SuryaOCR RunPod H100 Serverless

Production-ready SuryaOCR deployment on RunPod H100 GPU with 0.5s per image OCR speed.

🚀 Quick Setup (2 Options)

Option 1: Pre-built Docker Image (RECOMMENDED - Instant Startup)

Best for production: Models are pre-downloaded, no cold start delays!

The Docker image is automatically built by GitHub Actions and pushed to GitHub Container Registry.

Just use this image in RunPod:

ghcr.io/gunitbindal/surya-runpod-h100:latest

Setup:

Create RunPod Template:
- Go to: RunPod Console → Serverless → Templates → New Template
- Container Image: ghcr.io/gunitbindal/surya-runpod-h100:latest
- Docker Command: (leave empty)
- GPU: H100 80GB or H100 PCIe
Deploy Endpoint:
- Template: Select your template
- Active Workers: 1
- Max Workers: 1
- Endpoint Type: Queue

Benefits:

✅ Instant cold starts (2-3 seconds)
✅ No model download wait time
✅ No pip installs on startup
✅ Production-ready
✅ Automatically updated on every push to main

Option 2: GitHub Handler (Simple but Slower)

Good for testing: Downloads on every worker start.

Create Template:

Container Image: runpod/pytorch:2.8.0-py3.11-cuda12.8.1-cudnn-devel-ubuntu22.04
Docker Command:

bash -c "pip install --no-cache-dir surya-ocr runpod pillow && curl -sSL https://raw.githubusercontent.com/GunitBindal/surya-runpod-h100/main/handler_final.py -o handler.py && python -u handler.py"

Deploy Endpoint (same as Option 1, step 3)

Drawbacks:

⏱️ First request: 60-90 seconds (downloads models)
📦 Installs packages every worker start
💰 Wastes compute time on setup

📝 Usage

📋 Key Points

First request: 60-90 seconds (downloads Surya models ~500MB)
Subsequent requests: ~0.5 seconds per image
Active Workers = 1: Keeps worker warm, prevents queue issues
Logs visible: Handler prints status to worker logs

📁 Files

handler_final.py - Optimized handler with logging
docker_command.txt - RunPod Docker command
test_client.py - Python test client

🔧 Troubleshooting

Requests stuck IN_QUEUE?

Set Active Workers = 1 in endpoint settings
Wait 90 seconds for first model download
Check worker logs for errors

Worker crashing?

Verify H100 GPU is selected
Ensure Docker command is exactly as shown above
Check logs for memory issues

Current Status

✓ Handler updated with better logging
✓ Simplified deployment (no Docker build)
✓ Single-command setup via GitHub

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.github/workflows		.github/workflows
.env.example		.env.example
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
batch_ocr.py		batch_ocr.py
build_and_push.sh		build_and_push.sh
docker_command.txt		docker_command.txt
handler_final.py		handler_final.py
prewarm.py		prewarm.py
test_client.py		test_client.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SuryaOCR RunPod H100 Serverless

🚀 Quick Setup (2 Options)

Option 1: Pre-built Docker Image (RECOMMENDED - Instant Startup)

Option 2: GitHub Handler (Simple but Slower)

📝 Usage

📋 Key Points

📁 Files

🔧 Troubleshooting

Current Status

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

SuryaOCR RunPod H100 Serverless

🚀 Quick Setup (2 Options)

Option 1: Pre-built Docker Image (RECOMMENDED - Instant Startup)

Option 2: GitHub Handler (Simple but Slower)

📝 Usage

📋 Key Points

📁 Files

🔧 Troubleshooting

Current Status

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages