OCR Module

Native text extraction with PaddleOCR GPU fallback for scanned PDFs.

Features

Method	Endpoint	Description
POST	`/projects/{id}/ocr/process`	Run OCR on papers
GET	`/projects/{id}/ocr/stats`	OCR statistics

bash

# Process papers
curl -X POST http://localhost:8000/api/v1/projects/1/ocr/process

# Get stats
curl http://localhost:8000/api/v1/projects/1/ocr/stats