- Telega FM

Русский ИТ бизнес

10 дек 2025 09:56

Специализированные OCR и парсеры документов. Подходят для PDF, таблиц, сканов и сложных макетов. Подборка ниже, по названию легко найдете.

1. GOT-OCR
Универсальная модель "всё-в-одном". Сразу выдает текст в HTML, сохраняя форматирование (таблицы, заголовки). Удобна для преобразования сканов в читаемые веб-страницы.

2. granite-docling-258m
Очень лёгкая модель (258M параметров). Создана для библиотеки Docling. Подходит для локальной работы на CPU, если нужно просто разобрать структуру документа без глубокого анализа.

3. MinerU 2.5
Отлично превращает PDF в Markdown, особенно научные статьи и документы со сложной вёрсткой.

4. OCRFlux
Модель для очистки и восстановления текста из "грязных" или повреждённых сканов. Подходит для восстановления плохого качества PDF.

5. RolmOCR
Специализация - бизнес-документы (счета, чеки, формы). Выделяет нужные поля с высокой точностью.

6. Nanonets OCR
Идеальна для извлечения данных из финансовых и юридических документов с чёткой структурой.

7. Deepseek OCR
Поддерживает много языков и отлично распознаёт код в скриншотах. Высокая точность на сложном контенте.

8. dots OCR
Современная модель, подходит для точного распознавания мелкого и структурированного текста (например, таблиц и схем).

9. olmOCR 2
Обновленная и мощная версия популярных открытых OCR. Крупная модель (7B параметров) - требует больше ресурсов, но даёт максимальное качество для сложных PDF.

Русский ИТ бизнес

👍 0

Комментариев пока нет.