Русский ИТ бизнес
Русский ИТ бизнес

Mistral AI представила OCR 4. Модель преобразует документ в структуру

Mistral AI представила OCR 4. Модель преобразует документ в структуру
Mistral AI представила OCR 4. Модель преобразует документ в структуру
Mistral AI представила OCR 4. Модель преобразует документ в структуру:

• выделяет блоки с помощью bounding boxes;
• распознает типы элементов: заголовок, таблица, формула, подпись;
• показывает confidence score по страницам и словам;
• работает с 170 языками.

Главная польза заключается не столько в «распознавании текста», сколько в возможности дальнейшего нормального использования документов в RAG, enterprise search, редактировании, проверке человеком и агентных пайплайнах. Mistral заявляет, что OCR 4 обошла конкурентов в слепом сравнении на 600+ реальных документах и набрала 85,20 баллов на OlmOCRBench.

Модель можно запускать self-hosted в одном контейнере, чтобы документы не покидали вашу инфраструктуру. Цена через API: $4 за 1000 страниц, через Batch API: $2 за 1000 страниц.

https://mistral.ai/news/ocr-4/

tg / max

Комментариев пока нет.