В обсуждении на Реддит (LocalLLaMA) пишут, что PaddleOCR VL в задачах распознавания текста обгоняет закрытые модели. Код открыт, вот тут.
Топовый коммент: "PaddleOCR is probably the best OCR framework. It's shocking how no other OCR framework comes close."
А я все чаще встречаю на сайтах умных ИИ- помощников в чатах, которые неплохо работают. И этот софт может пригодиться, если вы на вход даете, скажем, изображения инструкций на товары.
Поддерживает 109 языков.
Русский ИТ бизнес
-
никак своей тыквой не могу придумать прикладное применение -
Полезная штука, через нее бы прогнать все архивные бы записи, не оцифрованные и составить единое генеалогическое дерево для всех и сразу к госуслугам подключить.-
Мощно :) Но ошибок конечно будет.... руками-то непросто
-
