PaddleOCR - готовый движок распознавания текста. Превращает PDF и изображения в структурированные данные вроде JSON и Markdown с высокой точностью. Бесплатный.]
хех, как раз вчера домучился с Тессерактом и сейчас буду его ковырять.
Поставлена задача наклейки с коробок распознавать.
А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.
maxedemax
данную OCR кто-нибудь доучивал на кастомных данных?
knstntnpkrn
всмысле доучивал? Это OCR и там под капотом нет ИИ, но ты можешь его прикрутить судя по описанию PaddleOCR
maxedemax
Ну тессеракт же тоже OCR, но его можно затрейнить
maxedemax
сорян, если вопрос глупый, просто недавно добрался до всех этих штук.
knstntnpkrn
не, в теории могли бы ИИ под капот зашить в OCR, какую-то небольшую модельку, вопрос нормальный
maxedemax
там по-любому моделька должна быть, какой-нибудь CNN+LSTM или тупо LSTM.
Комментарии (0)
Поставлена задача наклейки с коробок распознавать.
А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.