PaddleOCR - готовый движок распознавания текста. Превращает PDF и изображения в структурированные данные вроде JSON и Markdown с высокой точностью. Бесплатный.]
0
👍 0
0
Рассудительный Гепард
хех, как раз вчера домучился с Тессерактом и сейчас буду его ковырять.
Поставлена задача наклейки с коробок распознавать.
А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.
Рассудительный Гепард
данную OCR кто-нибудь доучивал на кастомных данных?
Вечерний Ленивец
всмысле доучивал? Это OCR и там под капотом нет ИИ, но ты можешь его прикрутить судя по описанию PaddleOCR
Рассудительный Гепард
Ну тессеракт же тоже OCR, но его можно затрейнить
Рассудительный Гепард
сорян, если вопрос глупый, просто недавно добрался до всех этих штук.
Вечерний Ленивец
не, в теории могли бы ИИ под капот зашить в OCR, какую-то небольшую модельку, вопрос нормальный
Рассудительный Гепард
там по-любому моделька должна быть, какой-нибудь CNN+LSTM или тупо LSTM.
Поставлена задача наклейки с коробок распознавать.
А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.