Русский ИТ бизнес 👨
Подписаться
PaddleOCR - готовый движок распознавания текста. Превращает PDF и изображения в структурированные данные вроде JSON и Markdown с высокой точностью. Бесплатный.]

Комментарии (0)

  • maxedemax
    хех, как раз вчера домучился с Тессерактом и сейчас буду его ковырять.
    Поставлена задача наклейки с коробок распознавать.
    А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.
  • maxedemax
    данную OCR кто-нибудь доучивал на кастомных данных?
    • knstntnpkrn
      всмысле доучивал? Это OCR и там под капотом нет ИИ, но ты можешь его прикрутить судя по описанию PaddleOCR
      • maxedemax
        Ну тессеракт же тоже OCR, но его можно затрейнить
      • maxedemax
        сорян, если вопрос глупый, просто недавно добрался до всех этих штук.
        • knstntnpkrn
          не, в теории могли бы ИИ под капот зашить в OCR, какую-то небольшую модельку, вопрос нормальный
          • maxedemax
            там по-любому моделька должна быть, какой-нибудь CNN+LSTM или тупо LSTM.
      • Ut4J6
        ахахаха