Русский ИТ бизнес
Русский ИТ бизнес

PaddleOCR - готовый движок распознавания текста. Превращает PDF и изображения в структурированные данные вроде JSON и Markdown с высокой точностью. Бесплатный.]
  • Рассудительный Гепард
    Рассудительный Гепард
    хех, как раз вчера домучился с Тессерактом и сейчас буду его ковырять.
    Поставлена задача наклейки с коробок распознавать.
    А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.
  • Рассудительный Гепард
    Рассудительный Гепард
    данную OCR кто-нибудь доучивал на кастомных данных?
    • Вечерний Ленивец
      Вечерний Ленивец
      всмысле доучивал? Это OCR и там под капотом нет ИИ, но ты можешь его прикрутить судя по описанию PaddleOCR
      • Рассудительный Гепард
        Рассудительный Гепард
        Ну тессеракт же тоже OCR, но его можно затрейнить
      • Рассудительный Гепард
        Рассудительный Гепард
        сорян, если вопрос глупый, просто недавно добрался до всех этих штук.
        • Вечерний Ленивец
          Вечерний Ленивец
          не, в теории могли бы ИИ под капот зашить в OCR, какую-то небольшую модельку, вопрос нормальный
          • Рассудительный Гепард
            Рассудительный Гепард
            там по-любому моделька должна быть, какой-нибудь CNN+LSTM или тупо LSTM.
      • Экологичный Священник
        Экологичный Священник
        ахахаха