- Telega.FM

Русский ИТ бизнес

19 сен 2025 17:01

PaddleOCR - готовый движок распознавания текста. Превращает PDF и изображения в структурированные данные вроде JSON и Markdown с высокой точностью. Бесплатный.]

👍 0

Рассудительный Гепард 2025-09-19 17:07

хех, как раз вчера домучился с Тессерактом и сейчас буду его ковырять.
Поставлена задача наклейки с коробок распознавать.
А текст и вертикальный, и горизонтальный. Даже не знаю как подступиться.
Рассудительный Гепард 2025-09-19 17:09

данную OCR кто-нибудь доучивал на кастомных данных?
- Вечерний Ленивец 2025-09-19 17:11
  
  всмысле доучивал? Это OCR и там под капотом нет ИИ, но ты можешь его прикрутить судя по описанию PaddleOCR
  - Рассудительный Гепард 2025-09-19 17:12
    
    Ну тессеракт же тоже OCR, но его можно затрейнить
  - Рассудительный Гепард 2025-09-19 17:12
    
    сорян, если вопрос глупый, просто недавно добрался до всех этих штук.
    - Вечерний Ленивец 2025-09-19 17:13
      
      не, в теории могли бы ИИ под капот зашить в OCR, какую-то небольшую модельку, вопрос нормальный
      - Рассудительный Гепард 2025-09-19 17:14
        
        там по-любому моделька должна быть, какой-нибудь CNN+LSTM или тупо LSTM.
  - Экологичный Священник 2025-09-19 17:13
    
    ахахаха