pdfplumber - вытаскиватель всего и вся из PDF. Для RAG находка, т.к. умеет обрабатывать и таблицы (ну так пишут, сам не проверял). Вот здесь, бесплатно.
p.s. еще графики обрабатывает.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться

Комментарии (7)