<b>pdfplumber</b> - вытаскиватель всего и вся из PDF. Для RAG находка, т.к. умеет обрабатывать и таблицы (ну так пишут, сам не проверял). Вот <a href="https://github.com/jsvine/pdfplumber">здесь</a>, бесплатно. p.s. еще графики обрабатывает. <a href="https://t.me/bezsmuzi">Русский ИТ бизнес</a>
Комментарии (7)