Тема: Пакетная обработка больших объемов PDF файлов бесплатно (Прочитано 17963 раз)

Anonymous · « : 11 Октября 2022, 13:24:14 »

Цитировать

Задача:
Каталогизировать несколько десятков тысяч сканированных файлов в формате PDF, содержащих документы на английском языке.

Anonymous · « **Ответ #1 :** 11 Октября 2022, 13:26:40 »

два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?
2) Google OCR работает с кириллическим текстом?

elia · « **Ответ #2 :** 11 Октября 2022, 14:07:36 »

Цитировать

два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?

Цитировать

2) Google OCR работает с кириллическим текстом?

Для него есть языковые модули под русский и украинский языки