Форум Резников

Основной форум => Курилка => Тема начата: Anonymous от 11 Октябрь 2022, 13:24:14

Название: Пакетная обработка больших объемов PDF файлов бесплатно
Отправлено: Anonymous от 11 Октябрь 2022, 13:24:14
Цитировать
Задача:
Каталогизировать несколько десятков тысяч сканированных файлов в формате PDF, содержащих документы на английском языке.
[Читать дальше...] (http://reznik.kiev.ua/node/457)
Название: Re: Пакетная обработка больших объемов PDF файлов бесплатно
Отправлено: Anonymous от 11 Октябрь 2022, 13:26:40
два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?
2) Google OCR работает с кириллическим текстом?
Название: Re: Пакетная обработка больших объемов PDF файлов бесплатно
Отправлено: elia от 11 Октябрь 2022, 14:07:36
Цитировать
два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?

http://djvu.sourceforge.net/doc/man/djvuextract.html
но не пробовал

Цитировать
2) Google OCR работает с кириллическим текстом?

Для него есть языковые модули под русский и украинский языки

Free secondary DNS