Форум Резников
Основной форум => Курилка => Тема начата: Anonymous от 11 Октября 2022, 13:24:14
-
Задача:
Каталогизировать несколько десятков тысяч сканированных файлов в формате PDF, содержащих документы на английском языке.
[Читать дальше...] (http://reznik.kiev.ua/node/457)
-
два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?
2) Google OCR работает с кириллическим текстом?
-
два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?
http://djvu.sourceforge.net/doc/man/djvuextract.html
но не пробовал
2) Google OCR работает с кириллическим текстом?
Для него есть языковые модули под русский и украинский языки