Форум Резников

Пожалуйста, войдите или зарегистрируйтесь.

Расширенный поиск  

Автор Тема: Пакетная обработка больших объемов PDF файлов бесплатно  (Прочитано 2804 раз)

Anonymous

  • Гость

Цитировать
Задача:
Каталогизировать несколько десятков тысяч сканированных файлов в формате PDF, содержащих документы на английском языке.
[Читать дальше...]
Записан

Anonymous

  • Гость

два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?
2) Google OCR работает с кириллическим текстом?
Записан

elia

  • и.о. пользователя
  • Администратор
  • Старожил
  • *****
  • Пол: Мужской
  • Сообщений: 503
    • ICQ клиент - 54891094
    • Просмотр профиля
    • http://reznik.kiev.ua
    • E-mail

Цитировать
два вопроса:
1) как разобрать djvu на изъятие слоя текста и на картинки не искали?

http://djvu.sourceforge.net/doc/man/djvuextract.html
но не пробовал

Цитировать
2) Google OCR работает с кириллическим текстом?

Для него есть языковые модули под русский и украинский языки
Записан
Сайт Резников и Автосправочник

Объективная реальность - бред, вызванный недостатком алкоголя в крови!
Совесть - это тихий голос, напоминающий, что за тобой могут подсматривать!
 


Free secondary DNS