Сайт | Скачать | Видео | Wiki

Автор Тема: OCR : Сканирование и распознавание текста в линуксе  (Прочитано 4950 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Fliker09

  • Почетный участник
  • Ветеран
  • *
  • Сообщений: 1624
  • Репутация: +120/-1
  • Puppy 4ever!
Несмотря на то что это аддон у него есть зависимость! Вот:
ftp://ftp.yandex.ru/puppyrus/users/fliker/Repositary/Libraries/glibc-cxx-gcc-12.1-ru.pet
А вот и сам аддон:
ftp://ftp.yandex.ru/puppyrus/users/fliker/Addons/Office/scanner-complex_301.sfs
« Последнее редактирование: 09 Февраль 2020, 09:55:41 от sfs »
Я покинул проект так что прошу в случае чего писать мне на мыло!
Драйверы от разных систем НЕСОВМЕСТИМЫ!
http://wellminded.com/puppy/pupsearch.html -
 - поиск по http://www.murga-linux.com/puppy/
http://www.minus.com/ - для постоянного хранения файлов
http://rghost.ru/ - для временного хранения файлов
http://appdb.winehq.org/ - база данных WINE
http://jabberworld.info/ - всё о Jabber
http://convertfiles.com/ - конвертер файлов

Оффлайн RemDerBauer

  • Старожил
  • ****
  • Сообщений: 312
  • Репутация: +4/-0
Re: Cuneiform & YAGF - распознавание текста в линуксе
« Ответ #1 : 04 Декабрь 2009, 10:50:06 »
я позволю себе немного откомментровать данную программу:
1) Она вроде неплохо распознает русский текст
2) Она не понимает формат pdf. Совсем. Только изображения в хорошем качестве
3) Она фактически единственный вариант OCR для Linux
4) Она бесплатна и открыта
5) Cuneiform - это собственно движок распознавания, YAGF - это морда к нему
Мы наш, мы новый мир построим... если будем прикладывать к этому хоть немного усилий

Оффлайн Fliker09

  • Почетный участник
  • Ветеран
  • *
  • Сообщений: 1624
  • Репутация: +120/-1
  • Puppy 4ever!
Re: Cuneiform & YAGF - распознавание текста в линуксе
« Ответ #2 : 04 Декабрь 2009, 16:23:34 »
1) Она вроде неплохо распознает русский текст - угу :).
2) Она не понимает формат pdf. Совсем. Только изображения в хорошем качестве - смотрим мою подпись ;) :).
3) Она фактически единственный вариант OCR для Linux - правда, я пробовал и другие движки - ужасть!
Я покинул проект так что прошу в случае чего писать мне на мыло!
Драйверы от разных систем НЕСОВМЕСТИМЫ!
http://wellminded.com/puppy/pupsearch.html -
 - поиск по http://www.murga-linux.com/puppy/
http://www.minus.com/ - для постоянного хранения файлов
http://rghost.ru/ - для временного хранения файлов
http://appdb.winehq.org/ - база данных WINE
http://jabberworld.info/ - всё о Jabber
http://convertfiles.com/ - конвертер файлов

Оффлайн Fliker09

  • Почетный участник
  • Ветеран
  • *
  • Сообщений: 1624
  • Репутация: +120/-1
  • Puppy 4ever!
Обновление:

 - Добавил внутрь Xsane (зависимость YAGF);
 - Поправил расположение одной библиотеки;
 - Увёл либы в другую папку.
« Последнее редактирование: 27 Март 2010, 22:43:01 от Fliker09 »
Я покинул проект так что прошу в случае чего писать мне на мыло!
Драйверы от разных систем НЕСОВМЕСТИМЫ!
http://wellminded.com/puppy/pupsearch.html -
 - поиск по http://www.murga-linux.com/puppy/
http://www.minus.com/ - для постоянного хранения файлов
http://rghost.ru/ - для временного хранения файлов
http://appdb.winehq.org/ - база данных WINE
http://jabberworld.info/ - всё о Jabber
http://convertfiles.com/ - конвертер файлов

Оффлайн Fliker09

  • Почетный участник
  • Ветеран
  • *
  • Сообщений: 1624
  • Репутация: +120/-1
  • Puppy 4ever!
Обновление.

 - Теперь кнопка сканирование из YAGF работает.
Я покинул проект так что прошу в случае чего писать мне на мыло!
Драйверы от разных систем НЕСОВМЕСТИМЫ!
http://wellminded.com/puppy/pupsearch.html -
 - поиск по http://www.murga-linux.com/puppy/
http://www.minus.com/ - для постоянного хранения файлов
http://rghost.ru/ - для временного хранения файлов
http://appdb.winehq.org/ - база данных WINE
http://jabberworld.info/ - всё о Jabber
http://convertfiles.com/ - конвертер файлов

Оффлайн sfs

  • Администратор
  • Ветеран
  • *****
  • Сообщений: 28955
  • Репутация: +195/-0
    • PuppyRus-A
чего мне не хватало, так это нормального, не тормознутого gui для tesseract и gocr. Который был бы не на этих ихних тормознутых питонах.
https://aur.archlinux.org/packages/ocrgui/  - у меня segfault. yagf тоже
gimagereader-ocr-gtk3-3.3.0-1801-sf01.pfs
Распознавалка текста. Проверил на pdf и png - норм
Вроде и сканировать может - проверить нечем

Оффлайн imp

  • /dev/бубен
  • Ветеран
  • *****
  • Сообщений: 1103
  • Репутация: +39/-1
  • /dev/hands from /dev/ass
Не, ну yagf пробовал - хоть и самое вменяемое, но не очень. Gimagereader те же яйца, только в профиль. Может, у Романа получилось бы?
Компьютер имеет то преимущество перед мозгом, что им пользуются.

Оффлайн k0l0p0k

  • Ветеран
  • *****
  • Сообщений: 1411
  • Репутация: +20/-1
https://aur.archlinux.org/packages/ocrgui/  - заглянул на https://sourceforge.net/projects/ocrgui/
последнее обновление в 2011, похоже забросили совсем, русского перевода не вижу
имхо пытаться оживлять бессмысленно

YAGF посвежее, на Qt4, но вроде тоже заброшен, с 2015г правок нет


Может, у Романа получилось бы?
если вопрос мне, то не понял, что должно получиться? :)
1.нетбук  Samsung N145 (Debian+openBox+LXPanel, ddr01)
2.core2duo,4Gb,Radeon HD7850,(ubuntu+openBox+LXPanel, ddr01)

Оффлайн imp

  • /dev/бубен
  • Ветеран
  • *****
  • Сообщений: 1103
  • Репутация: +39/-1
  • /dev/hands from /dev/ass
Да я в твоей теме про qt писал, что гуевины вменяемой для tesseract не хватает
Компьютер имеет то преимущество перед мозгом, что им пользуются.

Оффлайн k0l0p0k

  • Ветеран
  • *****
  • Сообщений: 1411
  • Репутация: +20/-1
Да я в твоей теме про qt писал, что гуевины вменяемой для tesseract не хватает
Сам tesseract смотрю активно развивается, примеры кода вижу есть,
но "переплюнуть" тот же YAGF .. нашими силами .. сильно сомневаюсь что получится .. разве по мелочи что подправить  :-\
1.нетбук  Samsung N145 (Debian+openBox+LXPanel, ddr01)
2.core2duo,4Gb,Radeon HD7850,(ubuntu+openBox+LXPanel, ddr01)

Оффлайн sfs

  • Администратор
  • Ветеран
  • *****
  • Сообщений: 28955
  • Репутация: +195/-0
    • PuppyRus-A
Чем gimagereader не угодил?

Оффлайн imp

  • /dev/бубен
  • Ветеран
  • *****
  • Сообщений: 1103
  • Репутация: +39/-1
  • /dev/hands from /dev/ass
Чем gimagereader не угодил?
Он тоже на питоне. Виснет, глючит, вылетает. Уж лучше из консоли. Я же и спрашивал, можно ли на кутэ, а не на этих питонах.
Компьютер имеет то преимущество перед мозгом, что им пользуются.

Оффлайн sfs

  • Администратор
  • Ветеран
  • *****
  • Сообщений: 28955
  • Репутация: +195/-0
    • PuppyRus-A
Он тоже на питоне.
Нет https://www.archlinux.org/packages/community/x86_64/gimagereader-gtk/
Виснет, глючит, вылетает. Уж лучше из консоли
Если из консоли устраивает - может проше самим гуй на yad gtkdialog написать
Результативных qt писателей у нас пока не наблюдается

Оффлайн krasnyh

  • Ветеран
  • *****
  • Сообщений: 2958
  • Репутация: +93/-1
А gscan2pdf на perl?
p.s. Фраза неправильно звучит. Правильно так - "А gscan2pdf на perl устроит?" )

Ocrfeeder, хотя я понял, что на python не нравится.
Tesseract-gui, тоже python.
« Последнее редактирование: 10 Февраль 2020, 14:57:09 от krasnyh »

Оффлайн imp

  • /dev/бубен
  • Ветеран
  • *****
  • Сообщений: 1103
  • Репутация: +39/-1
  • /dev/hands from /dev/ass
Не видел его. Судя по зависимостям - да. Будем попробовать
Компьютер имеет то преимущество перед мозгом, что им пользуются.