Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revisionLast revisionBoth sides next revision | ||
linux_faq:ubuntu_ocr_gui_распознавание_текста_ubuntu_gui [2019/06/05 08:54] – admin | linux_faq:ubuntu_ocr_gui_распознавание_текста_ubuntu_gui [2020/04/28 18:12] – admin | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | Понадобилось мне распознать десяток страниц из документа **djvu**. | ||
+ | Я, по старой памяти, | ||
+ | А потом попытался распознать. \\ | ||
+ | Сначала попробывал **Yagf + Cuneiform**. **Yagf** вываливался в **Segmentation Fault** на этапе открытия **PDF**. \\ | ||
+ | Потом я попробывал **lios**. По сравнению с **yagf** он оказался гораздо лучше. | ||
+ | **lios** смог нормально испортировать изображения их **pdf** и распознать. Русский язык нормально распознался с помощью **tesseract** после установки словаря: | ||
+ | sudo apt-get install lios tesseract-ocr tesseract-ocr-rus speech-dispatcher | ||
+ | А для распознавания **djvu** без преобразования в **pdf** есть такое: | ||
+ | ocrodjvu - tool to perform OCR on DjVu documents |