OCRopus

OCRopus
Тип	розпізнавання тексту
Розробник	Thomas Breuel DFKI
Стабільний випуск	0.4.4 (березень 2010 р.)
Операційна система	FreeBSD, Linux, macOS і Windows 10
Мова програмування	C++ і Python
Українська мова	ні
Ліцензія	Apache License вер. 2.0
Репозиторій	https://github.com/tmbdev/ocropy, https://github.com/ocropus/ocropy.git
Вебсайт	www.ocropus.org
	Медіафайли у Вікісховищі ;

OCRopus — OCR-система на базі відкритого розпізнавального ядра — tesseract. Програмний пакет для розпізнавання тексту, що розвивається за принципами Open Source і розповсюджується під Apache License 2.0. За задумом розробників, з допомогою OCRopus стане можливим визначати текстовий вміст на цифрових зображеннях і переводити його в звичайний текстовий формат для подальшого редагування. Крім друкованого тексту, програма зможе розпізнавати і рукописні матеріали. За станом на альфа-реліз, OCRopus використовує код мови моделювання з іншого проекту, що підтримується Google — OpenFST. OCRopus в наш час^[коли?] доступний лише для Linux.

Використання

В даний час OCRopus може бути використаний тільки з командного рядка. Після встановлення можна посилатися, вказуючи вхідне зображення з текстом. Він виведе hOCR HTML-код. Якщо необхідний точніший контроль, можна вказати в командному рядку команду для виконання конкретних операцій (наприклад, розпізнавання одного рядка).

Історія розвитку

0.1.0 — альфа — 22 жовтня 2007 р.
0.1.1 — 14 грудня 2007 р. — поліпшення системи збирання пакунку
0.2 — альфа 2 — 31 травня 2008 р.
0.3 — 16 жовтня 2008 р.^[3]
0.4 альфа 4 — ^[4]
1.0 — у планах — пакунки для інших операційних систем, + GUI

Див. також

Примітки

↑ OCRopus release notes. Архів оригіналу за 12 лютого 2010. Процитовано 24 грудня 2009.
↑ ocropus | Групи Google. Архів оригіналу за 9 лютого 2010. Процитовано 24 грудня 2009.
↑ Old OCRopus Wiki - Сторінку не знайдено. Архів оригіналу за 4 липня 2008. Процитовано 4 липня 2008.
↑ Old OCRopus Wiki - Upcoming Releases

Посилання

Офіційний сайт
IUPR Publication Server [Архівовано 27 квітня 2009 у Wayback Machine.] (опис алгоритмів, використовуваних у OCRopus)
Офіційний сайт OpenFST [Архівовано 27 лютого 2009 у Wayback Machine.]

[changelog-1] OCRopus release notes. Архів оригіналу за 12 лютого 2010. Процитовано 24 грудня 2009.

[2] ropus | Групи Google. Архів оригіналу за 9 лютого 2010. Процитовано 24 грудня 2009.

[3] Old OCRopus Wiki - Сторінку не знайдено. Архів оригіналу за 4 липня 2008. Процитовано 4 липня 2008.

[4] Old OCRopus Wiki - Upcoming Releases

[1]

[2]

[3]

[4]

п о р Програми з використанням оптичного розпізнавання символів
Вільне програмне забезпечення	CuneiForm · GOCR · Ocrad · OCRopus · Tesseract
Власницьке програмне забезпечення	Expervision · ABBYY FineReader · Microsoft Office Document Imaging · OmniPage · Readiris · ReadSoft · SimpleOCR · SmartScore · ViewWise