Tesseract 3.02 running on Gnome Terminal 3.8.0. "input_image.tif" is the input document which will be rendered as "output_text.txt" by Tesseract. | |
रचनाकार | Ray Smith, Hewlett-Packard[1] |
---|---|
डेवलपर | |
आखिरी संस्करण |
4.1.0 / मार्च 14, 2019[1] |
प्रोग्रामिंग भाषा | C and C++ |
ऑपरेटिंग सिस्टम | Linux (32 & 64-bit), Windows (32-bit), and, unofficially, Mac OS X (x86) |
भाषा |
Interface: अंग्रेज़ी भाषा |
स्थिति | Active |
प्रकार | Optical character recognition |
लाइसेंस | Apache License v2.0 |
वेबसाइट |
github |
टेसरैक्ट (Tesseract) एक मुफ्त ओसीआर सॉफ्टवेयर है जो विभिन्न आपरेटिंग प्रणालियों तथा हिन्दी सहित पचासों लिपियों के लिए काम करता है। यह अपाचे लाइसेंस 2.0 के अन्तर्गत जारी किया गया है। यह सर्वाधिक शुद्ध मुफ्त ओसीआर माना जाता है। इसका अधिकांश कोड सी / सी++ में बनाया गया है।
टेसरैक्ट के 3.01 संस्करण में हिन्दी के अक्षरों को पहचानने की सुविधा प्रदान की गई। १८ अक्टूबर २०१२ को इसका 3.02 संस्करण निकाला गया था।
टेसरिक्ट का अभी तक अपना जीयूआई नहीं है और मूल रूप में यह कमाण्ड-लाइन इण्टरफेस से चलाया जाता है। किन्तु इसके लिए अनेकों बाहरी (दूसरी पार्टियों के) जीयूआई उपलब्ध हैं जो टेसरैक्ट के लिए जीयूआई का काम करते हैं।
tesseract.exe imagename outputbase [-l lang] [configfile [[+|-]varfile]...]