Στιγμιότυπο της εκτέλεσης του Tesseract 3.0.3.
| |
Γενικά | |
---|---|
Δημιουργοί | Ρέυ Σμιθ, Hewlett-Packard[1] |
Είδος | ελεύθερο και ανοιχτού κώδικα λογισμικό |
Διανομή | |
Έκδοση | 5.4.1 (11 Ιουνίου 2024)[2] |
Λειτουργικά | GNU/Linux, Microsoft Windows, macOS, BSD, Android, IOS |
Διαθέσιμο σε | Περιβάλλον: αγγλικά, υποστήριξη αναγνώρισης χαρακτήρων για 100+ γλώσσες |
Ανάπτυξη | |
Υπευθ. ανάπτυξης | Ρέυ Σμιθ |
Γραμμένο σε | C++ |
Κατάσταση | Ενεργό |
Άδεια χρήσης | Άδεια Apache, Έκδοση 2.0 |
Σύνδεσμοι | |
Επίσημος ιστότοπος | |
https://github.com/tesseract-ocr | |
Αποθετήριο κώδικα | |
https://github.com/tesseract-ocr/tesseract.git |
Το Tesseract (μτφ. τεσσεράκτιο) είναι λογισμικό οπτικής αναγνώρισης χαρακτήρων διαθέσιμο σε διάφορα λειτουργικά συστήματα. Διατίθεται ως ελεύθερο λογισμικό υπό την άδεια Apache έκδοση 2.0[1][3][4] από το 2006 συντηρείται από την Google.[5]Αποτελεί μια από τις πλέον ακριβείς μηχανές αναγνώρισης οπτικών χαρακτήρων και έχει ευρεία χρησιμοποίηση σε πλήθος εφαρμογών.[4][6]
Η κατασκευή του λογισμικού ξεκίνησε το 1984 ως διδακτορική διατριβή υπό τη χορηγία της Hewlett-Packard στο Μπρίστολ του Ηνωμένου Βασιλείου. Το 1987 προστέθηκε και δεύτερο άτομο το οποίο συμμετείχε στην ανάπτυξη του λογισμικού στις εγκαταστάσεις της Hewlett-Packard στο Γκρήλεϋ του Κολοράντο στις ΗΠΑ και ξεκίνησαν οι πρώτες προσπάθειες για την εμπορική αξιοποίηση του ως λειτουργία για συσκευές σαρωτών. Το 1995 αξιολογήθηκε ως μια από τις κορυφαίες μηχανές οπτικής αναγνώρισης χαρακτήρων ως προς την ακρίβεια αναγνώρισης,[7]το 1996 δημιουργήθηκε έκδοση για Windows, ενώ το 1998 ξαναγράφτηκε τμήμα του παλαιού κώδικα ο οποίος ήταν γραμμένος σε C στην C++. Κατόπιν η ανανέωση συνεχίστηκε εν μέρει έτσι ώστε να είναι δυνατό όλος ο κώδικας να μεταγλωττιστεί με χρήση μεταγλωττιστή C++.[3]
Από το 1999 δεν υπήρξε καμία δραστηριοποίηση και πέρασε τελείως στην αφάνεια, έως το 2005 όταν η Hewlett-Packard σε συνεργασία με το πανεπιστήμιο της Νεβάδα, Λας Βέγκας αποφάσισε να το διαθέσει υπό ελεύθερη άδεια χρήσης (Apache 2.0), ενώ από το 2006 τη συντήρηση και επέκταση του λογισμικού ανέλαβε η Google (ως έκδοση 1) και έλαβε θετική μετέπειτα αποδοχή ως προς την ποιότητα των αποτελεσμάτων του.[8]
Όλες οι εκδόσεις του λογισμικού είναι διαθέσιμες για τα λειτουργικά συστήματα GNU/Linux, Windows και Mac OS X.[3][4] Η ποιότητα των αποτελεσμάτων του εξαρτάται σημαντικά από την ποιότητα και ευκρίνεια των εικόνων κειμένων τα οποία λαμβάνει ως είσοδο,[9] και προβλήματα όπως ημιπεριστραμένες ή χαμηλής φωτεινότητας σελίδες χρειάζονται ξεχωριστή επιμέλεια πριν ξεκινήσει η διαδικασία της αναγνώρισης χαρακτήρων.[10]
Το λογισμικό εκτελείται σε περιβάλλον τερματικού/κονσόλας και το ίδιο δεν διαθέτει γραφικό περιβάλλον,[11] ωστόσο υπάρχουν άλλα ξεχωριστά εγχειρήματα τα οποία διαθέτουν γραφικό περιβάλλον και χρησιμοποιούν το Tesseract στο υπόβαθρο για τις εργασίες της οπτικής αναγνώρισης.[12][13][14] Η απευθείας χρήση του γίνεται με παροχή παραμέτρων κατά το παρακάτω πρότυπο:
tesseract imagename outputbase [-l lang] [configfile [[+|-]varfile]...]
Στην αρχική του έκδοση ως ελεύθερο λογισμικό το 2006, παρείχε υποστήριξη μόνο για αναγνώριση λατινικών χαρακτήρων στα πλαίσια της αγγλικής γλώσσας. Ως δεδομένα εισόδου δεχόταν μόνο φωτογραφίες τύπου TIFF και δεν πρόσφερε καμία υποστήριξη για ανάλυση διάταξης εγγράφων, πολύστηλα κείμενα, και άλλα χαρακτηριστικά τα οποία θα προστίθονταν στις μετέπειτα εκδόσεις.
Η έκδοση 2 διατέθηκε το 2007 και εκτός από τα αγγλικά παρείχε υποστήριξη και για 6 ακόμα λατινογενείς γλώσσες, γαλλικά, ιταλικά, ισπανικά, πορτογαλικά, καθώς και γερμανικά και ολλανδικά, καθώς και πρώιμη υποστήριξη για εκπαίδευση του προγράμματος για καλύτερη αναγνώριση.[15]
Το 2010 διατέθηκε η 3η έκδοση η οποία έως το 2015 είχε επακόλουθα στάδια προσθηκών (3.01 έως 3.05). Η έκδοση αυτή είχε πάρα πολλές και ιδιαίτερα σημαντικές προσθήκες όπως παρακάτω:
Από το 2016 ξεκίνησε να δημιουργείται η 4η έκδοση του Tesseract, η οποία έως το πρώτο τρίμηνο του 2018 βρισκόταν σε καθεστώς δοκιμαστικής έκδοσης (4.0.0-beta.1). Στην έκδοση αυτή προστέθηκαν: