Nhận dạng quang học chữ Braille

Hình ảnh của một trang chữ bao gồm các ký tự chữ nổi và các ký tự chữ chìm ở trang bên kia

Nhận dạng quang học chữ nổi Barille là hoạt động chụp và xử lý hình ảnh của các ký tự chữ nổi thành các ký tự ngôn ngữ tự nhiên. Nó được sử dụng để chuyển đổi các tài liệu chữ nổi cho những người không thể đọc chúng thành văn bản và để bảo quản và sao chép các tài liệu.

Lịch sử

[sửa | sửa mã nguồn]

Năm 1984, một nhóm các nhà nghiên cứu tại Đại học Công nghệ Delft đã thiết kế một máy tính bảng đọc chữ nổi, trong đó một đầu đọc với các tế bào cảm quang di chuyển dọc theo thanh trượt để chụp từng dòng chữ nổi.[1] Năm 1988, một nhóm các nhà nghiên cứu người Pháp tại Đại học Khoa học và Công nghệ Lille đã phát triển một thuật toán, được gọi là Lectobraille, để chuyển đổi các tài liệu chữ nổi thành văn bản thuần túy. Hệ thống chụp ảnh văn bản chữ nổi bằng camera CCD độ phân giải thấp và sử dụng các kỹ thuật máy tính để trích xuất chữ nổi. Các ký tự chữ nổi sau đó được chuyển đổi sang ngôn ngữ tự nhiên bằng cách sử dụng nhận dạng thích ứng.[2] Kỹ thuật Lectobraille có tỷ lệ lỗi 1% và thời gian xử lý trung bình là bảy giây trên mỗi dòng. Năm 1993, một nhóm các nhà nghiên cứu từ Đại học Katholieke Leite đã phát triển một hệ thống nhận dạng chữ nổi trên các máy quét thương mại phổ thông. Tuy nhiên, hệ thống không thể xử lý được các dòng chữ bị biến dạng, do đó cần tài liệu chữ nổi được định dạng tốt ở đầu vào.[3] Năm 1999, một nhóm tại Đại học Bách khoa Hồng Kông đã sử dụng kỹ thuật phát hiện viền để dịch chữ nổi sang văn bản tiếng Anh hoặc tiếng Trung Quốc.[4] Năm 2001, Murray và Dais đã tạo ra một hệ thống nhận dạng cầm tay, quét các phần nhỏ của tài liệu cùng một lúc.[5] Do diện tích quét nhỏ hơn, biến dạng ít xảy ra hơn nên thuật toán đã trở nên đơn giản và hiệu quả. Năm 2003, Morgavi và Morando đã thiết kế một hệ thống để nhận dạng các ký tự chữ nổi sử dụng mạng lưới thần kinh nhân tạo. Hệ thống này được chú ý vì khả năng xử lý hình ảnh chất lượng thấp thành công hơn các phương pháp khác.

Các ứng dụng

[sửa | sửa mã nguồn]

Nhận dạng quang học chữ nổi được sử dụng để số hóa và tái tạo các văn bản đã được tạo ra bằng phương pháp cơ học, chẳng hạn như với máy đánh chữ chữ nổi. Số hóa các văn bản chữ nổi cũng giúp giảm không gian lưu trữ, vì các văn bản chữ nổi chiếm nhiều không gian hơn so với các ngôn ngữ tự nhiên khác. Nhận dạng quang học chữ nổi cũng hữu ích cho những người không thể đọc chữ nổi, nhưng cần truy cập vào nội dung của tài liệu chữ nổi.[6]

Thử thách

[sửa | sửa mã nguồn]

Nhiều thách thức để xử lý thành công văn bản chữ nổi phát sinh từ bản chất của tài liệu chữ nổi. Chữ nổi thường được in ấn trên giấy màu, không dùng mực để tạo độ tương phản giữa các ký tự dập nổi với nền giấy. Tuy nhiên, sự không hoàn hảo của giấy có thể xuất hiện trên bản quét hoặc hình ảnh của trang giấy.

Nhiều tài liệu được in hai mặt. Như vậy, phần lõm của chữ nổi của mặt này sẽ xen kẽ với chữ nổi nhô ra của mặt kia.[7]

Kỹ thuật

[sửa | sửa mã nguồn]

Một số kỹ thuật nhận dạng chữ nổi quang học ứng dụng nguồn sáng xiên và máy ảnh để phát hiện phần đổ bóng của các ký tự lồi hay lõm. Số khác thì sử dụng máy quét tài liệu thương mại phổ thông.[7]

Nguồn tham khảo

[sửa | sửa mã nguồn]
  1. ^ Mennens, Jan; Tichelen, Luc van; François, Guido; Engelen, Jan J. (tháng 12 năm 1994). “Optical recognition of Braille using standard equipment”. IEEE Transactions on Rehabilitation Engineering. 2 (4): 207–212. doi:10.1109/86.340878. ISSN 1063-6528.
  2. ^ Dubus, J.P.; Benjelloun, M.; Devlaminck, V.; Wauquier, F.; Altmayer, P. (tháng 11 năm 1988). Image processing techniques to perform an autonomous system to translate relief braille into black-ink, called: Lectobraille. Proceedings of the Annual International Conference of the IEEE. 4. Engineering in Medicine and Biology Society. tr. 1584–1585. doi:10.1109/IEMBS.1988.94726. ISBN 978-0-7803-0785-8.
  3. ^ Wong, Lisa; Abdulla, Waleed; Hussman, Stephan (tháng 8 năm 2004). A software algorithm prototype for optical recognition of embossed Braille. Proceedings of the 17th International Conference on Pattern Recognition. tr. 586–589. doi:10.1109/ICPR.2004.1334316. ISBN 978-0-7695-2128-2. ISSN 1051-4651.
  4. ^ Ng, C.; Ng, V.; Lau, Y. (tháng 9 năm 1999). Regular feature extraction for the recognition of braille. Third International Conference on Computational Intelligence and Multimedia Applications. tr. 302–306. doi:10.1109/ICCIMA.1999.798547. ISBN 978-0-7695-0300-4.
  5. ^ Murray, I.; Dias, T. (2001). A portable device for optically recognizing Braille. The Seventh Australian and New Zealand Intelligent Information Systems Conference. tr. 302–306. doi:10.1109/ANZIIS.2001.974063. ISBN 978-1-74052-061-4.
  6. ^ Al-Saleh, Amany; El-Zaart, Ali; Al-Salman, Abdul Malik (2011). “Dot detection of Braille images using a mixture of beta distributions”. Journal of Computer Science. 7 (11): 1749–1759. doi:10.3844/jcssp.2011.1749.1759. ISSN 1549-3636.
  7. ^ a b Antonacopoulos, A.; Bridson, D. (2004). A Robust Braille Recognition System. Document Analysis Systems. Lecture Notes in Computer Science. VI. tr. 533–545. doi:10.1007/978-3-540-28640-0_50. ISBN 978-3-540-23060-1. ISSN 0302-9743.