Segmentasi teks

Segmentasi teks adalah proses pemisahan teks tertulis menjadi unit makna seperti kata, kalimat, atau topik. Istilah ini dapat diterapkan baik untuk proses mental yang dilakukan oleh manusia sewaktu membaca teks, maupun proses buatan yang dilakukan oleh komputer dan menjadi bahan kajian pemrosesan bahasa alami. Meskipun beberapa aksara memiliki batas kata eksplisit (seperti spasi) atau pembedaan bentuk huruf awal, tengah, dan akhir (seperti pada aksara Arab), penanda tersebut kadang taksa dan tidak semua bahasa tulisan memilikinya.

Lihat pula

[sunting | sunting sumber]