Phân tích cú pháp

Phân tích cú pháp (tiếng Anh: parsing, syntax analysis, hoặc syntactic analysis) là một quá trình phân tích một chuỗi các biểu tượng, sử dụng trong ngôn ngữ tự nhiên, ngôn ngữ máy tính và các cấu trúc dữ liệu, tuân theo các quy tắc của ngữ pháp hình thức (formal grammar). Thuật ngữ parsing đến từ từ Latin pars (orationis), nghĩa là từ loại.[1]

Thuật ngữ này có đôi chút khác biệt trong các chuyên ngành ngôn ngữ họckhoa học máy tính. Phân tích cú pháp một câu truyền thống thông thường được thực thi dưới dạng một phương pháp hiểu ý nghĩa chính xác của một câu hoặc từ, đôi khi với sự trợ giúp của các thiết kế chẳng hạn như các biểu đồ câu. Theo đó, tầm quan trọng của các bộ phận ngữ pháp như chủ ngữvị ngữ được nhấn mạnh.

Thuật ngữ cũng được dùng trong ngôn ngữ học tâm lý khi mô tả sự hiểu biết ngôn ngữ. Trong bối cảnh đó, phân tích cú pháp là cách con người phân tích một câu hay cụm từ (trong tiếng nói hay văn bản) "xét theo các nhân tố cấu thành ngữ pháp, xác định các thành phần của lời nói, các quan hệ cú pháp,..."[1] Thuật ngữ này đặc biệt phổ biến khi thảo luận về những tín hiệu ngôn ngữ nào giúp người nói diễn dịch câu đường đi trong vườn (garden-path sentence, câu lập lờ).

Với khoa học máy tính, thuật ngữ được dùng để phân tích ngôn ngữ máy tính, nhắc đến cách phân tích cú pháp của mã đầu vào thành các phần thành phần của nó nhằm tạo điều kiện thuận lợi cho việc viết trình biên dịchtrình thông dịch. Thuật ngữ cũng dùng cho việc mô tả sự tách biệt hay phân chia.

Ví dụ[sửa | sửa mã nguồn]

Sử dụng thư viện spaCy để phân tích cú pháp của câu "Apple is looking at buying U.K. startup for $1 billion" bằng ngôn ngữ Python.

import spacy

nlp = spacy.load("en_core_web_sm")
doc = nlp("Apple is looking at buying U.K. startup for $1 billion")

for token in doc:
    print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,
            token.shape_, token.is_alpha, token.is_stop)

Xem thêm[sửa | sửa mã nguồn]

Tham khảo[sửa | sửa mã nguồn]

  1. ^ a b “Parse”. dictionary.reference.com. Truy cập ngày 27 tháng 11 năm 2010.

Đọc thêm[sửa | sửa mã nguồn]

Liên kết ngoài[sửa | sửa mã nguồn]

Chúng tôi bán
Bài viết liên quan
Tìm hiểu về căn bệnh tâm lý rối loạn lưỡng cực
Tìm hiểu về căn bệnh tâm lý rối loạn lưỡng cực
Rối loạn lưỡng cực là căn bệnh tâm lý phổ biến với tên gọi khác là bệnh rối loạn hưng – trầm cảm
Nhân vật Ryuunosuke - Sakurasou No Pet Na Kanojo
Nhân vật Ryuunosuke - Sakurasou No Pet Na Kanojo
Akasaka Ryuunosuke (赤坂 龍之介 - Akasaka Ryūnosuke) là bệnh nhân cư trú tại phòng 102 của trại Sakurasou. Cậu là học sinh năm hai của cao trung Suiko (trực thuộc đại học Suimei).
Lịch sử năng lượng của nhân loại một cách vắn tắt
Lịch sử năng lượng của nhân loại một cách vắn tắt
Vì sao có thể khẳng định rằng xu hướng chuyển dịch năng lượng luôn là tất yếu trong quá trình phát triển của loài người
Shiina Mashiro - Sakurasou No Pet Na Kanojo
Shiina Mashiro - Sakurasou No Pet Na Kanojo
Shiina Mashiro (椎名 ましろ Shiina Mashiro) là main nữ trong "Sakurasou no Pet Na Kanojo" và hiện đang ở tại phòng 202 trại Sakurasou. Shiina có lẽ là nhân vật trầm tính nhất xuyên suốt câu chuyện.