Trích xuất câu

Trích xuất câu (hay còn gọi là rút trích câu, tiếng Anh: sentence extraction) là một kỹ thuật được sử dụng cho việc tóm tắt tự động văn bản.[1] Theo cách tiếp cận thô sơ này, người ta áp dụng một thống kê heuristic (dựa trên kinh nghiệm) để nhận dạng các câu quan trọng nhất (các câu có ý nghĩa) trong một văn bản. Trích xuất câu là một phương pháp tiếp cận có chi phí rẻ khi so sánh với các phương pháp tiếp cận đòi hỏi kiến thức sâu hơn, cần các cơ sở kiến thức bổ sung như bản thể học hay ngôn ngữ học. Tóm lại, "trích xuất câu" hoạt động như một bộ lọc, chỉ cho phép các câu quan trọng đi qua.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Goldstein, J., Mittal, V. O., Carbonell, J. G., & Kantrowitz, M. (2000). Multi-document summarization by sentence extraction. In NAACL-ANLP 2000 Workshop: Automatic Summarization.
Chúng tôi bán
Bài viết liên quan
Nhân vật Delta -  The Eminence In Shadow
Nhân vật Delta - The Eminence In Shadow
Delta (デルタ, Deruta?) (Δέλτα), trước đây gọi là Sarah (サラ, Sara?), là thành viên thứ tư của Shadow Garden
Design Thinking for Data Visualization: A Practical Guide for Data Analysts
Design Thinking for Data Visualization: A Practical Guide for Data Analysts
Tư duy thiết kế (Design Thinking) là một hệ tư tưởng và quy trình giải quyết các vấn đề phức tạp theo cách lấy người dùng cuối (end-user) làm trung tâm
Seeker: lực lượng chiến đấu tinh nhuệ bậc nhất của phe Decepticon Transformers
Seeker: lực lượng chiến đấu tinh nhuệ bậc nhất của phe Decepticon Transformers
Seeker (Kẻ dò tìm) là thuật ngữ dùng để chỉ một nhóm các người lính phản lực của Decepticon trong The Transformers
Con người rốt cuộc phải trải qua những gì mới có thể đạt đến sự giác ngộ?
Con người rốt cuộc phải trải qua những gì mới có thể đạt đến sự giác ngộ?
Mọi ý kiến và đánh giá của người khác đều chỉ là tạm thời, chỉ có trải nghiệm và thành tựu của chính mình mới đi theo suốt đời