Trích xuất thông tin

Trích xuất thông tin (tiếng Anh: information extraction, viết tắt IE) là tác vụ tự động trích xuất thông tin có cấu trúc từ dữ liệu phi cấu trúc và/hoặc các văn bản dữ liệu máy có thể đọc được (machine-readable data) bán cấu trúc và các nguồn tài nguyên thể hiện điện tử khác.[1] Trong đa số các trường hợp, hoạt động này liên quan đến việc xử lý các văn bản ngôn ngữ con người bằng cách phương tiện xử lý ngôn ngữ tự nhiên (NLP). Các hoạt động gần đây trong xử lý tài liệu đa phương tiện như chú thích tự động và trích xuất nội dung ra khỏi hình ảnh/âm thanh/video/tài liệu có thể được xem là trích xuất thông tin.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ “What is Information Extraction? Ontotext Fundamentals”. Ontotext. Truy cập 23 tháng 2 năm 2021.

Liên kết ngoài

[sửa | sửa mã nguồn]
Chúng tôi bán
Bài viết liên quan
Naginata - Vũ khí của Lôi thần Baal
Naginata - Vũ khí của Lôi thần Baal
Trấn của Baal không phải là một thanh Katana, biểu tượng của Samurai Nhật Bản. Mà là một vũ khí cán dài
Vì sao vẫn cứ mãi là cẩu độc thân
Vì sao vẫn cứ mãi là cẩu độc thân
Sống hơn 20 năm rồi, quả là càng sống càng hiểu, hãy thử tổng kết lại vài nguyên nhân nào.
1-In-60 Rule: Quy Luật Giúp Bạn Luôn Tập Trung Vào Mục Tiêu Của Mình
1-In-60 Rule: Quy Luật Giúp Bạn Luôn Tập Trung Vào Mục Tiêu Của Mình
Quy luật "1-In-60 Rule" có nguồn gốc từ ngành hàng không.
Oxytocin - Hormone của tình yêu, lòng tốt và sự tin tưởng
Oxytocin - Hormone của tình yêu, lòng tốt và sự tin tưởng
Trong bài viết này, mình muốn giới thiệu đến các bạn một hormone đại diện cho thứ cảm xúc