Trích xuất thông tin

Trích xuất thông tin (tiếng Anh: information extraction, viết tắt IE) là tác vụ tự động trích xuất thông tin có cấu trúc từ dữ liệu phi cấu trúc và/hoặc các văn bản dữ liệu máy có thể đọc được (machine-readable data) bán cấu trúc và các nguồn tài nguyên thể hiện điện tử khác.[1] Trong đa số các trường hợp, hoạt động này liên quan đến việc xử lý các văn bản ngôn ngữ con người bằng cách phương tiện xử lý ngôn ngữ tự nhiên (NLP). Các hoạt động gần đây trong xử lý tài liệu đa phương tiện như chú thích tự động và trích xuất nội dung ra khỏi hình ảnh/âm thanh/video/tài liệu có thể được xem là trích xuất thông tin.

Xem thêm[sửa | sửa mã nguồn]

Tham khảo[sửa | sửa mã nguồn]

  1. ^ “What is Information Extraction? Ontotext Fundamentals”. Ontotext. Truy cập 23 tháng 2 năm 2021.

Liên kết ngoài[sửa | sửa mã nguồn]

Chúng tôi bán
Bài viết liên quan
Đức Phật Thích Ca trong Record of Ragnarok
Đức Phật Thích Ca trong Record of Ragnarok
Buddha là đại diện của Nhân loại trong vòng thứ sáu của Ragnarok, đối đầu với Zerofuku, và sau đó là Hajun, mặc dù ban đầu được liệt kê là đại diện cho các vị thần.
Review Doctor John - “Vì là con người, nên nỗi đau là có thật”
Review Doctor John - “Vì là con người, nên nỗi đau là có thật”
“Doctor John” là bộ phim xoay quanh nỗi đau, mất mát và cái chết. Một bác sĩ mắc chứng CIPA và không thể cảm nhận được đau đớn nhưng lại là người làm công việc giảm đau cho người khác
Hướng dẫn cày Genshin Impact tối ưu và hiệu quả nhất
Hướng dẫn cày Genshin Impact tối ưu và hiệu quả nhất
Daily Route hay còn gọi là hành trình bạn phải đi hằng ngày. Nó rất thú vị ở những ngày đầu và rất rất nhàm chán về sau.
Đừng chơi chứng khoán, nếu bạn muốn giàu
Đừng chơi chứng khoán, nếu bạn muốn giàu
Nếu bạn đang có ý định “chơi” chứng khoán, hay đang “chơi” với số vốn trăm triệu đổ lại thì bài này dành cho bạn