Trích xuất thông tin

Trích xuất thông tin (tiếng Anh: information extraction, viết tắt IE) là tác vụ tự động trích xuất thông tin có cấu trúc từ dữ liệu phi cấu trúc và/hoặc các văn bản dữ liệu máy có thể đọc được (machine-readable data) bán cấu trúc và các nguồn tài nguyên thể hiện điện tử khác.[1] Trong đa số các trường hợp, hoạt động này liên quan đến việc xử lý các văn bản ngôn ngữ con người bằng cách phương tiện xử lý ngôn ngữ tự nhiên (NLP). Các hoạt động gần đây trong xử lý tài liệu đa phương tiện như chú thích tự động và trích xuất nội dung ra khỏi hình ảnh/âm thanh/video/tài liệu có thể được xem là trích xuất thông tin.

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ “What is Information Extraction? Ontotext Fundamentals”. Ontotext. Truy cập 23 tháng 2 năm 2021.

Liên kết ngoài

[sửa | sửa mã nguồn]
Chúng tôi bán
Bài viết liên quan
Thông tin nhân vật Oshino Shinobu - Monogatari Series
Thông tin nhân vật Oshino Shinobu - Monogatari Series
Oshino Shinobu (忍野 忍, Oshino Shinobu) là một bé ma cà rồng bí ẩn
Hướng dẫn build đồ cho Neuvillette - Genshin Impact
Hướng dẫn build đồ cho Neuvillette - Genshin Impact
Chỉ kích hoạt các passive khả thi chứ ko phải full sức mạnh của vũ khí, ví dụ như Điển tích tây phong chỉ lấy 2 stack
[Review] 500 ngày của mùa hè | (500) Days of Summer
[Review] 500 ngày của mùa hè | (500) Days of Summer
(500) days of summer hay 500 ngày của mùa hè chắc cũng chẳng còn lạ lẫm gì với mọi người nữa
5 băng đảng bất lương mạnh nhất Tokyo Revengers
5 băng đảng bất lương mạnh nhất Tokyo Revengers
Là manga/anime về cuộc chiến giữa các băng đảng học đường, Tokyo Revengers có sự góp mặt của rất nhiều băng đảng hùng mạnh