Kiểm chứng chéo

Trong thống kê, kiểm chứng chéo (cross validation) là việc phân nhóm một mẫu dữ liệu thành các mẫu con để cho việc phân tích ban đầu chỉ thực hiện trên một mẫu con đơn, còn các mẫu con còn lại được giữ "kín" để dùng cho việc xác nhận và kiểm chứng lại lần phân tích đầu tiên đó.

Kiểm chứng chéo là quan trọng trong việc đảm bảo tránh được kiểm tra tổng hợp từ dữ liệu, đặc biệt khi mà các mẫu là may rủi, chi phí cao hay không thể (khoa học không thuận lợi thu thập).

Kiểm chứng chéo gồm hai loại: kiểm chứng chéo toàn diện và kiểm chứng chéo không toàn diện.

Tham khảo

[sửa | sửa mã nguồn]

Kohavi, Ron (1995). "A study of cross-validation and bootstrap for accuracy estimation and model selection". Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence. San Mateo, CA: Morgan Kaufmann. 

Chúng tôi bán
Bài viết liên quan
Có nên vay tiêu dùng từ các công ty tài chính?
Có nên vay tiêu dùng từ các công ty tài chính?
Về cơ bản, vay tiêu dùng không khác biệt nhiều so với các hình thức vay truyền thống. Bạn mượn tiền từ ngân hàng trong 1 thời gian
Thuật toán A* - Thuật toán tìm đường đi ngắn nhất giữa hai điểm bất kì được Google Maps sử dụng
Thuật toán A* - Thuật toán tìm đường đi ngắn nhất giữa hai điểm bất kì được Google Maps sử dụng
Đây là thuật toán mình được học và tìm hiểu trong môn Nhập môn trí tuệ nhân tạo, mình thấy thuật toán này được áp dụng trong thực tế rất nhiều
Lịch sử năng lượng của nhân loại một cách vắn tắt
Lịch sử năng lượng của nhân loại một cách vắn tắt
Vì sao có thể khẳng định rằng xu hướng chuyển dịch năng lượng luôn là tất yếu trong quá trình phát triển của loài người
Tại sao blockchain chết?
Tại sao blockchain chết?
Sau một chu kỳ phát triển nóng, crypto có một giai đoạn cool down để ‘dọn rác’, giữ lại những thứ giá trị