Phân bổ Dirichlet tiềm ẩn

Trong xử lý ngôn ngữ tự nhiên, phân bổ Dirichlet tiềm ẩn (tiếng Anh: Latent Dirichlet allocation, hay viết tắt LDA) là một mô hình sinh mẫu cho phép các tập quan sát được giải thích bằng các nhóm biến tiềm ẩn lý do tại sao một số phần trong dữ liệu lại giống nhau.[1] Ví dụ, nếu các quan sát là các từ thu thập trong các tài liệu, điều đó giả định mỗi tài liệu là một sự pha trộn của một số lượng chủ đề và mỗi thể hiện từ có tính quy kết cho một trong các chủ đề của tài liệu. LDA là một ví dụ của mô hình chủ đề và thuộc về hộp công cụ học máy và ở nghĩa rộng hơn thuộc về hộp công cụ trí tuệ nhân tạo.

Lịch sử

[sửa | sửa mã nguồn]

Với bối cảnh di truyền học quần thể, LDA do Jonathan K. Pritchard, Matthew Stephens (statistician)Peter Donnelly đề xuất năm 2000.[2][3] Sau đó, LDA được áp dụng cho Học máy bởi David Blei, Andrew NgMichael I. Jordan vào năm 2003.[4]

Tham khảo

[sửa | sửa mã nguồn]
  1. ^ Latent Dirichlet Allocation module, Microsoft.
  2. ^ Pritchard, J. K.; Stephens, M.; Donnelly, P. (tháng 6 năm 2000). "Inference of population structure using multilocus genotype data". Genetics. Quyển 155 số 2. tr. pp. 945–959. ISSN 0016-6731. PMC 1461096. PMID 10835412.
  3. ^ Falush, D.; Stephens, M.; Pritchard, J. K. (2003). "Inference of population structure using multilocus genotype data: linked loci and correlated allele frequencies". Genetics. Quyển 164 số 4. tr. pp. 1567–1587. PMC 1462648. PMID 12930761.
  4. ^ Blei, David M.; Ng, Andrew Y.; Jordan, Michael I (tháng 1 năm 2003). Lafferty, John (biên tập). "Latent Dirichlet Allocation". Journal of Machine Learning Research. Quyển 3 số 4–5. tr. pp. 993–1022. doi:10.1162/jmlr.2003.3.4-5.993. Bản gốc lưu trữ ngày 1 tháng 5 năm 2012. Truy cập ngày 19 tháng 12 năm 2006.

Liên kết ngoài

[sửa | sửa mã nguồn]
  • D. Mimno's LDA Bibliography An exhaustive list of LDA-related resources (incl. papers and some implementations)
  • Gensim, a Python+NumPy implementation of online LDA for inputs larger than the available RAM.
Chúng tôi bán
Bài viết liên quan
Giới thiệu Anime/Manga Kaiju No.8 - Tân binh tiềm năng
Giới thiệu Anime/Manga Kaiju No.8 - Tân binh tiềm năng
Kaiju No.8 đạt kỉ lục là Manga có số lượng bản in tiêu thụ nhanh nhất với 4 triệu bản in
Vĩnh biệt BAEMIN- hành trình chan chứa đầy cảm xúc
Vĩnh biệt BAEMIN- hành trình chan chứa đầy cảm xúc
Baemin với tên khai sinh đầy đủ là Baedal Minjeok, được sự hẫu thuận mạnh mẽ nên có chỗ đứng vững chắc và lượng người dùng ổn định
Cảm nhận của cư dân mạng Nhật Bản về Conan movie 26: Tàu Ngầm Sắt Đen
Cảm nhận của cư dân mạng Nhật Bản về Conan movie 26: Tàu Ngầm Sắt Đen
Movie đợt này Ran đóng vai trò rất tích cực đó. Không còn ngáng chân đội thám tử nhí, đã thế còn giúp được cho Conan nữa, bao ngầu
Corpse Bride - tản mạn về phim, cảm xúc của Victor đối với Emily là gì?
Corpse Bride - tản mạn về phim, cảm xúc của Victor đối với Emily là gì?
Victor gặp Emily trong một hoàn cảnh khá trớ trêu. Emily là một cô gái hồng nhan bạc mệnh, vì trót trao nhầm tình yêu cho một kẻ đểu cáng mà ra đi tức tưởi trong bộ váy cưới