t-분포 확률적 임베딩(t-SNE)은 데이터의 차원 축소에 사용되는 기계 학습 알고리즘 중 하나로, 2002년 샘 로이스Sam Rowise와 제프리 힌턴에 의해 개발되었다.[1] t-SNE는 비선형 차원 축소 기법으로, 고차원 데이터를 특히 2, 3차원 등으로 줄여 가시화하는데에 유용하게 사용된다. 구체적으로 t-SNE는 비슷한 데이터는 근접한 2, 3차원의 지점으로, 다른 데이터는 멀리 떨어진 지점으로 맵핑한다.
t-SNE 알고리즘은 두 단계에 걸쳐서 진행된다. 첫번째로, 각 데이터 쌍에 대해서 결합분포를 만든다. 이 분포는 비슷한 데이터는 선택될 확률이 매우 높지만 다른 데이터끼리는 선택될 확률이 매우 낮도록 설계된다.
↑Gashi, I.; Stankovic, V.; Leita, C.; Thonnard, O. (2009). “An Experimental Study of Diversity with Off-the-shelf AntiVirus Engines”. 《Proceedings of the IEEE International Symposium on Network Computing and Applications》: 4–11.
↑Hamel, P.; Eck, D. (2010). “Learning Features from Music Audio with Deep Belief Networks”. 《Proceedings of the International Society for Music Information Retrieval Conference》: 339–344.
↑Wallach, I.; Liliean, R. (2009). “The Protein-Small-Molecule Database, A Non-Redundant Structural Resource for the Analysis of Protein-Ligand Binding”. 《Bioinformatics》 25 (5): 615–620. doi:10.1093/bioinformatics/btp035. PMID19153135.
↑Birjandtalab, J.; Pouyan, M. B.; Nourani, M. (2016년 2월 1일). 《Nonlinear dimension reduction for EEG-based epileptic seizure detection》. 《2016 IEEE-EMBS International Conference on Biomedical and Health Informatics (BHI)》. 595–598쪽. doi:10.1109/BHI.2016.7455968. ISBN978-1-5090-2455-1. S2CID8074617.