שיכון מילים משמש בעיבוד שפה טבעית (NLP), לייצוג של מילה. הייצוג משמשת לעיבוד ואנליזה של טקסטים. בדרך כלל, הייצוג הוא וקטור רב ממדי של מספרים ממשיים המקודד את משמעות המילה, באופן שמילים קרובות במרחב הווקטורי תהיינה דומות במשמעותן.[1] קיימות דרכים רבות להפיק שיכוני מילים, בין השאר באמצעות מודלי שפה, רשתות נוירונים, הורדת מימד, מודלים הסתברותיים ועוד.
שיכון של מילים ומשפטים משפרים מאוד את הביצועים של במשימות עיבוד שפה טבעית מסוימות כמו ניתוח מחרוזות[2] וניתוח סנטימנט.[3]
שיכון One Hot Vector (חם יחיד) הוא אחת הדרכים הפשוטות לשיכון מילים: בהינתן אוצר מילים של N מילים, כל מילה תיוצג באמצעות וקטור N ממדי ייחודי. כל אברי הווקטור יכילו אפסים, למעט איבר אחד שיכיל את הערך 1, בתא המשמש באופן ייחודי לזיהוי המילה. למרות פשטותה, גישה זו סובלת מקללת הממדים (אנ'), חסרה מידע סמנטי ואינה מייצגת את הקשרים בין מילים.[4]