מִחְשׁוּב חִישָׁתִי (באנגלית: Affective computing) הוא מחקר ופיתוח של מערכות והתקנים אשר יכולים לזהות, לפרש, לעבד ולדמות השפעות אנושיות. זהו ענף בינתחומי המשתרע על פני מדעי המחשב, פסיכופיזיולוגיה ומדעי הקוגניציה[1]. ניתן למצוא כמה מרעיונות הליבה בתחום כבר בחקירה הפילוסופית המוקדמת על רגש[2], אולם הקישור המודרני יותר אל מדעי המחשב מקורו במאמרה של רוזלינד פיקארד משנת 1995[3] על מחשוב חישתי ובספרה Affective Computing[4] אשר פורסם על ידי דפוס MIT. אחד המניעים למחקר הוא היכולת להעניק למכונות אינטליגנציה רגשית, לרבות לדמות אמפתיה. המכונה צריכה לפרש את המצב הרגשי של בני האדם ולהתאים את התנהגותה אליהם, כלומר - לתת מענה הולם לאותם רגשות.
גילוי מידע רגשי מתחיל בדרך כלל בחיישנים פסיביים אשר אוספים נתונים על המצב הפיזי או על התנהגותו של המשתמש האנושי מבלי לפרש את הקלט. הנתונים שנאספים מקבילים תאורטית לרמזים שבני אדם משתמשים בהם כדי לתפוס רגשות אצל אחרים. לדוגמה, מצלמת וידאו עשויה ללכוד הבעות פנים, תנוחת גוף ומחוות, בעוד שמיקרופון עשוי ללכוד דיבור. חיישנים אחרים מזהים רמזים רגשיים על ידי מדידה ישירה של נתונים פיזיולוגיים, כגון טמפרטורת העור והתנגדות גלוונית[5].
זיהוי מידע רגשי מחייב חילוץ של דפוסים משמעותיים מהנתונים שנאספו. הדבר יכול להתבצע באמצעות טכניקות למידת מכונה שונות, כגון זיהוי דיבור, עיבוד שפה טבעית או זיהוי הבעות פנים, כמו גם בשיטות מסורתיות כגון סטטיסטיקה הסקית. המטרה של רוב הטכניקות הללו היא לייצר תוויות שיתאימו לתוויות שתופס אנושי היה נותן באותו מצב: לדוגמה, אם אדם מחווה הבעת פנים כגון קימוט המצח, אזי מערכת הראייה הממוחשבת עשויה להצמיד לאותו אדם את התוויות "מבולבל", "מרוכז" או "מעט שלילי". תוויות אלה עשויות להיות תואמות או לא להתאים למה שהאדם מרגיש בפועל.
ענף נוסף במחשוב רגשי שואפת להגיע לתכנון של מכשירים חישוביים שלהם רגשות ממש או שביכולתם לדמות באופן משכנע רגשות. גישה מעשית יותר, אשר מבוססת על יכולות טכנולוגיות עדכניות, היא הדמיית רגשות בסוכני שיחה על מנת להעשיר ולהקל על האינטראקטיביות בין האדם למכונה[6]. הגישה החדשנית "בני אדם דיגיטליים" או בני אדם וירטואליים כוללת ניסיון להקנות לתוכנות אלה, אשר מדמות בני אדם, גם את המימד הרגשי, כולל תגובות בהתאם לתגובה שאדם אמיתי היה מגיב במצב מסוים שמעורר מבחינה רגשית וכן הבעות פנים ומחוות[7].
בפסיכולוגיה, במדעי הקוגניציה ובמדעי המוח, קיימות שתי גישות עיקריות לתיאור האופן שבו בני אדם תופסים ומסווגים רגש: גישת הרצף והגישה הקטגורית. גישת הרצף נוטה להשתמש בממדים כמו שלילי מול חיובי, רגוע מול מגורה. הגישה הקטגורית נוטה להשתמש בסיווגים מובחנים של רגש, כמו שמח, עצוב, כועס, מפחד, מופתע, נגעל. ניתן להשתמש בסוגים שונים של רגרסיה ושיטות למידת מכונה כדי לייצר תוויות רציפות או בדידות של רגשות. ישנם מודלים אשר מאפשרים שילוב בין הקטגוריות. למשל, פרצוף מופתע-שמח או פרצוף חושש-מופתע[8].
הסעיפים הבאים מתייחסים לנתוני הקלט העיקריים אשר משמשים עבור זיהוי רגשות.
על פי גישת הפסיכופיזיולוגיה, ניתן לזהות את המצב הרגשי של בני אדם על ידי ניטור וניתוח הסימנים הפיזיולוגיים שלהם. סימנים אלו נעים החל משינויים בקצב הלב ובמוליכות העור, דרך ניתוח חשמלי של פעילות מוחית ופעילות השרירים ועד לניתוח כוח האחיזה[9]. תחום זה הופך לרווח בשנים אלו ולאחרונה ניתן למצוא מוצרים אשר מיישמים את שיטה זו, הודות לחסינות השיטה להטיות מכוונות של התוצאות על ידי האדם הנמדד וכן הודות לרציפות במדידה, שמאפשרת להשתמש בתוצרי המדידה במערכות מחשוב חישתי בזמן אמת.
שינויים שונים במערכת העצבים האוטונומית יכולים לשנות בעקיפין את אופן הדיבור של האדם, וטכנולוגיות מחשוב חישתי יכולות למנף מידע זה לטובת זיהוי רגש. לדוגמה, דיבור שמופק במצב של פחד, כעס או שמחה הופך להיות מהיר, רועש ומבוטא במדויק, עם טווח גבוה ורחב יותר בגובה הצליל, בעוד שרגשות כמו עייפות, שעמום או עצב נוטים ליצור דיבור איטי, מטושטש ומעורפל[10]. עוד נמצא כי רגשות מסוימים מזוהים בקלות רבה יותר מבחינה חישובית, כגון כעס[11] או אישור[12].
טכנולוגיות עיבוד של דיבור רגשי מזהות את המצב הרגשי של האדם באמצעות ניתוח חישובי של תכונות דיבור. ניתן לנתח פרמטרים ווקאליים כגון משתני גובה וקצב דיבור באמצעות טכניקות זיהוי תבניות[11][13].
ניתוח דיבור הוא שיטה יעילה לזיהוי מצב רגשי, עם דיוק ממוצע של 70% עד 80%, על פי מחקרים משנת 2003 ו-2006[14][15]. שיטות אלו נוטות לעלות על הדיוק האנושי הממוצע (כ-60%[11]), אך הן פחות מדויקות משיטות אחרות לזיהוי רגשות, כגון מדדים פסיכופיזיולוגיים או זיהוי הבעות פנים[16]. עם זאת, מכיוון שמאפייני דיבור רבים אינם תלויים בסמנטיקה או בתרבות, טכניקה זו נחשבת לכיוון מבטיח למחקר נוסף.
זיהוי ועיבוד הבעות פנים מבוצעים באמצעות שיטות שונות כגון זרימה אופטית, מודל מרקוב חבוי, עיבוד רשתות עצביות או מודלים של מראה פעיל. ניתן לשלב או למזג יותר מאופן אחד (זיהוי רב-מודאלי, למשל הבעות פנים ופרוזודית דיבור[17], או הבעות פנים ומחוות ידיים[18],) כדי לספק הערכה טובה יותר של מצבו הרגשי של האדם.
ניתן להשתמש במחוות גופניות כאמצעי יעיל לזיהוי מצב רגשי מסוים של המשתמש, במיוחד כאשר נעשה בהם שימוש בשילוב עם דיבור וזיהוי הבעות פנים. בהתאם לפעולה הספציפית, מחוות יכולות להיות תגובות רפלקסיביות פשוטות, כמו הרמת כתפיים כאשר לא יודעים את התשובה לשאלה, או שהן יכולות להיות מורכבות ומשמעותיות כמו בעת תקשורת באמצעות שפת הסימנים. מחד, ללא כל שימוש בחפצים אנו יכולים לנופף בידיים, למחוא כפיים או לקרוץ. מאידך, בעת שימוש בחפצים, אנו יכולים להצביע עליהם, להזיז, לגעת או לבצע בהם פעולות. תוכנות מחשוב חישתי מסוימות מסוגלות לזהות מחוות שונות, לנתח את ההקשר ולהגיב בצורה משמעותית, על מנת לשפר את יעילות האינטראקציה שבין אדם למחשב.
ישנן שיטות רבות לזיהוי מחוות הגוף[19]. הספרות המחקרית מבחינה בין שתי גישות שונות לזיהוי מחוות: מודל תלת מימד ומודל מבוסס מַרְאֶה[20]. השיטה המובילה עושה שימוש במידע תלת־ממדי של אלמנטים מרכזיים של חלקי הגוף על מנת לקבל מספר פרמטרים חשובים, כמו מיקום כף היד או זוויות של מפרקים. מערכות המבוססות על מַרְאֶה משתמשות בתמונות או בסרטונים לצורך פרשנות ישירה. תנועות ידיים היו מוקד נפוץ בשיטות זיהוי מחוות גוף[20].
חיבה משפיעה על מצב הלמידה של הלומדים. באמצעות טכנולוגיית מחשוב רגשי, מחשבים יכולים לשפוט את חיבתם של הלומדים ואת מצב הלמידה שלהם על ידי זיהוי הבעות הפנים שלהם. בחינוך, המורים יכולים להשתמש בתוצאת הניתוח כדי להבין את יכולת הלמידה והקבלה של התלמידים, ולאחר מכן לגבש תוכניות הוראה סבירות. במקביל, הם יכולים לשים לב לתחושות הפנימיות של התלמידים ולהתנהל בהתאם, דבר אשר עשוי להועיל לבריאותם הפסיכולוגית של התלמידים. בחינוך מרחוק, בשל הפרדת זמן ומרחב, אין תמריץ רגשי לתקשורת דו-כיוונית בין מורים לתלמידים. ללא האווירה שמביאה הלמידה המסורתית בכיתה, התלמידים משתעממים בקלות ולדבר יש השפעה על אפקט הלמידה. יישום גישת המחשוב הרגשי בחינוך מרחוק יכול לתרום ליעילות מצב למידה זה[21].
רובוטים חברתיים, כמו גם מספר הולך וגדל של רובוטים אשר משמשים בתחום הבריאות, נהנים ממידה מסוימת של מודעות רגשית מכיוון שהם יכולים לשפוט טוב יותר את המצבים הרגשיים של המשתמשים והמטופלים ולשנות את הפעולות שלהם בהתאם. יכולת זו חשובה במיוחד במדינות עם אוכלוסיות מזדקנות הולכות וגדלות ובמדינות שבהן קיים מחסור בעובדים צעירים, כדי לתת מענה לצרכיהם של המבוגרים[22].
מחשוב אפקטיבי מיושם גם בפיתוח טכנולוגיות תקשורת לטובת שימוש על ידי אנשים עם אוטיזם[23]. גם מרכיבים רגשיים של טקסטים זוכים יותר ויותר לתשומת לב ובמיוחד תפקידם במה שמכונה האינטרנט הרגשי[24].
יישומי המחשוב החישתי עשויים לתרום לשיפור הבטיחות בדרכים. לדוגמה, מכונית יכולה לנטר את הרגשות של כל הנוסעים ולהתריע על כלי רכב אחרים אם היא מזהה שהנהג כועס וייתכן שאינו מודע להתקרבותם[25]. בנוסף, מערכות מחשוב חישתי לניטור דחק של הנהג עשויות לאפשר התערבויות שונות כגון מערכות עזר לנהג מותאמות על פי רמת הדחק[26] והתערבויות מזעריות וישירות לשינוי מצבו הרגשי של הנהג[27].
למשחקי וידאו רגשיים יכולת קליטה של המצב הרגשי של השחקנים אשר משחקים בהם באמצעות אמצעי מדידה פסיכופיזיולוגיים[28]. מדידה פסיכופיזיולוגית זמינה באמצעות גיימפאד אשר מודד את הלחץ שבו לוחצים על כפתור, שנמצא במתאם חזק עם רמת העוררות של השחקן[29]. בנוסף ישנם משחקי מחשב אשר כוללים ממשקי מוח-מחשב ישירים[30]. משחקים רגשיים שימשו במחקר רפואי כדי לתמוך בהתפתחות הרגשית של ילדים עם אוטיזם[31].
שיטות אימון של פעולות פסיכומוטוריות כמו ניהוג והכוונה משמשות בתחומים שונים כגון תעופה, תחבורה ורפואה. שילוב של יכולות מחשוב חישתי במערכות אימון כאלה, בהתאם לגישת האוטומציה האדפטיבית, נמצא כיעיל בשיפור איכות האימון ובקיצור משך האימון הנדרש[32].
יישומים אפשריים של מחשוב חישתי טמונים באינטראקציה בין אדם למחשב, כגון מראות רגשיות אשר מאפשרות למשתמש לראות כיצד הוא או היא מתפקדים; סוכני ניטור רגשות שמזהירים את המשתמש לפני שזה שולח מייל זועם; או אפילו נגני מוזיקה אשר בוחרים רשימות השמעה בהתאם מצב הרוח[33].
בתחום אינטראקציית אדם-מחשב, המושג הקוגניטיביסטי או "מודל המידע" של רוזלינד פיקארד של רגש זכה לביקורת על-ידי הגישה הפרגמטית ה"פוסט-קוגניטיביסטית" או ה"אינטראקציונית" של קירסטן בוהנר ואחרים, אשר רואה ברגש מטבעו מושג חברתי[34].
המיקוד של פיקארד הוא באינטראקציה בין אדם למחשב, והמטרה שלה בתחום המחשוב הרגשי היא לתת למחשבים את היכולת לזהות, לבטא, ובמקרים מסוימים, "להיות" עם רגשות[4]. לעומת זאת, הגישה האינטראקציונית מבקשת לעזור לאנשים להבין ולחוות את רגשותיהם[35] ולשפר את התקשורת הבין אישית אשר מתווכת באמצעות המחשב. גישה זו לא בהכרח מבקשת למפות את הרגש למודל מתמטי אובייקטיבי לפרשנות על ידי מכונה, אלא לתת לבני אדם להבין את הביטויים הרגשיים זה של זה בדרכים פתוחות שעשויות להיות מעורפלות, סובייקטיביות ורגישות להקשר[35].