شبکه عصبی گرافی (GNN) یک کلاس از شبکههای عصبی مصنوعی برای پردازش دادهها است که میتواند به صورت یک گراف نمایش داده شود.[۱][۲]
در موضوع کلیتر "یادگیری ژرف هندسی"، برخی از معماریهای شبکه عصبی خاص موجود را میتوان به عنوان شبکههای عصبی گرافی که بر روی گرافهای خوشتعریف عمل میکنند تفسیر کرد. شبکههای عصبی پیچشی، در زمینه بینایی کامپیوتری، میتوانند بهعنوان یک شبکه عصبی گراف به اعمال شده روی گرافهایی که بهصورت شبکههایی از پیکسلها ساخته شدهاند، دیده شوند. ترنسفورمرها، در زمینه پردازش زبانهای طبیعی، میتوانند بهعنوان شبکههای عصبی گرافی دیده شوند که برای گراف کاملی که گرههای آنها کلمات در یک جمله هستند اعمال میشوند.
نکته کلیدی در طراحی شبکههای عصبی گرافی، استفاده از روش ارسال پیام بهصورت زوجی است؛ بهگونهای که گرههای گراف به طور مکرر مقادیر و نمایششان را از طریق تبادل اطلاعات با همسایههایشان بهروز میکنند. از زمان ظهور شبکههای عصبی گرافی، معماریهای مختلفی با انواع روشهای ارسال پیام معرفی شدهاند. اما تا به امروز این سوال که آیا میتوان معماری شبکههای عصبی گرافی ارائه کرد که از ارسال پیام فراتر برود یا برای هر گرافی که به شکلی مناسب تعریف شده است یک مدل شبکه عصبی گرافی مبتنی بر ارسال پیام طراحی کرد بدون پاسخ باقیماندهاست.
در معماری یک شبکه عصبی گرافی عمومی لایههای اساسی زیر پیادهسازی میشوند:
هموردای جایگشتی: یک لایه هموردای جایگشتی، نمایشی از یک گراف را به یک نمایش بهروز شده از همان گراف نگاشت میکند. در مقالات، لایههای هموردای جایگشتی از طریق ارسال پیام زوجی بین گرههای گراف پیادهسازی میشوند. به طور شهودی، در یک لایه ارسال پیام، گرهها با جمعآوری پیامهای دریافتی از همسایگان خود، نمایش خود را بهروزرسانی میکنند. به این ترتیب، هر لایه ارسال پیام، میدان دریافتی شبکه عصبی گرافی را یک جهش افزایش میدهد.بلوکهای اصلی ساختار یک شبکه عصبی گراف (GNN). لایه هموردا به جایگشت. لایه ادغام محلی. لایه ادغام سراسری (یا بازخواندن). رنگها ویژگیها را نشان میدهند.
ادغام محلی: یک لایه ادغام محلی، گراف را از طریق نمونهکاهی، ناهموار میکند.[۳] از ادغام محلی برای افزایش میدان دریافتی یک شبکه عصبی گرافی، به روشی مشابه لایههای ادغام در شبکههای عصبی پیچشی استفاده میشود. به عنوان مثال میتوان به ادغام k-نزدیکترین همسایهها، ادغام top-k و ادغام توجهبهخود اشاره کرد.[۴]
ادغام سراسری: یک لایه ادغام سراسری، که همچنین به عنوان لایه بازخوانی شناخته می شود، نمایشی با اندازه ثابت از کل گراف ارائه میدهد. لایه ادغام سراسری باید نسبت به تغییرات جایگشتی بدون تغییر بماند، به طوری که جایگشت در ترتیب گرهها و یالهای گراف، خروجی نهایی را تغییر ندهد.[۵] مثالها عبارتند از: مجموع، میانگین یا حداکثر عناصر.[۶]
بهروزرسانی نمایش گرهها در لایه شبکه عصبی ارسال پیام. گره پیام ارسالشده توسط تمام همسایههای مستقیمش یعنی تا را دریافت میکند. این پیامها توسط تابع پیام محاسبه میشوند که توصیفی از هردوی فرستندهها و گیرندهها است.
لایههای انتقال پیام، لایههای هموردا نسبت به جایگشت هستند که یک گراف را به نمایش بهروز شدهای از همان گراف نگاشت میکنند. در واقع، میتوان این لایهها را به عنوان شبکههای عصبی ارسالکننده پیام (MPNN) عنوان کرد.[۷][۸]
فرض کنید یک گراف با مجموعه گرههای و مجموعه یالهای و همسایگی گره باشد. همچنین فرض کنید بردار ویژگیهای گره و بردار ویژگیهای یال باشد. یک شبکه عصبی ارسالکننده پیام میتواند به شکل زیر بیان شود:
که و توابع دیفرانسیلپذیر و یک عملگر تجمیع ناوردا نسبت به جایگشت است که میتواند تعداد دلخواهی ورودی را بپذیرد. توابع و اغلب به ترتیب توابع بهروزرسانی و پیام مینامند. به طور شهودی، یک بلوک محاسباتی شبکه عصبی ارسالکننده پیام، گرههای گراف با تجمیع پیامهای دریافت شده از همسایههایشان،نمایش خود را بهروز میکنند.
خروجی های یک یا چند لایه شبکه عصبی ارسالکننده پیام، نمایشهای گره به فرم برای هر گره هستند. این نمایشهای گره میتوانند برای هر کار جریان پاییندست مانند طبقهبندی گرهها یا پیشبینی یالها بهکار روند.
لایههای ادغام محلی گراف را از طریق نمونهکاهی ناهموار میکنند. ما در اینجا دو استراتژی ادغام محلی قابل یادگیری را ارائه میکنیم.[۳] در هر مورد، ورودی یک گراف اولیه است که با ماتریس به عنوان ماتریس ویژگیهای گرهها و ماتریس مجاورت نمایش داده میشود. خروجی نیز یک ماتریس ویژگی جدید و یک ماتریس مجاورت جدید است.
که یک بردار پروجکشن قابل یادگیری است. بردار پروجکشن یک مقدار پروجکشن اسکالر برای هر گره محاسبه میکند.
لایه ادغام Top-k را میتوان به شکل زیر بیان کرد:
که زیرمجموعه گره گراف با بالاترین مقدار پروجکشن و نشاندهنده ضرب نظیر به نظیر درایههای ماتریس است. به عبارت دیگر، گرههایی که بالاترین مقادیر پروجکشن را دارند، در ماتریس مجاورت جدید حفظ میشوند. تابع سیگموئید استفاده شده نیز باعث میشود بردار پروجکشن از طریق پسانتشار(backpropagation) قابل یادگیری باشد؛ زیرا در غیر اینصورت خروجیهای گسسته تولید میشود.[۹]
لایه ادغام توجه به خود را میتوان به شکل زیر بیان کرد:[۴]
که زیرمجموعه گره گراف با بالاترین مقدار پروجکشن و نشاندهنده ضرب نظیر به نظیر درایههای ماتریس است.
لایه ادغام توجه به خود را میتوان به عنوان افزونهای بر لایه ادغام top-k در نظر گرفت. با این تفاوت که مقادیر محاسبه شده در لایه ادغام توجه به خود، توصیفی از هردوی ویژگیهای گرههای گراف و توپولوژی آن است.
شبکههای عصبی گرافی به عنوان بلوکهای سازنده اساسی برای چندین الگوریتم بهینهسازی ترکیبیاتی استفاده میشوند. مثالهایی از آن عبارتند از محاسبه کوتاهترین مسیرها یا مدارهای اویلری برای یک گراف، پیدا کردن جایگذاریهای بهتر تراشهها نسبت به راهحلهای دست انسان، و بهبود قوانین انشعاب طراحیشده در شاخه و کران.[۱۳]