روش گروهی مدیریت دادهها (GMDH) یک خانواده از الگوریتمهای استقرایی است که برای مدلسازی ریاضی مجموعه دادههای چندمتغیره بهصورت کاملاً خودکار طراحی شده است. این روش به بهینهسازی ساختاری و پارامتری مدلها میپردازد.
GMDH در زمینه هایی مانند داده کاوی ، کشف دانش ، پیش بینی ، مدل سازی سیستم های پیچیده ، بهینه سازی و تشخیص الگو استفاده می شود. [۱] الگوریتمهای GMDH از یک فرآیند استقرایی استفاده میکنند که طی آن مدلهای چندجملهای بهصورت تدریجی پیچیدهتر میشوند و بهترین مدل با استفاده از یک معیار خارجی انتخاب میشود. بخش آخر [۲] شامل خلاصه ای از کاربردهای GMDH در دهه 1970 است.
این روش گاهی با نامهایی مانند شبکه عصبی پیشخور چندجملهای یا خودسازماندهی مدلها نیز شناخته میشود[۳] .اGMDH یکی از نخستین روشهای یادگیری عمیق است که در سال ۱۹۷۱ برای آموزش یک شبکه عصبی هشتلایه استفاده شد. [۴][۵]
این مسئله عمومی مدلسازی آماری دادهها است: فرض کنید یک مجموعه داده شامل ، با n نقطه داریم. هر نقطه شامل مشاهدات و یک متغیر هدف y برای پیشبینی است. سوال این است که چگونه میتوان متغیر هدف را بر اساس این مشاهدات به بهترین شکل پیشبینی کرد؟
ابتدا مجموعه داده به دو بخش تقسیم میشود:
مجموعه آموزشی: برای تنظیم پارامترهای بیشتر مدل استفاده میشود.
مجموعه اعتبارسنجی: برای تعیین اینکه کدام پارامترها باید شامل شوند و چه زمانی باید فرآیند تنظیم متوقف شود.
ما نمیخواهیم همه این مدلهای چندجملهای را قبول کنیم، زیرا تعداد آنها بسیار زیاد است. برای انتخاب بهترین زیرمجموعه از این مدلها، هر مدل روی مجموعه اعتبارسنجی اجرا میشود و مدلهایی انتخاب میشوند که میانگین مربعات خطای (MSE) آنها کمتر از یک آستانه مشخص باشد. همچنین کمترین مقدار خطای به دست آمده به صورت ثبت میشود.
همان الگوریتم ادامه می یابد و مقادیر را تولید میکند. تا زمانی که هر کمتر از مقدار قبلی باشد، فرآیند ادامه پیدا میکند و مدلها به عمق بیشتری میرسند.به محض اینکه الگوریتم متوقف میشود. لایه آخر (لایه ) کنار گذاشته میشود، زیرا بیش از حد دادههای آموزشی را برازش کرده است، و لایههای قبلی به عنوان خروجی در نظر گرفته میشوند.
شکل 1. توزیع معمولی از حداقل خطاها. این فرآیند زمانی خاتمه می یابد که به حداقل برسد.
به طور فرض بعد از این عملیات، مجموعه ای شامل تا از مدل ها در دسترس باشد اکنون مدلها را مجموعه داده هایی گه باید مطابق ان اموز دیده شوند اجرا میکنیم تا دنبالهای از مشاهدات ایجاد شده را بهدست آوریم: . اکنون می توانیم همان الگوریتم را دوباره اجرا کنیم.
روشهای پیچیدهتری میتوانند برای تعیین زمان توقف استفاده شوند؛ مثلاً، الگوریتم را چند مرحله بیشتر ادامه میدهند تا از افزایش موقت عبور کنند.
به طور کلی
به جای استفاده از چندجملهای درجه دوم در دو متغیر، هر واحد میتواند چندجملهایهایی با درجه بالاتر و متغیرهای بیشتر به کار گیرد:
و به طور کلی تر:
که در آن:
fi: توابع اولیه وابسته به ورودیهای مختلف
ai: ضرایب
m: تعداد اجزای تابع پایه
معیارهای خارجی اهداف بهینه سازی برای مدل هستند، مانند به حداقل رساندن میانگین مربعات خطا در مجموعه اعتبارسنجی، مهمترین معیارها عبارتند از: