منظور از نمونهبرداری گیبز یا نمونهبردار گیبز (به انگلیسی: Gibbs sampling) در مطالعات آماری، الگوریتمی است که بر مبنای تئوری زنجیره مارکوف مونت کارلو طراحی شدهاست. کاربرد این الگوریتم در تولید دنبالهای از مشاهدات از یک تابع توزیع احتمالاتی چند متغیره است که تولید نمونه از آن به صورت مستقیم دشوار است. این دنباله را میتوان برای تخمین توزیع همزمان (مثلاً برای تولید هیستوگرام توزیع)، تخمین توزیع حاشیه ای بر روی یک یا زیر مجموعهای از متغیرهای توزیع (مانند پارامتر پنهان یا متغیرهای پنهان)، یا برای محاسبه یک انتگرال (مانند امید ریاضی متغیرها) استفاده نمود. اغلب برخی از متغیرها وابسته به مشاهدات هستند که مقدار آنها مشخص است و بنابراین نیازی به نمونهبرداری برای آنها نیست.
نمونهبرداری گیبز معمولاً به عنوان ابزاری برای استنتاج آماری و به ویژه در استنتاج بیزی استفاده میشود. این روش یک الگوریتم تصادفی (از آن جهت که با استفاده از اعداد تصادفی نمونه تولید میکند) که میتواند جایگزینی برای الگوریتمهای قطعی در استنتاج آماری مانند الگوریتم بیشینه انتظار (ای ام) باشد.
نمونهبرداری گیبز مانند دیگر الگوریتمهای زنجیره مارکوف مونت کارلو، زنجیره مارکوفی از نمونهها تولید میشود بطوریکه هر نمونه وابسته به نمونههای نزدیک است؛ بنابراین اگر نمونههای مستقل مورد نظر است، باید نمونهبرداری محتاطانه انجام پذیرد، این کار اغلب با نازکسازی زنجیرهٔ نمونههای حاصل شده انجام میشود بدین شکل که تنها مقدار n-ام زنجیره مثلاً ۱۰۰-ام انتخاب میشود. علاوه بر این نمونههای ابتدای زنجیره (تکرارهای سوخته) احتمالاً نمایانگر خوبی برای توزیع مورد نظر نخواهند بود.
نمونهبرداری گیبز به افتخار نام فیزیکدان Josiah ویلارد گیبس, نامگذاری شدهاست و اشاره به یک مقایسه بین الگوریتم نمونه برداری و فیزیک آماری دارد. الگوریتم شرح داده شده، توسط برادران استوارت و دونالد Geman در سال 1984، یعنی هشت دهه پس از مرگ گیبس تشریح شد.[۱]
نمونهبرداری گیبس در تجسم اولیه، یک حالت خاص از این الگوریتم متروپلیسهستینگز است. نکتهای که در نمونهبرداری گیبس وجود دارد این است که برای یک توزیع چند متغیره، نمونهبرداری از توزیع شرطی سادهتر است از محاسبه توزیع حاشیه ای، که با انتگرالگیری بر روی توزیع توام بهدست میآید. فرض کنید ما می خواهیم نمونه از از یک توزیع توام بهدست بیاوریم. نمونه -ام را بهصورت روند الگوریتم به شرح زیر است:
با مقدار اولیهای مانند شروع میکنیم.
نمونه بعدی را باید تولید نماییم. آن را می نامیم. یک بردار است، مقدار هر اندیس از این بردار از توزیع آن اندیس مشروط بر باقی اندیسهایی که تاکنون نمونهبرداری شده اند، نمونهبرداری میشود. اما یک دست آورد این است که: ما اندیس های را تا و پس از آن اندیس های را با شروع از تا مشروط کردیم. برای دستیابی به این هدف نمونهبرداری اندیسها به ترتیب با شروع از اولین اندیس انجام شد. به بیان ریاضیاتی دقیق تر برای نمونهبرداری از , آن را بر اساس توزیعی که به صورت بیان میشود، به روز رسانی کرده ایم.
دقت کنید که از مقدار اندیس -ام در نمونه -ام استفاده کرده ایم نه نمونه-ام.
Bishop, Christopher M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN0-387-31073-8{{citation}}: More than one of |ISBN= و |isbn= specified (help)نگهداری CS1: پیشفرض تکرار ref (link)