نظریه تجدید

نظریه تجدید، شاخه‌ای از نظریه احتمال است که فرایندهای پواسون را به زمان‌های نگهداری اختیاری عمومیت می‌دهد. کاربردهایی شامل محاسبه زمان انتظار برای میمونی که به صورت تصادفی به صفحه کلید ضربه می‌زند تا کلمه مک بت را تایپ کند و به محاسبه مزایای دراز مدت از سیاست‌های تضمینی مختلف بپردازد.

مقدمه

[ویرایش]

فرایند تجدید، تعمیم یافتهٔ فرایند پواسون است. فرایند پواسون ذاتاً یک فرایند پیوسته مارکوف می‌باشد که توزیع مستقل یکسان از زمان‌های نگهداری شده از هر عدد صحیح با توزیع نمایی قبل از رسیدن به عدد صحیح بعدی با احتمال یک است. در رویه غیررسمی ممکن است نظریه تجدید را به همین صورت تعریف کنیم به جز اینکه زمان‌های نگهداری شده از توزیع عمومی تری گرفته شده‌اند. (توجه داشته باشید که مشخصات توزیع‌های مستقل ویکسان(متغیرهای تصادفی مستقل با توزیع یکسان)از زمان‌های نگهداری شده حفظ می‌شوند.)

تعریف ریاضی

[ویرایش]
تحول نمونه‌ای از یک فرآیند تجدید با زمان انتظار Si و زمان پرش Jn.

فرض کنید دنباله‌ای از متغیرهای تصادفی مستقل وتوزیع شده یکسان باشد مثل: فرض می‌کنیم متغیر تصادفی به عنوان امین زمان ثبت شده باشد که برای هر ۰<"n" به صورت زیر تعریف می‌کنیم؛

هرمربوط به امین پرش زمانی است وبازه به عنوان بازهٔ تجدید شناخته می‌شود پس متغیر تصادفی به صورت زیر داده می‌شود. به‌طوری‌که تابع شاخص مطرح است بیان‌کننده تعداد پرش است که در زمان t رخ داده است و به عنوان فرایند تجدید خوانده می‌شود.

شرح و تفسیر

[ویرایش]

ممکن است شخصی فکر کند زمان‌های نگهداری شده به عنوان زمان طی شده قبل از یک خرابی ماشین را در مین بار، در زمان آخرین خرابی باشد. به این فرض توجه کنید که ممکن است ماشین فوراً درست شده باشدوما کلاک را فوراً ریست می‌کنیم). در این تفسیر زمان‌های پرش، زمان‌های موفقیت را ثبت می‌کنند که در کد یک از آن‌ها ماشین خراب شده و فرایند تجدید ، تعداد زمانهایی که تا این جا در زمان داده شده باید تعمیر شده باشد را ثبت می‌کند. اگر چه این مطلب برای فهم فرایند تجدید با وجود شکل مختصر خود، مؤثر است چون ممکن است برای مدل کردن تعداد زیادی از موقعیت‌های عملی وابسته استفاده شود ارتباط خیلی نزدیکی با عملکرد ماشین نداشته باشد.

فرایندهای تجدید-پاداش

[ویرایش]
Sample evolution of a renewal-reward process with holding times Si، jump times Jn and rewards Wi

فرض کنید دنباله‌ای از متغیرهای تصادفی (پاداش)،IID باشد که در رابطه صدق کند. سپس به متغیر تصادفی ، فرایند تجدید-پاداش گفته می‌شود. توجه کنید که بر خلاف ، هر ممکن است مقدار منفی را همانند مقادیر مثبت بگیرد. متغیر تصادفی ، به دو دنباله وابسته است: زمان‌های نگهداری شده وپاداشهای، نیازی نیست که این دو دنباله مستقل از هم باشند. اصولاً تابعی ازاست.

تفسیر

[ویرایش]

در فهم تفسیر بالا از زمان‌های نگهداری شده، به عنوان زمان بین خرابی‌های متوالی یک ماشین، پاداش های (که در این مورد به عنوان منفی بودن اتفاق افتاده است) به عنوان هزینه تعمیر متوالی و به عنوان نتایج خرابی‌های متوالی می‌باشد، بیان می‌شود. یک مقایسه جایگزین این است که، یک غاز جادویی داشته باشیم که بر روی تخم‌ها در بازه‌های توزیع شده مثل (زمان‌های نگهداری شده) می‌خوابد، بعضی وقت‌ها بر روی تخم‌های طلایی با وزنهای تصادفی می‌خوابد و گاهی اوقات بر روی تخمهای سمی می‌خوابد (باوزن‌های تصادفی) که نیازمند درد معرض دید بودن (هزینه بربودن) می‌باشد. پاداشهای ، سودها یا ضررهای مالی ناشی از تخمهای متوالی می‌باشد و ، مجموع مالی از پاداش‌ها در زمان را ثبت می‌کند.

مشخصات فرایندهای تجدید و فرایندهای پاداش–تجدید

[ویرایش]

تابع تجدید را به این صورت تعریف می‌کنیم؛

قضیه اولیه تجدید

[ویرایش]

تابع تجدید در رابطه زیر صدق می‌کند:

برهان

[ویرایش]

در زیر شما متوجه می‌شوید که قانون قوی تعداد زیاد برای فرایندهای تجدید به ما می‌گویند که برای اثبات قضیه اولیه تجدید، سخت است که نشان دهیم به یک شکل قابل انتگرال‌گیری هستند. برای انجام این، تعدادی از فرایندهای کوتاه شدهٔ تجدید را در نظر بگیرید که زمان‌های نگهداری شده بوسیله تعریف می‌شود که نقطه‌ای است که که برای هر فرایند تجدید تا معین، وجود دارد یک حد بالایی روی است و تجدیدهای آن فقط در شبکه اتفاق می‌افتد. علاوه بر این، تعداد تجدیدها در هر زمان تصاعد هندسی با پارامتر است، بنابراین داریم:

قضیه پایه‌ای تجدید برای فرایندهای تجدید-پاداش

[ویرایش]

تابع پاداش را به صورت زیر تعریف کرده‌ایم: تابع تجدید در رابطه زیر صدق می‌کند:

معادله تجدید

[ویرایش]

تابع تجدید در رابطه زیر صدق می‌کند: به‌طوری‌که تابع توزیع عمومی است و تابع چگالی احتمال متناظر است.

برهان معادله تجدید

[ویرایش]

ممکن است مجدداً انتظار اولین زمان نگهداری شده را بازگو کنیم: ولی به وسیلهٔ مشخصه مارکوف داریم: بنابراین

مشخصه‌های مجانبی

[ویرایش]

مشخصه‌های مجانبی و در رابطه زیر صدق می‌کند: (قانون قوی تعداد فراوان برای فرایندهای تجدید) (قانون قوی تعداد فراوان برای فرایندهای تجدید)

برهان

[ویرایش]

ابتدا در نظر بگیرید ، با تعریفی که ما داریم: برای همه داریم و همچنین چون ، داریم:

بررسی قیاس ضد و نقیض

[ویرایش]

ویژگی عجیب فرایندهای تجدید این است که ما در بعضی از زمان‌های از قبل مشخص شده t صبر می‌کنیم و سپس مشاهده می‌کنیم که بازه تجدید شامل t چه اندازه است، ما باید انتظار داشته باشیم که بزرگتر از سایز بازه میانگین باشد. قیاس ضد و نقیض به صورت ریاضی این‌گونه بیان می‌شود: برای هر t>0، بازه تجدید شامل t، به صورت اتفاقی بزرگتر از بازه تجدید اولیه است؛ که برای همه x>0 و همه t>0: که FS تابع توزیع عمومی IID از زمان‌های نگهداری شده Si است.

اصل برهم نهی

[ویرایش]

روی هم قرار دادن فرایندهای تجدید مستقل، عموماً یک فرایند تجدید نیست، تابع توزیع عمومی از رخدادهای داخلی زمان در فرایند برهم نهی به وسیله فرمول زیر داده می‌شود: به‌طوری کهR وCDF رخدادهای داخلی زمان هستند و نرخ ورودی فرایندها Kاست.

منابع

[ویرایش]

Cox, David (1970). Renewal Theory. London: Methuen & Co. p. 142. ISBN 0-412-20570-X.