پژوهش های انجام شده در مورد استنباط بیزی … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
ملاحظه می شود که میتوان (۳-۱) را با بهره گرفتن از میانگین روی متغیرهای پنهان، از (۳-۴) تعیین کرد. برای داریم:
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
که این، دقیقاً معادله (۳-۳) است. همچنین برای حالت داریم:
که این، دقیقاً معادله (۳-۳) است.
هر چند مدلهای (۳-۱) و (۳-۵) معادلاند اما فرمولبندی با متغیر پنهان منجر به کارایی الگوریتم تولید داده می شود، که در بخش ۳-۳ با جزئیات بیشتر بحث خواهد شد.
مقادیر وابستگی معمول را میتوان در مدلهای با متغیر وابسته پیوسته و آمیخته استفاده کرد. ژنه و نسلهوا (۲۰۰۷) و اسمیت و خالد (۲۰۱۲) نشان دادند در حالتی که حداقل یکی از متغیرهای وابسته، گسسته است، پارامتر وابستگی تابعی از تمام پارامترهای مدل است.
با شرط روی متغیر کمکی ، مقدار -کندال بین و عبارت است از:
به طوریکه تابع توزیع توأم شرطی به شرط است.
اثبات: مرجع
بهطورکلی، انتگرال بالا پیچیده است اما میتوان آن را با کمک انتگرال مونت کارلو تقریب زد. علاوهبراین، همانند حالت متغیرهای وابسته پیوسته، پارامترهای و تمایلی به تناظر یک به یک ندارند. مجازاً، باید مدل با یکی از این دو مدل پارامتری شود، در اینجا مطابق کارهای قبل عمل میکنیم.
۳-۲-۳ مشخصه پیشین
درحالیکه توزیعهای پیشین در مدل رگرسیون نرمال به خوبی قابل درک هستند (بهعنوان مثال، جلمن و همکاران (۲۰۰۴) را ببینید )، باسکورت و ایوانس (۲۰۱۱)، ایوانس و جانگ (۲۰۱۱) و دوکیک و هوگان (۲۰۰۲) نشان دادند که پیشینهای نامعلوم اثر بسیار متفاوتی روی ضرایب مدل رگرسیون لوژستیک دارند. بنابراین، پیشینهای مربوط به برای مدلهای با متغیر وابسته پیوسته و آمیخته متفاوتاند. برای روشن شدن مسئله، در شبیهسازی تنها یک متغیر کمکی به کار بردهایم. و برای مدل با متغیر وابسته پیوسته پیشینهای زیر را در نظر گرفتهایم:
در حالت با متغیر وابسته آمیخته، توزیعهای پیشین را بر حسب مدل لوژستیک کناری انتخاب میکنیم، بنابراین توزیع کناری پیشین تقریباً یکنواخت می شود و
به طوری که انتخاب به دامنه متغیر کمکی بستگی دارد.
برای مشخصه پیشین پارامترهای شامل در اسپلاین مکعبی، ماکسیمم تعداد گرههای مدل که با نشان داده می شود را ثابت در نظر میگیریم. دامنه را از طریق تقسیم مقادیر مشاهده شده متغیر بر فواصل با طول مساوی ، گسترش میدهیم و فرض میکنیم که هر فاصله شامل بیش از یک گره است. برای کامل شدن مشخصه مدل، متغیرهای تصادفی کمکی را تعریف میکنیم، به طوریکه به ازای هر ،
بنابران مدل (۳-۱) به صورت زیر بیان می شود:
ملاحظه میکنید که تعداد حالتهای غیر صفر در مجموع، به مقادیر وابسته است. مدل را با در نظر گرفتن متغیرهای پنهان بسط میدهیم و توزیعهای نمونه گیری آنها را تعریف میکنیم. مشخصاً، فرض میکنیم تعداد گرههای مورد استفاده در مدل باشد آنگاه:
یعنی اینکه، از توزیع پوآسن بریده از راست با پارامتر و مقدار ماکسیمم پیروی می کند. همچنین
شکل دلالت بر این دارد که، با داشتن گرههای مدل، احتمال همه ترکیبات فواصل شامل یک گره، یکسان است. پیشینها برای همه پارامترهای شامل در مدل اسپلاین، برای صرفنظر از نوع متغیر وابسته انتخاب میشوند. بنابراین
بر خلاف فان و همکاران (۲۰۱۰) که را از پیش تعیین شده و ثابت در نظر میگرفتند در اینجا برای یک توزیع پیشین بیان کرده و فرض میکنیم انتخاب، داده رهنمون باشد. مدلهای سلسله مراتبی مشابه برای نشان دادن تصحیح برای چندگانگی از رگرسیون بیزی استفاده می کنند. شبیهسازیها نشان می دهند که مقدار نامناسب به نتایج ضعیف منجر می شود. میتوان ملاحظه کرد که تعداد پارامترها در ازای به طور خطی افزایش مییابد و در اینجا در همه شبیهسازیها از استفاده شده است. بررسی شبیهسازیها نشان میدهد که استفاده از بزرگ نه تنها برازش را بهبود نمیبخشد بلکه به طور معنیداری الگوریتم محاسبات را که برای نمونه گرفتن از توزیع پسین استفاده شده است، را کند می کند.
۳-۳ انتخاب مدل و برآورد
بر اساس الگوی بیزی، استنباط بر پایه توزیع پسین بردار پارامترها که با نمادگذاری می شود، انجام می شود. با وجود پیچیدگی مدلهای با متغیر وابسته پیوسته و آمیخته، از لحاظ تحلیلی ممکن است پیچیده باشد و خواص آن را تنها میتوان از طریق روشهای مونت کارلو بررسی کرد. در ادامه در مورد الگوریتم مونت کارلوی زنجیر مارکوفی برای نمونه گیری از بحث میکنیم.
۳-۳-۱ نمونه گیری مونت کارلوی زنجیر مارکوفی از توزیع پسین
الگوریتم مونت کارلوی زنجیر مارکوفی برای متغیرهای وابسته پیوسته و آمیخته خیلی شبیه است. نمونهبردار زیر را برای متغیر وابسته آمیخته شرح میدهیم.
۳-۳-۱-۱ حالت متغیر وابسته آمیخته
شکل کلی الگوریتم از اصل تولید داده (تنر، ۱۹۹۶) پیروی می کند، بر این اساس که زنجیر مارکوف ارگودیک با مقادیر فضای پارامتر ساخته می شود و توزیع ایستا، است. زنجیر داده افزایی متناوباً با نمونه گیری از توزیعهای شرطی زیر ساخته می شود:
۱- توزیع شرطی متغیر پنهان (یا داده های گمشده)، ، به شرط پارامترهای و داده های مشاهده شده .
۲- توزیع شرطی پارامتر به شرط کامل بودن داده ها، .
از طرفی توزیعهای شرطی مورد نیاز ۱ و ۲ شکل متعارف ندارند. بنابراین برای به روز رسانی هر مؤلفه، از الگوریتم قدم زدن تصادفی متروپولیس یا الگوریتم متروپولیس هستینگس مستقل استفاده میکنیم.
نمادگذاری ، وضعیت زنجیر مارکوف در زمان را بیان می کند، که در آن (، بردار همه گرههای مورد استفاده را نشان میدهد و و تعریفی مشابه دارند) است. در زیر به روز رسانی در زمان مربوط به هر پارامتر و مقدار داده گمشده، توضیح داده شده است:
ها: به ازای هر که از قدم زدن متروپولیس درون گیبز برای نمونه گیری از توزیع شرطی استفاده میکنیم، به طوریکه همه پارامترها به جز را شامل می شود. پیشنهاد در این مورد میباشد. انتخاب مهم است اما هموارسازی آن ممکن است وقتگیر باشد، بنابراین از مونت کارلوی زنجیر مارکوفی استفاده میکنیم، به این صورت که در طی یک دوره اولیه از ۱۰۰۰ تکرار، انحراف استاندارد پیشنهادی ثابت نگه داشته می شود سپس ، به صورت تعیین می شود، به طوریکه واریانس نمونه ای، نمونههای است و برای مقابله با مواقعی که ممکن است صفر شود، تعریف شده است. توجه کنید، ثابت نرمال سازی توزیع شرطی روی احتمال پذیرش مورد نیاز هسته انتقال قدم زدن متروپولیس تأثیری ندارد. بهطورکلی این مطلب در مورد تمام توزیعهای شرطی که در زیر توضیح داده می شود درست است و توضیح میدهد که چرا این الگوریتم حتی وقتی توزیعهای شرطی، ثابتهای نرمال بریده شده دارند، انجام می شود.
ها: شرط لازم برای نامنفی بودن است، چون ترجیح میدهیم که با فضاهای وضعیت نامحدود کار کنیم، بنابراین مدل را در شرایط پارامتری کرده و مونت کارلوی زنجیر مارکوفی را برای اجرا میکنیم. بعد از تکمیل نمونه گیری، نمونههای را به مقیاس تبدیل میکنیم. چون دامنه ، است میتوان از انتقالهای قدم زدن تصادفی متروپولیس درون گیبز، برای نمونه گیری از توزیع شرطی استفاده کرد. برای به روز رسانی از همان روش به روز رسانی ها، استفاده میکنیم.
ها: متغیرهای پنهان ، با بهره گرفتن از متروپولیس هستینگس مستقل درون گیبز به روز رسانی میشوند. بدون ساختار مفصل در مدل، توزیع شرطی لوژستیک بریده شده است (اگر ، بریده شده در؛ و اگر باشد، بریده شده در است) و میتوان با بهره گرفتن از روش تابع توزیع معکوس نمونه گیری کرد. در هر به روز رسانی، لوژستیک بریده شده را به جای توزیع مستقل پیشنهادی به کار میبریم. نرخ پذیرش مشاهده شده بیشتر از ۸۰% است.
ها: هیچ محدودیت دامنهای برای ها که وجود ندارد و هیچ روش نمونه گیری مستقیمی ممکن نیست. بنابراین از قدم زدن تصادفی متروپولیس درون گیبز با الگویی مشابه ها استفاده میکنیم.
ها: دو حالت و را به ازای را جداگانه بررسی میکنیم:
-
- اگر باشد از روش قدم زدن تصادفی درون گیبز برای به روز رسانی ها با به کارگیری الگویی همانند به روز رسانی ها، استفاده میکنیم.
-
- اگر باشد، از به عنوان یک پیشنهاد استفاده و آن را مطابق توزیع پیشینش به جای توزیع پسین شرطی به روز رسانی میکنیم.
ها: به روز رسانیها با بهره گرفتن از روش متروپولیس هستینگس درون گیبز برای بردار کامل متغیر پنهان انجام میشوند. برای به روز رسانی ، دو حالت زیر در نظر گرفته می شود:
-
- حذف یا اضافه کردن یک مؤلفه، یعنی تغییر تصادفی مؤلفه صفر به یک یا برعکس.
-
- تعویض دو مؤلفه، یعنی تعویض تصادفی دو مؤلفه از .
در کاربردها، در هر یک از روشهای بالا حذف/اضافه یا تعویض با احتمال انتخاب می شود.
ها: مشابه به روز رسانی ها در اینجا نیز دو حالت به صورت زیر داریم:
فرم در حال بارگذاری ...
[سه شنبه 1401-04-14] [ 03:24:00 ب.ظ ]
|