برآوردیابی پارامترهای یک مدل خطی برای داده های سانسورشده |
فصل دوم : دادهای سانسور شده از راست و مدل های رگرسیونی
1.2 مقدمه و تاریخچه……………………………………………………………………………………………………………………………………… 21
2.2 برآوردگر Susarla _Van Ryzin_ Koul……………………………………………………………………………………….. 22
1.2.2 مزایایی و معایب برآوردگر KSV……………………………………………………………………………………………………… 24
3.2 اصلاحات و تعمیم های برآوردگر KSV…………………………………………………………………………………………………. 25
1.3.2 تبدیل های دیگر………………………………………………………………………………………………………………………………… 25
2.3.2 اصلاحات برآوردگر KSV…………………………………………………………………………………………………………………. 26
1.2.3.2 طبقه بندی…………………………………………………………………………………………………………………………………… 26
2.2.3.2 برآورد M……………………………………………………………………………………………………………………………………… 27
4.2 تحلیل باقیمانده……………………………………………………………………………………………………………………………………….. 29
5.2 مثال………………………………………………………………………………………………………………………………………………………….. 30
فصل سوم : برآورد مدل مدل های خطی خطا با داده های سانسور شده
1.3 مقدمه……………………………………………………………………………………………………………………………………………………….. 37
2.3 . مدل رگرسیون خطی با دادههای سانسور شده با وجود خطا در متغیرهای مستقل…………………………… 40
1.2.3 اصلاح روش حداقل مربعات……………………………………………………………………………………………………………….. 41
2.2.3 روش درستنمایی تجربی وساخت فاصله اطمینان…………………………………………………………………………….. 45
4.3 اثبات قضایا……………………………………………………………………………………………………………………………………………….. 50
فصل چهارم :مطالعات شبیه سازی
1.4 حالت یک بعدی………………………………………………………………………………………………………………………………………….. 6
پیوست
برآوردگر کاپلان مایر با وجود دادههای سانسور شده……………………………………………………………………………………… 66
نسبت لگاریتم درستنمایی تجربی…………………………………………………………………………………………………………………… 67
معرفی نمادهای و ……………………………………………………………………………………………………………….. 70
واژه نامه
واژه نامه انگلیسی-فارسی………………………………………………………………………………………………………………………………… 72
وژه نامه فارسی-انگلیسی…………………………………………………………………………………………………………………………………. 77
مراجع…………………………………………………………………………………………………………………………………………………………………. 82
فهرست جداول
عنوان صفحه
جدول شماره 2.1: مجموع مربعات باقیمانده……………………………………………………………………………………………………. 31
جدول شماره 2.2: مجموع مربعات باقیمانده…………………………………………………………………………………………………… 34
جدول شماره 3.2: ضرائب برآورد شده (برای مدل کامل)………………………………………………………………………………. 35
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش NA برای ……………………………. 62
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش AEL برای …………………………. 63
یک مطلب دیگر :
فهرست شکلها
عنوان صفحه
شکل شماره 1.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش درجه دوم………………………. 20
شکل شماره 2.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش خطی…………………………….. 21
فصل اول:
مقدمات
در این فصل تعاریف و مقدمات اولیه برای مدلهای خطی، مدلهای خطی با خطای اندازهگیری، برآوردگرهای استوار بهویژه برآورد M، آنالیز بقا، برآوردگر کاپلان مایر، دادههای سانسورشده و انواع سانسور ارائه میشود.
1-1- مدل خطی
یکی از کاربردیترین روشها برای تحلیل دادهها در بین ابزارهای آماری، تحلیل رگرسیونی است. تحلیل رگرسیونی،روشی کارآمد برای بررسی و مدلسازی ارتباط بین متغیرها است که از این مدل های رگرسیونی در توصیف دادهها، برآورد پارامترهای مجهول، پیشگویی و کنترل استفاده می شود.
در بیشتر موارد، پاسخ یک آزمایش به چندین متغیر مستقل مثلا k متغیر مستقل، وابسته است. در این صورت یک مدل خطی رابطهای به صورت زیر را در نظر میگیرد:
که n اندازه نمونه میباشد. متغیرهای را متغیرهای توضیحی و متغیر تصادفی قابل مشاهده y را متغیر پاسخ مینامند.
متغیر تصادفی غیرقابل مشاهده متغیر خطا تلقی میشود، بدین معنی که به عنوان متغیری تصادفی، انداره ناتوانی مدل در برازش دقیق دادهها را اندازهگیری میکند. این خطا ممکن است به دلیل عدم حضور برخی از متغیرهای مؤثر، خطاهای تصافی مربوط به مشاهدات و اندازهگیریها و غیره صورت پذیرد.
همچنین فرض میشود که خطاها دارای توزیع نرمال با میانگین صفر و واریانس نامعلوم و ناهمبسته باشند.
پارامترهای و مجهول هستند و باید با استفاده از دادهها برآورد شوند. فرض میشوددادهها عبارتند از که در آن پاسخ متناظر با k سطح از متغیرهای مستقل است. یعنی بنابر معادله (1.1.1) میتوان نوشت:
آنگاه هدف ما به دست آوردن برآوردهای برای به ترتیب به نامهای و در نتیجه به دست آوردن رابطه زیر است.
که در آن نشان دهنده مقدار برآورد شده y به ازای مقادیر است. در این صورت معادله (3.1.1) به عنوان معادله پیش بینی کننده میتواند مورد استفاده قرار گیرد.
معمولترین روش در برآورد پارامترهای یک مدل خطی، استفاده از روش “کمترین مربعات معمول (OLS)” است که روشی بسیار سودمند و کارا است.
پایه و اساس روش کمترین مربعات به Gaussو Legendreباز میگردد. این روش (و تعمیمهای آن ) به دلیل راحتی محاسبات و جوابهای بسته مبتنی برآن مورد توجه بسیاری از آماردانان است.
برآوردهای را به گونهای برمیگزینیم که مجموع توان دوم انحرافها را کمینه کند، یعنی آنها را به گونهای به دست میآوریم که در معادله زیر هنگامی که به ترتیب جایگزین میشوند، کمترین مقدار ممکن را تولید کنند.
برآوردهای با مشتق گرفتن از معادله (4.1.1) نسبت به و مساوی صفر قرار دادن آنها به دست میآیند. ملاحظه میشود که برای حل این معادله های نرمال بهتر است که از روش ماتریسی استفاده شود. می توان رابطه (1.1.1) را به فرم ماتریسی زیرر در نظر گرفت.
بطوریکه .
فرم ماتریسی را میتوان بصورت زیر نوشت.
این مدل را یک مدل خطی گویند، زیرا نسبت به پارامترهای مدل، خطی است.
در این مدل خطی Yیک ماتریس ، X یک ماتریس ، یک ماتریس و یک ماتریس هستند.
آنگاه میتوان معادلههای نرمال را به صورت زیر نوشت:
زیرا
چون یک ماتریس است در نتیجه با ترانهاده خود برابر است پس:
فرم در حال بارگذاری ...
[پنجشنبه 1399-08-08] [ 07:21:00 ق.ظ ]
|