سفارش تبلیغ
صبا ویژن

رگرسیون لجستیک (Logistic Regression

 

در مباحث مرتبط با مدلهای رگرسیونی، زمانی که متغیر پاسخ دو حالتی باشد، استفاده از روشهای معمول رگرسیون خطی با مشکلاتی مواجه خواهد بود.

 

ممکن است مقادیر پیش بینی شده، بی معنی بوده، در عمل تفسیر پذیر نباشند.

 

امکان قیاس مقادیر پیش بینی با یکدیگر وجود ندارد.3پذیره های اولیه رگرسیون خطی (مانند همسانی واریانس متغیر پاسخ،  نرمال نبودن مقادیر متغیر پاسخ و مقادیر پیش بینی شده) برقرار نیست.

 

در چنین شرایطی، استفاده از رگرسیون لجستیک (دو حالتی) پیشنهاد می شود.

 

استفاده از رگرسیون لجستیک برای وضعیت هایی که هدف آن براورد مفاهیمی چون «رخ دادن» یا «رخ ندادن» یک اتفاق باشد، یک انتخاب عالی و بی عیب و نقص است. زنده ماندن بیمار در طی درمان، بیمار شدن یک فرد، طی نمودن موفقیت آمیز دوره آموزشی توسط دانش آموز و … همگی مثالهایی از این نوع می باشند که معیار اندازه گیری نتایج آن دو حالتی (Binary) است.

 

استفاده از رگرسیون لجستیک به ویژه زمانی که با پایگاه داده های بسیار بزرگ مواجه هستیم، یا در وضعیت هایی که متغیرهای مستقل از یک قاعده منظم و کلی پیروی نکرده و مفروضات مدلهای عمومی را نقض می کنند، بسیار مفید خواهد بود.

 

 با تمام این انعطاف پذیری، استفاده از آن با یک مشکل اساسی مواجه است:

 

 برای دست یابی به نتایج استوار و پایا (Stable) و معنی دار (Meaningful)، به حجم داده هایی بیش از آنچه در رگرسیون خطی معمولی یا تحلیل تشخیص  (Discriminant Analysis) مواجه هستیم، نیاز است.

 

 معمولاً در رگرسیون خطی معمولی یا تحلیل تشخیص، 20 مشاهده بازای هر متغیر مستقل کفایت می کند، اما در رگرسیون لجستیک حداقل 50 مشاهده بازای هر متغیر مستقل نیاز است.

 

 متغیر پاسخ در یک مدل رگرسیون لجستیک به صورت رسته ای دوحالتی است.درحالیکه درتکنیک های رگرسیون خطی، متغیر پاسخ یک پیوستاربی کران را شامل می شود (متغیر پیوسته در دامنه(-∞,+∞))

 

 تبدیل به پیوستار: از آنجایی که مقادیر احتمال به صورت پیوسته در بازه (0,1) توزیع می شوند، بنا براین، استفاده از احتمال وقوع رخداد پیروزی منتسب به متغیر پاسخ (p=Pr[Y=1]) بجای خود متغیر پاسخ، جایگزین مناسبی برای تأمین شرط پیوستگی است.