سفارش تبلیغ
صبا ویژن

فرایند تصادفی

فرایندهای تصادفی (به انگلیسی: Stochastic processes یا Random processes)‏ جنبه‌های نظری و پایه‌های ریاضی مربوط به فرایندهای تصادفی را در حوزه? ریاضیّات احتمالات مورد مطالعه و تحلیل قرار می‌دهند. به عنوان ساده‌ترین مثال‌ها، می‌شود رکوردهای ثبت‌شده از سیگنال‌های مربوط به پدیده‌هایی همچون زلزله، سیل، امواج دریا، یا تغییرات بازارهای بورس، یا پیام‌های ارسال‌شده در یک شبکه? مخابرات را ذکرکرد.

 

تعریف

مجموعه‌ای از متغیرهای تصادفی با اندیس مرحله یا زمان که وضعیت یک پدیده یا آزمایش تصادفی را در طول یک دوره نمایش می‌دهد. متغیرهای تصادفی و اندیس آنها می‌توان از انواع گسسته و پیوسته و نیز چند بعدی باشند. مثلاً بررسی وضعیت آب و هوا، تعداد افراد و وضعیت یک بازی در مکانها زمانها یا مراحل مختلف. فرایندهای تصادفی یکی از علوم کاربردی وابسته به احتمال و آمار بوده که در سایر علوم و فنون دیگر کاربرد بسیاری دارد.
فرایندهای تصادفی در ابتدا در علم فیزیک و برای توصیف پدیده‌های تصادفی که حالت آنها در طی زمان تغییر می‌کند مطرح شد. در مدلسازی هر سیستم تصادفی که حالت آن در طی زمان (فضا یا سایر پارامترها) تغییر می‌کند، مدل باید قادر به توصیف حالت سیستم در طول زمان باشد. به عبارت دیگر مدل شامل دنباله‌ای از متغیرهای تصادفی است که پدیده تصادفی را توصیف می‏کند.
فرض کنید t متغیر زمان و x(t) متغیر تصادفی متناسب با t باشد. در این صورت یک فرایند تصادفی مجموعه‌ای از متغیرهای تصادفی {x(t):t?T} است که در آن x(t) به ازای هر t?T یک متغیر تصادفی است.
با این توضیح فرایندهای تصادفی مفهوم تعمیم یافته متغیرهای تصادفی است. برای تعریف یک فرایند تصادفی داریم:
T = مجموعه اندیس فرایند (فرایند).
مقادیر x = حالات فرایند.
S = فضای حالات فرایند.

برخی فرایندهای تصادفی معروف

  • فرایند زاد و مرگ
  • فرایند ورشکستگی قمارباز
  • فرایند ارنفست
  • فرایند وینر (حرکت براونی)
  • فرایند پواسن
  • فرایند شکار و شکارچی
  • فرایند تصادفی هندسی

پارادوکس زندانبان

مسئله زندانبان یکی از مسائل ساده ودر عین حال جالب احتمالات است:

زندانبان یک زندان که در آن احمد، رضا و بهرام زندانی اند تنها کسی است که میداند یکی از این سه نفر محکوم به اعدام شده و دو نفر دیگر آزاد می شوند. احمد مصمم است نامه ای به همسر خود نوشته ازاو بخواهد تا در صورت محکومیت او پیغامش را به رضا یا بهرام، هرکدام آزاد شدند برساند ( توجه کنید چون تنها یک نفر محکوم به مرگ است بنابراین از دو نفر دیگریعنی رضا و بهرام بالاخره یکی آزاد می شود) لذا احمد از زندانبان خواهش می کند که به او بگوید از دو نفر دیگر کدامیک آزاد می شوند. زندانبان از دادن پاسخ امتناع کرده به او می گوید دادن پاسخ هم ارز افزایش محکومیت او از 3/1 به 2/1 است. بنابراین مایل نیست موجب ناراحتی بیشتر او شود. این موضوع برای احمد عجیب می آید و به طور شهودی نیز قبول آن برایش مشکل است. ازخود سوال می کند که پاسخ زندانبان اطلاع جدیدی به او نمی دهد، پس چرا این پاسخ باید احتمال محکومیت او را افزایش دهد؟

 

احمد از پیش میداند که یکی از دو نفر آزاد می شوند. بنابراین اطلاع از نام کسی که آزاد میشود نباید احتمال محکومیت او را تغییر دهد.

 

بااستفاده از قضیه بیز به سادگی معلوم می شود که حتی اگر زندانبان نام یکی از آنهایی را که آزاد می شوند به احمد بگوید باز هم احتمال محکوم شدن احمد همان 3/1 است.

 

فرض کنید که C,B,A  به ترتیب پیشامد محکوم شدن احمد، بهرام و رضا و J این پیشامد باشد که زندانبان مثلا بگوید “رضا آزاد می شود” داریم:

 

 

 

A).P(A)  /  P(J|A).P(A) + P(J|B).P(B) + P(J|C).P(C)  ? P(J  J) =? P(A

 

 3/1=3/1*0 + 3/1*1 + 3/1*2 /1   / 3/1*2/1=

 

 

 

به همین ترتیب اگر مثلا K را این پیشامد فرض کنیم که زندانبان مثلا بگوید”بهرام آزاد می شود” آنگاه باز هم به دست می آوریم:     P(A|K)= 1/3

 

در این مسئله ممکن است صرف نظر از جواب رسمی مسئله که با استفاده از قضیه بیز بدست می آید بخواهیم از نقطه نظر شهودی نیز مثلا اشکال گفته زندانبان را دریابیم.

 

 او می گوید با وجود سه نفر احتمال محکومیت هرکدام 3/1 است، اما با فاش شدن نام یکی از آنهایی که آزاد می شوند  احتمال محکومیت هر یک از دو نفر دیگر از 3/1 به 2/1 تغییر می کند.شاید دلیل قاطعی که می تواند موضوع را مشخص کند توجه به تفاوتهای مقادیر  p(J|A) وp(J|B) است که در فرمول بالا ملاحظه شد. بازیکنان بازی بریج این اصل را اصل “مقید” گویند. بنا به اصل بیان مقید از اظهارنظر طرف مقابل هیچگونه اطلاع مفیدی بدست نمی آید.

 

به وضوح احتمال بیان مقید بیش از احتمال بیان آزاد است و اشتباه همه آنهایی که سعی در حل چنین مسائلی دارند این است که  این نکته را در نظر نمی گیرند. در مسئله زندانبان وقتی قرار است بهرام محکوم شود احتمال اینکه زندانبان بگوید ” رضا آزاد می شود” دو برابر بیشتر از وقتی است که قرار است احمد محکوم شود.( قید در بیان زندانبان این است که وقتی قرار است بهرام محکوم شود ناچار است بگوید “رضا” و آزادی بیان زندانبان در این است که وقتی قرار است احمد محکوم شود میتواند بگوید “بهرام” یا “رضا”)

 

در پارادوکس زندانبان و جواب آن زیاد بحث شده است، اما علی رغم تمام این بحث ها و جدلها وقتی این مسئله در یک مجله بازگو شد و نویسنده مقاله( زو وایفل) جواب درست آن را بیان کرد به شدت مورد انتقاد و مواخذه سه ریاضیدان قرار گرفت. در شماره 17 فوریه سال   1991 همان مجله نویسنده مقاله می نویسد: تا این تاریخ نزدیک 2000 نامه در مورد این مطلب دریافت کرده است که 92% کل خوانندگان و 65%  کسانی که تحصیلات دانشگاهی داشته اند، نظری برخلاف نظر او عنوان کرده اند.

 


روش AHP بهتر است یا ‏TOPSIS

روش تصمیم گیری چند معیاره، تکنیک‌های مختلفی دارد که در این میان روش تحلیل سلسله مراتبی (AHP) و تاپسیس(Topsis)  از شهرت و محبوبیت بیشتری نسبت به سایر تکنیک های دیگر برخوردارهستند. علت کاربرد بیشتر این تکنیک ها، سهولت تحلیل، دقت بالا و قابلیت کاربرد در بسیاری از موضوعات است. اما پژوهشگران معمولاً در انتخاب روش مناسب تصمیم گیری چند معیاره دچار تردید می‌شوند و علاقه‌مند هستند جواب سؤالات زیر را بدانند:

 

  •  کدام روش برای پژوهشم مناسب تر است؟
  •  کدام روش دقیق تر است؟
  •  کدام روش به حجم نمونه کمتری نیاز دارد؟
  • و …

 

در ادامه سعی می‌شود به تمامی سؤالات و ابهامات پژوهشگران پاسخ داده شود. روش AHP تکنیکی است که برای حل مسائل تصمیم گیری چند معیاره با ساختار سلسله مراتبی استفاده می‌شود. برای انجام روش AHP لازم است ابتدا معیارها و گزینه‌های خود را به صورت ساختاری سلسله مراتبی مشخص کنید یعنی مشخص کنید برای رتبه‌بندی گزینه‌های خود چه معیارها و زیر معیارهایی را در نظر گرفته اید. سپس پرسشنامه مقایسه زوجی شامل کلیه معیارها، زیر معیارها و گزینه‌ها را طراحی کنید. در پرسشنامه مقایسه زوجی ترکیب دو تایی همه معیارها و گزینه‌ها می بایست در نظر گرفته شود(البته با توجه به ساختار سلسله مراتبی مسئله!) بنابراین اگر تعداد معیارها و گزینه‌ها زیاد باشد باعث می‌شود که تعداد مقایسات زوجی نیز افزایش پیدا کند که این امر باعث طولانی شدن پرسشنامه می‌شود و پاسخ‌دهندگان ممکن است در مقایسات دچار اشتباه شوند و یا اینکه به علت کم حوصلگی مقایسات را با دقت پر نکنند و نرخ ناسازگاری افزایش یابد. بنابراین تعداد معیارها و گزینه‌ها باید به حدی باشد که تعداد مقایسات زوجی داخل پرسشنامه  در حد معقول و منطقی به دست آید. نکته بعدی این است که روش AHP، روشی منطبق بر نظر خبرگان است یعنی اینکه پرسشنامه مقایسه زوجی را باید در اختیار خبرگان و کارشناسانی قرار دهید که بر همه معیارها و گزینه‌های مسئله اشراف و تسلط داشته باشند. در برخی مواقع ممکن است در جامعه اماری مورد نظر بیشتر از 3 یا 5 نفر خبره وجود نداشته باشد که از این بابت نیز هیج مشکلی وجود ندارد و نتایج به دست آمده نیز کاملاً علمی و قابل اکتفا است چون پرسشنامه‌ها را خبرگان تکمیل کرده‌اند و نیاز به داشتن حجم بالای نمونه نیست. بنابراین شرایط مناسب استفاده از روش AHP در زیر ذکر شده است:

 

  • تعداد معیارها، زیر معیارها و گزینه‌ها در حد معقول باشد (زیاد نباشد).
  • موضوع مسئله تخصصی باشد و نیازمند نظر خبرگان باشید.
  • می‌خواهید وزن و رتبه معیارها را به دست آوردید.
  • می‌خواهید وزن و رتبه گزینه‌ها را به دست آورید.
  • در حالت خاص ممکن است مسئله شما معیار نداشته باشد و شما می‌خواهید وزن و رتبه تعدادی گزینه یا سوال را به دست آوردید.

 

روش تاپسیس نیز از محبوبیت زیادی در مسائل تصمیم گیری چند معیاره برخوردار است. برای انجام روش تاپسیس باید هم وزن معیارها وجود داشته باشد و هم داده‌های ماتریس تصمیم گیری را در اختیار داشته باشید. برای به دست آوردن وزن معیارها می‌توان از نظر کارشناسان استفاده کرد و یا از روش AHP وزن معیارها را محاسبه کنیم. داده‌های ماتریس تصمیم گیری اگر واقعی و کمی باشند مثل میزان سود، هزینه، قیمت ، وزن و … داشتن یک ماتریس تصمیم گیری برای تحلیل روش تاپسیس کفایت می‌کند اما اگر معیارها کیفی باشند و نتوانیم مقدار واقعی هر گزینه نسبت به هر معیار را به دست آوریم بهتر است از پرسشنامه تاپسیس استفاده کنیم. در این پرسشنامه میزان امتیاز هر گزینه نسبت به هر معیار به صورت طیف لیکرت یا هر طیف قراردادی دیگری به دست می‌آید با توجه به اینکه داده‌های ماتریس تصمیم گیری قضاوتی هستند بهتر است تعداد بیشتری پرسشنامه تاپسیس در جامعه آماری مورد نظر توزیع کنیم و از ادغام نظرات کلیه پاسخ‌دهندگان ماتریس تصمیم گیری نهایی را استخراج کنیم تا در مورد معیارهای کیفی و قضاوتی به یک اجماع دست پیدا کنیم. تعداد معیارها و گزینه‌ها در روش تاپسیس محدودیتی ندارد و متناسب با مسئله خود می‌توانید تعداد زیادی را اختیار کنید. در روش تاپسیس حتماً باید معیار و گزینه وجود داشته باشد در صورتی که فقط یکی وجود داشته باشد روش تاپسیس قابل انجام نخواهد بود.

بنابراین به طور کلی در روش تاپسیس:

 

  • با تعداد معیارها و گزینه‌های کم یا زیاد قابل انجام است.
  • با داشتن معیارهای های مثبت و منفی قابل انجام است.
  • با داشتن معیارهای کیفی و کمی قابل انجام است.
  • در روش تاپسیس رتبه‌بندی گزینه‌ها به دست می‌آید.
  • در روش تاپسیس وزن معیارها به دست نمی‌آید باید از سایر روش‌ها دیگر به دست آورید.
  • باید معیارها و گزینه‌ها حتماً وجود داشته باشد.
  • پرسشنامه‌های تاپسیس را می‌توان به تعداد زیاد در جامعه آماری توزیع کرد.
  • اگر داده‌های واقعی برای ماتریس تصمیم گیری وجود داشته باشد استفاده از روش تاپسیس خیلی مناسب است.

 


رگرسیون لجستیک (Logistic Regression

 

در مباحث مرتبط با مدلهای رگرسیونی، زمانی که متغیر پاسخ دو حالتی باشد، استفاده از روشهای معمول رگرسیون خطی با مشکلاتی مواجه خواهد بود.

 

ممکن است مقادیر پیش بینی شده، بی معنی بوده، در عمل تفسیر پذیر نباشند.

 

امکان قیاس مقادیر پیش بینی با یکدیگر وجود ندارد.3پذیره های اولیه رگرسیون خطی (مانند همسانی واریانس متغیر پاسخ،  نرمال نبودن مقادیر متغیر پاسخ و مقادیر پیش بینی شده) برقرار نیست.

 

در چنین شرایطی، استفاده از رگرسیون لجستیک (دو حالتی) پیشنهاد می شود.

 

استفاده از رگرسیون لجستیک برای وضعیت هایی که هدف آن براورد مفاهیمی چون «رخ دادن» یا «رخ ندادن» یک اتفاق باشد، یک انتخاب عالی و بی عیب و نقص است. زنده ماندن بیمار در طی درمان، بیمار شدن یک فرد، طی نمودن موفقیت آمیز دوره آموزشی توسط دانش آموز و … همگی مثالهایی از این نوع می باشند که معیار اندازه گیری نتایج آن دو حالتی (Binary) است.

 

استفاده از رگرسیون لجستیک به ویژه زمانی که با پایگاه داده های بسیار بزرگ مواجه هستیم، یا در وضعیت هایی که متغیرهای مستقل از یک قاعده منظم و کلی پیروی نکرده و مفروضات مدلهای عمومی را نقض می کنند، بسیار مفید خواهد بود.

 

 با تمام این انعطاف پذیری، استفاده از آن با یک مشکل اساسی مواجه است:

 

 برای دست یابی به نتایج استوار و پایا (Stable) و معنی دار (Meaningful)، به حجم داده هایی بیش از آنچه در رگرسیون خطی معمولی یا تحلیل تشخیص  (Discriminant Analysis) مواجه هستیم، نیاز است.

 

 معمولاً در رگرسیون خطی معمولی یا تحلیل تشخیص، 20 مشاهده بازای هر متغیر مستقل کفایت می کند، اما در رگرسیون لجستیک حداقل 50 مشاهده بازای هر متغیر مستقل نیاز است.

 

 متغیر پاسخ در یک مدل رگرسیون لجستیک به صورت رسته ای دوحالتی است.درحالیکه درتکنیک های رگرسیون خطی، متغیر پاسخ یک پیوستاربی کران را شامل می شود (متغیر پیوسته در دامنه(-∞,+∞))

 

 تبدیل به پیوستار: از آنجایی که مقادیر احتمال به صورت پیوسته در بازه (0,1) توزیع می شوند، بنا براین، استفاده از احتمال وقوع رخداد پیروزی منتسب به متغیر پاسخ (p=Pr[Y=1]) بجای خود متغیر پاسخ، جایگزین مناسبی برای تأمین شرط پیوستگی است.