بررسی انواع توزیع داده در MATLAB

۱۵ فروردین ۱۳۹۷


Distributions of data in MATLAB

داده ها برحسب ویژگیهای خود دارای توزیع های ممکن ازجمله توزیع یکنواخت، توزیع نرمال، توزیع لگاریتمی نرمال، توزیع نمایی، توزیع پواسون و توزیع دوجمله ای هستند. در این شماره به توضیح روشهای مختلف جهت بررسی نوع توزیع داده در MATLAB خواهیم پرداخت.

توزیع نرمال:

به منظور بررسی نرمال بودن داده ها در MATLAB میتوان از دستور normplot استفاده کرد. جهت روشنشدن نحوه استفاده از این دستور به مثال ذکرشده در شکل۱، توجه کنید. در این شکل ابتدا از normrand یک ماتریس از اعداد تصادفی با توزیع نرمال تولید میشود که دو پارمتر اول مربوط به تعداد سطر و ستون ماتریس است و اعداد سوم و چهارم نیز میانگین و انحراف معیار اعداد را نشان میدهد.

سپس با استفاده از دستور normplot به بررسی نرمال بودن توزیع داده ها پرداخته شده است که همانطور که در تصویر شکل ۱ مشخص است روند داده ها حول خط رگرسیون پرازش شده است.

شکل۱) نحوه مشاهده نرمال بودن داده ها


نمودارهای pdf و cdf :


از نمودارهای تابع چگالی احتمال (Probability Density Function-PDF) و تابع توزیع تجمعی (Cumulative Distribution Function -CDF) نیز جهت مشاهده روند توزیع داده ها استفاده میشود..

جهت رسم تابع چگالی احتمال میتوان از دستور hist که به نوعی فراوانی داده ها را رسم میکند استفاده کرد. دستور مشاهده تابع توزیع تجمعی در MATLAB نیز cdfplot است. در شکل۲ ابتدا با دستور randn یک آرایه تصادفی نرمال با ده هزار نمونه ایجاد شده است که با دستور hist فراوانی داده ها رسم شده است.

همانطور که در تصویر ظاهرشده مشخص است داده ها دارای توزیع نرمال بوده و حول میانگین نزدیک به صفر تقارن دارند. نمودار cdf داده ها که در شکل۳ نشان داده شده است نیز روند اکیداً صعودی داشته که این نیز مؤید نرمال بودن داده ها است.

شکل۲) نمودار تابع چگالی احتمال داده ها با توزیع نرمال
شکل۳) نمودار تابع توزیع تجمعی داده ها با توزیع نرمال

جعبه ابزار Disttool:


از این جعبه ابزار نیز میتوان برای نمایش pdf و cdf دادهها با هر توزیع دلخواه در MATLAB  استفاده کرد. کافی است ابتدا دستور disttool را در محیط پنجره دستورات تایپ کرده تا صفحه ای به صورت شکل ۴  ظاهر شود. در این شکل از قسمت Distribution نوع توزیع داده را مشخص و سپس از قسمت Function type نوع تابع (PDF یا CDF) انتخاب شده و سپس تصویر تابع مورد نظر ظاهر میشود.

در شکل ۴، نوع توزیع داده نرمال و نوع تابع CDF تنظیم شده است. شکل ۵ نیز تصویر تابع چگالی احتمال توزیع نرمال را نشان میدهد که روند تقارن منحنی قبلاً توسط تابع hist معرفی شده بود.  در این شکل میزان انحراف معیار داده ها که با sigma (سیگما) مشخص شده است مقدار ۱ است که هر چقدر میزان سیگما کاهش یابد شکل توزیع تیزتر و هر چقدر افزایش یابد شکل توزیع پهنتر خواهد بود.

شکل۴) محیط گرافیکی جهت تعیین نوع توزیع داده
شکل۵) منحنی تابع چگالی احتمال برای داده هایی با توزیع نرمال


شکل ۶ تابع چگالی احتمال توزیع نرمال برای سیگما برابر ۴ (تصویر سمت چپ) و ۵/۰ (تصویر سمت راست) را نشان میدهد.

شکل۶) نمودار تابع چگالی احتمال برای سیگما ۴ و ۵/۰

در صورتی که بخواهید نمودار pdf و cdf توزیع های مختلف را مشاهده کنید کافی است در قسمت نوع Distribution توزیع مورد نظر خود را انتخاب تا نمودارهای تابع چگالی احتمال و تابع توزیع تجمعی آنها رسم شود. شکل ۷ توزیع های مختلف این جعبه ابزار را نشان میدهد.

شکل۷) مشاهده انواع توزیع در جعبه ابزار Disttool

توزیع یکنواخت:


با استفاده از دستور rand میتوان اعداد تصادفی یکنواخت بین صفر تا یک ایجاد کرد. برای مشاهده یکنواختبودن داده ها میتوان نمودار هیستوگرام آن را رسم کرد. شکل ۸ نحوه توزیع یکنواخت داده ها را نشان میدهد. همچنین برای تست نحوه توزیع یکنواخت داده ها میتوانید از جعبه ابزار disttool نیز استفاده کنید تا روند یکنواخت داده ها را بهتر درک کنید.

شکل۸) توزیع یکنواخت داده

توزیع نمایی:


جهت مشاهده توزیع نمایی میتوانید از دستور exppdf استفاده کنید. شکل ۹ روند توزیع نمایی را نشان میدهد. در این شکل یک آرایه بین صفر تا ۱۰ تعریف شد و سپس با دستور exppdf خروجی با روند نمایی تولید و سپس شکل آن ترسیم شد. درصورت استفاده از دستور hist نیز میتوانستید روند نمایی توزیع را مشاهده کنید.

شکل ۹ روند توزیع نمایی



۰
برچسب ها :
نویسنده مطلب hossein
کارشناس مهندسی پزشکی - توسعه دهنده سیستم های پردازش تصویر

بدون دیدگاه

رسانه های همکار