روش کرزانوفسکی
این روش تشابهات بین داده های انتخابی و داده های اصلی را بررسی می کند. ابتدا کل داده های هواشناسی که به طریقی در اقلیم منطقه تاثیر بسزایی دارند و در همه ایستگاهها ثبت شده بوده اند، شامل ۱۸۸ متغیر اقلیمی که با P نمایش داده شد و چهار سری داده انتخابی ۱) داده های که توسط سایر افراد انتخاب شده بودند شامل ۱۰۲ متغیر اقلیمی که با z1 نمایش داده شد ۲) ۱۰۶ متغیر اقلیمی که بر اساس پوشش گیاهی منطقه انتخاب شده بودند که با z2 نمایش داده شد. ۳) متغیرهای که با بهره گرفتن از روش گام به گام بدست آمده شامل ۹۶ متغیر اقلیمی که با z3 نمایش داده شد ۴) متغیرهای با بیشترین همبستگی با هم شامل ۱۱۲ متغیر اقلیمی که با z4 نمایش داده شد. این متغیرها مهمترین متغیرهای هستند که بیشترین تاثیر را بر روی اقلیم منطقه و همچنین بیشترین ارتباط را با هدف تحقیق دارند که تعداد متغیر آنها، با q نمایش داده شد. این پارامترها با بهره گرفتن از آنالیز تجزیه به مولفه های اصلی[۴۹] به ۵ فاکتور یا مولفه اصلی کاهش یافت که با k نمایش داده شدند. تعداد مولفه اصلی در ۶۲۲ نقطه که با n نمایش داده شدند، ۹۰ درصد واریانس داده ها را به خود اختصاص می دهند و در واقع مهمترین مولفهها به شمار میروند [۱۸،۷۲،۹۶]. چرخه انتخاب متغیرها با روش پروکراستس در زیر نمایش داده شده است. برای محاسبه M2 دوشرط q≤p و ≤ q k باید برقرار باشد.
انتخاب
X(n×p) X(n×q)
PCA PCA
Y(n×k) Z(n×k)
پروکراستس
ضریب پروکراستس از رابطه (۳-۴) محاسبه شد:
رابطه ۳-۴ M2=Trace{YY´+ZZ´-۲ZQ´Y´}
Q از رابطه (۳-۵) محاسبه می شود:
رابطه۳-۵ Q=VU´
با تجزیه مقدار منفرد[۵۰] ماتریس Z´Y به ابعاد k×k مقدار U و V محاسبه شد و مقدار Q بدست آمد. همچنین با مربعی نمودن ماتریسهای Y و Z و قرار دادن آن در رابطه ۳-۴ مقدار M2 محاسبه گردید. هر کدام از سری داده های انتخابی که دارای کمترین ضریب M2 باشد یعنی بیشترین شباهت را با داده های کل دارد و به عنوان مناسبترین سری پارامتر انتخاب می شود. تعریف فاکتورهای لازم برای بدست آوردن مقدار M2 و تجزیه مقدار منفرد در جدول (۳-۱۴) آورده شده است. برای محاسبه ترانهاده ماتریسها، تجزیه مقادیر منفرد و مقدار M2 برای هر کدام از ماتریسهای Z1, Z2, Z3, Z4 از نرم افزار Matlab 2012 استفاده شد.
جدول (۳-۱۴): فاکتورهای مورد نیاز برای بدست آوردن مقدار M2
فاکتور | توضیحات | فاکتور | توضیحات |
X(n×p) | ماتریس تمامی متغیرها | Z | ماتریس تجزبه به مولفههای متغیرهای انتخاب شده (آرایش تقریبی[۵۱]) |
X(n×q) | ماتریس متغیرهای انتخابی | Y´ | ترانهاده ماتریس Y |
p | تعداد کل متغیرها | Z´ | ترانهاده ماتریس Z |
q | تعداد متغیرهای انتخابی | U | ماتریس m در n روی میدان K |
n | تعداد نقاط دارای داده | ∑ | ماتریس قطری m در n با درایههای نامنفی حقیقی بر روی قطر |
Y | ماتریس تجزبه به مولفههای کل متغیرها (آرایش واقعی[۵۲]) |