(۱۶)
با توجه به توزیع احتمال بیان شده در قالب فرمول فوق، احتمال انتخاب هر یک از آیتمهایی که توسط u به آنها امتیاز داده شده است بستگی به تشابه آنها با آیتم هدف i دارد و عددی در بازه ]۱,۰[ خواهد بود که مجموع تمامی آنها ۱ خواهد بود. در فرمول فوق یک متغیر تصادفی در بازه ]۱,۰[ است که بر اساس مقدار آن و متناسب با احتمال انتخاب هر یک از آیتمهای مجموعه یکی از آیتمها برگزیده خواهد شد.
نکته مهم: در روند اجرای الگوریتم لزوما آیتمی از مجموعه که دارای بیشترین تشابه با آیتم i باشد انتخاب نخواهد شد و کاملا به صورت تصادفی گزینش انجام می شود.
۴-۲-۵- تشابه آیتم ها
در این مدل برای محاسبه تشابه آیتم ها با یکدیگر از فرمول پیرسون استفاده شده است که با توجه به علائم و نشانه های بکار رفته در مدل TrustWalker یک بار دیگر فرمول پیرسون در قالب فرمول زیر تعریف میگردد .
(۱۷)
مقادیر محاسبه شده از فرمول فوق در بازه ]۱+,۱-[ است. مقادیر منفی نشان دهنده این مطلب است که امتیازات تخصیصی به آیتم های i و j در تضاد با یکدیگر میباشد لذا در مدل TrustWalker این آیتمها سودمند نیستند و تنها آیتمهایی که دارای مقادیر مثبت باشند در نظر گرفته می شود.
در فرمول فوق مجموعه تمام کاربرانی می باشد که به صورت مشترک به دو آیتم i و j امتیاز داده اند و میانگین امتیازات کاربر u به آیتمهای مختلف می باشد. اندازه مجموعه نیز از اهمیت برخوردار است، به عنوان مثال در صورتیکه corr(i,j)=corr(i,m) اما اندازه مجموعه کاربرانی که به صورت مشترک به i و j امتیاز داده اند از اندازه مجموعه کاربرانی که به صورت مشترک به i و m امتیاز دادهاند بزرگتر باشد در این صورت ارتباط correlation میان آیتم i و j قویتر خواهد بود که نتیجه، تشابه بیشتر میان i و j به نسبت تشابه میان i و m خواهد بود. با توجه به مطالب فوق تشابه میان دو آیتم i و j در قالب فرمول زیر تعریف شده است.
(۱۸)
در فرمول فوق از تابع سیگموید جهت کنترل عدم توجه بیش از حد، به اندازه مجموعه و نگه داشتن مقدار تابع تشابه در محدوده ]۱,۰[ استفاده شده است. در صورتیکه اندازه مجموعه به اندازه کافی بزرگ باشد در اینصورت مقدار تابع سیگموید به ۱ همگرا خواهد شد اما برای مجموعه کوچک، مقدار تابع سیگموید ۰٫۶ خواهد بود . مقدار عدد ۲ در مخرج کسر توان e نیز به این جهت است که در صورتیکه اندازه مجموعه بزرگتر از ۵ باشد مقدار بازگشتی تابع سیگموید عددی بزرگتر از ۰٫۹گردد.
۴-۲-۶- محاسبه احتمال ماندن در یک گره شبکه اعتماد ()
در هر کاربر u از شبکه اعتماد به احتمال ، این امکان وجود دارد که پیمایش تصادفی متوقف گردد و یکی از آیتمهایی که توسط کاربر u به آنها امتیاز داده شده است و دارای تشابه با آیتم هدف i باشد در مرحله k از یک پیمایش تصادفی انتخاب گردد. این احتمال باید دارای رابطهای با تشابه آیتمهایی که توسط u به آنها امتیاز داده شده است و آیتم هدف i باشد. با توجه به این مطلب که مقدار تشابه دو آیتم مقداری اعشاری در محدوده ]۱,۰[ میباشد لذا می توان آنرا به عنوان احتمال نیز در نظر گرفت. در مدل TrustWalker حداکثر مقدار تشابه آیتمهایی که توسط u دارای امتیاز هستند با آیتم هدف i، به عنوان احتمال توقف در گره کاربر u در نظر گرفته شده است و علاوه بر آن با توجه به این نکته که هرچه در عمق شبکه اعتماد حرکت شود امتیازات و نظرات کاربران از صحت و اعتماد کمتری برخوردار خواهد بود بنابراین هرچه که در عمق شبکه حرکت شود احتمال ادامه پیمایش باید کاهش یابد و در نتیجه مقدار احتمال افزایش پیدا کند. برای لحاظ نمودن فاکتور عمق k باید از تابعی کمک گرفته شود که برای مقادیر بالای k خروجی ۱ را بازگشت دهد و برای مقادیر کوچک k مقدار اندکی را به عنوان خروجی بازگرداند که تابع سیگموید به خوبی می تواند این نیاز را برطرف نماید. با توجه به مطالب فوق تابع احتمال توقف در مرحله k از پیمایش تصادفی در کاربر u به جستجوی امتیاز آیتم هدف i به صورت زیر تعریف شده است.
(۱۹)
۴-۲-۷- چگونگی انجام پیش بینی امتیاز
در مدل TrustWalker در هر پیمایش تصادفی این احتمال وجود دارد که امتیاز تخصیصی توسط کاربران به آیتم هدف i و یا آیتمی شبیه آن به عنوان جواب بازگردانده شود بنابراین پیش بینی و تخمین امتیاز کاربر مبدا u به آیتم هدف i از تجمیع امتیازات حاصل از اجرای پیمایشهای تصادفی مختلف خواهد بود. این مطلب را می توان در قالب فرمول زیر بیان نمود.
(۲۰)
در فرمول فوق یک متغیر تصادفی برای تصمیم گیری در خصوص توقف پیمایش تصادفی در کاربر v و انتخاب آیتم j از میان آیتمهای امتیاز داده شده توسط v میباشد و در واقع مقدار احتمال توقف در کاربر v و انتخاب آیتم j از میان آیتمهای امتیاز داده شده توسط v در شرایطی می باشد که پیمایش تصادفی از کاربر u و به دنبال امتیاز آیتم هدف i آغاز شده است. نیز یک متغیر بولی است و نشان دهنده این مطلب است که آیا کاربر v دارای امتیاز و نظری برای آیتم j است. با توجه به توضیحات فوق می توان فرمول فوق را به صورت زیر تفسیر کرد:
“پیش بینی امتیاز کاربر مبدا u به آیتم هدف i، به صورت میانگین وزنی (بر اساس احتمال رخداد) امتیازات حاصل از پیمایش های تصادفی موفقی خواهد بود که امتیازی را به عنوان جواب بازگردانده اند.“
یا به عبارت دیگر: