دانلود فایل پایان نامه : طرح های پژوهشی انجام شده در مورد ارائه مدلی ... |
itm_id
کد آیتم/ محصول
ratings
امتیاز
date
تاریخ
۵-۲-۳- ایجاد مجموعه داده نمونه[۱۰۷]
با توجه به اینکه جدول ratings شامل ۵۷۳۹۳۱ رکورد مربوط به نظرات کاربران در خصوص آیتمهای مختلف میباشد و اجرای مدل پایه و مدل توسعه یافته بر روی این اطلاعات مستلزم صرف زمان بسیار زیاد میباشد، لذا نسبت به استخراج چندین مجموعه داده نمونه مطابق مراحل زیر برای بررسی و انجام آزمایشات و تسریع در روند تحقیق اقدام شده است.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
مرتب سازی اطلاعات جدول ratings بر اساس امتیاز تعلق گرفته به آیتمهای مختلف
استخراج ۲۰ درصد اطلاعات متناسب با نسبت تعداد موجود از هر امتیاز در محدوده ]۵,۱ [به جهت حفظ نحوه پراکندگی اطلاعات
۵-۳- مجموعه داده movielens
یکی دیگر از مجموعه دادههایی که در این تحقیق مورد استفاده و بررسی قرار گرفته است مجموعه داده سایت Movielens[108] میباشد. این سایت یکی از بزرگترین سایتهای موجود در زمینه به اشتراک گذاری و اجاره فیلم سینمایی میباشد. در این سایت نظرات کاربران مختلف درباره فیلمها و همچنین امتیازات تخصیص داده شده به هر فیلم قابل مشاهده میباشد. بر خلاف مجموعه داده epinions، در این مجموعه داده اطلاعات شبکه اعتماد میان کاربران موجود نیست و تنها دسترسی به نظرات کاربران در خصوص فیلمهای گوناگون قابل دسترس است.
۵-۳-۱- ویژگیهای مجموعه داده movielens
از این مجموعه داده، ۳ ویرایش مختلف توسط گروه grouplens دانشگاه Minnesota آمریکا منتشر شده است که در این تحقیق ویرایش شماره ۱ مورد استفاده قرار گرفته است. در این نسخه از مجموعه داده movielens تعداد ۱۰۰۰۰۰ نظرات ۹۴۳ کاربر در خصوص ۱۶۸۲ فیلم موجود میباشد. در این مجموعه داده هر کاربر حداقل به ۲۰ فیلم امتیاز داده است بنابراین در این مجموعه داده، مشکل کاربران تازه وارد و همچنین مشکل اندکی اطلاعات وجود ندارد و نمی توان از آن برای بررسی عملکرد سیستم توصیهگر در خصوص کاربران تازه وارد استفاده نمود. همانند مجموعه داده epinions، امتیازات به صورت مقادیر صحیح و در محدوده ]۵,۱[ توسط کاربران بیان شده است. در این مجموعه یک کاربر در مورد یک فیلم تنها یک بار نظر داده است بنابراین ردیفهای تکراری وجود ندارد، همچنین اطلاعات بدون نقص و کاستی ارائه شده است لذا نیازی به پالایش اطلاعات نیست.
با توجه به اینکه در این مجموعه داده شبکه اعتماد میان کاربران وجود ندارد بنابراین برای بکارگیری آن در این تحقیق، محاسبه اعتماد میان هر دو زوج از کاربران به صورت دستی و از طریق فرمول شماره ۳۰ انجام شده است که نتیجه حاصل در قالب جدولی مشابه جدول WOT ذخیره و شامل تعداد ۸۸۹۲۴۹رکورد میباشد.
لازم به توضیح است اطلاعات این مجموعه داده در قالب تعدادی فایل متنی ارائه شده است که در ساختارها و جداولی کاملا مشابه جداول مجموعه داده epinions در پایگاه داده SQL Server 2010 درج، یکپارچه و نگهداری شده است.
۵-۴- نیازمندیهای نرم افزاری
برای پیاده سازی مدل TrustWalker پایه و همچنین مدل توسعه یافته از زبان برنامه نویسی Java نسخه ۱٫۶٫۰_۲۴ و محیط توسعه NetBeans IDE[109]نسخه ۷٫۲ و سیستم عامل Windows 7 Ultimate استفاده شده است.
۵-۵- نیازمندیهای سخت افزاری
انجام آزمایشات و اجرای مدل پیادهسازی شده بر روی یک دستگاه رایانه با مشخصات فنی زیر انجام گرفته است.
Processor : Intel® Core™ i5 CPU M520@2.40 GHz
RAM : 4.00 GB
System Type : 32-bit Operating System
۵-۶- متدولوژی نرم افزاری
پیاده سازی مدل پایه و مدل توسعه یافته کاملا به صورت متدولوژی شیگرا انجام گرفته است و جهت افزایش سرعت اجرای الگوریتم و بهره گیری از کل توان سیستم، از روش پردازش موازی[۱۱۰] برای پیاده سازی و اجرای متدهای اصلی مدل استفاده شده است.
۵-۷- پارامترهای پیش فرض انجام آزمایشات
جهت حفظ دقت و یکپارچگی در انجام آزمایشات، اخذ نتایج و یکسان بودن شرایط انجام آزمایشات، پارامترها و متغیرهای مورد استفاده در مدل، مطابق جدول شماره ۵-۵ تعیین و تنظیم گردیدهاند.
جدول ۵-۵ : مقادیر پیش فرض پارامترها و متغیرهای مورد استفاده در مدل پیشنهادی
پارامترها و شرایط انجام آزمایش
دقت اجرا
۰٫۰۰۰۱
حداکثر اجرای ناموفق
۱۰۰۰۰
عمق
فرم در حال بارگذاری ...
[یکشنبه 1400-09-28] [ 11:04:00 ب.ظ ]
|