کدام بازی‌های موبایلی بالاترین امتیازها را می‌گیرند؟ / یادداشت دوم از سلسله تحلیل‌های رگرسیونی روی داده‌های کافه بازار

0
277

در این گزارش به‌طور مفصل به بررسی تکمیلی یادداشت اول با تغییراتی اساسی در مدل برازش داده‌شده بر داده‌های کافه بازار می‌پردازیم. همان‌طور که گفته شد، هدف بررسی عوامل تأثیرگذار بر هر بازی در کسب رضایت کاربران و مشخص کردن ویژگی‌های مؤثر در کسب امتیاز بیشتر از طرف کاربران است. برای انجام این پژوهش، از مدل رگرسیون لوژستیک برای پاسخ‌های ترتیبی استفاده کرده‌ایم. در این گزارش به‌منظور بررسی دقیق‌تر و قابل‌لمس‌تر، تغییرات زیر در مدل­‌سازی صورت گرفته‌­اند:

  • متغیرهای موجود در مدل شامل: ژانر مدل‌های درآمد، حجم بازی، مدت‌زمان سپری‌شده از انتشار بازی و نصب فعال هستند.
  • از تمامی متغیرهای کمکی موجود به‌صورت دسته‌بندی‌شده استفاده‌شده است. در حقیقت به‌جای استفاده از مقدار واقعی اعداد، آن­ها را در بازه­‌های مختلف دسته‌­بندی کرده‌­ایم.

نکته‌ی قابل‌ذکر در این تحلیل کاهش معنادار معیار اطلاعاتی آکائیکه (Akaike Information Criterion) است که به‌منظور سنجش نیکویی برازش مدل استفاده می‌شود و این کاهش 2883.068 واحدی بهبود محسوس مدل فعلی نسبت به مدل گزارش قبل علی‌رغم افزایش پارامترهای مدل را نتیجه می‌دهد.

همچنین به‌منظور بررسی دقیق‌تر دقت مدل با تقسیم داده‌ها به دو گروه داده‌های آموزشی که شامل 70 درصد داده‌ها می‌شوند و داده‌های آزمایشی که باقی 30 درصد داده را در برمی‌گیرند به‌دقت تقریباً 91 درصدی مدل در اختصاص برچسب صحیح امتیاز تعدیل‌شده به بازی‌ها می‌رسیم.

ضمناً در این یادداشت نیز از داده­های گردآوری‌شده از فروشگاه بازار در نیمه دوم اسفندماه 1398 و مفهوم امتیاز تعدیل‌شده خیلی خوب مشابه با یادداشت اول استفاده‌شده است.

مدل‌های درآمدی

وضعیت پرداخت هر بازی به هفت زیر بخش بازی‌های رایگان، رایگان با پرداخت درون برنامه‌ای، فروشی با هزینه‌ی بین 500 تا 3000 تومان، 3000 تا 5000 تومان، 5000 تا 10000 تومان، 10000 تا 20000 تومان و بالای 20000 تومان تقسیم می‌شود. در تحلیل این مؤلفه، بازی‌های فروشی بین 3000 تا 5000 تومان به‌عنوان رده‌ی مبنا در نظر گرفته‌شده است، درنتیجه سایر زیر بخش‌های مؤلفه‌ی وضعیت پرداخت با آن مقایسه می‌شوند. جدول 1 نتایج این تحلیل را مشخص می­‌کند.

آنچه مشخص است، بازی‌های دارای درون پرداخت از بخت بیشتری برای کسب امتیاز خیلی خوب نسبت به سایر مدل‌های درآمدی برخوردار هستند. بعد از بازی‌های رایگان و در میان بازی‌های فروشی، آن‌هایی که قیمت آن‌ها بین 5000 تا 10000 تومان است بیشترین بخت را دارا هستند.

حجم بازی

حجم بازی‌ها را به پنج دسته تقسیم و آن‌ها را به‌صورت متغیر دسته‌ای وارد مدل کردیم. جدول 2 نتایج این بخش از تحلیل‌ها را منعکس کرده است.

با توجه به جدول فوق بخت دریافت امتیاز تعدیل‌شده‌ی خیلی خوب برای بازی‌هایی با حجم بالای 100 مگابایت بیشتر از سایر بازی‌ها است و کمترین بخت را بازی‌هایی با حجم کمتر از پنج مگابایت دارند.

مدت‌زمان سپری‌شده از انتشار

مدت‌زمان سپری‌شده از انتشار بازی به 5 زیر بخش تقسیم‌شده است تا به شکل یک متغیر دسته‌بندی‌شده دربیاید. جدول 3 نتایج تحلیل مدل روی مدت‌زمان سپری‌شده از انتشار را مشخص می­‌کند. تعداد روزهای انتشار کمتر از 500 روز به‌عنوان رده‌ی مبنا انتخاب‌شده است.

آنچه در این تحقیق منعکس شد، بخش کوچکی از تلاش برای درک بهتر وضعیت بازی­‌های موبایلی در ایران است. مسلماً این تلاش‌­های آماری با کاستی­‌های فراوانی همراه بوده و راهی طولانی برای بهبود و کاربردی شدن در پیش دارد. به شکل خاص، هرچه متغیرهای بیشتری در مدل وارد شوند، نتایج مدل معتبرتر خواهد بود و در اولین یادداشت از سلسله یادداشت‌­های تحلیل رگرسیونی روی‌داده‌های کافه بازار از ساختار ساده­ای برای تحلیل استفاده‌شده است. طی کردن این مسیر به‌تنهایی میسر نخواهد بود و به همین دلیل از همه علاقه‌­مندان دعوت می­‌شود برای ارائه انتقادات و پیشنهاد‌ها، نظرات خود را به آدرس research@ircg.ir ایمیل کنند.

محمدرضا صیدی

 

 

 

كارشناسی ارشد آمار رياضي از دانشگاه تهران، عضو مركز تحقيقات بازی‌های ديجيتال (دايرك) و علاقه‌مند به علوم داده هستم. تحليل داده و داده‌كاوی مربوط به حوزه بازی‌های ديجيتال را مورد بررسی قرار می‌دهم.

LEAVE A REPLY

Please enter your comment!
Please enter your name here