کدام بازی‌های موبایلی بالاترین امتیازها را می‌گیرند؟ / یادداشت دوم از سلسله تحلیل‌های رگرسیونی روی داده‌های کافه بازار

0
26 بازدید
اشتراک گذاری در شبکه های اجتماعی

در این گزارش به‌طور مفصل به بررسی تکمیلی یادداشت اول با تغییراتی اساسی در مدل برازش داده‌شده بر داده‌های کافه بازار می‌پردازیم. همان‌طور که گفته شد، هدف بررسی عوامل تأثیرگذار بر هر بازی در کسب رضایت کاربران و مشخص کردن ویژگی‌های مؤثر در کسب امتیاز بیشتر از طرف کاربران است. برای انجام این پژوهش، از مدل رگرسیون لوژستیک برای پاسخ‌های ترتیبی استفاده کرده‌ایم. در این گزارش به‌منظور بررسی دقیق‌تر و قابل‌لمس‌تر، تغییرات زیر در مدل­‌سازی صورت گرفته‌­اند:

  • متغیرهای موجود در مدل شامل: ژانر مدل‌های درآمد، حجم بازی، مدت‌زمان سپری‌شده از انتشار بازی و نصب فعال هستند.
  • از تمامی متغیرهای کمکی موجود به‌صورت دسته‌بندی‌شده استفاده‌شده است. در حقیقت به‌جای استفاده از مقدار واقعی اعداد، آن­ها را در بازه­‌های مختلف دسته‌­بندی کرده‌­ایم.

نکته‌ی قابل‌ذکر در این تحلیل کاهش معنادار معیار اطلاعاتی آکائیکه (Akaike Information Criterion) است که به‌منظور سنجش نیکویی برازش مدل استفاده می‌شود و این کاهش ۲۸۸۳.۰۶۸ واحدی بهبود محسوس مدل فعلی نسبت به مدل گزارش قبل علی‌رغم افزایش پارامترهای مدل را نتیجه می‌دهد.

همچنین به‌منظور بررسی دقیق‌تر دقت مدل با تقسیم داده‌ها به دو گروه داده‌های آموزشی که شامل ۷۰ درصد داده‌ها می‌شوند و داده‌های آزمایشی که باقی ۳۰ درصد داده را در برمی‌گیرند به‌دقت تقریباً ۹۱ درصدی مدل در اختصاص برچسب صحیح امتیاز تعدیل‌شده به بازی‌ها می‌رسیم.

ضمناً در این یادداشت نیز از داده­های گردآوری‌شده از فروشگاه بازار در نیمه دوم اسفندماه ۱۳۹۸ و مفهوم امتیاز تعدیل‌شده خیلی خوب مشابه با یادداشت اول استفاده‌شده است.

مدل‌های درآمدی

وضعیت پرداخت هر بازی به هفت زیر بخش بازی‌های رایگان، رایگان با پرداخت درون برنامه‌ای، فروشی با هزینه‌ی بین ۵۰۰ تا ۳۰۰۰ تومان، ۳۰۰۰ تا ۵۰۰۰ تومان، ۵۰۰۰ تا ۱۰۰۰۰ تومان، ۱۰۰۰۰ تا ۲۰۰۰۰ تومان و بالای ۲۰۰۰۰ تومان تقسیم می‌شود. در تحلیل این مؤلفه، بازی‌های فروشی بین ۳۰۰۰ تا ۵۰۰۰ تومان به‌عنوان رده‌ی مبنا در نظر گرفته‌شده است، درنتیجه سایر زیر بخش‌های مؤلفه‌ی وضعیت پرداخت با آن مقایسه می‌شوند. جدول ۱ نتایج این تحلیل را مشخص می­‌کند.

آنچه مشخص است، بازی‌های دارای درون پرداخت از بخت بیشتری برای کسب امتیاز خیلی خوب نسبت به سایر مدل‌های درآمدی برخوردار هستند. بعد از بازی‌های رایگان و در میان بازی‌های فروشی، آن‌هایی که قیمت آن‌ها بین ۵۰۰۰ تا ۱۰۰۰۰ تومان است بیشترین بخت را دارا هستند.

حجم بازی

حجم بازی‌ها را به پنج دسته تقسیم و آن‌ها را به‌صورت متغیر دسته‌ای وارد مدل کردیم. جدول ۲ نتایج این بخش از تحلیل‌ها را منعکس کرده است.

با توجه به جدول فوق بخت دریافت امتیاز تعدیل‌شده‌ی خیلی خوب برای بازی‌هایی با حجم بالای ۱۰۰ مگابایت بیشتر از سایر بازی‌ها است و کمترین بخت را بازی‌هایی با حجم کمتر از پنج مگابایت دارند.

مدت‌زمان سپری‌شده از انتشار

مدت‌زمان سپری‌شده از انتشار بازی به ۵ زیر بخش تقسیم‌شده است تا به شکل یک متغیر دسته‌بندی‌شده دربیاید. جدول ۳ نتایج تحلیل مدل روی مدت‌زمان سپری‌شده از انتشار را مشخص می­‌کند. تعداد روزهای انتشار کمتر از ۵۰۰ روز به‌عنوان رده‌ی مبنا انتخاب‌شده است.

آنچه در این تحقیق منعکس شد، بخش کوچکی از تلاش برای درک بهتر وضعیت بازی­‌های موبایلی در ایران است. مسلماً این تلاش‌­های آماری با کاستی­‌های فراوانی همراه بوده و راهی طولانی برای بهبود و کاربردی شدن در پیش دارد. به شکل خاص، هرچه متغیرهای بیشتری در مدل وارد شوند، نتایج مدل معتبرتر خواهد بود و در اولین یادداشت از سلسله یادداشت‌­های تحلیل رگرسیونی روی‌داده‌های کافه بازار از ساختار ساده­ای برای تحلیل استفاده‌شده است. طی کردن این مسیر به‌تنهایی میسر نخواهد بود و به همین دلیل از همه علاقه‌­مندان دعوت می­‌شود برای ارائه انتقادات و پیشنهاد‌ها، نظرات خود را به آدرس research@ircg.ir ایمیل کنند.

محمدرضا صیدی

 

 

 

کارشناسی ارشد آمار ریاضی از دانشگاه تهران، عضو مرکز تحقیقات بازی‌های دیجیتال (دایرک) و علاقه‌مند به علوم داده هستم. تحلیل داده و داده‌کاوی مربوط به حوزه بازی‌های دیجیتال را مورد بررسی قرار می‌دهم.


اشتراک گذاری در شبکه های اجتماعی

ارسال یک پاسخ

لطفا دیدگاه خود را وارد کنید!
لطفا نام خود را در اینجا وارد کنید