در این گزارش بهطور مفصل به بررسی تکمیلی یادداشت اول با تغییراتی اساسی در مدل برازش دادهشده بر دادههای کافه بازار میپردازیم. همانطور که گفته شد، هدف بررسی عوامل تأثیرگذار بر هر بازی در کسب رضایت کاربران و مشخص کردن ویژگیهای مؤثر در کسب امتیاز بیشتر از طرف کاربران است. برای انجام این پژوهش، از مدل رگرسیون لوژستیک برای پاسخهای ترتیبی استفاده کردهایم. در این گزارش بهمنظور بررسی دقیقتر و قابللمستر، تغییرات زیر در مدلسازی صورت گرفتهاند:
- متغیرهای موجود در مدل شامل: ژانر مدلهای درآمد، حجم بازی، مدتزمان سپریشده از انتشار بازی و نصب فعال هستند.
- از تمامی متغیرهای کمکی موجود بهصورت دستهبندیشده استفادهشده است. در حقیقت بهجای استفاده از مقدار واقعی اعداد، آنها را در بازههای مختلف دستهبندی کردهایم.
نکتهی قابلذکر در این تحلیل کاهش معنادار معیار اطلاعاتی آکائیکه (Akaike Information Criterion) است که بهمنظور سنجش نیکویی برازش مدل استفاده میشود و این کاهش 2883.068 واحدی بهبود محسوس مدل فعلی نسبت به مدل گزارش قبل علیرغم افزایش پارامترهای مدل را نتیجه میدهد.
همچنین بهمنظور بررسی دقیقتر دقت مدل با تقسیم دادهها به دو گروه دادههای آموزشی که شامل 70 درصد دادهها میشوند و دادههای آزمایشی که باقی 30 درصد داده را در برمیگیرند بهدقت تقریباً 91 درصدی مدل در اختصاص برچسب صحیح امتیاز تعدیلشده به بازیها میرسیم.
ضمناً در این یادداشت نیز از دادههای گردآوریشده از فروشگاه بازار در نیمه دوم اسفندماه 1398 و مفهوم امتیاز تعدیلشده خیلی خوب مشابه با یادداشت اول استفادهشده است.
مدلهای درآمدی
وضعیت پرداخت هر بازی به هفت زیر بخش بازیهای رایگان، رایگان با پرداخت درون برنامهای، فروشی با هزینهی بین 500 تا 3000 تومان، 3000 تا 5000 تومان، 5000 تا 10000 تومان، 10000 تا 20000 تومان و بالای 20000 تومان تقسیم میشود. در تحلیل این مؤلفه، بازیهای فروشی بین 3000 تا 5000 تومان بهعنوان ردهی مبنا در نظر گرفتهشده است، درنتیجه سایر زیر بخشهای مؤلفهی وضعیت پرداخت با آن مقایسه میشوند. جدول 1 نتایج این تحلیل را مشخص میکند.
آنچه مشخص است، بازیهای دارای درون پرداخت از بخت بیشتری برای کسب امتیاز خیلی خوب نسبت به سایر مدلهای درآمدی برخوردار هستند. بعد از بازیهای رایگان و در میان بازیهای فروشی، آنهایی که قیمت آنها بین 5000 تا 10000 تومان است بیشترین بخت را دارا هستند.
حجم بازی
حجم بازیها را به پنج دسته تقسیم و آنها را بهصورت متغیر دستهای وارد مدل کردیم. جدول 2 نتایج این بخش از تحلیلها را منعکس کرده است.
با توجه به جدول فوق بخت دریافت امتیاز تعدیلشدهی خیلی خوب برای بازیهایی با حجم بالای 100 مگابایت بیشتر از سایر بازیها است و کمترین بخت را بازیهایی با حجم کمتر از پنج مگابایت دارند.
مدتزمان سپریشده از انتشار
مدتزمان سپریشده از انتشار بازی به 5 زیر بخش تقسیمشده است تا به شکل یک متغیر دستهبندیشده دربیاید. جدول 3 نتایج تحلیل مدل روی مدتزمان سپریشده از انتشار را مشخص میکند. تعداد روزهای انتشار کمتر از 500 روز بهعنوان ردهی مبنا انتخابشده است.
آنچه در این تحقیق منعکس شد، بخش کوچکی از تلاش برای درک بهتر وضعیت بازیهای موبایلی در ایران است. مسلماً این تلاشهای آماری با کاستیهای فراوانی همراه بوده و راهی طولانی برای بهبود و کاربردی شدن در پیش دارد. به شکل خاص، هرچه متغیرهای بیشتری در مدل وارد شوند، نتایج مدل معتبرتر خواهد بود و در اولین یادداشت از سلسله یادداشتهای تحلیل رگرسیونی رویدادههای کافه بازار از ساختار سادهای برای تحلیل استفادهشده است. طی کردن این مسیر بهتنهایی میسر نخواهد بود و به همین دلیل از همه علاقهمندان دعوت میشود برای ارائه انتقادات و پیشنهادها، نظرات خود را به آدرس research@ircg.ir ایمیل کنند.
محمدرضا صیدی
كارشناسی ارشد آمار رياضي از دانشگاه تهران، عضو مركز تحقيقات بازیهای ديجيتال (دايرك) و علاقهمند به علوم داده هستم. تحليل داده و دادهكاوی مربوط به حوزه بازیهای ديجيتال را مورد بررسی قرار میدهم.