یادداشت اول از سلسله تحلیلهای رگرسیونی روی دادههای کافه بازار
یکی از مسائل مهم برای تحلیل موفقیت در بازار بازیهای دیجیتال و خصوصا بازیهای موبایلی که رقابت بیشتری در میان آنها وجود دارد، تعیین یک متغیر به عنوان متغیر معیار و بررسی عوامل اثرگذار بر آن است. شاید بهترین و دقیقترین معیار برای موفقیت یک بازی، عملا درآمد حاصل از آن باشد. با این حال با توجه به اینکه دسترسی به درآمد همه بازیها ممکن نیست، معمولا تلاش میشود تا از گزینههای جایگزین برای بررسی عوامل موفقیت استفاده شود.
در کنار شاخصهایی همچون نرخ رشد و نصب فعال، یکی از بهترین معیارها، امتیازی است که کاربران به یک بازی دادهاند. با این حال سروکله زدن با این عامل به دلیل آنکه تحت تاثیر تعداد کم کاربران، تقلب، هک شدن و عواملی از این دست، دچار نارسایی میشود، معمولا با چالش مواجه است. در این یادداشت تلاش شده تا پس از گردآوری دادههای مربوط به بازیهای موبایلی در فروشگاه بازار، به شکل تمرینی با تعدیل امتیاز کاربران به بازیها و استفاده از یک مدل برآوردگر مبتنی بر رگرسیون لوژستیک، تحلیل ابتدایی از بخت ژانرها و مدلهای درآمدی مختلف ارائه شود.
- این پژوهش چگونه انجام شده است؟
در این تحقیق، هدف بررسی عوامل تاثیرگذار بر هر بازی در کسب رضایت کاربران با معیار میزان امتیاز و مشخص کردن ویژگیهای موثر در کسب امتیاز بیشتر از طرف کاربران بوده است. گردآوری دادهها از سایت کافه بازار در نیمه دوم اسفندماه 1398 صورت گرفته و برای انجام این پژوهش، از مدل رگرسیون لوژستیک استفاده شده که در آن متغیر هدف، امتیاز تعدیل شده کاربران بوده است. در این یادداشت چهار متغیر ژانر، مدل درآمدی، زمان طی شده از تاریخ انتشار و حجم بازی وارد مدل شدهاند تا تاثیرگذاری همزمان آنها بخت دستیابی به یک امتیاز مناسب از بازیکنان به تفکیک ژانر و مدل درآمدی حاصل شود. ذکر این نکته ضروری است که در مدلهای مبتنی بر رگرسیون لوژستیک، با افزایش تعداد متغیرهای اثرگذار، ممکن است مدل دقیقتری ساخته شود.
- مفهوم امتیاز تعدیل شده خیلی خوب
در کافه بازار هر کاربر میتواند به طور مستقیم به بازی مورد نظر امتیازی بین عدد یک تا 5 را بدهد؛ اما این روش تفاوتی میان یک بازی که امتیاز 4 را توسط یک نفر کسب کرده و بازی دیگری که همین امتیاز را توسط هزاران نفر کسب کرده است قائل نیست. به همین سبب ما از یک برآوردگر بِیزی برای تعدیل امتیازها استفاده کردیم. در حقیقت با انجام این برآورد بیزی (مشابه با آنچه سایت IMDB برای معرفی 250 فیلم برتر خود استفاده میکند) هرچه تعداد افرادی که به یک بازی امتیاز دهند بیشتر باشد، اثر امتیاز کسب شده برجستهتر خواهد بود و در حقیقت کسب امتیاز بالا به شکل همزمان هم وابسته به دریافت امتیاز خوب از کاربران و هم وابسته به تعداد بالای امتیازدهندگان است. در جدول 1، 50 بازی برتر فروشگاه بازار با بالاترین امتیاز تعدیل شده ارائه شدهاند.
با توجه به اینکه برای استفاده از رگرسیون لوژستیک با پاسخ ترتیبی، متغیر هدف باید به صورت ترتیبی تعریف شود، بازه امتیازهای تعدیل شده را به پنج قسمت مساوی تقسیم کردیم و به ترتیب امتیاز، به آنها برچسب خیلی خوب، خوب، متوسط، ضعیف و خیلی ضعیف دادیم که در این دستهبندی، امتیاز تعدیل شده خیلی خوب عددی مابین 4.334 و 4.798 است.
بر این اساس، در تحقیق حاضر هدف بررسی بخت دستههای مختلف بازیها برای دریافت امتیاز تعدیل شده خیلی خوب است. باید توجه داشت که نتایج این تحلیل آماری، یک مقایسه میان گونههای مختلف را با فرض ثابت بودن سایر شرایط ارائه میدهد. برای مثال مشخص میکند که یک ژانر نسبت به ژانر دیگر با فرض ثابت بودن حجم بازی، زمان طی شده از تاریخ انتشار و مدل درآمدی چقدر بخت بیشتری برای دریافت امتیاز «خیلی خوب» دارد.
- بخت ژانرهای مختلف برای به دست آوردن امتیاز تعدیل شده خیلی خوب
ژانر بازیها در کافه بازار به بخشهای استراتژی، اکشن، امتیازی، آموزشی، تفننی، خانوادگی، رانندگی، شبیهسازی، کلمات و دانستنیها، ماجرایی، معمایی و ورزشی تقسیم میشود. بر اساس نتایج این مدل رگرسیون لوژستیک، بازیهای ژانر آموزشی در بازار از کمترین بخت برای دریافت امتیاز تعدیل شده خیلی خوب برخوردار هستند؛ بنابراین این ژانر به عنوان ژانر «مبنا» قرار گرفته و بخت سایر ژانرها نسبت به بازیهای آموزشی در جدول 2 ارائه شدهاند.
بر اساس آنچه در جدول 2 ارائه شد، بازیهای ژانر شبیهسازی در حال حاضر بیشترین بخت را برای دریافت امتیاز تعدیل شده خیلی خوب دارا هستند. باید توجه داشت که به فرض در ژانر کلمات و دانستنیها، ممکن است یک بازی وجود داشته باشد که امتیاز تعدیل شده آن از بهترین بازی شبیهسازی نیز بالاتر باشد؛ اما آنچه رگرسیون لوژستیک تعیین میکند، بخت یک بازی در ژانرهای مختلف برای دریافت امتیاز خیلی خوب است که برای مثال برای یک بازی در ژانر شبیهسازی، 2.68 برابر بیشتر از یک بازی در ژانر آموزشی است.
- بخت مدلهای درآمدی مختلف برای به دست آوردن امتیاز تعدیل شده خیلی خوب
مدلهای درآمدی بازیهای بازار را میتوان به سه دسته رایگان، رایگان دارای درونپرداخت و فروشی تقسیم کرد. کمترین بخت برای دریافت امتیاز تعدیل شده خیلی خوب در این دستهبندی، متعلق به بازیهای فروشی است و جدول 3 این سه روش درآمدی را از این حیث با هم مقایسه میکند.
آنچه در این تحقیق منعکس شد، بخش کوچکی از تلاش برای درک بهتر وضعیت بازیهای موبایلی در ایران است. مسلما این تلاشهای آماری با کاستیهای فراوانی همراه بوده و راهی طولانی برای بهبود و کاربردی شدن در پیش دارد. به شکل خاص، هرچه متغیرهای بیشتری در مدل وارد شوند، نتایج مدل معتبرتر خواهد بود و در اولین یادداشت از سلسله یادداشتهای تحلیل رگرسیونی روی دادههای کافه بازار از ساختار سادهای برای تحلیل استفاده شده است. طی کردن این مسیر به تنهایی میسر نخواهد بود و به همین دلیل از همه علاقهمندان دعوت میشود برای ارائه انتقادات و پیشنهادات، نظرات خود را به آدرس research@ircg.ir ایمیل کنند.
محمدرضا صیدی
كارشناسی ارشد آمار رياضي از دانشگاه تهران، عضو مركز تحقيقات بازیهای ديجيتال (دايرك) و علاقهمند به علوم داده هستم. تحليل داده و دادهكاوی مربوط به حوزه بازیهای ديجيتال را مورد بررسی قرار میدهم