关于消除游戏数据分析的三个方法和三大误区

来自 游戏葡萄 2015-10-14
深度

[ 游戏葡萄原创专稿,未经允许请勿转载 ]

关于消除游戏数据分析的三个方法和三大误区

本文由偶尔喝咖啡独家投稿,授权游戏葡萄发布。即使我们允许,也不能转载。

作者信息:

网名:偶尔喝咖啡

QQ:1963904

Email:ancientlight@sina.com

当前状态:子非鱼工作室(专业从事消除游戏玩法和关卡设计)

欢迎加入消除游戏从业者群: 193348845

今天,我们暂时放下设计的话题,来谈谈游戏产业当中的另一个重要环节:运营。本文中,我们将着重探讨一下针对消除类游戏的数据分析工作。

与市面上主流的网络游戏相比,消除类单机游戏在玩家存留,付费模型,系统结构等等方面都有着非常显著的差异。因此的,针对消除游戏所做的数据分析,从数据采集,统计,到具体的特征分析,也都会有其特有的关注点和独特的手法。因此的,本文将从以下几个维度来展开论述:

  • 数据分析的基本方法

  • 游戏数据分析的核心指标

  • 数据分析从业者的能力要求

  • 消除游戏的存留分析方法

  • 消除游戏的付费分析方法

  • 基于关卡的数据分析方法

在此笔者想要说明一点,本文更多探讨的是如何去做好一款消除游戏的数据分析,而不是给大家去展示各款游戏的实际数据。对于抱有后者期望的同学,笔者只能够在此真诚地表示道歉。

数据分析的基本方法

在这里,笔者将一般意义上的数据分析工作从浅到深的拆分为三个阶段:数据统计,数据分析,数据挖掘。

  • 数据统计

这是我们实际项目工作中最常用到的一种数据分析方式,我们每天登陆后台BI系统,第三方数据平台或者查看数据日报周报月报,这都属于最基本的数据统计范畴。

数据统计工作的基本模式如下:

换言之,数据统计所能发现的问题模式必须是我们已知的,乃至于在其他产品的运营工作中已经被验证过的。而当我们在做一款之前没有尝试过的新类型的产品时,数据统计工作往往会显得力不从心。

  • 数据分析

与数据统计不同,数据分析致力于针对每一款产品的具体设计和数据特征,在产品的具体设计与线上数据之间建立起各种逻辑关系,并对游戏设计者的各种假设进行验证,以提供改进的依据。

数据分析工作的基本模式如下:

与数据统计工作相比,数据分析最大的特点就在于它加入了循环修正这一过程。这是因为数据分析工作的出发点并不如数据统计那么可靠。但也正因为如此,数据分析往往能够比数据统计发现更多更多的问题和内在联系。而与之对应的,数据分析工作对于分析者的能力经验和投入的时间精力也都会有着更高的要求。

  • 数据挖掘

数据挖掘是大数据时代开始流行的一个名词,它本身是计算机专业学科的一门新课题。其主要目的是通过在大数据样本中利用计算机的超高速运算能力,发现隐藏在数据样本内部的潜在规律,辅助我们揭示一些常人无法注意到的事物逻辑。

数据挖掘工作的基本模式如下:

数据挖掘一般被用于揭示以下两类结论:

  • 逻辑结论

即事物之间的直接因果关系,但这种逻辑结论往往在一般的数据统计中并不会直观显示出来。举个例子,在数据统计中,我们突然发现一段时间晚上8~12点的玩家活跃度骤降,而我们也并无法提出足够的假设来说明这一骤降的原因。数据挖掘会基于我们大数据集中的每个维度进行动态分析,最后告诉我们,这个数据骤降和地域的关联度非常高,集中在少数的几个相邻的省区。于是当我们详细了解以后,发现是针对那几个省区的网络出口在这一阶段出现了频繁的掉线问题。

  • 相关性结论

有些时候,数据挖掘并不会直接给我们因果结论,而会给我们很多相关性结论,而事实上的逻辑关系则往往隐藏在这些相关性之中。比如,通过数据挖掘,我们发现,某款消除游戏的免费玩家中,技术相对较高的玩家(这个可以用平均的通关效率来衡量),往往在日常关卡的排名中排名较低(即这两个群体的相关性程度较高),那么建议设计者就要仔细分析一下出现这个现象的原因了。是由于在某个玩法中存在了玩家作弊的可能性,还是玩家在两种玩法中有很明显的倾向于选择?

在这里,笔者也想说明一点。即便放眼整个互联网行业,真正在数据挖掘上比较有所成就,能够很有效的指导产品设计和改进的公司事实上也屈指可数。一般来讲,只有超大用户量的产品才能够积累起足够海量的数据样本,也才能够值得投入专门的人力物力财力去进行深入的持续的数据挖掘工作。对于游戏行业,到目前为止,数据挖掘基本还属于未充分适合商用的前卫领域。

游戏数据分析的核心指标

对于绝大多数的游戏行业团队来讲,KPI(Key Performance Indicator,核心绩效指标)都像是随时悬在团队头上的达摩克里斯之剑。作为一个行业从业者,平时嘴里不冒出几个ARPPU,LTV之类的英文名词也会有不好意思和人打招呼的感觉。那么,到底哪些数据指标是我们游戏运营过程中的生命线,它们的逻辑关系又是什么样的呢?

  • 存留率

一般来讲,游戏发行和渠道首先关注的产品指标就是存留率,也就是在相同渠道导入的一批用户,经过二日,三日,七日或者更长时间,所能够存留下来形成活跃用户的比例。

一般的数据分析,针对存留率往往会做横向比较,从而得出次日留存偏低,七日很低等等结论。但这里就产生了另一个问题:绝大部分情况下,次日留存低的产品,七日,十五日留存必然也会低,那么我们是否能够因此得出这款游戏在2~15日的游戏设计中存在问题呢?似乎我们并无法直接得出这样的结论,难道我们只能等到这款产品把次日留存提升到某一个合格标准才能够去评估它的长期留存问题么?

基于此的,笔者在这里提出一个周期留存率的概念:从第X日到第Y日的周期留存(Y>X)=Y日留存率/X日留存率。这一周期留存率的横向比较,可以用于对比不同游戏,同一游戏的不同推广渠道,或者同一游戏不同版本之间的中长期留存水平。事实上,一款30日留存只有6%的产品未见得一定比30日留存10%的产品 长期留存差,这一特征在SLG类产品中表现的尤其明显。

  • ARPU(Average Revenue Per User单用户收益)

ARPU=特定周期(如一天)总付费额/周期内(如当日)登陆总用户数。很直观的,这一指标评估的是产品的整体变现能力。

倒退回几年前的页游时代,行业内很少使用ARPU这一数据指标,而大多使用下文中将要讲到的ARPPU。但事实上,笔者认为ARPU是最公平的用于衡量产品变现能力的指标,ARPU与ARPPU的差异笔者将会在下一节详细论述。

  • 付费比例与ARPPU(Average Revenue Per Paid User单付费用户收益)

付费比例=特定周期(如一天)付费用户/周期内总登陆用户数。

ARPPU=特定周期(如一天)总付费额/周期内(如当日)付费用户数。

之所以将付费比例和ARPPU放在一节内讨论,笔者是想说明一个之前产品运营中的常见误区,即片面的强调某款产品付费比例过低或者ARPPU过低问题。这里笔者首先要阐明一个基本的指标公式:

ARPU=ARPPU*付费比例。

我们设X=周期内总登陆用户数,Y=周期付费用户,Z=周期总付费额,那么ARPU=Z/X,ARPPU=Z/Y,付费比例=Y/X。那么自然的:

ARPPU*付费比例=Z/Y*Y/X=Z/X=ARPU。

这一公式揭示了一个运营手段上的陷阱,即我们可以通过运营活动很容易的调节ARPPU和付费比例的高低,但这种调节如同一个跷跷板,我们调高一端时往往会拉低另一端,因为很多时候我们的调节手段并不会提升ARPU。

当然的,如果是基于运营活动,付费激励等各个维度完全对等的前提下,我们也可以通过比较付费比例和ARPPU来分析到底游戏的收费短板在于小R还是大R。这一分析方法尤其适合单款产品进行版本前后的纵向分析。只不过,在这所有的分析中,请随时对比参考一下ARPU的变化,以避免再次落入前述的误区之中。

  • LTV(Life Time Value生命周期价值)

在手游时代兴起的最热门的产品指标当属LTV。这一指标直接的反映了产品的推广回收能力。指定周期的LTV=在某日新进入游戏的用户在指定周期内的总付费额/新进入用户总数。

LTV指标火爆的核心原因在于负责推广的同学会直接将LTV与产品的广告推广成本进行比较核算,来计算产品推广的盈亏能力和回收周期。简单地说,如果一款产品一年期的单用户LTV是20元,而分到推广者手中的比例是35%,那么当单个用户的推广成本高于20*35%=7元时,每推广进来一个用户都是入不敷出的——除非这款产品的生命周期大大高于一年。

与LTV相关的还有一个指标:ROI(投资回报率),这是一个财务上非常关注的指标,感兴趣的同学不妨自己查询一下,在此不再多做展开。

数据分析从业者的能力要求

这里,笔者简单的总结了个人认为数据分析从业者最为核心的三项能力要求。

  • 基本的公式理解和计算能力

在我们的数据分析工作中,每一个常用指标背后都隐藏着一个基本的计算公式。一个好的数据分析师必须能够理解每个核心公式的计算方法,并能够在相对原始的数据基础上手动计算出各个指标。

各个平台,各个公司,在实际的指标统计和计算方式上往往会存在着各种细微的差异。比如统计留存时是以严格规则还是以递进规则计算,比如统计ARPU等指标时是否将当日流失用户计算在内,比如在线时长的估算使用的是什么样的估算算法,甚至包括时间周期的截取方式(比如海外游戏以哪个时区作为自然日的计量标准)。这样的差异会给我们横向比较定位问题带来难以估算的误差。一个好的数据分析人员则可以有效地发现并绕开这些差异,从原始数据上独立计算出一致的数据指标来作为横向对比的依据。

同时的,具备独立计算能力的数据分析者,可以针对自己的产品提出更具有说明性的新产品指标,并将计算方式提交给BI部门,以获取更加精准的产品分析数据。

  • 基于最原始数据的分析工具使用

在绝大多数笔者接触过及亲手参与过开发的数据统计平台(BI)中,数据的最原始状态都是日志条目。例如,活跃用户数指的是在日志数据库中该周期内有登陆日志条目的独立用户数量。

在前文中笔者讲过,数据分析是一个基于假设不断尝试验证的迭代过程。深入持续的数据分析过程无法像简单的数据统计一样,每次都提交需求给技术或者平台方,因为一方面这会带来大量不确定的沟通成本,另一方面也会大大拖慢这一分析过程的效率。因此的,笔者强烈的建议数据分析人员至少掌握1项数据分析工具的使用方式,以便在需要的时候直接在原始数据上进行采样验证。常见的数据分析工具笔者推荐以下几种:

  • EXCEL:这是非技术人员最常使用的工具,最容易上手,在一些基本的分类,计数等等工作中也非常得心应手。但与此同时的,它在一些复杂的多条件筛选,联合查询,数据剪裁等等方面也会受到诸多制约,而且在实际使用中性能也会比其他工具要差,因此只适用于初级的数据分析。

  • 数据库(MySQL,Oracle等):这是程序员最经常使用的工具,它具有极强的查询能力,使用查询语句可以很方便的做出非常复杂逻辑的查询工作。绝大多数的BI系统都是使用页面直接通过数据库访问和查询来计算的统计结果。但对于非技术人员来讲,直接操作数据库的难度和风险都会相对偏大。

  • LINUX查询(grep,awk等):这是笔者个人特别偏爱的一种数据分析工具,它尤其适用于分析文本格式存储的用户日志(基于HTTP协议的服务大部分都会采用文本格式存储用户日志)。文本切割查询是它最大的优势,尤其适用于客户端以文本方式将大量信息(如整个关卡过程)单条提交的日志方式。

  • SPSS,MATLAB等:这些大多应用于特定专业领域的工具用于游戏行业会显得略有一些高冷,但如果分析师确实在之前的工作中经常使用,也是非常强大好用的工具。

当然,最理想的状态是数据分析师能够熟练掌握以上工具中的多项,并在实际的分析工作中灵活切换。

  • 对于行业横向数据指标的了解

也许,这一能力并不应该单纯的去要求数据分析者,而是一个团队甚至一家公司的能力体现。

无论我们在做哪种产品的数据分析,我们首先需要知道,行业内同类产品在每个指标的评论水平是多少,S级A级产品的真实指标又是多少。笔者这里特意强调真实指标,就是想提醒大家不要把软文中传说的90%多的次留等数据当做参照物。那么,如何获取到这些横向的数据指标呢?更多的就要通过行业内的人脉,以及对外部信息的分辨能力了。

  • 对游戏设计的理解

作为一个合格的游戏数据分析者,他必须懂游戏,并且至少能够在表面程度上理解游戏的设计目的。前文中笔者强调过,游戏分析的前提是假定的逻辑,而合理的假定逻辑则往往来自于对游戏内在逻辑的理解和思考。一个不懂游戏的数学天才,也很难成为一个好的游戏数据分析师。

消除游戏的留存分析方法

用户留存分析,即用户流失分析。大体上,笔者把用户流失分为四个大的类别:

  • 第一眼流失

  • 前期卡点流失

  • 无理由回归流失

  • 长期流失

大体上来讲,前三者主要反映在游戏的次留上(少部分会反应在第三日~第七日存留),而长期流失则望文知意。下面笔者主要分析一下各类型流失的典型特征。

  • 第一眼流失

造成用户第一眼流失的原因很多,比如美术风格不喜欢,游戏类型不喜欢,游戏和玩家进入前的认知不符(这一特征尤其明显的出现在传统的欺骗性广告推广中),不确定的技术问题等。这种流失往往是在运营角度很难快速优化的(除推广和渠道优化外),我们把它叫做产品综合品质形成的流失。

在消除游戏中,这类型流失的数据特征非常明显,流失玩家会非常集中地出现在第1~3关,而且第一关往往占据了一半以上的比例。如果你横向比较下发现你的第一关流失率明显高于行业平均值或者你熟悉的顶级产品,那么可能你就要从整体上去考虑下产品的品质了。

消除游戏中,“没有新意”是非常重要的一个第一眼流失诱因。无论是作为设计者还是数据分析者,都应该特别关注产品在前5关尤其是第一关的直观体验,是否能够让玩家觉得眼前一亮,有没有能力吸引一个玩过开心消消乐,糖果传奇或其他若干款消除游戏的玩家继续玩下去。这是游戏生命线级别的核心问题。

  • 前期卡点流失

这是游戏运营工作中最为关注的一个流失类型,也是最容易调整并产生效能的一个类型。在消除游戏中,用于考量玩家流失状况的数据指标,可以使用以下四种表达方式:

通过人数(SU):指定样本集中成功通过某个关卡的玩家人数。

流失人数(LU):指定样本集中在某一关卡中流失掉的玩家人数

绝对通过率(AR):指定样本集中通过该关卡的玩家人数/样本集总人数

相对通过率(RR)指定样本集中通过该关卡的玩家人数/通过上一关的玩家人数。

在一个理论上无卡点的产品数据中,以上四个数据的曲线类似下图:

1444790228890625.png

1444790231749078.png

在实际的数据分析中,我们所关注的是产品的数据曲线在哪些地方出现凸点。例如在下图中:

1444790228890625.png

1444790231749078.png

在流失人数曲线上,我们能够看到若干个明显的卡点,但在其他三条曲线上,我们只能很明显的看到第4关处出现的巨大卡点,第36关左右也有一个并不明显的变化点。那么实际的数据特征是什么样呢?我们来看一下详细的数据表:

1444790234899288.png

在前40关中,标注为黄色的高流失关卡有 6处,但在上面的图表中,大部分都被曲线平滑的隐藏了。大家仔细对比一下就会发现,四个指标中,流失人数曲线是最容易直观反映出数据变化的,这也是笔者比较推荐大家使用的一个指标,但是在足够长的关卡曲线上,后期的数据曲线会很接近于横坐标轴,变化幅度根本看不清。

在这里,笔者给大家提供一个小技巧:制作一条相对流失幅度曲线,它的定义是,每一关的流失人数/之前五关的流失人数平均值。那么,上面看起来平滑的曲线的相对流失幅度曲线又是什么样的呢?

1444790234314260.png

在这条变化非常明显的曲线中,我们需要关注的是相对流失幅度大大高于1的关卡,它们的流失人数大大高于其前面五关的平均流失人数,很明显的会是游戏的关卡难点和潜在的卡点。在图中,我们可以很容易的找到第17,25,32,36几个难度峰值点。当然,这个曲线也有它的缺点,就是它对于最前期(尤其是前10关)的流失卡点的反应能力几乎为0。这是因为前10关原本就是一个流失人数随进入人数快速下降的过程。

  • 无理由回归流失

这是最让运营同学头疼的一种流失方式 ,即便你以心路历程的方式去追踪这种用户的每一步游戏轨迹,观察他在流失前半小时的每一步行为,都找不到任何使他突然流失的理由,但这个用户就是无情的抛弃了这个游戏,离开了,再也没有回归。无理由回归流失主要发生在游戏的当日或前三日,在玩家没有形成对游戏的充分认同,没有成为游戏稳定玩家的前提下,我们很难找到他流失的典型数据特征,但这种流失对于游戏的前期存留指标的影响是非常巨大的。

在消除游戏中,笔者建议可以通过对玩家关卡行为的特征分析来优化无理由回归流失。笔者会在后面的基于关卡的数据分析中详细论述这一点。

  • 长期流失

一般情况下,我们认为一个在游戏中稳定登陆超过一周的玩家是游戏的稳定玩家,他们不太会再因为游戏的美术,题材等等原因而放弃游戏,即便再遇到一些引导或功能上的难点也愿意花时间精力去探索或者解决。对于这样的玩家,长期流失的原因也会有很多种,但大体上来讲以下几种是最常见的:

  • 玩家觉得无聊,缺少新的刺激点。在消除游戏中,缺少新的玩法变化或者新的玩法变化不被认同,最容易导致这种结果。

  • 玩家客观原因导致,例如学生开学,工作繁忙,设备或账号丢失等等原因。比较有趣的一个话题是,游戏运营中往往会想方设法强化玩家的每日登陆,让玩家每天不登陆都会觉得可惜,觉得在进度上落后于其他玩家,而很多时候正是这种不愿落后的心态导致了玩家由于客观原因不便登陆几天后被迫流失。尤其是在传统的页游运营中,春节长假和十一长假是产品运营的大敌,往往容易导致游戏DAU的大幅度下跌。在这一点上,消除游戏的弱粘着性反而使得其不容易产生节日型流失。

  • 玩家觉得游戏太坑钱。在目前的消除游戏中,这种情况出现的很少,可以忽略。

  • 玩家在PVP竞争中失败流失,不管是在传统SLG的PVP中被打退还是在RPG类游戏的排行榜中受到挫折。这些在消除游戏中都很少出现,也可以忽略。

  • 难点流失。这是关卡类休闲游戏所特有的一种长期流失原因,往往会集中在少量的若干个关卡上。这种流失比较容易在数据上分辨,很突出的特征就是玩家在流失前长时间的卡在流失时所在的关卡上。一旦发现这种特征的比例过高,游戏应考虑是否要优化这些关卡的难度。

  • 通关流失。这也是消除类游戏比较独有的一种流失方式,即高端或大R玩家打穿了游戏当前版本的全部关卡,在等不及新关卡更新的前提下流失游戏。这是最容易识别的一种用户流失,在此不再多加赘述。

消除游戏的付费分析方法

这里笔者想先讲一个小故事。一个古代的欧洲小国家,当前对农民征税的比例是10%(即传统的什一税),某天缺钱了,国王将税率提升到20%,于是每年的税收提高了一辈。另一个国家原本税率是90%(好吧,假定这个国家富得流油,农民是活得下去的),然后国王将税率提升到了180%,你们猜会发生什么?很简单,老百姓造反了。

在游戏的付费分析中,笔者认为最重要的一个问题就是,要确定自己的游戏,在当前的品质和产品模式下,玩家可接受的付费水平到底是什么样的。如果玩家只能接受人均1元的付费水平,而运营者主观的想要把它拉升到3元,那么结果只能是逼急赶走你的玩家。在前面笔者指出,游戏数据分析的一个重要基础就是对于同类游戏真实数据的了解。与自己产品品类相似的游戏,一般的收费水平是什么样,能够达到的最高收费水平又是什么样?只有明确了这些问题,我们才能找到付费分析的标准。

消除游戏的付费和传统重度网游的付费有一个根本的差异点:如果传统网游有10个核心付费点,比如装备,武将,宝石,附魔等,则大R玩家几乎必然的要在每一个付费维度上付费,而他获得的收益 是各个维度收益之和。而在消除游戏中,绝大多数的消费点都在围绕着同一个目的展开:通关,更快的通关,通过更多的关。无论玩家买体力,买步数,抑或够买各种辅助功能道具,他们所起到的作用都只有一个,就是让某一个或若干个关卡从未通过变成通过(或者少数情况是从1~2星变成3星)。也就是说,玩家可以用其中的任何一个收费点去替代其他所有收费点的价值。因此的,在市面上主流的消除游戏中我们都可以看到非常类似的数据特征:

  • 排名第一的消费点是关卡结束时+5Move,这是最可控也最有把握能够获得想要收益(通过关卡)的收费点

  • 排名第二的消费点有两个选择,一是购买体力,一是开启章节,不过后者在近期的游戏里被越来越弱化,而且在越来越多的游戏中被取消。

  • 关卡内的辅助功能道具RMB购买比例严重偏低,在很多游戏被转移用于二级货币对应的消耗点。

基于如上的特征,笔者认为消除游戏的付费数据分析的重心会在于以下几个方面:

  • 宏观数据是否达标,付费比例,ARPU与市面成功产品的整体对比

  • 新付费点的挖掘和验证,例如近一年越来越多的消除游戏使用的限时特价礼包,在新增的养成类系统或其他玩法上的收费点等。

  • 基于关卡的付费收益分析。这是一个深度的分析,并不是说付费比例高的关卡一定是好的,付费比例低的关卡就一定是不好的。这部分笔者也会放在下面一起讨论。

基于关卡的数据分析

在笔者之前的一些文章中,已经多方面详细的探讨过在设计角度怎么样去评估一个关卡设计的好坏。在这里,笔者希望更多的从数据分析的角度去探讨如何评估一个关卡的好坏。

首先,笔者希望在此为大家澄清几个关卡数据分析的常见误区:

  • 误区一:流失率高的关卡一定是不好的关卡

诚然,我们当然不希望玩家在一个关卡里过度的流失,但是否一个游戏的各个关卡都要以流失率低作为其绝对的好坏判定标准呢?

在传统的网络游戏设计中,我们基本可以认为,任何会导致玩家挫折失败从而流失的点都一定是不好的,应该被修正的。这是因为传统的网络游戏并不倾向于在技巧上给与玩家挑战,也并不期望玩家通过改善游戏技巧来通过游戏挑战。技巧在大部分页游和手游的网络游戏中被无限弱化到近乎为0。然而,技巧却是消除类游戏的天然必须组成部分,与其连带的,失败造成的挫折感也是这类型游戏的必然组成部分。任何没有失败的休闲游戏都不可能让玩家长期沉迷下去。

难度和挑战,在某种程度上来讲是一种对玩家的两分抉择:一部分玩家经过努力或者运气通过这一挑战进行下一关(当然这部分应该是绝大多数),少部分玩家则选择了放弃。如果一款休闲游戏没有这种极具挑战的关卡,则它自身也失去了对玩家的吸引力。做一个简单的对比,《Flappy Bird》就是一款永远在失败中不断前行的游戏。

  • 误区二:付费率低的关卡一定是不好的关卡

当然,付费率高的关卡肯定是我们所期望看到的,但正如笔者在上一节中提到的用户两分抉择,每次面对付费抉择时,也有可能有一部分玩家选择了不付费而是流失。

在消除游戏的数据分析中,我们可以很容易的看到,付费率高的关卡往往也是难度高,用户流失率高的关卡。每一个这样的关卡到底是有效提高了收入,还是杀鸡取卵涸泽而渔,这是一个需要进行深入分析的问题。

与之对应的,付费率低的关卡本身并不会导致任何收入下降的后果,简单一点说,如果一条商业街都是你一家商户的产业,你在意购物者不在第三家店铺购物而是在第四家店铺购物么?如果你开的是一条美食街,难道你会指望食客一定要把每家店铺吃遍么?

  • 误区三:通过率过高的关卡一定是不好的关卡

通过率过高的关卡,尤其是在游戏的中后期,很容易被人视作设计欠缺,一方面是担心玩家觉得关卡缺乏挑战,另一方面则是担心玩家觉得关卡无法带给玩家乐趣,还有一个问题就是觉得无法有效的控制玩家生命周期。

这里笔者只想用一个词来解释这个问题,“节奏”。设想一下你在一家大型游乐场,刚刚从一个超级刺激的过山车上下来,你是想放松一下喝点水还是想马上一分钟后登上另一个更加刺激的游艺设备(比如玩个蹦极)?

任何一款消除游戏,或者我们放大到绝大多数的游戏乃至娱乐形式,都需要在节奏上做到张弛有度,就像《魔兽世界》的RAID副本也需要在中间穿插一些单调但不需要人神经高度紧张的小怪,甚至穿插一些剧情对白乃至恶搞。因此的,简单的对一个关卡做出好坏评价是很容易产生偏颇的。

那么,我们到底应该如何从数据分析上去判断一个关卡的好坏呢?笔者认为我们首先应该从逻辑上搞清楚几个核心指标之间的因果联系。

首先我们用一个简单的四象限来表示游戏难度和体验构成的四种关卡类型:

接下来,笔者根据自己的个人理解,分析一下四个象限的关卡类型分别会导致什么样的数据特征:

1444790235489558.png

根据上图,我们可以很直观的看到,游戏的难度和平均尝试次数是严格正相关的。游戏的付费率主要受到难度的影响,甚至可能会出现低体验关卡高付费率的情况。关卡的流失率则会同时受到难度和体验两个因素的影响。

结合上图,笔者给出一些简单的基于数据的分析建议:

  • 在难度相当的关卡中,流失率越低的关卡体验越好。也就是说,建议把关卡流失率和平均尝试次数结合在一起做二维分析,分析各个关卡在这两个数据之间的分布差异。

  • 在高难度关卡中横向比较付费率,建议选出难度相当的关卡,横向比较流失率和付费率。最好的办法是在样本集充分的情况下,比较难度相当的各个关卡中,相同流失率的关卡之间的付费率差异。付费率过低的关卡可能的原因是关卡的方差过大,玩家大部分尝试处于绝望状态(即便一两次消费也看不到过关的希望)。

  • 对于关卡的平均尝试次数分析方差分布,要特别注意玩家间方差过大的关卡(除非你的游戏中使用了跨关卡的动态难度因子)。

除了上面的基本数据外,笔者建议可以从以下数据角度切入,进行游戏关卡数据的深度分析:

  • FUUU值:提升关卡的用户体验和付费率

笔者最早学习到这个指标是在WOOGA的一位设计师在GDC2014年的演讲中提到的,之后《开心消消乐》的开发商也曾经在演讲中引用过这一理论。

FUUU值=玩家在单一关卡中失败总次数/失败次数中接近成功的次数

一个关卡的FUUU值越高,就意味着玩家近乎绝望的游戏次数比例越高,而FUUU值越低,玩家越会在游戏中体会到与他能力匹配的挑战以及这种挑战所带来的紧张感和刺激感。

当然,更直观的收益来自于,玩家FUUU值越低,他挑战中接近成功的次数越高,他付费的机会和可能性也就越高——这当然是游戏的开发和运营者所最期望的。

  • 玩家活跃度:跳过难度去探查背后的玩家体验

如果你是一个消除游戏玩家,同样是被一个难度很高的关卡卡住,一种情况是这是一个虽然很难但每次玩起来还是很爽的关卡,另一种情况则是一个让你每次打开它都要鼓足勇气只想着赶快结束这个噩梦,在这两种心态下,你的每日打开次数和挑战次数会有怎样的变化呢?

笔者会将这样一个指标作为对关卡体验的重要评估因素:玩家停留在此关卡期间平均每日的关卡挑战次数。这在大数据下是很可以说明一些问题的。

  • 玩家提前退出的比例:小伙伴不要一起玩耍了!

笔者建议在数据统计方式上,在玩家每次进入游戏,正常结束游戏,手动提前退出游戏时要各记录一条记录,无论挑战是成功或者失败。进入游戏数量和结束游戏数量之间的差异表明了一个现象:玩家中途强行退出了游戏。

排除掉一些系统级的因素,比如玩家手机没电或者系统出错强退(某些时候这种情况数据统计反而可能帮助开发者找到隐藏的Bug),大部分的情况是,玩家主动选择了强行退出这个关卡。无论是手动提前退出还是系统强行退出,尤其是后者,其数量越多,则表现出玩家对这个关卡更大的不认同甚至是愤怒。

  • 玩家的体力剩余:危险的流失信号

并不是说每次玩家在没有用光体力的时候退出都说明他将要流失这个游戏,接电话,现实生活中的任何事情,都可以使得玩家选择提前退出游戏,但是,如果某些关卡的玩家体力剩余频度明显高于其他关卡,这却是非常危险的:玩家卡在这个关卡并且明显的感到厌烦了!

这是一个从技术角度上比较难以清晰统计的数据,笔者建议采用一种间接的统计方法:在每次玩家进入游戏的日志条目中包含剩余体力数据,然后横向比较剩余体力数据的分布状态:剩余体力越集中在高位,就说明玩家在剩余体力越多的情况下放弃的比例越高。

文章评论
游戏葡萄订阅号