都2022年了,为什么二次元还在炸服?

文/ 修理 2022-06-25 12:11:41

6月23日,《七星传》在海外上线了,对,就是那款娘化乾隆的二次元卡牌游戏。

1656303114186308.png

但可惜的是,游戏当天也和绝大部分二次元游戏一样——炸服了。你可以想象评论区里的玩家,是有多么的焦灼。

1656303114423571.png

法儒你在干什么啊!

毕竟游戏的卖点非常“显眼”。

1656303115451242.png

炸服之后,官方昨日凌晨发布了一条关于游戏维护补偿的公告,其中提到了服务器问题已经得到修复,但游戏包体存在一个关键性的程序错误,需要一段时间进行排查。目前游戏的开服时间未定。

1656303115552333.png

同时,团队向炸服当天「装死」的举动做出了说明。对于那些已经充值的玩家,游戏也将进行全额退款。

1656303115627000.png

而大家“喜闻乐见”的赔偿环节也没有缺席:110抽+养成素材+体力资源,如果算上预约和开服奖励,那么意味着玩家可以在进入游戏后累计获得220抽。

1656303115210276.png

这不禁让人联想到此前二次元游戏那些“著名”的炸服案例:开服误送10000黑卡,但最终起死回生的《战双帕弥什》;炸服赔偿120抽,数据一路下滑至停运的《山海镜花》;炸服数天,结果无力兑现原有赔偿承诺的《终焉誓约》。

1656303115908591.png

就连腾讯网易这样的一线大厂,也曾在上线当天出现过炸服事故,比如说《英雄联盟手游》(TapTap渠道)《明日之后》《忘川风华录》等等。

而在如今,上线当天炸服已经算是“见怪不怪”的日常体验了,不少玩家甚至都能把赔偿公告的行文套路给背诵下来了。但不管后续团队的补救措施如何到位,炸服在绝大部分情况下,对于产品来说都是弊大于利的。

葡萄君想一定会有人好奇,为什么都2022年了,怎么还有游戏会在上线当天炸服,之前那些事故案例难道一点警示作用都没有吗。还是说,这里面有什么无法规避的技术难题?

其实在2020年,天美J3工作室《使命召唤手游》的服务器主程Jerry曾分享过四个炸服的原因:服务器架构设计不到位、平行扩容能力欠佳、负载均衡能力欠缺、单点容灾问题。详细的技术解答,大家可以看这篇分享,这里不多赘述了。

1656303115196547.png

因为今天我想讨论的话题不是「如何减少炸服出现的情况」,而是为什么在有这么多技术积累、经验教训的情况下,炸服事故还是屡现不止?这里就说说葡萄君所了解到的几点原因,权当抛转引玉了,欢迎大家在评论区留言讨论。

1.炸服是个归因非常复杂的事情。

很多人一听炸服就自然联想到是因为盆子小了,水太多了,所以导致溢出。但实际上游戏服务器就像一个由十几段输水管组成的通道,每一个小段、分支都有自己的最大容量瓶颈,系统工程、服务架构、后台数据库、前端云服务......任何一个地方出了问题,都有可能导致炸服。

所以炸服并不是一个可以单一归因,「水多加盆」就能解决的简单问题,而是一个需要逐一排查各个环节,综合判断的疑难杂症。它有可能是进程逻辑出了问题,也可能是架构性能跟不上,这和服务器容量大小没有直接联系。

2.技术资源不够。

某个二次元项目负责人告诉我,现在团队基本都会选用云服务器,随时可以增减数量或升级配置,不像过去要买一大堆成本很高的物理服务器。物理服务器一般情况下,只有在内网开发时才会使用。所以如今不管大厂小厂,炸服基本都可以归为技术问题。

但正如我刚刚所说,炸服是个复杂的技术问题,就算是拥有大量技术专家的大厂项目,同样也无法100%规避这个问题。而对于二次元中小团队来说,美术、玩法、内容包装等需求在多数情况下,是要胜过技术需求的。不少小团队可能就一个后端人员,还不是一线水平的那种,一些临时突发的技术状况,可能之前压根就没见过,更不用说如何快速处理了。

甚至于部分二次元游戏其实在测试阶段就出现过类似的炸服问题,但缝缝补补之后,正式上线时该炸还是要炸,依然无法快速定位问题。所以猎头也曾向葡萄君透露过,如今不少拿到大厂投资的新锐二次元团队,都在高薪招后端,以提升团队的技术能力。

3.服务器成本。

虽说云服务器便宜方便,但一些有资源的大项目也还是会使用物理服务器,自建机房。因为这样对用户数据的控制能力更强,对云服务商和网络环境也没有那么依赖。同时考虑到云服务器各种配置升级的价格(如高防),运维的人力成本等等,这一块的成本还没到可以完全忽视的程度。

根据某大厂后端主程的说法,就算是大厂也不会准备超出压力测试数据太多的服务器,发行的量如果预估是10台服务器,那怎么都不可能买到100台。所以一旦瞬时登陆人数远远超出预期,那短时间的炸服也是无法避免的,就算修复扩容也会需要一段时间。那为什么玩家人数总是会超出团队预期?真的是游戏太火爆了吗?不一定,也可能是另外一个原因:

4.黑客攻击。

因为ACCN组织的高调行事风格,不少人应该都比较熟悉DDoS攻击了(模仿真实用户,向服务器发送海量访问请求,使得服务器瘫痪)。由于这种攻击的成本,远远低于服务器架高防的成本(像腾讯云、阿里云这种主流云服务器的高防价格,基本都是几十万一年),所以对于小团队来说,除非有外援,否则很难与之对抗。

而大厂虽然有钱架高防,但在攻防双方同等成本消耗的情况下,高防也不一定100%能挡得住。并且由于大厂产品牵扯的利益链条更多,潜在的攻击方也会更多,并且不会是ACCN这种专门勒索小团队的小组织,而是攻击力度和隐蔽程度更强的专业团队了。

5.第三方服务不可控。

最后,如果不是自研自发,拥有自有渠道的大厂,多数游戏上线时不可避免要接入一些第三方系统。其中可能包括给运营、客服使用的业务受理模块,以及在线广告、支付等第三方系统。而这些系统,对于研发团队来说基本上是不可控的。

比如说产品的访问量不可控,客服调用的频次不可控,如果用业务受理系统做Web页面的互动,团队也无法得知它的量级会有多少。并且第三方系统的协议还有可能跟产品的协议不兼容,团队在访问权限上也可能会被限制。那一旦第三方系统出现了问题,团队自己能做的事情非常有限。

6.特殊原因。

而除了以上比较常见的5点外,导致炸服不可避免的原因还有一些极为特殊但你确实没办法100%规避的情况:比如说机房起火、断电、水灾等现实物理层面的问题,或者内部人员因为各种原因的故意报复,甚至说极少数的营销团队为了制造营销话题,拔高游戏热度,还会故意炸服。

当然,以上也只是个人观察所得,不一定是炸服事故的全貌,也还有很多地方没有聊透,比如说大厂为什么也会出现炸服技术问题?云服务器相比物理服务器的劣势是什么?那些没钱的小团队是如何做到不炸服的?诸如此类的问题,也欢迎大家在评论区讨论补充~