收录于话题
#Java面试那些事儿
422个内容
大家好,我是D哥
点击关注下方公众号,Java面试资料 都在这里
Please wait forever to playReddit、Steam、HackerNews上,无数玩家吐槽抱怨……终于,一个黑客大哥实在忍不了,用逆编译器逐条查看运行情况,终于找到原因。原来,R星(游戏开发商RockStar)写的代码太低效,加载时,一个if语句竟然循环了19.8亿次….
幕后黑手:谁占用大量时间?
Reddit相关板块发起的调查中,超过80%的玩家,都要等3分钟以上,有的甚至超过15分钟。而且,从7年前Online上线到今天,这个情况丝毫没有改善。
但奇怪的是,如果你选择是故事模式(单机版),加载就会快很多,感觉甚至像两个不同的工作室开发的游戏。
CPU,是老而弥坚的AMD FX-8350,2012年上市,采用“推土机”架构,超频潜力惊人。这样今天看起来老旧的配置,打开单机版GTA 5需要1分10秒,而加载联机版则6分钟起。黑客大哥用了最简单的Windows任务管理器,来判断联机版GTA 5在启动时,都调用了哪些计算机资源。
在1分钟的时间分界线上,之前是加载的是单机和联机版通用的基础内容,之后是联机版独有的内容。可以看到,联机版GTA 5,加载时调用大量CPU资源至少长达4分钟之久。而同时,内存、GPU、硬盘的使用情况几乎没有明显变化。
“R星代码写太烂!”
为了找出到底那一部分程序卡住了CPU,他使用了工具Luke Stackwalker,对CPU任务堆栈进行采样分析。Luke Stackwalker对于闭源应用程序,可以转存正在运行的进程堆栈,和当前指令指针的位置,以一定时间间隔建立一个调用树。
于是他使用专业的代码拆解工具,给GTA 5来了一个“开膛破肚”。沿着调用栈往下走,发现问题出在一个sscanf函数上。
sscanf的功能是读取格式化的字符串中的数据,而在GTA 5中,它正在读取的是一个10M左右,有63000多个条目的JSON文件。这个文件到底是干什么用的?黑客大哥推测,这可能是游戏内购商店的相关内容。
在具体运行时,sscanf对于每个有效值,逐个读取每一个字符,然后返回结果,之后指针移向下一个值,循环往复……直到把10M文件全部扫一遍。再看第二个问题,这是一个存储命令,对象是item,具体是什么不得而知。但是保存前,有一个if语句,逐一比较item内项目的哈希值,检查它们是否出现在某一列表中。按照他的计算,这一步if,要执行(63000^2+63000)/2 = 1984531500次!没错,等待加载前的十多分钟里,GTA 5用你的CPU,执行了19.8亿次if命令。既然对象有唯一哈希值,那为什么不用hash map???
(hashmap根据hashCode值存储数据,大多数情况下可以直接定位到它的值,因而具有很快的访问速度,但遍历顺序不确定。)
问题解决,加载时间节省70%
至于第一个问题,黑客大哥采用hook大法,不一一读取字符串,而是:hook strlen
“缓存 “字符串起始和当前长度。
如果在字符串范围内函数在此被调用,返回缓存的值
至于if语句问题,就更直接了——完全跳过重复检查,利用hash map插入项目,因为这些值是唯一的。
现在,GTA 5联机版加载,从原来的6分钟,下降到现在的1分50秒!而且,用的还是七八年前的硬件配置。这位黑客大哥在博文中没有留下任何身份信息,也没有透露用的反编译工具,但是做好事不留名的他,把打好包的工具上传到了Github,玩家通过一行代码就能下载:git clone —recurse-submodules https://github.com/tostercx/GTAO_Booster_PoC
博客原文
https://nee.lv/2021/02/28/How-I-cut-GTA-Online-loading-times-by-70/Github地址:
https://github.com/tostercx/GTAO_Booster_PoC
技术交流群
有不少同学问D哥,大厂面试官到底喜欢问什么?想进大厂镀金。因此,D哥特意邀请了华为、腾讯、阿里的朋友进群,与大家一起交流经验,增长技术。
有兴趣入群的同学,可长按扫描下方二维码,一定要备注:城市+昵称+技术方向,根据格式备注,可更快被通过且邀请进群。
▲长按扫描