工作中犯的最大的错误?网友:我把女友变成了前女友算吗?
欢迎大家点击左下角“阅读原文”到原帖与作者交流讨论哦!
大概不论在哪里,做码工,pay attention to details都是必须要有的能力,这其中的一个代表场景就是代码质量高无明显bug
但人总会犯错,即便系统做的很robust。最近HBO Max的一个intern大概config改错了,一个集成测试的notification 邮件发给了所有用户,这个错误本身impact已经足够升VP了,现在网上大家都在讨论HBO Max,很好的宣传。
话说回来,不是所有错误都能帮你升VP的,你在工作中制造的最大的错误有多厉害,最后是如何处理善后的?
楼主抛砖引玉:
在AWS一个组,new grad期间一段代码没有写异常处理导致异常层层populate到了表示层,结果就是在某种情况下某种型号的EC2频繁重启。当新的代码部署到新的region后,产生了20个sev2,因为代码部署当时不是通过内部的pipeline CD过去,求助更有经验的工程师,在他的帮助下production环境手动revert了部署的代码。我当时很自责,给队友(尤其是当值oncall)道了歉,当时遇到了比较好的队友和经理大家都是安慰为主。当然我知道因为失误导致COE然后被pip的案例(推测被pip,这个人刚来了7个月,当时一个非常大的COE)。
热评
有人问:
楼主没被PIP?
楼主回答:
低情商:review的锅,集成测试太难跑了
高情商:我麻讲究ownership,这次全是我的锅
言归正传,当时的情况是跟随的feature不会trigger这个exception,codebase被好几个sister team瓜分,不太方便在一起集成测试,有时候一个小修改不会绕一大圈,流程上肯定有改进的地方。组里的Sr后来这么跟我说的,“我不会相信一个从没有制造过sev2的engineer”。在这个incident之后,做了个story改进了集成测试的运行环境
是否应该pip,感觉还是看锅的大小
@arthes:
同亚麻 组内有个同事曾经不小心把prod stack当test stack给删了,包括数据库... 不过还好有备份几个小时后就恢复过来了。两年过去了,现在这个同事还在我们组,而且因为资历比较老已经当tech lead了...
补充一个我自己的。刚开始oncall时有一天晚上睡太香了,半夜sev2没听见。快天亮时迷迷糊糊看到手机一排消息直接吓醒,赶紧掏出电脑发现director在ticket里回复了。原来我的manager和skip也都没听见,escalate了三层
@umbg :
我当时的女票新入职不久,犯了一个错把内部debug的print代码deploy到production了,打印出不少内部敏感信息,客户看得到但是他们不应该看得到。她一时手足无措热锅上的蚂蚁,疯狂给我打电话寻求帮助和安慰。而我在打游戏挂断了她的好几个夺命连环call。。。最后她成了我前女友
有人说:
谁都会犯错,尤其是对系统不熟悉的新人。关键还是有出色的回滚系统可以及时回滚binary。我当新人的时候有一次搞坏生产系统,就是因为不知道同一个binary里的有些调用是通过rpc的,所以部署时候的异步就造成了大量rpc fail,用户端白屏。还好binary回滚做的快。
@韦小崽 :
这不是最大的错误不过应该是最印象深的错误了。我干过和这个intern类似的事儿。搞一个smtp server结果给隔壁dept所有人发了测试邮件。
还好没人鸟我,或者来投诉啥的。倒是那个dept一个和我熟的小哥哥私下跑来跟我开玩笑
大家还爱看
大家如果还有相关的问题和看法,欢迎点击“阅读原文”到一亩三分地讨论
源于一亩三分地,版权归原作者所有
本文禁止任何形式的转载,请与一亩三分地联系
欢迎小伙伴们爆料提供新闻线索发送到:1point3acres.ops.1@gmail.com,会加米哟
生活|投资|职场|留学
与百万华人一同关注我们4个公众号!
别错过北美最新热点和干货!
商业合作:1point3acres.com/contact
百万级月活,品牌精准投放