查看原文
其他

从字节跳动实习生误删事件引发的对模型思维的思考

小电 博文视点Broadview 2022-06-02

👆点击“博文视点Broadview,获取更多书

前段时间,互联网圈最劲爆的一个料,莫过于脉脉用户在社交媒体上发布信息称字节跳动一名实习生删除了公司所有 lite 模型,“实习生直接 delete 父目录,还加了 skip trash”。


随即有称该公司员工的网友表示自己加班到凌晨来处理此次事故。后续,微博上#字节跳动实习生删库##网传字节跳动实习生删库跑路#等话题登上了热搜榜。同时在知乎上也得到了网友们的热议。



针对本次事件的反生,我们收集了一些热议的问题,采访了近日登陆京东、当当计算机新书TOP榜的《模型思维:简化世界的人工智能模型》作者中国科学院计算技术研究所博士、博士生导师龚才春教授对相关问题进行专业性解答。


之所以邀请龚老师作为本期大咖说的嘉宾,是因为龚老师不仅拥有较高的学术水平,也曾担任过大街网的首席科学家和阿里巴巴的搜索研发专家,在大厂拥有丰富的开发经验,而且在拜读了龚老师新书后,感受到了龚老师强大的表达能力,他能用非常有趣的语言来阐述高深的人工智能知识,所以对于该事件所引发的问题进行解答是再合适不过的了。




本期大咖
龚才春
中国科学院计算技术研究所博士、博士生导师曾任北京市计算中心互联网重点实验室副主任,主持规划和设计北京市超级计算中心;曾任淘宝网搜索研发专家,负责淘宝电子商务专用词典的建设、淘宝买家评论的情感分析;曾任新浪微博大数据技术专家,负责微博的文本内容挖掘;曾任大街网首席科学家,负责大街网的搜索业务,规划大街网的大数据业务。


(网传“内部截图”)

读者

问:龚老师,您好!您觉得这次事件的发生到底是因为技术不过硬,还是管理不到位?

龚才春


大家都觉得字节跳动作为国内一流的互联网公司,技术应该是国内一流的。一个实习生怎么能够轻松地把模型库给删了,产生这种bug与公司名气也太不成正比了吧?


我想说的是,技术不是万能的,越高深的技术,越容易在堡垒内出现问题。固若金汤的特洛伊城,最后也就是因为一个木马而崩溃。技术可以防止纸币造假,却不能防止无赖吃饭不给钱。


所以,我们现实场景中遇到的很多问题,不仅仅是技术上的问题,更多可能还是管理上的问题。



读者

问:事件发生后,大家对这位实习生的前景十分担心,各种传闻铺天盖地。就您作为旁观者而言实习生犯错,到底应该由谁来承担责任?

龚才春


答:作为互联网大厂格局还是有的,应该不会出现把责任推给临时工的闹剧,虽然在这里,当事人的的确确是如假包换的“临时工”。把责任全部推给一个实习生,对公司、对产品线都于事无补。


所以这里需要承担的责任,首先是实习生的直接领导,然后就是it管理部门。在大团队作战的互联网团队,任何一个人可以删除他人的文件,这都是管理上有问题的,不管删除文件的人是不是实习生,哪怕是文件owner的领导也不可以。



读者

问:传言事件中管理员对实习生设置了子目录没有写权限,父目录却有写权限,这是怎么回事?这种情况在技术上可以避免吗?

龚才春


答:这是个很好的问题,直击本次事件的要害。一般来说,建立某个子目录的时候,子目录会继承父目录的权限。既然这样,父目录有写权限,子目录就不该出现不能写的问题。可能是由于某些特定的原因,管理员剥夺了实习生对子目录的写权限,却忘了剥夺其父目录的写权限。于是就出现了实习生不能删除子目录,却可以轻松删除父目录的事件。


从道理上讲,既然已经去掉了某个用户对于子目录的写权限,就应该递归地去掉该用户对父目录的写权限,否则,从逻辑上来说就是讲不通的,这会引发权限管理混乱的问题。


实际在设计文件系统的时候,这种最符合逻辑的方法,现实生活中却不一定被采纳,最主要的原因还是成本。某一个用户对某一个目录的访问权限变化时,如果递归的修改所有父目录的访问权限,所消耗的时间会与当前目录的深度有关。当然,更可怕的是,如果增加了某个目录的权限,然后递归地增加所有子目录的权限,这个运算量非常庞大,这在大多数情况下是没有必要的。



读者

问:这次事件引发了一个更深层次的思考,我们真的需要用技术来解决一切问题吗?

龚才春


答:子目录没有写权限,却可以删除父目录,在现实生活中有没有类似的bug?


有,太多了。我们给窗户安上了护栏,防止了大家从窗户跳楼,却没法避免大家到楼顶跳楼


我们防止了捣蛋鬼在家里放火,捣蛋鬼不能把家烧了,却可以到楼梯口放火把整个楼都烧了。


我们在技术上给汽车设计了刹车,却不能在技术上避免有人驾车踩油门冲向行人。


我们通过权限管理,可以避免捣蛋鬼把重要文件删除,却没有技术手段防止捣蛋鬼用锤子把硬盘砸碎。


根据最大熵原理,世界是趋于混乱的,让世界混乱几乎毫不费力,让世界变得井然有序却需要付出巨大代价。我们可以轻易把一个鸡蛋敲碎,却很难把敲碎的鸡蛋复原。镜子总是轻易破碎,破镜重圆却只是我们的愿望;把猪肉做成美味的火腿肠,是司空见惯的事儿,把火腿肠变出活猪来却鲜有耳闻。我们删除一个文件很轻松,生成这些轻量级模型却需要几百人没日没夜地工作好几个月


让世界不那么乱的力量,就是需要我们不断研发新的技术手段,以维持世界正常运转的管理。

(每个程序员都懂)




大咖好书



《模型思维:简化世界的人工智能模型》
作者:龚才春



本书将人工智能在现实生活场景中解决的问题分类,并根据这个分类来介绍各种人工智能模型。书中将人工智能问题分为权重问题、状态问题、序列问题、表示问题、相似问题和分类问题六大类,方便读者了解各个模型之间的关系,也方便读者理解各个模型的适用场景。


本书不仅适合希望学习和运用人工智能模型到具体应用场景的企业工程师、科研院所的学生和科研人员,也适合对人工智能模型感兴趣的读者,使其将模型思维应用到生活中。





扫码购书


京东满100减50快快扫码抢购吧!



如果喜欢本文
欢迎 在看留言分享至朋友圈 三连


 热文推荐  





▼点击阅读原文,查看本书详情~

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存