查看原文
其他

揭秘@爱可可:“寂寞呆子”成长记

阿司匹林 AI科技大本营 2018-07-20




从一个人的狂欢到一群人的狂欢,到除了我以外其他人的狂欢,我其实是越来越冷静了。——陈光



陈光算得上是地道的北邮人。从本科到博士,一直到留校任教,刚满 40 的陈光超过一半的时间都是在北邮度过的。


2010 年,陈光的女儿在北京出生,小名“可可”。同年,陈光注册了一个名叫@爱可可-爱生活的微博账号。


8 年后,@爱可可-爱生活已经变成拥有接近 34 万粉丝的大V,在人工智能领域算得上小有名气。毕竟,吴恩达的 Twitter 粉丝也才刚刚突破 30 万。


陈光说,自己就是一个 Nerd,一个技术“呆子”。然而,就是这样一个“呆子”,却成了微博大V。


@爱可可-爱生活成长记


2010 年 2 月,陈光发布了第一条微博,“做个准爸爸可真不易啊”,10 个月后,陈光发布了第二条微博,“谢谢,老婆”。


对陈光来说,@爱可可-爱生活这个微博一开始不过是为了记录生活。在开始的几年里,@爱可可-爱生活 记录的基本就是陈光的生活“流水账”。


直到 2014 年,陈光才开始重新定位,在微博上分享的学术资源逐渐多了起来。2015 年之后,机器学习的论文也慢慢多了起来。


当你觉得市场上所有产品都无法满足你某方面需求的时候,可能你的机会就来了。我的微博,最早就是想做符合我自己需要的推荐频道,这些年,其实我一直在打磨能真正“懂我自己”的推荐系统。


作为一名大学老师,看论文是必不可少的,论文的甄选是很耗时耗力也很考验“功底”的工作,而推荐系统一直是陈光最感兴趣的领域,可以说,@爱可可-爱生活 就是一个推荐系统,只不过这个系统的背后不是计算机,而是陈光。


多年来,陈光一直坚持早上 4、5 点起床发微博的习惯。他说,自己的“勤奋”都是被女儿“训练”出来的。毕竟,既要照顾三四岁的小朋友,又不误工作,就只能早睡早起了。因此,陈光每天发微博最频繁的时间都是在 5~7 点。


另外,也因为中国与美国之间十几个小时的时差,早上 4、5 点正好积累了国外一整天的消息,陈光刚好可以利用这个时间差,筛选出有价值的新闻和论文,通过微博进行分享。也正是因为这一点,反倒让陈光先人一步,毕竟不是所有人都能坚持 5 点起床。


如果没有特殊情况,陈光每天都要发几十条微博,其中大部分都是论文和技术文章,然而这么多内容,就连陈光自己也不可能一篇篇精读,但是为什么陈光依旧要发这么多内容?


我一直在倡导大家,一定要大量地泛读,哪怕你光看一个标题。有些东西实际上光看标题就足够了,尤其是新闻。技术性的东西,其实就是看角度,看思路,非常快速的。如果是你确实很感兴趣的,再去精读,一旦精读了就不要抱着泛读的心态。我们一直在倡导,包括我们自己的学生,一定不要在精读、泛读之间的层次上去徘徊,你要是精读的话一定要每字每句都能理解,都去思考。如果是泛读的话一定要快快地去掠过,别看的半懂不懂的,整篇看了,又好像整篇都没看,那个状态是最差的。


实际上,一直关注@爱可可-爱生活的人应该有注意到微博风格的变化:


最早的时候就是自己喜欢什么发什么,但逐渐的你会发现,大家的反应是不一样的,做微博就像在做一个社区,原来是你自娱自乐,但逐渐就成了一群人在欢乐,再往后可能就成了你要让大家欢乐,你会发现这种责任感会越来越强。


一开始我是一个对技术很着迷的人,因此主要就是和大家分享在技术领域自己觉得比较好的东西,逐渐的会形成自己的一些思考。其实原来思考很少,大家看到我现在会逐渐地写一些东西,有一些自己东西的思考。越来越多地,大家也想看到更多的有思想性的东西,现在我也更喜欢分享这些,这些我觉得更值得去讨论。


其实也是我越来越希望在技术之外去影响大家,尤其是学生朋友,包括思考的角度,选问题的角度,看待问题的角度。因为我发现,你要弥补技术上的缺陷或者漏洞,或者说不足,其实还是相对容易的,因为这些东西你都很好找,技术上的东西其实没有特别多需要探讨的,因为它就在那儿,它是一个客观的东西。反过来现在特别提倡元思考,问题背后的思考其实更重要。批判性思维是现在的年轻人最需要的。


▌如何评价 AI 媒体?


@爱可可-爱生活的粉丝除了学生、科研工作者之外,其实还有一个很特殊的群体,那就是 AI 媒体人。


和其他领域不太一样,AI 领域学术界和产业界的结合非常紧密,因此国内外的最新论文,大家都会第一时间报导。


因此,虽然@爱可可-爱生活分享的绝大部分都是技术文章或者论文,但是对于很多 AI 媒体人来说,不管是话题选择还是内容时效,@爱可可-爱生活都是一个非常好的消息源。


于是,很多人早上起来的第一件事就是刷@爱可可-爱生活的微博,找选题。


虽然国内外的 AI 媒体在近几年蓬勃发展,然而两者之间有仍然存在很大的差异。由于 AI 领域的论文大部分都是英文撰写的,因此国内的 AI 媒体经常做的一件事——翻译。


然而,陈光却对此并不赞同,“我觉得技术论文不但不应该全文翻译,连摘要都不应该翻译。”


如果他想做研究的话,看这个东西绝对是走了一条更长的路,看原文一定是最好。我的观点是,如果你做学问想绕开英文,你还是趁早转行,这个东西是绕不开的,不但要看,你将来还要自己写,如果你看都不想看,怎么写?所以我觉得从某种意义上来讲,把中文版的这些论文交给他们,其实是害了他们。


除此之外,在陈光看来,相比国外的媒体,国内的媒体更侧重于技术和论文本身的介绍,而缺乏对这种技术可能带来的影响的思考。


你看国外的报道,(以及)一些作者在博客上写的这些文章,都是很有思想性的文章,他一定是一个技术领域有广泛了解,但是没有那么深入,他是一个真正记者的存在。国内我感觉还没有找到哪一家媒体,不管是自媒体,还是大媒体。这些记者我感觉可能角色还没有到位,更多的还是纯媒体人,对技术感觉不够到位,只是英文的直译。


我觉得国内媒体对于最新的论文,应该从一个更广阔的视野去看,扩展性的东西应该是更重要的。技术突破本身很重要,但是这个突破能给我们的产业、生活带来的变化和更加深入的思考,我觉得这个可能更重要。


在陈光眼里,中国的 AI 媒体更多地扮演的是搬运工的角色,而且在标题党泛滥的情况下,媒体本身的职能并没有发挥出来。


AI 媒体非常重要的一个作用在于要让大家认清目前技术发展的真相,不仅仅是告诉大家这个能干了,那个能干了,这儿打败人了,那儿打败人了,而更重要的是告诉大家,AI 发展能给我们的未来带来些什么。


另外一个层面,我觉得(AI 媒体)有责任和义务去倡导一种正确的 AI 观,不仅仅是把这些华丽的好的东西,业界的发展告诉大家,另外也要告诉大家哪些是泡沫,哪些是炒作。


大家现在对人工智能的喜欢和恐惧,其实都来自于未知,因为你不知道它具体能发展什么样,所以你想象的好像它将来啥都能干。所以我觉得 AI 媒体的做强做大,是非常好的现象。但是反过来,我觉得大家冷静下来去考虑这件事,AI 媒体是有很大的责任和义务,它担负着让所有的大众对 AI 的发展前景有一个正确的认识的重大责任。


▌如何评价 AI 炒作?


从 AlphaGo 开始,很多公司和机构出于公关的需求,开始夸大 AI 的能力,而很多媒体也在知情或者不知情的情况下成为了帮凶。比如大家都知道的 ImageNet 图像分类挑战赛,每年的成绩都会创新高,这个比赛的评价标准其实是 Top-5 错误率,然而大部分的报道都非常容易造成误解。


Top-1 就是你预测的标签取最后概率向量里面最大的那一个作为预测结果,你的预测结果中概率最大的那个类必须是正确类别才算预测正确。而 Top-5 就是最后概率向量最大的前五名中出现了正确概率即为预测正确。


显然,两者有很大的不同。然而你很少会在标题甚至正文中看到“Top-5”的字眼。一位业内人士曾告诉AI科技大本营,在图像分类任务中,如果没有特别说明,其正确率或者错误率默认的都是“Top-5”,但是没有专业背景的普通读者如何去分辨?这算得上是一种变相的夸大。


夸大、炒作……这种现象已经屡见不鲜,而且有时候手法隐秘,陈光也深有感触。


比如说像翻译或者打游戏,动不动就说超过人,我们其实都很反对这种说法,离人还早着呢。像翻译,我们现在争议最大的就是怎么样来评价它是一个好的翻译?我们也看到 BLEU(Bilingual Evaluation Understudy) 指标很高的系统,真正拿出来翻译作品的时候,看起来其实挺费劲的。所以一旦脱离了技术本身去做比较,去做评判,或者做渲染的时候,那就是炒作了。


当然,目前争论最大的还是 AI 这个词本身是不是就包含了炒作的成分。机器学习大牛迈克尔·乔丹在今年初的 SysML 大会就曾表示,“我讨厌把机器学习称为 AI”,引发了学术界的大讨论。


作为学术界的一员,陈光对此也非常反感:


我们最开始的时候都是模式识别、机器学习,学术圈子的人原来很少说 AI,但是现在是不得已,你不说 AI 大家不知道你说的是啥,所以你必须要用通俗的语言跟大家交流,那就是要用 AI。


学术界的 AI 和大家现在所说的 AI 其实不是一回事,学术界的 AI 更多的是科普书里介绍的人工智能的发展历史。乔丹为什么说他不喜欢这个词?实际上大众认知里面的 AI 已经科幻化了,像原来人工智能电影里所说的 AI,它恨不得复制人脑的智能。它应该叫人工心智了,现在大家脑子里面的人工智能,远还没有发展到这个阶段。目前大家做的真正 AI 的应用,都是某种意义上的自动化。


现在的人工智能其实一大块都是智能增强,抛开智能增强以外就是自主控制,自主控制的东西其实非常少,包括我们现在说的打游戏,其实都还算不上自主控制,它只是一个特别窄的领域的机器学习算法。现在我们所说的炒作,是因为(这些炒作)让大家对通用智能有太多的幻想。



为什么会有这么多炒作?为了让投资人看到,让政府看到,以此来获得更多的支持。然而,很多时候一旦过热就很难收场。


现在一个共识是,为什么以前老是寒冬寒冬的?就是因为过热,因为你告诉大家你能实现什么样的东西,但是最后你又实现不了的时候,投资就撤了,紧接着就是真正做研究、真正搞学问的这些人得不到足够的支持,这时候它就下坡了。


▌如何评价 AI 教育?


陈光的身份不只是微博网红,还是北邮的一名老师。而就在昨天(7 月 19 日),北邮也宣布成立人工智能研究院。


为什么要用“也”?


2017 年 7 月,国务院发布《新一代人工智能发展规划》;今年4月,教育部发布《高等学校人工智能创新行动计划》。


在政策的支持下,仅在今年 5 月,南开大学、天津大学、南京大学、吉林大学四所高校就相继成立了人工智能学院。此外,哈尔滨工业大学和清华大学分别在今年 5 月和 6 月成立了人工智能研究院。


可以说,各大高校相继成立人工智能学院或者研究院已经成了最新的风潮,种蜂拥而上的现象真的好吗?


至少陈光认为这是一个必要的过程。


我觉得它是一个过程,还是有必要上的。我们看到国外高校也在开人工智能专业,但是到底什么样的专业真正能培养出好人才,其实全世界的人都不知道。从积极的角度来讲,人工智能这个领域,尤其在教育这个领域我觉得是值得去探索的。


其实我们研究院更多的想做和企业的对接,只有在应用环境下面才能接触到实际的问题,他(学生)才有实际的分析问题、解决问题的感觉。


在具体的教学形式上,陈光也在不断尝试。


大家逐渐会发现,这些(人工智能)课程的质量也参差不齐,而且也没有特别好的教材,都是从国外找一本书,就这么上。最终学生达到教育的效果可能就和他们自己看完这本书也差不多,只是老师可能理解得更深入一些。


现在网络上内容这么多,国外这些好的课这么多,我们到底还有没有必要讲?我们讲的又比不上人家,唯一的好处是我们讲的是中文。这时候我们怎么办?我们也一直在思考。现在有一句话叫你要和学生一起成长,要发自内心地和学生站在统一的战线上。网上这些资源有,我们一起看,它重点讲的东西我就不重点讲了,但是我知道有一些东西它没讲到,或者在它讲的之外的一些扩展、延伸性的内容,这种东西我们作为重点来讲,真正把现在所谓的翻转教学推行起来,而不仅仅是在形式上。大家下面去看网络教程,课上大家随意讨论,这不叫翻转课堂。


(编者注: 翻转课堂译自“Flipped Classroom”或“Inverted Classroom”,也可译为“颠倒课堂”,是指重新调整课堂内外的时间,将学习的决定权从教师转移给学生。)


在最近一年的时间里,陈光做了不少改变,包括怎样去贴近学生,怎样让学生保持上课的注意力,而不仅仅是对着 PPT 照本宣科。


我觉得有一句话很好,就是和学生共同的成长,就是怎么样的过程算是和学生共同成长?其实一直在体会这句话。


▌陈光的坚持


一天发几十条微博可能很容易,但是数年如一日,这就变成了一项艰巨的任务。一直有人怀疑,@爱可可-爱生活其实是一个团队,但是陈光告诉AI科技大本营,一直就是他一个人。


而让陈光坚持下来的一个重要原因,却是奇虎 360 的创始人——周鸿祎。


2014 年的时候,周鸿祎是第一个关注@爱可可-爱生活的大V,当时的陈光还是一个“小草根”,并没有什么名气。周鸿祎给陈光发了封私信,建议陈光在微博中加上一些中文介绍,并告诉他怎样跟粉丝走的更近一些。


那个时候陈光发的东西并没有什么人看,纯属自娱自乐,周鸿祎的关注让陈光信心倍增。虽然两人至今未在现实世界中碰过面,但是周鸿祎对陈光的承认却是他坚持下来的重要原因。


从 2014 年到现在,我基本上没有间断,每天都会去发。逐渐你会有一种责任感。一开始是觉得今天不发点儿什么,好像少干了一件事,但逐渐的好像觉得如果不发的话,好像很多人还希望能看到一些东西,你应该发一些东西让他们能看见。


这四年不仅仅是在给大家发东西,我自己也在看东西,反过来对我也有挺大的促进,它也会帮助我改进注意力,帮助我改进对于问题思考的方向。


除了周鸿祎之外,没有商业化的纯粹也是陈光能走到现在的重要因素。


我当初没做商业化运作还是对的。如果我把微博这个当一个创业项目来做,现在估计就黄了,我可能坚持不下去了,就是因为我一直自己一个人在做,所以才能做到今天。


一旦你有商业目标,一旦你有考核指标,你肯定不能坚持你原来的想法,我觉得我现在最大的一个优势,也是最大一个劣势,就是没有什么想法,完全可以自由自在地去做,就是坚持做我自己觉得好的事。


我的导师说的一句话,我一直都记在心里,做事情,尤其是做学问,一定要耐得住寂寞,在背后默默坚持,你如果是为了出名,为了让大家知道而让大家知道的话,你做的事一定不是出自本心的。


如果有一天我停止做这件事,那一定是因为我已经不是我自己了,我不希望做那样的事。


浮夸当道,衷心希望这个 Nerd 保持本心,不负“呆子”之名。



——【完】——


在线公开课NLP专场

精彩继续


时间:7月26日 20:00-21:00

扫描海报二维码,免费报名

添加微信csdnai,备注:公开课,加入课程交流群


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存