查看原文
其他

十年前,第一个看中AI的中国人

龚正 真故研究室 2024-02-26
撰文 | 龚   正
编辑 | 马   路

2012年,美国滑雪胜地太浩湖的赌场酒店里,举行了一场秘密竞拍。

竞拍标的是一家名为DNNresearch的“三无公司”,唯一资产是创始人杰弗里·辛顿(Geoffrey Hinton)教授和他的两名学生。起拍价1200万美元。

四家公司参与竞拍,包括谷歌、微软和DeepMind(发明AlphaGo的公司)。最终,报价“狂飙”到4400万美元,一位来自中国公司的高管频频举牌,而他的背后,是百度的创始人李彦宏。

这是一场遗憾的交锋,也被称为是“一场全球新的军备竞赛的开始”。


#01

视界

最先发出邀约的百度,没有赢得辛顿。

辛顿教授最终选择去谷歌。他顾虑的因素很多。比如他腰椎间盘突出,不能长时间坐飞机,卖身百度,往返中美是个问题。谷歌有太多他的朋友、学生,他割舍不下。

当然,对这种“不讲武德”的行为,世人宁愿相信,在做出选择那一刻,辛顿相信了玄学——酒店窗外,两架飞机恰好从相反方向对飞,画出了一个大大的“X”。

坐镇北京的李彦宏一定五味杂陈。这场竞拍的初因,原本就是来自于李彦宏的橄榄枝。

出生于1947年的辛顿教授将“神经网络”视为毕生研究的方向,2012年,辛顿和两名研究生Alex Krizhevsky和llya Sutskever实现了一次历史性的突破:

他们通过分析数百万张照片、打造出了一款可区分动物、物体图片的“神经网络系统”。当时谷歌这样的大公司也在从事相关研究。不过在一场图像识别大赛中,他们成功将错误率从25%以上降低到15%,获得第一名。而谷歌的识别精度差了很多。三人一战成名。

图 | 辛顿教授

彼时的公众可能不明白这套系统对他们的生活意味着什么。如今,这套系统带来的改变早已潜移默化成一种日常——人们用识图软件来识别不认识的植物、动物,翻译外文,服务自动驾驶,AI诊疗等等。这是“深度学习”的概念首次进入行业视野。

百度第一个意识到了这件事的重要性,火速向辛顿发出邀约,希望用1200万美元招募他与两名学生入职。当然,因为谷歌和微软的紧随其后,辛顿决定以成立公司DNNresearch、并发起竞拍的方式,决定自己和深度学习成果的未来去向。

辛顿因其在神经网络方面的开创性工作,于2018年获得计算机领域的最高荣誉“图灵奖”。两名学生之一的llya Sutskever,后来成为人工智能研究公司OpenAI的首席科学家。

图 |

OpenAI的首席科学家 llya Sutskever

日后看来,这次错过在一定程度上刺激了李彦宏,加深了他对深度学习重要性的意识。

李彦宏关注到辛顿不算巧合。他本身就和辛顿教授的所学所研究领域“同源”。

1991年,从山西阳泉来的李彦宏考取北京大学信息管理专业,毕业后随即前往美国布法罗纽约州立大学攻读计算机科学硕士学位。在美留学及工作8年,李彦宏逐渐把自己升级成一位华人世界里顶级的自然语言处理专家

2000年,李彦宏拿着其超链分析专利回国,在北大资源宾馆的两间房里,成立了如今全球最大的中文搜索引擎百度。

如今看,从做搜索引擎的第一天起,李彦宏做的就是人工智能的事——这需要机器真正地理解人的意图,并且做出相应的回应。

深度学习与自然语言处理通常被认为是人工智能旗下两个相互关联的领域。简单来说,自然语言处理是机器学习的一个应用,而机器学习是深度学习的一个应用。这种关联,构成李彦宏对辛顿研究领域的一种天然的敏锐。

在这场秘密竞拍的前两年(2010年),百度开始布局AI。这一年,深度学习在学术和应用层面都有相应突破,百度也开始使用机器学习重新调整百度的搜索算法。为此,百度于这一年成立了全球研究院。

在技术层面之外,李彦宏内心还埋藏着一个多年夙愿——实现计算机领域的“中国梦”。

这份初心来自1992年李彦宏刚赴美留学时所受的一份委屈。当时,李彦宏得知学校计算机图形学专业的一位教授想招一个助理,于是去面试。教授问了他一些关于计算机、计算机图形学的问题,李彦宏回答得不好。最后教授问他:“Do you have computers in China?”(你在中国有电脑吗)。

这份带着轻蔑的怀疑让李彦宏很受伤。李彦宏从此将壮大中国计算机产业的梦种下,这也构成他日后回国的驱动力。

2005年,百度在美国纳斯达克上市,成为当时最引人瞩目的公司之一。当初的“中国梦”已经完成了一部分。但计算机和互联网的世界没有终点。

2012年10月,一位AI专家向李彦宏演示了基于深度学习的AI技术对于搜索的改进,搜索排序的质量得到显著提升。人工智能可以解决搜索的全部问题——李彦宏当即写了一封邮件,鼓励全百度的产品经理去了解AI技术的最新趋势。

2个月后,太浩湖秘密竞拍召开。

虽然竞拍的结果并没有按照李彦宏设想的剧本走,竞拍后不到一个月,李彦宏宣布成立了百度深度学习研究院。

这是中国第一个把深度学习提到核心技术创新地位的公司。李彦宏亲自出任院长。相较于2010年正式打出all in AI,对李彦宏而言,2013年是真正开始将规划落实到实践之中的一年。

2014年,李彦宏又相继成立大数据实验室、硅谷人工智能实验室。后来深度学习研究院改为深度学习实验室,并成立了百度研究院,由该院统括前三个实验室。并将美国的办公地址选在加州,紧邻亚马逊、谷歌、微软等公司,和辛顿教授隔得不远。

这意味着李彦宏的AI布局一开始就是立于全球的。日前,李彦宏在接受英国《经济学人》专访时说,“我知道AI的推出对百度而言是一种范式革命。”


#02

长跑

辛顿虽然被后来者尊为“深度学习之父”,也曾走了一段长长的泥泞之路。

在剑桥大学期间,辛顿最初攻读的是生理学和物理学,期间转哲学,最后拿的是心理学学士学位。他在人工智能方面的造诣,则是在爱丁堡大学积累的。但当时,他数学极差,且人工智能在该校完全是一个冷门专业。当时几乎没人相信神经网络,导师劝他收手放弃。

2012年那场举世瞩目的秘密竞拍到来之前,辛顿坐了近半个世纪的冷板凳。

某种程度上,李彦宏错过了辛顿,却继承了辛顿出名前的坎坷。虽然早已被戴上“中国AI教父”王冠,但从2010年宣布百度all in AI至今,李彦宏仍需面对AI带来的巨大挑战。

图 | 李彦宏

早在当年业务转向AI之际,外界便质疑百度是因错失了移动互联网时代,所以才想出了一个有关AI的新故事。用故事画饼,简单、直接、有效。

然后是外界坐等看AI的好戏。事实也证明,这不是一个花一点儿钱和一点儿时间,就能收获成百上千倍回报的行业。时至今日,仍然可以听到百度AI是大饼变大坑的说法。

对于这些质疑,李彦宏倒是看得通透。多年前他的一句话,一直被外界解读为是他思维范式的定海神针:最前沿的技术浪潮是等不来的,必须提前10年、20年去布局。

这意味着,要做这件事必须要有定力。它不会被喜欢赚快钱的资本和创业者喜爱。

李彦宏在AI上投入的定力,若寻根问底,应来自于他的创业经验总结。

百度刚创业时面临的种种未知,李彦宏都以一枚硬币的两面来面对。一面是勇于尝试,不固步自封;一面是保持专注,不朝思暮想。

2001年百度刚成立一年时,李彦宏做业务转型,将百度从网站背后的技术服务商,转型为面向终端网民的搜索引擎。这意味着新生的公司将失去来自老客户的稳定收入。但李彦宏认为改变是方向,为此还跟投资人发了脾气,坚持要转型。

转型成功后,百度成为真正的独立个体,不再躲在幕后。这时,李彦宏又强调专注。2001年后,门户网站、游戏行业等相继走红,但李彦宏不为所动,坚持就把搜索这一件事做好、做专、做精。

对于AI,他也是如此,但他觉得AI是方向,值得一试。他也知道AI的投入需以10年计,小投入根本不可能产生技术的转化与普惠。

深知这一点的李彦宏,选择了在外界看起来的“孤注一掷”。因为“爱”,他倒进“AI”的真金白银,10年间数以千亿计,甚至一度拉低了百度的利润。

百度披露,近十年百度在AI方面累计研发投入超过 1462亿元。2022 年百度核心研发费用 214.16 亿元,占百度核心收入比例达到 22.4%。

全国工商联的《2022中国民营企业500强调研分析报告》中,百度高于腾讯、阿里等其他所有民企,排名中国民营企业研发强度第一。这些钱全部都投进深度学习、对话式人工智能操作系统、自动驾驶、AI芯片等前沿领域的研究。

如果只是自己乐也就算了,从李彦宏过去10年的做法来看,他还显得“轴”。他成为国内最早的AI布道者之一,不但说得多、做得也很满。

这也是来自于他对AI的一个判断——不做“孤独英雄”,“开放会让所有人获得更多”。

据统计,在AI大潮袭来的2016年,李彦宏在公开场合提到“人工智能”“AI”500多次。安利的对象从政府官员到企业老板、普通公众。

作为全国政协委员,李彦宏在连续8年的“两会”中,提出了13份AI相关提案。2017-2019这三年,李彦宏共发布40次演讲,共计15万字,次次都涉及AI,这构筑起李彦宏的“AI简史”。

在这10年,李彦宏还为百度打造了一套AI时代的四层框架架构——实现芯片、框架、模型、应用全栈布局。

他的商业逻辑是,全栈布局可以实现端到端的优化,大幅提升效率,实现高效协同与降低成本。至此,百度也成为全球唯一全栈布局四层架构的公司。

熬得过万丈孤独,藏得下星辰大海。

2021年,百度回港二次上市。在《致股东信》中,李彦宏提到,“每当百度徘徊在十字路口,我都会问自己,什么能够让你真正制胜未来?我认为就是两方面:一是你信仰什么,What do you really believe in;一是你有多大的决心,your determination。”

“从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。我们也有决心,有耐心。我们对AI的信仰没有丝毫改变,它一定会彻底改变我们今天的每一个行业。”


#03

接力

硅基时代的AI不是一天建成的,这背后需要一代代人的付出与努力。而将这些人连接在一起,外引与内培都只是方式,最重要的是传承,也要有领军式人物来为队伍对齐目标。

作为百度嵌入AI世界的据点,百度深度学习研究院成立初期,余凯任负责人。他是一个标准的“学霸”。18岁时,出身江西的他被保送至南京大学电子科学与工程学系。在青葱校园里,他痴迷上人工智能和神经网络,特别喜欢用神经网络来研究语音系统的处理。

图 | 余凯

余凯是一位技术专家,但也是一位活跃在技术界的社牛,为李彦宏拉来了不少AI悍将。

2013年3月,竞拍会议结束后的第4个月,被行业内称为“谷歌大脑之父”的吴恩达(Andrew Ng)到访北京。李彦宏亲自拟定了“挖人计划”。

吴恩达最知名的成果之一是“电脑识猫”。其所开发的人工神经网络通过观看一周YouTube视频,自主学会识别出哪些是关于猫的视频。这个案例在业内被认为是人工智能领域翻开了崭新一页。

盛邀之下,吴恩达来到北京。李彦宏推掉所有安排,与他边吃饭边聊了3小时。最后吴恩达说:“我希望来帮助你们。”

李彦宏的挖人计划成功。2014 年5 月 16 日,百度发布内部信:吴恩达先生今天正式加盟百度,担任百度公司首席科学家。

这像一场连环接力,吴恩达的加盟,又为百度带来了六位顶级的人工智能专家。

在百度三年,吴恩达带领人工智能团队增长至1300人,其中百度研究院成员300人,帮助百度培养出大量AI人才。

 | 吴恩

这其中也有不少日后成为大牛级的人物。比如2021年成立于旧金山的人工智能公司Anthropic的联合创始人兼CEO Dario Amodei,他从斯坦福大学博士后出站后的第一份工作,就是进入百度在硅谷成立的AI实验室(SVAIL)担任研究员。

Dario Amodei和吴恩达背景、年岁都不一样,但有一个共同的领路人——李彦宏。

图 

| Dario Amodei  

2017年,百度研究院交棒至现任百度首席技术官王海峰手中。这一举动也标志着从百度内部成长起来的科学家开始显露头角。

毕业于哈尔滨工业大学的王海峰,先后负责百度搜索、百度地图、百度翻译、百度智能云等业务,开辟了自然语言处理、知识图谱等多个百度人工智能技术方向,先后获得国家技术发明二等奖、国家科技进步二等奖等。李彦宏对他的评价是:王海峰是百度培养的技术领袖和优秀领导者,是百度向人工智能变革的推动者。

图 

| 王海峰

原生团队的佼佼者中,还有现任百度技术委员会主席吴华。毕业于中科院自动化研究所的她,负责的百度翻译项目翻译质量处于世界领先水平,并获国家科学技术进步奖二等奖。她也主导了百度文心ERNIE 3.0 Zeus的开发。

“十个百度人,六个做研发”。在百度4万员工中,六成是研发工程师。创业之初,李彦宏也曾希望从市场招聘成熟人才,毕竟作为前沿行业,一个资深专家就顶得上一万名应届生。不过,李彦宏很快发现,只靠外引的大牛还远远不够,由于在国内起步太早,AI人才空缺十分严重,而要发展中国AI,必须同时依赖自主培养。

于是,李彦宏设立“熔炉机制”,让很多年轻人来百度能有机会做创新的事、不平凡的事,快速成长,力求成长为“务实、自驱、负责到底” 的人才。

据信通院报告,百度以85.5分位居“AI产业创新人才”全国第一,并在预训练大模型、深度学习、自然语言处理等7大领域均排名第一。

百度计划五年为社会培养500万AI人才,目前已经与全国100多所高校进行深度合作、培养超300万AI人才。

日前,在2023年《时代周刊》发布的首届全球AI影响力100人名单,李彦宏被评为全球AI领袖。曾经的同事们,吴恩达、Anthropic的Dario Amodei也都在这份榜单与他们曾经的领路人再会。


#04

浪尖

2022年11 月 30 日,被称为“技术天才、投资狂魔、下一个马斯克”的犹太裔38岁青年Sam Altman(山姆·阿尔特曼)在推特上写道:“今天我们推出了 ChatGPT,尝试在这里与它交谈。”

山姆·阿尔特曼就是OpenAI创始人。ChatGPT推出后,5天用户破百万,2个月用户破亿。一场ChatGPT潮流开始席卷全世界。

图 

| 山姆·阿尔特曼

这次,李彦宏的最新论断是,“大模型改变了人工智能,大模型将改变世界。”

今年3月16日,作为全球大厂中首个发布的生成式AI产品,文心一言开启邀测。相关App开放下载仅19小时,用户数量就突破了100万,快于ChatGPT的5天破百万。发布当天,百度股价上涨超过4%。

早在2019年,百度就推出了国内最早的大模型文心大模型ERNIE 1.0版本,“事儿不是一天做成的”。

8月31日,文心一言向公众开放,首日回复3342万个问题,平均每分钟处理约23000个问题。很多人从尝鲜,到逐渐把大模型当作成自己工作的助手。

麻省理工科技评论充分肯定了文心一言的使用体验,称其“有更多的互动和引导功能、发现页展示了190多个预选主题、用户可以在社区论坛观看其他用户提出的问题以及他们得到的文本和图像回应。”

文心一言当中,最受欢迎的角色是“贴心的姐姐”,它由一群专业心理学家和人工智能开发者训练,主要基于大量的语言和情感数据,为用户提供服务和情感支持。

继百度后,国内各互联网公司也纷纷推出大模型。据不完全统计,国内的大模型个数已经达79个。

为了规范大模型的运营和发展,9月1日,国家网信办发布境内深度合成服务算法备案信息。公告显示,百度文心大模型算法、百度数字人驱动算法、语音合成算法等完成备案。

这意味着百度成为“双料王”,即同时获批向公众开放服务备案和深度合成服务算法备案。这为李彦宏的AI梦,无疑是提供了政策上合规性的保障。

此前,在《时代》周刊首评的“全球AI领袖”中,李彦宏是唯一的一位中国企业家。评语是:As China’s foremost futurist, Robin Li has been riding the AI wave for a long time。(李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮。)

图 

| 李彦宏

与李彦宏一同上榜的有那些全球AI界的风云人物,比如特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋和Open AI CEO萨姆·奥特曼。也有李彦宏的一些老伙伴,比如吴恩达、比如Dario Amodei。

时下,据接近李彦宏的业内人士透露,他正在用全新的AI技术理念重构公司的所有产品。今年3月文心一言发布之后,李彦宏除了自己亲自研究相关技术外,他还鼓励4万百度员工有意识地培养AI原生应用的思维方式和理念,用新的理念去重构百度现有的每一个产品和业务。

今年的10月,进入AI新阶段的李彦宏,将在世界大会上发布最新的文心一言大模型4.0。

和当年的辛顿教授一样,李彦宏也成了那个甘于坐冷板凳、又独辟蹊径的人。

1994年,正在美国纽约州布法罗大学攻读博士学位的李彦宏,决定退学。大家都不理解。

李彦宏答复说:“上博士是正路,但我的兴趣不是学术,而是希望做一个东西几十万人用。学校研究的东西都比较长远,每个人都在研究新的方法,即便这个问题解决了,对实际应用也产生不了多大影响。而在工业界,遇到一个问题立即解决,就可以产生比较大的影响,也可以得到很大的商业价值。”

最后,家人同意了他终止博士学业的请求。年轻的李彦宏,去了华尔街,热烈地拥抱实际、拥抱商海。

中国需要自己的大模型,也需要李彦宏。


- END-
如果您有线索或想要讨论更多,
欢迎在后台输入关键词“读者群”,加入我们。
继续滑动看下一个

十年前,第一个看中AI的中国人

龚正 真故研究室
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存