查看原文
其他

李开复对话腾讯云:技术人更需要场景的想象力 | 创观点

创新工场 2022-10-07


从 1956 年的达特茅斯会议至今,AI 已经走过了近 70 年的历程。这 70 年间,对于AI 的期待有之,对于 AI 的恐慌有之,技术人对于 AI 的探索应用也从未停歇。


千禧年时的我们,未曾畅想过移动互联网的繁盛,2022 年的我们,又该如何畅享未来 20 年的AI 发展进程?AI + 医疗会让我们活到 100 岁吗?AI 将如何让元宇宙变为现实?AI 可以帮人类找到幸福吗?AI 会加深偏见吗?传统企业是否能享受到 AI 红利?


近日,受腾讯云邀请,创新工场董事长兼首席执行官李开复博士携新书《AI未来进行式》,在腾讯云 TVP 直播间与浙江大学教授、腾讯优图实验室高级顾问、杰出科学家沈春华博士,进行了一场尖峰对话, 50 位来自 AI 领域的 CTO 与技术专家参与论坛讨论并在全网直播,碰撞出关于 AI 的未来火花。


以下为部分实录:



—1—

《AI未来进行式》创作起源


李开复:《AI未来进行式》这本书的创作起源主要有两方面原因,首先我认为 AI 是一个特别重要的技术,每个人都应该去了解它能创造什么机会,和自己有什么关联。父母可以帮助孩子做学习规划,年轻人可以为自己做职业规划,我希望用讲故事的方式,把这本聚焦 AI 技术的科普书籍写得让每一个人都能读懂,目前来看反响还是不错的,让很多完全不了解 AI 的人大概搞懂了 AI 是什么意思。


另一方面,我自己作为一个理工科出身的技术人,在本科、博士的时候研究的就是机器学习,我深深地感受到技术人普遍欠缺场景想象力,这也是为什么 AI 在语音识别、自然语言、计算机视觉这些领域做了近 40 年,却还在关注类似的问题。很多新的场景落地是需要更有想象力的,所以我也希望用跟科幻作家合作的方式,把故事描述清楚,让我们这些做技术的人可以看到未来 AI 可能的应用场景,带来的挑战,又将如何化解,给大家一些灵感与建议。


所以这次和科幻小说作家陈楸帆合作创作《AI 未来进行式》的两个重要的目的,一是把难的技术给所有的人讲懂;二是希望给一些技术很强,但是场景想象力不是那么强的理工人,或做 AI的技术人,也让他们对未来的愿景和场景能有一些灵感和建议。





—2—

AI创业发展的三个阶段


李开复:得益于很多投资的经历,我也在其中学会了一些跨领域的知识,我个人认为 AI 创造的最大价值,一定是和场景的结合。在相关投资经历中,可以总结出三个 AI 创业的发展阶段:


第一个是在比较早期的阶段时,因为 AI 技术人员很厉害,选择了先创立公司,再做应用;


第二个是在某些领域,AI 已经可以创造很大的价值,比如我们当时投的第四范式、创新奇智、极飞科技等等,都有非常强的商业应用和落地场景。它们先靠场景落地,之后再做平台。


而今天 AI 已经进入了第三个阶段,AI 会和其他的科学交叉,也就是说 AI + Science,AI 可以被用在发明新药、基因编辑、新材料新能源等方向。


《AI 未来进行式》这本书里包含了这三个方向,比如说在智能交通、无人驾驶就是一个重要的领域,比如说 AI 制药,AI 在新能源方面的应用,这本书都会涉及。因为我们投资也要关注和了解这些产业领域,所以我们也尝试在书中描述出这些场景,而我们调研出的趋势则会给写作带来一些新的灵感。



—3—

NLP技术发展与应用


李开复:《AI未来进行式》书里有一个「双雀」的故事章节,在这个故事里,AI 成为了孩子成长的陪伴助手。在人类老师的主导下,AI 化身为一个长期陪伴的助教角色,将孩子的学习与兴趣相结合,变得更有效率与主动性。


虽然在 AI 时代,我认为人类老师的教育工作 AI 是替代不了的,但是 AI 可以做很多有益的补充,因此在这样的场景下,NLP(自然语言处理) 的技术就是其中的关键点。


在我大二的时候,我刚开始接触的第一个 AI 技术就是 NLP(自然语言处理)。与早期 NLP 的发展相比,最近几年很多技术正在发扬光大,深度学习是其中的一个重要核心。我们看到一个很大的突破就是 NLP 的领域正在用自监督学习的技术去做海量数据的标注,这解决了一个巨大的瓶颈。从这个模型做出来以后,带来了包括 transformer、GPT3 在内的诸多 NLP 领域的技术突破。


创新工场孵化和投资的澜舟科技就是 NLP 领域非常优秀的公司。首先,澜舟科技证明了轻量的预训练大模型在一些权威榜单里面比如CLUE也能问鼎第一;其次,一般来说大模型需要很贵的机器,这样的话很多创业公司或者学者或者应用是用不起的,澜舟科技能用缩小 1000 倍的模型训练出相当好的效果。澜舟科技的技术在语音识别、机器翻译,还有针对性广告等多个领域应用,而且每次就花几周的时间就能调出一个模型出来。


我认为 NLP 在未来三到五年应该会有非常多的发展,一方面是在过去已有的应用,比如语音识别、机器翻译等方向有更多突破;另一方面是在还没有发生的场景下得到很多尝试,比如语音对话型的终极搜索引擎等等。NLP未来的发展,既会把已有的应用从不可用变成可用,从可用变成好用,也会把过去不可能做的应用变成可能做,这是我们现在重大的投资方向。



—4—

AI+医疗的进展未来可期


李开复:我们认为从现在到未来的十年,甚至二十年间,医疗都会是一个非常好的投资领域。具体有几方面原因:


一是传统的医疗行业现在正全方位数字化,包含医疗流程信息化、可穿戴设备记录全程健康数据、以及新技术产生海量生物学数据等带来的大量数据将成为 AI 的“养料”,产生有价值的算法,在疾病预警、诊断、治疗、监测、长期管理等方面辅助医生进行诊断和治疗。


二是医疗领域目前还不是海量数据的训练和科学。比如说癌症的样本,我和哈佛的医学院聊数据的时候,他们每一种癌症的数据样本很少。他们的数据是用来教学的,我们的数据是用来教 AI 的,当教学数据只有很少样本的情况下,海量数据训练后的 AI 能力领先性就产生了。


三是医学知识太多了,医生不可能做到全知全能,他看一个病人能够了解病人的背景和病例的时间也是有限的,看病的时间更是有限的。


从投资的角度看,我们认为其实在医疗行业,做新药研发是一个非常好的领域,这也与 AI 的目标高度一致。因为在这样的场景下,人的想法和 AI 的想法是一致的,都是如何用最低成本、最短时间研制一个最有效的新药,这样的方向上,做 AI 的技术人群与真正的业务方诉求都是一致的,可以用合力把事情做好。这方面我们也投资了几家公司,包括 AI 新药研发公司Insilico Medicine,用 AI 发现了肺纤维化、肾纤维化等罕见疾病的候选药物。


最后我想讲的是,医疗行业背后有很多生物学、化学等领域的科研人员,他们处于电脑模拟之后、临床之前的实验室工作阶段,这其实也非常适合 AI 去做。它带来的价值不仅仅是取代了人力成本,更重要的是机器本身可以 24 小时不间断地做实验,研发的进程指数级提升。例如创新工场投资的镁伽科技,用实验室自动化解放了科学家的时间。


最终 AI 理想的效果是让新药研发更快,成本更低,让很多罕见病,不可医的病都变得可医,让人享受更长久的健康,这是我们可以期待的,也是 AI 能做出的最大且没有争议的贡献。



—5—

科技向善与数据隐患


李开复:数据隐患的这些问题,已经造成了很多人对 AI 的负面认知多于正面,这是一件很不幸的事情。AI 确实带来了一些问题,但也会随着时间、新技术去化解,包括一些相关法律法规的健全和完善,Web 3.0 把数据还给个人等等的方式。这些都是可以探索的方向,而且解决方案并没有我们想象的那么难。


比如隐私保护的问题,如何确保数据不被滥用,就涉及到很多隐私计算的算法,比如联邦学习。以联邦学习为代表的隐私算法,可以让我们鱼与熊掌兼得,既能把数据授权去做训练,又能确保对训练模型中的数据构成脱敏的作用,不至于产生隐私问题。


从大数据到推荐算法,这其中的确产生了很多不好的社会现象,这引出了 AI 领域一个很有趣的题目:我们如何能让一个目标函数去衡量一个相对长远、比较困难的事情。商业化落地的 AI 算法,最大化的是大公司的利益,但我们也应该考虑个人对 AI 千人千面的需求。有没有可能将个人的需求作为目标函数参考进来,去训练 AI 的模型,兼顾企业和个人的需求,这是非常值得去思考、突破的技术方向。


另一点,偏见的问题其实主要来自于数据的不平衡,这些问题是做 AI 的技术人应该警惕的,我们做产品之前要确保数据有合理的覆盖度、平衡度,除了个人的观念,也需要有一些工具的提醒校正。这背后涉及到的可解释性相当困难,一方面我们可以做一些可解释的机器学习模型,另一方面可以试着对已有的标准模型做可解释,但不要对结果的精确性、细腻度过于吹毛求疵。


最后我想说的是,我们批评 AI 这么多,人难道就会做得更好吗?人会比 AI 更没有偏见吗?其实不然。以色列做过一个实验,法官在午餐之前做出的判决会比午餐之后更苛刻,代表他的心情影响到公平了。人的偏见是很严重的,而且人会隐藏、拒绝承认自己的偏见。AI 是一个客观、公平、透明、基于数据的领域,所以我们有更大的希望把 AI 做成一个低偏见的决策者,远远比人的偏见来得低。





推荐阅读









您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存