“技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。”——约翰 · 冯 · 诺依曼(John von Neumann), 1958“ChatGPT 爆发意味着 AI 的 iPhone 时刻来了,下一步就是应用时刻,新应用时代将来临。而 AI 的 Android 时刻也一定会出现!”若要问人工智能的新十年究竟会有什么变化,通过由 CSDN、《新程序员》、上海市人工智能行业协会主办,百度飞桨、达观数据、智源人工智能研究院协办的全球人工智能开发者先锋大会(GAIDC)“新程序员:人工智能新十年”论坛上,技术大咖们的演讲与对话,我们能看到这样三个关键词:AIGC、大模型、AI 编程。这意味着,对于所有程序员而言,我们正在亲身经历编程范式的转移。
上海临港新片区管委会高科处副处长吴海涛致辞:2023 年有望成为人工智能新开发范式发展元年,新的产业生态已呼之欲出。今天,人工智能有了更多可以畅想的空间,相关的技术创新与应用让人工智能展现出新面貌,进入了新纪元。CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛:ChatGPT 带来的,是程序员的技术栈的发生变化。从过去互联网程序员的 LAMP,移动的 iOS、Android,云原生的 K8s 到今天,大模型将推动更多的 AI 应用程序员产生。
达观数据副总裁王文广:“以人为本 AGI” 就是以人类为中心的通用人工智能,也就是说人工智能是以服务人类为目的的。它由神经网络大模型+知识图谱+强化学习构成,在 ChatGPT 浪潮中已经打好基座,未来将引起从效率革命到思维革命,从改造自然到改造自身的深远影响。智源人工智能研究院总工程师林咏华:GPT3.5+ChatGPT 打开了 AIGC 的潘多拉盒子,但在大模型发展和产业落地中,我们面临着许多重要的技术挑战,涉及参数及模型大小、海量的训练数据、大模型的评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起:吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华:大模型绝不仅仅是模型系统和算力,数据是非常重要的问题,我呼吁大家能够更多地关注大模型的数据治理。百度 AI 技术生态总经理马艳军:我们一定要把人工智能的门槛降下来,从开发、训练、推理的流程,能不能从尽可能降低流程的成本,进一步演进为用更简单的流程取代它?才能让应用变得更广泛。同济大学百人计划、特聘研究员、博士生导师王昊奋:ChatGPT 出来后,我被问得最多的问题就是——知识图谱是不是不用做了?是不是相当于“判死刑”了?我说可能“死缓”吧,当然,也还有不少变数。华为云智能化软件研发首席专家王千祥:编程 AI,程序员在新十年里,还是以编程为主吗?是不是会用对话这种方式?九章云极 DataCanvas 副总裁于建岗:ChatGPT 的出现确实对于当前基于大模型的自然语言处理和通用智能带来了革命性的变化,但我觉得当前只是个开始。现在,还可以从 CSDN 视频号里,观看最精彩的现场直播回放(路径:关注-点击“直播”-找到回放):
这次论坛不仅在线下高朋满座,而且线上更是汇聚了数万名开发者。各位专家不仅深入分享了自己躬身入局深耕多年来的思考与实践经验,还带来数个重磅发布,都是进入人工智能新十年的“趁手兵器”:- 华为云与 CSDN 联合发布“智能化编程助手 Snap”,支持 IntelliJ、PyCharm、VS Code 等主流 IDE,不仅可以自动生成代码,还能自动分析代码。
- 由 CSDN、《新程序员》联合出品,开源开放的《2023 年度人工智能产业全景图》(国际&中国)正式发布!
- 由智源人工智能研究院与多家机构共建,FlagOpen 飞智大模型技术开源体系来了!
- 中国 AI 如何走向根深叶茂?CSDN AI 编程评测标准“猿大师”正式发布!
接下来,就让我们从头回顾本次论坛,一同见证人工智能黄金时代的揭幕。在论坛开始前,临港新片区管委会高科处副处长吴海涛为我们进行了开幕致辞,他表示,人工智能是临港新片区重点布局的前沿产业领域,这项学科作为计算机科学的一个分支,虽已历经数十年的积淀,但始终是前沿科学的重要领域,承载着人类面向未来挖掘自身智慧潜能的无限遐想。在未来,我们将守正创新,向光前行,让人工智能在未来十年乃至更多年里迸发出更激动人心的技术活力。
在论坛的主旨演讲环节,CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛发表了《新程序员时代:中国AI开源开发者的新十年》的主题演讲,他分享了 CSDN 开发者的最新数据,如今 CSDN 用户总量为 4200 万,2022 年新增用户为 600 万,访问量突破历史新高。在这个人人都是开发者的时代,CSDN 将用五年来兑现曾经的口号:“成就一亿技术人”。
蒋涛,CSDN 创始人&董事长、极客帮创投创始合伙人他表示,AI 正在渗透到各行各业,ChatGPT 的出现引爆了话题,加剧了开发者的关注。如今的 ChatGPT 爆发宛如 2007 年 iPhone 初发布之时,所需等待的就是雨后春笋的应用阶段。
他用两张《2023 年度人工智能产业全景图》清晰地剖析了世界人工智能产业的局势:在基础层方面中美不相上下,而 ChatGPT 问世使得我国在 AIGC 领域落后一步;但是,AI 的行业应用方面还未出现较大的进展,机遇因此而来。
他还提出,程序员将迎来一个真正的 AI 应用时代,云计算将同水和电一般普及千家万户,过往的人类会运用自己的专业知识来完成任务,而 ChatGPT 却能同时运用数据库中海量的知识,这就是 AI 蕴含的包容性,也是智能云时代的本质。最终,程序员这一职业不会被替代,只是技术栈将发生变化。
达观数据副总裁王文广表示,人工智能赋能百业,能够提升各行各业的效率。而在 ChatGPT 问世之后,人工智能的发展出现了新的趋势,这是一个充满机遇和挑战的时刻,正如蒋涛所提到的 iPhone 发布之时,是一个革新的时刻。他还将自身对人工智能的十几年思考总结为“神经网络大模型”+“知识图谱”+“强化学习”=通用人工智能(AGI)的公式,通用人工智能的出现、发展和进步将会是全社会的巨大机遇,这可能就是又一次的工业革命,颠覆过往的生产效率。而通用人工智能的出现,或将为人类带来思维革命,这种变革可能会从改造自然开始,最终改造人类的自身,为整个人类社会带来深远的影响。随后,智源人工智能研究院总工程师林咏华指出,ChatGPT 浪潮之前的 AI 领域曾处于一个低谷,而大模型+ AIGC 会把人工智能从当前一个低谷带到下一个拐点。她提出,开发范式很大程度上决定了产业落地的成本,过去采用的开发范式都存在着不少问题。但随着过去几年大模型的迅速发展,一些头部企业开始采用基础大模型+应用提示的全新范氏,大幅降低企业投入、缩短研发周期,同时具有多样性、通用性。如今,GPT3.5 + ChatGPT 打开了 AIGC 的“潘多拉盒子”,这个“AIGC 元年”需要大模型技术的推动和支持。北京智源人工智能研究院过去几年一直在做相关的研究,并带来了 FlagOpen 飞智大模型技术开源体系,发布“悟道”大模型平台,助力大模型技术的百花齐放。未来,大模型还需要更多的技术深耕,才能做到在未来十年成功落地。复旦大学教授肖仰华以“面向大模型的数据治理”为主题,带来了一些实践成果和思考。他提出,语言模型成为了人工智能发展新的底座,预训练的语言模型极大推动了自然语言处理(NLP)技术发展,成为语言智能的新范式、认知智能新底座。然而,大模型仍存在诸多问题。研究者需要特别关注数据整理和模型训练两阶段,实现数据治理,保障大模型质量,充分发挥大模型的价值。他还表示,预训练语言模型虽已具备初级认知能力,但仍缺乏高级认知能力。在未来,可从概念、类比、幽默、价值认知等角度探索如何增强模型的高级认知能力。此外,预训练语言模型的推理能力也需要继续加强,从数值、逻辑、常识推理等角度探索如何增强模型的推理能力。百度 AI 技术生态总经理马艳军表示,这十年是人工智能的黄金时代,而深度学习技术将在人工智能领域继续保持非常核心的位置。随着深度学习技术的发展,大模型、大数据、大算力,这三者的融合更加迫切。因此需要综合考虑如何将数据、模型、算力三要素深度融合,同时把人工智能的使用门槛降低。就实现这一目标而言,他提出了围绕技术持续创新、功能体验以开发者需求为首位、持续与生态共享共创三方面开展深度学习平台建设,以百度飞桨为例,发展人工智能产业生态,最终实现千行百业的深度结合。同济大学百人计划、特聘研究员、博士生导师王昊奋提出,生成算法、预训练模型、多模态等 AI 术累积融合,催生了 AIGC 的大爆发。如今,AIGC 的应用集中在数字化程度高+内容需求丰富的行业,而这项技术仍然存在诸多挑战,从文本到图像生成还遗留了大量问题尚未解决。为了解决这一问题,需要从 AIGC 涉及的知识类型与注入方式入手,改善 AI 的学习过程。
他还根据 ChatGPT 现有的不足,提出了 LLM+知识图谱,通过大规模语言模型表现出的强大抽取、生成能力,辅助知识图谱的快速构建、实现知识的自动抽取与融合、增强模型复杂推理能力,让 LLM 作为基础提供接口,朝多模态、多领域持续深入,并就如何结合各种各样的模型作出了假设和展望。CSDN 携手华为云,重磅发布 AI 编程助手 Snap作为 AI 领域的前沿工作者,华为云智能化软件研发首席专家王千祥在最后一场主题演讲中,根据程序自动生成的历史提出了该领域现存的两项挑战:程序空间与用户意图,并指出了用 GPT 生成程序这一突破点,聚焦 AI 编程技术,为 AI 代码生成能力进行评估,从原先的下游任务到反哺大模型技术。他还提出,要构建真正智能的系统,我们应当更加关注数理逻辑和知识推理,不但要设计新模型将统计方法与规则方法(常识)融合起来,并在交互过程中根据反馈实时在线学习,最终构建健康的生态。为了实现 AI 编程“从叶到根”的理念,华为云与 CSDN 联合发布“智能化编程助手 Snap”。基于华为诺亚语音语义 LAB 与华为云 PaaS 技术创新 LAB 联合研发的业界能力领先的代码大模型 Pangu-Coder,华为云进一步开发出了智能编程助手插件 CodeArts Snap。
Snap 支持 IntelliJ、Pycharm、VS Code 等主流的 IDE,目前支持 Java、Python 等主流的编程语言,对其它编程语言的支持也会很快陆续发布。Snap 不仅可以自动生成代码,还可以自动分析代码,发现其中存在的部分缺陷,以提升代码质量。基于华为云与 CSDN 的账号互通体系,CSDN 用户可以用 CSDN 账号直接使用该插件,免去注册华为云账号的环节。
在 AI 编程大势下,CSDN 创始人&董事长蒋涛紧接着带来了另一项重磅发布:AI 编程评测标准“猿大师”。他提出,代码生成能力不仅能够作为开发者辅助编程的工具,同时能够成为 AIGC 结果执行的飞翼,但这一过程仍离不开人工的参与,“猿大师”应运而生。
“猿大师”从辅助编程到完全自动编程设置了五种能力等级,最高级别具备代码生成、代码分析以及测试 case 生成能力,借助这一评测标准,企业将能够培养全新的应用工程师人才,让开源模型得到完善利用。最后,由达观数据副总裁王文广主持,CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛,九章云极 DataCanvas 副总裁于建岗,智源人工智能研究院总工程师林咏华和华为云智能化软件研发首席专家王千祥作为嘉宾的圆桌对话正式展开,五位技术大咖以“人工智能新十年”为主题,通过新技术及新应用的思考、趟坑经验及探索实践,深入呈现人工智能发展的最新面貌。在圆桌论坛中,几位老师不谋而合,都构想出人工智能将带来的两大改变:效率革命和思维革命。蒋涛提出,AI 会将重复性的低级工作取代,同时伴生一系列 AI 相关的职业,催生 AI 程序员。ChatGPT 就是新时代的 OS,现在每个人都可以尝试把专业领域的知识以用户体验的方式传达出去,ChatGPT 可以观察到每一个问题的深度,准确地满足用户的需求。从人机交互的角度,王千祥判断,未来的交互方式会出现很大的变化,而如今大模型没有彻底解决语言的问题,还只是开始阶段。随着产业链的发展,中小企业(尤其是创业企业)都能遇见很多机会;而在算力方面,未来算力成本将逐渐降低的,最终为所有人找到各自的发展空间。而林咏华认为,人类的一部分的知识是用语言来记录的,而另一部分的知识则不然。因此,如果要训练出一个具备知识的模型,就必须要考虑这些记录了知识的语料;而那些无法用语言记录的知识,就应该采用更高效的方法去记录。
对于 ChatGPT 所引发的革命,于建岗表示,对于当前的无论是底层的 GPT 还是 ChatGPT,本质而言还是提升效率,这一次 ChatGPT 的表现对于在一个规则明确、逻辑性封闭的学习空间来说,能力还是有目共睹的而且比较让人耳目一新。但也要看到,以 ChatGPT 代表的通用智能目前还缺乏一定的创新性,在不远的将来,一定会有更大层次的飞跃,乃至出现创新性的工作和类人的思维的通用智能,这将对各行各业产生重大影响。距离这一点,我们还有许多工作要做。同时,对于通用智能的安全、隐私、伦理等方面我们也要积极地开展工作,让 ChatGPT 之类的智能能够更好地为人类服务,而不是形成对抗。人工智能在不同领域都对效率有极大的提升,随着未来科研实力的上涨和资本的进入,其人工智能的智能化程度亦将加深,最终实现人工智能的工业化,让机器人+AI 协助人类从事各种工作。而人工智能在助力人类生产的同时,也开始学习艺术创作,并对人类的创造性思维产生影响:这是过往的科技都没有带来的东西。这也令人反思:AI 难道真的没有创造性吗?会不会是创造性这个词汇本身的定义问题呢?
在过去数十年间,人工智能几经起落,而每一次的兴起都有着非常标志性的技术突破或应用创新。(1)任何在我出生时已经有的科技都是稀松平常的世界本来秩序的一部分;(2)任何在我 15-35 岁之间诞生的科技都是将会改变世界的革命性产物;(3)任何在我 35 岁之后诞生的科技都是违反自然规律要遭天谴的。如今,人工智能即将成为这个改变世界的革命性产物,最终成为让后代感到稀松平常的秩序。