查看原文
其他

文院学览 | 观通学社·古籍研究所“镕今铸古 综贯博通”系列讲座第三讲“Chat合成与生产力赋能”纪要

黄璟 浙大文学院 2023-12-16


编者按:浙江大学文学院秉承“文以化人,学通古今”的育人理念,积极构筑师生学术交流平台。为进一步活跃学术氛围,增强学术素养,助力学院教学、科研建设和发展,“浙大文学院”特开辟【文院学览】专栏,及时回顾学术交流、讲座等相关信息,努力为师生打造高层次、高水准的学术交流平台。



“Chat合成与生产力赋能

——从ChatGPT到GPT-4的思考”

讲座纪要


4月3日晚,观通学社·古籍研究所“镕今铸古 综贯博通”系列讲座第三讲,在紫金港校区成均苑4幢107会议室顺利举行。本次讲座特别邀请了浙江大学求是特聘教授、浙江大学人工智能研究所所长吴飞老师主讲,主题为“Chat合成与生产力赋能——从ChatGPT到GPT-4的思考”。浙江大学古籍研究所副教授窦怀永老师担任主持。


ChatGPT是OpenAI研发的人工智能技术驱动的自然语言大模型,它能够通过理解和学习人类的语言来进行对话。自2022年11月发布后,ChatGPT展示出了强大的实用性和影响力。今年3月,OpenAI发布GPT软件的最新迭代版本ChatGPT-4,分析了来自互联网的海量数据信息,以学习如何生成类似人类作出反应的文本,并为用户提出的问题予以详细解答。ChatGPT和GPT-4已经成为人工智能领域现象级科技创新产品。


吴飞老师在讲座中介绍了人工智能70多年发展历程中的“两落三起”,深入浅出地说明了ChatGPT以“共现则关联”来进行模型学习的方法,体现了“计算独大、表示丰富和机理式微”的特点,这也反映了计算机所体现的“试错与暴力”优势,指出人工智能存在数据偏差等局限性。吴老师表示,未来将是人和人工智能共同进化的时代,人和人造物之间将如影随形、协同共进、相得益彰,人类要在制造工具和利用工具中奋力前行。


新颖而富于创见的学术话题,吸引了来自本院和其他学院不同专业方向的师生,极大点燃了大家的参与和互动热情。


▲讲座现场


吴飞老师从人工智能的起源说起,介绍了学科的发展缘起。人工智能(Artificial Intelligence)是以机器为载体所展示的人类智能,其学科意义的起源可以追溯到20世纪50年代。当时的科学家们开始探索如何将机器赋予类似于人类的智能,提出了包括自我学习与提高、归纳与演绎在内的值得关注的七个问题,因而人工智能也被称为机器智能(Machine Intelligence)。1973年,《人工智能:一份全面报告》(Artificial Intelligence: A General Survey)提出,人工智能研究集中在自动机、机器人和神经系统,能够在“玩具类问题(Toy Problem)”中表现得很好,但无法解决真实世界的问题。这直接导致人工智能研究坠入了第一次隆冬。在此期间,“MCP神经元”模型推动了神经网络的发展,沃伦·麦卡洛克(Warren McCulloch)说,“在科学史上第一次,我们知道了我们是怎么知道的”,它也成为“感知机(perceptron)”模型的基础。到了20世纪80年代初,由于由输入层和输出层构成的感知机能力极其有限,饱含期望的神经网络研究被打入冷宫,用机器模拟人类智能的最早尝试基本失败,人工智能自此进入了十年左右的第二个冬天。20世纪90年代,受到人工智能研究的内部驱动力以及信息环境与社会目标的外部驱动力的影响,深度学习出现,重新点燃了人工智能创新发展的希望。人工智能开始稳步发展,逐渐形成第三次发展浪潮。


▲人工智能的“两落三起”


对于近期出现的人工智能现象级科技产品“ChatGPT”,吴飞老师详细介绍了它的理论模型和生成机制。沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮兹(Walter Pitts)提出的“MCP神经元”模型,包含了多个输入和一个输出。为了模拟深度神经网络,神经元在接受信息之后,要进行加权累加,并做非线性变换。神经元模型的深度学习,向人们揭示了“我们是怎么知道的”这一问题的答案,但也要求亟需大量的数据刺激与驱动训练。作为一种自然语言工具,ChatGPT以Transformer为核心,引入了注意力(Attention)机制,可以海量语料中学习单词间的共现概率关联。ChatGPT的训练过程,主要包括完形填空的自监督学习(Self-supervised In-context Leaning)、提示学习(prompt learning)、人类反馈下强化学习(Human-in-the-Loop)三个阶段。从本质上来说,ChatGPT是在大数据、大模型、大算力下,以“共生则关联”原则实现了统计关联关系的挖掘。目前的GPT-3拥有强大的数据建模能力,即通过单词12288个维度的词向量表达,步步为营,从不同侧面刻画一个单词在哪些方面与另外单词构成了关联,也擅于细水长流般“思考”(Feedforward),像神经元之间信息加权和信息激活一样,去细化共生概率关联。新生代GPT-4则以文生图,以文本作为监督信息来实现无监督学习下视觉信息理解。这种方法可以使模型更加准确地理解图像,以实现更高水平的视觉信息理解。“多者异也(More is different)”,ChatGPT这一大模型具备强大的涌现能力。


▲深度神经网络

▲ChatGPT的技术路线


吴飞老师认为,ChatGPT将成为人工智能时代一种新的信息系统入口,也将成为一种新的知识调用方式。数据驱动越多,在数据中暴露度越大的工作,所受影响越是显著,可能有80%的工作运用ChatGPT后,会极大提高工作效率。ChatGPT推动了人工智能由识人辨物和预测决策等向内容合成跃升,即人工智能内容合成(Artificial Intelligence Generated Content,AIGC),推动了人工智能下沉为普通用户使用,是一个重要的标志性事件,必将会在古代文化、传统语言、敦煌写本等人文社会科学研究领域展现出卓越的“赋能”影响力。


讲座最后,吴飞老师还带领大家重新思考了人类智能和人工智能、人和人造物间的关系。吴老师认为,人类不仅要善于制造工具,也要善于利用工具,未来将是人和人工智能共同进化的时代,人和人造物之间将如影随形、协作共进、相得益彰。在听众提问互动环节,针对人工智能的个性化设计、类人化的情感问题、发展定位等问题,吴老师一一进行了细致回答。


整场讲座,吴飞老师立于专业、又不囿于专业,以渊博的学识、诙谐的语言,深入浅出地阐述了人工智能给当代社会与人类带来的无限魅力,多次获得在场师生的热烈掌声。


▲讲座现场



撰稿 | 黄   璟

审订 | 吴   飞教授

编辑 | 卞雨轩

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存