01
AI大模型 | AI大模型概览
新技术不断涌现
它们会怎样影响我们的工作生活
如何在业务中应用这些技术
……
大模型、双碳节能、新质生产力
……
我们为您搜集
最前沿的技术资讯
助您能够深入思考
灵活应用这些知识
本期是第1期[ AI大模型 ]
本期内容开始之前,先介绍几个AI方面的基本概念
概念介绍
AI
Artificial Intelligence(AI),人工智能。它涵盖了各种技术和领域,目的是让计算机模仿、延伸甚至超越人类智能。例如,智能手机、智能家居设备,这些都是AI技术的应用。
AIGC
AI Generated Content(AIGC),利用AI技术生成的内容。比如AI写作、AI绘画、甚至AI主持的节目!(是不是听起来很科幻?但这已经在我们周围发生了。)
AGI
Artificial General Intelligence(AGI),又称通用人工智能,目标是创造一个能像人类一样思考、学习、执行多种任务的系统。(想象一下,如果有了AGI,它可能会成为全能的“超级大脑”,能在任何领域都超越人类。听起来是不是有点像科幻电影里的情节?)
AI模型
AI模型,指基于已有数据集,运行深度学习算法所得到的一种数学表示。可以简单理解为,它是计算机通过分析大量数据学到的技能,而这种技能本身也是一种算法。就像我们人类社会中有老师、医生、消防员等不同专业人士,AI模型在进行不同的应用之前,也要经过专业的培训,只不过AI模型是通过持续给机器喂数据、优化框架算法,匹配相应的算力来完成。
AI大模型
AI大模型,相比于AI模型,具有更多的参数和更复杂的结构,能够处理更复杂的问题,并且具有更高的泛化性能和准确性。AI模型通过一系列大规模的训练将让其成为大规模预训练模型,即“大模型”,就如同我们通过“小学到高中”的预训练过程。就像我们在不同的学习阶段会展现不同的倾向,AI大模型也并不只有一种。
2023年的科技界,AI大模型备受瞩目,呈现群“模”乱舞之象。
它到底是什么?跟我们普通人又有多大关系?会对人类造成什么影响?
现如今打开APP,你看到的文章、图片、音频、视频很有可能是AI生成的。AI已经体现出了超越人类的效率和能力,这一些都得益于AI大模型的快速发展。
从云时代向大模型时代进化
信息社会先后经历了计算机、互联网、移动互联网和云计算等重要阶段。ChatGPT及一大批类似大模型的发展,标志着信息社会进入了大模型主导的新阶段。
根据陆奇提出的“信息-模型-行动”系统分析范式框架,计算机、互联网、移动互联网和云计算这四个标志性技术都是实现了信息获取的边际成本无限趋近零。大模型热潮标志着新拐点即将到来,社会各界获取模型的总成本将逐渐趋近固定成本,预示着模型将无处不在,万物都将成为它的载体。
未来,自动化行动将成为新的拐点,人在物理空间内“行动”的代价转向固定,人将与数字化技术构建出一个全新的智能系统,实现信息、模型和行动的无缝衔接。
这意味着人不再通过获取信息,利用人脑分析,自己去行动,而是智能系统自动获取低成本信息(数据),利用大模型,形成指令驱动各类系统(包括机器人)采取行动,从而对整个社会产生深远的影响和冲击,各类数字化系统也将基于大模型形成互联互通。
02
大模型时代的三大革命性变化
大模型推动弱人工智能向通用人工智能(AGI)跃升
2023年2月,OpenAI在ChatGPT成功的基础上,发布了通用人工智能路线图,建议逐步向AGI过渡,让大众、政策制定者和研究机构有时间了解AGI技术带来的改变。
谷歌也指出未来数年AGI将会得到普及,各种应用领域中的智能系统将具备与人类认知能力相持平的智力水平,能够胜任多种复杂任务。
大模型推动生产力从算力向机器人智力跃升
生产力的变革是推动人类社会进步的根本动力,从原始社会、农业社会、工业社会到信息社会,背后是人力、畜力、电力到算力的跃升。随着大模型成为新的物种,机器智力将成为新的主流生产力。
机器智力是智能算力与人类知识的扩展、集成和融合,大模型是机器智力的载体。随着大模型的不断进化和普及,其将成为经济社会的主流生产工具,重塑经济社会的生产方式,全面降低生产成本,提升经济效益。
首先AI,特别是AGI产业高度发展,带动智能算力相关基础设施投资,并基于大模型衍生出多种新业态和新市场,成为经济增长的核心引擎。
以智算中心为例,一个单位的智算中心投资,可带动AI核心产业增长约2.9-3.4倍、带动相关产业增长约36-42倍。GPT等各种大模型是人工智能时代的“操作系统”,将重构、重写数字化应用。
其次是有了AGI的加持,人类的能力和活动范围都将得到大幅提升,进一步从重复性的脑力劳动中解放出来。但是,需要注意到,大模型的普及也会给现有的教育、就业、舆论甚至全球的政治格局带来冲击,是需要政府和产业界共同研究的问题。
大模型发展的三个阶段和三次飞跃
自2022年11月30日ChatGPT发布以来,AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。
大模型的发展主要经历了三个阶段,分别是萌芽期、探索沉淀期和迅猛发展期,形成“百模大战”的竞争态势。
01
萌芽期(1950年-2005年)
02
探索沉淀期(2006年-2019年)
2013年,自然语言处理模型Word2Vec诞生,首次提出将单词转换为向量的“词向量模型”,以便计算机更好地理解和处理文本数据。
2014年,被誉为21世纪最强大算法模型之一的GAN(对抗式生成网络)诞生,标志着深度学习进入了生成模型研究的新阶段。
2017年,Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构,奠定了大模型预训练算法架构的基础。
2018年,OpenAI和Google分别发布了GPT-1与BERT大模型,意味着预训练大模型成为自然语言处理领域的主流。在探索期,以Transformer为代表的全新神经网络架构,奠定了大模型的算法架构基础,使大模型技术的性能得到了显著提升。
03
迅猛发展期(2020年-至今)
以GPT为代表的预训练大模型阶段
大模型技术发展路径
从技术的角度来讲,AI大模型通常是基于深度学习的神经网络,这些网络由数以百万计的参数组成,能够从大量数据中学习复杂的模式。
这些模型通过在大规模数据集上进行训练,能够理解和生成语言、识别图像内容,甚至在某些情况下,预测未来的趋势。
01
以ChatGPT为例,它使用来自人类反馈的强化学习(RLHF)来训练模型
首先,使用监督微调训练了一个初始模型,即人类AI训练员提供对话,他们在对话中扮演双方——用户和AI助手。其次,ChatGPT让标记者可以访问模型编写的建议,以帮助他们撰写回复。最后,ChatGPT将这个新的对话数据集与原有数据集混合,将其转换为对话格式。
具体来看,主要包括三个阶段:
第一阶段
训练监督策略模型
ChatGPT模型的训练过程中,需要标记者的参与监督过程。首先,ChatGPT会从问题数据集中随机抽取若干问题并向模型解释强化学习机制,其次标记者通过给予特定奖励或惩罚引导AI行为,最后通过监督学习将这一条数据用于微调GPT3.5模型。
第二阶段
训练奖励模型
这一阶段的主要目标,在于借助标记者的人工标注,训练出合理的奖励模型,为监督策略建立评价标准。
训练奖励模型的过程同样可以分为三步:
抽样出一个问题及其对应的几个模型输出结果
标记员将这几个结果按质量排序
将排序后的这套数据结果用于训练奖励模型
第三阶段
采用近端策略优化进行强化学习
近端策略优化(Proximal Policy Optimization,PPO)是一种强化学习算法,核心思路在于将Policy Gradient 中 On-policy的训练过程转化为Off-policy,即将在线学习转化为离线学习。
具体来说,也就是先通过监督学习策略生成PPO模型,经过奖励机制反馈最优结果后,再将结果用于优化和迭代原有的PPO模型参数。
往复多次第二阶段和第三阶段,从而得到参数质量越来越高的ChatGPT模型。
02
ChatGPT模型原理
大模型的应用之路
目前,AI大模型已经在医疗、金融、教育、制造等多领域得到了广泛应用。
01
医疗领域
AI大模型可以帮助医生进行疾病诊断和治疗方案制定,提高诊断准确率和治疗效果。
02
金融领域
AI大模型可以用于风险评估、信用评级、投资决策等方面,提高金融服务的智能化水平和风险控制能力。
03
教育领域
AI大模型可以根据学生的学习情况和反馈进行智能化的教学设计和推荐,提高教学质量和学生学习效果。
04
制造领域
AI大模型可以实现智能制造、智能监控、智能维护等方面的应用,提高生产效率和产品质量。
随着AI大模型的落地加速,各行业应用生态也在加速形成。越来越多的企业和机构开始将AI大模型技术应用于自身的业务中,探索新的商业模式和创新点,为各行业提供更加智能化、高效化的解决方案和服务。
阅读完本章内容
您对AI大模型有什么想要进一步了解的
欢迎评论区留言,一起探讨~
---
内容:李晓萌
校对:李宇凡
排版:龚泓月