AI大模型 | AI大模型概览

凌宇时代时代凌宇

2024-09-09

前言

新技术不断涌现

它们会怎样影响我们的工作生活

如何在业务中应用这些技术

……

大模型、双碳节能、新质生产力

……

我们为您搜集

最前沿的技术资讯

助您能够深入思考

灵活应用这些知识

本期是第1期[ AI大模型 ]

第一章 AI大模型概览

本期内容开始之前，先介绍几个AI方面的基本概念

概念介绍

Artificial Intelligence（AI），人工智能。它涵盖了各种技术和领域，目的是让计算机模仿、延伸甚至超越人类智能。例如，智能手机、智能家居设备，这些都是AI技术的应用。

AIGC

AI Generated Content（AIGC），利用AI技术生成的内容。比如AI写作、AI绘画、甚至AI主持的节目！（是不是听起来很科幻？但这已经在我们周围发生了。）

AGI

Artificial General Intelligence（AGI），又称通用人工智能，目标是创造一个能像人类一样思考、学习、执行多种任务的系统。（想象一下，如果有了AGI，它可能会成为全能的“超级大脑”，能在任何领域都超越人类。听起来是不是有点像科幻电影里的情节？）

AI模型

AI模型，指基于已有数据集，运行深度学习算法所得到的一种数学表示。可以简单理解为，它是计算机通过分析大量数据学到的技能，而这种技能本身也是一种算法。就像我们人类社会中有老师、医生、消防员等不同专业人士，AI模型在进行不同的应用之前，也要经过专业的培训，只不过AI模型是通过持续给机器喂数据、优化框架算法，匹配相应的算力来完成。

AI大模型

AI大模型，相比于AI模型，具有更多的参数和更复杂的结构，能够处理更复杂的问题，并且具有更高的泛化性能和准确性。AI模型通过一系列大规模的训练将让其成为大规模预训练模型，即“大模型”，就如同我们通过“小学到高中”的预训练过程。就像我们在不同的学习阶段会展现不同的倾向，AI大模型也并不只有一种。

2023年的科技界，AI大模型备受瞩目，呈现群“模”乱舞之象。

它到底是什么？跟我们普通人又有多大关系？会对人类造成什么影响？

现如今打开APP，你看到的文章、图片、音频、视频很有可能是AI生成的。AI已经体现出了超越人类的效率和能力，这一些都得益于AI大模型的快速发展。

大模型正在开启一个新的时代

从云时代向大模型时代进化

信息社会先后经历了计算机、互联网、移动互联网和云计算等重要阶段。ChatGPT及一大批类似大模型的发展，标志着信息社会进入了大模型主导的新阶段。

根据陆奇提出的“信息-模型-行动”系统分析范式框架，计算机、互联网、移动互联网和云计算这四个标志性技术都是实现了信息获取的边际成本无限趋近零。大模型热潮标志着新拐点即将到来，社会各界获取模型的总成本将逐渐趋近固定成本，预示着模型将无处不在，万物都将成为它的载体。

未来，自动化行动将成为新的拐点，人在物理空间内“行动”的代价转向固定，人将与数字化技术构建出一个全新的智能系统，实现信息、模型和行动的无缝衔接。

这意味着人不再通过获取信息，利用人脑分析，自己去行动，而是智能系统自动获取低成本信息（数据），利用大模型，形成指令驱动各类系统（包括机器人）采取行动，从而对整个社会产生深远的影响和冲击，各类数字化系统也将基于大模型形成互联互通。

大模型时代的三大革命性变化

大模型推动弱人工智能向通用人工智能（AGI）跃升

2023年2月，OpenAI在ChatGPT成功的基础上，发布了通用人工智能路线图，建议逐步向AGI过渡，让大众、政策制定者和研究机构有时间了解AGI技术带来的改变。

谷歌也指出未来数年AGI将会得到普及，各种应用领域中的智能系统将具备与人类认知能力相持平的智力水平，能够胜任多种复杂任务。

大模型推动生产力从算力向机器人智力跃升

生产力的变革是推动人类社会进步的根本动力，从原始社会、农业社会、工业社会到信息社会，背后是人力、畜力、电力到算力的跃升。随着大模型成为新的物种，机器智力将成为新的主流生产力。

机器智力是智能算力与人类知识的扩展、集成和融合，大模型是机器智力的载体。随着大模型的不断进化和普及，其将成为经济社会的主流生产工具，重塑经济社会的生产方式，全面降低生产成本，提升经济效益。

大模型推动数字社会向智能社会跃升

首先AI，特别是AGI产业高度发展，带动智能算力相关基础设施投资，并基于大模型衍生出多种新业态和新市场，成为经济增长的核心引擎。

以智算中心为例，一个单位的智算中心投资，可带动AI核心产业增长约2.9-3.4倍、带动相关产业增长约36-42倍。GPT等各种大模型是人工智能时代的“操作系统”，将重构、重写数字化应用。

其次是有了AGI的加持，人类的能力和活动范围都将得到大幅提升，进一步从重复性的脑力劳动中解放出来。但是，需要注意到，大模型的普及也会给现有的教育、就业、舆论甚至全球的政治格局带来冲击，是需要政府和产业界共同研究的问题。

大模型发展的三个阶段和三次飞跃

自2022年11月30日ChatGPT发布以来，AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。

大模型的发展主要经历了三个阶段，分别是萌芽期、探索沉淀期和迅猛发展期，形成“百模大战”的竞争态势。

大模型发展的三个阶段

萌芽期（1950年-2005年）

以CNN为代表的传统神经网络模型阶段

1956年，从计算机专家约翰·麦卡锡提出“人工智能”概念开始，AI发展由最开始基于小规模专家知识逐步发展为基于机器学习。

1980年，卷积神经网络的雏形CNN诞生。

1998年，现代卷积神经网络的基本结构LeNet-5诞生，机器学习方法由早期基于浅层机器学习的模型，变为了基于深度学习的模型，为自然语言生成、计算机视觉等领域的深入研究奠定了基础，对后续深度学习框架的迭代及大模型发展具有开创性的意义。

探索沉淀期（2006年-2019年）

以Transformer为代表的全新神经网络模型阶段

2013年，自然语言处理模型Word2Vec诞生，首次提出将单词转换为向量的“词向量模型”，以便计算机更好地理解和处理文本数据。

2014年，被誉为21世纪最强大算法模型之一的GAN（对抗式生成网络）诞生，标志着深度学习进入了生成模型研究的新阶段。

2017年，Google颠覆性地提出了基于自注意力机制的神经网络结构——Transformer架构，奠定了大模型预训练算法架构的基础。

2018年，OpenAI和Google分别发布了GPT-1与BERT大模型，意味着预训练大模型成为自然语言处理领域的主流。在探索期，以Transformer为代表的全新神经网络架构，奠定了大模型的算法架构基础，使大模型技术的性能得到了显著提升。

迅猛发展期（2020年-至今）

以GPT为代表的预训练大模型阶段

2020年，OpenAI公司推出了GPT-3，模型参数规模达到了1750亿，成为当时最大的语言模型，并且在零样本学习任务上实现了巨大性能提升。随后，更多策略如基于人类反馈的强化学习（RHLF）、代码预训练、指令微调等开始出现，被用于进一步提高推理能力和任务泛化。

2022年11月，搭载了GPT3.5的ChatGPT横空出世，凭借逼真的自然语言交互与多场景内容生成能力，迅速引爆互联网。

2023年3月，最新发布的超大规模多模态预训练大模型——GPT-4，具备了多模态理解与多类型内容生成能力。

在迅猛发展期，大数据、大算力和大算法完美结合，大幅提升了大模型的预训练和生成能力以及多模态多场景应用能力。如ChatGPT的巨大成功，就是在微软Azure强大的算力以及wiki等海量数据支持下，在Transformer架构基础上，坚持GPT模型及人类反馈的强化学习（RLHF）进行精调的策略下取得的。

大模型技术发展路径

从技术的角度来讲，AI大模型通常是基于深度学习的神经网络，这些网络由数以百万计的参数组成，能够从大量数据中学习复杂的模式。

这些模型通过在大规模数据集上进行训练，能够理解和生成语言、识别图像内容，甚至在某些情况下，预测未来的趋势。

以ChatGPT为例，它使用来自人类反馈的强化学习（RLHF）来训练模型

首先，使用监督微调训练了一个初始模型，即人类AI训练员提供对话，他们在对话中扮演双方——用户和AI助手。其次，ChatGPT让标记者可以访问模型编写的建议，以帮助他们撰写回复。最后，ChatGPT将这个新的对话数据集与原有数据集混合，将其转换为对话格式。

具体来看，主要包括三个阶段：

第一阶段

训练监督策略模型

ChatGPT模型的训练过程中，需要标记者的参与监督过程。首先，ChatGPT会从问题数据集中随机抽取若干问题并向模型解释强化学习机制，其次标记者通过给予特定奖励或惩罚引导AI行为，最后通过监督学习将这一条数据用于微调GPT3.5模型。

第二阶段

训练奖励模型

这一阶段的主要目标，在于借助标记者的人工标注，训练出合理的奖励模型，为监督策略建立评价标准。

训练奖励模型的过程同样可以分为三步:

抽样出一个问题及其对应的几个模型输出结果
标记员将这几个结果按质量排序
将排序后的这套数据结果用于训练奖励模型

第三阶段

采用近端策略优化进行强化学习

近端策略优化（Proximal Policy Optimization，PPO）是一种强化学习算法，核心思路在于将Policy Gradient 中 On-policy的训练过程转化为Off-policy，即将在线学习转化为离线学习。

具体来说，也就是先通过监督学习策略生成PPO模型，经过奖励机制反馈最优结果后，再将结果用于优化和迭代原有的PPO模型参数。

往复多次第二阶段和第三阶段，从而得到参数质量越来越高的ChatGPT模型。

ChatGPT模型原理

从ChatGPT的训练原理中，我们不难发现，这一训练过程存在几个特点：

采用的是单一大模型

在ChatGPT模型兴起之前，大多数AI模型主要是针对特定应用场景需求进行训练的小模型，存在通用性差、训练数据少、适应范围小的弊端。

而我们看到，ChatGPT虽然在过程中使用了奖励模型等辅助手段，但最终用于实现自然语言理解和生成式功能的主模型只有一个，但却在语义理解、推理、协作等方面表现出了更强能力。因此，ChatGPT的成功，验证了参数增长、训练数据量增大，对AI模型的重要意义。

采用的是小样本学习方法

在小样本学习（Few-shot Learning）方法下，AI预训练模型在不必使用大量标记的训练数据，就可以建立起比较通用的泛化能力。

简单来说，小样本学习即是在给定有限信息和较少训练数据的情况下，尝试对总体规律进行理解和预测，这一过程类似于“学习如何去学习”。

对于小样本学习在ChatGPT中的应用，我们认为，这一方法解决了大模型数据标注工作量巨大的问题，是模型得以迅速迭代的基础。

采用人类反馈微调监督学习

ChatGPT是从GPT3.5（即Instruct GPT）改进而来的版本，相比于前代，ChatGPT主要变化在于采用了人类反馈机制，对监督学习过程进行微调。本质上来说，无论是大模型还是小样本学习，解决的目标都是提升训练的效率，但真正令ChatGPT实现结果准确、合理的关键技术，还是在于加入了人类反馈。

据LongOuyang等人2022年发表的《Training language models to follow instructions with human feedback》，InstructGPT仅用13亿个参数就实现了比1750亿个参数的GPT-3更优的输出结果，显著提升了真实性、减少了有害信息的输出。

大模型的应用之路

目前，AI大模型已经在医疗、金融、教育、制造等多领域得到了广泛应用。

医疗领域

AI大模型可以帮助医生进行疾病诊断和治疗方案制定，提高诊断准确率和治疗效果。

金融领域

AI大模型可以用于风险评估、信用评级、投资决策等方面，提高金融服务的智能化水平和风险控制能力。

教育领域

AI大模型可以根据学生的学习情况和反馈进行智能化的教学设计和推荐，提高教学质量和学生学习效果。

制造领域

AI大模型可以实现智能制造、智能监控、智能维护等方面的应用，提高生产效率和产品质量。

随着AI大模型的落地加速，各行业应用生态也在加速形成。越来越多的企业和机构开始将AI大模型技术应用于自身的业务中，探索新的商业模式和创新点，为各行业提供更加智能化、高效化的解决方案和服务。

阅读完本章内容

您对AI大模型有什么想要进一步了解的

欢迎评论区留言，一起探讨~

---

内容：李晓萌

校对：李宇凡

排版：龚泓月

【参考】

AI、AIGC、AGI、ChatGPT：一文搞懂它们的区别

AI三重问：什么是AI？什么是AI模型？什么是AI大模型？

迎接大模型时代：大模型发展简史及攻略

ChatGPT技术路线分析

人工智能行业研究报告：AI+行业应用第二弹

修改于

继续滑动看下一个

时代凌宇

向上滑动看下一个

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

AI大模型 | AI大模型概览

大模型发展的三个阶段和三次飞跃

自2022年11月30日ChatGPT发布以来，AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

桐城一派｜倒在“跨年夜”的龚书记，13个字换来免职调查冤不冤？

比佟丽娅还恋爱脑，怀孕7次流产4次，目睹丈夫背叛却选择原谅

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

生成图片，分享到微信朋友圈

AI大模型 | AI大模型概览

大模型发展的三个阶段和三次飞跃

自2022年11月30日ChatGPT发布以来，AI大模型在全球范围内掀起了有史以来规模最大的人工智能浪潮。

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡