2023人工智能大事件回顾丨中国AI大模型篇

刘典

2024-09-17

The following article is from 清华大学人工智能国际治理研究院 Author I-AIIG

点关注不迷路，加星标★更好找

Follow & Favourite

2023

人工智能中国AI大模型大事件

清华大学人工智能国际治理研究院AI2023人工智能大事件回顾
中国大模型篇

-2023 Annual Major Events-

2月

全国首个人工智能公共算力平台在上海正式投用

2月20日，全国首个人工智能（AI）公共算力平台在上海正式投用，该平台依托上海超级计算中心建设及运用，将用于满足科研机构和广大中小微企业实际算力需求，探索算力调度新模式。

2月

国内第一个对话式大型语言模型MOSS发布

2月，国内第一个对话式大型语言模型MOSS由邱锡鹏教授团队发布至公开平台邀公众参与内测，为国内首个发布的类ChatGPT模型。复旦大学计算机科学技术学院教授、MOSS 系统负责人邱锡鹏表示：“这是国内第一个插件版对话语言模型，能使用搜索引擎、图像生成模型、方程求解器等外部工具，为用户提供越来越多的服务。GPT-4 也能接入各种插件，这种能力在大模型落地应用过程中会很有价值。〞整体而言，MOSS 基于公开的中英文数据训练，目前已经拥有200亿参数，具有和人类对话的能力，并可以通过与人类交互实现迭代优化。

3月

百度大语言模型产品“文心一言”正式发布

3月16日，百度大语言模型产品“文心一言”正式发布，这是继OpenAI发布ChatGPT后，中国第一款生成式语言大模型产品，具备五大能力：文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。7个月后，文心大模型4.0问世，同步开始邀测，并带来全线重构的新搜索等十余款AI原生应用。

4月

大模型创企百川智能成立

4月10日，前搜狗CEO王小川、前搜狗COO茹立云联手成立国内大模型创企百川智能。1个月后，百川智能拿到了来自腾讯、小米、金山、清华大学资产管理有限公司等十余家机构的联合投资，整体估值超10亿美元。半年内，百川智能已经发布超7款大模型，参数规模从10亿到超百亿不等，覆盖开源、闭源。

4月

知乎推出首个中文大模型“知海图 AI〞

4月，知乎推出首个中文大模型“知海图 AI〞，该大模型在成熟大模型CPM-Bee 基础上研发，拥有千亿级参数，具备更强的逻辑推理能力，更快的训练和推理速度。“知海图 A〞在公司业务提效上收益显著，其在分层、分类、兴趣理解、搜索等业务场景广泛应用大模型能力，人工标注量降低了 90%以上，业务准召效果普遍提升了15%以上。

5月

科大讯飞正式发布“讯飞星火认知大模型”

5月6日，科大讯飞正式发布“讯飞星火认知大模型”，在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。6月，讯飞星火认知大模型通过中国信通院组织的国内首个官方可信AIGC大模型基础能力（功能）评测，并且获得认证通过全部功能项。10月，讯飞星火认知大模型V3.0版本发布，七大能力持续提升，整体超越ChatGPT，医疗六大核心能力超越GPT-4。

7月

华为正式发布人工智能大模型华为云盘古大模型3.0

7月7日，华为正式发布人工智能大模型华为云盘古大模型3.0——面向行业的大模型系列包括“5+N+X”三层架构，包括底层（L0）的通用大模型、第二层（L1）的行业大模型和第三层（L2）的细分场景模型。在金融、金融制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。

7月

京东发布言犀大模型

7月13日，在2023京东全球科技探索者大会暨京东云峰会上，京东言犀大模型正式推出。与通用大模型不同，京东言犀大模型是立足于产业研发的。它融合了 70%通用数据与 30%数智供应链原生数据，具有“更高产业属性、更强泛化能力、更多安全保障”的优势，致力于各种产业场景，解决真实的产业问题。言犀大模型已经在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。此外，在内部经营管理方面，京东尝试将大模型应用于系统代码辅助编写，实现了20%以上的效率提升；也开始测试 AIGC 自动生成商品营销图文的能力，目前已推广至 2000 多个零售三级品类。

7月

网易有道发布国内首个教育领域垂直大模型“子曰”

7月26日，网易有道发布国内首个教育领域垂直大模型“子曰”，同时陆续推出搭载“子曰”教育大模型的六大应用成果——虚拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答。该模型拥有更专业的预训练语料，可以依据用户的不同学习场景下需求，向其提供对话。

8月

中国首颗AI卫星成功发射

8月10日，中国首颗以人工智能（AI）载荷为核心、具备智能操作系统的智能应急卫星“地卫智能应急一号”（又名WonderJourney-1A，简称WJ-1A），在酒泉发射中心成功发射并进入预定轨道。

8月

抖音宣布开始对外测试 AI 对话产品 “豆包”

8月17日，抖音集团（前字节跳动）宣布开始对外测试 AI 对话产品 “豆包”。据称，“豆包〞是字节跳动公司基于云雀模型开发的 AI 工具，提供聊天机器人、写作助手以及英语学习助手等功能，它可以回答各种问题并进行对话，帮助人们获取信息，支持网页 web 平台，i0s 以及安卓平台，但 ios 需要使用TestFlight 安装。

9月

腾讯混元大语言模型正式亮相

2023年9月7日，腾讯混元大语言模型在2023腾讯全球数字生态大会上正式亮相，并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型。混元大模型拥有超干亿参数规模，预训练语料超2万亿tokens，具有强大的中文理解与创作能力、逻辑推理能力，以及可靠的任务执行能力。在多个场景下，腾讯混元大模型已经能够处理超长文本，通过位置编码优化技术，混元大模型对于长文处理效果和性能得到了提升。并且混元大模型还具有识别“陷阱”的能力，简单来说就是通过强化学习方法拒绝被 “诱导〞。

9月

阿里云“通义千问”大模型向公众开放

9月13日，阿里云宣布其最新的人工智能大模型“通义千问”已经通过备案，并表示将开源一个更大参数规模的大模型版本，供全社会免费商用。该举措旨在降低大模型使用门槛，推动人工智能技术发展与普及。

9月

金山办公宣布WPS AI已接入金山办公全线产品

9月，金山办公官方宣布，基于大语言模型的智能办公助手WPS AI已接入金山办公全线产品，邀请用户体验全组件 AI 功能。金山办公将应用大模型重构办公软件，为每一位用户提供 AIGC（内容创作）、Copilot（智慧助理）和Insight（知识洞察）三方面全新的产品体验。WPS AI 作为协同办公赛道的类ChatGPT式应用 ,己接入 WPS 文字、演示、表格、PDF、金山文档等产品线，解决用户在内容生成、内容理解、指令操作等方面的日常办公难题。公司率先实现大语言模型在各端落地，构建稳定的 Office基建服务，并为 AI 功能提供简洁的交互框架、接入指南和准入标准，确保产品的智能化体验。

10月

中国原生大模型ChatGLM3发布

10月27日，智谱AI于2023中国计算机大会（CNCC）上，推出了全自研的第三代基座大模型ChatGLM3 及相关系列产品。在全新升级的ChatGLM3 赋能下，生成式 AI 助手智谱清言已成为国内首个具备代码交互能力的大模型产品（Code Interpreter），可支持图像处理、数学计算、数据分析等使用场景。

10月

百川智能宣布推出 Baichuan2-192K 大模型

10月30日，百川智能宣布推出 Baichuan2-192K 大模型，其上下文窗口长度高达 192K，能够多处理约 35 万个汉字。据悉，Baichuan2-192K 将以API调用和私有化部署的方式提供给企业用户。目前百川智能已经启动该大模型的API 内测，并开放给法律、媒体、金融等行业的核心合作伙伴。

主理人丨刘典

文案丨陶含孜

排版丨赵杨博

校审丨王祚

终审丨梁正鲁俊群

关于我们

清华大学人工智能国际治理研究院（Institute for AI International Governance, Tsinghua University，THU I-AIIG）是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势，研究院面向人工智能国际治理重大理论问题及政策需求开展研究，致力于提升清华在该领域的全球学术影响力和政策引领作用，为中国积极参与人工智能国际治理提供智力支撑。

新浪微博：@清华大学人工智能国际治理研究院

微信视频号：THU-AIIG

Bilibili：清华大学AIIG

【全球AI战略洞察】栏目由清华大学人工智能国际治理研究院推出，旨在通过对当前人工智能领域发生的重要信息进行“标注、提炼、解读”，剖析全球AI治理各国家间不同的战略图景，以此描绘人工智能治理领域的国际格局。

栏目主理人：刘典

本文首发于：微信公众号@清华大学人工智能国际治理研究院

——END——

点关注不迷路，加星标更好找

近期内容 ●●

// 1

｜信息量巨大！深化整治金融、国企、能源、医药和基建工程腐败，10个要点读懂中央纪委第三次全体会议

// 2

｜数字经济成为推动共同富裕关键一环，8个要点读懂《数字经济促进共同富裕实施方案》

// 3

｜数据局局长首谈“数据要素x”与“互联网+”的区别，5个要点详解刘烈宏北大光华新年论坛的讲话

// 4

｜从3个坚持、6个要求看如何进一步完善国有资本经营预算制度 | 宏观金融观察系列 ①

// 5

｜2024年金融工作要推进这10项重点工作，4个要点详解中国人民银行工作会议 | 宏观金融观察系列 ②

往期系列内容

点击图片，查看更多

加入全球政经观察员

加微信“x-923604517”拉你入群

刘典

复旦大学中国研究院副研究员

《技术经济与管理研究》总编辑

主要研究领域为数字经济、数字货币、网络与数据治理，国际政治经济学等。

个人专著包括《非常法史》、《法眼看民国》、《政策沟通：国际合作引擎》；参与编著《“一带一路”大百科》《读懂“一带一路”》《破解中国经济十大难题》、《中国改革大趋势》等。

在《中国金融》、《文化纵横》、《人民论坛》等核心期刊发表十多篇研究论文，在《光明日报》、《经济日报》、《解放军报》、《北京日报》等数十家权威纸媒发表近百篇评论文章。

素材来源官方媒体/网络新闻

继续滑动看下一个

刘典

向上滑动看下一个

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“上海王”柯庆施之死的真相

毕业论文辅导| 你又不是伞，硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞！

缺人：60r/次，立结~

2023人工智能大事件回顾丨中国AI大模型篇

您可能也对以下帖子感兴趣

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“上海王”柯庆施之死的真相

毕业论文辅导| 你又不是伞，硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞！

缺人：60r/次，立结~

生成图片，分享到微信朋友圈

2023人工智能大事件回顾丨中国AI大模型篇

您可能也对以下帖子感兴趣