查看原文
其他

2023人工智能大事件回顾丨中国AI大模型篇

刘典
2024-09-17

The following article is from 清华大学人工智能国际治理研究院 Author I-AIIG



点关注不迷路,加星标★更好找

Follow & Favourite


2023
人工智能中国AI大模型大事件
KNOW年度大事件
清华大学人工智能国际治理研究院AI2023人工智能大事件回顾
中国大模型篇

-2023 Annual Major Events-





2月

全国首个人工智能公共算力平台在上海正式投用






2月20日,全国首个人工智能(AI)公共算力平台在上海正式投用,该平台依托上海超级计算中心建设及运用,将用于满足科研机构和广大中小微企业实际算力需求,探索算力调度新模式。

2月

国内第一个对话式大型语言模型MOSS发布






2月,国内第一个对话式大型语言模型MOSS由邱锡鹏教授团队发布至公开平台邀公众参与内测,为国内首个发布的类ChatGPT模型。复旦大学计算机科学技术学院教授、MOSS 系统负责人邱锡鹏表示:“这是国内第一个插件版对话语言模型 ,能使用搜索引擎、图像生成模型、方程求解器等外部工具,为用户提供越来越多的服务。GPT-4 也能接入各种插件,这种能力在大模型落地应用过程中会很有价值。〞整体而言,MOSS 基于公开的中英文数据训练,目前已经拥有200亿参数,具有和人类对话的能力,并可以通过与人类交互实现迭代优化。

3月

百度大语言模型产品“文心一言”正式发布






3月16日,百度大语言模型产品“文心一言”正式发布,这是继OpenAI发布ChatGPT后,中国第一款生成式语言大模型产品,具备五大能力:文学创作、商业文案创作、数理逻辑 推算、中文理解、多模态生成。7个月后,文心大模型4.0问世,同步开始邀测,并带来全线重构的新搜索等十余款AI原生应用。



4月

大模型创企百川智能成立






4月10日,前搜狗CEO王小川、前搜狗COO茹立云联手成立国内大模型创企百川智能。1个月后,百川智能拿到了来自腾讯、小米、金山、清华大学资产管理有限公司等十余家机构的联合投资,整体估值超10亿美元。半年内,百川智能已经发布超7款大模型,参数规模从10亿到超百亿不等,覆盖开源、闭源。



4月

知乎推出首个中文大模型“知海图 AI〞






4月,知乎推出首个中文大模型“知海图 AI〞,该大模型在成熟大模型CPM-Bee 基础上研发,拥有千亿级参数,具备更强的逻辑推理能力,更快的训练和推理速度。“知海图 A〞 在公司业务提效上收益显著,其在分层、分类、兴趣理解、搜索等业务场景广泛应用大模型能力,人工标注量降低了 90%以上,业务准召效果普遍提升了15%以上。



5月

科大讯飞正式发布“讯飞星火认知大模型”






5月6日,科大讯飞正式发布“讯飞星火认知大模型”,在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。6月,讯飞星火认知大模型通过中国信通院组织的国内首个官方可信AIGC大模型基础能力(功能)评测,并且获得认证通过全部功能项。10月,讯飞星火认知大模型V3.0版本发布,七大能力持续提升,整体超越ChatGPT,医疗六大核心能力超越GPT-4。



7月

华为正式发布人工智能大模型华为云盘古大模型3.0






7月7日,华为正式发布人工智能大模型华为云盘古大模型3.0——面向行业的大模型系列包括“5+N+X”三层架构,包括底层(L0)的通用大模型、第二层(L1)的行业大模型和第三层(L2)的细分场景模型。在金融、金融制造、医药研发、煤矿、铁路等诸多行业发挥着巨大价值。



7月

京东发布言犀大模型






7月13日,在2023京东全球科技探索者大会暨京东云峰会上,京东言犀大模型正式推出。与通用大模型不同,京东言犀大模型是立足于产业研发的。它融合了 70%通用数据与 30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于各种产业场景,解决真实的产业问题。言犀大模型已经在消费导购、商家经营、客服售后、医疗问诊等多个供应链场景中试点接入。此外,在内部经营管理方面,京东尝试将大模型应用于系统代码辅助编写,实现了20%以上的效率提升;也开始测试 AIGC 自动生成商品营销图文的能力,目前已推广至 2000 多个零售三级品类。





7月

网易有道发布国内首个教育领域垂直大模型“子曰”






7月26日,网易有道发布国内首个教育领域垂直大模型“子曰”,同时陆续推出搭载“子曰”教育大模型的六大应用成果——虚拟人口语教练Hi Echo、LLM翻译、AI作文指导、语法精讲、AIBox、文档问答。该模型拥有更专业的预训练语料,可以依据用户的不同学习场景下需求,向其提供对话。





8月

中国首颗AI卫星成功发射



8月10日,中国首颗以人工智能(AI)载荷为核心、具备智能操作系统的智能应急卫星“地卫智能应急一号”(又名WonderJourney-1A,简称WJ-1A),在酒泉发射中心成功发射并进入预定轨道。


8月

抖音宣布开始对外测试 AI 对话产品 “豆包”



8月17日,抖音集团(前字节跳动)宣布开始对外测试 AI 对话产品 “豆包”。据称,“豆包〞是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 web 平台,i0s 以及安卓平台,但 ios 需要使用TestFlight 安装。


9月

腾讯混元大语言模型正式亮相



2023年9月7日,腾讯混元大语言模型在2023腾讯全球数字生态大会上正式亮相,并宣布通过腾讯云对外开放。这是腾讯首次披露的通用大语言模型。混元大模型拥有超干亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力 ,以及可靠的任务执行能力。在多个场景下,腾讯混元大模型已经能够处理超长文本,通过位置编码优化技术,混元大模型对于长文处理效果和性能得到了提升。并且混元大模型还具有识别“陷阱”的能力,简单来说就是通过强化学习方法拒绝被 “诱导〞。


9月

阿里云“通义千问”大模型向公众开放



9月13日,阿里云宣布其最新的人工智能大模型“通义千问”已经通过备案,并表示将开源一个更大参数规模的大模型版本,供全社会免费商用。该举措旨在降低大模型使用门槛,推动人工智能技术发展与普及。


9月

金山办公宣布WPS AI已接入金山办公全线产品



9月,金山办公官方宣布,基于大语言模型的智能办公助手WPS AI已接入金山办公全线产品,邀请用户体验全组件 AI 功能。金山办公将应用大模型重构办公软件 ,为每一位用户提供 AIGC(内容创作)、Copilot( 智慧助理)和Insight(知识洞察)三方面全新的产品体验。WPS AI 作为协同办公赛道的类ChatGPT式应用 ,己接入 WPS 文字、演示、表格、PDF、金山文档等产品线,解决用户在内容生成、内容理解、指令操作等方面的日常办公难题。公司率先实现大语言模型在各端落地,构建稳定的 Office基建服务,并为 AI 功能提供简洁的交互框架、接入指南和准入标准,确保产品的智能化体验。


10月

中国原生大模型ChatGLM3发布



10月27日,智谱AI于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型ChatGLM3 及相关系列产品。在全新升级的ChatGLM3 赋能下,生成式 AI 助手智谱清言已成为国内首个具备代码交互能力的大模型产品(Code Interpreter),可支持图像处理、数学计算、数据分析等使用场景。

10月

百川智能宣布推出 Baichuan2-192K 大模型



10月30日,百川智能宣布推出 Baichuan2-192K 大模型,其上下文窗口长度高达 192K,能够多处理约 35 万个汉字。据悉,Baichuan2-192K 将以API调用和私有化部署的方式提供给企业用户。目前百川智能已经启动该大模型的API 内测,并开放给法律、媒体、金融等行业的核心合作伙伴。


主理人丨刘典

文案丨陶含孜

排版丨赵杨博

校审丨王祚

终审丨梁正 鲁俊群



关于我们

清华大学人工智能国际治理研究院(Institute for AI International Governance, Tsinghua University,THU I-AIIG)是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势,研究院面向人工智能国际治理重大理论问题及政策需求开展研究,致力于提升清华在该领域的全球学术影响力和政策引领作用,为中国积极参与人工智能国际治理提供智力支撑。



新浪微博:@清华大学人工智能国际治理研究院

微信视频号:THU-AIIG

Bilibili:清华大学AIIG





【全球AI战略洞察】栏目由清华大学人工智能国际治理研究院推出,旨在通过对当前人工智能领域发生的重要信息进行“标注、提炼、解读”,剖析全球AI治理各国家间不同的战略图景,以此描绘人工智能治理领域的国际格局。


栏目主理人:刘典
本文首发于:微信公众号@清华大学人工智能国际治理研究院



——END——



点关注不迷路,加星标更好找

近期内容 ●●

// 1

信息量巨大!深化整治金融、国企、能源、医药和基建工程腐败,10个要点读懂中央纪委第三次全体会议

// 2

数字经济成为推动共同富裕关键一环,8个要点读懂《数字经济促进共同富裕实施方案》

// 3

数据局局长首谈“数据要素x”与“互联网+”的区别,5个要点详解刘烈宏北大光华新年论坛的讲话

// 4

从3个坚持、6个要求看如何进一步完善国有资本经营预算制度 | 宏观金融观察系列 ①

// 5

2024年金融工作要推进这10项重点工作,4个要点详解中国人民银行工作会议 | 宏观金融观察系列 ②

往期系列内容

点击图片,查看更多


加入全球政经观察员
加微信“x-923604517”拉你入群


 

刘典

复旦大学中国研究院副研究员

《技术经济与管理研究》总编辑


主要研究领域为数字经济、数字货币、网络与数据治理,国际政治经济学等。


个人专著包括《非常法史》、《法眼看民国》、《政策沟通:国际合作引擎》;参与编著《“一带一路”大百科》《读懂“一带一路”》《破解中国经济十大难题》、《中国改革大趋势》等。


在《中国金融》、《文化纵横》、《人民论坛》等核心期刊发表十多篇研究论文,在《光明日报》、《经济日报》、《解放军报》、《北京日报》等数十家权威纸媒发表近百篇评论文章。

素材来源官方媒体/网络新闻
继续滑动看下一个
刘典
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存