8家大模型获批上线!百度商汤王小川在列,「文心一言们」终开放
文|苏建勋 邓咏仪 尚恩
智能涌现深夜获悉,8月31日凌晨,备受行业瞩目的首批大模型产品获批名单终于出炉,当中既有巨头企业,也包含了创业公司与科研院校,具体的企业机构包括:
五家北京企业机构:百度(文心一言)、抖音(云雀大模型)、智谱AI(GLM大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)
三家上海企业机构:商汤(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)
产品获批后,上述企业机构的大模型产品,即可在网站/应用商店下载后直接使用。以百度旗下的“文心一言”为例,智能涌现尝试后发现,8月30日晚23点前后,文心一言的APP已经能公开使用,此前则需要排队领取内测资格。
△百度“文心一言”内测排队页面,目前已完全开放
8月31日零点刚过,百度官方公众账号即发布推文,称“文心一言向全社会开放”,用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。未来,百度还将开放一批经过全新重构的AI原生应用。
随后,百川智能正式宣布:从今日起,百川大模型面向全社会开放服务。商汤官方也对外表示:商汤旗下大模型应用“商量SenseChat”即日起全面向广大用户开放服务。
今年大模型爆火以来,监管层面一直有相关政策落地。生成式AI产品涉及用户数据安全,正式上线前除了要进行算法备案外,还需要向相关部门申报安全评估。
4月11日,国家互联网信息办公室发布的关于《生成式人工智能服务管理办法(征求意见稿)》提出,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。同时,利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。
6月20日,国家互联网信息办公室发布了关于深度合成服务算法备案信息的公告,公开发布境内深度合成服务算法备案信息。根据公告附件的清单,共有41个深度合成服务算法被纳入清单,涵盖美团、快手、淘宝、大麦、酷狗音乐、百度文心一格等多个热门应用。
从备案到获批上线,国内大模型企业终于有了明确的政策准入。率先获批的企业,可以优先推出面向To C广大用户的AI产品,这意味着在用户积累、数据获取与产品打磨上能占据主导权。
百度创始人、董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。
以下为首批获批上线的大模型企业介绍:
百度-文心一言大模型
百度“文心一言”为国内首个、全球大厂中首个生成式AI产品,于2023年3月16日开启邀测,基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。
抖音集团-云雀大模型
8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据悉“豆包”是基于抖音云雀模型开发,提供聊天机器人、写作助手以及英语学习助手等功能。目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。
智谱AI-GLM大模型
成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。
当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。
基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
百川智能-百川大模型
百川成立于2023年,由搜狗创始人王小川创立。今年6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。
中科院自动化研究所-紫东太初大模型
中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。
“紫东太初”目前参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。
商汤-日日新大模型
今年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,据悉其参数达千亿级规模。
Minimax-ABAB大模型
Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。
在模型层,Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,并推出自研通用大模型“ABAB”。
Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。
上海人工智能实验室-书生大模型
上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。
2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。
36氪旗下AI公众号