上海AI实验室与商汤科技联合多家高校发布书生通用大模型体系|WAIC 2023
7月6日,2023世界人工智能大会(WAIC 2023)隆重开幕。在开幕式和科学前沿全体会议上,上海人工智能实验室(上海AI实验室)与商汤科技联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的“书生通用大模型体系”(以下简称“书生大模型”),包括书生·多模态、书生·浦语和书生·天际等三大基础模型,以及首个面向大模型研发与应用的全链条开源体系。
“书生”(INTERN)自2021年发布后历经数次升级,从国内首个覆盖多种视觉任务的通用大模型,逐步升级为涵括视觉、语言和三维等在内的大模型体系。基于书生大模型,上海AI实验室联合团队夺得计算机视觉顶级会议CVPR 2023最佳论文奖,为近40年来署名全部为中国学术机构的文章首次获此殊荣。
书生多模态大模型:实现开放世界理解、多模态生成与交互
如同人类是通过多种信息认识世界,让AI模型认知和理解现实世界,也需要突破单一模态,融合视觉、语言、语音等多种模态信息。此次发布的书生多模态模型(InternLMM,Intern Large Multimodal Model)包含200亿参数,使用80亿多模态样本训练。书生多模态大模型可通过自然语言定义各种任务,实现开放世界理解,支持多模态生成和跨模态交互,并支持350万语义标签的识别和理解,覆盖开放世界常见的类别和概念。书生体系在80多种多模态和视觉评测任务中性能领先,超过了谷歌、微软、OpenAI等研发的同类模型。
书生·浦语大模型全面升级,多项评测超越 ChatGPT
第一,语境窗口的长度从2K提升到8K,这使其具备了理解长输入、展开复杂推理、以及进行长时间多轮对话的能力;
第二,多语种和结构化表达能力进一步加强,新版模型支持二十多种语言,还可通过表格和图表等方式汇总与呈现复杂信息;
第三,多维度能力全面提升,在42个主流评测集上性能明显提升,在其中35个评测集上性能超越了ChatGPT。
多维度能力全面提升,在42个主流评测集上性能明显提升,在其中35个评测集上性能超越了ChatGPT
第四,数理逻辑能力明显进步,大幅提高了数值计算、函数运算、方程求解等数理能力,在数学评测集 GSM8K 上性能从62.9提高到73.2,在2023年高考数学选择题上,正确率提升超过70%;
第五,安全与对齐能力显著增强,通过更有效的指令微调,包括基于人类反馈的强化学习(RLHF),新版模型可以更可靠地遵循人类指令,安全性也得到明显改善。
书生·浦语开源体系:覆盖全链条五大环节
上海AI实验室林达华教授表示:“在大模型时代,基座模型和相关的工具体系是大模型创新的技术基石。通过书生·浦语的高质量全方位开源开放,我们希望可以助力大模型的创新和应用,让更多的领域和行业受惠于大模型变革的浪潮。”
InternLM-7B 在包含40个评测集的全维度评测中展现出卓越且平衡的性能,全面领先现有开源模型。值得一提的是,它在两个被广泛采用的基准 MMLU 和 CEval 上分别取得了50.8和52.8的高分,刷新了7B量级模型的世界纪录。
此外,书生·浦语还开源了全链条工具体系,涵盖数据、预训练、微调、部署和评测五大环节。
在数据环节,通过OpenDataLab开放了包含30多种模态的5500公开数据集,其中在自然语言方面开放了超过10000亿token的高质量语料。
在预训练环节,开源了面向轻量级语言大模型的训练框架 InternLM-Train,支持从8卡到1024卡并行训练,提出了Hybrid-Zero独特技术,性能领先行业水平。
在微调环节,开源了全流程微调工具,支持SFT、RLHF,还支持训练模型进行复杂的符号计算和工具调用,通过代码解决复杂的数学计算问题。
在部署环节,开源了部署推理工具链LMDeploy。支持十亿到千亿参数语言模型的高效推理,性能超越 HuggingFace、Deepspeed、vLLM等主流推理框架。
在评测环节,上线了开放评测平台 OpenCompass,支持大模型的一站式、全方位评测,包含超过40个评测集、30万评测题目。通过全自动分布式评测,保障开源模型性能可高效复现。
书生·天际:全球首个城市级NeRF实景三维大模型
目前,书生·天际已实现对100平方公里范围进行城市实景建模,分辨率精度可达4K;并支持对全范围的高精度实时渲染,以及城市级编辑、风格化转换等功能。未来,上海AI实验室将对书生·天际的建模范围和功能进行扩展,并对书生·天际的算法、算子和系统全部进行开源。
全球首个城市级NeRF实景三维大模型——书生·天际
实景三维是对一定范围内人类生产、生活和生态空间进行真实、立体、时序化反映和表达的数字空间。
书生·天际集算法、算子、计算系统为一体,在模型层面提出一种新的实景三维模型表征和训练范式,在高效训练的同时,可以准确表征大规模三维城市场景,并且达到高质量的神经渲染效果。书生·天际在高精度建模、高精度渲染、功能可扩展性、训练交互一体化四个方面取得领先。
支持创新 赋能应用
在自动驾驶方面,上海AI实验室联合团队的研究成果《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)摘取CVPR最佳论文奖,首次提出感知决策一体化的自动驾驶通用大模型UniAD,使自动驾驶更智能。
在智慧医疗方面,上海AI实验室牵头推出了全球首个医疗多模态基础模型群“OpenMEDLab浦医”,为人工智能大模型在医疗领域的快速发展、高效落地提供了坚实的基础。
在地球科学方面,全球中期天气预报大模型“风乌”首次实现气象有效预报时间首破10天,同时“风乌”仅需30秒即可生成未来10天全球高精度预报结果,在效率上大幅优于传统模型。
书生大模型包括书生·多模态、书生·浦语和书生·天际等三大基础模型,以及首个面向大模型研发与应用的全链条开源体系