DeepLink桥接新兴算力,书生覆盖全能生成
11月26日,第三届算力网络与数字经济论坛暨2024年“算力浦江”总结大会在上海举行。会上,上海人工智能实验室(上海AI实验室)发布了开放计算及通专融合大模型的最新成果:首次在大模型训练中实现了全面由国产新兴算力异构互联技术支撑,完整训练出全能多模态生成大模型——书生·若明(InternLumina)。
发挥原创算法及AI软硬件深度互联技术优势,上海AI实验室联合无问芯穹、天数智芯、沐曦科技及算丰信息等新兴算力提供方开展跨域异构互联技术探索,实现了异构混训技术新突破:实验结果表明,书生·若明在新兴算力组成的异构集群中混训效率达97.5%,计算效率较未优化前提升1.6倍。
书生·若明的能力范围涵盖覆盖多轮对话、视觉理解、可控生成、多轮编辑等多模态生成任务,可精准应对实际应用场景中的复杂挑战。在生成技术领域,上海AI实验室研究团队通过打造协同发展的算法框架,在兼具通用生成能力和专业泛化能力的“通专融合”技术路径上更进一步。
会上还发布了由上海市通信管理局的指导,实验室联合中国电信等机构主导制定的《智算中心能力验收规范》团体标准。以DeepLink人工智能开放计算体系为载体,上海AI实验室将持续推动人工智能软硬件深度耦合,与行业伙伴共同推动新兴算力高效应用与AI基础设施建设。
全能生成:精准应对复杂挑战
图像理解器支持中英双语,支持高分辨率及任意分辨率的内容标注,用户可灵活定义从简单标签到长文本描述的多粒度内容理解方式,为其它任务构建坚实的基础;
图像生成模型针对中文社区AI创作的痛点,用户可通过中英双语生成多文化、多领域、多风格的高质量图像;
扩散视频生成模型可支持任意时长、任意分辨率、多种风格的视频生成;
全能生成模型全面涵盖多轮对话、视觉理解、可控生成、多轮编辑等多种任务,为多领域的智能生成提供强大的技术支撑。
异构混训:验证新兴算力跨域协同潜能