分享一下,我们在大模型生态的最新进展
日前,由中国工程院院刊《Engineering》、中国人工智能学会、中国工程院院刊信息与电子工程领域分刊《FITEE》联合主办的Engineering大讲堂暨“智行中国”第五期系列论坛在浙江大学举行,本次论坛公布了一系列大模型相关进展。
基于通义千问7B模型的智海-三乐教育大模型发布
浙江大学联合高等教育出版社、阿里云等发布基于通义千问7B(70亿参数)模型训练的智海-三乐教育垂直大模型,该模型已在阿里云灵积平台(DashScope)上线服务,开发者仅需一行代码即可使用。
三乐出自《孟子》“得天下英才而教育之,三乐也”,这是教育一词的起源,寓意重视教育是亘古不变的话题。智海-三乐以阿里云通义千问7B通用模型为基座,基于核心教材、领域论文和学位论文等教科书级高质量语料和专业指令数据集继续预训练和微调,集成了搜索引擎、计算引擎和本地知识库等功能,将于9月在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。
浙江大学教授吴飞介绍:“智海-三乐富有创造力,它生成的回答并非教科书已有标准答案,而是模型通过预测下一个token以及人说话、做事的能力合成出来的精彩回答。”
目前智海-三乐已通过阿里云灵积平台(DashScope)对外提供API服务。借助灵积平台的统一SDK接口,智海三乐大模型可获取云上高效推理能力,方便被开发者集成。未来该模型还将基于灵积平台提供的高效微调训练能力、插件框架等配套设施,系统化的拓展模型覆盖面和效果。
阿里云正积极建设自研和行业大模型生态,灵积平台已托管了通义千问、Stable Diffusion、ChatGLM-v2、百川、姜子牙、LLaMa2等业界领先的大模型。不久前,阿里云还在AI模型社区魔搭ModelScope开源通义千问7B参数通用模型和对话模型。
阿里云参与起草行业首个法律大模型评估指标体系
在本次论坛上,智慧司法技术总师系统、浙江大学、上海交通大学与阿里云等联合发布了行业首个《法律大模型评估指标和测评方法(征求意见稿)》,旨在推动法律大模型的研发、评测和应用的规范化。
过去几年,用AI辅助司法工作者提升案件处理的效率已成行业共识,随着大模型的诞生进,AI对案件理解、分析及法律文书生成、报告生成的能力进一步提升,目前,国内企业和高校研究团队已推出多个法律大模型,行业迫切需要一套面向法律AI行业的评估指标和评测方法。
作为行业首个《法律大模型评估指标和测评方法(征求意见稿)》,其涵盖法律大模型能力体系、评估指标、测评方法、典型应用场景等内容,适用于法律大模型系统测试的设计和实施等任务场景。
在评测方法内容中,针对特定任务,意见稿提出需从功能、性能、安全、质量四个方面共12项指标,为法律大模型测评提供各项指标的选择、评分和计算方法,最终获得该项任务的性能测评结果。
智慧司法技术总师许建峰表示:“大模型为法律人工智能领域带来了新的机遇,推出指标体系是指导行业规范化的基础,我们希望更多行业从业者提供反馈和意见,并进一步完善法律大模型的评估标准,促进法律人工智能更好更快的发展。”
阿里云在法律AI领域已发表数十篇国际顶会论文,团队辅助研发的AI法官助理“小智”已在浙江省高院、黑龙江高院等法院上线应用,可将简单案件庭审效率提升50%以上,已辅助审理案件超10000件。
/ END /