最新：百度“文心一言V2.2.1”通过中国软件评测中心（工业和信息化部软件与集成电路促进中心）测评

通信产业网 2023-10-19

近日，由中国软件评测中心（工业和信息化部软件与集成电路促进中心）测试的“文心一言V2.2.1”结果出炉。

结果显示，“文心一言V2.2.1”在功能性方面符合测试需求规格说明书的相关要求。在测试过程中，系统功能运行正常，通过了中国软件评测中心（工业和信息化部软件与集成电路促进中心）的软件产品单项功能测试。

据了解，本次测试是针对文心一言V2.2.1包含的毒害信息识别过滤算法的一个模块。毒害信息识别过滤算法实现了基于文本数据对有害内容识别过滤的功能，基于包含偏见歧视、违法犯罪、身心伤害、个人隐私、违背道德伦理、不良诱导、脏话侮辱共1400条不同文本数据样本，在测试机运行测试的毒害信息识别过滤准确率分别为99.00%、98.50%、98.50%、97.00%、99.50%、96.50%、97.00%。

经检测功能运行正常，系统运行稳定。文心一言V2.2.1在测试中展现了对有害内容的识别和处理能力，具备稳定的系统运行，并考虑了伦理和道德因素。中国软件评测中心人工智能测评事业部副主任孙佰鑫表示，这些特征使得文心一言具备为用户提供符合道德准则的能力。

此前据多家权威机构发布的大模型评测报告，验证了文心大模型的综合实力，尤其是在语言能力上的卓越表现。而此次中国软件评测中心针对百度文心一言的单项功能测试，则展现了文心一言在内容方面的可靠性。语言能力匹配道德修为，无疑为文心一言大模型打磨了深远发展的两翼。

目前，文心大模型在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。文心一言大模型已经拥有中国最大的产业应用规模。而确保应用和服务在最大程度上减少侮辱、歧视、偏见，才能增强大众对人工智能的信任，确保人工智能健康高质量发展及应用落地。

有理由相信，大模型的快速发展终将会促进人类的进步。本次针对“文心一言V2.2.1”的单项功能测试的成功，标志着AI向善是大模型发展的基本伦理方向的形成。大模型能够做到善解人意，我们也应该积极拥抱大模型，在发展中完善，在进步中规范。

采写：崔亮亮

制图：曙念

编辑、校对：胡媛亮亮

指导：辛文

延伸阅读：

IDC评估7个满分：百度文心率先探索商业化落地

百度交卷：“文心一言”来了！

以AI助力责任新闻：《通信产业报》全媒体接入百度“文心一言”