产业观察 丨知道创宇推出基于SecGPT架构的新一代内容安全治理方案
随着AI技术的不断完善及拓展,以ChatGPT为代表的生成式人工智能(AI Generated Content,“AIGC”) 产品正在成为一种堪称颠覆式的生产力工具,必然将渗透到经济社会生活的每个角落。但在为社会带来便利的同时,AIGC产品蕴含的潜在风险也为网络安全行业带来巨大挑战。
面对AIGC产品可能引发的各种应用风险,我国的监管部门已敏锐察觉到AIGC野蛮生长所带来的风险。今年4月11日,国家网信办正式发布《生成式人工智能服务管理办法(征求意见稿)》,就AIGC产品应用制定了明确的监管要求。为了帮助企业组织做好AIGC内容治理,满足行业主管部门的监管要求,知道创宇日前推出了基于SecGPT架构的新一代内容安全治理方案。
知道创宇公司高级副总裁李伟辰表示:SecGPT是知道创宇在2015年世界互联网大会上提出新一代先进技术理念架构,实现了将整个网络空间的各种数据放到一起进行跨域、跨层的数据关联,然后寻找风险以及应对方法。该架构由大数据AI安全基座、大数据AI安全模型算法中台、大数据AI安全能力引擎、大数据AI安全业务应用构建,可以根据客户需求制定不同的针对性解决方案。
针对互联网应用平台的内容安全风险,知道创宇基于SecGPT技术架构,可提供4套防护方案:
AIGC智能审核定制:使用 Instruction GPT 类模型强大的指令执行特性,极速指定审核模板,分钟级上线定制化的机审能力。
内容合规鉴别服务:积极参与AIGC内容管理相关法令法规制定,契合监管需求,提供AIGC模型的内容合规测试服务以及AIGC违规内容的识别服务。
AIGC训练标注服务:充分发挥人审专家优势,为各大厂商提供专业的、高质量的RLHF(Reinforcement Learning Human Feedback)服务,助力客户厂商的GPT类模型训练。
AIGC合规基线评测:提供内容安全领域专业的测试人员对AIGC基线开展测试和评估,最终评测结果将为人工智能系统的开发和应用提供参考和指导。
针对企业组织的大模型工具安全应用,知道创宇推出了三位一体的合规解决方案:在训练阶段可以提供无监督预训练、RLHF;评估阶段可以帮助客户建立问题库、问题答案请求模型;推理阶段可以进行用户请求分析以及内容传播分析等。
「三位一体」的大模型安全&合规解决方案
此外,针对企业的不同业务场景,知道创宇还提供了ScanA全栈式内容风控体系解决方案,包括机审和人审。客户可以根据需要的业务场景选择机审引擎或者机审引擎+人工复核,审核的内容包括图文音视文档等,覆盖AI对话、AI绘画、AI办公、AI搜索、AI视频、AI音频等AIGC应用场景。
据李伟辰介绍:在本次推出的新一代内容安全治理解决方案中,还包括了一套AI系统创新解决架构——CDAI(Cognitive Domain Artificial Intelligence)认知域AI引擎系统,基于知道创宇多年业务审核实践经验,联合众多内容安全审核领域专家智囊,使用了数十种前沿数据科学算法作为能力核心。该系统目前已完全接入ScanA内容安全监测、ScanA智能审核平台、资质审核平台、数据精标平台等诸多产品及AIGC应用内容安全风控方案。