内容风控大脑核心组件“白泽”正式发布!
“白泽”搜索引擎主页面。
据悉,内容风控大脑是对全网海量内容进行高通量感知、机器理解、智能检索并自主进化的计算平台,“白泽”则是该计算平台的核心组件。内容风控大脑全部技术组件均实现国产化部署,提供视频搜索、内容风控、开源情报、反诈反恐、内容溯源、版权保护、实训靶场等多功能。鉴于跨平台、跨模态的视频搜索引擎是探索数字世界的重要工具,有巨大社会价值和商业前景,该引擎拟独立运营,以“白泽”作为商品名对外提供服务。
叶蓁蓁表示,当前,各大主流媒体已进入多模态阶段,可实现文字、图片、视频搜索,但相互间的壁垒依然存在,人民网进入跨模态搜索领域,实现文字、图片、音视频互联互通。
“白泽”搜索界面。
当前,基于单个模态的内容提取及简单规则匹配的内容分析策略,已无法满足实际工作需要。对此,各厂商纷纷推出基于多模态融合和复合规则判断的多模态策略,但仍面临依赖大规模算力、模态之间信息相互隔离、运行和维护成本高、资源复用率低等问题。此次发布的“白泽”引擎,基于跨模态视频检索的策略,其跨模态引擎可实现单模态语义理解、多模态信息融合、跨模态语义关联,补全单一模态信息不足的现状,打破模态间信息孤岛。
据介绍,“白泽”引擎将文字、图片、语音和视频等不同模态信息映射到一个统一特征表示空间,以视频为核心,学习多个模态间统一的距离度量,跨越文字、语音、视频等多模态内容的语义鸿沟,自动关联多模态间关键要素。
在此背景下,“白泽”引擎无需配置传统内容搜索所需的复杂匹配规则,通过自然语言描述即可快速检索出相同语义的视频,在不需要依赖大规模算力的情况下,有效应对新事件和突发事件,资源复用率高。
此外,面向内容安全,“白泽”结合对境内外多平台内容的检索,可跨平台实现文本搜图片、文本搜视频、图片搜视频、视频搜视频、图片搜文字、视频搜文字等功能。在论坛现场,叶蓁蓁展示了“白泽”在视频搜索、溯源和辟谣、版权监测、视频生产等商业化应用场景的功能。
同时,为提升“白泽”引擎的安全和效率,人民中科基于华为昇腾芯片研发了面向内容理解的“雨燕”智能计算加速卡,并采用全自主研发的模型压缩和加速算法,同等条件下能够实现4倍效率的提升。
责编:芈金 | 编辑:冯春昉
来源:人民网 记者:孙阳、栗翘楚