打击不良广告,阿里妈妈智能风控体系下重拳
市场监管总局又要对不良广告下猛药了!
昨天,市场监管总局发布了关于深入开展互联网广告整治工作的通知。有关部门对此的重视度也在一定程度上反应了互联网广告违法现象的严重程度。
国家市场监督管理总局公布的数据显示,2018年上半年,全国工商、市场监管部门共查处互联网广告案件8104件,同比增长64.2%。
层出不穷的不良广告危害了互联网广告环境,百度就曾因发布含淫秽色情赌博迷信等违法广告,被罚 60万;绝味鸭脖在2017年双11期间也因低俗广告被罚60万。如今,闹的沸沸扬扬的椰树椰汁广告亦是如此,广告文案和图片十分露骨。
而这类现象的出现无疑跟广告素材审查不严有很大关系,各大广告平台作为互联网广告发布的源头如果能对广告素材从严审查,则能有效减少不良广告。那么,作为其中的一员,阿里妈妈是如何做的呢?在3月27日的“中国广告协会法律咨询委员会年会及互联网广告疑难问题研讨会”上,阿里妈妈作为阿里巴巴集团旗下的商业营销平台则从多年实践经验出发,发布了《电商平台广告管理规范——阿里妈妈风控合规白皮书》(以下简称白皮书)。
分层审核
提高互联网广告审核效率
成立至今,阿里妈妈涵盖包括直通车、智钻等丰富的营销产品矩阵,这无疑对广告风控提出了更高的要求。
为此,阿里妈妈充分利用自身数据技术优势,建立了针对互联网广告的风控决策体系。据白皮书介绍,阿里妈妈风控决策体系共分为五个阶段:准入决策层、事中监控层、审核处理层、数据沉淀层和品质管理层。
在准入层决策阶段,该体系会对用户进行个性化管理,这样一来,就能对不同行业建立更具针对性的规则体系;事中监控主要有文本监测、图片监测和行为监测;审核方面,分为人工审核和系统校验两个模块;通过数据沉淀,可以将图片、文字、风险特征等沉淀到核心算法层;在最后的品质管理层,则是通过系统化抽样,对风险进行评测,制定规则。
这样的风控决策体系有着极强的数据吞吐能力,不仅可以智能化识别广告风险,还能够对审核内容进行分层,配备不同的审核策略,提高审核效率。而其风险管理的效果也很明显,据《白皮书》显示,消费者不适感知率下降了48%,平台风险密度值定向下降70%,搜索下降40%。
尽管如此,阿里妈妈方面也坦言,在此过程中他们也遇到了一些难题,在互联网信息大爆炸的当下,有些广告风险很难进行标准化定义,其中,广告法中针对公序良俗类风险的模型化就十分困难。因此,广告风控的智能化还有很长的路要走。
开发OCR技术
识别广告图文中的违规信息
对于电商平台的广告主来说,图文无疑是应用最为广泛的宣传形式。当然,也有商家会把违规信息隐藏在图片中。面对纷繁复杂的图片信息和刻意隐藏,如何有效识别呢?
OCR技术很好地解决了这一问题,OCR图像识别技术是阿里妈妈自主开发的核心识别技术,可以从图片中识别出违规的文案信息。该技术基于端到端深度学习,将卷积神经网络模型与长短时记忆模型结合,大大提高了识别的准确率。
通过筛选文字区域——文字字符识别——语言模型解码的算法流程,这项技术每天可以处理图片近千万张,自动反馈疑似违规图片准确率达 95% 以上。
处理案例
此外,针对一些商家刻意在标题、详情页、商品属性等地方隐藏商品品牌信息,侵权著名商品品牌的行为,阿里妈妈也研发了品牌logo识别系统,通过“漏斗式”逐级扫描,广告创意数据集准确率可达98.6%。
人工审核+技术手段
加强直播营销的可控性
在电商+直播的风口下,淘宝直播的强大带货能力也在刺激着更多的主播、广告主入局。与图文素材的确定性相比,直播具有很大的不确定性,主播会在直播的时候说什么是不可控的,在监管方面面临的挑战也比较大。
针对直播中可能会出现的虚假宣传等现象,阿里妈妈高级安全运营专家张晓铭表示,目前阿里妈妈主要通过事前直播稿件审核、直播用户准入(结合该主播以往直播情况等筛选)、直播过程中抽检这三个方面来进行把控。除此之外,阿里妈妈也会对视频进行切帧,将其切成图片过图片的系统,识别出直播中的违规信息。
“直播的时候,主播为了提升流量,他们也会放很多样品,会放一些跟自己直播内容不相关的东西,这种就可以通过切帧借助图像的方式进行校验。”张晓铭说道。
直播虽然是实时的,但到达消费者层面上可能也会有延迟,在张晓铭看来,当淘宝直播的广告主体量足够大的时候,或许可以尝试在延迟过程中将切帧系统化接入,切一些图片下来校验。
作为中国最大的互联网广告平台之一,阿里妈妈一直在利用自身的数据技术优势来赋能互联网广告审核,未来它又会研发出哪些新技术呢,我们大可期待一下。