查看原文
其他

内容平台监管加强,第三方内容风控业务的机会来了?

安福双 文化产业评论 2021-07-16

2213期文化产业评论


近年来,网络文学、视频网站、动漫游戏等文化内容平台受到的内容监管力度不断加强,可以说,如果一个内容平台的供给质量决定了它的发展上限,那么内容的绿色健康、合法合规决定了它的下限和生死存亡。在监管力度不断加强的背景下,各个平台用技术+人工的方法保证着对内容监控,但技术的不成熟和人工的高成本使得内容平台力有不逮。这个时候,第三方内容风控业务的出现,给了内容平台另一种选择。


 

作者 | 安福双

来源 | 文化产业评论

编辑 | 李卓

 


正文共3672字 | 预计阅读时间10分钟


监管年年有,今年格外多。

 

1月,微博热搜榜、热门话题榜、微博问答功能、广场头条栏目等多个板块下线一周进行整改。

 

2月,直播问答“百万赢家”等因提问规范性被责令整改。

 

3月,问答社区知乎,因为平台管理不严、传播违法违规信息,被北京网信办要求下架一周。

 

4月,快手、火山小视频、今日头条、凤凰新闻、网易新闻和天天快报被网信办责令整改,内涵段子被永久关停。

 

5月,暴走漫画因发布含有侮辱、戏谑先烈董存瑞的视频,被北京市网信办、市新闻出版广电局、市公安局、市文化市场行政执法总队依法联合约谈,随后被多个平台封禁账号。

 

6月,美拍被国家网信办会同广电总局、文化和旅游部、属地网信办依法依规联合约谈,进行全面整改。

 

7月,抖音、搜狗被北京网信办约谈,启动专项整改。

 

10月,全国“扫黄打非”办公室和国家新闻出版署就微信公众号传播淫秽色情和低俗网络小说问题约谈了腾讯公司。

 

11月,网络视听内容审查新规出台,网络电视剧、网络大电影和网络动画的剧本和成片都必须交由省级广电局审核,网剧网大监管趋严。

 

12月,网络游戏道德委员会成立,并对首批20款存在道德风险的网络游戏进行了评议。

 

其实,这不单是国内内容平台的情况,国外脸书、YouTube等内容平台也面临着恐怖主义、暴力、儿童色情等不良内容的困扰。从全球来看,内容平台的审核关乎到平台的品牌、声誉和生死存亡,如何快速准确的过滤掉色情、暴力等违法内容,成为各大视频、文学、音频等互联网内容平台的长期而重要的任务。

 

内容平台的解决方案:AI+人工

 

面对日益增长的违法内容,各大互联网平台首先想到的是通过技术手段来进行过滤,核心就是使用AI人工智能来判定哪些内容是违规的和哪些是正常的。

 

脸书创建并部署了一个名为Rosetta的AI机器学习系统,可以实时地从超过10亿张图像和视频帧中提取文本,并能识别多种语言,然后进行标记,如检测到含有敏感词汇的内容,会将其删除或向用户发出警告。今日头条的AI系统1秒钟能处理100篇文章,内容识别技术模型包括了鉴黄模型、低俗模型、谩骂模型等。以谩骂模型为例,样本库超过百万级别,准确率80%以上。

 

技术手段虽然效率高,速度快,但是毕竟不完美,很容易出现误判情况。比如一副裸体的艺术画,现有的人工智能水平还不足以区分艺术的裸体和色情的裸体,会将艺术画判定为色情然后自动删除。在美国参议院听证会上,脸书CEO扎克伯格表示:AI还不可靠,尽管脸书已经开发了可以识别仇恨言论的AI,但是目前错误率实在是太高了。如果想要依靠AI审核内容,可能还需要5-10年。

 

因此,内容平台目前只是将AI等技术手段作为辅助,最终内容是否违规还是交给人工来断定。

 

各大内容平台都在拼命扩招人工审核团队,来解决内容审核的棘手问题。脸书目前已经拥有一个15000人规模的运营审核团队,将在年底扩充到20000人。快手的审核团队从现有2000人扩充到5000人。今日头条则“全面纠正算法和机器审核的缺陷,不断强化人工运营和审核,将现有6000人的运营审核队伍扩大到10000人。”

 


人工审核在提高准确率的同时,内容平台的运营成本也飙升。以今日头条为例,新增4000人审核团队,按照每人月薪4000元计算,一年新增工资成本1.92亿,这还没有算管理成本、房租等相关费用。为了降低这方面成本,快手、今日头条等平台都开始在成都、长沙等中部人工成本低的地方建立审核团队。

 

两种内容审核方式各有优劣,因此内容平台基本上都是通过技术手段来进行辅助识别,由人工来最终把关,将两者结合起来。

 


不管哪种审核方式,企业如果自建内容风控系统的话,成本都是很高的。巨头虽然运营成本提高,但还可以承受。对于中小内容企业来说,高成本完全可能侵蚀掉企业利润。

 

如何既能快速准确的审核大量内容确保企业的内容安全,同时又成本较低呢?

 

大量的需求催生了一个新行业:第三方内容审核服务。这些第三方机构看到了问题背后的商机,研发出内容审核风控系统,专门提供给内容相关企业。

 

第三方内容风控业务的玩家

 

从网络公开可以查询到的提供第三方内容审核服务的企业,大概国内外一共有20多家。

 


从上表可以看出,第三方内容风控服务提供方基本有4种类型:

 

第一种是云服务企业,也是最多的类型,阿里云、腾讯云、百度云、微软Azure等国内外的云平台基本都提供这项服务。

 

第二种是内容企业,代表是人民网,先是在自己平台上进行内容审核风控,积累经验后对外输出。

 

第三种是外包企业,优势是有成熟完善的人员外包体系,比如conectys。

 

第四种是创业企业,有些原来做大数据风控(同盾科技),有些做云服务(七牛云),有些做人工智能(图普科技),都具有图像识别、视频识别方面的技术优势,然后切入到这块领域。

 

基本上,这4种类型企业要么有技术优势,要么有客户优势,或者两者都有。

 

从费用来看,大概是1元/千张图像识别-3元/千张的范围,很多还有额外优惠。这样,内容企业完全可以根据自己的需求和业务发展来购买相应的服务,大大降低了成本。

 


值得关注的是具有官方背景的人民网。在11月5日的投资者沟通会,人民网透露了内容风控业务的一些情况。从2012年开始,人民网就成立了专门的内容风险控团队,建立起一套科学有效的行业标准,搭建了具有自主知识产权的云审核平台。下一步,人民网将进行内容风控系统输出,主要面向两类客户:大型的央企、国企、互联网商业公司和中小型企业。

 

相比其他内容风控系统,人民网的权威性无疑具有很大优势,有望吸引很多内容企业成为其客户。

 

总的来说,这些第三方内容审核服务可以有效的帮助内容企业降低成本、节省时间、提升平台内容质量,内容平台可以专注在核心的内容运营业务上。因而,美拍、映客、秒拍、纵横文学、糗事百科等内容平台都选择了其中一两家平台的服务。

 

那么,第三方内容审核服务的市场空间和发展趋势如何呢?

 

大空间+高壁垒+弱竞争=滋润的小日子

 

手机和移动互联网蓬勃发展,人们每天都在各种内容平台上传各种文字、图片、表情、视频。此外,5G即将商用,视频应用将更加普及和广泛,视频、AR/VR内容也会随着5G发展而爆发。内容审核的需求也必将跟着水涨船高,客户会越来越多,市场空间和规模会越来越大。

 

不过,第三方内容审核的进入壁垒较高,包括技术壁垒、人才壁垒、管理壁垒。每一个壁垒都不是可以轻易突破的。因此,潜在进入者不会很多,鉴于国内云计算企业基本都已经推出内容审核业务,唯有AI类企业最有可能入场,比如商汤科技(已经为科大讯飞内容审核服务提供技术支持)、旷视科技、依图科技等。再加上现有的10多家服务提供商,未来第三方内容审核企业的数量预计在20多家左右,竞争并不是很激烈。

 


从客户来看,网络文学、漫画、直播、短视频等内容平台是主要客户。这些内容平台的集中度较高,前几名平台占据了大部分市场份额。阅文集团和掌阅科技的市场份额占据网络文学市场的58.1%,快手和头条系(抖音、火山、西瓜)占据短视频的74%市场份额,快看漫画和腾讯动漫加起来的市场份额超过70%,直播市场则主要被斗鱼、YY、虎牙瓜分。头部平台都倾向于自建内容审核体系和团队,只有处于长尾市场的中小内容平台才是第三方审核服务的主要客户。这些长尾客户数量多,很分散,因此议价能力较弱。

 


上游的供应商主要为硬件设备生产商,提供各类服务器、网络、存储等硬件设备。由于硬件设备的标准化程度高,市场价格比较透明,供应商的议价能力也不高。

 

因此,第三方内容审核企业处于较好的市场竞争格局:较高的壁垒阻挡了很多新进入者,上游供应商和下游客户的议价能力都比较弱。第三方内容审核企业的规模和盈利能力有望不断提升。

 

唯一值得担忧的就是AI人工智能技术的飞速发展。虽然现在人工智能还有些“人工弱智”,无法达到人类的判断水平,但是人工智能的发展速度极快,一个个难题有望逐步克服。当人工智能对内容的判断水平接近人类时候,其处理数量和速度都是人类所望尘莫及的,全自动化内容审核将让现有的大部分内容审核人员下岗。

 

结语

 

不良、违法违规内容始终是悬在内容企业头顶的达摩克利斯之剑。能否运营出高质量的内容吸引更多用户,这决定着一个内容平台的上限,可以走多远。能否实时审核平台不良内容并进行快速处理,则决定了一个内容平台的下限,可以活多久。

 

在这种情形下,第三方机构提供专业的内容风控业务成为有利可图的生意。由于市场规模的不断扩大,进入壁垒和上下游较弱的议价能力,内容风控市场的竞争格局较好,这块拥有良好的商机。不过,现有企业需要不断密切关注AI技术的发展,加大AI内容审核技术的研发,以免被新技术颠覆。

 


//主题阅读//


//推荐阅读//




还可以点击“阅读全文”,在微店上单独购买笔记本

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存