查看原文
其他

扎克伯格、张一鸣、宿华都公开道歉,AI算法不灵了吗?

2018-04-11

作者 聚焦AI的


作者 | DavidZh

出品 | AI 科技大本营(公众号ID:rgznai100)


中国最大的两个短视频产品快手和抖音,世界最大的社交网络 Facebook,最近都来到了舆论风波的正中心。


凭借强大的推荐算法和用户贡献内容(UGC),这三家公司积累了海量用户,但也都遇到了内容审核的难题。


今日头条旗下的内涵段子被监管部门评价为“导向不正”。快手、抖音、火山小视频的审核机制没能拦下由用户上传并被监管部门认定的“低俗内容”。而 Facebook 整个 2017 年都在跟假新闻做斗争,最近还因为 8700 万用户隐私数据被泄露 CEO 扎克伯格要到美国国会参加专门的听证会。


虽然三家公司的 CEO 都已经公开道过歉,但这些风波让我们更加理解 AI 是什么,它的能力边界又在哪儿。


AI 包含人的价值取向甚至是偏见


今年 3 月,央视报道过快手平台上存在大量未成年妈妈等低俗内容,以及今日头条的广告问题之后,两家公司的 CEO 宿华和张一鸣相继发布道歉信。


昨日晚间,今日头条 CEO 张一鸣还在道歉信中宣布永久关停内涵段子 App,承诺将“正确的价值观融入技术和产品”,同时将运营审核团队规模从现在的 6000 人扩大到 10000 人。


快手不久前也启动了内容审核员的大规模招聘,一口气就要 3000 名审核编辑,招聘条件是团员和党员优先。


新招募的这些人员,除了在运营层面给公司大幅增加开支之外,还意味着快手、今日头条、抖音等社区型产品在 UGC 内容审核上还不能完全依赖它们所擅长的 AI 算法。“人工审核” 仍然占据非常重要的地位。


对于 AI 在 UGC 社区内容审核中所扮演的角色,快手 CEO 宿华在道歉信中表达的观点更为直接:


(快手)社区运行用到的算法是有价值观的,因为算法的背后是人,算法的价值观就是人的价值观,算法的缺陷是价值观上的缺陷。


换句话说,快手的推荐算法包含并反映出了这家公司在短视频内容上的价值判断和平台偏好。内涵段子、抖音等头条系的 App 也是同理。


AI 能快速吸引用户,也让平台更容易被监管


依靠能够揣摩用户喜好的推荐算法,快手自转型短视频以来,累计吸引了超过 7 亿的注册用户,日活用户规模达到 1.2 亿。而比今日头条更早上线的内涵段子,在早期成了最主要的下载来源。抖音从去年快速崛起之后,最新的日活数据已经增长到 9000 万。


成立于 2004 年的 Facebook,虽然总用户增长放缓,但月度活跃用户已经涨到了 20 亿,相当于全球互联网用户的 50%。


随着海量用户的加入,这些社交平台上的内容也开始变得五花八门。


快手上各种惊奇搞怪的表演,在早期给快手短视频贴上了 low 的标签。而抖音在强运营策略的主导下,依靠海草舞、各种运镜、旅游风光等内容,形成了自己的风格,同时也吸引到更多的内容贡献者。Facebook 用户的时间线上,则充斥着真真假假的时下新闻。


由于推荐算法 7*24 不间断运行,用户很容易因为“刷上瘾”而忘记时间。


就国内而言,在国家广电总局眼中,快手、抖音这些“全民级”内容平台的价值判断和导向是不符合要求的,所以才有了这次针对短视频和新闻资讯类产品的集中整顿。


在道歉信中,张一鸣将此次被整顿的深层原因归结为“‘四个意识’淡薄、社会主义核心价值观教育缺失、舆论导向存在偏差。”宿华则承诺要“重整社区运行规则,将正确的价值观贯穿到算法推荐的所有逻辑中”。


但从技术层面看,目前的 AI 算法还很难理解“四个意识”和社会主义核心价值观的真正含义。社区运行规则和内容审核策略的调整还是要借助相当多的人力。


以 Google 为例,基于机器学习的在线视频内容云端识别 API 去年 3 月才在 Google Cloud 正式上线。而国内云服务公司阿里云、腾讯云、百度云等对视频内容的识别、多维度分析和解读服务也才推出不久。


从技术成熟度来说,包含音频的视频内容分析和自动审核即便在人工智能逐步落地的今天,仍然有很多挑战。更不用说监管层面对短视频平台的种种要求。


内容审核之外,更难的是持续让用户信任


在内容审核上,月活用户数超过 20 亿的 Facebook 面临的挑战更加严峻。


首先是不同国家的语言和文化差异,一则带有煽动性的仇恨言论很可能成为审核机制的漏网之鱼,在社交网络里肆意传播。


按照目前 AI 的智力水平,要解决这个问题,更多还是要考人工来审核。目前 Facebook 拥有一个 15000 人规模的运营审核团队,预计今年年底增加至 20000 人。


在昨天举行的美国国会听证会上,Facebook 创始人扎克伯格回答问题时表示,利用机器学习工具来自动监测和处理仇恨言论要 5-10 年后才会变成现实。





这无疑是对 AI 在硅谷乃至整个科技界的莫大冲击。与此同时,也让我们更加清楚了解了人工智能现阶段的能力边界。


而在商业模式层面,Facebook 对用户完全免费,依靠广告收入支持平台和公司运营。抖音和快手也是如此。


这意味着此类免费产品的用户,或多或少总有一些个人数据被利用了。


在 2010 年的一次网络讨论中,一位 ID 为 blue_beetle 的用户道出了真相:


If you are not paying for it, you're not the customer; you're the product being sold.


正是因为 Facebook 没有做好隐私数据的保密工作,才招致了用户和公众的不信任。这对一个社交平台来说,是最直接的打击:当平台上的好友都离开,用户本身也有极高的可能性流失掉。


为了解决隐私保护和商业化之间的矛盾,扎克伯格表示会始终提供一个免费版的 Facebook。Facebook 的 COO 在接受采访时还说,如果用户不希望自己的数据作为投放广告的依据,可以选择自愿退出,但要向 Facebook 支付一笔费用。


这听起来可能并不是挽留用户的最佳方法,但在 AI 变得真正强大之前,免费互联网产品的商业化悖论将一直存在。


招聘

AI科技大本营现招聘AI记者和资深编译,有意者请将简历投至:gulei@csdn.net,期待你的加入!


AI科技大本营读者群(计算机视觉、机器学习、深度学习、NLP、Python、AI硬件、AI+金融、AI+PM方向)正在招募中,和你志同道合的小伙伴也在这里!关注AI科技大本营微信公众号,后台回复:读者群,添加营长请务必备注姓名,研究方向。


AI科技大本营公众号ID:rgznai100


☟☟☟点击 | 阅读原文 | 查看更多精彩内容

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存