查看原文
其他

晨读 | BBC:谷歌重返中国的事情要黄了,吗?

我是林伯虎 在下林伯虎 2019-10-30


星标置顶林伯虎,有趣有料还靠谱


第332期  |  本期53词  |  累计14526词


怕太长你不听

▸ “信息审查”用英语怎么说?

▸ 离开中国的日子里,谷歌如何“懂”你我?

▸ 谷歌重返中国遇到了怎样的障碍?


今日晨读

00:48起词汇讲解  |  07:06起只听点评  |  13:42起原文朗读


Google China: Has search firm put Project Dragonfly on hold?

Google has reportedly "effectively ended" plans for a censored search engine in China.

The Intercept, which revealed the existence of Project Dragonfly in August, says Google has been "forced to shut down a data analysis system it was using" to feed the project.

原文:

https://www.bbc.com/news/technology-46604085

晨读及一词一句打卡,请点击菜单栏:每日晨读–万人打卡


332期微词卡



put sth. on hold

把……晾一边;延期


effectively

[ɪ'fektɪv(ə)li] adv. 实际上


intercept

[.ɪntə(r)'sept] v. 拦截


One Word, One World


今日重点词:

put sth. on hold

重点词造句练习:

他们把这个计划暂时搁置,直到他们有足够的钱来完成它。

(参考例句打卡后可见)


上期参考例句查看上期

A recent survey showed nearly 60% of interviewees were in favour of the plan.


扫码加入一词一句营,听免费活词造句讲解


总有一些词,分开讲没话题,但组成CP就是上头条的命。


就好比“炒股”遇到“赵薇”,“兄弟情”遇到“胡海泉”,“姜昆”遇到了“郭德纲”……


再比如:当“谷歌”遇到“中国”。


不久前,这家刚刚上了头条,原因是:即将重返中国。


仅仅几个月,谷歌再次因为中国而上头条,这次的理由是:这事要黄了。


这两天,不仅是外媒,我看到国内一些文章也在说:这次谷歌重返中国的计划眼看要黄。




但细究之下,事情不是你想象那样。


谷歌是不是回不到中国了?五分钟读下来,你会收获迄今最靠谱的答案。


1


甚至可以说:本周这条爆料,回答了萦绕在我心中许久的一个问题


离开了中国的谷歌,如何确保依然能“懂”中国网民?


先交代下背景:


搜索引擎的核心竞争力其实不只在于能搜到多少信息,更在于信息的排序。说白了:一个词条指向的结果可能是几十上百万个,那如何确保把最符合用户需求的搜索结果排在前面呢?


那最简单也最重要的一个方式:看用户怎么选。


说白了,就是让用户用他们的鼠标来投票。点开A链接的人越多,表明这个结果越符合用户的需求,那算法就相应地把这个结果的优先级往上提。


比如搜“特朗普”的用户,可能多数是搜CNN怼他的相关新闻,或是去到了介绍他的维基百科页面,或者是去围观他的推特……那这些多数派的选择就成为搜索结果页面上最重要的排序依据。


     

根据用户反馈来做结果排序——这个道理很常识,但有一个前提:你得有足够多的用户数据。


谷歌在中国就遇到这样的窘境。


毕竟身处墙外,所以它没办法像百度那样拥有海量中国人的搜索行为数据。那么问题来了:


长此以往,会不会使得谷歌的中文搜索结果,越来越脱离中国群众的需求?(就像百度家的英文搜索那样烂)


结果,看了这篇报道后我搞清楚了:在离开中国(准确讲是离开中国大陆)的这些年里,谷歌其实一直在用另一种方式追踪和研究中国用户的搜索偏好。


他们靠的是一家网站,叫做265.com。


这个网站听名字就有点low,没办法,人家是早期互联网创业的典型代表。


很多上点年纪的网民都有这样的印象(包括我爸妈现在上网依然保持这样的使用习惯),就是因为很多网址你记不住或者怕麻烦,所以就干脆就把浏览器主页设置成一个导航网站(就像这个265.com),打开后满满一屏全是各种网站(新华网人民网凤凰网……)你对着名字点点点就跳转过去了。



谷歌在2008年(也就是离开中国那一年)买下了这家网站。


是想借这家网站来赚钱吗?


现在看来,显然不是。


由于在中国,仍有大量网民使用这家网站,他们上来后怎么操作(点开哪些网站,页面驻留多久),对谷歌来说都是值得记录的数据。


更重要的,是谷歌特意在这家网站上内嵌了搜索框,这样用户不用再另外打开百度,直接在265.com页面上就可以输入关键词进行搜索。


谷歌颇有心机的一点:他们没有在内嵌框里使用谷歌引擎,而是使用百度


这样的做法,从用户体验来讲,和直接上百度搜索别无二致;但对谷歌而言,他们可以在这个过程中默默记住这些百度用户的数据。


这样一来,即便不在中国、即便大量中国用户没有使用谷歌的搜索引擎,但这家公司依然可以获取大量中国网民的搜索偏好数据



2


交代完这么长的背景,重点来了:


谷歌这次的重返中国计划,为什么会栽在这家导航网站上呢?


根据爆料媒体 The Intercept报道(今天音频里介绍了这家的背景,之前谷歌被爆启动重返中国的“飞龙计划”最早就是他家爆的料):


谷歌重启“飞龙计划”以后,为适应中国国情,特别需要搞清楚的一件事情就是:在中国互联网上,究竟哪些词算是敏感词?



这事办起来可能比各位想象的要难。我们的网管部门从来没有列出一个具体的清单,说这些词你不能讲,那些词你得给我禁掉……


正所谓法无明令禁止即……需要自己琢磨,谷歌琢磨这件事的方法就是调用265.com上面的数据,特别是拿这些用户在百度上的搜索结果跟谷歌自己做匹配:


同样的搜索行为,哪些结果在谷歌上能显示但在百度上是被屏蔽掉的?


通过这种比较谷歌就知道了:A不能讲、B要屏蔽掉……


这样的A、B、C,据说谷歌找到了几千个。


3


那你说,谷歌这种做法有什么问题吗?


至少在中国这头没问题——积极过滤负面词汇,这分明是积极向中方要求靠拢好吗?管你谷歌在全世界如何飞龙在天,到了中国你不还是强龙难压地头蛇?!(谷歌内部把重返中国的项目命名为“飞龙计划”)


但是谷歌没想到:这么艰难的与中国关系都搞定了,却后院起火


8月份,谷歌重返中国的秘密计划被曝光,随后,谷歌内部一个专门确保用户隐私不受侵犯的部门,发现了“飞龙计划”利用265.com网站窥探用户数据的做法。


然后隐私部门就怒了:


你们居然在搞这种默默收集用户信息的套路!关键,这既然涉及使用用户隐私,那你为什么不按规定向我报备!


这样一来,谷歌内部非常强势的隐私监管部门直接对“飞龙计划”亮了红牌。


也是因为这个原因(注意并不是由于谷歌跟中国政府又闹掰了)才使得谷歌重返中国的计划被内部叫停。



4


这个事情的来龙去脉给各位讲清楚了。


基于这样的事实接下来分析事态走向,我觉得也更加清晰。


第一,从政治层面看,基本事实是:这次谷歌重返中国遇阻,并不是由于和中国官方的政治分歧,而是出于谷歌自身的内控管理杯葛。这就意味着:(至少到目前为止)谷歌重返中国的政治基本面依然向好。


第二,从技术层面看,收集和使用用户数据只是为了优化它家的用户体验。既然这样做不对,那接下来:如果是程序的问题,就完善内部流程,把该走的隐私保护程序重走一遍;如果是做法整个不妥,那就永久关停这些个数据库,再想别的法子继续分析研究,这对谷歌来说也不算难事。


包括这篇BBC报道的文后分析也表示,“飞龙计划”的搁浅很可能只是一时,谷歌重返中国的决心依旧。


     

不过就在不久之前,Pichai,也就是谷歌老大,在接受国会质询时表示,目前他家还“没有计划重返中国”。



考虑到11月时还有数百名谷歌工程师就重返中国计划联名对高层提出过抗议,相信在谷歌内部,对于中国这块市场到底要不要进入、要不要早点进入,分歧仍在持续。


所以可以明确的是,短期内谷歌想要重返中国,从技术准备到内外部氛围似乎都不太乐见


但从长远来看,我相信这家搜索公司回到太平洋这头的希望依然很大。


就算一时看不到希望,或者说只是阉割后的归来,我想我们也有足够的信心笑面未来——毕竟,时代的脉搏、历史的规律、世界的大势,你我都懂。


你期待谷歌重返中国么?

欢迎留言




推荐阅读 | 谷歌2018全球热搜榜出炉

前十里面中国网友能认出一半


编辑 | Wenyu  校对 | 东奇   排版 | 丽莉   剪辑 | Pzj



 - END - 



14天外刊精读




在下林伯虎

长按扫码加关注

★给林伯虎设星标,步骤如下★



更多精选文章,点下方

圣诞 | 高考 | 女王 | 演讲 | 狗粮 | 世界杯

朝韩 | 胡适 | 漫威 | 游学 | 麻省 | 奥斯卡

熊猫 | 王源 | 日本 | 大众 | 童话 | 一抹红


喜欢请点击右上角···分享 ↗





点击进入2019“虎课外刊精读”


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存