国外网络平台个人信息保护方式研究
点 击 蓝 字
欢 迎 关 注
国外网络平台个人信息
保护方式研究
【摘要】各种网络平台已经成为个人信息的重要载体,对于网络平台如何对个人信息进行保护的讨论成为热点。本文以非传统的语料库语言学研究方法,对国外发展较为完善的六家网络平台的隐私政策文本进行样本分析,揭示了网络平台在个人信息保护方面的普遍做法,并提出了一些对策建议。
【关键词】网络平台 个人信息保护 语料库语言学 样本分析
Jean-Francois Millet · The Wood Sawyers
国外网络平台个人
信息保护方式研究
以互联网为代表的数字技术正在加速与经济社会各领域深度融合,成为促进我国消费升级、经济社会转型、构建国家竞争新优势的重要推动力。随着互联网的发展,以及大数据产业的兴起,各类网络平台利用其用户的个人信息开展商业活动已不再罕见;一些由于个人信息泄露而导致的电信诈骗案件,隐私权、名誉权遭受侵犯的案件也呈多发态势。但由于我国并没有直接针对各类平台利用个人信息方面的法律,《中华人民共和国个人信息保护法》(草案)仍在立法议程中。目前,对于各类网络平台,主要是依靠行业内部的团体规定、有关法律问题的决定、部门规章以及部门工作文件来进行规制,缺少强有力的,高位阶的法律规制。而且,各平台在制定各自的“个人信息保护声明”或者“隐私政策”时,没有统一的标准,质量参差不齐,而且该类文件制定后,由于没有相关依据可以参照,有关部门在审查时也存在困难。
相比较而言,国外由于互联网产业发展历史长,技术和法律的规制也相对完善。尤其是美国,作为诞生互联网的国家,其国内互联网产业已经非常成熟,各类网络平台均有较好的发展,其产业规模占全球比重极大。从1974年《隐私法案》开始,美国已经存在互联网平台的个人信息保护方面的立法实践,而欧盟也在1995年,通过推出《关于涉及个人数据处理的个人保护以及此类数据自由流动的指令》开始对网络平台利用个人信息进行法律层面的规制,日本2003年的《个人信息保护法》,等其他发达国家在对网络平台的规制方面有较多的先例可以借鉴。所以国外网络平台在发展中,始终有相应的法律作为保护个人信息的依据,其网站上都明示了隐私声明链接,这应引起国内的重视。
所以,本文考察了国外网络平台所公布的隐私政策或者个人信息保护声明文本,通过对此类性质文件的分析,观察这些文本所表现出的特征,一方面可以总结国外网络平台在处理利用以及管理用户个人信息方面受到的规制,另一方面可以较为清晰的观察平台自身在个人信息保护方面采取的做法。
具体来说,本文首先对各种网络平台进行分类,将研究对象定为使用程度最频繁的三类网络平台——社交类、购物类、生活服务类。之后按照各类型对生活影响所占的比重,选取了共6个平台作为研究样本,将这些平台的“隐私政策”或“个人信息保护声明”建立语料库,运用Wordsmith®和AntConc两个语料分析软件对有关其法律规制方面的文本特征抽象出来,再回归自然文本与相关法律总结国外平台在保护个人信息方面的方式,为我国下一步立法,以及对网络平台进行规制提供借鉴。
目次
一、引言
二、研究思路及方案设计
三、研究过程及结果分析
四、结语
一、引言
(一)国内外现有研究成果
在个人信用信息隐私的立法保护上,主要存在欧盟的统一立法和美国的分散立法两种立法模式。有的学者通过研究欧盟和美国在个人信息保护以及隐私权方面的立法进程,得出了以上结论。他们认为,欧洲在价值上,将个人信息保护或者说隐私权定义为一项基本权利,所以应得到社会的保护;由此,欧洲采纳了一种全面性的、公共政策式的方法和适用于所有公立和私立部门的独立的监管机制的方法论。美国的网络社会化程度相当高,而且网络的发展时间长,行业组织较为发达,业内企业对于行业组织的团体规定都较为认可。所以在制定法律和法规时力图寻找一个平衡点,以协调保障用户隐私权与促进网络信息业发展和保证网络秩序安全稳定之间的关系。
这是从立法模式角度进行的研究,而直接将规制对象定位于网络平台这一具体层面的研究则非常少。
(二)本文研究方法介绍
(1)语料库语言学概述
本文将采用语言学语料库分析法。该方法来源于国外,是通过对一段文本进行词语上的分析,通过词频,关键词、词语搭配频率等可量化的数据,反映文本的含义,作为进一步推论的直接证据,或可直接形成推论。
语料分析方法的特点是:
1. 经验性的,着重于分析原始文本中现实存在的语言特点;
2. 利用庞大的文本集合,也就是“语料库”作为分析的基础;
3. 运用广泛的电脑技术进行分析,包括自动的和互动的技术;
4. 依赖于定量分析和定性分析技术。
由此可以得知,语料库语言学作为一种研究方法,其在研究语言现象和变体语言文本上具有很强优势。人类的语言,无论是口语还是书面语言,都包含着作者的思想,而成规模的语料库则蕴含着丰富的知识、事实、以及一些难以通过研究自然语言观察到的细节。“文本挖掘”是在语料库语言学下诞生的又一新学科,利用语料库,可以在文本中挖掘出我们一是无法了解到的知识和事实。在法律中,这样的应用也并不罕见。美国法庭上就曾发生过多起因对法律条款的解释产生争议而引起的纠纷。通常的做法是,律师以词典为依据,从权威词典中查询法律条款中有关词语的“平义”(plan meaning),陪审团依此裁定被告人是否有罪。但是字典或者法院解释往往只给出该词的规范释义,很难契合各种不同的场合,所以寻找“平义”难以实现。语料库则通过大文本的集合,克服不同语境带来的干扰,实现了在给定语料库情境下对一词的语义分析,以此补充了法律条款中的“平义”。
本文的研究对象亦是如此。平台类型众多,对个人信息和隐私的定义,以及其在收集利用,和分享透露信息上都有差别,即使是同一个词,在不同语境下含义也不会完全相同。但是如果通过直接阅读文本,则很难捕捉到这些细微但重要的差别。
(2)本文研究中主要观察指标介绍:
1.文本全貌:通过语料库分析软件,得出各平台隐私政策文件或个人信息保护声明的文本典型性如何。包括文本中有多少可被识别的词汇、文本词汇总量、非重复词语数量等等。这一项指标主要是为接下来解释词语的特征现象提供铺垫。
2.词语频率:顾名思义,要对出现过的词语,尤其是实词进行数量上的统计并排序。可以考察该文本或者总体语料库中词语的适用情况,并可对高频词出现的原因做以推断,得出可信的结论,或者证明、证伪之前的一些研究假设。
3.词语搭配:通过计算机软件,得出出现在选定变量词语附近的常见词语搭配,可以观察到该词的使用语境,有助于推论其对因变量的影响。
(3)选用该方法的理由
1.规则具有语言依赖性,通过考察其文本表述可以直观地反映规则本身。平台的隐私政策或者个人信息保护声明文本,是平台在实际操作运行中的依据,平台所有有关个人信息以及用户隐私方面的操作均应以此文本为据。所以,本文所采用的方法,可在将这类文本处理后,抽象为可被统计和检索的语料库,通过研究者精心的变量设计,检索与研究目标有关的词,考察相关指标即可对文本所体现的内容有一个较为客观地把握。
2.强检验的方式,使得结果具有独特性,较有说服力。由于在样本选择和变量设计上依然是在案例式研究的大框架下,所以所得出的结论具有相当的独特性。而且语料库的方法,可以在一定程度上克服研究者的主观印象以及知识背景对文本研究造成的影响,实现从文本的角度出发,而非从个人理解的角度出发。
3.更容易追踪自变量与因变量,较为准确地反映研究对象。此类文本在阅读时具有很大的迷惑性:一方面是平台为了保护自己,可能会故意隐藏对其单方有利的文本真意,仅通过不容易被察觉的方式暗藏在某些语段之间,如果直接对文本进行解读往往很难发现;另一方面,该类文本的体量冗长,本身就代表了一定的意涵倾向,尤其是词语搭配复现情况,直接反映了文本中所要考察的变量变化情况。
(4)研究工具介绍
本次研究采用的语料分析工具是“Wordsmith © Mike Scott”2015年第六版以及“Ant Conc”3.4.4 2014年版,这两个软件可以完成上述功能,而且这是目前语料分析中常用的一个计算机辅助软件,可靠度较高。所以,我将按照下文研究设计对样本进行研究,最后,运用定性的分析方法对于得出的结果进行解释,以获取本文需要探究的国外网络平台在个人信息保护方面的方式以及相应的立法借鉴。
在此,也对以上两个软件的开发者和维护者表示感谢!
二、研究思路及方案设计
(一)样本选取
“网络平台”是一个集合名词,在不同语境下有不同的含义。网络平台已经成为人们日常生活和社会经济中不可缺少的一部分,有些平台正在逐渐改变整个社会的运行机制,如网络支付工具(财付通、支付宝等)、家用游戏平台(索尼PS3、微软Xbox 360 等)、搜索引擎广告平台(Google、百度等)、电子商务平台(Amazon、Ebay、淘宝等)。抽象地来说,网络平台指的是以互联网线上应用或者网站为主要载体,以实现某种交互性功能为目的,为信息的传递、共享、反馈及其他功能提供场所的虚拟实体。目前来看,网络平台可以分为几个主要类型,如社交类、购物类、生活服务类、金融类、娱乐类等等。但在众多平台中,本文认为有三类较为特殊的平台,与个人信息的利用和保护及其相关。
首先是网络社交平台,既包括即时通讯类的社交平台,也包括广播式的社交平台。如今这些平台承担着相当大的信息量,每天都有数以亿计的用户访问并发送数据,各平台的注册用户数也已经达到了上亿的级别。尤为重要的是,社交平台上的个人信息享有的是一种新型隐私权——网络隐私权。其次是网络购物平台,也成为目前个人信息保护的重要关注点。购物平台不但掌握个人的姓名、年龄、住址等基础信息,更重要的是可以通过用户的购买记录、搜索记录等追踪用户的购物偏好信息,实现更为精准的广告投放,同时也可以进一步分析用户的心理偏好的信息以作进一步的商业利用。更重要的是,以网络购物平台为依托的网络支付环节中,一些逐利者容易将平台上流出的信息整理后贩卖给实施网络诈骗的不法分子,导致一场场悲剧的发生,所以在源头上关注网络购物平台是如何对个人信息进行保护的尤为重要。最后,一些生活服务类平台对个人信息的收集利用同样值得注意,比如“约车软件”将会追踪用户每次的行程轨迹,并且只要用户使用该平台,或者仅仅是保持后台运行,该类平台的软件都可以实时定位用户,这直接关涉到用户的个人隐私。
所以,本文将在这三类与个人信息保护极为相关的平台中选取样本,每类中选取两家有代表性的平台。下面逐一做以简要介绍。
网络社交平台:
Twitter(以下简称中文:推特)是一个广播式社交网络与微博客服务,它可以让用户更新不超过140个字符的消息,这些消息也被称作“推文(Tweet)”。Twitter被形容为“互联网的短信服务”。网站的非注册用户可以阅读公开的推文,而注册用户则可以通过Twitter网站、短信或者各种各样的应用软件来发布消息。2011年9月7日,Twitter对外宣布他们已经拥有1亿活跃用户,这些用户每个月至少登陆Twitter网站一次,并且有5000万的活跃用户每天使用Twitter服务。
WhatsAppMessenger(以下简称WhatsApp),是一款用于智能手机的跨平台加密即时通信应用程序。该软件通过互联网进行语音通话及视频通话,并使用标准移动网络电话号码向其他用户发送短信、文档文件、PDF文件、图片、视频、音乐、联系人信息、用户位置及录音档等。WhatsApp公司总部设在美国加利福尼亚州的山景城,2014年2月Facebook耗资约193亿美元收购为旗下事业体。截至2016年2月底,WhatsApp的用户人数超过10亿人,使其成为时下最流行的即时通信软件。
网络购物平台:
Amazon(以下简称中文:亚马逊)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。
eBay(中文:电子湾、亿贝、易贝)是管理可让全球民众上网买卖物品的线上拍卖及购物网站。营业额140.7亿美元(2012)、总资产372.7亿美元(2012)、员工人数27,770人(2012),是目前全球应用最广的线上拍卖及购物网站之一。
生活服务平台:
Uber(以下简称中文:优步)是一间交通网络公司,总部位于美国加利福尼亚州旧金山,以开发移动应用程序连结乘客和司机,提供载客车辆租赁及实时共乘的分享型经济服务。乘客可以通过发送短信或是使用移动应用程序来预约这些载客的车辆,利用移动应用程序时还可以追踪车辆的位置。业务范围遍及500多个城市,用户数超过10亿人次。
Lyft(以下简称中文:来福车)是一间交通网络公司,总部位于美国加利福尼亚州旧金山,以开发流动应用程序连结乘客和司机,提供载客车辆租赁及实时共乘的分享型经济服务。乘客可以透过传送简讯或是使用流动应用程序来预约这些载客的车辆,利用流动应用程序时还可以追踪车辆的位置。来福车于2012年6月启动,目前大约在300个美国城市中营运,包括纽约、旧金山及洛杉矶,每月提供1870万次载客。2017年4月,该公司市值为75亿美元,募资总计26.1亿美元。
可以看到,这6家平台有如下几个共同点。一是这些平台在各自的领域都占有较大的市场份额,而且用户数和访问量都具有相当的规模;其次在业务范围方面,这几家平台的业务几乎是覆盖全球,但都发源于美国;最后是诞生年限方面,除亚马逊更早一些外,整体来说相近,而亚马逊开始作为网络平台出现的时间事实上也与其他几个平台相差不远。从这三个主要的相同点上,本文认为通过研究这六个样本,可以较为准确地反映当前国外网络平台对个人信息的保护情况,减少样本中极端值的影响。而且每个样本内容也相当具有代表性,可以代表一个行业内的普遍状况。总而言之,将这6个网络平台作为此次研究的样本,兼具普遍性与特殊性,与所要研究的问题高度契合。
(二)变量设计
本次研究的因变量即是本文题目——“保护方式”,而自变量是网络平台的个人信息保护手段和路径。也就是哪些自变量对个人信息保护造成了影响,以及其作用方式。
但手段和路径是抽象的,不容易被直观的观测。所以,为了实现对手段和路径这个自变量的观察,本文将选取一些可以反应网络平台对个人信息进行处理和利用,以及管理个人信息时所涉及的词语,通过词频和词语搭配复现的方式,直观反映该自变量。综上,变量设计的研究思路如下图1所示:
所以在选取哪些词作为语料分析检索的值就非常关键,选择的这些词,必须是可以准确地体现出网络平台对于个人信息利用、处理和管理所采取的行为动作的词语。通过借鉴国内外学者的研究成果,以及对样本的初步研究,本文将以下词语作为此次研究的检索词语。
第一组:
INFORMATION、PRIVACY、DATA
个人信息与隐私权保护的关系始终是学者们讨论的话题之一。在传统的规制模式中,隐私权一般指的是不能公开的,或者不适宜公开的个人心理、情感、生活癖好等等信息。但在大数据时代,个人信息的范围往往与以往隐私权所要保护的内容存在竞合,“交出个人信息就是生存的一种必要条件”,而平台正是利用诸多个人信息为我们的生活提供了便利。所以,如何认清各种平台对“信息”、“隐私”、“数据”的界定,非常关键,这构成了下一步推论的基础。
第二组:
COLLECT、USE
通过对库中各平台隐私保护政策或者个人信息保护声明的考察,以及对其他平台的考察。网络平台在告知用户其将收集信息时,使用的词汇集中于“COLLECT”、“USE”。在讨论网络平台如何对个人信息保护时,往往首先要涉及到一个问题,就是平台如何收集和使用信息。收集和使用的方式是否合法,其包含的范围是哪些,都对观察平台的保护行为产生影响。据相关研究,网络平台在信息市场中除了提供其基本服务功能外,也扮演着信息市场的中介的角色,而中介方的市场流程第一阶段就是从供给方获取信息并存储。
第三组:
SHARE、DISCLOSURE
对应的,平台对用户个人信息管理中存在的信息泄露问题一直是各种研究关注的重点,所以通过考察平台的分享和披露个人信息或数据的行为,可以较为清楚的了解其在遇到此类问题时是如何对个人信息进行保护,或者其存在的问题。比如在一些网络购物平台注册时,常出现“您提供的数据与资料将授予本运营商独家永久使用权”此类条款,而诸多用户并不在意,引起了个人信息泄露的风险。
三、研究过程及结果分析
(一)文本总体情况分析
本次研究涉及6个平台的隐私政策或者个人信息保护声明文本,总计127109词。各平台文本的具体情况如下图(图2)所示。从中可以看到,即使是同一类型的网络平台,其文本在长度和用词情况上也有很大区别。最明显的是社交平台和网络购物平台,Twitter和eBay两平台表意词语(tokenused for word list)在长度和不同词语(distinct word)数量上都大幅超过其同行业对手;相反的,Uber和lyft则较为相近。表意词语与不同词语的比例(type/token ratio,以下简称TTR)上,尽管eBay在表意词语数量上占优,但实际上不同词语所占比例是所有文本中最低的。
如果专门对平台的隐私政策协议的性质进行考察,可以对此现象做如下解释。一是隐私政策协议或个人信息保护声明往往作为用户使用平台所要同意的诸多格式条款的一部分存在,不同平台对由于运营业务的差异性,所以其格式条款需要实现不同功能,导致了隐私条款内容的不同。以网络购物平台为例,其隐私保护政策主要包括两方面内容,一面是对于使用平台的消费者,一部分是经营网络店铺的经营者,这就导致了其内容的膨胀。本文研究样本中,eBay的主营业务形态类似于淘宝,网站本身只经营小部分的商品销售业务,更多的商品由平台上的其他用户提供,所以其需要规定不同的隐私保护内容。而Amazon的大部分业务是其自营商品,其他商户的比例相对较小,而且很少有个人经营的商户存在,所以内容上会相对少一些。虽然需要考虑的隐私保护对象有差别,但二者在许多基本权利条款上共性较大,用词不会有很大差异,导致了eBay又在文件内容增加的情况下,TTR反而降低。
其他平台的情况也大体相似,所以由此可以总结出一个结论。网络平台制定隐私保护政策是基于其业务形态的,但其内容的繁简并不能反映其对隐私和个人信息保护的方式上的多样性如何,不可单纯地以文本长度来判断某平台对个人信息保护程度的情况。
(二)第一组词语
个人信息的定义及其具体外延和内涵有很多不同说法,比如,信息(Personal information),个人数据(Personal data)和隐私(Privacy)。尤其是隐私,至今还没有一个人尽皆知的定义,也没有一个普遍化的定义被广为接受。
所以,对网络平台如何定义个人信息做精准解释成为开展更深入研究的首要工作。学界对个人信息的定义也有很多理论,典型的代表是“识别说”和“关联说”,以及动态场景(情境)理论。但对于网络平台是如何界定个人信息的,并没有给出精确的答案,而只停留在外部社会如何界定个人信息,以及在大数据时代下如何界定。本文首先通过分析这三个词语在各平台的文本中占比情况,观察各平台在“信息”、“隐私”、“数据”三者的表述上有何显著特征,结果如下图(图3)所示。
可以看到,在各词语的使用频率上,各类平台显示出的偏好各有不同,尤其Twitter与WhatsApp虽然是同一行业内的平台,其差异却十分明显。Twitter作为广播式社交平台,在隐私政策中相比更加私密性的WhatsApp,更强调对更广义上的数据进行保护和管理,其他行业中在这点上的数据表现差异性不甚显著。
总体情况是虽然各平台在文本标题上是“隐私政策(Privacy policy)”,但实际内容中往往更加强调对于信息的保护和管理。无论是向用户做出保护的承诺,或者是提示用户平台将会怎样利用其信息及隐私内容,“隐私”这一真正敏感的词语在文本中使用的场景远不如“信息”的广泛。
表 1 Privacy 词语搭配复现情况前10位统计表
上表(表1)是“隐私”一词的左右复现词语情况,可以看到排名前5位的词语几乎都是宣示性的,并没有很好的反映出平台是如何界定“隐私”的。但值得注意的是,在第六位和第十位上隐私一词的左边出现了“SWISS-US”及“EU-US”这样的词语,以及“Global”具体使用情况如下:
1. Our Global Operations
Tobring you the Services, we operate globally. Twitter, Inc. complies with theEU-US and Swiss-US Privacy Shield principles regarding the collection, use,sharing, and retention of personal information from the European Union andSwitzerland, as described in our EU-US Privacy Shield certification andSwiss-US Privacy Shield certification.
2. EU-US and Swiss-US Privacy Shield
Amazon.com,Inc. participates in the EU-US and Swiss-US Privacy Shield frameworks. Clickhere to learn more.
3. eBay Inc. has established global privacystandards for all eBay Inc. companies known as our Binding Corporate Rules(BCRs).
说明国际性网络平台在制定隐私保护政策时确实受到了国际条约、国际公约或者国际原则的限制,同时也反映出几个比较典型,或者说是有效的国际原则,即欧盟、美国和瑞士三个主要国际主体所认可的隐私保护原则。
当我们用同样的方法考察信息这一词语时,情况就完全不同了(见表2)。首先从词语搭配复现情况上可以看出更多具体的使用情境,以及平台是如何将“信息”进行分类的,并且一些具有实际意义的动词也出现在了较高频的复现搭配中。
表 2 Information 词语搭配复现情况前20位统计表
仅通过位于中心词左侧出现频率最高的L1列,就可以观察到“个人信息”、“位置信息”、“联系信息”、“账户信息”、“附加信息”、“简要信息”以及“公共信息”等不同种类的信息。这一方面说明网络平台以信息的内容,以及该信息在什么情境下使用作为信息的分类标准,另一方面也是提示用户其留在平台上的信息会被打上怎样的标签。再通过观察与信息形成搭配的动词,频率较高的是“接受”、“分享”、“收集”、“提供”,而非“保护”或者近义的词语。由此可以得出一个结论。网络平台在隐私政策中更多的是向用户释明该平台是如何运作的,而非将重点放在保护用户隐私上。
(三)第二组词语
收集和使用是网络平台个人信息保护的关键环节,一些常见的个人信息泄露时间往往发生于这一阶段。一般来说,网站采集个人信息主要有 4 种方式,即用户注册填写信息,在线调查活动中填写个人信息,Cookies收集的用户上网信息,其他采集方式在个人注册网站账户填写信息时也是在传递个人信息,如果网站没有正当使用则导致个人信息的泄露。所以,在这一部分中本文将对“收集”和“使用”两次的使用语境做以考察。
表 3 collect 词语搭配复现情况前10位统计表
由上表(表3)可见,网络平台在收集行为上所出现的使用搭配,与传统研究所涉及的内容区别不大,但在(L1,5)中出现的与中心词汇组成的“knowingly collect”搭配,即“有意收集”这一词组,之前的研究很少涉及。在本次研究的6家平台中,有3家的文本中都出现了这一词组,具体使用情况如下:
1.Amazon.com does not sell products forpurchase by children. We sell children's products for purchase by adults. Ifyou are under 18, you may use Amazon.com only with the involvement of a parentor guardian. We do not knowingly collect personal information from childrenunder the age of 13 without the consent of the child's parent or guardian. Formore information, please see our Children's Privacy Disclosure.
2.Our websites are general audiencewebsites, and our Services are not intended for children under the age of 13.We do not knowingly collect personal information from users in this age group.
3.Children Privacy. Lyft is not directedto children, and we do not knowingly collect personal information from childrenunder 13. If we find out that a child under 13 has given us personalinformation, we will take steps to delete that information. If you believe thata child under the age of 13 has given us personal information, please contactus at our Help Center.
可以看到,“有意收集”的内容是针对未成年人,尤其是为13岁以下的儿童而专门制定的保护性政策。再结合其他内容来看,网络平台在收集和使用用户个人信息的保护方面,不仅考虑了传统的“识别性”以及“情境”,而且也会对用户本人的身份,甚至是内容进行进一步审查。但在本次抽样的六家平台中,也仅有三家有此项保护条款出现,这三家中两家是网络购物平台,另一家是网约车平台。但,如果从商业角度分析网络购物平台的此项声明的用意,首要的应是防止无效购物合同的产生。由于13岁及以下的儿童属于无民事行为能力人,且大多数国家的法律规定都是如此,所以一旦儿童自己注册了平台账号并消费了与其能力不相称的商品,那么后期很容易引发购物纠纷。所以在隐私政策中,直接用明示条款将儿童所提供的信息全部排除,意味着无论是儿童在平台上留下的个人信息,还是其发布的购物信息都不被收集和使用。而基于此带来的附加效果,是保护了儿童的个人信息不被泄露。所以,尽管一方面网络平台将收集的个人信息用于了商业目的,但同时另一方面,为了保证其商业目的能够实现,也在一定程度上保护了部分个人信息。
表 4 use 使用情境统计表截录
但类似的,“use”词语搭配复现情况统计表中笔者没有发现值得解读的信息,反而如果直接考察具体的使用情境(表4)则可以证明一点:网络平台在此类格式文件中,将“用户允许平台使用其信息”作为用户使用该平台提供的服务的一项条件。各平台都明示了用户,平台将使用哪些信息,但在平台利用这些信息进行的活动上表述模糊。WhatsApp中的表述“We use all the informationwe have to help us operate, provide, improve, understand, customize, support,and market our Services.”非常典型,留给平台很多解释的空间,尤其是“market our service”,几乎可以为平台利用个人信息进行的任何商业行为提供解释。
综上,网络平台在收集和利用个人信息方面提供的保护存在以下特点。一是在收集上网络平台确实已经采取了情境式的个人信息收集模式,除此之外还会对信息的提供者身份进行考察,拒绝收集13岁及以下未成年人的信息成为普遍做法。但是这类条款多数存在于涉及商品交易及消费性质的平台中,条款的动机更侧重于对商业的保护。二是在使用方面,不但再次印证了第一组词得出的结论,即保护条款的功能更侧重于向用户释明平台的活动,而且即使是释明,也存在模糊的表述,为平台恣意解释其规定留下了巨大的空间。
(四)第三组词语
分享和披露两个动作对于考察网络平台对个人信息保护方式上非常关键,不恰当地共享或披露用户信息是侵害网络隐私权的一种常见现象。所以,本研究通过对网络平台这两个词的使用语境进行分析,可以较为全面地了解网络平台自身对这两种行为的规制程度。
表 5 share 词语搭配复现情况前10位统计表
表 6 share 词语搭配复现情况前10位统计表
由上表(表5、表6)可以看到,平台在使用“分享”这一词语是,与之搭配的有关被分享的内容的词语都较为模糊,频率高的仍是“信息”这类概括词。除此之外,“位置”这一词语的频率相较于其他词语的出现频率也较为突出。类似的,在对“披露”这一词语进行考察时,并没有发现直接能解释行为内容的词语搭配。但在统计过程中,两行为在不同平台的文本中出现的频次有显著差别,“分享”一词最为明显,具体情况如下图。
图4 share*在各文本中出现频次/文本总词数 统计图
明显的特点是,购物网站在分享或者共享行为上的有关表述不多,而其他平台则基本近似。社交平台一部分的功能在于为用户提供分享、共享信息的服务,所以该词的出现较为广泛;网约车平台在使用这一词语时情况比较多样,一种是解释其“拼车”服务时,二是由于业务需要而必须分享司机或者乘客的地理位置等信息。所以,其隐私政策在对分享行为的表述思路是基于为用户提供的服务内容而定的。
四、结语
本文运用语言学语料库的方法,对国外平台个人信息保护的方式进行了研究,得出的结论及发现的问题有以下四方面:
方面
首先,各平台文本的写作格式不一,网络平台制定隐私保护政策是基于其业务形态的,但其内容的繁简并不能反映其对隐私和个人信息保护的方式上的多样性如何,不可单纯地以文本长度来判断某平台对个人信息保护程度的情况。
第二,通过对各平台是如何定义“个人信息”进行考察,以及对其制定的隐私政策本身的功能进行反思,本文发现网络平台在隐私政策中更多的是向用户释明该平台是如何运作的,而非将重点放在保护用户隐私上。
第三,网络平台在制定隐私政策时,商业因素成为影响条文内容的重要变量,所以可以考虑在对网络平台进行规制时,要注意将保护用户利益与促进网络平台的商业目的相结合,增强规制的可接受度。
第四,网络平台对用户个人信息的管理基本是基于其业务内容来的,所以在制定相应的法律法规对其利用、收集、保存、分享、披露个人信息的行为进行规制时,应充分考虑不同类型平台的特点,将行业自律的软法与国家的硬法相结合。
综上
本次研究提出了以上四点发现以及一些建议,“知己知彼方能百战百胜”,在大多数学者在讨论如何制定规范性文件规制网络平台上用户的个人信息时,笔者认为应先对平台是如何看待这一问题的进行一个较为准确客观的认识,故此进行了本次研究。希望能为更多学者更加深入的研究提供基础性数据及更好的研究思路。
感谢作者对本公众号的授权!
为方便读者阅读,引注已略。
本文仅作学习交流之用。
Vincent van Gogh · Oil on canvas
欢迎关注
大数据和人工智能
法律研究院
异 化 中 的 解 放