首发文章丨用信息交换歧视 ——从“大数据杀熟”看算法运用中的个人信息合规问题
冯坚坚 (竞天公诚律师事务所)
蒋昕妍 (竞天公诚律师事务所)
朱 菁 (竞天公诚律师事务所)
引言
“大数据杀熟”和Facebook“数据门”事件在朋友圈的热度尚未退去,“中国人更愿意用隐私交换效率”的言论又触动了很多人的敏感神经。有人说这个言论太过直白,但在笔者看来仍然隐晦。大数据时代的真相是,我们用个人信息交换的不仅是效率、便利和更贴心的服务,还有歧视。在大数据基础上展开的算法(algorithm)运用,已经将更多的歧视投向了整个社会。虽然笔者认同经济学意义上的“歧视”是中性的,是效率的另一个代名词;但是在数据和算法基础上展开的歧视,其中的个人信息合规问题不容忽视。
“一级价格歧视” 在很长时间里都只是一个微观经济学教科书中的理论概念,简单而言就是商家向每个消费者收取其能接受的最高价格。很明显它没有多少现实可行性:一方面,商家很难得知每位消费者对于商品愿意支付的最高价格;另一方面,即使商家知道消费者的支付意愿,要向不同消费者报出不同价格(如果有可能的话),其成本也是极其高昂的。 然而,近期有网友爆料,他在自己经常使用的平台预定某特定酒店房间的价格常年在380元左右,而朋友的新账号在同一平台上查询同一酒店的房间价格居然是300元,但用自己的账号再查却依然还是380元。一石激起千层浪,网友们纷纷吐槽自己有过被“宰”经历,在出行、酒店、电影购票、电商等重灾区都出现了给老客户的价格反而比新客户更高的情况。传统商业交易中难以实现的“一级价格歧视”似乎已经在“大数据杀熟”中初步实现了。这是什么操作?这其中有个人信息安全方面的问题吗?“大数据杀熟”是我们唯一发现的算法运用歧视吗?
一、“大数据杀熟”中的价格歧视机制
“大数据杀熟”中的价格歧视机制并不复杂。首先,商家通过追踪每个消费者的线上行为、所使用终端的硬件设备情况、地理位置、个人基本资料等,生成详细、具体的用户画像 (user profiling),包括个人品味、习惯、消费倾向等。然后,可以通过个性化定制策略性的线上实验,洞察消费者喜好、消费行为、可能的支付意愿(willingness to pay)等信息。最后,商家可以深层挖掘已收集的数据,预测每位用户消费的“价格天花板”,定制网络购物环境。 由于掌握大量老客户的数据,可以使用算法在收集的数据基础上推算出消费者的价格敏感度和接收度、消费依赖度,衡量其消费能力、支付意愿、计算其“价格天花板”,从而给出更高的定价;而对于新客户,在缺乏足够数据的情况下,商家无法做到价格歧视。与实体商店统一定价不同,网络用户只能看见为他量身打造的电子商铺,他甚至可能完全不知道价格歧视正在发生。因此,在商家掌握消费者的消费习惯、支付意愿等信息后,可以为每位消费者个性化制定商品或服务价格,通过互联网向不同消费者呈现不同的报价,实现“一客一价”的价格歧视。这就是传说中的“大数据杀熟”。
二、“大数据杀熟”其实是“个人信息杀熟”
对于“大数据”(Big data),麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
而如前文所述,“大数据杀熟”中,商家所使用的数据主要是消费者个体的线上行为、所使用终端硬件设备情况、地理位置、个人基本资料等,而每个具体的杀熟个案中,所需要的数据量级和“大数据”相差甚远。因此,在人们脱口而出的“大数据杀熟”中,杀熟的数据基础主要是远达不到大数据级别的个人信息等数据的集合。但为了照顾读者的理解习惯,我们继续使用“大数据杀熟”这个其实并不准确的说法。
三、“大数据杀熟”中的个人信息合规问题
“大数据杀熟”本质上是一种个性化的价格形成机制。有观点认为“大数据杀熟”下的价格歧视违背诚实信用的原则,违反《反垄断法》、《消费者权益保护法》、《价格法》等法律;也有观点认为杀熟这种价格歧视机制由来已久,而且细细分析也没有明确违反相关法律,至少是尚处于灰色地带。本文不在这些领域进行讨论,而主要着眼于“大数据杀熟”中的个人信息合规问题。
在个人信息合规领域,“大数据杀熟”是否存在瑕疵,取决于这种个性化的价格是以何为基础形成的,它可能涉及到数据的定性、收集、使用、共享或转让以及约束信息系统自动决策等多个方面。将于2018年5月1日生效的(GB/T35273-2017)《信息安全技术 个人信息安全规范》(以下简称《个人信息安全规范》)是我国目前在个人信息合规领域最为详实和具备可操作性的文件,因此下文将结合该规范来展开讨论。
1. 个人信息的定性与识别
第一个问题是“大数据杀熟”的价格形成机制是以什么数据为基础的,这些数据是否属于《个人信息安全规范》所界定的个人信息。根据《个人信息安全规范》的定义,个人信息(personal information)为以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息。
在本文讨论的“大数据杀熟”领域,根据不同的消费场景,可能涵盖的个人信息包括用户的生日(年龄)、性别、住址等个人基本资料,网站浏览记录、软件使用记录、点击记录等个人上网记录,交易消费记录等个人财产信息,行踪轨迹、精确定位信息、住宿信息等个人位置信息。上述均是《个人信息安全规范》明文列举的个人信息。 而除此之外,商家利用算法在个性化定价时还可能会使用上述范围之外的信息,即非个人信息。例如用户所使用终端的设备硬件情况(PC端or移动端,安卓or苹果)等既不能识别到个人也不能反映个人活动情况的信息。
进一步举例而言,商家会对消费者购买商品的价格区间进行判断,比如看消费者购买的马克杯在所有马克杯商品中的价格排序在什么位置。这其中的“消费者购买马克杯的记录”属于个人信息,但“马克杯的价格排序”则属于不能识别特定自然人身份或反映特定自然人活动的非个人信息。再比如,消费者把商品加入购物车到付款购买的时间长度,以前是否点击、收藏、使用过优惠券,在该电商平台消费的频率,都属于反映特定自然人活动情况的个人信息;而特定商品的市场供需、销售量、成本等数据则属于非个人信息。
如果商家收集的数据属于《个人信息安全规范》定义的个人信息,则其处理需要做到合规。此外,对所收集的个人信息进行加工处理而产生的信息,能够单独与其他信息结果识别自然人个人身份,或者反映自然人个人活动情况的,也应将其认定为个人信息,对其处理也应遵循一致的合规要求。 这类信息通常包括商家通过算法得到的消费者消费习惯、消费偏好、价格敏感度等信息。
2. 个人信息收集时的告知义务
如果商家收集的数据经识别属于个人信息,则应根据《个人信息安全规范》的相关规定对合规风险加以考量。《个人信息安全规范》中的收集(collect)是指获得对个人信息的控制权的行为,包括由个人信息主体主动提供、通过与个人信息主体交互或记录个人信息主体行为等自动采集,以及通过共享、转让、搜集公开信息间接获取等方式。
个人信息控制者收集个人信息时应当取得授权同意,如涉及个人敏感信息,还应当取得用户的明示同意。收集个人信息前,应向个人信息主体明确告知所提供产品或服务的不同业务功能分别收集的个人信息类型,以及收集、使用个人信息的规则(例如收集和使用个人信息的目的、收集方式和频率、存放地域、存储期限、自身的数据安全能力、对外共享、转让、公开披露的有关情况等),并获得个人信息主体的授权同意。 个人信息控制者应制定隐私政策,内容应包括但不限于收集、使用个人信息的目的,以及目的所覆盖的各个业务功能,例如将个人信息用于精准推送商业广告,将个人信息用于形成直接用户画像及其用途等。
《个人信息安全规范》在此提出了一个明确的要求,即无论是何种形式收集的个人信息,商家在取得用户同意时,均需要告知其收集、使用的目的。而现实中,商家在互联网上的服务协议或隐私条款对于个人信息处理目的的表述往往都很笼统,比如“为了更好地提供服务”,稍微具体一点的可能会提及“提供个性化的服务”,但却都没有告知用户的个人信息会被用于区别定价或价格歧视。按照实体商店的购买常识,用户通常会误以为网络商家在定价方面也会遵从给予熟客、回头客以更多优惠或折扣的商业习惯,或者至少应当是一视同仁的。因此,这种含糊其辞的表述和未如实充分的告知可能会影响用户的判断,进而导致商家取得的用户同意可能存在瑕疵。
3. 个人信息使用目的的限制
《个人信息安全规范》要求个人信息控制者使用个人信息时,不得超出与收集个人信息时所声称的目的具有直接或合理关联的范围。 这要求商家要在事先明确告知用户使用目的的前提下,严格控制处理范围,不得以违背用户原有意愿的方式直接使用或者与其他信息进行关联分析。
如前文所述及,现今的网络商家为了更精准地了解用户品味、提供个性化的服务和产品,经常会采用用户画像的处理模式。用户画像(user profiling)是指通过收集、汇聚、分析个人信息,对某特定自然人的个人特征,如其职业、经济、健康、教育、个人喜好、信用、行为等方面做出分析或预测,形成其个人特征模型的过程。 许多商家通过用户画像,可以有针对性的向用户推送广告,推算上次购买产品的消耗程度以提醒用户再次添置、根据用户的偏好推荐类似产品、搭配产品等。“比你更了解你”,这样的口号也许会让极其注重个人隐私的用户觉得不适,但至少尚处于商家所声称的“更好、更精准地为客户提供服务”的目的范围内,也的确带给了用户更便捷、贴心的消费体验。
更进一步而言,如果商家对用户个人信息的使用不再停留于营销和推送层面,而是延伸至个性化产品的打造上,选择性地为不同承受能力的用户提供价高质优或者价格相对低廉质量合格够用的产品,相信绝大多数用户对于这样的个人信息使用目的也是能够理解接受的。
“大数据杀熟”之所以引起巨大争议,往往是由于商家基于无差别的服务或产品向部分用户索取了更高的价格。从个人信息使用目的来分析,“大数据杀熟”中个人信息使用的真实目的应当是(或者至少包括)“最大限度榨取消费者剩余”,即通过算法进行用户画像,分析用户的消费行为、消费习惯、消费能力,计算用户的价格敏感度和消费依赖度,预测消费者的价格天花板,以此对老客户抬高价格、区别定价,进一步榨取消费者剩余。这种“最大限度榨取消费者剩余”的目的很可能已经背离了用户提供个人信息的初始意愿和商家原本向用户说明的个人信息用途和目的,将产生较大的个人信息合规风险。
4. 个人信息处理目的的正当性分析
《个人信息安全规范》开创性地提出了个人信息安全的七大基本原则,其中的“目的明确原则”要求个人信息控制者开展个人信息处理活动应当具有合法、正当、必要、明确的个人信息处理目的。 “大数据杀熟”中个人信息处理目的的正当性如何呢?
笔者认为,个性化定价中个人信息处理目的是否具有正当性,一个重要的判断标准应当是“个人信息处理是否服务于供需定律”。按照现代市场经济学理论,价格是由供给与需求之间的互相影响、平衡决定的,商品价格随市场供求关系的变动围绕商品价值上下波动,而价格机制这一“看不见的手”可以使得稀缺资源的配置趋于优化。例如,在高峰时段运力供给有限时,网约车平台优先满足通过个人信息和算法定位到的愿意以更高价格购买出行服务的用户,这应当视为市场价格机制的体现,是对资源分配的合理调节。因此笔者认为这种个人信息处理的目的具有较大程度的正当性和合理性(虽然容易陷入道德争论中)。但是电商平台如果通过个人信息和用户画像,在商品或服务明明不存在供需矛盾的情况下,仅仅利用单向信息不透明、不对称的优势进行加价,不合理的消耗了用户本可以投向其他资源的购买力,此类个人信息处理的目的正当性则存在疑问。
此外,在传统线下商业模式中,商家出于逐利,也会在条件允许时利用其长年积累的经验来一客一价的杀熟或者进行歧视定价,但是商业经验与用户个人信息及其组成的大数据仍存在以下根本性区别:商业经验来自于商家自身积累,为主观认识和经验,误差较大,商家要自行承担其判断对于成交影响的风险,且通常只影响个案中的消费者利益,不会产生大范围的影响;而用户个人信息及其大数据则是客观的,它来源于用户授权同意,在个人信息足够充分的前提下,误差率极低,商家和用户之间极易形成信息不对称的地位差距,如果商家滥用用户个人信息进行“大数据杀熟”,很可能对整体用户利益造成损害。
5. “大数据杀熟”的其他个人信息合规问题
在当前的商业场景应用中,“大数据杀熟”至少还存在如何约束信息系统自动决策、用户个人信息的共享或转让等相关问题。
1) 约束信息系统自动决策。根据《个人信息安全规范》第7.10条,信息系统自动决策是指“仅依据信息系统的自动决策而做出显著影响个人信息主体权益的决定(例如基于用户画像决定个人信用及贷款额度,或将用户画像用于面试筛选)” 。很明显,“大数据杀熟”通过数据和算法自动做出,对于用户利益也产生显著影响,属于前述信息系统自动决策行为。而信息系统自动决策行为应当受到约束(无论这是否与人类对人工智能的恐惧有关),《个人信息安全规范》对此给出的应对方案是要求“个人信息控制者应向个人信息主体提供申诉方法”。而在“大数据杀熟”的场景中,用户作为消费者甚至根本不知晓自己的利益已经受到了信息系统自动决策的影响,所以申诉机制根本无从谈起。
2) 用户个人信息的共享或转让。“大数据杀熟”中,做为杀熟基础的用户个人信息不一定只来源于出售产品或服务商家的直接收集,其中部分很可能来自于第三方的共享或转让,而个人信息的共享或转让应当遵守《个人信息安全规范》的相关规定 。
四、合规建议
对于以数据和算法为基础进行商品或服务定价的商家企业,我们有如下合规建议:
1) 建立内部个人信息合规机制,对作为定价基础的数据进行识别区分,同时确保数据来源合法,这是后续个人信息合规工作的基础;
2) 通过用户协议、隐私政策、增强式告知、单独提示等多种方式为用于定价的个人信息收集、使用获得充分的用户同意和授权,并充分告知用户这些个人信息可能被用于个性化定价以及相关个性化定价机制的原理;
3) 个性化定价应当在供需定律基础上进行,而不是以利用信息不对称来追求不合理的超额利润;
4) 在向用户告知说明个性化定价机制的基础上,建立针对个性化定价的用户个案申诉机制包括建立跟踪流程,并在合理的时间内,对申诉进行响应;
5) 在使用第三方共享或转让的个人信息数据时,应尤为谨慎,推荐按照《个人信息安全规范》中的规定进行相关必要操作;
6) 更有策略的开展个性化定价工作。例如,从消费心理学角度来看,消费者对于“熟客高价”十分反感,但是对于商家给予新客户的价格优惠券却能够理解和接受。而事实上,给予新客户的早期价格优惠就是一种针对新老客户的差异化定价。
结语
在数据科学家Cathy O’Neil 2016年的畅销书《Weapons of Math Destruction》(杀伤性数学武器)中曾举过一个例子:企业招聘中,一个求职者被频频拒绝却不知原因,直到他从朋友口中得知这些公司在招聘时采用了同一基于大数据的人格评估算法,他因为获得了负面评价而被算法拒之于职业的大门外。
在今天的世界,越来越多基于数据的算法被运用于各个场景,同时将更多的歧视投向整个社会。虽然笔者认为在未来很长一段时间,用户提供个人信息换来歧视的局面会持续下去,但是从个人信息合规角度出发,给控制个人信息的商家套上枷锁仍然是很有必要的,否则这个世界会越来越像电影《萨利机长》中所描述的那样,人的尊严服从于冷冰冰的计算。
注:
[1]“一级价格歧视”又称“完全价格歧视”,即每一单位产品都有不同的价格,它假定垄断者知道每位消费者对任何数量的产品愿意支付的最大货币量,并以此决定价格,因而能够获得每位消费者的全部消费者剩余。
[2]Joana Resende, Personalized Pricing: “Big Data is watching you!”, available at:http://www.ipdigit.eu/2016/05/personalized-pricing-big-data-is-watching-you/
[3]根据(GB/T35273—2017)《信息安全技术 个人信息安全规范》中的定义,用户画像是指,通过收集、汇聚、分析个人信息,对某特定自然人个人特征,如其职业、经济、健康、教育、个人喜好、信用、行为等方面做出分析或预测,形成其个人特征模型的过程。
注:直接使用特定自然人的个人信息,形成该自然人的特征模型,称为直接用户画像。使用来源于特定自然人以外的个人信息,如其所在群体的数据,形成该自然人的特征模型,称为间接用户画像。
[4]Christopher Townley, Eric Morrison, and Karen Yeung, Big Data and Personalised Price Discrimination in EU Competition Law, available at: https://ssrn.com/abstract=3048688
[5]《个人信息安全规范》第3.1条。
[6]《个人信息安全规范》附录A。
[7]《个人信息安全规范》第7.3(b)条。
[8]《个人信息安全规范》第3.5条。
[9]《个人信息安全规范》第5.3条。
[10]《个人信息安全规范》第5.6(a)(2)条。
[11]《个人信息安全规范》第7.3条。
[12]《个人信息安全规范》第3.7条。
[13]《个人信息安全规范》第4(b)条。
[14]《个人信息安全规范》第7.10条。
[15]《个人信息安全规范》第8.2条。
[16]可以参考《个人信息安全规范》第7.11和第7.12条。
作者简介
冯坚坚
竞天公诚律师事务所合伙人。冯坚坚律师的执业领域主要专注于网络安全合规、反垄断调查及反垄断合规咨询。
冯律师是上海市律师协会互联网业务研究委员会委员,曾任阿里巴巴特色中国训练营讲师,长期为众多大型跨国企业、大型互联网科技企业提供法律服务,对于互联网新技术与商业模式有独到而深刻的理解。自2016年开始,冯律师及其团队为大量客户提供了有关网络安全法相关的合规咨询服务,并从2017年网络安全法生效实施后,协助客户应对与网络安全合规有关的政府检查和调查,在公司的网络安全合规和调查应对上积累了丰富的经验。冯律师还曾在威科平台上先后发表了《网络安全法的出台改变了什么?》、《个人信息保护之隐私条款起草指南》等多篇专业文章。
同时,冯律师及其团队从2007年开始为大型外商投资企业、跨国集团提供反垄断合规咨询、反垄断调查应对的相关法律服务,尤其是在汽车行业、电子行业积累了丰富的反垄断法律服务经验。受相关部门委托,冯律师曾对中国汽车行业的纵向限制问题进行过深入行业调研,走访了多家整车厂、经销商和汽车业相关经营者,对于汽车行业的反垄断合规体系建设及落地有丰富的实操经验。
蒋昕妍
竞天公诚律师事务所律师,执业领域为商事争议解决、数据隐私与网络安全。
蒋律师2013年毕业于中南财经政法大学,取得法学学士学位;2016年毕业于美国本杰明卡多佐法学院,取得法律博士学位(Juris Doctor)。在加入竞天公诚之前,蒋律师曾在美国纽约州司法部任职。蒋律师已取得美国纽约州律师资格和中国法律职业资格。
朱菁
竞天公诚律师事务所律师。华东政法大学国际法硕士。自2014年开始执业,执业领域主要专注于网络安全合规、反垄断调查及反垄断合规咨询。朱律师曾参与中国汽车行业的纵向限制问题的调研,对于汽车行业的反垄断合规体系建设及落地有着一定的实操经验。
同时,朱律师还曾先后参与多个新三板挂牌项目、私募基金融资项目、上海股交中心挂牌项目以及企业债项目,在证券与资本市场、并购重组与外商投资方面积累了较为丰富的经验。
相关文章
● GDPR之“用户数据可携权”评析(一)——认识“用户数据可携权”
● GDPR之“用户数据可携权”评析(二) ——“用户数据可携权”实务运用的若干问题
● GDPR之“用户数据可携权”评析(三) —— “数据可携权”视角下的数据之争
威科先行® • 法律信息库是荷兰威科集团(WoltersKluwer)为中国专业人士量身定制的在线法律信息库产品。该产品整合了威科全球与中国相关的中英文法律题材内容,搭载领先的智能信息技术平台,是集法律法规、案例、实务指南、国际条约于一体,高效检索、及时更新的法律信息解决方法。
点击二维码申请试用威科先行法律信息库
点击下面 阅读原文