查看原文
其他

谷海燕 2018-05-25


“创新与发展”论坛 

第五讲


谷海燕

新浪集团法务部总经理

非常高兴来到中央财经大学,也非常感谢杜老师的邀请。本次讲座我主要围绕“大数据时代下《反不正当竞争法》的适用——以数据商业化利用为视角”展开,分为以下四部分:数据商业化利用的背景;商业化数据的定义和属性;数据维权中的案例分析及意义;数据产业中对商业化数据利用的思考。




01

数据商业化利用的背景

随着网络的进一步扩张,越来越多的信息以数据的形式汇聚在互联网之中,形成大数据,此类数据具有体量大、类别大、价值密度低等特点。而基于数据分析技术的发展,使得利用如此庞杂的数据资源成为可能,因此数据的商业化趋势不可避免。


《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。 奥巴马政府在2012年公布了“大数据研发计划” (Big Data Research and Development Initiative),以增强联邦政府收集海量数据、分析萃取信息的能力,迎接新的挑战。我国也将推进大数据发展作为国家战略,布局下一代互联网。大数据已在网络通信、医疗卫生、农业研究、金融市场、气象预报、交通管理、新闻报道等方面广泛应用。以数据整合、分析与挖掘为表现形式的数据整合与数据控制能力已经远超以往。


越来越多的数据被收集,越来越多的数据产品被利用和加工。随之而来的是数据的定义模糊化,对于数据的定义和权益界限尚未明确。这种未明确的数据权属也为大数据产业的发展带来了不确定性;同时,由于数据蕴含巨大的商业价值,与之一并产生的地下产业也让有序推进数据开发的主体无法有效保护其数据产生的商业模式带来的利益以及其平台用户的权益。数据的利用和维权通常都是个案解决,很难形成指引性和规范性,但同时贸然将数据纳入某个权利体系中也很难形成普遍共识,数据在商业化利用过程中,目前没有明确的权利加以保护,通常适用知识产权法来解决纠纷和维权。


但是在大数据时代下,知识产权面临着如下冲击:第一,知识产权受众波及面扩大,包括侵权主体、被侵权人群体都将面临大幅度的扩容。第二,固有权利外延拓展,因为当“互联网+”这个概念产生后,基于载体形态本身的创新,固有权利的范畴也得到了大范围的拓展。包括像跨境的电子商务当中所产生的法律问题等新生问题,其实就是因为固有权利的外延,跟传统概念里的一些保护内容发生了部分重叠,或者更新或者重构。第三,侵权成本降低、知识产权保护成本升高:互联网场域下,侵权行为显示出跨区域性以及低成本性,原始版权方更难控制内容的传播和知识产权的保护。


数据纠纷之所以出现,对于各平台公司来说,是出于他们在大数据时代对于自身商业利益进行维护的必要。但是从前面所说的可知,知识产权法并不能完全满足实践的需要,因此法院在审判数据纠纷时,也会引用《反不正当竞争法》(尤其是第二条)来维护企业的正当权益。


反不正当竞争法和知识产权法的关系如下:


两者有着共同的立法目标,即保护合法权利,促进社会进步。知识产权法律是通过保护知识财产所有人的合法权益、鼓励知识创新来实现这一目标;而反不正当竞争法则是通过制止非法竞争行为、维护市场竞争秩序来达到上述目的。


对于那些为专利法、商标法等专门法无法提供保护、但是又应当受到法律保护的权利,反不正当竞争法要发挥其补充保护作用。在知识产权保护领域,反不正当竞争法发挥其补充保护作用是有其深刻意义的,有关知识产权的不正当竞争行为在实践中多种多样、形形色色,通常都表现为对私权的侵害。知识产权法通过确立对知识产权侵权制裁的法律机制,在知识产品的市场流转、应用和传播领域确保了公平、有序的竞争秩序。然而,知识产权法对知识产权领域的一切不正当竞争行为,并不是都能适用的。这是因为,对于侵害知识产权的一些不正当竞争行为,知识产权领域中的一些专项法律无法对其调整或者调整的力度十分有限,反不正当竞争法就是从维护公平竞争秩序的角度,对知识产权专项法律保护不到或者不够的地方进行必要的保护,在此情形下,反不正当竞争法的干预和调整作用就凸显出来。可以看出,反不正当竞争法从维护公平竞争的秩序出发,在加强对知识产权保护的同时,对不正当竞争行为也进行了调整,进而实现了知识产权法立法的目的和宗旨。


02

商业化数据的定义与属性


这里所说的数据,非为在二进制的基础上以0和1的组合而表现出来的比特形式的数据;非为纸面统计数据及以账号和密码形式存在的数据或虚拟财产;而是通过互联网收集的大数据,具有体量大、类别大、价值密度低等特点的身份数据、内容数据和行为数据。


身份数据:通过平台提供服务,由接受服务的用户提交的信息所收集而成,或通过收集阶段进行整合分析,通常每个用户在注册阶段,依照各注册字段进行的填写内容,如昵称、姓名、性别、电子邮箱、联系方式、教育背景、职业背景等内容。


行为数据:通过对用户在网站或应用程序的用户行为,如使用或浏览方式进行收集整理分析,达到通过行为进行用户画像(personas)的目的,而用户画像本身是基于一系列用户数据,如用户社会属性、消费习惯、个人喜好等真实数据所形成的数据模型。


内容数据:指基于数据中的信息内容进行数据整理,如各种视频、声音、图片、文字等,与受众产生互动,从而得到了有价值的交互数据。通过对这些交互数据的筛选、挖掘、分析,得到有价值的数据,从而对后期内容的生产和发行形成指导和信息交易。


关于数据的属性,应当有以下五个:无损性、多渠道性、时效性、扩容性、多样性。


关于无损性,无损性是数据本身传播过程中的一种特别的属性,正如知识产权的属性一样。知识产权的一种天然的属性是跟所有权分离的,同理,数据在复制和传播的过程中,跟民法传统物的流转是不一样的,数据可以通过多次复制被提供,且数据并不因为多次提供或者交换而使本身的价值减损。


关于多渠道性,数据本身是可以被多个主体获得或者使用的,有的时候甚至是可同时使用的。一个主体可以很容易获得数据的渠道,但并不代表其他主体没有类似相同的渠道。对于数据的来源,存在环式或者链条式等各种结构,对于上下游之间的数据开发和处理方案而言,也是互相成为各自上下游方利用的数据分析的样本。例如,一家公司通过规范的处理方式将数据脱敏,即去除个人隐私的身份信息等不带有具体单个用户画像的数据,将该数据跟其他公司的数据发生交互,其他公司再通过其处理和分析后,也有可能再跟这家公司的数据再次发生叠加和处理。近几年在中国的市场,数据分析处理公司的水准越来越高,我国现在已经完整拥有了自己中游或者上游的质量非常高的数据处理和分析的构思,同时也为我国数据的安全和数据跨境流动提供了更多的技术成熟性和安全的保障性。


关于扩容性,即对于数据的利用和开发形成的衍生数据和数据的效果,同样也可以反馈给原生数据,丰富原生数据开发的进一步可行性,因此更增加了数据流动的基本价值。


关于多样性,同样的数据分析后,产生的内容和分析结果可以完全不同,而这种不同的数据结果导致数据的体量和内容更加丰富。同样的数据可以发展出不同的应用场景,且每个场景之间可以互动互通,也可以各自独立。


关于时效性,数据的“时效性”要求很高,数据可能很快过时,因此可能在很短时间内失去价值。数据收集过程中,需要持续性的投入,以保障数据样本更新和时效性。当然,“失去时效”的数据并非没有价值,只是在数据发掘和数据开发的过程中,数据对分析结果的影响可能随着时效性的降低而随之降低。


基于互联网和移动端的发展,当下社会数据收集和创造变得便捷,且通过互联网数据分析技术的突破性发展,分析利用数据并依照分析结构预测成为可能。数据本身是信息流动的产物,数据分析利用已在网络通信、医疗卫生、农业研究、金融市场、气象预报、交通管理、新闻报道等方面广泛应用。正如Facebook的副总工程师杰伊•帕瑞克所言,“如果不利用所收集的数据,那么你所拥有的只是一堆数据,而不是大数据”,因此,数据是收集的样本,而大数据是对于数据潜在价值的挖掘和分析,是种类多样的数据集合。


数据的来源是千千万万的用户提交和收集行为,但对于数据分析和利用结果,通常是海量数据中极小的一个片段。分析结果离不开海量的样本数据,但结果价值和方式却高于样本数据。正因为数据本身散乱的来源,因此需要通过大数据分析技术将数据加以“提纯”,而这也是数据本身“价值密度低”,但“商业价值高”的表现。


03

数据维权中的案例分析及意义


第一个案例是微博公司诉脉脉公司不正当竞争案。微梦和脉脉的合同约定脉脉可以利用微博系统开放接口(open api)获取微博用户信息资料用于脉脉应用。后微梦公司发现脉脉在未授权情况下大量使用非法获取的微博用户信息。微梦起诉脉脉在未得到授权的前提下非法搜集微博用户信息,并将非法获取的信息与自身应用搜集到的信息非法关联,构成不正当竞争;脉脉以公告形式恶意抹黑微博,构成商业诋毁。要求脉脉公司立即停止侵权、赔偿损失。 两审法院均支持了微博公司的诉请,判决二被告构成不正当竞争以及共同赔偿微博公司200万元的经济损失和合理支出20万元。


该案例贡献了以下三点有价值的思考:第一点是强调了数据的价值,确认了信息时代的数据包含一定的商业价值,是反不正当竞争法中应当保护的商业利益;第二点是强调了第三方平台使用授权平台数据的时候应该遵循三重授权原则——在收集用户数据的时候,第一层原则是应当经过用户的授权,第二层是应当经过合作平台方的授权,第三层是在数据调取和使用的具体平台当中,应当经过用户的再次授权;第三点是强调了网络平台在已征得用户同意的前提下,可基于自身的经营活动收集且进行商业化利用用户信息,网络平台还有权以自己名义进行相关维权。


第二个案例是大众点评诉百度地图不正当竞争案。百度地图曾推出过垂直搜索功能,即在百度地图里输入某一家餐馆的名字,就会显示出该餐厅的地址信息,同时还会显示出食客对该餐厅的点评信息,这些评论信息有一部分来自于大众点评网,百度在使用这些信息时有标注“来自大众点评”的说明并提供链接,用户可点击该链接跳转到相应的大众点评页面。大众点评诉称“百度地图”及“百度知道”大量复制了其用户点评信息,构成不正当竞争,要求赔偿经济损失9000万及合理费用453470万。一审认定百度对大众点评造成了实质替代,百度应当本着诚实信用的原则和公认的商业道德,合理控制来源于其他网站的信息,判决百度构成不正当竞争,承担赔偿经济损失300万元;二审认定大众点评网上用户评论信息是经营者付出大量资源所获取的,具有很高的经济价值,属于劳动成果,百度属于“未经许可使用他人劳动成果”,驳回上诉,维持原判。


对于此案,一审法院上海浦东法院归纳了三个争议焦点:1、大众点评的服务与“百度地图”和“百度知道”的服务之间是否构成竞争关系;2、被告是否导致大众点评流量减进而对其构成了实质性侵害;3、被告抓取大众点评的信息的行为和构成不正当竞争之间的关系。


一审法院对应分析是:1、通过“百度地图”和“百度知道”与大众点评争夺网络用户认定大众点评网与“百度地图”和“百度知道”提供的服务构成竞争关系;2、被告是通过技术手段从大众点评等网站获取点评信息用来充实“百度地图”和“百度知道”的产品,故实质性替代了大众点评提供的服务,进而给大众点评造成损害;3、百度搜索引擎抓取的涉案信息其实并不违法,但是这并不代表百度可以任意使用其抓取来的信息,百度应该本着诚实信用的原则和公共的商业道德来合理控制信息使用的方式。


从大众点评网诉百度网讯公司不正当竞争案,可以看出涉案数据区别于身份数据和行为数据,更多是长时间积累的用户评论(UGC) 所形成的内容数据信息。而对于内容数据的应用,其中对于数据的长时间积累和基于商业模式上对于必要收集所进行的投入,是竞争和产业发展过程中的必经阶段,因此通过技术利用他人劳动成果的行为,属于不正当的竞争行为。


04

数据产业中对商业化数据利用的思考


总的来说,我认为商业化数据利用应当考虑以下几点:


一是,数据收集和使用应当遵守现有商业秩序。我们会看到越来越多的判决中,在论述基本法理认定的原则和法律属性判断的时候,更多的或者说衍生的部分都会去判断现在社会商业秩序和商业权利分配的合理性或者平衡度。遵守现有商业秩序,也就是说市场经济的效能竞争和商业模式的流通,应该还是要以遵循现有合理的商业秩序为前提的。


二是,充分尊重平台在数据收集中的权益。三重授权原则之一要求,商业利用开发应该获得数据平台的授权。因为如果仅仅通过单个用户的授权,单个数据基本不会获得相关需求方的关注,正如你发了一条信息没有人关注,没有社会效应,那它本身的社会价值可能是极低的,但如果你的信息发在微博这样的平台上,基于微博平台已具有了非常成熟的粉丝效应或者说是商业化的生态效应,可以给你的信息带来非常好的商业价值。但需要注意,这种平台效应绝不是天然形成的,而是通过运营公司多年的商业合理性经营、开发、利用、分析得来的。


三是,应当与现有权利体系进行结构化区分。这是由数据天然的独特属性决定的,数据与传统意义上的知识产权、物权、人格权、财产权等完全不一样,所以决定了看待数据收集和使用的问题的时候,需要带有多层次的规制手段,并与传统既有的权利体系进行结构化区分。


四是,技术中立应当具有合理边界。即技术创新应该要考虑合理性的边界。例如在既有案例中已经出现过的搜索引擎当中的垂直搜索、爬虫技术等技术,其若不考量在应用层面的合理性,以及在商业模式层面是否构成合理竞争,还是会构成不正当竞争。技术作为一种工具的手段,虽然存在着中立性的价值,但并不因此导致其在法律层面的属性发生根本性变化。



来源:IP颖响力

(本文为授权发布,未经许可不得转载)

近期热文

 


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存