谷歌DTP:数据转移的得力助手
每个星期都有大量关于个人数据泄露的新闻,而唯一不可能获取到你数据的,似乎就是你自己。谷歌正在和微软、Twitter和Facebook开展合作,通过开源的DTP(数据传输项目)改变这一现状。该项目所开发的工具能够让用户将个人信息直接从一个服务器转移到另一个服务器。
这一工具是基于谷歌之前的数据传输服务(个人云数据存储服务):Download Your Data(或者是Takeout),用户将他们的数据存储在超过50个谷歌产品中,然后使用这一工具下载机器可读的数据副本。你也可以利用这一工具将你存储在Google Drive上的文件直接传输到Dropbox、Box、或者MS OneDrive账户中。
DTP的目标是将任意两个面向公众的产品接口连接起来,通过使用API来直接导入以及导出数据。这一项目的开发目的是测试在线服务器之间,特定类型的用户数据传输的概念性和可行性。
DTP是由“adapter”驱动的,“adapter”能够将专有的数据格式转换成规范格式,即“数据模型”。这些模型中的数据将会被用于在系统间传输数据。
任何两家供应商的数据传输服务都会使用供应商当前的认证机制。因此,每一家供应商都会对服务的安全性进行管控。
在数据传输时、以及数据传输后,所有的用户凭据和用户数据都会被加密,这一行为保证了用户数据的隐私性。在此协议之下,每一次数据传输都会生成一个单独的秘钥。
即使所有的过程都很顺利,但是还是会出现一些问题。例如,规范数据格式或许不会缓解类似格式限制或者不一致特征支持等问题。再者,DTP的方法能使全行业的数据在很大程度上实现可移植性,而不需要大幅改变当前产品或者认证机制。简而言之,它能让数据传输变得足够安全,DTP公司希望其他的公司能够加入他们,在其服务中加入导入导出数据的功能。
微软公司全球标准事务副总裁Craig Shank表示,DTP将会使用户的个人数据传输更加便捷、更加安全,具体如下:
●面向用户:数据可移植性工具应开放、符合产业标准、易于寻找和使用、用户可以随时使用这一工具来很容易地传输服务之间的数据,或者自己下载使用;
●使用强大的隐私和安全标准:数据可移植性传输过程中的供应商需要有强大的隐私和安全措施,来防止未授权访问、数据转移、或者其它形式的欺诈行为。应该明确告知用户传输的数据种类和范围、数据的用途、以及目标服务的隐私和安全行为。
●关注用户数据,而不是企业数据:数据可移植性需要关注个人用户数据的使用,例如用户创建、导入、或者同意用于收集信息的内容,或者使用数据控制器对服务供应商进行控制。企业应使用对数据的管理政策来控制企业的数据可移植性。
●尊重每个人:我们生活在一个人们互相联系、共享和共同创造的协作世界中。数据可移植性应只关注与请求数据转移的用户直接相关的数据,以便在可移植性、隐私和尝试新服务的好处之间取得适当的平衡。这意味着服务提供商需要确保尊重数据主体之外人员的相关私人信息。
这些看起来都很好,但是我们言归正传:DTP能够用于哪些场景?DTP开发者提供了以下的使用案例:
●用户发现新的照片打印服务,能够提供美观而又创新的相册,但他们的照片存储在他们的社交媒体帐户中。通过使用DTP,他们可以访问照片打印服务提供的网站或应用程序,并将这些照片直接从他们的社交媒体平台转移到相册服务中。
●用户不同意其音乐服务的隐私政策,他们想立即停止使用音乐服务,但又不想丢失他们创建的播放列表。通过使用这个开源软件,他们可以使用原始提供商的导出功能将其播放列表的副本保存到云端。他们在决定使用新服务后,能够将播放列表导入到新的提供商或多个提供商。
●用户向公司申请将他们的数据从濒临停业的供应商中导出。传统供应商在允许客户移动数据方面的选择有限,因此该公司为提供商的APS编写了一个Adapter,允许用户将数据传输到公司的服务,同时也使处理相同数据类型的其他供应商受益。
●“超市行业协会”希望允许客户将他们的购买历史从一个成员杂货店转移到另一个成员杂货店,这样他们就可以根据用户在商店之间的购买习惯向用户发放优惠券。协会将通过托管DTP的行业特定主机平台来实现这一目标。
这些都是很好的使用案例,但是我们什么时候能够使用这一工具?这个问题问得好。
正如Google软件工程师Brian Willard和Google产品经理Greg Fair所指出的那样:“DTP目前还处于早期阶段,我们鼓励开发人员社区加入我们并帮助扩展平台以支持更多数据类型、服务提供商、和托管解决方案。”
他们继续说道:“DTP原型已经支持多个垂直产品的数据传输,包括:照片,邮件,联系人,日历和任务。这些都是通过Google、微软、Twitter、Flickr、Instagram、Remember the Milk和Smugmug上的现有公开API实现的。”显然,这一方面还有很多的工作要做,但这些技术能力算得上是一个良好的开端。
如果你想亲自尝试,可以通过Docker和Code查看代码。要使该工具能够正常工作,你将需要每个服务的API密钥。
其他公司是否会支持?这也是一个很好的问题。早在80年代,当笔者还在编写C语言而不是技术文章时,在数据互操作性方面做了大量工作。虽然每个人都认识到开放数据API和格式是一件好事,但很少有公司愿意将他们的数据暴露给其他人。
也许现在,当开源方法显然是创建程序的最佳方式时,公司将更愿意接受这样一种观念,即与用户共享数据也可以为他们带来好处。
原文作者:Steven J. Vaughan-Nichols
编译:信息化观察网
往期精选
围观
热文
微信编辑器 96编辑器