因涉嫌窃取谷歌AI商业机密 中国籍谷歌工程师在美被捕
2024年3月6日,据美国司法部网站信息,美国联邦政府对华人工程师Linwei Ding(又名Leon Ding)提起四项商业机密盗窃罪名,指控其涉嫌意图从谷歌公司处窃取与AI技术相关的专有信息。3月5日,Linwei Ding在加利福尼亚州纽瓦克当地被捕。如果罪名成立,Linwei Ding将面临最高10年监禁及每项罪名最高25万美元(约180万元人民币)的罚款,联邦地区法院法官将在参考美国量刑指南及其他法律因素后做出判决。目前,联邦调查局与商务部正在联手调查此案。
起诉书显示,Linwei Ding今年38岁,为中国公民、加利福尼亚州纽瓦克居民。根据公布的法庭文件,Linwei Ding涉嫌窃取的技术涉及谷歌先进超级计算数据中心的构建模块,该数据中心专门用于支持大型AI模型训练和托管中的机器学习类工作负载。从起诉书看来,该大型AI模型能够理解细微的语言表达差别,属于能针对提示词、任务或查询生成智能响应的AI应用。
起诉书还描述了谷歌如何开发其专有硬件和软件,进而推动由其超级计算数据中心支持的机器学习过程。在硬件方面,谷歌采用了先进的计算机芯片,具备支撑机器学习并运行AI应用所需要的卓越处理能力。而在软件方面,谷歌部署有多层软件,起诉书将其称为“软件平台”,旨在有效协调机器学习工作负载。
例如,该软件平台的组件之一为集群管理系统(CMS),由其充当谷歌超级计算数据中心的“主脑”。CMS负责为整个硬件基础设施进行任务组织、优先级排序和具体分配,从而确保各先进芯片能够以高效方式执行机器学习工作负载或托管AI应用程序。
美国司法部长Garland表示,“司法部不会容忍对AI乃至其他任何可能危及我们国家安全的先进技术实施盗窃。在本案中,我们指控被告在秘密为两家中国企业工作期间,窃取了谷歌的AI相关商业机密。我们将努力保护美国开发的敏感技术,避免这些技术落入错误的人手中。”
该工程师号称是“全球能搭建万卡级算力平台的十人之一”
起诉书提到,谷歌于2019年聘请Linwei Ding担任软件工程师,其工作职责包括开发谷歌超级计算数据中心内部署的软件。正式入职之后,Linwei Ding获得了访问谷歌机密信息的权限,具体内容涉及硬件基础设施、软件平台及其所支持的AI模型与应用程序。
此外,起诉书还指控LinweiDing秘密与两家中国科技企业有所关联。从内容来看,Linwei Ding曾在2022年6月13日左右收到来自中国某早期科技公司CEO的几封电子邮件,其中提到Linwei Ding已被任命为该公司首席技术官。据称LinweiDing于2022年10月29日回到中国,并逗留至2023年3月25日。在此期间他参加了为新公司筹集资金的投资者会议。起诉书提到,各准投资方被告知Linwei Ding担任新公司首席技术官,而且掌握着公司20%的股权。
起诉书同时指出,在谷歌不知情的前提下,Linwei Ding于2023年5月30日前创立了自己的AI与机器学习科技企业,并担任公司CEO。Linwei Ding的这家公司宣称将开发一套软件平台,旨在加快机器学习类工作负载的运行速度,包括大型AI模型的训练速度。根据起诉书所言,Linwei Ding曾申请中国的初创企业孵化计划,并于2023年11月24日前往北京,在投资者会议上介绍了这家企业。而且与Linwei Ding初创公司相关的一份文件也提到,“我们拥有谷歌万卡级算力平台的管理经验;只需照搬并加以升级,就能进一步开发出适合中国国情的算力平台。”
起诉书强调,Linwei Ding的行为违反了雇佣协议以及其在入职谷歌时签署的单独行为准则。此外,起诉书也解释了Linwei Ding为隐瞒其商业机密窃取行为而采取的措施。
例如,Linwei Ding疑似将谷歌源文件中的数据复制到公司配发给他的MacBook笔记本上的Apple Notes应用程序当中。随后,Linwei Ding将AppleNotes转换为PDF文件,又将其通过谷歌网络上传至独立账户。据称Linwei Ding避开了谷歌数据丢失防护系统的检测。此外,起诉书还描述了Linwei Ding在2023年12月如何把自己的工牌出借给另一位谷歌员工,使其顺利打卡并进入谷歌办公大楼。打卡记录显示Linwei Ding似乎仍在出入办公地点,但他当时实际上人在中国。
美国司法部国家安全部门助理总检察长MatthewG.Olsen表示,“Linwei Ding涉嫌策划从谷歌处窃取顶尖AI技术,同时与中方竞争企业秘密接触并接洽业务。”美国检察官Ismail Ramsey提到,“Linwei Ding在谷歌担任软件工程师期间,曾秘密为个人及两家位于中国的企业谋取利益。通过窃取谷歌关于AI超级计算系统的商业机密,Linwei Ding为他本人及归其名下的两家中国公司带来不公平的竞争优势。”
根据国内社交媒体上挖掘的信息,Linwei Ding极有可能是融数联智CTO、至算科技CEO丁林葳。
根据介绍,丁林葳毕业于美国南加州大学,曾任谷歌主任工程师/异构计算研发负责人,是全世界能搭建万卡级算力平台的十人之一。领导GPU和TPU等加速器的系统设计和开发,以及Pathways和Jax的系统框架的开发。其团队开发了所有云服务的加速器系统,以及基于超级计算机来研发LLM大规模语言模型。丁林葳曾在谷歌搭建的万卡级算力平台,正在被GoogleResearch、Anthropic、DeepMind和OPENAI所使用。
丁林葳任职的两家公司中,融数联智成立于2019年,专精于隐私计算,公司拥有自主研发的隐私保护芯片、多方安全计算软件系统、AI联邦学习平台、可信计算TEE以及隐私计算一体机,为客户构建合法高效的数据协同链提供技术保障,助力数据在机构之间“可用不可见”的流通和融合应用,保障数据合作和数据流通的全链条安全,为数据要素发挥价值提供技术驱动。
至算科技是国内唯一最早推出单任务万卡级的大算力AI训练推理加速算力平台的公司,从底层系统上解决“国内做不了50B以上大模型”的痛点。信息显示,该项目创始人(丁林葳)曾在谷歌带队做出的6万卡TPU、2.6万GPU万卡级算力平台。本项目支持的算力规模可达单任务万卡,支持大模型训练时长从月级可降至小时级。
将谷歌技术机密上传至谷歌网盘,网友:事情绝不简单
起诉书提到,2022年5月21日,Linwei Ding开始将机密信息复制至个人Google Cloud账户,秘密上传保存在谷歌网络内部的商业机密。之后Linwei Ding持续定期上传,直到2023年5月2日,期间Linwei Ding共上传了500多个包含机密信息的独立文件。
美国司法部副部长Lisa Monaco表示,“在我们努力以负责任的方式发挥AI积极价值的同时,司法部也对其风险保持着高度警惕,包括可能对我们国家安全造成的全面威胁。从今天的指控来看,被告从谷歌公司处窃取到500多个包含AI商业机密的保密文件,同时也秘密在为希望取得AI技术竞赛领先优势的中国企业工作。司法部将不懈追查那些将颠覆性技术成果(特别是AI)非法传出境外的人,并追究其责任。”
有网友质疑,“将谷歌技术机密上传至谷歌网盘”这一操作并不符合“窃密思维”,反而更像是正常的日常工作。有网友评论称,“不离职就只是工作,离职就是窃密”,也有网友将其归类于“阴谋论”:“内部技术人才辞工,不能把人才流去其他地方公司,然后找点所谓的证据,只有坐牢了就不会把前公司的技术泄露出去了”。
目前,关于该案只有美国司法部一面之词,当事人还未回应。值得一提的是,起诉书本身仅为涉案指控,被告在被法庭证明有罪之前,面临的一切指控均遵循疑罪从无原则。