查看原文
其他

深圳数据交易所、数鑫科技、中国电子云、尚数网联合先行发布国内AI可信数据空间联合解决方案

前言——

自《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》发布以来,我国数据要素建设不断深入,在国家数据局等 17 部门联合印发的《“数据要素 ×” 三年行动计划(2024 - 2026 年)》中,进一步明确了建设高质量语料库和基础科学数据集,以支持开展人工智能大模型开发和训练。目前,我国在大模型领域已取得一定进展,但高质量中文语料资源的匮乏问题依然存在。例如,ChatGPT的训练数据中,中文资料所占比重不足千分之一,这导致国内在进行模型训练时常依赖外文标注数据集或开源数据集。业界认为,算法、算力与数据,是支撑大模型发展的三大基石,更高质量、更丰富的数据是以 GPT 为例的生成式人工智能大模型成功的驱动力。因此,数据工作已成为大模型行业中最受关注的一个任务。


近日,国家数据局发布了数字经济创新发展试验区建设案例,其中就重点介绍了广东省在加快培育人工智能产业方面的案例。广东省积极应对人工智能快速发展带来的机遇与挑战,充分发挥数据资源丰富、应用场景广阔、产业基础扎实等优势,不断完善政策保障体系,着力破解人工智能应用场景开放不够、应用深度不足等难题,加快推动人工智能技术创新、产业集聚,深化人工智能赋能千行百业,促进数字经济与实体经济深度融合,激发经济发展新活力,取得了显著成效。(点击阅读全文)



8月27日,由开放群岛开源社区、北京市东城区科技创新产业投资发展集团有限公司、深圳数据交易所(下称“深数所”)、软通智慧科技有限公司主办、开放算料联盟、中国电子云、深圳数鑫科技有限公司(下称“数鑫科技”)等协办的人工智能高质量数据集与数据资产化研讨会在北京成功举办。会上,深数所、数鑫科技、中国电子云、尚数网联合发布国内首个AI可信数据空间联合解决方案,该方案旨在促进高质量训练数据集的共享与应用,加速数据资产化的进程,为我国人工智能大模型的发展注入新的活力。


该方案整合各方优势能力,致力于打造一个开放、共享、可信的AI数据空间。深数所与中国电子云同打造统一的人工智能语料库索引,并辅以全方位的数据资产转化服务,尚数网则以其多样化的交付策略,为智能标注、机器视觉等算法环境提供坚实支撑。同时,结合数鑫科技的数据空间流通体系,确保语料数据在合规、安全、高效及可控的前提下实现流通。最终,依托深圳数据交易所平台,实现高质量训练数据的顺畅交付与交易结算。

数鑫科技创始人&CEO吴会才 讲解方案


方案整体包含四大部分,即数据交易平台、数据空间流通网络、算力算法能力平台、数据价值链生态体系等。数据交易平台集语料交易、数据资产化、数据登记等能力一体的服务平台,实现语料在线交易全过程闭环;数据空间流通网络保障参与方的数据权益,从技术方面同时兼顾语料提供方的数据持有权、模型训练方的数据加工使用权、以及各参与方的数据产品经营权,实现数据的跨域流通使用,并可形成多对多、多层级的数据流通网络,从而让AI可信数据空间更好的赋能各行各业。算力算法能力平台为参与方企业提供算力、算法、数据标注、模型训练等能力,助力企业降低运营成本;数据价值链生态体系构建完整的数据价值链生态体系,打通商业生态的闭环。


AI可信数据空间联合方案框架图


联合解决方案的推出,标志着国内在AI数据领域迈出了重要一步。通过聚合各方优势,该方案将极大地推动AI技术在各行各业的应用,为智能制造、智慧城市、金融科技等领域带来新的发展机遇。未来,各方将继续深化合作,不断优化和升级解决方案,为客户提供更优质的服务。



深圳数据交易所牵头成立可信数据空间

创新实验室



2022年5月,深圳数据交易所携手华为云、深圳数鑫科技,共同创建了国际数据空间创新实验室。短短一年后,该实验室便完成了国内首个智能制造领域的数据空间应用案例,并实现了全国首个基于数据空间的数据工具产品场内交易。2023年9月,实验室进一步升级为可信数据空间创新实验室,并迎来中国信息通信研究院和四川长虹电子控股集团有限公司的加入。新的实验室基于可信数据空间TDM设计原则和参考架构,致力于提供高效、便捷、普适的数据可信流通方案,以确保数据流通的安全性、可信度、可控性和可追溯性,进一步推动构建全国性的数据交易平台和完善的数据流通基础设施,从而促进数字经济与实体经济的深度融合。在人工智能领域,创新打造可信数据空间技术应用于大模型语料安全合规流通新路径,并通过商机精准匹配,高效链接哈尔滨工业大学(深圳)和北京瑞莱智慧科技有限公司供需双方,实现全国首单语言语料数据场内实质闭环案例落地。


2024年5月24日,国家数据局发布了首批“数据要素×”典型案例。其中,四川长虹电器股份有限公司的项目脱颖而出,入选工业制造系列案例。该项目以可信数据空间为基石,有力地推动了产业链和供应链的高质量协同发展。可信数据空间创新实验室在四川长虹电器股份有限公司成功孵化了工业数据空间,借助先进的数据跨域使用控制技术,实现了数据在长虹与产业链各方之间的安全、可控、可管理和可溯源流通。这不仅强化了电子信息产业链的协同能力,还利用龙头企业的信息优势,提升了中小微企业的信用水平和信贷能力。



声明

· 本公众号文章内容未经授权不得擅自使用,如需转载请注明出处和保持信息完整性。

· 如认为本文/本公众号中存在侵犯相关知识产权的内容,请与我们联系【alarm@szdex.com】。






继续滑动看下一个
深圳数据交易所
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存