其他
上海数据交易所建设高质量语料库,推动人工智能大模型产业发展
中共中央政治局4月28日召开会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。上海数据交易所立足国家数据交易所定位,于7月7日正式上线语料库,助力人工智能产业蓬勃发展,推进数字中国建设进程。目前已对接百余家合作伙伴,包括海天瑞声和拓尔思等,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。上海数据交易所从提高开放程度和数据质量两大维度,为四类供方制定差异化工作策略。针对数据质量高但开放程度低的供方,通过数据交易链有效破解语料数据流通的信任问题,并提供特色标签服务体系,挖掘应用场景价值,驱动稀缺数据开放流通;针对开放程度高但数据质量低的机构,搭建专业化数商服务渠道,以提高数据质量。围绕人工智能与各行业产业链深度融合,上海数据交易所打造核心服务,进一步提升语料数据应用效能,发挥平台信息聚集匹配功能。以多场景应用为导向构建特色标签化服务体系以应用场景为导向,上海数据交易所构建六类特色标签服务体系,涵盖15个应用领域,制定适用于通用大模型和垂类大模型的差异化推荐策略。通过特色标签化服务体系助力垂直领域供需方精准匹配,以交通运输领域为例,需要大量高质量、多模态的道路图像语料数据,用于自动驾驶规控算法训练与验证,提高自动驾驶仿真平台模型的精准度,以推动智慧交通领域数字化升级,打造智慧出行新未来。兼顾开源共享和商业化需求引领语料数据流通模式创新上海数据交易所将组织协调多方共建项目,建立长期可持续性运营的机制,兼顾开源共享和商业化使用的需求,通过数据要素价值释放为各行业企业数字化场景赋能。线上通过信息发布平台撮合交易,线下以DSM(Demand