近日,欣闻中国海洋学会就《海洋资源数据治理元数据》等2项团体标准公开征求意见。中国生物多样性保护与绿色发展基金会(中国绿发会)海洋与湿地工作组认真响应号召,进行了研究。总体看,这份草案在结构和内容上都展现了较高的专业性,为海洋资源数据治理提供了良好的框架。为服务海洋治理、海洋科学研究,从建构的角度,中国绿发会海湿组提出以下几条建议,供参考:
(一)考虑到未来可能出现新的数据类型和应用场景,元数据结构应具有良好的扩展性。建议通过配置的方式灵活调整元数据内容和结构,以适应不同的需求。理由:海洋数据种类繁多,随着科技的发展和研究的深入,新的数据类型不断涌现。而且海洋数据应用场景广泛,从科学研究到资源开发,再到环境监测,对元数据的要求各不相同。所以,元数据标准也在不断发展,需要适应新的标准和规范。在这样的背景下,就得考虑如何通过配置来实现元数据结构的灵活调整?可以考虑元数据元素模块化,也就是将元数据元素按照功能和属性进行划分,形成独立的模块。通过配置文件或数据库来定义模块之间的关系、元素的属性和约束条件,可以方便地添加新的模块或修改现有模块,适应新的数据类型和应用场景。从配置化工具的角度说, 提供一个直观的图形化界面,让用户可以方便地配置元数据结构,无需编写代码。提供脚本语言接口,允许用户自定义元数据配置。(二)关于元数据更新机制和管理的建议:因为数据是动态变化的,元数据也需要随之更新。因此建议明确:应建立一套完整的元数据更新机制,包括触发条件、更新流程和责任人。从元数据版本管理上来说, 对于历史数据,应保留不同时期的元数据版本,以便进行追溯和分析。(三) 明确元数据的存储方式,是与数据一起存储,还是单独存储在元数据仓库中。理由:元数据的存储方式是一个至关重要的决策,直接影响到数据管理的效率、安全性以及可扩展性。将元数据与数据一起存储的话,虽然方便查询和管理、方便实时更新、同步,但是也可能导致相同的元数据信息可能在多个数据表中重复出现,造成存储空间浪费、以及难以同步、系统耦合度高,维护难度增加等情况;将元数据单独存储在元数据仓库中的话,虽然比较方便统一管理和维护,但往往需要额外的元数据仓库系统、更复杂、维护的难度也更高一些。(对于数据量较小、结构简单的系统,可以将元数据与数据一起存储;对于数据量较大、结构复杂的系统,建议将元数据单独存储。得结合系统的整体架构,选择合适的存储方式。如果系统采用分布式架构,将元数据单独存储可以提高系统的可扩展性。不过一般来说,对于大型的、复杂的海洋数据管理系统,可将元数据单独存储在元数据仓库中,这以便更好地管理元数据,提高系统的可扩展性、灵活性。)摄影:卫伟(中国科学院生态环境研究中心研究员,博士生导师) ©绿会融媒·“海洋与湿地”(OceanWetlands)
(四)从标准的拓展的角度来说,我们建议还再考虑以下要素:如何利用语义Web技术,为元数据赋予更丰富的语义,以实现更智能的数据检索和分析?如何利用人工智能技术,自动生成和更新元数据,提高元数据管理的效率?如何与联合国机构/国际组织合作,共同制定海洋元数据标准,促进全球海洋开放数据的获取、共享和利用?(五)还建议考虑增加一些内容。比如说,考虑到海洋数据的特殊性,是不是可以增加一些海洋专有的元数据元素,如海域类型、海洋要素、观测方法等等;从时间维度上说,对于时间序列数据,应详细描述数据的采集时间、有效期等信息;从空间维度说,对于空间数据,是不是可以明确空间参考系统、投影方式等信息。另外,定期生成数据质量报告,对数据的质量进行评估和反馈。
本文为日常工作记录,供了解和参考。
整理 | Wendy
编辑 | Samantha
排版 | 绿叶
【参考资料】
中国海洋学会关于《海洋资源数据治理元数据》等2项团体标准公开征求意见的通知
http://www.cso.org.cn/ggxx/3366.jhtml
海洋与湿地
全球环境治理微信号:OceanWetlands联系小编/投稿/授权:
010-88431370 17319454776
欢迎投稿、转发。联系后台长期授权: 18910282583
海洋拥有蓝色,地球才有脉搏 | 支持绿会生态保护公益项目,请点击“阅读原文”