交换机 | 数字历史中的数据实践
文章 · 推介
数字历史中的数据实践
Data Practices in Digital History
作者简介:
马戎千, 美国匹兹堡大学计算与信息学院博士生, 零壹Lab轮值编辑
肖芳辉,美国匹兹堡大学计算与信息学院博士生
本文是对数字历史 (Digital History) 研究领域中的数据实践进行探索的初步尝试。它最初是我为研究数据管理一课做的课程作业,后来和同为匹兹堡大学计算与信息学院的博士生同学一起发展成为一篇论文并发表于 International Journal of Digital Curation。数字历史 (Digital History) 这个概念可以从数据、方法、以及研究范式等多个角度定义和讨论。这篇文章主要探讨的是,在新兴的数字历史学研究中,研究人员使用数字工具和技术对研究数据进行处理、分析、与保存的问题。为此,我们采访了近三十余名数字历史研究人员,包括历史学者、教授、历史学研究生、图书馆员等。采访试图从多个角度了解他们对于数据 (data) 这个概念在历史学研究领域中的意义和内涵的认识,以及他们在一个数据生命周期的各个阶段中具体的数据实践 ,例如,如何收集、处理、保存、和分享数据等等。研究的第二阶段,我们依据采访结果做成一个调查问卷,试图从相同的角度收集更多可供分析的数据。问卷通过美国图书馆学会的邮件服务发送并回收40余份有效答复。在这项探索性研究中,我们发现了一些有趣的观点和现象。
比如,我们发现“数据”这个概念在数字历史的研究中并没有被广泛接受的统一定义;研究者对于“数据”的理解是非常多元的。大部分学者不常使用“数据”一词,认为这个词承载了很多关于定量研究和“数值数据” (numeric data) 的意涵。但是也有学者认为“数据”并非历史研究的新词汇,应该将其和各类历史资料等同看待。对“数据”概念的理解也延伸到了关于研究对象范围、分析方法、以及研究范式转变的思考。一个有趣的看法提到相互连接的数据可以帮助历史研究更好的弥补“断裂的证据”之间的空隙,更好地“追踪不确定性”。关于具体的数据管理实践,我们发现档案研究依然是数字历史研究中数据收集的主要方式;数据可视化、文本分析、地理与空间分析的方法和工具正在被广泛应用。然而随着数据收集和分析方法的变化,对于数字历史研究数据的保存 (preservation) 和分享 (sharing) 还相对滞后。大部分受访人表示自己保存数据的主要目的是个人或单个研究项目的需求,因此较少考虑数据保存的标准及其日后被广泛分享或复刻的可能性。对于元数据的关注和使用也相对初步。许多历史资料及档案资源的版权限制以及数据储存库建设方面的局限也给数字历史数据的分享造成了障碍。另外,在当下仍以个人专著和论文为主要标准的人文学科评估体系下,如何衡量并肯定“另类”人文学术表现形式的价值(比如数据可视化、研究衍生数据库、项目网站等等 ),也成为数字历史研究数据实践中的重要考量和问题。文章的最后,我们试图从图书馆与信息学的角度讨论如何解决以上问题。北美的许多图书馆都建立了数字学术中心和数字人文研究中心,以帮助学者更好地参与数字化的人文研究。越来越多跨学科深入合作的项目出现并推动了数字人文的发展。在这样的学术环境下,我们强调了对于领域知识 (domain knowledge) 和学科术语 (terminology) 的理解和沟通在深度跨学科合作中的重要性。同时,制定数字历史研究语境下的数据管理标准和建议、完善数字化基础设施、以及提供相关的资源、举办工作坊等都是图书馆和信息学领域可以参与到数字历史研究并作出贡献的途径。
全文链接 ●●
Ma, R., & Xiao, F. (2020). Data practices in digital history. International Journal of Digital Curation 15 (1).
http://www.ijdc.net/article/view/597
END
主编 / 陈静 徐力恒
责编 / 马戎千
美编 / 马戎千