布朗大学数字学术中心介绍
布朗大学数字学术中心
The Center For Digital Scholarship, Brown University
关于CDS
布朗大学(Brown University)是美国最早的八所常青藤联盟(Ivy League)高校之一,位于美国的最小州—罗德岛州(Rhode Island)的首府普罗维登斯(Providence),毗邻高校云集的波士顿。布朗大学数字学术中心(Center For Digital Scholarship,Brown University,简称CDS)隶属于布朗大学图书馆,位于John D. Rockefeller, Jr. Library(简称洛克菲勒图书馆)的第一二层。中心主任总监现为埃莉·米洛纳斯(Elli Mylonas)女士。该中心拥有一个独立的数字学术实验室(PATERICK MA DIGITAL SCHOLARSHIP LAB),具备进行数字化处理的多种软硬件设施与工具,在数据管理、保存与共享,数据可视化,文本与定量分析,GIS和制图,2维和3维对象的数字化,视觉设计和用户界面开发,开放获取和学术交流,数字研究项目咨询、设计和实施等诸多方面开展数字学术教学、研究与合作。中心的主要宗旨是组织并促进布朗大学社区使用数字技术的学术活动,为布朗大学的每个学科提供相关建议、设计,开展合作项目,举办研讨会等。
特色项目简介
1
数字出版物倡议
Digital Publications Initiative
该项目是数字人文中心在数字出版领域的代表性项目,由安德鲁·W·梅隆基金会(the Andrew W. Mellon Foundation)资助,主要帮助和推进学术出版物的数字化再现与出版。该项目下目前正在进行若干子项目。以即将完成的“熔炉和赋格曲”(Furnace and Fugue)子项目为例,该项目由数字学术中心的研究人员与布朗大学的古典学术系、设计系、音乐系、美术系、历史系等多个专业领域学者通力合作,对迈克尔·迈耶(Michael Maier)在17世纪出版的Atalanta fugiens一书进行数字化处理和在线出版。通过多种媒体技术,将这本1618年出版的著作里的文字、图像、乐谱等都进行了数字视听化再现。读者们可以通过点击与在线检索,全方位地了解作者生平经历,书中插图里各种形象的来源背景,聆听书内乐谱所演奏的17世纪音乐等等。同时还能通过数字图书内所包含的专业论文与评论,深度了解学习本书,并根据自己的兴趣自由探索该书的阅读与学习方式。目前,“熔炉和赋格曲”项目已经完成了全部数字化处理工作,将于2020年秋季由剑桥大学出版社的数字出版物系列项目出版发行。该项目在如何运用数字技术对古籍进行数字化再现与保护方面进行了非常有益的探索,其充分表明了古籍的数字化并非仅仅意味着将古籍进行数字化扫描和电子化存储,更重要的是如何运用数字技术实现古籍在当代社会的“活化”再现,让古籍在人们的当代生活中仍然能够发挥其应有的作用。
该项目正在进行的子项目还有诸如Italian Shadows: A Curious History of Virtual Reality,Nicholas Brown and the Roman Revolution,Islamic Pasts and Futures: Gazing at Horizons of Time,The Sensory Monastery等等,内容涉及意大利18-19世纪城市风景的光学再现、法国古代修道院生活的可视化,伊斯兰历史的时间性再现与重构等。
2
以色列/巴勒斯坦的铭文数据库
Inscriptions of Israel/Palestine
该项目是数字学术中心在人文研究数据库搭建方面的代表性项目之一,旨在收集和提供波斯时期至伊斯兰教征服(公元前500年– 640年)的所有铭文(及其英文译本)。目前收集整理了大约15,000个铭文,主要由犹太人,基督徒和异教徒以希伯来语、阿拉姆语、希腊语和拉丁语写成。其内容涉及范围广泛,从关于纪念性建筑的帝国宣言到犹太教堂的捐赠通知,到藏在骨库中的贱民名字等等。这些铭文提供的信息在现存的文献著作中通常是找不到的,是历史调查的宝贵资源。除了为这个庞大的数据库提供DTD咨询和标记策略建议外,STG( Scholarly Technology Group)率先使用了迄今未得到充分利用的开放源XML工具,以提供强大、灵活的Web搜索界面来搜索铭文以及有关铭文的元数据。与此同时,项目组还开发了MySQL参考书目数据库以及该数据库的浏览和编辑界面,世界各地的协作者都可以访问该数据库。该资源还可以用作为将来类似的人口统计项目提供有价值的模型。
CDS主要隶属于布朗大学图书馆,基于此,各种各样的数据库搭建与分享是CDS最为主要的工作对象。除了以色列/巴勒斯坦的铭文数据库项目外,CDS完成或正在进行的还有“十六世纪佛罗伦萨在线地名录”(Online Gazetteer of Sixteenth Century Florence)、“巴黎,十九世纪的首都”(Paris, Capital of the 19th Century)、佩里在日本(Perry In Japan)、布朗校友口述历史(Brown Alumnae Oral Histories)等涉及艺术、文学、历史等人文社会科学方面的诸多数据库项目。具体可查询网址(https://library.brown.edu/create/cds/projects/)
3
加里波第全景图项目
Garibaldi Panorama: Visualizing the Risorgimento
该项目是数字学术中心在数据可视化方面的代表性项目,以十九世纪中叶在英国绘制的一幅关于意大利英雄人物加里波第(Giuseppe Garibaldi,1807-1882)生平事迹的全景图为主线,结合1850-1885年间英、法、德等国报纸上关于加里波第职业生涯的插图和近4000种文献资料,对这位在意大利统一过程中举足轻重的历史人物的生活事迹进行了全方位的地图化和可视化呈现。项目将巨大的全景图按人物主要生平切分为55个分场景,每个场景均对应着该场景的文字解说和相应的研究文献资料等。并且,根据全景图和相关文献所提供的数据,项目对加里波第在欧洲游历的所有地点均进行了地图化呈现,每一个地点都对应着相应的文献资料链接。该项目为意大利统一进程这段历史提供了直观、丰富且共享的跨学科研究与教学资源平台。网址:https://library.brown.edu/cds/garibaldi/
工作坊
在数字学术的教学与研究方面,CDS以工作坊形式提供全方位的教学与科研服务,主要面对布朗大学社区内的学生、教师和研究人员,亦开展与当地社会机构和国际访问学者的合作。目前, CDS主要在以下四个方面提供工作坊形式的教学与科研资源。
1
数字人文工具与方法
DH Tools and Methods
该工作坊下设文本发掘导论(Introduction to Text Mining)、网络分析导论(Introduction to Network Analysis)、使用MALLET进行端到端主题建模(End-to-End Topic Modeling with MALLET)。文本发掘导论讲授如何使用Voyant,AntConc和MALLET等工具对大型文本语料库展开文本发掘与分析。网络分析导论讲授如何运用Gephi工具探索诸如Twitter等新媒介上的数据集合,从而发现其内部不同数据集之间的若干关系并将这些数据关系进行视觉化呈现。主题建模则探讨如何使用MALLET工具,从下载软件到输入原始数据集,再到创建各种主题模型。该工具可以根据单词的共现或重复出现在语料库中的方式推断有关单个单词的信息,从而实现在关键词搜索列表完成后,无需人工介入就能将一个单词从另一个单词中解析出来。这类主题建模工具在人文领域具备广阔的应用前景。
2
数据管理与数据共享
Data Management and Data Sharing
该工作坊涵盖四个方面的内容:(1)了解如何为研究项目或资助计划编写数据管理和数据共享计划以及布朗大学可用于协助编写这些计划的人员、工具和资源。(2)学习如何将数据存储到相关的存储库中,以及布朗大学图书馆可以提供哪些人员、资源和服务以协助参与者成功地归档,发布和引用数据。(3)研究数据管理基础知识(Managing Research Data)的课程,包括如何建立文件命名约定、文件夹结构、注释和描述数据、版本控制、备份、存储和保护数据文件等,以及在存储库中共享和归档数据等。(4)数字身份管理(Managing Digital Identity)课程,包括如何利用社交媒体、博客和其他出版物直接影响人们阅读?运用哪些工具可以协助制作数字叙事(digital narrative),提高社交媒体知名度,扩大在线出版物影响以最终促进职业发展。
3
数据清理和处理
Data Cleaning and Manipulation
数字人文研究中往往会产生大量的重复或无效的冗余数据,如何能有效地清理和处理这些数据对于提高研究效率和准确度十分重要。该工作坊提供运用Open Refine这一易于使用的开源工具进行数据清理的具体方法。对于需要大量使用诸如学术数据库、档案馆或其他来源数据的学者来说,这十分帮助。同时,该工作坊传授使用Regular Expressions这一文本发掘工具的方法,以帮助人们在文本种发现各种模式,并进行大规模的改造。这个使用范围广阔且功能强大的工具与大多数文本编辑工具兼容,从微软的excel到Python和Open Refine。
4
数据分析与可视化
Data Analysis and Visualization
数据的视觉化呈现一直是数字人文研究的重要领域。该工作坊主要讲授视觉感知,设计和表达以及与受众进行交流的一些基本原理。具体包括(1)如何使用API((Application Programming Interface))创建数据集,以帮助人们批判性地思考数据,使得人们通过数据进行的表达更准确。(2)学习使用Tableau软件包,快速将各种可视化文件放在一起并上传浏览,参与者将通过探索自己选择的数据集并设计自己的可视化方案来传达他们的发现。(3)如何使用Excel进行数据可视化。Excel作为常用软件,其在可视化方面的应用经常被忽视。但是在许多情况下,Excel是生成简单静态可视化效果的最合适工具,可以轻松产生具有吸引力的结果,并达成最佳的数据可视化效果。
译者简介
杨光,山东师范大学文学院副教授,布朗大学哲学系访问学者。本文由译者对布朗大学数字人文研究中心主任Elli Mylonas及主要研究人员Allison Levy、Patrick Rashleigh、Ashley Champagne等人的采访,并结合CDS网址(https://library.brown.edu/create/cds/)相关内容译出。
END
主编 / 陈静
责编 / 任苗青
美编 / 任苗青