查看原文
其他

从“数位典藏”到“数位人文”和“空间人文” ——黄进兴先生访谈录

郝倖仔 DH数字人文 2022-07-17

基础设施







郝倖仔

------------------------------------

受访人简介:黄进兴,1950年生。台湾“中央研究院”副院长(2016-迄今),院士。台湾“中央研究院”历史语言研究所所长(2009.10-2016.10)。唐奖教育基金会“汉学奖”召集人(2017.1-2020.12)。台湾大学历史系学士(1973)、历史研究所硕士(1975)、美国哈佛大学历史学博士(1983)。主要研究领域为中国近代思想史、宗教文化史、历史哲学、比较史学。在大陆已出版的专著主要有《历史主义与历史理论》《优入圣域:权力、信仰与正当性》《圣贤与圣徒》《后现代主义与史学研究:一个批判性的探讨》《从理学到伦理学:清末民初道德意识的转化》《皇帝、儒生与孔庙》《儒教的圣域》等。

黄进兴

采访人简介:郝倖仔,北京大学古典文学博士,国家清史编纂委员会副研究员,美国斯坦福大学访问学者,著有《明代〈文选〉学研究》。

访谈地点:台北

访谈时间:2019年10月17日

------------------------------------

一、早期的“数位典藏”

郝倖仔:据悉您目前就任Pacific Neighborhood Consortium(太平洋邻里协会,以下简称PNC)的执行主席。这个国际组织自1993年成立以来,一直致力于促进学术资源的交换,以及环太平洋地区高等教育、科研机构之间的信息技术的共享。您被邀请担纲如此重要的国际职务,可见“中研院”以及史语所在典藏及其数位化(即数字化)方面的成就确为世界瞩目。


黄进兴:人有时是被逼着长大的。会上我必须面对十几个国家的学者以主席身份致辞,晚上还要负责主持有各方代表参与的董事会。我的英语也算差强人意,应付得过去。会上一位80岁的英国学者发现我竟然读过他老师Trevor Roper的论文,高兴得不得了。“中研院”的数位化工作,一直都是人文副院长在主持,曾志朗、刘翠溶、王汎森当副院长的时候都主持过。史语所是世界上最早从事汉籍数位典藏工作的学术机构。数据库方面,我们开始的比日本和欧美要早,大约30年前就投入经营汉籍资料库,因为史语所自己有典藏可做,是国际汉学的重镇,当然日本也有汉籍典藏,但日本相对保守,现在可能不一样了,但在以前,就典藏的开放性,也就是用典藏做数据库方面,确比我们要保守一些。美国一直都很开放,但数位化做得比较晚。哈佛大学燕京学社最近才有相关成果大量问世。


郝倖仔:您的前任副院长王汎森院士也说,台湾在这方面做得很早,规模很大,而且集合了全台湾的力量,包括“中研院”、台大、“台北故宫”,以及其他博物馆等十几个单位。以至于后来像美国这样的发达国家,都来学习。美国刚开始是跟台湾的机构合作,后来就跟大陆的机构大量地合作。


黄进兴:近几年大陆奋起直追,人多钱多,各方面资源比较充沛,所以很多地方做的规模都比史语所还要大。在这个大形势下,史语所也慢慢转型成为一个数位化的中心,开创了“数位人文学”,希望能够以比较精简的人力和财力,做出比较有特色的东西。


郝倖仔:我们先谈谈早期典藏数位化的努力与成果吧。


黄进兴:史语所的数位典藏一直以来分了几块:考古库房、傅斯年图书馆(以下简称“傅图”)以及明清档案(内阁大库档案)。先来说考古这一块。2000年前,史语所就完成了以殷墟古物为主体的文物陈列馆,并且利用“中研院”计算技术的资源,率先完成了“数位典藏”工程。当时刚刚就任史语所考古学门召集人的陈光祖研究员,曾经试图联手中国社会科学院考古所以及考古所安阳工作站共同建设网络博物馆。这一提议后来未能实现,但殷墟题材的两岸交流确是积极互动的。


文物陈列馆作为史语所的对外展厅,展品全都来自所藏。殷墟古物悉数保存在史语所考古库房,明清档案展品来自傅图和明清档案工作室。这些重要藏品在文物陈列馆得以展示实体,又通过二维码使社会各界的参观者可以直接链接上史语所数位典藏的资源。


郝倖仔:当时启动做二维码的时候,文物陈列馆前馆主任李宗焜都还没有用智能手机,更不知道此码有何用处,只听人说便利,也就做了。文物馆建了一个独立的wifi,一进馆就可以自动连上,所有相关文物的介绍和资讯就可以在手机上查阅,不用登录史语所的账号密码,确是一个便民设施。


黄进兴:至于傅图和明清档案的数位化,前者按律都是谁当馆主任谁来主持,后者早年是由刘铮云研究员负责,近年来由陈熙远研究员接任。傅图的数位典藏就是把一些重要的古书一页一页去扫描,明清档案就是做数据库和资料库。


郝倖仔:我问了傅图现任馆主任林圣智博士一个问题:傅图数位化下一步可以努力的空间和方向在哪里?他说,就提供内部研究人员便利性这一点,傅图超过日本很多研究机构的图书馆。但是日本、欧美数位化善本资源的开放趋势愈来愈强,很多时候甚至无需登录注册,坐在家里就可以直接上网下载。相比之下,傅图由于对于善本的保护和重视,对数位化的规定更严格,授权门槛更高,这会让公众感觉到不那么容易亲近。他的思考让我感动,他想的是如何去降低乃至剔除门槛,而不是把馆藏变成一种权力。


黄进兴:傅图的确有规定要去申请账号密码才能查阅数位典藏资源。我们确实需要虚心思考,辛辛苦苦花这么多钱做这些数位化资源,怎样才能使其更开放、更便利、更公益。资讯的公开是所有图书馆未来的方向,不是什么特别的事情。越公开越透明越便利越好。哈佛大学也在做,而且做得很好。


郝倖仔:曾任傅图馆主任的刘铮云研究员以善本书扫描为例,来说明科技的不断进步催生数据库的不断更新。善本书上盖的红色印章,用彩色扫描,红章和黑字即可分辨;用黑白扫描,扫出来都是黑色,就会把字挡掉。但是最初只能扫成黑白图片,后来技术进步才能扫彩色。同理,邢义田院士主持做汉简,有红外线摄影技术之后,可以看到原先肉眼看不到的东西,后来红外线技术进一步发展,就又可以看到一些早先红外线看不到的东西。这就带来一个问题,旧有技术下做出来的数位化资源,要不要随着科技的进步而改善?


黄进兴:傅图善本书的数位化,在整个史语所的数位化工作中应该是最早的。当年还用了所谓的王安系统,当时王安的光碟是国际最先进的数位技术。后来王安垮了,傅图又花了很大的功夫才把资料从王安系统中转出来。典籍数位化理想的状态是,这一部分做完了就做完了,再开始做另一部分。但是技术不断进步,所以有些古籍可能还需要再重新做数位化。明清档案那一块也面临相似的问题:资料库的架构是十几年前的,只提供检索之用,就是拿关键字去查,查到什么资料点击出来看;可现在对资料库又有了新的要求,强调数位人文要用资讯技术来帮助人文学者做研究。那么内阁大库档案的原先架构就不适用了。要不要做新的架构,就是个问题。


档案拍摄也是如此:先前拍的色域、显色、尺寸都不如现在。所以势必要重拍。但是黑白改彩不会马上进行,因为工作太多。此外,目前档案保存的重要原则就是尽量维护原貌,不要多作修裱,但数位化又是必行趋势,所以档案馆同仁努力在尽量不伤害原件的情况下来做数位化,包括联系厂家量身定做一些重要的仪器。

傅斯年图书馆中文网站首页,http://lib.ihp.sinica.edu.tw

郝倖仔:陈熙远研究员介绍了明清档案工作室日常工作中使用的重要仪器:馈纸式扫描仪用来扫卷轴,大型卷轴拍摄仪用来拍摄超长卷轴,还有从下往上拍的册档拍摄、从上往下拍的平床拍摄等等。联系厂家都是根据线索顺藤摸瓜。比如听说哪家图书馆在扫描地图,就去问用的什么仪器,哪个厂家定做。结果找到的厂家有的做不了需要的尺寸;有的只接受送件,档案又必须件不离馆;有的又是大型机器搬运困难。总之克服种种不利因素,不断打听,不断洽谈,才能最终敲定合适的厂商。


黄进兴:档案所需仪器还有一个经费的问题。厂家既然量身定做,当然希望机器可以被买下,但是他们体谅所里经费有限,就只是租借机器,驻馆使用并计件付费。


郝倖仔:众所周知,数位典藏很“烧钱”,关于经费问题,大家各有各的说法,很有趣。同样做过傅图的馆主任,林圣智说经费很充足,刘铮云说当年他负责时老觉得钱不够用。


黄进兴:刘铮云应该是指买数据库时钱总不够用,因为数据库很贵,动辄要以台币百万计;林圣智说钱够用,应该侧重于买书。


郝倖仔:早年需要买新的数据库时,刘铮云都是去找王汎森前副院长,用院里的经费来支援。现在您是不是也要经常面对这样的“化缘”?


黄进兴:“中研院”的史语所、近史所、台史所这些文科研究所的图书馆联合设有一个协调会,各馆都会拨出一些经费投进协调会的基金池里,遇到买数据库之类需要花大钱的时候,如果是文科所们共同的需要,就拿这笔基金来买。再不够的话,就要找副院长拿院里的钱来支援。


郝倖仔:院里每次都能批下来吗?


黄进兴:那就要看院里经费的状况了。史语所向来勤俭持家,钱都用在刀口上。翁启惠前院长曾在院务会议上号召全体同仁向史语所看齐。近年经济并不好,所以预算难成长,只能斤斤计较,小本经营。我常跟同事说,现在我满身铜臭味,凡事先不问研究议题的价值,而是先掂量口袋里的铜板,有时还要去别所挪用,来年再还。看到大陆高校的经费充裕,令人羡慕!


郝倖仔:说到钱的问题,王汎森院士提到他在副院长任内(2010-2016)主持数位化工作时,碰上的一个似有理似无理的社会风潮,即希望从数位典藏中衍生出文创产业,进而衍生出产值。他说自己非常不幸,那几年都纠缠在产值这件事情上,每三个月都要汇报一次,非常艰难。最近文创产业的热潮过了,看清这里面很难赚到钱了,当时伴随文创产业冒出来的小产业也都难以为继了。


黄进兴:数位典藏其实根本赚不到钱,它的目的就是把一本书电子化放到网上,让所有人都能点击到,完全是公益的,怎么可能赚出钱来呢?我们毕竟是学术单位,有自己的步调和考虑,这一点与民间的数位化不同,譬如在投资上拓展市场,我们就没办法做到。当然资金上会有一些掣肘,但是这种非利益化、非经营化的路子,大家的心态也会平和。


郝倖仔:据说“中研院”早期做数位典藏的两位先生——计算机中心主任谢清俊和史语所研究员毛汉光,科学与人文珠联璧合。毛汉光先生当时做了一副对联,现在还挂在计算机中心的墙壁上:做人无心中算计,为学有计算中心。


黄进兴:他们是数位典藏的先驱。当时普遍认为典籍做了数位化之后,古书就不用读一辈子了,将来可以在电脑上查。对此很多学者持反对态度,包括我的老师余英时先生。他认为书是用来读的,怎么可以用来查呢?但后来发现这是一个大的趋势。


二、数位中心与“数位人文学”

郝倖仔:您在PNC年会的主持发言中指出:自1993年以来,PNC已经建成了一个促进各个领域学者跨学科合作的平台,包括信息技术、人类学以及社会科学。“跨学科”这个关键词,我在考察史语所数位典藏工作时感受到,确是处处体现了人文与科学的结合。正如他们开创的新兴学科——数位人文学,旨在超越早期的全文资料检索,真正实现将数位科学与资讯科学应用到人文研究上来。


黄进兴:“中研院”从1984年开始做数位化,那时候对此完全没有概念,在华人世界尚无机构做过数位化,也是在摸索。1980年代初个人电脑也才刚刚问世,我们还都不会用。开始仅仅是古籍的数位化,就是把古籍变成可以全文检索的资料库,内容就是“十三经”和“二十五史”,这么简单而已。但已是当时全世界的首创。古籍数位化阶段结束以后,到了1990年代,我们才发现,除了文字以外,还有很多类似图片、档案、图书善本的影像、文物馆的器物等等,也可以记录时代,就开始要将这些资源也做成数位化,且有数位博物馆的概念出现,但没有很成功,因为技术不成熟,当时全世界也没有几个成功范例可以学。台湾走在前面,筚路蓝缕,必然辛苦,全部都是新的摸索。进入21世纪,才有一个“国科会”的“数位典藏科技计划”,整整做了12年,林富士是从头到尾跟下来的,你要多去听他讲。该计划结束以后,“中研院”负责维护成果,并进行转型。于是今天你看到的这个数位化中心应运而生,它成立的目的即为保护既有数位资产,以及促进数位人文学的发展。中心一直由林富士负责,“数位人文学”亦始于他,2020年初由陈熙远接任。


郝倖仔:“中研院”开始发展数位化计划在1984年,林富士正好在台大读研究生,兼任这个计划的助理,所以完全是一个很奇妙的因缘。


黄进兴:他硕士毕业以后就到史语所来工作了,当然并不是因为参加过数位化的关系,而是因为他自己的学术研究。他应该是所里挑选优秀硕士进所,然后送出去读博士这一培养模式的最后一个人。


郝倖仔:他读完学位回台以后,所里看他做过数位化,就要他去接管一段时间。但数位化的负责人换得很快,每个人做几年就被换了。林富士提出一个概念——“数位工农兵”,意思是说数位工作没有哪一个人能独立做下来,因为跨越很多的学科,所以永远是集体在做。个体学者永远都是在群众里面工作,没有个人的色彩。数位的工作人员最少都是以百人为单位,最高记录的一次,开会点人头超过1,000人,中心至今有100位助理。这一点迥异于传统人文学者的个体治学方式。


黄进兴:林富士将自己也定义为工农兵,常说自己研究的是边缘的历史,跟庶民和工农兵最有关系。


郝倖仔:他认为傅斯年时代是一个个人英雄的时代。到了师兄黄进兴的时代,还是个人学术研究的杰出表现成为楷模的时代。再下一个时代,就是数位工农兵的时代,所想到的楷模不是某一个人,而是一个单位、一个群体或者一个资料库,是由几百个人文学者与工程师,甚至是几代人的力量集结完成的。


黄进兴:从傅斯年开始,一直到1980年代任所长的丁邦新——现在所里最强大的一批人,包括所有的院士都是在他任上被吸纳进所的——都在贯彻“拔尖主义”:我要用的这个年轻人,在这个课题上绝对是全世界第一。但同时也有强调集众工作的传统。傅斯年也找很多不同学科的人一起工作;凌纯声先生早年领导民族志的写作,就是语言学家、音乐学家、地质学家等众多学科的人在一起,对某一个区域进行全方位的研究;杜正胜先生任所长时,强调的也是集体和集众工作的观念;王汎森也有一本书叫《天才为何成群地来》。


郝倖仔:我问林富士,投入那么多精力做数位化,对自己的传统人文研究来讲,算不算一种牺牲?他说从学生时代一直做到快退休,都陷在数位里头,很幸运也很不幸。自己的学术也还要做,确实很辛苦。但他尽量将其与自己的研究相结合,人文学者中少有能够充分、大量地利用资料库者,他是一个。这当然要求个人不断地去学习,要敢于离开自己的人文历史专业,去接触自然科学、资讯科学。他很快乐,不能说牺牲。


黄进兴:林富士的研究跨时段都很长,很少停留在某一个断代,时代的变化会很清楚,应该得益于他充分利用资料库。


郝倖仔:林富士很骄傲地告诉我,他在争取项目方面还从来没有失败过。这个吃饭的本领还要得益于张光直先生的指导。张先生1990年代从美国回台湾做“中研院”副院长的时候,二人有一些行政上的交往。张先生认为钱对一个学者很重要,因为要养人、要发展学术,而这一切要从学会写proposal开始,他甚至将自己申请foundation的那些计划书拿给林富士看。所以直到现在申请那些几个亿的项目,基本上都是林富士亲自写proposal。


黄进兴:几个亿的项目在大陆不算什么,在台湾就算很大了。


郝倖仔:这个数位中心的定位比较特殊,是史语所下面的二级单位。王汎森在人文副院长任上时,希望把它提成院里的一级单位,就在该往上提一把的时候,王汎森卸任,所以转型没有成功。林富士笑言,他作为数位中心的负责人,名头叫召集人,实际上是“有官无印”——虽然也是一级单位,可以签很多的文件,但没有官印,是假的单位,但又有预算和人员——身份很尴尬。虽然数位中心的规模和实力超过很多的人文所,但是拿不出去。我觉得大陆的说法应该管这种机构叫“虚体”,相对于“实体”而言,虽然也有漂亮大楼,也有人有钱,但无正式编制。他说意思差不多,他本人无所谓,但底下的优秀人才留不住,就因为中心“妾身未明”,没有“合法婚姻”。


黄进兴:要解决此事,需要修正院里的组织法,还必须送到上级机构去。


郝倖仔:机构有人有钱就可以做事出成果。数位中心在国际上、在大陆都有影响,合作颇多。譬如说著名的《四库全书》数据库,学界家喻户晓。


黄进兴:我们做的第一套数据库是汉籍的全文资料库,第二套大概最有名,就是你说的《四库全书》资料库,是香港的一个公司做的,全部是院里的技术资源,我们分文不取,教会香港的公司怎么做。当时数位化是谢清俊教授负责,之后像大陆的爱如生等商业公司,要么直接跟我们学,要么跟香港公司学,走的基本上就是同一条路了,反正已经有一个范本,后面就容易了。但同时他们也就停留在那个层次了。


郝倖仔:近年来有一个合作项目——“中国历代人物传记资料库”,由哈佛大学出钱,兼设计格式,史语所提供内容传记资料,北京大学承担人工,即人力的校对与计算机的处理。这个资料库最早由一位美国汉学家设计,哈佛大学接受其格式并进行修正。总之就是三边的关系,三方共同挂名。这个三方合作的网络版从2018年开始,又回到史语所的数位中心来做。


黄进兴:中国大陆做这一块,在量上面已经超过史语所了,但有一点尚在追赶,就是数位人文学。以前的数位化只是简单的全文资料检索,新的数位人文学是要把数位科学和资讯科学的一些工具、概念、方法用到人文研究上来。我们创造了一个新的数位人文研究的平台,把工具和资料库结合在一起,形成一个系统的学科。当然,前面说了,就典籍数位化来说,大陆这一块其实起步也不晚,1990年代就和我们“中研院”的谢清俊、郑锦全等有过密切的交流。


郝倖仔:这些交流源于当时北京大学中文系团队陆续开发一些数位人文的产品,包括“全唐诗、全宋诗分析平台”“资治通鉴分析平台”“中国历代总目分析系统”“数字中国古代文学史”等,但因一直没有找到持续的资助,靠自己找项目,发展不顺利。现任中国科学院自然史研究所图书馆馆长的孙显斌研究员,当年亲身参与北大中文系的数位开发,同时也是史语所的“汉典”的受益者,感慨“中研院”不仅有敏锐的学术前沿见识,最为难得的是历任领导长期支持这项工作。就像您经常说的一句话:史语所的成绩是一棒一棒跑出来的。


黄进兴:当年的“汉典”的确给很多大陆学者留下了难忘的回忆。最近大陆方面在“数位人文学”这一块追得比较快。武汉大学、南京大学成立了“数字人文学研究中心”,清华大学、中国人民大学还创办了数字人文研究的学术期刊。上海图书馆一直是重镇,研发项目侧重古籍尤其是家谱。史语所、傅斯年图书馆与上图是老朋友了,但在数位人文方面尚未真正展开合作,正在议谈之中。上海图书馆多与世界接轨,观念比较新。武汉与上海方面都有来史语所数位中心考察过,但不容易有正式的合作。民间交往很频繁,我们经常派人过去都没有问题。但一进入正式合作的阶段就面临签订各种合约,名称的问题就出来了。所以说,数位这一块,与大陆之间不能算没有合作,也不能算真正有合作。


郝倖仔:林富士也特别跟我提到,武汉大学成立了大陆第一个数字人文学研究中心,是在王晓光教授的引领之下,据说史语所启动数位人文学是为了保持在这一领域的领先地位,因为五六年前台湾大学做的比较前列,大有赶超之势。


黄进兴:做数位有一个基本的思维:在文字的时代,当然以书籍为主。到数位的时代,所有文字、图像、声音、影像,都是史料。史语所历来强调史料,且史料不限文字,所以才会有多年来对于考古、地质、文书、民谣等各种标本的收集。但很多新的概念,包括空间人文学的概念、物质文化和流行文化的统计、人群的移动、文本里面的情绪等等,都是要依靠数位工具帮助完成的。而这些是传统人文学者不熟悉的,所里大部分同仁还停留在全文检索,这样史语所就落后了,或者说台湾的人文研究就落后了。所以史语所就要想办法保持引导地位,于是就发展出了数位人文学。这是我们的责任,因为有个光荣的老祖宗。


三、地理信息系统(GIS)和“空间人文”

郝倖仔:我在考察史语所典藏工作时发现,GIS(Geographic Information System,地理信息系统)这一块很有意思。一方面它是以数位人文为基础和前提来做的,包括最基本的典藏和资料库、数据挖掘以及查询检索系统等等;另一方面,它又努力超越工具的范畴,朝着空间人文科学的方向去发展和要求自己。


黄进兴:史语所的范毅军研究员30年来苦心经营这个地理资讯系统,做出了很有特色的成绩,大陆学界也有很多人知道他。我做所长任内,他接手东京大学的水岛司(Mizushima Tsukasha)教授,当选为亚洲地理资讯研究学会会长。此事是史语所国际化的一个亮点和新发展。


郝倖仔:最初是他一个人在做,后来规模越来越大,如今独立出来,在院方成立了一个专题中心,隶属于人文社会科学研究中心。


黄进兴:但是他的个人关系还在史语所,所以说GIS还是史语所的成果。这个项目开始于1980年代末,他刚从美国回来就开始做。当时即便在美国这也是一项比较新的技术,属于应用科学领域,主要用于处理空间要素,诸如土地管理、城市经营规划、甚至国防等等。历史要解决的问题就是人、事、时、地、物,所谓“地”就是空间要素。所以从一开始这就是一个跨领域研究。

郝倖仔:具体工作内容是怎样的?


黄进兴:简言之,就是将谭其骧先生早年所作的《历史地图集》[1],藉由矢量化技术的处理,将静止的纸图变为可以自由编辑、灵活使用的资讯工具。


郝倖仔:谭先生的地图集从1950年代到1980年代全部出版。但是纸图是无法编辑的。我看到GIS系统处理过的纸图,上面任何一个点,包括地名、地形、地物、地貌、边界线、河流等等,都有坐标,都有自己的经纬度。这些坐标可以是一个点,比例尺放大之后,就成为一条线(一条带状坐标)或者一个面(一片坐标)。以坐标为媒介,可以根据资料的多寡详细,把所有关联性的事件进行任意的应用和整合。真的是非常神奇!


黄进兴:谭先生《历史地图集》迄今已经全部实现矢量化,并且形成一个叫做“中华文明时空技术基础架构”的系统。做这个项目早期的想法就是基于计算机技术发展出来的GIS系统,来对传统文献包括器物进行解读分析,但30年间不断深化,难度越来越高,牵扯出的问题也越来越复杂。因此下一步的想法是利用这个技术对数位典藏中具有空间属性的文本资料做链接工作。举个例子,比如说《史记》《汉书》中某一个历史事件,涉及一系列连续性的空间场景,如果将其中点线面、人事物的因素都用计算机技术萃取出来并加以统计,再与这个系统整合在一起,就可以做长线,甚至可以做到空间分析、人口分布等等。而传统方式则是用人工一个一个做出标尺才可能实现。当然这样一个系统,还需要一些计算机的系数,目前都在发展中。


郝倖仔:复旦大学历史地理研究中心也做了一个类似的项目网站,名叫“中国历史地理信息系统”(CHGIS),是与哈佛大学合作的。


黄进兴:谭先生《历史地图集》的版权归属中国社会科学院,范毅军专门为此跑了几趟北京,花时间协商,最后社科院科研局给了他专属授权,就是只此一家。这是2000年左右的事情,我们是先做,做出来之后又去争取专属授权。


郝倖仔:范先生说,支持这项工作的关键人物是杜正胜先生。1996年他从近史所转到史语所,找时任史语所所长的杜先生谈,希望来所里并准备做GIS,杜当即表示全力支持。您当时是历史组的召集人,所以等于是您三位搭班全力配合。


黄进兴:是的,支持不是没有理由的。这个GIS系统用到了新材料、新方法,这也是老史语所的传统,傅斯年先生一直讲的就是新材料、新方法。


郝倖仔:他们也一直强调这一点。所谓新方法,即《历史地图集》全部实现矢量化之后,再直观地进行朝代的套叠。因为谭先生《历史地图集》只是一个框架,每个朝代都只是一个断面,系统做出来后希望断面之间可以产生更多的意义。举例来说,北京今天的某个区域在明代、元代乃至汉代属于哪个行政区域,一套叠就看出来了;再比如很多朝代都设有“州郡”这个建制,具体某一州郡在当时和今天的边界在哪里,穿过图层,一套叠就知道了。因此这个系统也叫做“古今时空的对位系统”,任何朝代都可以进行面对面、线对线、点对点的套叠。


黄进兴:他们还在全世界范围内大量搜集清末以来的地图。中国大陆变化最快的是在1980年代以后,大部分地区在1950年代之前,甚至上溯到清末都没有太大的变化。所以他们借助于这些清末的老图,很容易往上推,甚至成功复原汉唐的西安。其实汉唐的西安都有异位,不是今天的西安,但无论如何后者都可以构成参照系。这当然要以汉唐考古资料和文献的整合为基础,比如说依据唐代大明宫的考古资料就能确定原址位置。“推”要有所本。


郝倖仔:傅斯年先生当年讲地底下挖出来的材料是新材料,其实这些老地图,还有老航片也应该算是新材料。因为他们搜集的多是没有公开发行的、大比例尺的、经过测绘有坐标的地形图。谭先生《历史地图集》的分辨率很低,比例尺非常小,最大仅为1:24万分。且基本上是行政区划图,就清代来看最小只做到府,北京就是一个小点。所以他们必须根据自己的需要去找图。我看到他们藏有光绪年间北京的图,比例尺非常大,每个小村落都可以看到,非常漂亮。其实清末也就是19世纪以来,中国人就开始自己测图了。大陆各个省份的图他们都有,当真实现全覆盖。至于老航片,数量就更多,保守估计是一两百万张,涵盖大陆的大部分省份。航照技术是到后来才发展起来的,因此以1940年代之后所拍居多,二三十年代的较少。



黄进兴:作为单一机构收藏中国大陆的地图与航片这些老资料,“中研院”地理科学资讯中心在世界上也是数一数二的。各种图包括地形图、主题图、城市图,大概共计40多万件,全部扫描,且做成查询检索系统。他们的应用已经不只是面对历史专业,而且面对整个社会科学,包括考古、历史、宗教、政治学,甚至自然科学。很多计算机专家与他们合作,发表了一批纯科学性的论文。这个项目已然成为跨领域研究的推动者。


郝倖仔:GIS团队在思维习惯上也开始迥异于传统的历史学家。他们普遍表示最难沟通的就是历史学家,因为历史学不能容错,要求100%正确,此乃传统专业的规范训练所致。而科学是可以容错的,科学就是要在不断的错误中进步,精确度从10%提高到20%就是进步。就这一点来说,历史学家是非常保守的。


黄进兴:研究GIS的年轻人目前基本都是纯科学背景,有些纯粹就是做电子计算机的,而且做的不错。当然他们也在熟悉人文社会科学这一块,其实就是两边在靠。他们经营的方式也是理工科的方式,每年常规的经费预算支撑不了实验室的规模,他们就自己到外面去找钱、申请项目。


郝倖仔:以这个团队的技术,如果走市场化的路子是很容易赚钱的。


黄进兴:“中研院”自诩为先行者,是一直走在前面的。所以他们的战略是,一个商业公司会做的事情,他们就不做。他们是制定规则的人,先做出一整套计矢规范方法SOP标准,之后由商业公司去做。大家也乐见商业公司多赚钱多缴税,这样科研机构也能相应得到更多的政府拨款,所以彼此之间不存在竞争。他们会适度地支持一些非牟利性的志愿性的社会需要,提供方法技术和资料,诸如考古、民间社群主持的地方文史工作、地方产业的发展等等,此外还办课传播方法技术。


编 辑  | 许可

注释:

[1]谭其骧等:《中国历史地图集》,北京:中国地图出版社,1982年。


原刊《数字人文》2020年第3期。




《数字人文》2020年第3期目录

【DH数字人文】新年祝福(附赠最全推文合集)

 魏希德:数字人文研究的问题意识

比较视野中的数字人文对话与争议 ——南京大学“比较视野中的数字人文反思”学术研讨会综述

走进数字人文——爱尔兰科克大学“数字人文导论”课程纪要

从概念模型到计算批评:数字时代的“世界文学”研究


校对  |  肖爽

美编  |  徐璇






数字使人文更新


转载请联系授权

投稿邮箱:dh2020@tsinghua.edu.cn

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存