该内容已被发布者删除 该内容被自由微信恢复
文章于 2021年9月25日 被检测为删除。
查看原文
被用户删除
其他

数字人文 | “佛学研究资源数据库建设座谈会”召开

转载 川大老子研究院 2021-02-06

编者按

感谢微信公众号【燕园佛学】授权转载!点击左下角链接可查阅原文。


北京大学佛教研究中心

举行“佛学研究资源数据库建设座谈会”


学术研究离不开电子资源已成为学术界的共识。基于共享精神,学界、社会界提供了许多网络资源,为研究者创造了便利。但与此同时,网络资源的有限性、不稳定性等局限,也为学术研究充分利用资源带来了困难与挑战。为此,11月19日,北京大学佛教研究中心邀请部分在京学者在中心举办了“佛学研究资源数据库建设”座谈会,商讨中心数据库建设的相关事宜。


北京大学《儒藏》编纂与研究中心杨浩老师首先介绍了知识图谱技术。知识图谱技术通过模仿人脑的思维方式,在数据库的基础上进行数据连接,相当于数据库的2.0版,其底层逻辑是本体-关系理论。杨浩老师以《宋元学案》知识图谱为例,为在场学者演示文本处理与图谱构建的具体应用。《宋元学案》最基本的本体有人物、地点、著作、职官等,在本体基础上以可视化技术完成知识和知识之间的连接。接着,杨浩老师介绍了古籍整理核心算法研究——通过人机协作实现句读标点、词语切分、实体识别的自然语言处理技术,方便核对古籍原图与标记,并且可以记录对电子稿的任何修改。人机协作能产生更好的数据,更好的数据积累能滋生更好的算法,从而形成良性循环。可以说数字化会全面提升古籍整理效率。


中央民族大学哲学与宗教学学院史经鹏老师介绍了方广锠老师对敦煌写本的处理过程。写本本身形态复杂,人力识别耗时耗力,为学术研究带来了许多困难。杨浩老师指出,方老师的前期工作积累可作为原始数据帮助计算机“学会”识别、切字等技能,进而辅助识别、切分所有敦煌文献,因为对计算机而言,三万件与三百万件的区别不大。


北京大学外国语学院叶少勇老师介绍了梵佛辞典在线检索平台与Mdict格式离线辞典,以及PKU梵文输入法3.0PC版。梵佛辞典与梵文输入法以其简易便捷的特点,在学界使用率颇高。并且,叶少勇老师希望在建设佛学研究资源数据库时,可以制定一个大家共同遵守的规范制度,方便大家分类上传、备份资料,并且定期整理目录、清理重复文件,以便研究者查询与下载。中国人民大学哲学院王俊淇老师顺便分享了清理重复文件的利器——Duplicate Cleaner。该软件通过比对文件内容而非文件名识别出重复文件,帮助大家更有条理地整理文献资料。


王俊淇老师根据以往的研究经验指出计算机在具体研究中的应用问题。例如,《楞伽经》梵文底本有三十多种,若人工对比不仅劳力费神,还会出现讹误。虽然采用计算机则可以在一定程度上解决文本对照的问题,但写本本身的字体差异悬殊、印刷年代久远,又对计算机的智能程度提出更高的要求。杨浩老师建议,在目前的技术条件下,建立数据库或许是更好的选择。在数据库中实现数据检索与文本对照,既可以简化研究者的研究步骤,又不完全依赖计算机,在一定程度上整合了人力与计算机的优势。叶少勇老师认为计算机的使用是有临界值的,文本量需要超出这个临界值,才能凸显计算机的优势,若文本量较少,人工可能更兼具效率与准确。杨浩老师则指出计算机的优势在于减少人力带来的无效、重复劳动,因为计算机绝对不会出现遗漏,而人眼识别则会出现遗漏,再以人力排查遗漏无异于大海捞针。


北京外国语大学亚非学院李灿老师结合自己正在进行的《阴持入经》研究,询问如何利用计算机实现校勘巴利文并导出校勘记。杨浩老师指出目前的古籍整理平台是以《儒藏》的方式导出校勘记的,外文校勘功能还在开发当中,需要研究者提供更加具体的需求,比如梵语或巴利语的变位规则等。对校文本的软件很多,而这个版本的古籍整理平台特色在于可以对照异体字,这种特色的优势在中文对照中更加凸显。


中国社会科学院古代史研究所陈志远老师介绍了造像记的资料。目前中国出版了七种大型录文集,但录文集并未对造像统一题名,因此在为某一造像记定名时会产生混乱。陈老师目前正在做勘同的工作,减少同石不同名的情况。并且把原石和拓本以及录文进行整理,做成表格、设置参数,实现大数据分析。接下来的工作是对博物馆等单位进行细致的调查。希望未来能以交通线串联起石刻材料,方便研究者研究。


北京大学哲学系孙海科博士介绍了东京大学数字人文研究现状。东大基于佛教学提供人文学各领域可参考的数字知识基础,探讨人文学整体共同开创未来研究的方法论,形成“统合数字研究环境”。将人文学的文本、图像、事物、行为等研究对象的差异与思想、语言、历史、社会学等研究方法的差异这两者共同纳入视野,通过数字技术有效地保存和利用此两者产生的知识多样性,构建多层次概念模型,并在新大藏经数据库(新SAT-DB)中装载。


对于古籍多功能协同数字人文研究平台的设计,杨浩老师提供了几点想法:第一,应提供古籍的多层次阅读。数字化古籍不仅要服务于研究者的学术研究,还有必要为普通读者提供阅读服务。第二,应重视知识网络的构建,建立相关内容之间的链接,比如引书内容之间的连接,专名与其别名之间的连接。第三,应提供协同工作环境与动态知识库,构建协同工作环境,让不同的用户参与协作与沟通,并聚合研究成果。在知识库的设计上,将研究者生产的新知识补充到知识库中,形成一个动态的、可扩充的知识库。第四,应集成辅助研究工具、分析工具,集成辅助研究工具,提升工作效率;提供分析工具,展开数字人文研究。


参加座谈会的还有北京大学哲学系赵悠老师、南开大学哲学院赵文老师、中国社会科学院哲学所胡士颍老师,德国海德堡大学的陈瑞翾老师(线上),中心主任王颂教授主持了会议。在座学者积极参与讨论,分享交流了计算机技术在具体应用中的问题和解决方法,并展望了数字技术与人文研究相结合的前景。座谈会在热烈的氛围中圆满结束。



相关阅读


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存