新知丨蔣玉斌、李霜潔、楊熠:人工智能引導人類直覺産生的甲骨新綴十組
人工智能引導人類直覺産生的甲骨新綴十組
蔣玉斌1*、李霜潔2*、楊熠1*
1 復旦大學出土文獻與古文字研究中心
“古文字與中華文明傳承發展工程”協同攻關創新平臺
2 清華大學計算機科學與技術系
商周甲骨文是研究商周語言文字和歷史文化的第一手材料。存世的有字甲骨16萬片,已發表8萬片,破損十分嚴重,殘片占到90%以上。爲更好發揮商周甲骨的作用,必須開展綴合復原工作。
綴合是甲骨整理的重要手段,其目的是促進材料的完整性和史料化,理應演進爲對材料的系統整理。包含綴合在內的整理工作,過去主要靠人工。學者已有綴合在7000組以上,涉及甲骨約1.5萬片,成就很大。但上述成果,係由百餘位學者在百餘年中做出;受學識、精力和敏感度的影響,人工綴合還存在零散、隨機、不確定等特點。學者很早就嘗試利用計算機綴合甲骨,直到近年方有突破,獲得數十組機綴甲骨成果,而實現大规模、可持續的甲骨綴合,仍有待學界共同努力、聯合攻關。爲此,我們在總結“人”“機”綴合經驗教訓的基礎上,人機協同,作了一些新的探索。
甲骨綴合是一項需要大量“腦補”的創造性工作,成果斐然的甲骨綴合學者(如正確綴合超過100組者),往往對潜在的綴合可能性具備非常出色的直覺能力。這種敏感和反應能力,通常指引他們快速精準地發現正確的甲骨綴合,這是他們取得突出成果的重要條件。基於此,清華大學計算機系自然語言處理實驗室“計算甲骨學(Computational Jiaguology)”研究組李霜潔研發了人工智能文物拼綴系統“知微綴(RejoinX)”,將如何更有效地發現甲骨新綴這一問題,聚焦到人工智能如何建立更有效的直觀聯繫以帶動和觸發研究者的直覺上(實現細節另見他文)。
YH127坑甲骨是甲骨學中最顯赫的材料之一,內容豐富,地位重要,但也有大量散落的碎片,是最值得也最需要系統整理的。不少碎片內容簡單且重複率高,以人力來找到它們的確切位置,往往收效甚微。我們運用“知微綴(RejoinX)”對這批材料進行綴合,這裏介紹新綴10組,供學界參考,請大家指教。
第1組
A:合集14208正(丙108)
B:乙補4786
第2組
A:【〔合集13604正(丙427)+乙7092+乙7903〕+R044119】+乙補0797+乙補0863+乙補2085+乙補1876+乙補2137+乙補2138
B:乙1346
説明:A版綴合情況參吳品婕《史語所甲骨新綴第二例》,[1] 及楊熠《甲骨綴合第101-150則》第106則。[2]
第3組
A:合集11596正(乙5900)+乙補2136
B:乙補5093
説明:A版綴合情況參張惟捷《甲骨新綴二十二則》第17則。[3]
第4組
A:醉古158〔合集00947正(丙498)+合集01726(乙7583)〕+R037757
B:乙補1894
(局部圖版)
説明:A版綴合情況參林宏明《甲骨新綴第453~470例》第461例,[4] 及《甲骨新綴第776-785例》第779例。[5]
第5組
A:醉古150〔合集07996(殷合307、乙5350—乙5913)+合集13360(乙7390)+合集16457(乙4651,反面即乙補4477)+合集03992(乙5353)+合集10863正反(乙7674、乙7675)+合補03275正反(乙7944、乙7945)+合補00998(乙8007)+乙6076+乙7952+合集03971正反(乙7715、乙7716)〕+合集12883(乙4742)
B:乙補6619
(局部圖版)
説明:A版綴合情況參林宏明《甲骨新綴第830-834例》第830例。[6]
第6組
A:【〔合集04550正甲(乙4445)+合集04550正乙(乙6216+乙6228)+合集09232正(乙4888)+合集14239(乙4404+乙4706)+合集15403正(乙4398)+合集17691正(乙8367)+乙4492+乙4855+乙4905+乙4907+乙6118+乙補4152+乙補4158倒+乙補4195+乙補4234+乙補4238+乙補4246+乙補4270+乙補4334倒+乙補4337+乙補4339+乙補4345倒+乙補4394倒+乙補4530+乙補4550+乙補4584倒+乙補4847+乙補5362+乙補6791〕+(乙4353+乙補4316+乙補4354)+乙補4229+R038101+乙4560+乙補4641】+乙補4284
B:乙5383
(局部圖版)
説明:A版綴合情況參楊熠《甲骨試綴第31-46則(附補綴二則)》第44組,[7] 及林宏明《甲骨新綴第811-812例》第812例。[8]
第7組
A:合集07440正(丙409)+乙3076+乙補1765倒
B:乙補0937
(局部圖版)
説明:A版綴合情況參楊熠《甲骨試綴第48-55則》第51則。[9]
第8組
A:合集02652正(丙253)
B:乙7601
第9組
A:合集00438正(丙360)
B:乙補0789
第10組
A:合集06657正(丙444)+乙補1148+乙補1149+乙補1152+乙補2006+乙補3133+乙補6332+乙補6215+無號甲
B:乙8071
説明:A版爲史語所綴合,綴合情況參R044463。
注釋
* 同等貢獻者。
[1] 先秦史研究室網站2021年1月5日:https://www.xianqin.org/blog/archives/15021.html。
[2] 先秦史研究室網站2021年5月20日:https://www.xianqin.org/blog/archives/15570.html。
[3] 張惟捷:《甲骨新綴二十二則》,《政大中文學報》第十九期,2013年6月,第49—50頁。
[4] 先秦史研究室網站2014年2月25日:https://www.xianqin.org/blog/archives/3717.html。
[5] 先秦史研究室網站2018年1月8日:https://www.xianqin.org/blog/archives/9702.html。
[6] 先秦史研究室網站2018年12月28日:https://www.xianqin.org/blog/archives/11319.html。
[7] 先秦史研究室網站2018年9月22日:https://www.xianqin.org/blog/archives/10920.html。
[8] 先秦史研究室網站2018年11月20日:https://www.xianqin.org/blog/archives/11043.html。
[9] 先秦史研究室網站2018年11月8日:https://www.xianqin.org/blog/archives/11023.html。
本文原載“復旦大學出土文獻與古文字研究中心”網站(2023年10月12日首發)。點擊文末“閱讀原文”可查看原文。
微刊小編:老八