“冷门绝学”甲骨文,热起来了

被很多人称为“最冷门学科”的甲骨文专业,最近不太冷。

在浙江,一位甲骨文专业的毕业生用短视频将3000多年前的文字带到了互联网上;在河南安阳,甲骨文借助最新的计算机技术,以前所未有的速度在ChatGPT的时代被重新“焕活”。

安阳这座城市的血液里,似乎流淌着“文字基因”。这里是甲骨文的发源地,坐落有中国文字博物馆,安阳师范学院里更是孕育出了一个重点实验室——甲骨文信息处理教育部重点实验室。

4月20日,“了不起的甲骨文”小程序在安阳发布上线。这是安阳与腾讯公司合力研发的微信小程序,以“甲骨文破译与传承活化”为主题,凝聚了实验室的大量心血。

这款甲骨文科普的小程序,加上此前实验室为研究者搭建的“殷契文渊“甲骨文大数据平台——甲骨文这一古老的文字,慢慢被描摹出了数字形象,离大众的距离也越来越近。

潮新闻记者在安阳找到了实验室背后的老师们,听到了一个好消息:今年实验室第一次招收研究生,放出的十个名额,招满了。说到这些时,他们的眼睛里有抑制不住的兴奋,那是坐了二十余年“冷板凳”后,甲骨文交叉研究终于迎来传承者的欣慰。

当古老文字遇上现代技术,让甲骨文飞入寻常百姓家

120多年前,清末学者王懿荣从中药材“龙骨”上偶然发现了甲骨文。从此,“一片甲骨惊天下”。

甲骨文破译一字奖励10万元,你或许听过这份来自中国文字博物馆的“悬赏令”,如今,在“了不起的甲骨文”小程序里,你可以直接找到甲骨文的未释字,输入你认为对破译有帮助的线索。

当然,如果你不懂甲骨文,可以在小程序里学习,也不妨碍你去这里欣赏甲骨片的高清数字焕活版本。刻在龟甲和兽骨上的文字痕迹比较淡,又小又模糊。但在手机上,由正反各600张高清照片拼接组合而成的等比甲骨,可以用手指任意放大缩小。

“这个小程序不仅会教你学甲骨文,还会引导你造字,创造甲骨文。”安阳师范学院计算机与信息工程学院院长、甲骨文信息处理重点实验室主任刘永革说,比如3000年前没有高铁,那如何用甲骨文表达高铁的含义呢,在创造的过程中,相信会有更多人对甲骨文的文字体系产生兴趣。

刘永革的办公室里挂着甲骨文的书法作品,他们的实验室里摆着一整面墙的甲骨文相关文创。他说,安阳是中国甲骨文研究氛围最浓厚的地方,“我们就是把古老的文字和现代的技术结合起来。”

为什么要做这些?由于历史原因,出土的甲骨片散落世界各地。曾经,甲骨文研究者只能依靠一个一个手写输入,手动翻阅材料,研究、传播都很不便。而数字化,打破了空间的阻隔。

2019年10月,实验室的“殷契文渊“甲骨文大数据平台正式发布上线。它将世界各地的甲骨文著录、文献收集起来,建立甲骨文字形库,并向全世界免费开放。截至目前,“殷契文渊”共收录甲骨著录152种、甲骨图像234762幅、甲骨论著33389种。

“殷墟文渊”甲骨文大数据平台

用数字赋能甲骨文,不只是刘永革团队在做。

“目前甲骨文数据库,国内外共有十几个,每一个的功能都略有不同。“浙江师范大学退休教授陈年福致力于甲骨文研究多年,是甲骨文科普博主”李右溪“的导师,曾把自己的课题成果建起了殷墟甲骨文数据库。陈年福的想法很简单,不希望辛苦研究出来的成果,被束之高阁,而是希望能被更多人知晓和分享。陈年福退休后,学校引进了古文字学专业博士,相信浙江师范大学的甲骨文研究会有后继者。

后继无人,这曾是甲骨文研究一度面临的现实问题,好在情况正在好转。

“殷墟出土的甲骨文为我们保存3000年前的文字,把中国信史向上推进了约1000年。”“中国的汉文字非常了不起,中华民族的形成和发展离不开汉文字的维系。”二十大闭幕后不久,习近平总书记就来到河南安阳考察,对甲骨文研究传承提出殷殷期望。

“甲骨文是迄今为止中国发现的年代最早的成熟文字系统,是汉字的源头和中华优秀传统文化的根脉,值得倍加珍视、更好传承发展。”在甲骨文发现和研究120周年之际,习总书记还曾专门致信祝贺。

目前,国内甲骨文研究形势正在好转,各级部门的支持力度也比以往更大。刘永革觉得,“甲骨文热”的时代,也许已经来了。

从一个人到一群人,“甲骨文研究天团”的诞生

用计算机处理甲骨文,刘永革们不是第一个,却可能是坚持最久的那一批。

虽是土生土长的安阳人,但在2000年前,刘永革怎么也没想到,自己会与甲骨文研究产生千丝万缕的联系。

那年,刘永革在西北工业大学学习获得计算机软件与理论硕士学位后,回到了安阳师范学院任教。学院两位老师希望他能把甲骨文输入计算机,刘永革一口答应下来。

殷墟博物馆里的刻辞卜甲

原以为不难,可真正实践起来才发现:“这咋不困难呢,没有拼音辅助,按照字形部首来拆解,发现一些象形字根本没法拆。”多番摸索,他按照甲骨文的分类,通过鼠标点击输入甲骨文,并给这套系统取名可视化甲骨输入法。

这套系统,刘永革利用课余时间,从千禧年一直开发到了2004年,“能坚持做下来,很大一部分原因是有人愿意用,这其中大部分是本校研究甲骨文的老师,后来也有外地的想买,我都免费给他们用了。”

2004年,刘永革又和学院的韩江苏教授合作,一个负责计算机,一个负责甲骨文,申请下了国家社科基金项目,建立甲骨文数据智库。这是个浩大的工程,为此,刘永革找到了许多本校的大学生参与到这项工作里来,例如甲骨文中的“人”字,需要找到散落在世界各地甲骨片中的“人”,再“合并同类项”,形成5个“人”字的代表字形,录入数据库。数据库的建立大大方便了甲骨文的研究,耄耋之年的郭青萍为此买了一台电脑,开始学用计算机,著书立作的效率大大提高。

这期间,刘永革觉得可以尝试用计算机破译甲骨文,2008年,基于甲骨文语料库的计算机辅助考释技术研究获批国家自然基金,立项之后,刘永革把计算机学院几位感兴趣的老师组织起来,组建团队。

这群搞计算机的老师一开始哪懂甲骨文,于是利用休息日请退休的郭教授处上课。郭青萍很认真,每次都会提前准备课件,等到这群人学得差不多了,课件也堆成了厚厚一摞,最后,这些课件还集合成册,出了本书。

2012年,甲骨文数据库成果验收,越来越多的新项目在这个团队里开始立项,团队过渡成了实验室,2016年获批河南省重点实验室。

作为一所地方院校,安阳师范学院的人才队伍自然没法和大城市的高校PK,但他们很善于借力。在甲骨文信息处理教育部重点实验室第一届学术委员会成员的名单里,我们看到,有院士和各大高校研究机构知名专家加盟,专业范围涵盖了计算机、历史、古文字研究等多个领域。

外脑的力量不可小觑。一个实验室的壮大,需要专家学者的光环加持,也离不开年轻人的热情参与。

图片正在加载中,请稍后

刘永革(左二)和学生们。

上周末,实验室的研究生复试刚结束。这是实验室的文物学专业(甲骨文信息处理方向)首次招收研究生,要求考生同时具备考古学、甲骨文基础知识以及人工智能等计算机信息处理方面的知识背景。“一开始我们很担心会招不到人,没想到报考的有近30人,而且都是我们希望的复合型人才。”实验室副主任高峰告诉我们。他有些激动,或许安阳师范学院放眼全国并不知名,但这里有研究甲骨文的基因,也永远有人热爱着它。

“冷门绝学”,后继有人。

“云时代”,如何让甲骨文焕发新生?

计算机能为甲骨文带来什么?高峰向我们展示了众多成果中有趣的两个——用计算机给破碎的甲骨片“拼拼图”,用计算机语言创造甲骨文的知识图谱。

甲骨文拼图,号称是世界最难的“拼图“。目前出土的甲骨碎片,流落在世界各地,因为年代久远,许多碎片上只有一两个字,没有上下文语境结合,很难破译。但如果能把碎片拼接完整,就能看出相对完整的叙事。

早期,这项工作都是由甲骨文研究者“剪刀加浆糊“拼接起来的——觉得印象里哪两块甲骨的边缘有些相似,便拿出拓片拼到一起,这不仅进展缓慢,出错的概率还特别大,”一年能找出一两组,就已经是很棒的成果了。“高峰说。

图片正在加载中,请稍后

甲骨边缘拼接,成功缀合的例子

2019年,基于前期的甲骨文大数据组建,让计算机完成拼图的任务有了可能性,这项专业术语叫“缀合“的工作交给了算法,一个星期就拼出了一百多组。去除前人已拼过的,筛选出全新的,再去寻求专家意见,大大缩减了中间的过程时间。

现在,利用初步建起的甲骨图像拼接软件,实验室已经成功缀合了37组甲骨碎片,位居全国第一。

人工智能在古文字研究领域发挥的价值和作用,正越来越显现。

比如,人工智能团队DeepMind利用深度神经网络伊萨卡(Ithaca)修复古希腊铭文。伊萨卡不仅可以复原受损铭文的缺失文本,还能识别铭文原始位置、确定书写年限。团队称,伊萨卡在恢复受损文本方面的准确率达到了62%,在识别其原始位置方面的准确率达到71%,并可以将文本的日期确定在其真实日期范围的30年内。国内也有一些高校正利用神经网络、AI算法、深度学习等,来识别失传已久的西夏文。

前路漫漫,对于甲骨文研究,这个实验室想要做的还很多——他们已经开始探索生成式AI研究甲骨文语义的相关项目;他们还在建展示馆,打算将安阳民间收藏的甲骨片集中展示,对外开放,让更多的人走近甲骨文,了解甲骨文。

3000多岁的甲骨文始终年轻着,继续陪伴着人类见证下一个AI的时代。

(来源:潮新闻)

标签: 安阳 甲骨文

最新资讯

文档百科

CopyRight © 2000~2023 一和一学习网 Inc.All Rights Reserved.
一和一学习网:让父母和孩子一起爱上学习