位置:首页历史解密>首次定义并发布甲骨文全信息模型 现代“仓颉”助力汉字探源

首次定义并发布甲骨文全信息模型 现代“仓颉”助力汉字探源

所属分类:历史解密 编辑:卖萌天才 访问量:2357 更新时间:2023/12/4 22:38:44

如果你是学生,在这里点击部首可以知道甲骨的读音释义;如果你要写论文,在这里能检索关于甲骨文的专业论著;如果你是考古工作者,在这里甲骨碎片能够智能缀合。这个全世界最完善的甲骨数据免费平台,以人机协同助力甲骨文破译和传承活化,让越来越多的公众触达甲骨文化,更加清晰地了解到汉字的源头和中华优秀传统文化的根脉。

创新

全世界唯一的实验室在殷墟安阳

甲骨文是中国的一种古老文字,又称“契文”“甲骨卜辞”,如才能把三千年前契刻在骨头上象形字输入电脑?甲骨文等古文字研究的研究资料和研究力量分散、沟通协同不够,是甲骨学研究长久以来的痛点。建立甲骨文数据库显得尤为重要。

2月17日,在安阳师范学院,计算机与信息工程学院院长刘永大河报·豫视频记者介绍,从2000年开始,他就带领研究甲骨文的两位老师,以甲骨文输入法为起点,开展甲骨文信息化研究。2018年7月,经教育部批准,安阳师范学院成立了甲骨文信息处理重点实验室,目前有甲骨文大数据平台、甲骨文识别与字形分析、甲骨文语言计算、甲骨文与殷墟科技考古四个稳定的研究方向,是全世界唯一的服务甲骨学研究的理工科实验室。

“因为我们要做甲骨文的大数据,首先必须把关于甲骨研究的纸质资料收集齐,目前我们资料室收集的关于甲骨文书有7359册,不敢说全部集齐了国内外关于甲骨100%的书籍,但是也有99%。”刘永革说。

安阳有着得天独厚的甲骨文渊源,加之完善的数据资料来源,2019年,实验室发布甲骨文大数据基础平台“殷契文渊”,目前收录了152种甲骨著录、23466个甲骨图像、4487个甲骨文字形,33368种甲骨论著,免费服务全球的甲骨文、考古、历史、文字等专业的研究专家。

从纸墨誊抄到互联网三维建模,3000年前的古老文字瞬间灵动了起来,不仅位居北京大学“甲骨金文”数据排行榜第一,同时也吸引着国内外的古文字爱好者、教师、书法爱好者前来查阅使用。

■创新构建互动展示工具和高保真数据增强展示工具,观看不同层次的甲骨文信息。

成果

人工智能让甲骨精确重现

基于深度神经网络的甲骨文字检测系统,把碎片式的数据和文献进行归拢数字化,甲骨研究者从以前的图书馆查阅,到现在网络数据库,用拼音、汉字、部首的检索,免费读取甲骨的图像、释文、相关文献、重片、缀合库、字形库的信息。

大河报·豫视频记者观察到,“殷契文渊”为对甲骨文感兴趣的计算机工作者提供了手写甲骨字数集(HWOBC数据集)、甲骨文字检测数据集、甲骨拓片识别数据集(OBC306数据集)三个数据集;实验室还用知识图谱技术,用复杂网络技术,把甲骨文所有的字、文、图全部都建立关联,然后用计算机逻辑推理。

复旦大学教授、出土文献与古文字研究中心主任刘钊说,甲骨文发现120年以来,有约16万片的甲骨收藏遍布世界各地,这些分散的古人信息是中华优秀传统文化的根脉,急需破译和数字化回归。

“以前甲骨碎片都是靠记忆和手工一片一片地拼合。数据数字化以后,可利用人工智能图像技术进行自动缀合。目前我们已经已缀合出37组,这是人类专家还没有缀合出来的37组。”刘永革骄傲地说。

为了动对全球甲骨文资料的全面普查和采集,甲骨文信息处理重点实验室利用最新科技手段,研发了甲骨三维建模的技术和设备,获取甲骨的拓本、彩色照片、尺寸、收藏信息等,近期将进行第一批甲骨文三维建模实验。

刘永革向记者介绍:“原来甲骨的图形都来自于照片和拓片,去年,实验室和腾讯联合研发打造的高精度、高速度、便携性的甲骨三维建模,调整与改进已有核心算法,提出一套点云融合方法,已完成12片甲骨三维模型,如今扫一下二维码就能看到,实现了甲骨藏品的精确重现。”

突破

首次定义甲骨文全信息模型

“这是实验室首次对外公布甲骨文全信息数字模型。”2月17日,在安阳师范学院,刘永革对大河报·豫视频记者说,“这是国际上首次提出了一个全信息的数据模型。分层次进行数据融合,实现了高保真互动化的对比展示。我们实验室讨论了多次,最终的名字还没有确定。”

在刘永革展示的解析图上,记者看到实验室研发的甲骨文全信息数据模型,是将信息分类分层,类似于手机地图一样,以坐标对齐的方式,让甲骨片按照类别进行分层叠加,每个观众可以根据不同的需要,看不同的信息。这些信息层次有标注释读、科学影像、三维数据、拓片、摹本、基础数据等。而传统的甲骨文著录,都是比较单一的用图片加文字注释。

以甲骨的拍摄为例,传统相机受限于光线和拍照人员的技术水平,使得甲骨上的细微线条很难拍摄完整。而在全信息数据模型中,利用高保真数据拍摄技术,使用光照变换矩阵可以把照片放大几十倍,不仅能分辨甲骨“伪片”、微痕,还能清晰地看到渗透在甲骨下人眼看不到的甲骨文字墨迹。

研究甲骨文离不开考古,甲骨文数据处理信息技术的飞跃,也为殷墟考古注入了科技动力。在安阳小屯古工作站,实验室计划对殷墟40平方公里进行三维建模,为甲骨文信息处理提供相关知识和支撑。

记者了解到,实验室已联合腾讯,利用微信用户的传播力度,研发了“了不起的甲骨文”小程序,预计3月份将进行内测,拟在4月份向全球公布这个项目。刘永革说,这个小程序以介绍传播甲骨文知识为主,开发有闯关类小游戏,有过关奖励等玩法。

■面向风化的甲骨实物,通过多光谱技术进行微痕提取,形成肉眼难以观察到的科学影像。

传承

飞出书斋代有传人

在甲骨文信息处理重点实验室的走廊里,挂着一张照片,是2018年第一届甲骨文信息处理国际学术研讨会的合影,照片上有44个人。刘永革说,这44人已是全世界研究甲骨文信息处理的大部分专家。

甲骨文信息处理,简单地说,就是把甲骨文的所有数据都归拢收集起来,用技术手段再次进行数据开发利用。因为研究的人太少,一度显得这个学科非门。

“根据教育部对重点实验室的要求,安阳师范学院能请到中科院院士、清华大学教授戴海琼担任学术委员会主任,十分难得。甲骨学领军人物,中国社会科学院学部委员、研究员镇豪,更是把一生的研究成果和数据无偿地捐献给了实验室。”刘永革动情地说,正是由于科研前辈的无私奉献和指导,“殷契文渊”数据库平台才得以加快对全世界开放发布。

刘永革说:“习近平总书记致甲骨文发现和研究120周年的贺信,为我们的未来工作指明了方向。实验室紧紧围绕国家重大战略需求,以服务文化传承创新为主线,实行开放、流动、联合、竞争的运行机制,着力建设多学科协同创新、具有国际化水平的甲骨文大数据平台和甲骨文信息处理领域一流的科学研究、技术创新和人才培养基地。”自2000年研究甲骨文输入法,23年的探索,实验室将研讨文字与文化传承多学科交叉融合。目前,实验室成员作为主持人承担了7项国家自然科学基金项目、3项国家社会科学基金重大委托项目、8项国家社会科学基金项目和50项省部级、地厅级项目,这其中涉及科学、技术、人文和艺术等学科。

在刘永革的支持下,安阳师范学院开设了《甲骨文信息处理》特色课程。越来越多的大学生,从大一开始就参与到甲骨文信息化课题研究和甲骨文大数据平台信息采集和录入工作。

刘永革说:“用计算机破译甲骨文,用知识图谱的推理,可以对缺失甲骨学语义进行补全或预测,从而实现甲骨学知识的自动发现和考古预测。我们实验室的终极梦想是破译出来一个新的甲骨文字,目前我们正在一步一步向这个目标靠近。

标签:历史

标签: 中国历史

更多文章

  • 闯关东:与其说秀儿爱上了一郎,不如说她爱上了昔年痴情的自己!

    历史解密编辑:晴天标签:中国历史

    《闯关东》里面的秀儿嫁给传武苦守了18年,那一年她又遇到了一郎,也是在那一年,秀儿火速移情爱上了一郎,很多人不理解为何秀儿苦恋了传武那么多年,为何忽然就不爱了呢?或许秀儿爱上的不是一郎,而是昔年痴情的自己吧?秀儿是个善良的姑娘,从她十八年前救下病重的一郎就能看出来,这个姑娘善良,哪怕对方是日本人,她

  • 良辰好景:萧北辰送走杭景,决战北新城,许子俊等人战死

    历史解密编辑:心作祟标签:中国历史

    许子俊战死了,为了救萧北辰,死在了萧书仪答应嫁给他的那一年!随着局势的急转直下,北新城也开始动荡起来,佐藤名义上是大和商会,促进经济,实则一直在加紧布置侵略的事宜,在此期间他拉拢了康敬雄,并且成功花钱买通了金城的关系,又通过郑奉棋,拉拢了牧子正,卧底到了青年会,借此打探爱国者的动向。萧海山对于金城一

  • 上海观复:唐代金器体现大简至美、大繁也至美

    历史解密编辑:人生初见标签:中国历史

    唐代是金银器制作的高峰。现在在陕西历史博物馆展出的何家村遗宝以及在法门寺展出的法门寺地宫出土文物都是唐代金银器的巅峰作品,属于唐代皇室金银器的“标准品”。唐代文化开放包容,影响周边也被周边影响,文化中包含很多异域元素。反映在金银器上,无论是造型还是纹饰,都能发现来自西域的图样。在装饰风格上,有纯素面

  • 风从海上来!从三次觉醒看“何以东莞”?

    历史解密编辑:君莫笑标签:中国历史

    央广网东莞2月20日消息,南海之滨、珠江之畔,一场关于海洋文化的多元对话近日落下帷幕。国内十余位专家学者云集广东东莞,以史溯源、以古鉴今,为读懂湾区提供了新的视角和脉络。为何东莞能成为“中国近代史开篇地”?为何全国第一家“三来一补”企业是出现在东莞?偶然之中,有其必然。一直以来,东莞因制造业而闻名,

  • 吴彦霖:从文物中“复活”二十四伎乐

    历史解密编辑:异世邪君标签:中国历史

    成都永陵博物馆保存着晚唐五代前蜀皇帝王建的陵墓,石棺床腰部的“二十四伎乐”浮雕石刻图,是迄今考古发现的唯一完整反映唐代及前蜀宫廷乐队的文物遗存,在中国音乐史上有重要地位。天府之音气象万千,“二十四伎乐”承载的不仅是一段王朝史诗,也是一缕古老的城市记忆。2019年,“二十四伎乐”在成都“复活”,于四川

  • 南京父女合葬墓中发现的“药丸”,检测结果让人生气:不配当父亲

    历史解密编辑:做你的英雄标签:中国历史

    一座东晋时期的普通墓葬,却挖出了一段令人难以想象的故事。两个明显有着血缘关系的人,却像是殉情一般,被分主次葬入了左右墓室。要不是考古学家们考察得仔细,恐怕这座墓葬,又将在人类伦理史上添上让人难堪的一笔。这座墓葬,就是东晋名家之后王彬的墓葬。上世纪六十年代,我国考古工作者在南京市象山发现了一个大规模的

  • 为什么清官难断家务事,情理法理不能挑战伦理

    历史解密编辑:我亦王者标签:中国历史

    常言道“清官难断家务事”,一些人认为是家庭事务错综复杂,难以理清原委、辨明是非。这太小看清官老爷们的能力了,只要愿意,查证事实对他们来说并不是难事。让他们犯难的是断和判,常规的情理、法理在这时会遇到巨大的挑战。洪武年间,河间府尚义村的生员何式玉娶了府城黄员外的独生女黄氏为妻。但是这对夫妻的好日子还没

  • 宋美龄一生未生育,这是为何?蒋纬国临终前终于说出实情

    历史解密编辑:胖次标签:中国历史

    对于我们普通人来说,爱情的最终归宿就是婚姻。而两人结合生出的孩子,则是爱情的结晶。宋美龄与蒋介石结婚,寻找到自己在感情上的归宿,可两人之间却为何没有属于自己的孩子呢?年轻的时候没有怀上,也并没有老年得子,这是否成为宋美龄的终身遗憾我们也不得而知。不过,蒋介石的儿子蒋纬国在临终之际,却将宋美龄终生未孕

  • 历史上根本“不存在”的4个名人,每一个你都熟悉的要死!

    历史解密编辑:不惹红尘标签:中国历史

    “假作真时真亦假”,当历史和小说混在一起时,肯定是小说中的人物更加立体、饱满、出彩,让大家误以为历史上真的有这样一个人物的存在,而事实上有许多人物,都是杜撰出来的,我们还信以为真!1、花木兰提起花木兰替父从军的故事,大家都不陌生,她对父亲尽孝,为国尽忠,一度成为了大家心目中的女性楷模,但事实上,花木

  • 笔底父爱深,三国西晋时期的教子家书

    历史解密编辑:活在梦里标签:中国历史

    三国时期,群雄逐鹿,英才辈出,彼此之间,斗智斗勇,为今人留下了生动的三国故事。在我们激赏三国人物运筹帷幄的智慧、侠肝义胆的忠勇时,容易忘记这一时代诞生了一些对后世影响深远的家训文献,正是通过这些文字,我们得以见识在那个兵荒马乱的年代中三国人物内心深处的柔软。01淡泊明志,宁静致远三国时期的诸葛亮,不