成果展示

数字人文成果

当前位置: 首页 > 成果展示 > 数字人文成果 > 正文

中国古典诗歌声律分析系统

杜晓勤

北京大学中国语言文学系

2024-05-09

发布

基本信息


“中国古典诗歌声律分析系统”,是我主持的国家社科基金项目“中国古代诗歌声律数据库的建立及中近古时期诗歌律化过程研究”(批准号:04BZW022)的阶段性研究成果,于 2011 年结项时获得了“优秀”等级的好评。

图1

图1 软件封面

音韵分析数据库


“中国中上古汉字音韵数据库”以李珍华、周长楫编撰《汉字古今音表》为主要数据来源,吸收近几十年来古代汉语音韵学研究成果,把 9000 个左右汉字的上古音、中古音、近代音、现代音导入数据库,每个汉字包含纽、韵、调和中古音的开合、等、摄、诗韵韵部等参数。

作品文本数据库


“中国古典诗歌文本数据库”对先秦至唐末五代的诗歌典籍,如《诗经》(20 卷)、《楚辞》(17 卷)及逯钦立辑校《先秦汉魏晋南北朝诗》 、《玉台新咏》、《全唐诗》、《乐府诗集》,依据学界公认最可靠的版本,进行全文收录,计 17 种 1182 卷 900 多万字。

计算机分析系统软件


此工具软件对现存所有古代诗歌作品能够实现对“中国古典诗歌文本数据库”中收录的诗歌作品(亦可自行导入作品),进行任意时代、任意地域、任意作家、任意诗体的声律格式和合律程度进行科学的分析和统计,快速标注四声和平仄,并根据永明体声律和近体诗格律,对五七言诗自动标识句式、联式、篇式,标识和统计平头、上尾、蜂腰、鹤膝、大韵、小韵、正纽、傍纽等永明八病,并能对句、联、篇、韵的声律格式进行数据统计和概率分析。

 

图2 软件使用界面截图

学术和技术创新


① 首次实现对中国古典诗歌作品进行大批量的四声自动标注和八病标识、数据统计功能,有助于研究永明体诗歌声病情况,考察永明诗律向近体诗律演变的环节和过程。

② 可对五七言近体诗的句、联、篇的声律格式进行标注、分析和统计,与国内具有类似功能的其他软件相比,运行速度更快,标注更准确、直观,导出语料和数据更方便。

③ 突破技术瓶颈,首次解决了四声和平仄标注中多音字的难题。本系统采用人工提前干预的方式,将四声和平仄标注过程中多音字处理的主动权直接交给使用者。系统使用者音韵水平的高低决定四声和平仄标注的正确性,决定了声律分析数据的准确度。

④ 突破技术瓶颈,首次在诗歌声律分析系统中增加了诗歌文本校勘这一独特功能,解决了因文本讹错而导致诗律分析和统计不准确的问题。

版权所有©北京大学文科智数化公共平台