成果展示

数字人文平台

当前位置: 首页 > 成果展示 > 数字人文平台 > 正文

经籍指掌——中国历代典籍目录分析系统

李文琦、王凤翔、黄芷欣、李芃蓓、孙显斌、王军

北京大学数字人文研究中心

2024-05-09

发布

背景


古人求学,以目录为途径,明文章之旨趣,晓读书之伦次;古人治学,以目录为利器,辨古书之真伪,考学术之源流。不论求学还是治学,中国历代学者均重视目录的重要功用。清人王鸣盛所言“目录之学,学中第一要紧事”准确道明了目录学在中国学术史上这一不可替代的地位。伴随这一门学问而流传至今的古籍目录,自然也成了今天我们了解和研究中国古代文人精神、学术形式和文化气象的主要入口。置于现代语境下,目录兼具图书分类和反映学术演变的功能。但古典目录学毕竟延续发展了两千多年,诞生的官私目录无数,这些目录在体例、分类、收书标准、时间跨度甚至用字上也各有差异,在一定程度上为充分实现其功能增加了阻碍。以往仅依靠个人手工的目录学研究或寻一视角,推阐一家或几家的学术脉络,论述一个或几个类目变化,又或总览各目录,定性概括分类异同。为了实现在全时段、全书目上对古典目录做定量研究的目标,本项目紧扣目录学两种功能,在计算机的辅助下对最具代表性的正史目录 和四库全书总目数据进行深加工,由专业人员手工统一书目与人物的表述,再利用统计以及可视化等方法展现类目和书目之间的对应及跨时段的分类演化。

功能介绍


1.书目统计

系统首先提供一个柱状图概览(图1),八种目录按照时间顺序从左到右依次排列,不同目录用竖线隔开,目录名下的数字是该目录收书总量,柱状图的横轴上分布着每种目录的一级类,该类下的书目数量用直方柱的高度表示。这样一来,八种目录各大类及类下书目数的多少在一目了然。除了宏观视角的观察,微观的探索同样可以在此图上展开。只要在搜索栏中输入关键词(如图2),系统会使用模糊匹配算法寻找相关的书籍,将结果返回到柱状图中,这些相关的书分布在哪些目录哪些类下,数量几何都十分清楚。并且,所有这些书籍的详细信息都以表格的形式列与结果柱状图之下,可供一一浏览。

null

图1 全局统计柱状图

null

图2 “孟子”检索结果

从全局统计图到局部观察的途径不仅只有关键词检索,点击任何一个一级类目的直方柱便可对该类目放大观察查看其下的二级类目及其书目数量。(图3-a)二级类目是我们数据提供的最底层分类,若继续纵向深入,同样点击代表二级类的直方柱就可查看该二级类下所有典籍的数据细节。(图3-b)

null

图3-a 新唐志·子部统计

null

图3-b 新唐志·子部统计及“农家”数据条目

2.类目演化

我们构建了基于典籍的历时性分类演变轨迹的交互式可视化分析工具(图4)。图中的每一个纵轴代表一部目录,纵轴上的坐标点为该目录的二级子类目,每一条线从不同纵轴的某坐标点穿过即展示了一部典籍在每个目录中分别归属于哪个类目,即该典籍的分类演变轨迹,不同的颜色代表从不同目录开始被收录的新生典籍。鼠标只想某一条线并点击,可以查看该条线对应典籍在各目录里的原始著录数据。

null

图4 目录分类演化可视化分析工具概览

从微观来看,用户可以通过点击任意纵轴上的坐标点来查看相应目录子类中所收录的具体典籍分类演变(5-a 以新唐书艺文志中的“正史”类为例);从较为宏观的层面来看,系统还提供了弧形图来整体呈现该类目中的典籍在前代和后代目录中的著录情况,其中线条的粗细反映了出现在其他目录中的典籍占当前类目下典籍总数的比例。(图5-b)

null

图5-a 新唐书·艺文志“正史类”典籍分类演化轨迹

null

图5-b 新唐书·艺文志“正史类”典籍分类演化轨迹

总结


本系统以古籍目录为研究对象,以探究古籍目录的分类演化及其背后的学术流衍为核心研究问题,对八种代表性的官修史志目录进行了数据集成,在保留古籍目录图书分类和考察学术源流的基础上引入定量分析,并构建了交互式的可视化分析系统以支持学者的检索、统计、分析等研究需求。

指导教师:孙显斌、王军、史睿

数据处理:黄芷欣、李芃蓓、王凤翔

系统设计:李文琦

系统开发:王凤翔

版权所有©北京大学文科智数化公共平台