随着传统人文数据的数字化,数据可视化提供了直观的探索方式,帮助大众探索和理解各类人文数据。然而绘制可视化具有技术门槛,为支持大众使用,本项目提供支持日常用语的问答的方式来生成可视化。
本演示选取明代进士数据作为案例,该数据源自明朝进士录,包含一万四千余名进士的年份、姓名、省、县、户籍类型、科目等属性信息。在系统中,大众可以自然地通过问题来探索数据。用户可以提出关于不同属性的分布、关系、趋势等探索式的问题。如,可以通过“进士们来自哪些省份”等来询问不同省份的分布。可以询问“不同户籍的进士随年份变化的情况”来发现明朝中后期来自军籍的进士比例较明朝初期上升。针对不同的问题,系统通过柱状图、线图、散点图、堆叠面积图、树图等可视化来回答问题。
该项目来源于北京大学可视化研究组的研究项目,是实验室开展的自然语言处理作为可视化交互新方法的进展之一。
智能学院可视化与可视分析实验室团队由袁晓如研究员带领,在可视化和可视分析基本方法理论、方法和应用等方面开展了长期研究探索。团队十余次荣获 IEEE VAST 数据可视分析国际挑战赛奖项。实验室在基于地图隐喻的社交媒体数据可视分析、任务驱动的可视化数据管理、交互式复杂数据分析、可视化的快速构建与自动化等方向做了创新的开拓工作,相关可视化研究工作成果广泛用于流场分析、交通、社会媒体等领域。团队同时也是大数据分析与应用技术国家工程实验室可视分析中心的核心基础。