随着信息技术的迅猛发展,人类社会开始进入数字化、智能化时代,科学研究范式和人才培养模式都发生了天翻地覆的变化。大量珍贵的数据被新的技术所采集利用,推动了哲学社会科学领域的繁荣发展。但其存在的问题也日益显现:
(一)分散保存和缺乏管理的弊端,以及参差不齐的数据质量使得许多数据存在遗失的风险和挖掘不足的缺憾,不可持续。数据的种类和范围也亟待扩大,语料库、案例库、档案库、音视频库等具有哲学社会科学领域特色的数据尚未被纳入统一框架。
(二)在数据采集、数据存储、数据库管理以及数据开发使用上还存在着信息鸿沟和学科壁垒,学术评价、安全审查、成果转化、知识产权保护等多方面缺少配套机制和标准规范,资源无法得到充分共享和运用,甚至形成新的“数据孤岛”。
(三)人工智能的巨大潜力尚未被开发出来,大量科学数据仍然停留于档案保存和简单搜索的层面,难以对学科建设、咨政启民和文化传承创新发挥实际支撑作用,也难以获得全流程、多层次、个性化的学术支持,未能被整体激活成为原始创新和学科交叉的源头。
基于此,建设一个综合型的数据平台,并以此为依托引领和带动高校哲学社会科学的创新发展,至关重要。
本平台将以AI为牵引,存储和管理适合于人文社会科学场景的各类数据,着力于各类数据的深度挖掘和价值转化,紧密围绕科学研究和人才培养,提供跨学科跨领域的公共服务和精准支持,注重机制建设,营造开放的创新生态。
基于“北京大学开放研究数据平台”及其他相关工作的良好基础,经过前期调研和论证,在学校层面的统筹部署下,由北京大学社会科学部、北京大学图书馆、北京大学计算中心和北京大学中国社会科学调查中心联合进行平台建设方案设计。持续集成各类科学数据资源,推动对人文社科领域各类数据的科学管理,并促成更大范围内的人文社科科研数据开放和利用。未来,这一平台还将逐步向兄弟院校和社会各界有序开放,不断汇聚优质资源,扩大生态圈,发挥辐射力。
2024年5月17日,高校哲学社会科学实验室联盟成立大会在北京大学召开,标志着这一平台正式启动。
1、数据资源:数据采集与保存、数据长期管理、数据引证、数据库的使用
2、服务资源:数据采集方案设计、问卷设计、数据清理、数据分析、数据开发与应用、数据报告
3、教学资源:教学数据库及案例库、大数据分析与挖掘讲义、实验教学体系、精品数据课程、大数据培训及人才培养
4、公共资源:国际资源、政府资源、学术资源、企业资源
5、组织管理资源:数据库管理经验、调查研究组织管理经验、调查研究团队建设经验
以人文社科数智化为核心特色,打造一流的数据资源和服务平台。
夯实基础研究,深化学科交叉,开展科学研究范式、科研组织形式和人才培养模式的创新,基于平台孵化数据密集型项目,打通咨政、启民、惠产服务链条,构建中国自主知识体系,以事实数据讲好中国故事,引领国际对话。
版权所有©北京大学文科智数化公共平台