数智资源

影视剧本数据库

该数据库包含:

1)训练语料:中英文电影剧本20300多个;电视剧剧本150多个;网路微短剧剧本1100多个(以上资源都已公开发行)。

2)标注案例:利用各种力量,目前完成1000多个优质中英文电影剧本、200多个网络微短剧剧本的案例标注工作。

3)规则库:已经构建完成目前世界上最大、最齐全的影视叙事规则库,涉及类型、风格、时代、人物、话题、情节线索、情节点、冲突、陷阱、悬念等300多个叙事要素的定义、特征提取、标准化模版等可计算性条目6100多个,基本涵盖影视领域70%叙事逻辑。

4)向量库:已经构建语词向量700多条,涉及角色属性、人物重要性、故事要素权重、人物性格、社会关系、故事推动力弧线、矛盾冲突、主要目标、次要目标、因果逻辑、环境关联、决策判断、情感判断、道德判断、价值判断等等,非常有力的帮助智能体完成分类、蕴含、相似度和多选等任务。

截屏2025-03-20 20.42.42

基于影视剧本数据库打造的智能微短剧剧本自动写作平台“灵狐”AI



版权所有©北京大学文科智数化公共平台