以数据之眼,重新解码古典诗词的浪漫美感
本项目基于《全宋词》开源数据集(chinese-poetry),收录约 21,050首 宋词作品, 覆盖 1,300余位 词人、800余种 词牌。通过力导向图、三维直方图、层次树图、 词云等多种可视化手段,从多个维度呈现宋词的创作风貌与文学图景。
数据来源:唐圭璋《全宋词》· chinese-poetry 开源项目 | 指导教师:李春芳
20位核心词人的共现网络 · 拖拽节点探索词人关系
节点大小 = 作品数量 | 连线粗细 = 共用词牌数量 | 拖拽节点查看连接关系
三维直方图呈现作者分布格局 · 词牌流行度一览
从形式到内容的量化视角:词人占比 · 字数分布 · 词牌偏好
宋词高频用字的诗意密码 · 前100高频汉字词云
作者—词牌—作品 的圆形层级嵌套 · 圆面积 = 词作字数 · 点击圆钻取
数据:宋词三百首 | 点击圆形钻取层级,点击空白返回上级
作者—词牌—作品 的径向分区 · 弧形面积 = 词作字数 · 点击扇区钻取
数据:宋词三百首 | 点击扇区钻取层级,点击空白返回上级
作者—词牌—作品 的矩形镶嵌 · 矩形面积 = 词作字数 · 点击矩形聚焦
数据:宋词三百首 | 点击矩形聚焦层级,面包屑导航返回
宋词创作的三维等高线图谱 · 拖拽旋转 · 滚轮缩放 · 悬停查看名句
从可视化中读出的宋词创作密码
在署名词人中,辛弃疾以629首词作位列第一,远超苏轼(362首)与刘辰翁(354首)。其词风豪放沉郁,题材广阔,堪称"词中之龙"。
吴文英与陈允平共享72种词牌,辛弃疾与赵长卿共享60种——词牌作为"公共资源",编织出一张跨越时代的词人网络。
字数分布呈现显著右偏态,大量词作集中在40-60字的小令区间。宋词以短小精悍见长,"言有尽而意无穷"是其核心美学追求。
"风""花""春""云""无"位居高频字前列,折射出宋词对自然意象的偏爱。"无"字的高频出现则暗示了词体"以悲为美"的情感基调。
《数据可视化的理论和应用》课程结课作品
数据来源:唐圭璋《全宋词》 · chinese-poetry 开源项目
指导教师:李春芳
小组成员:余希冉 · 喻湘儒 · 蔡青源 | 2026年6月