数据与方法
本页说明红楼图鉴(hongloudata.com)在人物、关系与章回数据上的编辑原则与可追溯性;学术引用请仍以纸本校注本与原文核对为准。
公开统计(快照)
人物条目数
248
关系边数(GraphEdge,全库)
555
章回数
120
第 1 — 120 回
数据最近更新时间(UTC): 2026-05-05T15:50:01.474Z
快照时间(UTC): 2026-05-14T05:12:57.905Z
底本与文本
章回正文与出场统计所依据的全文,以仓库内 `data/raw/hongloumeng.txt` 为工作底本(程高本系 120 回排印本;卷首署「曹雪芹 高鄂」)。可与公开全本互校,例如维基文库《红楼梦》程乙本、ctext.org 《紅樓夢》全文。人物小传、关系类型与事件编年由编辑据原文归纳,不直接拷贝网络百科条目。结构化数据在入库前会做与原文、别名表等的一致性检查。
人物与关系数据的处理方式
人物节点以「书中可区分称呼」为主键,别名写入别名表;关系边来自对白、叙事与脂批等线索的显式标注,并区分血缘、姻亲、主仆、情感等类型。图谱布局(层次 / 放射)由算法根据边类型与配置生成,坐标可由服务端预计算以减轻浏览器负担。
引用与转载建议
引用本站统计或图谱时,建议注明「红楼图鉴」、访问日期与具体 URL;若涉及学术出版,请回查本站标注的底本与回目,并与权威校注本原文核对。
统计口径
「人物总数」为数据库中该作品下 Character 记录条数。「关系总数」为 GraphEdge 表在该作品下的边条数(含自动生成的反向边等,与图谱可视化中经筛选的子集可能不完全一致)。「章节覆盖」为 Chapter 表中 orderIndex 的最小与最大值。「快照时间」为本页服务端生成统计的时间(UTC)。
各模块数据溯源
下表概括本站主要功能模块的数据来源、处理方式与使用边界;与页面底部折叠区块一致,便于一次性查阅。完整方法论与底本说明见「数据与方法」页。
| 模块 | 可信度 | 数据来源 | 处理方式 | 局限 |
|---|---|---|---|---|
| 人物关系图 | 整理 | 关系边与图集 seed(GraphEdge / GraphSet 等);编辑据原著录入。 | 人工标注关系类型;子图按图集筛选边集合。 | 未穷举所有隐性关系;全景与子图展示范围不同。 |
| 出场排行 | 生成 | 通行本正文分回;人物与别名表;出场统计写入 appearances。 | 正文内按人物名与别名匹配计数(去重规则见数据与方法)。 | 不含回目标题、目录与脂批;别名归并影响合计;CSV 与榜单同源。 |
| 诗词索引 | 原著(中文)/ 生成(英译) | 诗词正文与注释自通行本摘录入库;英文标题、正文与注释为辅助阅读。 | 人工整理与校对;英文由 AI 辅助生成。 | 英译仅供阅读参考,学术引用请以中文原文为准。 |
| 大事年表 | 整理 | 事件、人物参与、章节关联等 seed;编辑据原著回目梳理。 | 人工编年与标注;故事纪年为站内叙事坐标。 | 红楼纪年属学界推算,事件先后与年份可能有争议。 |
| 人物列表 | 整理 | 人物条目、小传与别名等 seed。 | 人工据原著归纳概要信息。 | 小传为导读式摘要,细节请以原著为准。 |