数据与方法

本页说明红楼图鉴(hongloudata.com)在人物、关系与章回数据上的编辑原则与可追溯性;学术引用请仍以纸本校注本与原文核对为准。

公开统计(快照)

人物条目数

248

关系边数(GraphEdge,全库)

555

章回数

120

第 1 — 120 回

数据最近更新时间(UTC): 2026-05-05T15:50:01.474Z

快照时间(UTC): 2026-05-14T05:12:57.905Z

底本与文本

章回正文与出场统计所依据的全文,以仓库内 `data/raw/hongloumeng.txt` 为工作底本(程高本系 120 回排印本;卷首署「曹雪芹 高鄂」)。可与公开全本互校,例如维基文库《红楼梦》程乙本、ctext.org 《紅樓夢》全文。人物小传、关系类型与事件编年由编辑据原文归纳,不直接拷贝网络百科条目。结构化数据在入库前会做与原文、别名表等的一致性检查。

人物与关系数据的处理方式

人物节点以「书中可区分称呼」为主键,别名写入别名表;关系边来自对白、叙事与脂批等线索的显式标注,并区分血缘、姻亲、主仆、情感等类型。图谱布局(层次 / 放射)由算法根据边类型与配置生成,坐标可由服务端预计算以减轻浏览器负担。

引用与转载建议

引用本站统计或图谱时,建议注明「红楼图鉴」、访问日期与具体 URL;若涉及学术出版,请回查本站标注的底本与回目,并与权威校注本原文核对。

统计口径

「人物总数」为数据库中该作品下 Character 记录条数。「关系总数」为 GraphEdge 表在该作品下的边条数(含自动生成的反向边等,与图谱可视化中经筛选的子集可能不完全一致)。「章节覆盖」为 Chapter 表中 orderIndex 的最小与最大值。「快照时间」为本页服务端生成统计的时间(UTC)。

各模块数据溯源

下表概括本站主要功能模块的数据来源、处理方式与使用边界;与页面底部折叠区块一致,便于一次性查阅。完整方法论与底本说明见「数据与方法」页。

模块可信度数据来源处理方式局限
人物关系图整理关系边与图集 seed(GraphEdge / GraphSet 等);编辑据原著录入。人工标注关系类型;子图按图集筛选边集合。未穷举所有隐性关系;全景与子图展示范围不同。
出场排行生成通行本正文分回;人物与别名表;出场统计写入 appearances。正文内按人物名与别名匹配计数(去重规则见数据与方法)。不含回目标题、目录与脂批;别名归并影响合计;CSV 与榜单同源。
诗词索引原著(中文)/ 生成(英译)诗词正文与注释自通行本摘录入库;英文标题、正文与注释为辅助阅读。人工整理与校对;英文由 AI 辅助生成。英译仅供阅读参考,学术引用请以中文原文为准。
大事年表整理事件、人物参与、章节关联等 seed;编辑据原著回目梳理。人工编年与标注;故事纪年为站内叙事坐标。红楼纪年属学界推算,事件先后与年份可能有争议。
人物列表整理人物条目、小传与别名等 seed。人工据原著归纳概要信息。小传为导读式摘要,细节请以原著为准。

延伸阅读