https://banned-historical-archives.github.io
和谐历史档案馆,开源的数字档案馆。我们致力于搜集、整合各类受官方封禁的文稿、报纸、杂志和多媒体资料,对并它们进行标准化处理,通过解析、识别和分类,形成规范化的文稿档案和多媒体档案数据库。
尽管民间有许多人在进行资料收集和校验工作,但分散的工作可能难以避免重复劳动,资料的二次汇编难以确保真实性,且缺少统一的版本管理,难以维护。我们运用一系列自动化工具解决了这些问题,确保每篇文稿的溯源和可验证性。
其中已录入的文稿资料至少10万篇;待录入的文稿资料初步估计至少是已录入文稿资料的20倍。文稿内容包括但不限于中央发布的文件、中央高层会议纪要、主要人物的通知、著作、谈话/对话/讲话、宣言/声明、电报、通讯、书信、消息、评论/批语/批注/批示、意见、指示/命令,以及群众运动中的重要文献。涉及的主要人物包括毛泽东、江青、姚文元、张春桥、王洪文等。所收录资料立场不一,请注意辨别。我们仅进行收录和校对工作,力求保持文稿原貌,其内容并不代表我们的观点。
我们还收录了一些重要的学术性、第三方解读的哲学、政治经济学、历史书籍(通常以章节为最小单位录入)。 报纸和杂志经过类似处理,转换为标准文稿档案(以文章为最小单位),主要包括红旗杂志、学习与批判、参考消息、人民日报等。
多媒体资料涵盖音乐及歌词、电影、照片、录音等,目前主要收录了一些社会主义中国创作的红色音乐。
承认阶级斗争、无产阶级专政和无产阶级专政下继续革命这三大理论是开展历史研究讨论的前提。
一般方法: 针对多份资料相互印证的事实(某时某地某人做了什么事),分析事实对各个阶级造成了什么影响,由此得出结论。例:文化大革命中的大量群众运动,注意分析运动发起方与领导方,运动过程事件如何推进(武斗、打砸抢烧等),运动中各方的各种反映,后续如何,最后总结得出事件的性质。
资源贡献\校对\纠错
[Github issues]
本地运行
本地搜索
文稿录入与校对
标准化加工及开发说明
为了保护您的隐私与安全,建议您在访问过程中使用翻墙工具。 若需全文检索,可考虑使用本地搜索功能替代。
在使用 GitHub 和 Git 工具时,请谨慎操作,避免在以下操作中泄露个人身份:Issue 发言、Star、Watch、Fork、Pull Request、Git Commit。
建议您使用临时 GitHub 账户,设置随机 ID 和邮箱。
在数据库内上方搜索框搜索即为谷歌搜索,谷歌搜索收到网页收录影响,不保证即时性与搜索效果。
下载此分支的压缩包,安装 VS Code 并使用它打开解压后的目录,在 VS Code 中进行搜索
例如在扩大的中央工作会议上的讲话这篇文章,点击右上角“对比”按钮,选择“对比不同来源解析后的文本”,可见毛泽东选集官方版本中被删减的内容。
如果以备份为目的 fork 本仓库,最好同时 fork 本仓库对应的资源仓库 banned-historical-archives0, banned-historical-archives1, banned-historical-archives2 ... banned-historical-archives20
https://github.com/banned-historical-archives/banned-historical-archives.github.io/tree/gh-pages
https://github.com/banned-historical-archives/banned-historical-archives.github.io/tree/txt
包含已录入的和未录入的原始文件
https://huggingface.co/datasets/banned-historical-archives/banned-historical-archives
名称 | 收录状态 |
---|---|
红旗 | 已收录58-76年;77后待录入 |
人民日报 | 已收录涉及关键人物的文章 |
光明日报 | 暂缺 |
文汇报 | 已收录涉及关键人物的文章 |
解放日报 | 暂缺 |
解放军报 | 待解析,不完整 |
各地方报 | 待解析,不完整 |
学习与批判 | 部分录入 |
参考消息 | 待解析 |
自然辩证法 | 已收录 |