2019ncovmemory / nCovMemory

2020新冠肺炎记忆:报道、非虚构与个人叙述(持续更新) Memory of 2020 nCoV: Media Coverage, Non-fiction Writings, and Individual Narratives (Continuously updating)
https://2019ncovmemory.github.io/nCovMemory/
106 stars 17 forks source link

除了截图之外,建议增加纯文本存档 #96

Open lingjzhu opened 4 years ago

lingjzhu commented 4 years ago

假如可以把每篇文章存为单独纯文本的话,可以极大方便后续分享和分析。

sonnabanana commented 4 years ago

建议考虑pdf格式(可以使用浏览器打印功能输出pdf),一方面具有和截图基本一致的外观,同时可以进行全文搜索(借助工具可以跨文档全文搜索)。

speechfree commented 4 years ago

这里是两个基于本站建立的 Repo:

  1. https://github.com/Project-Gutenberg/nCovMemory-Raw-Data

根据本站收集的链接,整理而成的数据元信息,同时有 html, markdown, text 三种格式,此外,文本经过分词处理,已提取出关键词。

  1. https://github.com/Project-Gutenberg/nCovMemory-Web

本 Repo 为在 1 的基础上,利用 Gohugo 建立的静态网站,方便查看搜索。