Open hongqn opened 1 year ago
看到 TODO 里有整理左耳朵耗子的推文记录,告知一下之前 @yihong0618 抓取过他的全部推文,在 https://github.com/yihong0618/twint 下。
另外,我们设立了一个收集 @haoel 公开内容的项目,在 https://github.com/ghostincoolshell/haoel-articles ,里面已经有一些数据,例如酷壳的 blog 文章(包括图片)、左耳朵耗子最近半年的微博等, @yihong0618 抓取的推文在这个项目里也放了一份。我们还在继续收集。如果有需要可以直接用,应该能省掉一些抓取和清理的工作量。
好的, 感谢
我记得 @yihong0618 Tweet 应该是只拿到了 3200 条吧,Twitter 的限制
他后来改变了方法拿到了全部的
还有blog的备份, 作者 @soulteary https://github.com/soulteary/forever-coolshell
看到 TODO 里有整理左耳朵耗子的推文记录,告知一下之前 @yihong0618 抓取过他的全部推文,在 https://github.com/yihong0618/twint 下。
另外,我们设立了一个收集 @haoel 公开内容的项目,在 https://github.com/ghostincoolshell/haoel-articles ,里面已经有一些数据,例如酷壳的 blog 文章(包括图片)、左耳朵耗子最近半年的微博等, @yihong0618 抓取的推文在这个项目里也放了一份。我们还在继续收集。如果有需要可以直接用,应该能省掉一些抓取和清理的工作量。