Closed TomBener closed 10 months ago
弄了个 初步版本,未匹配搜索和新闻版面,只匹配了单篇新闻页面,请 @l0o0 @zepinglee 帮忙完善。
@pixiandouban 感谢豆瓣的工作,不过我对那个英文名有点疑问, Renmin Ribao Data 还是People's Daily
@TomBener 现在怎么要登录了?要怎么才能注册账号?
@l0o0 似乎一直都要登录才能用,但似乎没有个人注册方式,只能通过机构 IP 使用。
@TomBener 现在怎么要登录了?要怎么才能注册账号?
最新的新闻无需登录就可以浏览,但是过刊只有购买了数据库的用户才可以访问
@pixiandouban 感谢豆瓣的工作,不过我对那个英文名有点疑问, Renmin Ribao Data 还是People's Daily
我写那个似乎不太行,还需要人帮忙改一下。
可以指出有什么问题吗?我会尝试在标准化进程中一并解决。
People's Daily.js,只写了一半,然后就放那了。
已在 8a4056eb4c4f35417bdc5bb0192fc5e2119e1e1c 完成。有些页面我没有访问权限,可能会有所疏漏。
@jiaojiaodubai @l0o0 整版(比如2023年12月15日 第4版)的似乎没有抓取成功?搜索页面的multiple需要权限,可以暂时不管。
另外,这个js是否改叫 Renmin Ribao Data或People's Daily Data,因为人民日报的话,还有其电子版
有整版引用的情况?似乎都是引具体篇目的吧。最新的版面开放浏览,那里的多条目我可以正常抓取。
另外,这个js是否改叫 Renmin Ribao Data或People's Daily Data,因为人民日报的话,还有其电子版
确有必要更名,感觉叫“People's Data”即可,那个网站叫“人民数据”,不止人民日报。
手动下载js文件替换之后,可以在整版抓了。
网站名称:人民数据-人民日报图文数据库(1946-2022)
网址:http://data.people.com.cn/rmrb
示例文章《尽管说真话难……》