l0o0 / translators_CN

Zotero translator中文网页抓取翻译器🎉This is Zotero translators for Chinese Sites(beta), not the official Zotero repo
GNU Affero General Public License v3.0
4.11k stars 525 forks source link

请求增加「人民日报图文数据库」 #128

Closed TomBener closed 10 months ago

TomBener commented 2 years ago

网站名称:人民数据-人民日报图文数据库(1946-2022)

网址:http://data.people.com.cn/rmrb

示例文章《尽管说真话难……

photo_2022-09-20 10 42 22

pixiandouban commented 1 year ago

弄了个 初步版本,未匹配搜索和新闻版面,只匹配了单篇新闻页面,请 @l0o0 @zepinglee 帮忙完善。

l0o0 commented 1 year ago

@pixiandouban 感谢豆瓣的工作,不过我对那个英文名有点疑问, Renmin Ribao Data 还是People's Daily

l0o0 commented 1 year ago

@TomBener 现在怎么要登录了?要怎么才能注册账号?

TomBener commented 1 year ago

@l0o0 似乎一直都要登录才能用,但似乎没有个人注册方式,只能通过机构 IP 使用。

jiaojiaodubai commented 1 year ago

@TomBener 现在怎么要登录了?要怎么才能注册账号?

最新的新闻无需登录就可以浏览,但是过刊只有购买了数据库的用户才可以访问

doubanchan commented 10 months ago

@pixiandouban 感谢豆瓣的工作,不过我对那个英文名有点疑问, Renmin Ribao Data 还是People's Daily

我写那个似乎不太行,还需要人帮忙改一下。

jiaojiaodubai commented 10 months ago

可以指出有什么问题吗?我会尝试在标准化进程中一并解决。

doubanchan commented 10 months ago

People's Daily.js,只写了一半,然后就放那了。

jiaojiaodubai commented 10 months ago

已在 8a4056eb4c4f35417bdc5bb0192fc5e2119e1e1c 完成。有些页面我没有访问权限,可能会有所疏漏。

doubanchan commented 10 months ago

@jiaojiaodubai @l0o0 整版(比如2023年12月15日 第4版)的似乎没有抓取成功?搜索页面的multiple需要权限,可以暂时不管。

另外,这个js是否改叫 Renmin Ribao Data或People's Daily Data,因为人民日报的话,还有其电子版

jiaojiaodubai commented 10 months ago

有整版引用的情况?似乎都是引具体篇目的吧。最新的版面开放浏览,那里的多条目我可以正常抓取。 image

另外,这个js是否改叫 Renmin Ribao Data或People's Daily Data,因为人民日报的话,还有其电子版

确有必要更名,感觉叫“People's Data”即可,那个网站叫“人民数据”,不止人民日报。

doubanchan commented 10 months ago

手动下载js文件替换之后,可以在整版抓了。