l0o0 / translators_CN

Zotero translator中文网页抓取翻译器🎉This is Zotero translators for Chinese Sites(beta), not the official Zotero repo
GNU Affero General Public License v3.0
4.11k stars 525 forks source link

申请支持科学文库网站的图书条目抓取 #138

Closed hphGithub closed 8 months ago

hphGithub commented 2 years ago

希望开发者能添加对科学文库的抓取,以便形成图书条目导入到Zoreto中。

jiaojiaodubai commented 11 months ago

PubScholar中已经包含科学文库的内容

tangxunding commented 10 months ago

PubScholar没有科学文库自己更新快,而且科学文库有权限的话,可以在页面直接下载PDF阅读。 @jiaojiaodubai

tangxunding commented 10 months ago

PubScholar没有科学文库自己更新快,而且科学文库有权限的话,可以在页面直接下载PDF阅读。 @jiaojiaodubai

jiaojiaodubai commented 10 months ago

OK,那我做一个

jiaojiaodubai commented 10 months ago

@tangxunding 我基本上完成了,但是我没有下载权限,无法继续完成下载附件那部分的代码,你能在有权限的环境下打开科学文库的网页,然后Ctrl + kbd>S</kbd>保存一个`.mhtml`文件然后压缩发给我吗?(因为文件中可能包含机构账户名等隐私信息,请发到邮箱<jiaojiaodubai23@gmail.com

jiaojiaodubai commented 9 months ago

已在 #296 提交,请审查。

jiaojiaodubai commented 9 months ago

@tangxunding 感谢,我后来找了其他同学帮我测试,转换器已经在 #296 提交,你可以自行下载并按照这里的方法2进行测试。

tangxunding commented 9 months ago

@jiaojiaodubai 已尝试,可以用,就是书太大了,下载要好久。另外,科学文库的PDF下载下来只有15天有效期,还只能用知网的阅读器阅读,后附任一阅读器查看和时间权限解码软件的下载链接和说明网址。 科学出版社电子书下载方法 | Feng's Blog (windsky.tech) https://blog.windsky.tech/2022/02/08/ScienceReading/ 如果能够搞成,目录添加、PDF下载、PDF权限改变集成在一起就爽了。 只是建议。

jiaojiaodubai commented 9 months ago

按我的理解,转换器只对元数据负责,不应对附件作过多的加工,而且公共开源产品不应该承担这样的法律风险,但我可以继续优化目录抓取的代码,以便抓取到更完整的目录列表,感谢你的建议。