l0o0 / translators_CN

Zotero translator中文网页抓取翻译器🎉This is Zotero translators for Chinese Sites(beta), not the official Zotero repo
GNU Affero General Public License v3.0
4.03k stars 523 forks source link

add (Encyclopedia of China 3rd.js) 新增中国大百科全书 #141 #273

Closed jiaojiaodubai closed 7 months ago

jiaojiaodubai commented 8 months ago
doubanchan commented 8 months ago

@jiaojiaodubai 中国大百科全书的条目作者有些格式不同,需要改一下,比如例1。可以再增加一个多人作者的testcast,例2

jiaojiaodubai commented 8 months ago

中国大百科全书的条目作者有些格式不同,需要改一下,比如例1

例1的问题已修复;

可以再增加一个多人作者的testcast,例2

原来已经有一个多作者的例子,这个和原来的有什么区别吗?

doubanchan commented 8 months ago

之前的case中的作者含有“撰”、“修订“后缀,这个没有。

jiaojiaodubai commented 8 months ago

好怪,现在这个selector,我在浏览器里匹配是对的,但scaffold里总是匹配多个,还得继续改进

doubanchan commented 8 months ago

@jiaojiaodubai 发现一个问题,case 4(学科列表)未能识别成“multiple”。一个提议,是否在extra增加“英文名称”字段,虽然有时翻译不是很准确,但是大多数应该和英语常见标题一致或类似。如果增加英文字段,有一个问题,比如蒯祥,其中拼音字母a用了U+0251,而不是最常用的U+0061

jiaojiaodubai commented 8 months ago

我现在访问你上面给的两个链接都是502 504异常,过后我再试试

doubanchan commented 8 months ago

发现好像是整个网站502/504了,主页也是。

jiaojiaodubai commented 8 months ago

case 4(学科列表)未能识别成“multiple”。

实测可以检测为“multiple”。

一个提议,是否在extra增加“英文名称”字段

之前已经有original-title可用,不过selector写得有问题就没匹配上,我再改改。

有一个问题,比如蒯祥,其中拼音字母a用了U+0251,而不是最常用的U+0061

我想,我们不能对数据库的内容负责。

doubanchan commented 8 months ago

case 4的问题,我清楚浏览器缓存之后好了,暂不清楚原因。第二个拼音字母的话,其他条目似乎都是用U+0061,倾向是编写者的笔误(大百科全书中看得多之后,是能发现错误的)。为什么用“original-title”,而不是trans-title或者eng(lish)-title,按理说中文才是original-title。

jiaojiaodubai commented 8 months ago

为什么用“original-title”,而不是trans-title或者eng(lish)-title,按理说中文才是original-title。

见 #257