l0o0 / translators_CN

Zotero translator中文网页抓取翻译器🎉This is Zotero translators for Chinese Sites(beta), not the official Zotero repo
GNU Affero General Public License v3.0
4.11k stars 525 forks source link

fix (China Judgements Online.js) 通过ESLint;修复缺当事人;补充测试用例 #258

Closed jiaojiaodubai closed 10 months ago

jiaojiaodubai commented 10 months ago

@zepinglee 更新过程中发现原先无法处理多个当事人的情况,而且原来使用的“Genre”居然会被Zotero转换成“type”和另一个无关字段,所以我干脆就用“type”了,不知道和不合适,如果没问题我再合并过去。

zepinglee commented 10 months ago

@zepinglee 更新过程中发现原先无法处理多个当事人的情况,

而且原来使用的“Genre”居然会被Zotero转换成“type”和另一个无关字段,所以我干脆就用“type”了

不会转换吧?我这里用原版 translator 还是会抓取到“Genre”。另一个无关字段是什么?

Screenshot 2023-12-15 at 09 27 03

在 citeproc 的处理过程中,extraType 会覆盖原文献类型(见 https://www.zotero.org/support/kb/item_types_and_fields#citing_fields_from_extra),导致不能正确识别为 legal_case 类型。所以不能用“Type”。

zepinglee commented 10 months ago

另外我在 Zotero 的 Scaffold 中不能正确运行 test,你是怎么处理的?

09:29:16 TranslatorTester: Running 1 test for China Judgements Online
09:29:16 TranslatorTester: Running China Judgements Online Test 1
09:29:16 TranslatorTester: Translating https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=8uT/bLVGgtGbCEfXD1fGwRjonlu27L7bE9KWzYhQhrN5Pz5TEm1FHZO3qNaLMqsJrtmSoLGZMrRbw4YYlPxcEO55A1guaDK+t4Hw4I001PELWUlJ6s2F5fFuFZdL2RpR
09:29:16 Translation successful
09:29:16 TranslatorTester: Data mismatch detected:
09:29:16   {
             "itemType": "case"
             "creators": []
             "attachments": [
               {
                 "title": "Snapshot"
                 "mimeType": "text/html"
               }
             ]
             "tags": []
             "notes": []
             "seeAlso": []
         -   "caseName": "胡令国开设赌场案"
         +   "caseName": "案"
         -   "dateDecided": "2023-06-13"
         -   "court": "南昌高新技术产业开发区人民法院"
         -   "docketNumber": "(2023)赣0191刑初162号"
         -   "extra": "type: 刑事判决书"
             "language": "zh-CN"
             "url": "https://wenshu.court.gov.cn/website/wenshu/181107ANFZ0BXSK4/index.html?docId=8uT/bLVGgtGbCEfXD1fGwRjonlu27L7bE9KWzYhQhrN5Pz5TEm1FHZO3qNaLMqsJrtmSoLGZMrRbw4YYlPxcEO55A1guaDK+t4Hw4I001PELWUlJ6s2F5fFuFZdL2RpR"
           }
09:29:16 TranslatorTester: China Judgements Online Test 1: unknown (Item 0 does not match)
jiaojiaodubai commented 10 months ago

不会转换吧?我这里用原版 translator 还是会抓取到“Genre”。另一个无关字段是什么?

类似这样,不过实测发现并不会 存到条目里面,这可能是Scaffold和实际运行结果的区别之一吧(另一个我注意到的区别就是fieldMode,Scaffold里的“帮助—显示条目类型下的所有字段”里fieldMode显示取值为true,而实际上官方定制的ESLint规则里要求填1)。 image

zepinglee commented 10 months ago

噢我用的还是 Zotero 6,可能有些差异。

jiaojiaodubai commented 10 months ago

另外我在 Zotero 的 Scaffold 中不能正确运行 test,你是怎么处理的?

这确实是一个头疼的问题,它和知网一样,链接是动态的,真实域名的后半段应该是当前时间+内部ID,然后再进行一些编码处理,访问它的链接的时候,服务器会读取链接上的时间,如果和当前时间间隔太大,会认为这是异常的访问。知网的话,通过验证码就行了,但这个裁判文书网我都得在浏览器里重新检索、复制新鲜的链接粘贴到Scaffold里面,而且Scaffold里第一次粘贴回车会跳回首页,得再粘贴回车一次。

我用Z6的时候,Scaffold里面“在新标签页打开”的跳转是无效的,在Z7里面可以弹出新标签页,但它是以一个新窗口的形式弹出来,还没有地址栏可以复制链接。总之无论Z6还是Z7,遇到那种点击打开新标签页的网页,都得在浏览器另外开一份就为了获取新标签页上的链接。

jiaojiaodubai commented 10 months ago

刚才给群友答疑,把答疑图片错误地粘贴到这里的评论了,现在已经更正图片

jiaojiaodubai commented 10 months ago

刚才发现一些案例没有“与”,而是用顿号连接原告和被告,还有的标题上显示的当事人比概要里的少,而且刑事案件也是有可能出现标题上的两个人是上诉一方……总之意外情况太多了,这个标题不打算修补了,很难使用简单的替换来实现语义理解,反正有网页截图了,留给专业的用户去处理吧😢

zepinglee commented 10 months ago

刚才发现一些案例没有“与”,而是用顿号连接原告和被告,还有的标题上显示的当事人比概要里的少,而且刑事案件也是有可能出现标题上的两个人是上诉一方……总之意外情况太多了,这个标题不打算修补了,很难使用简单的替换来实现语义理解,反正有网页截图了,留给专业的用户去处理吧😢

嗯,感觉没问题。