l0o0 / translators_CN

Zotero translator中文网页抓取翻译器🎉This is Zotero translators for Chinese Sites(beta), not the official Zotero repo
GNU Affero General Public License v3.0
4.03k stars 523 forks source link

add (Sina Weibo.js) 新增新浪微博 #284 #287

Closed jiaojiaodubai closed 6 months ago

jiaojiaodubai commented 8 months ago

@doubanchan 请审查。

doubanchan commented 8 months ago

搜索界面结果 在搜索界面的搜索天气,抓取结果中,标题为“的微博”,作者为空,日期也为空。不知道其他人结果怎样。

用户主页未识别情形 用户主页主页2主页3未识别成multiple。 发现直接在浏览器输入主页网址或者从搜索引擎进入主页,结果不识别。如果从微博的帖子点击头像进入主页则会识别。

jiaojiaodubai commented 7 months ago

搜索界面结果 标题为“的微博”,作者为空,日期也为空。不知道其他人结果怎样。 用户主页未识别情形

已修复。

doubanchan commented 7 months ago

搜索界面日期 如果搜索结果是往年的内容,日期时间格式有误,实际为2023年某月某日的日期,结果显示为2024年,月和日也为空。

单贴中日期 Testcast3中日期格式错误,微博中的“24-1-10”需要先加“20”,否则在Zotero中会转为“2010-01-24”。 即 "date": "2010-01-24",应为"date": "2024-01-10",

用户主页 我这边好像还是不太行。不知道其他人是否也这样。

jiaojiaodubai commented 7 months ago

搜索界面日期 单贴中日期

以上两个问题已经修复。

用户主页 我这边好像还是不太行。不知道其他人是否也这样。

确认无误,可以使用,testcase中已经包括用户主页。

doubanchan commented 7 months ago

微博的日期实在是麻烦。! 单贴日期 案例虽然改到2024年了,不过准确日期是2024-01-10,在Zotero中为2024-01-24,可能哪儿算错了? 改善意见 (1)如果转发(reship)为0的话,Zotero显示为“转发”,去掉显示“转发”,改为不显示或者0比较好。 (2)时间,是否可能加上时间(几点几分) (3)“已编辑”,有的微博是经过编辑的,可以在extra中添加“已编辑”状态 用户主页 可能不是translator问题,可能和插件有关,先不管了。

jiaojiaodubai commented 7 months ago

单贴日期 案例虽然改到2024年了,不过准确日期是2024-01-10,在Zotero中为2024-01-24,可能哪儿算错了?

已修复。

改善意见 (1)如果转发(reship)为0的话,Zotero显示为“转发”,去掉显示“转发”,改为不显示或者0比较好。

已修复,“转发”字段仅匹配数字,未匹配到数字时置空。

(2)时间,是否可能加上时间(几点几分)

我不打算弄,一来要考虑那种显示“x小时前”、“x分钟前”的情况,又得像date一样得写一串if;二来date就是指日期,不宜含时间。

(3)“已编辑”,有的微博是经过编辑的,可以在extra中添加“已编辑”状态 。

这个似乎有必要,但我不确定应该用什么字段名,我参看了CSL的文档,不太确定这里是用version还是用status,或者我们自己造一个变量名。

待(3)讨论确认我再commit上来。

doubanchan commented 7 months ago

如果二选一的话,感觉status比较适合。status:Publication status of the item (e.g. “forthcoming”; “in press”; “advance online publication”; “retracted”)。

jiaojiaodubai commented 7 months ago

前述问题已解决

doubanchan commented 7 months ago

日期 case1,实际为2024-01-10,抓取到Zotero为2024-01-24。 case2,实际为2024-02-23,抓到Zotero为2024-02-24

jiaojiaodubai commented 7 months ago

已修复,else子句可能会有意外情况,待证实