Closed whitecodes closed 3 years ago
Hi @whitecodes 非常感谢你的提问;对于提出的以下问题:
@whitecodes 非常感谢你对该问题的剖析,我明天测试完毕之后发个版进行修复,如果你感兴趣你可以提一个变更 PR 我直接在你变更的上面测试也行。
@whitecodes 该问题已经在 v1.0.11
解决了,你升级新版本试试。
Release date 修正了 但是剧集的 Original title 还是不对,带了 第X季
@whitecodes 你搜索的关键字能否发出来看看;另外,豆瓣的搜索功能第一条的返回结果的标题是什么呢?对于该项的期待值我的理解是你希望 “第7季” 出现在 title 中,对吗?
根据豆瓣id来搜索的:35471063 返回的结果如下
是的,希望 “第7季” 出现在 title 。豆瓣上是每季都是独立的id
@whitecodes 感谢你的反馈,标题字符串拆分算法看来需要分策略进行优先级拆分,比如下述两个例子:
失控玩家 Free Guy
X医生:外科医生大门未知子 第7季 ドクターX~外科医・大門未知子~第7シリーズ
字符串策略优先级算法从上至下:
第\d+季
则按 第 2 次
出现空格拆分 第 1 次
出现空格进行拆分另外:希望能够有更多的标题示例来论证该算法是否能够完全解决此问题。
@whitecodes 再试试 v1.0.12
版本(服务端版本需要 >= 5c9a195),目前正则实现上述策略规则参考:https://github.com/caryyu/douban-openapi-server/blob/main/provider/httprequest_provider.py#L70
用起来没问题了。虽然看正则如果季数超过9季,两位数的话这个正则就出错了。但是现在的电视剧基本都不会有这么长的,这个问题先关闭了
metadata 中部分字段取错了
例如 Original title 使用了 “又名”字段,这里应该是原始名字。 例如 失控玩家 Free Guy ,豆瓣id 30337388:Original title 应该是 “Free Guy”,而不是 “分身人 / 爆机自由仁(港) / 脱稿玩家(台) / 自由之人 / 自由人”
另外缺少 Release date 的信息:douban-openapi-server 中已经取到了(字段应该是 screen),但是在插件中没有使用