LuckyPuppy514 / jproxy

介于 Sonarr / Radarr 和 Jackett / Prowlarr 之间的代理,主要用于优化查询和提升识别率 | A proxy between Sonarr / Radarr and Jackett / Prowlarr, mainly used to optimize search and improve recognition rate
MIT License
241 stars 28 forks source link

标题里中文冒号,中文括号的问题 #74

Closed PN62323424 closed 11 months ago

PN62323424 commented 11 months ago

问题描述

TMDB上很多剧集的标题里含有:()这样的中文标点,比如海军罪案调查处:洛杉矶、D.P:逃兵追缉令,TMDB的中文标题里的中文标点前后都没空格的,导致jproxy把搜索词格式化成海军罪案调查处洛杉矶,D P逃兵追缉令,也就是没空格,这样会导致很多结果搜不出来,而且像剧集的话,TMDB的中文标题里带中文标点是很常见的,动漫的话就更多了。

我随手找出的TMDB上带中文标点的几个链接: https://www.themoviedb.org/tv/17610-ncis-los-angeles/edit?active_nav_item=primary_facts https://www.themoviedb.org/tv/110534-d-p/edit?active_nav_item=primary_facts https://www.themoviedb.org/tv/2734-law-order-special-victims-unit https://www.themoviedb.org/tv/70998

馒头搜索测试方法: 比如用D P逃兵追缉令在馒头只能搜出一个结果,而用D P 逃兵追缉令就可以把所有结果都搜出来

功能描述

有没办法规避下中文标点造成的无空格的问题,比如遇到中文标点,后面有内容的话,就自动加个空格?

当然英文符号我觉得带个空格能搜出的结果也更多,类似毒枭巴勃罗·埃斯科巴这种,格式化的中文标题也会变成“毒枭巴勃罗埃斯科巴”这种长句子,会造成搜不出结果来

LuckyPuppy514 commented 11 months ago

重复的问题:#72 再次解释一下,JProxy 搜索不会对标题做任何修改,不会去除任何字符,但是 Sonarr 会 如果是 Sonarr 已经去除的,没法复原,如果是 JProxy 中同步的 TMDB 标题,有需要你完全可以自己修改

PN62323424 commented 11 months ago

我说的就是 JProxy 中同步的 TMDB 标题,并没有说Jproxy

现在的问题是TMDB 标题这种标题里带这种符号的太多了,我直接改TMDB标题的话肯定是不符合TMDB要求的,改JProxy 中同步的 TMDB 标题的话当然可以,但这个要改的频率太高了,随便下点动漫,里面就有这种TMDB里的中英文符号,导致的一大段不带空格的标题

LuckyPuppy514 commented 11 months ago

这个的话,后续再说,因为我还没了解过 Sonarr / Jackett 去除中文标点符号的规则,说不定有些去除了反而有问题 而且当前暂时就你一个人反馈这个问题,所以还是建议先手动修改

PN62323424 commented 11 months ago

确实是Sonarr / Jackett的原因,我没留意看jproxy的结果,jproxy格式化的中文标题是对的带空格的,但jackett里日志都是没空格的

PN62323424 commented 11 months ago

奇怪的是如果我TMDB里把中文括号去掉(带中文括号的都没空格),改成英文括号+空格,jackett里就带空格了,但如果用中文括号,即便jproxy格式化结果带个空格,jackett的日志里还是没有