adminpass / aliyundrive-subscribe

阿里云盘订阅
Apache License 2.0
951 stars 107 forks source link

【识别】正则表达式 收集 #161

Open adminpass opened 1 year ago

adminpass commented 1 year ago

V2.9.2 内置:E\d{1,4}|EP\d{1,4}|第\d{1,4}话|第\d{1,4}集|第\d{1,4}期|_\d{1,4}_|\d{1,4}\s|\[\d{1,4}\]|\d{1,4}-4K

image

msycn commented 1 year ago

感谢更新,欢乐颂这种有3季 S01E\d{1,4},S02E\d{1,4}

x1ao4 commented 1 year ago

希望可以让用户自定义正则表达式,或者再多提供一些选择。主要是即便是现在这个版本也有可能无法正确识别综艺节目。

当然你的软件的功能可能是识别正确的集数或期数,来命名对应的集数或期数。但是综艺节目的资源内容比较复杂,很多人订阅视频后需要在其他软件内进行刮削,所以需要正确的集数。

对于综艺节目来说,很多时候正确的期数并不是正确的集数。比如中国说唱巅峰对决 - 第 3 期下,如果想要正确的刮削,应该被名为中国说唱巅峰对决 - S02E06,通过之前的版本,我们可以通过过滤不要的集(加更、花絮),然后把正片顺序命名,不通过识别序号的方式来实现命名为正确的集数。

但有一种情况是,资源的期数不完整,因为现在规则似乎都是从1开始命名的,也没有办法指定起始集数,所以如果期数不完整,或者有中断,就无法实现正确命名,包括中途订阅的情况,也会出现一些问题。

当无法从视频标题获取正确的集数时,还有一种解决方案,是使用日期命名。比如20230731 - 第55期,重命名为2023-07-31 - 第55期就可以正常刮削识别,但如果要用SE命名,实际上这一期应该是S01E61

使用日期命名的好处是不需要转换期数,但有些综艺节目一天更新上下集的,就还是需要使用SE命名。

综艺节目比较复杂,所以还是希望可以增加一个用户自定义正则表达式,或者添加一些指定起始集数或者日期正则的命名方式。

最后感谢大佬的付出。

XlangNan commented 1 year ago

大佬 我发现{}替换序号的方式失败了,比如我订阅的事16 4K这种 就完全识别错误了。

XlangNan commented 1 year ago

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

adminpass commented 1 year ago

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

XlangNan commented 1 year ago

可是我想要的最终名称 是 长相思S01E16 这种格式,我预设名称写的是 长相思S01E 这样,遇到16 4K这种 就会识别成 长相思S0116 4K这样。

XlangNan commented 1 year ago

我明白了 感谢大佬

StanleyLovebass commented 1 year ago

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

Makerlong commented 1 year ago

希望可以支持单个视频独立支持的正则,有一些写出来会导致其他的出现问题。

msycn commented 1 year ago

希望支持 4k和1080p自动识别重命名,看到大佬现在已经支持显示元数据

adminpass commented 1 year ago

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

StanleyLovebass commented 1 year ago

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

感谢,但是这个识别出来是S01E00

adminpass commented 1 year ago

蹲求动画正则表达式~原始命名如下:[orion origin] Rurouni Kenshin:Meiji Kenkaku Romantan [04] [1080p] [H265 AAC] [CHS&JPN]

试下:[\d{1,4}]

感谢,但是这个识别出来是S01E00

\[\d{1,4}\] 前面有个 \ 发出来丢了

x1ao4 commented 1 year ago

看到新版支持自定义正则表达式了,但是搞不明白这个正则的规则,我想把20230807-第56期_Tacit0924重命名为2023-08-07-第56期_Tacit09242023-08-07 第56期2023-08-07,似乎这里的正则只能捕获序号不能捕获年月日,我尝试使用\d{4}\d{2}\d{2}或者(\d{4})(\d{2})(\d{2})或者2023\d{2}\d{2}都不行,因为我之前接触的正则表达式都是有原标题的表达式和替换标题的表达式,然后进行替换标题的,但是这里的正则表达式似乎只是捕获标题中的序号,我想把日期作为一个序号捕获,但是日期是8位连续数字,不知道应该如何捕获,并且我需要把捕获的年月日用-隔开,不知道有没有办法实现。

x1ao4 commented 1 year ago

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

大佬,你把{}命名整没了是吗?现在订阅标题中不包含正确集数的就没法自动命名了,原来还可以用{}顺序命名,现在也不行了,希望把E{}这个方法恢复。比如下面的:

20230811-第1期下_Tacit0924.mp4
20230811-第1期上_Tacit0924.mp4
20230811-先导片_Tacit0924.mp4

以前我过滤掉先导,保存名称设置为乐队的夏天 - S03E{}可以重命名为:

20230811-第1期下_Tacit0924.mp4 > 乐队的夏天 - S03E02
20230811-第1期上_Tacit0924.mp4 > 乐队的夏天 - S03E01

现在S03E{}用不成了,第1期提取序号这种对这个类节目不适用,这种综艺就没法自动重命名了。


哦,我误会了,其实乐队的夏天 - S03E{}这个还是有效的,但是有个 BUG 是预览里面没有显示正确的命名,订阅以后实际上效果和以前一样。

1
msycn commented 1 year ago

我感觉最好的方法就是让我们自己去设置表达式,比如18 4K这种名称,我们可以设置序号的字符的位置,这样的名称可以让我们设置 从名称第几个字符开始取 取几个字符。

V2.9.2版支持自定义正则,直接 E 不要用 E{},正则如:\d{1,4}\s -> 16 4K.mp4 \d{1,4}-4K -> 16-4K.mp4

大佬,你把{}命名整没了是吗?现在订阅标题中不包含正确集数的就没法自动命名了,原来还可以用{}顺序命名,现在也不行了,希望把E{}这个方法恢复。比如下面的:

20230811-第1期下_Tacit0924.mp4
20230811-第1期上_Tacit0924.mp4
20230811-先导片_Tacit0924.mp4

以前我过滤掉先导,保存名称设置为乐队的夏天 - S03E{}可以重命名为:

20230811-第1期下_Tacit0924.mp4 > 乐队的夏天 - S03E02
20230811-第1期上_Tacit0924.mp4 > 乐队的夏天 - S03E01

现在S03E{}用不成了,第1期提取序号这种对这个类节目不适用,这种综艺就没法自动重命名了。

同样问题,不仅新的无法重命名,已经在订阅的还会重复收藏一遍原文件

x1ao4 commented 1 year ago

同样问题

这个我测试了,他是有个 BUG,预览的时候没有显示正确的名字,实际上我订阅以后还是和以前一样,按想要的方式命名成功了,重复收藏原文件的情况,其实一般我订阅链接失效或怎么样需要重新订阅的时候,我会先重置,就是先清空以前所有保存的记录,重新刷新,这样就不存在重复文件的情况了。

wdzzz commented 1 year ago

建议过滤里面直接添加文件大小选项,然后按顺序编号。。基本能排除综艺里杂七杂八的花絮。。

lustlost commented 1 year ago

可以考虑使用chatgpt来自动识别和生成正确的名字 image

wunyee commented 9 months ago

大佬 这种有空格才是集数的正则该如何订? 1080p.H264 088.mp4

metaforget commented 8 months ago

看了一下,这个正则表达式不只是识别筛选文件名,还有重命名功能吗?但是我不太清楚重命名是什么逻辑,作者能不能说说这个。我现在保存格式就一个E,有的会转个名字,有的是原名保存