satan53x / SExtractor

从GalGame脚本提取和导入文本(大部分需要明文)
GNU General Public License v3.0
205 stars 14 forks source link

怎么把一整行的匹配成两个? #57

Closed allrobot closed 5 months ago

allrobot commented 5 months ago
目多朗「さっそく柔道の会場にやってきましたよ。さすがに女性といえどたくましいですねぇ。体脂肪100%の僕なんて到底たち打ちできませんねぇ」

目多朗,第一个匹配 「和」之间的文本,第二个匹配 这是一整行的内容

除了二次提取分别提取第一个和第二个,有啥办法能一次性提取一行的两个匹配项?

satan53x commented 5 months ago

两个捕获分组就是两个啊。

10_search=^(?P<name>.+?)「(.+?)」$
15_search=^(.+?)$

10是匹配你上边提到的对话。 15是其他,比如旁白。

satan53x commented 5 months ago

按顺序就行,10先匹配对话,因为对话有「」括号,没有括号的旁白不会被10匹配,就会继续到15。

allrobot commented 5 months ago

谢谢,学习了

allrobot commented 5 months ago

image

10_seach=^(?P<name>(.+?))「(.+?)」$
22_search=^([\s\S]+)$
extraData=^Original text$
writeOffset=1
sample=<不要启用纯文本模式>

好像捕获失败了,目多郎「こちらもご苦労様でありますっ。いけませんねぇ。ルール違反は厳しく罰すべきですな」不能显示成

{
"目多朗":"",
"こちらもご苦労様でありますっ。いけませんねぇ。ルール違反は厳しく罰すべきですな":""
}

这种?

原文是:

ID,Label,Context,Original text,Translated text
pylm:text:00000001.lsb:14:0,00000004,,目多郎「こちらもご苦労様でありますっ。いけませんねぇ。ルール違反は厳しく罰すべきですな」,
pylm:text:00000001.lsb:14:1,00000004,,「でも時間が停止している間は僕がルールですからね。僕に従っていただきますよ。ぺろぺろ」,
satan53x commented 5 months ago

哦,我刚刚打错字了,把search打成了seach,已编辑。