MAraragi / MusicalScoreRecognition

简谱识别并转化为音频文件的方法研究,即提取简谱图片中的音乐信息,并依据该音乐信息生成对应的midi文件。
21 stars 4 forks source link

可以识别歌词信息吗 #3

Closed echunun closed 2 months ago

echunun commented 2 months ago

感谢工作

MAraragi commented 2 months ago

感谢工作

xd我这个代码不支持识别歌词信息哈,我代码的思路是先把图像按照小节线分段,然后一段段识别。分段的时候会先确定每个小节线的位置,然后按照竖直方向来分组。 分组过后一般来说就可以得到每个小节的纵向位置,如果要使其能够识别歌词信息的话,可以在得到每个小节的纵向位置后,将小节间的图像片段截取出来,找一些OCR的脚本来识别一下,然后把得到的文本跟小节匹配起来就好。 最后的保存格式感觉有点麻烦,歌词应该不能存在midi文件里面,感觉xd需要的话可以用json或者xml这种通用一点的格式来存。

MAraragi commented 2 months ago

感谢工作

xd可以在recognition.py的第108行把self.sections打印出来看看,我记得这个里面存的是识别得到的各个小节的坐标。