Closed Sundy1219 closed 1 year ago
你好,谢谢你的关注!
很感谢您的回复,所以说,生成的TLG.fst大小是可能变大的,是这样子的吗?
是的
好的,感谢,请问你们这个CAT项目,有没有学习交流群啥的?希望可以多交流
有关问题可以在github discussions中交流:)
好的,你们的CAT loss 有tensorflow版本吗?或者有什么思路给整合到tensorflow上,类似tensorflow的tf.nn.ctc_loss().谢谢
可以参考这个repo: https://github.com/TeaPoly/warp-ctc-crf
你们的工程很棒,我也一直在eesen的工程上做工作,根据你们的论文CRF-BASED SINGLE-STAGE ACOUSTIC MODELING WITH CTC TOPOLOGY里说的,修改T.fst的生成方式,模型大小会变小,并且性能会略有提升. 我实际操作了下,根据我的语言模型,原来eesen生成的TLG.fst,是16M,直接在eesen的脚本中替换成你们的ctc_token_fst_corrected.py,生成的TLG.fst是20M.我发现你们论文说的,你们的T.fst的state的数量减少了,但是相对的arc增多了,这个你们有研究过吗?还是说我哪里有没理解到的地方?期待你们的回复,谢谢