whull / end2end_ASR

端到端语音识别实现;包含LAS、CTC、RNNT解码方式,模型SA(MHA)、LSTM、CNN、DFSMN等
14 stars 3 forks source link

在不,你这个代码能用么,utils下面没有tools,也没有提到数据集,这个vacab_file也没提供,能解决下么? #1

Open chengjuan125 opened 3 years ago

chengjuan125 commented 3 years ago

在不,你这个代码能用么,utils下面没有tools,也没有提到数据集,这个vacab_file也没提供,能解决下么?

whull commented 3 years ago

数据集是自有的中文数据集,代码是可以跑的,先使用make_am_data预处理数据;tools和vocab_file(拼音)文件已经上传了。

chengjuan125 commented 3 years ago

DFSMN这个模型的有完成么?

whull commented 3 years ago

过段时间会一起上传

chengjuan125 commented 3 years ago

data/train_data.csv这个我没有,是不能提供么?

whull commented 3 years ago

这个根据你自己的数据集整理生成,格式是:"1.wav","['wo3', 'wen4', 'ni3']"

chengjuan125 commented 3 years ago

你能提供给我么?

whull commented 3 years ago

你没有数据吗,你是需要做什么?

chengjuan125 commented 3 years ago

我就做个模型推理,我冻结个pb,推理用

whull commented 3 years ago

给个联系方式,私聊