Guanyuansheng / TFGAN-PLC

A Temporal-Spectral Generative Adversarial Network based End-to-end Packet Loss Concealment for Wideband Speech Transmission
29 stars 11 forks source link

plc因果模型生成器输入noisy如何构造? #3

Open ythwilam opened 2 years ago

ythwilam commented 2 years ago

您好,受您的论文启发,我在尝试复现这篇论文,有个问题想请教下,在训练因果版本的时候,输入的生成器的输入noisy是怎么构造的?我的理解根据论文图2和公式4中描述,前7帧取正常语音最后一帧用0填充,生成器的输出最后一帧作为预测帧,不知道是不是这样做的。

Guanyuansheng commented 2 years ago

因果和非因果系统的数据集均是输入前就使用随机错误插入方法构造,而因果模型的区别是推理时会逐帧检测是否丢失:如果是丢失帧则结合以往7帧输入至模型中,只取输出的最后一帧替换掉丢失帧;如果是正常接收帧则跳过,检测下一帧。

------------------ 原始邮件 ------------------ 发件人: "Guanyuansheng/TFGAN-PLC" @.>; 发送时间: 2022年4月25日(星期一) 中午11:04 @.>; @.***>; 主题: [Guanyuansheng/TFGAN-PLC] plc因果模型生成器输入noisy如何构造? (Issue #3)

您好,受您的论文启发,我在尝试复现这篇论文,有个问题想请教下,在训练因果版本的时候,输入的生成器的输入noisy是怎么构造的?我的理解根据论文图2和公式4中描述,前7帧取正常语音最后一帧用0填充,生成器的输出最后一帧作为预测帧,不知道是不是这样做的。

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

ythwilam commented 2 years ago

明白了,非常感谢!!!

Janne-byti commented 9 months ago

@ythwilam 想问一下,我的训练数据集是按随机丢帧5%-30%比例不等,全部混在一起,训练后几乎没有生成任何数据,是什么原因呢?