Open kogaki opened 5 years ago
singing voice detectionタスクにおいて、様々な入力音声のDataAugmentationを試した報告
Dropoutやgaussian noise付加はエラー率を大きくしてしまう。
Pitch shiftが効く
mixingはうまく行かなかった
test-timeにもpitch shiftを行って、その結果をaverageすると性能が上がった
最終的にpitch shift +-30%範囲、time stretch +-30%範囲、frequency filter +-10%を行ったもの(combined)が最も性能向上した
さらに、test-timeにもpitch shift augmentationをして、その結果を平均取ることで性能向上した
singing voice detectionタスクにおいて、様々な入力音声のDataAugmentationを試した報告
論文本体・著者
解きたい問題
新規性
実装
実験・議論
Dropoutやgaussian noise付加はエラー率を大きくしてしまう。
Pitch shiftが効く
mixingはうまく行かなかった
test-timeにもpitch shiftを行って、その結果をaverageすると性能が上がった
最終的にpitch shift +-30%範囲、time stretch +-30%範囲、frequency filter +-10%を行ったもの(combined)が最も性能向上した
さらに、test-timeにもpitch shift augmentationをして、その結果を平均取ることで性能向上した
読んだ中での不明点などの感想
関連論文