Open kenken118 opened 2 years ago
下記参考に、少なくとも以下の実装をしたい。 https://www.kaggle.com/code/hidehisaarai1213/rfcx-audio-data-augmentation-japanese-english/notebook
Data Augmentaiton for waveform ・GaussianNoiseSNR ・PinkNoiseSNR ・VolumeControl 理由:元データの音質、音量(ノイズの大きさ)にばらつきがあるので、均等にしたい
Data Augmentation for mel spectrogram ・Time and Frequency Masking ※変更無しでよいかと
下記の実装のように、鳥の種類に応じて処理を分けるのが効果的な気がします。 (例えば、鳴き声の小さい鳥を指定して音量を上げるなど) https://www.kaggle.com/code/shreyasajal/audio-albumentations-torchaudio-audiomentations/notebook
audiomentationsでまとめて実装した方がシンプルで良いかも(現在の関数での実装をやめて)
下記参考に、少なくとも以下の実装をしたい。 https://www.kaggle.com/code/hidehisaarai1213/rfcx-audio-data-augmentation-japanese-english/notebook
Data Augmentaiton for waveform ・GaussianNoiseSNR ・PinkNoiseSNR ・VolumeControl 理由:元データの音質、音量(ノイズの大きさ)にばらつきがあるので、均等にしたい
Data Augmentation for mel spectrogram ・Time and Frequency Masking ※変更無しでよいかと