mitsu-h / BirdCLEF

0 stars 0 forks source link

【実装】Data Augmentation #11

Open kenken118 opened 2 years ago

kenken118 commented 2 years ago

下記参考に、少なくとも以下の実装をしたい。 https://www.kaggle.com/code/hidehisaarai1213/rfcx-audio-data-augmentation-japanese-english/notebook

  1. Data Augmentaiton for waveform ・GaussianNoiseSNR ・PinkNoiseSNR ・VolumeControl 理由:元データの音質、音量(ノイズの大きさ)にばらつきがあるので、均等にしたい

  2. Data Augmentation for mel spectrogram ・Time and Frequency Masking ※変更無しでよいかと

kenken118 commented 2 years ago

下記の実装のように、鳥の種類に応じて処理を分けるのが効果的な気がします。 (例えば、鳴き声の小さい鳥を指定して音量を上げるなど) https://www.kaggle.com/code/shreyasajal/audio-albumentations-torchaudio-audiomentations/notebook

audiomentationsでまとめて実装した方がシンプルで良いかも(現在の関数での実装をやめて)