【実装】Data Augmentation

mitsu-h / BirdCLEF

0 stars 0 forks source link

Open kenken118 opened 2 years ago

kenken118 commented 2 years ago

Data Augmentaiton for waveform ・GaussianNoiseSNR ・PinkNoiseSNR ・VolumeControl 理由：元データの音質、音量（ノイズの大きさ）にばらつきがあるので、均等にしたい
Data Augmentation for mel spectrogram ・Time and Frequency Masking ※変更無しでよいかと

kenken118 commented 2 years ago

下記の実装のように、鳥の種類に応じて処理を分けるのが効果的な気がします。（例えば、鳴き声の小さい鳥を指定して音量を上げるなど） https://www.kaggle.com/code/shreyasajal/audio-albumentations-torchaudio-audiomentations/notebook

audiomentationsでまとめて実装した方がシンプルで良いかも（現在の関数での実装をやめて）