trtd56 / BirdCLEF

1 stars 0 forks source link

生息区域で鳥を絞る #23

Closed shinmura0 closed 3 years ago

shinmura0 commented 3 years ago

ホストのEDA(train_soundscapes)でsiteが結構大事な情報かも https://www.kaggle.com/stefankahl/birdclef2021-exploring-the-data#Training-data-(Soundscapes)

具体的な場所は以下の通り

試しに、train_soundscapeに出てくる鳥の生息区域をプロットするとこんな感じ ↓SSW(ニューヨーク) image

COL(コロンビア) COR(コスタリカ) image

結構当てになるかも https://www.kaggle.com/shinmurashinmura/train-soundscape-eda#plot-world-map

学習させる鳥の種類をsite周辺に絞れば、かなり鳥の種類を減らせるかも。 鳥の種類を絞れば、精度アップ・学習時間削減・HLの1種類当たりの数も 増やせる。

①ただし、train_soundcsapeにはCORとSSWしかないので、COLとSNEはlocationに 基づいて自分で絞り込む必要がある。さらに、CORとSSWも補完してあげないと いけない。

~~②locationとしてはSNE以外はアメリカ大陸なので、あまり絞れない場合、 思い切ってSNEを切ってしまうのも手か?SNEを切れれば、ユーラシア大陸を 切れるので、大幅削減できるはず。~~ 全てアメリカ大陸なので(緯度と経度はtest_soundscapeに書いてあった(^^;) 大幅削減できるはず。

ちなみに、現在1位のCPMPもこんなこと言っていた https://www.kaggle.com/c/birdclef-2021/discussion/230539#1264091

同じ戦略だと嬉しい

shinmura0 commented 3 years ago

やってみたけど、ダメだった。 ホスト側もアメリカ大陸に限って、鳥の種類を絞っているっぽい。