Closed shinmura0 closed 3 years ago
ホストのEDA(train_soundscapes)でsiteが結構大事な情報かも https://www.kaggle.com/stefankahl/birdclef2021-exploring-the-data#Training-data-(Soundscapes)
具体的な場所は以下の通り
試しに、train_soundscapeに出てくる鳥の生息区域をプロットするとこんな感じ ↓SSW(ニューヨーク)
↓ COL(コロンビア) COR(コスタリカ)
結構当てになるかも https://www.kaggle.com/shinmurashinmura/train-soundscape-eda#plot-world-map
学習させる鳥の種類をsite周辺に絞れば、かなり鳥の種類を減らせるかも。 鳥の種類を絞れば、精度アップ・学習時間削減・HLの1種類当たりの数も 増やせる。
①ただし、train_soundcsapeにはCORとSSWしかないので、COLとSNEはlocationに 基づいて自分で絞り込む必要がある。さらに、CORとSSWも補完してあげないと いけない。
~~②locationとしてはSNE以外はアメリカ大陸なので、あまり絞れない場合、 思い切ってSNEを切ってしまうのも手か?SNEを切れれば、ユーラシア大陸を 切れるので、大幅削減できるはず。~~ 全てアメリカ大陸なので(緯度と経度はtest_soundscapeに書いてあった(^^;) 大幅削減できるはず。
ちなみに、現在1位のCPMPもこんなこと言っていた https://www.kaggle.com/c/birdclef-2021/discussion/230539#1264091
同じ戦略だと嬉しい
やってみたけど、ダメだった。 ホスト側もアメリカ大陸に限って、鳥の種類を絞っているっぽい。
ホストのEDA(train_soundscapes)でsiteが結構大事な情報かも https://www.kaggle.com/stefankahl/birdclef2021-exploring-the-data#Training-data-(Soundscapes)
具体的な場所は以下の通り
スペインのシエタ・ネバラアメリカのカルフォルニア)試しに、train_soundscapeに出てくる鳥の生息区域をプロットするとこんな感じ ↓SSW(ニューヨーク)
↓
COL(コロンビア)COR(コスタリカ)結構当てになるかも https://www.kaggle.com/shinmurashinmura/train-soundscape-eda#plot-world-map
学習させる鳥の種類をsite周辺に絞れば、かなり鳥の種類を減らせるかも。 鳥の種類を絞れば、精度アップ・学習時間削減・HLの1種類当たりの数も 増やせる。
①ただし、train_soundcsapeにはCORとSSWしかないので、COLとSNEはlocationに 基づいて自分で絞り込む必要がある。さらに、CORとSSWも補完してあげないと いけない。
~~②locationとしてはSNE以外はアメリカ大陸なので、あまり絞れない場合、 思い切ってSNEを切ってしまうのも手か?SNEを切れれば、ユーラシア大陸を 切れるので、大幅削減できるはず。~~ 全てアメリカ大陸なので(緯度と経度はtest_soundscapeに書いてあった(^^;) 大幅削減できるはず。
ちなみに、現在1位のCPMPもこんなこと言っていた https://www.kaggle.com/c/birdclef-2021/discussion/230539#1264091
同じ戦略だと嬉しい