hamtaryo-san / probspace_taxi

2023f/服部研分析コンペチームのレポジトリです!!メダル取るぞ~~~
0 stars 0 forks source link

【🧪Experiment】天気データの中身について #15

Open hamtaryo-san opened 9 months ago

hamtaryo-san commented 9 months ago

概要

天気データcsvの中身のぞいてみて、その詳細とマージ方針考えてみたので貼っておきます!質問あったらください!

天気データマージ方針 1.レポートタイプごとに分割 I.FM-12 ・三時間おきのデータ ・欠損が多いカラムは落とす ・HourlyAltimeterSetting ・HourlyPrecipitation ・HourlyPresentWeatherType ・HourlySkyConditions ・HourlyWindGustSpeed ・REMはよくわからん(いろんな情報が入ってるが、抜き出し方がわからないので触りたくない)ので落とす II.FM-15 ・一時間おきのデータ、大本命 ・欠損が多いカラムは落とす ・HourlyPresentWeatherType ・HourlyWindGustSpeed ・REMもよくわからんので落とす ・HourlySkyConditionsちょっと処理むずそうなのでいったん省く ・HourlyPressureChange,HourlyPressureTendencyは、前のタイムスタンプの部分を埋める形でよさそう III.FM-16 ・天気に大きな変化があった時(ポジティブもネガティブも)に報告されるデータSPECI ・ちょっと処理むずそうなのでいったん飛ばす ・うまく取り込めたらかなりうまくいきそう IV.SY-MT ・祝日とかイベント日とか限定の報告データっぽい ・ただ、ちょっとこのデータの存在理由がよくわからないので飛ばす