yamamoto-ryuzo / TokyoOD_downloader

0 stars 0 forks source link

XLS2CSV作成開始 #13

Open yamamoto-ryuzo opened 2 weeks ago

yamamoto-ryuzo commented 2 weeks ago

緯度があるものは GIS_ファイル名 ないものは NON_ファイル名

yamamoto-ryuzo commented 2 weeks ago

とりあえず、「施設一覧」のエクセル1113ファイルでテスト開始

yamamoto-ryuzo commented 2 weeks ago

カラのエクセルシートは除外

        # 最初の1行だけを読み込む
        df_header = pd.read_excel(xls, sheet_name, nrows=1)

        # 最初の行が空でないかチェック
        if not df_header.empty and not df_header.iloc[0].isnull().all():
            # 全データを読み込む
            df = pd.read_excel(xls, sheet_name)
yamamoto-ryuzo commented 2 weeks ago

1121件中5件がGISデータととりあえず判定。。。 少なくとものこの5件はマシンリーダブルなエクセル image

まずは、マシンリーダブルなエクセルとそうでないものの仕分けが必要!

yamamoto-ryuzo commented 2 weeks ago

最初の行に「Unnamed」がないものはマシンリーダブルの可能性があるので DATA_ファイル名 にしてみた!

116件がマシンリーダブル。。。。

こうなったら、マシンリーダブルは NON それ以外は ERR

今後は ERR_ 削減の努力!