Open yamamoto-ryuzo opened 2 weeks ago
とりあえず、「施設一覧」のエクセル1113ファイルでテスト開始
カラのエクセルシートは除外
# 最初の1行だけを読み込む
df_header = pd.read_excel(xls, sheet_name, nrows=1)
# 最初の行が空でないかチェック
if not df_header.empty and not df_header.iloc[0].isnull().all():
# 全データを読み込む
df = pd.read_excel(xls, sheet_name)
1121件中5件がGISデータととりあえず判定。。。 少なくとものこの5件はマシンリーダブルなエクセル
まずは、マシンリーダブルなエクセルとそうでないものの仕分けが必要!
最初の行に「Unnamed」がないものはマシンリーダブルの可能性があるので DATA_ファイル名 にしてみた!
116件がマシンリーダブル。。。。
こうなったら、マシンリーダブルは NON それ以外は ERR
今後は ERR_ 削減の努力!
緯度があるものは GIS_ファイル名 ないものは NON_ファイル名