nims-dpfc / rdetoolkit

MIT License
2 stars 0 forks source link

データ構造化をデータタイルごとに処理をするための情報の取得方法について #5

Open sonoh5n opened 3 months ago

sonoh5n commented 3 months ago

マルチデータタイルやエクセルインボイスの場合、RDEToolKitは以下のようにフォルダ展開をしてくれますよね。

./dataは生成しないか?

./data/inputdata
./data/raw
./data/以下略
./data/divided/0001/inputdata
./data/divided/0001/raw
./data/divided/0001/以下略
./data/divided/0002/inputdata
./data/divided/0002/raw
./data/divided/0002/以下略

上記の場合、3つのデータタイルを登録するので、3回処理を回すことになります。

このとき、ループを回したいので以下のベースフォルダのようなもののリストがあるとありがたいです。

./data
./data/divied/0001
./data/divied/0002

上記のリストをworkFoldersとした場合

for work in workFolders:
  構造化処理(work)

のように構造化処理を回したい。

今の機能だとinputdataの場所に関するリストがあって、それを使えば上記のようなパスは取れるのですが、処理対象のベースフォルダのリストがあれば繰り返し処理しやすい、という要望です。