tsukurimono / stock-price-analysis

0 stars 0 forks source link

tsvファイルの中にスペースが入った場合に正しくパースできない #2

Open tsukurimono opened 3 years ago

tsukurimono commented 3 years ago

問題

項目にスペースが混在した際にsplitしたlistに空文字の要素が含まれてしまう。

コード

https://github.com/tsukurimono/stock-price-analysis/blob/018e4d55f12cee8bf2d8404910e975be8d5d677c/app/controller/cli/stock.py#L180-L181

再現データ

Input

hoge  :foofoo

output

['hoge', '', 'foo']
tsukurimono commented 3 years ago

これで直ると思う。

 syntax_split = list(filter(None, re.split(r"\s+|:", row[0]) ))
 tag_split = list(filter(None, re.split(r"\s+|,", row[1]) ))