Rindrics / lucifer

ネ申エクセルと戦うためのRパッケージ
GNU General Public License v3.0
3 stars 0 forks source link

えひめ H30漁業種類�別月別水揚量.xls@マサバとゴマサバ集計 をrebel()で読んだ時のNA行の挿入について #135

Closed JK-junkin closed 5 years ago

JK-junkin commented 5 years ago

15愛媛でhard code作業中、えひめ H30漁業種類�別月別水揚量.xlsマサバとゴマサバ集計シートを読んだ際にNA行が混入した。下記に読み込み時の設定(完全な整形までは行なっていない)と出力結果を示す。

res <- rebel(path = ./15愛媛/えひめ H30漁業種類�別月別水揚量.xls,
             sheet_regex = ".*\\p{Katakana}+.*",
             cluster = list(
               dir = "h",
               pos = 2,
               regex = "^年",
               offset = c(0, 0),
               ends = list(row = "2019年", col = "^マサバ.*"),
               info = list(offset = c(-1, 0), dim = c(1, 1))
             )) #,
ehime_NArows
Rindrics commented 5 years ago

クラスタによって info の offset がゆらぐ事象を確認

Rindrics commented 5 years ago

NA行混入については,ends 周りのバグかな?

Rindrics commented 5 years ago

このへんがあやしいかも https://github.com/kikirinrin/lucifer/blob/d0e36fcc51153bbbd4b0308072e816c03c544a9d/R/shapetools.R#L264