orangesignal / orangesignal-csv

CSV (comma-separated values) read and write library for Java.
http://orangesignal.github.io/orangesignal-csv
Apache License 2.0
43 stars 22 forks source link

ken_all.csv support #21

Closed orangesignal closed 10 years ago

orangesignal commented 10 years ago

確かこのライブラリを作り始めた時にサンプルとして使っていた気がするので大丈夫な気がするけど、ken_all.csv と戦える子が良いようなのでまずは確認してみてる

orangesignal commented 10 years ago

LHA形式であることやシフトJIS、半角カタカナなど読込み自体には全く問題ないことを確認。 世間で問題になっているのは上記を含め複数行にまたがるデータがあることだろうと推測。

orangesignal commented 10 years ago

公式 - 郵便番号データファイルの形式等 http://www.post.japanpost.jp/zipcode/dl/readme.html

FYI http://www.f3.dion.ne.jp/~element/msaccess/AcTipsKenAllCsv.html

orangesignal commented 10 years ago

これ以上掘っても仕方がないので一旦ペンディング

orangesignal commented 10 years ago

perl などで ken_all を扱えるのがあった気がするので

であれば移植するのも良いかも。いずれにしろこのライブラリの基本範囲を超える領域の話な気がする。 やるとしてもアドオンや付録的な提供物とするのが適当

orangesignal commented 10 years ago

FYI http://d.hatena.ne.jp/dayflower/20100929/1285744153

いわゆる ken_all.csv を (必要フィールドだけ) そのままデータベースにつっこむなんてのは (わかってやってる場合はともかく) やってはいけない

同感なのでのーさぽで