uribo / jpndistrict

🗾 Create Japansese Administration Area Maps
http://uribo.github.io/jpndistrict
Other
22 stars 3 forks source link

市町村役場のデータが文字化けする #27

Closed Takaaki-Tsuda closed 5 years ago

Takaaki-Tsuda commented 5 years ago

お世話になります。シェープファイルをダウンロードする手間が省けてとても楽になりました。

ただ、上記の通り、市町村役場のデータ(jpn_admins)では文字化けしてしまいます。一方で、市町村境界のデータは文字化けしませんでした(jpn_pref)。おそらくエンコードの問題だと思うのですが、何とか改善できますでしょうか。

【市町村役場のデータ jpn_admins(01)】 jis_code type 1 01100 1 2 01101 1 3 01102 1

name 1 <U+008E>D<U+0096>y<U+008E>s<U+0096><U+008F><U+008A> 2 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0096><U+008F><U+008A> 3 <U+008E>D<U+0096>y<U+008E>s<U+0096>k<U+008B><U+0096><U+008F><U+008A>

address 1 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0096>k1<U+008F><U+0090><U+00BC>2 2 <U+008E>D<U+0096>y<U+008E>s<U+0092><U+0086><U+0089><U+009B><U+008B><U+0093>3<U+008F><U+0090><U+00BC>11 3 <U+008E>D<U+0096>y<U+008E>s<U+0096>k<U+008B><U+0096>k24<U+008F><U+0090><U+00BC>6-1-1

geometry 1 POINT (141.3544 43.06197) 2 POINT (141.341 43.05536) 3 POINT (141.3409 43.09069)

【市町村区域のデータ jpn_pref(01)実行】 Simple feature collection with 194 features and 4 fields geometry type: GEOMETRY dimension: XY bbox: xmin: 139.3339 ymin: 41.35158 xmax: 148.8945 ymax: 45.55692 epsg (SRID): 4326 proj4string: +proj=longlat +datum=WGS84 +no_defs

A tibble: 194 x 5

pref_code prefecture city_code city geometry

1 01 北海道 01101 札幌市 中央区~ ((141.3423 43.06692, 141.3897 43.06861, 141.369 43.06137, 141.3628 43.053~ 2 01 北海道 01102 札幌市 北区 ((141.4085 43.1839, 141.3987 43.17592, 141.4 43.17119, 141.4192 43.17194,~ 3 01 北海道 01103 札幌市 東区 ((141.4472 43.15615, 141.4555 43.12895, 141.4538 43.11992, 141.4445 43.10~
uribo commented 5 years ago

ありがとうございます。 ご使用中のOS環境等をお教えいただけますでしょうか。

sessionInfo() の実行結果でもOKです。

uribo commented 5 years ago

手元の環境での再現です。

library(jpndistrict)
#> This package provide map data is based on the Digital Map 25000
#> (Map Image) published by Geospatial Information Authority of Japan
#> (Approval No.603FY2017 information usage <http://www.gsi.go.jp>)
jpn_admins(01)
#> options:        ENCODING=cp932 
#> Reading layer `P34-14_01' from data source `/private/var/folders/12/s9y70flx4z3b67cp237s70xm0000gn/T/RtmpRui6Zl/P34-14_01_GML/P34-14_01.shp' using driver `ESRI Shapefile'
#> Simple feature collection with 373 features and 4 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706
#> epsg (SRID):    4612
#> proj4string:    +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs
#> Simple feature collection with 373 features and 4 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706
#> epsg (SRID):    4612
#> proj4string:    +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs
#> First 10 features:
#>    jis_code type             name                       address
#> 1     01100    1       札幌市役所          札幌市中央区北1条西2
#> 2     01101    1 札幌市中央区役所         札幌市中央区南3条西11
#> 3     01102    1   札幌市北区役所       札幌市北区北24条西6-1-1
#> 4     01102    2       篠路出張所       札幌市北区篠路4条7-2-40
#> 5     01103    1   札幌市東区役所       札幌市東区北11条東7-1-1
#> 6     01104    1 札幌市白石区役所      札幌市白石区本郷通3北1-1
#> 7     01105    1 札幌市豊平区役所     札幌市豊平区平岸6条10-1-1
#> 8     01106    1   札幌市南区役所     札幌市南区真駒内幸町2-2-1
#> 9     01106    2     定山渓出張所 札幌市南区定山渓温泉東4-315-4
#> 10    01107    1   札幌市西区役所        札幌市西区琴似2条7-1-1
#>                     geometry
#> 1  POINT (141.3544 43.06197)
#> 2   POINT (141.341 43.05536)
#> 3  POINT (141.3409 43.09069)
#> 4  POINT (141.3656 43.14572)
#> 5  POINT (141.3637 43.07624)
#> 6  POINT (141.4051 43.04751)
#> 7    POINT (141.38 43.03137)
#> 8     POINT (141.3535 42.99)
#> 9   POINT (141.1631 42.9639)
#> 10 POINT (141.3009 43.07435)

Created on 2019-06-14 by the reprex package (v0.3.0)

Session info ``` r devtools::session_info() #> ─ Session info ────────────────────────────────────────────────────────── #> setting value #> version R version 3.6.0 (2019-04-26) #> os macOS Mojave 10.14.5 #> system x86_64, darwin18.5.0 #> ui unknown #> language En #> collate ja_JP.UTF-8 #> ctype ja_JP.UTF-8 #> tz Asia/Tokyo #> date 2019-06-14 #> #> ─ Packages ────────────────────────────────────────────────────────────── #> package * version date lib source #> assertthat 0.2.1 2019-03-21 [1] CRAN (R 3.6.0) #> backports 1.1.4 2019-04-10 [1] CRAN (R 3.6.0) #> callr 3.2.0 2019-03-15 [1] CRAN (R 3.6.0) #> class 7.3-15 2019-01-01 [2] CRAN (R 3.6.0) #> classInt 0.3-3 2019-04-26 [1] CRAN (R 3.6.0) #> cli 1.1.0 2019-03-19 [1] CRAN (R 3.6.0) #> crayon 1.3.4 2017-09-16 [1] CRAN (R 3.6.0) #> crosstalk 1.0.0 2016-12-21 [1] CRAN (R 3.6.0) #> DBI 1.0.0 2018-05-02 [1] CRAN (R 3.6.0) #> desc 1.2.0 2018-05-01 [1] CRAN (R 3.6.0) #> devtools 2.0.2 2019-04-08 [1] CRAN (R 3.6.0) #> digest 0.6.19 2019-05-20 [1] CRAN (R 3.6.0) #> dplyr 0.8.1 2019-05-14 [1] CRAN (R 3.6.0) #> e1071 1.7-2 2019-06-05 [1] CRAN (R 3.6.0) #> evaluate 0.14 2019-05-28 [1] CRAN (R 3.6.0) #> fs 1.3.1 2019-05-06 [1] CRAN (R 3.6.0) #> glue 1.3.1 2019-03-12 [1] CRAN (R 3.6.0) #> highr 0.8 2019-03-20 [1] CRAN (R 3.6.0) #> htmltools 0.3.6 2017-04-28 [1] CRAN (R 3.6.0) #> htmlwidgets 1.3 2018-09-30 [1] CRAN (R 3.6.0) #> httpuv 1.5.1 2019-04-05 [1] CRAN (R 3.6.0) #> jpmesh 1.1.3 2019-05-09 [1] CRAN (R 3.6.0) #> jpndistrict * 0.3.4 2019-05-23 [1] CRAN (R 3.6.0) #> KernSmooth 2.23-15 2015-06-29 [2] CRAN (R 3.6.0) #> knitr 1.23 2019-05-18 [1] CRAN (R 3.6.0) #> later 0.8.0 2019-02-11 [1] CRAN (R 3.6.0) #> leaflet 2.0.2 2018-08-27 [1] CRAN (R 3.6.0) #> magrittr 1.5 2014-11-22 [1] CRAN (R 3.6.0) #> memoise 1.1.0 2017-04-21 [1] CRAN (R 3.6.0) #> mime 0.7 2019-06-11 [1] CRAN (R 3.6.0) #> miniUI 0.1.1.1 2018-05-18 [1] CRAN (R 3.6.0) #> pillar 1.4.1 2019-05-28 [1] CRAN (R 3.6.0) #> pkgbuild 1.0.3 2019-03-20 [1] CRAN (R 3.6.0) #> pkgconfig 2.0.2 2018-08-16 [1] CRAN (R 3.6.0) #> pkgload 1.0.2 2018-10-29 [1] CRAN (R 3.6.0) #> prettyunits 1.0.2 2015-07-13 [1] CRAN (R 3.6.0) #> processx 3.3.1 2019-05-08 [1] CRAN (R 3.6.0) #> promises 1.0.1 2018-04-13 [1] CRAN (R 3.6.0) #> ps 1.3.0 2018-12-21 [1] CRAN (R 3.6.0) #> purrr 0.3.2 2019-03-15 [1] CRAN (R 3.6.0) #> R6 2.4.0 2019-02-14 [1] CRAN (R 3.6.0) #> Rcpp 1.0.1 2019-03-17 [1] CRAN (R 3.6.0) #> remotes 2.0.4 2019-04-10 [1] CRAN (R 3.6.0) #> rlang 0.3.99.9003 2019-06-13 [1] Github (r-lib/rlang@35b11ca) #> rmarkdown 1.13 2019-05-22 [1] CRAN (R 3.6.0) #> rprojroot 1.3-2 2018-01-03 [1] CRAN (R 3.6.0) #> sessioninfo 1.1.1 2018-11-05 [1] CRAN (R 3.6.0) #> sf 0.7-4 2019-04-25 [1] CRAN (R 3.6.0) #> shiny 1.3.2 2019-04-22 [1] CRAN (R 3.6.0) #> stringi 1.4.3 2019-03-12 [1] CRAN (R 3.6.0) #> stringr 1.4.0 2019-02-10 [1] CRAN (R 3.6.0) #> testthat 2.1.1 2019-04-23 [1] CRAN (R 3.6.0) #> tibble 2.1.3 2019-06-06 [1] CRAN (R 3.6.0) #> tidyr 0.8.3.9000 2019-06-08 [1] Github (tidyverse/tidyr@7a2b843) #> tidyselect 0.2.5 2018-10-11 [1] CRAN (R 3.6.0) #> units 0.6-3 2019-05-03 [1] CRAN (R 3.6.0) #> usethis 1.5.0 2019-04-07 [1] CRAN (R 3.6.0) #> vctrs 0.1.0.9004 2019-06-13 [1] Github (r-lib/vctrs@ee5ed26) #> withr 2.1.2 2018-03-15 [1] CRAN (R 3.6.0) #> xfun 0.7 2019-05-14 [1] CRAN (R 3.6.0) #> xtable 1.8-4 2019-04-21 [1] CRAN (R 3.6.0) #> yaml 2.2.0 2018-07-25 [1] CRAN (R 3.6.0) #> zeallot 0.1.0 2018-01-28 [1] CRAN (R 3.6.0) #> #> [1] /usr/local/lib/R/3.6/site-library #> [2] /usr/local/Cellar/r/3.6.0_2/lib/R/library ```
Takaaki-Tsuda commented 5 years ago

ご返信くださり、ありがとうございます。 sessionInfo()の結果は、以下の通りです。 エンコードのデフォルトはcp932のようですが、なぜかjpn_admins()ではUTF8で読まれています。 宜しくお願いします。

R version 3.6.0 (2019-04-26) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 10 x64 (build 17763) Matrix products: default locale: [1] LC_COLLATE=Japanese_Japan.932 LC_CTYPE=Japanese_Japan.932 [3] LC_MONETARY=Japanese_Japan.932 LC_NUMERIC=C [5] LC_TIME=Japanese_Japan.932 attached base packages: [1] stats graphics grDevices utils datasets methods base other attached packages: [1] jpndistrict_0.3.4 loaded via a namespace (and not attached): [1] Rcpp_1.0.1 magrittr_1.5 units_0.6-3 [4] tidyselect_0.2.5 xtable_1.8-4 R6_2.4.0 [7] rlang_0.3.4 dplyr_0.8.1 tools_3.6.0 [10] grid_3.6.0 KernSmooth_2.23-15 e1071_1.7-2 [13] DBI_1.0.0 miniUI_0.1.1.1 class_7.3-15 [16] htmltools_0.3.6 crosstalk_1.0.0 leaflet_2.0.2 [19] assertthat_0.2.1 digest_0.6.19 tibble_2.1.3 [22] sf_0.7-4 crayon_1.3.4 shiny_1.3.2 [25] tidyr_0.8.3 purrr_0.3.2 later_0.8.0 [28] htmlwidgets_1.3 promises_1.0.1 glue_1.3.1 [31] mime_0.7 jpmesh_1.1.3 compiler_3.6.0 [34] pillar_1.4.1 classInt_0.3-3 httpuv_1.5.1 [37] pkgconfig_2.0.2

2019年6月14日(金) 20:08 Shinya Uryu notifications@github.com:

手元の環境での再現です。

library(jpndistrict)

> This package provide map data is based on the Digital Map 25000

> (Map Image) published by Geospatial Information Authority of Japan

> (Approval No.603FY2017 information usage http://www.gsi.go.jp)

jpn_admins(01)

> options: ENCODING=cp932

> Reading layer P34-14_01' from data source/private/var/folders/12/s9y70flx4z3b67cp237s70xm0000gn/T/RtmpRui6Zl/P34-14_01_GML/P34-14_01.shp' using driver `ESRI Shapefile'

> Simple feature collection with 373 features and 4 fields

> geometry type: POINT

> dimension: XY

> bbox: xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706

> epsg (SRID): 4612

> proj4string: +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs

> Simple feature collection with 373 features and 4 fields

> geometry type: POINT

> dimension: XY

> bbox: xmin: 139.4468 ymin: 41.416 xmax: 145.7543 ymax: 45.48706

> epsg (SRID): 4612

> proj4string: +proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs

> First 10 features:

> jis_code type name address

> 1 01100 1 札幌市役所 札幌市中央区北1条西2

> 2 01101 1 札幌市中央区役所 札幌市中央区南3条西11

> 3 01102 1 札幌市北区役所 札幌市北区北24条西6-1-1

> 4 01102 2 篠路出張所 札幌市北区篠路4条7-2-40

> 5 01103 1 札幌市東区役所 札幌市東区北11条東7-1-1

> 6 01104 1 札幌市白石区役所 札幌市白石区本郷通3北1-1

> 7 01105 1 札幌市豊平区役所 札幌市豊平区平岸6条10-1-1

> 8 01106 1 札幌市南区役所 札幌市南区真駒内幸町2-2-1

> 9 01106 2 定山渓出張所 札幌市南区定山渓温泉東4-315-4

> 10 01107 1 札幌市西区役所 札幌市西区琴似2条7-1-1

> geometry

> 1 POINT (141.3544 43.06197)

> 2 POINT (141.341 43.05536)

> 3 POINT (141.3409 43.09069)

> 4 POINT (141.3656 43.14572)

> 5 POINT (141.3637 43.07624)

> 6 POINT (141.4051 43.04751)

> 7 POINT (141.38 43.03137)

> 8 POINT (141.3535 42.99)

> 9 POINT (141.1631 42.9639)

> 10 POINT (141.3009 43.07435)

Created on 2019-06-14 by the reprex package https://reprex.tidyverse.org (v0.3.0) Session info

devtools::session_info()

> ─ Session info ──────────────────────────────────────────────────────────

> setting value

> version R version 3.6.0 (2019-04-26)

> os macOS Mojave 10.14.5

> system x86_64, darwin18.5.0

> ui unknown

> language En

> collate ja_JP.UTF-8

> ctype ja_JP.UTF-8

> tz Asia/Tokyo

> date 2019-06-14

>

> ─ Packages ──────────────────────────────────────────────────────────────

> package * version date lib source

> assertthat 0.2.1 2019-03-21 [1] CRAN (R 3.6.0)

> backports 1.1.4 2019-04-10 [1] CRAN (R 3.6.0)

> callr 3.2.0 2019-03-15 [1] CRAN (R 3.6.0)

> class 7.3-15 2019-01-01 [2] CRAN (R 3.6.0)

> classInt 0.3-3 2019-04-26 [1] CRAN (R 3.6.0)

> cli 1.1.0 2019-03-19 [1] CRAN (R 3.6.0)

> crayon 1.3.4 2017-09-16 [1] CRAN (R 3.6.0)

> crosstalk 1.0.0 2016-12-21 [1] CRAN (R 3.6.0)

> DBI 1.0.0 2018-05-02 [1] CRAN (R 3.6.0)

> desc 1.2.0 2018-05-01 [1] CRAN (R 3.6.0)

> devtools 2.0.2 2019-04-08 [1] CRAN (R 3.6.0)

> digest 0.6.19 2019-05-20 [1] CRAN (R 3.6.0)

> dplyr 0.8.1 2019-05-14 [1] CRAN (R 3.6.0)

> e1071 1.7-2 2019-06-05 [1] CRAN (R 3.6.0)

> evaluate 0.14 2019-05-28 [1] CRAN (R 3.6.0)

> fs 1.3.1 2019-05-06 [1] CRAN (R 3.6.0)

> glue 1.3.1 2019-03-12 [1] CRAN (R 3.6.0)

> highr 0.8 2019-03-20 [1] CRAN (R 3.6.0)

> htmltools 0.3.6 2017-04-28 [1] CRAN (R 3.6.0)

> htmlwidgets 1.3 2018-09-30 [1] CRAN (R 3.6.0)

> httpuv 1.5.1 2019-04-05 [1] CRAN (R 3.6.0)

> jpmesh 1.1.3 2019-05-09 [1] CRAN (R 3.6.0)

> jpndistrict * 0.3.4 2019-05-23 [1] CRAN (R 3.6.0)

> KernSmooth 2.23-15 2015-06-29 [2] CRAN (R 3.6.0)

> knitr 1.23 2019-05-18 [1] CRAN (R 3.6.0)

> later 0.8.0 2019-02-11 [1] CRAN (R 3.6.0)

> leaflet 2.0.2 2018-08-27 [1] CRAN (R 3.6.0)

> magrittr 1.5 2014-11-22 [1] CRAN (R 3.6.0)

> memoise 1.1.0 2017-04-21 [1] CRAN (R 3.6.0)

> mime 0.7 2019-06-11 [1] CRAN (R 3.6.0)

> miniUI 0.1.1.1 2018-05-18 [1] CRAN (R 3.6.0)

> pillar 1.4.1 2019-05-28 [1] CRAN (R 3.6.0)

> pkgbuild 1.0.3 2019-03-20 [1] CRAN (R 3.6.0)

> pkgconfig 2.0.2 2018-08-16 [1] CRAN (R 3.6.0)

> pkgload 1.0.2 2018-10-29 [1] CRAN (R 3.6.0)

> prettyunits 1.0.2 2015-07-13 [1] CRAN (R 3.6.0)

> processx 3.3.1 2019-05-08 [1] CRAN (R 3.6.0)

> promises 1.0.1 2018-04-13 [1] CRAN (R 3.6.0)

> ps 1.3.0 2018-12-21 [1] CRAN (R 3.6.0)

> purrr 0.3.2 2019-03-15 [1] CRAN (R 3.6.0)

> R6 2.4.0 2019-02-14 [1] CRAN (R 3.6.0)

> Rcpp 1.0.1 2019-03-17 [1] CRAN (R 3.6.0)

> remotes 2.0.4 2019-04-10 [1] CRAN (R 3.6.0)

> rlang 0.3.99.9003 2019-06-13 [1] Github (r-lib/rlang@35b11ca)

> rmarkdown 1.13 2019-05-22 [1] CRAN (R 3.6.0)

> rprojroot 1.3-2 2018-01-03 [1] CRAN (R 3.6.0)

> sessioninfo 1.1.1 2018-11-05 [1] CRAN (R 3.6.0)

> sf 0.7-4 2019-04-25 [1] CRAN (R 3.6.0)

> shiny 1.3.2 2019-04-22 [1] CRAN (R 3.6.0)

> stringi 1.4.3 2019-03-12 [1] CRAN (R 3.6.0)

> stringr 1.4.0 2019-02-10 [1] CRAN (R 3.6.0)

> testthat 2.1.1 2019-04-23 [1] CRAN (R 3.6.0)

> tibble 2.1.3 2019-06-06 [1] CRAN (R 3.6.0)

> tidyr 0.8.3.9000 2019-06-08 [1] Github (tidyverse/tidyr@7a2b843)

> tidyselect 0.2.5 2018-10-11 [1] CRAN (R 3.6.0)

> units 0.6-3 2019-05-03 [1] CRAN (R 3.6.0)

> usethis 1.5.0 2019-04-07 [1] CRAN (R 3.6.0)

> vctrs 0.1.0.9004 2019-06-13 [1] Github (r-lib/vctrs@ee5ed26)

> withr 2.1.2 2018-03-15 [1] CRAN (R 3.6.0)

> xfun 0.7 2019-05-14 [1] CRAN (R 3.6.0)

> xtable 1.8-4 2019-04-21 [1] CRAN (R 3.6.0)

> yaml 2.2.0 2018-07-25 [1] CRAN (R 3.6.0)

> zeallot 0.1.0 2018-01-28 [1] CRAN (R 3.6.0)

>

> [1] /usr/local/lib/R/3.6/site-library

> [2] /usr/local/Cellar/r/3.6.0_2/lib/R/library

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/uribo/jpndistrict/issues/27?email_source=notifications&email_token=ALZBLSKV7IHBH5YCHUDO7ITP2N32ZA5CNFSM4HYFJONKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGODXWPIOI#issuecomment-502068281, or mute the thread https://github.com/notifications/unsubscribe-auth/ALZBLSIAUJRNK3BGEJKIAEDP2N32ZANCNFSM4HYFJONA .

uribo commented 5 years ago

1cd6007 こちらのコミットで対応してみましたがご確認いただけますでしょうか。

デフォルトのエンコードが市町村役場のデータ、行政区域データで異なっているようでした。 市町村役場のデータの方ではエンコードがcp932、行政区域データではUTF8になっているようで、その部分を修正しました。

Takaaki-Tsuda commented 5 years ago

お世話になります。 githubからインストールして試しました。無事文字化けせずに読み込むことができました。 ご対応くださり、ありがとうございました。

2019年6月17日(月) 13:19 Shinya Uryu notifications@github.com:

1cd6007 https://github.com/uribo/jpndistrict/commit/1cd600701af3915a64dd61c2d0452a76c90d0bd6 こちらのコミットで対応してみましたがご確認いただけますでしょうか。

デフォルトのエンコードが市町村役場のデータ、行政区域データで異なっているようでした。 市町村役場のデータの方ではエンコードがcp932、行政区域データではUTF8になっているようで、その部分を修正しました。

— You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub https://github.com/uribo/jpndistrict/issues/27?email_source=notifications&email_token=ALZBLSJL7UOHEGY4A2B2Z23P24GFDA5CNFSM4HYFJONKYY3PNVWWK3TUL52HS4DFVREXG43VMVBW63LNMVXHJKTDN5WW2ZLOORPWSZGODXZ7Y7A#issuecomment-502529148, or mute the thread https://github.com/notifications/unsubscribe-auth/ALZBLSKNYMVROIOQKK2O2BLP24GFDANCNFSM4HYFJONA .

uribo commented 5 years ago

ご確認いただき、ありがとうございました。 お手数おかけしました。