https://www.rpubs.com/Maxine/american_school_diversity
选题想法: Washington Post 的报道,数据量在 3 w 行以内,有天然的地理层级关系,适合分析结构。
涉及数据:
2017 年和 1995 年的学校多样性数据,经过 Washington Post 的预处理,可以在 https://github.com/WPMedia/student_integration_analysis/blob/master/output%20data/student_diversity_integration_output.csv 找到
美国各州、部分学区的形状文件,通过 tigris
和 tidycensus
获得
2017 年美国社区调查数据,通过 tidycensus
获得
# 种族人口分布
tidycensus::get_acs("state", variables = c(
white = "C02003_003",
black = "C02003_004",
asian = "C02003_006",
aian = "C02003_005",
other = "C02003_008",
multi = "C02003_009")) %>%
readr::write_rds("income.rds")
# 工资中位数
tidycensus::get_acs("state", variables = c(
"income" = "B19013_001",
"white_income" = "B19013H_001",
"black_income" = "B19013B_001",
"aian_income" = "B19013C_001",
"asian_income" = "B19013D_001",
"other_income" = "B19013F_001",
"multi_income" = "B19013G_001",
"hispanic_income" = "B19013I_001"
)) %>%
readr::write_rds("res_seg.rds")
视觉呈现的选择:
内容框架:
文件说明
student_integration_output.csv
Washington Post 提供的 1995 年和 2017 年美国各校区的多样性数据 region.csv
美国各州所属的地理大区,用于山脊图least_diverse_shape.rds
和 most_diverse_shape.rds
, 最多样和最不多样的 5 个州的形状文件,可用 readr::read_rds()
读取 ggtern.R
三角坐标图代码income.rds
2017 年 ACS 中各州工资中位数res_seg.rds
2017 年 ACS 中各州种族人口分布