Closed yangsp5 closed 1 year ago
And I find another dirty example:
In gaokao-geography
dataset, the label E
seems wrong. This case have four options
The example is
{"passage": null, "question": "中心城区通常为城市中人口最密集的区域。下表数据显示上海、北京、广州、深圳四城市2010年中心城区人口比重及2010~2020年中心城区和中心城区以外地区人口数量的变化。\\begin{tabular}{|l|l|l|l|} \\hline 城市 & $\\begin{array}{l}2010 \\text { 年中心城 } \\\\ \\text { 区人口比重/\\% }\\end{array}$ & $\\begin{array}{l}\\text { 2010-2020 年中心城 } \\\\ \\text { 区人口变化/万人 }\\end{array}$ & $\\begin{array}{l}2010-2020 \\text { 年中心城区以 } \\\\ \\text { 外地区人口变化/万人 }\\end{array}$ \\\\ \\hline 上海 & 30.3 & -30.25 & 215.42 \\\\ \\hline 北京 & 59.7 & -72.8 & 300.9 \\\\ \\hline 广州 & 39.7 & 129.12 & 568.46 \\\\ \\hline 深圳 & 34.0 & 116.88 & 56.73 \\\\ \\hline \\end{tabular} 根据四城市人口变化特点,城市规划应该引导()", "options": ["(A)人口向中心城区再集聚", "(B)人口在中心城区以外地区集聚", "(C)中心城区核心功能疏解", "(D)人口在中心城区以外地区均衡布局"], "label": "E", "answer": null, "other": {"source": "2022年全国乙卷文综地理试题"}}
Dear @yangsp5, thank you very much for your findings. We have corrected the typo and the error in the newest commit. Please pull the latest result.
The
gaokao-english
has a dirty data.The question is
The option is:
like:
The option
B
has some dirty string.