CutieDeng / Java2Pro

2 stars 0 forks source link

对数据表格标题翻译的修正意见 #1

Open CutieDeng opened 2 years ago

CutieDeng commented 2 years ago

对数据表格标题翻译的修正意见


补充:

CutieDeng commented 2 years ago

追增有效信息列

将所有的信息分成两部分,一部分描述为「原始信息」,另一部分描述为「附加信息」。条件:原始信息能够自动地推导出附加信息,即——在接下来具体的实现中,不会实际存储附加信息,以节约存储的磁盘空间和避免信息不一致错误。

ChristinaLJC commented 2 years ago

smoothed关键词仍待解决,目前的理解是“降噪”

CutieDeng commented 2 years ago

无法正常显示可以点击Data atom model v1125.pdf进行阅读。

Data atom model v1125

This modification is modified at 22:44, Nov. 25, 2021.

Geography with country

[raw information] Some ISO code starting with 'OWID' such as 'OWID_NAM' is the summary of the information of a continent. It stored the position information in col 'location' rather than 'continent'.

Time Information

Country Information

Epidemic Information

Graph Information

ChristinaLJC commented 2 years ago

已经仔细阅读了你目前上传的整理数据的代码。现提出两点问题:

  1. 用Scanner读入的效率如何?如果换成bufferedReader,效率会不会更高?
  2. 希望可以在重要的代码前面加上注释,以便后续理解,譬如:compareIndex方法是将对应index的列按照国家分类?
CutieDeng commented 2 years ago

收到你的询问,现给出回答:

  1. Scanner 本身带有相对友好的预处理功能,效率偏低;在需要效率的情况下,建议改成 BufferedReader.
  2. 收到,未来的代码我会在必要的、容易引起困惑的地方加上注释。

顺便补充接下来对数据处理的工作: