Open frank-zsy opened 1 year ago
随着与游兰老师团队数据的融合,计划进一步增强实验室对于 GitHub 开发者账号的信息采集与地址位置解析。
这个 Issue 会记录一下目前的方案,也方便其他同学了解目前的情况。
目前这部分的采集解析脚本在 OpenDigger 项目中统一维护,由定时任务执行。
根据目前的代码,GitHub 用户数据采集基本流程和策略如下:
根据目前的代码,地理位置解析的基本流程和策略为:
根据 11 月份更新的 30 万+ 用户的数据,目前包含的其他社交平台的账号数量为:
上面这些平台时可以后续采集和关联分析的。
关于地理位置解析部分我有两个疑问:
@PureNatural
随着与游兰老师团队数据的融合,计划进一步增强实验室对于 GitHub 开发者账号的信息采集与地址位置解析。
这个 Issue 会记录一下目前的方案,也方便其他同学了解目前的情况。
目前这部分的采集解析脚本在 OpenDigger 项目中统一维护,由定时任务执行。
用户数据更新
根据目前的代码,GitHub 用户数据采集基本流程和策略如下:
地址位置解析
根据目前的代码,地理位置解析的基本流程和策略为: