Closed will-ww closed 9 months ago
机器人事件类型分析修改如下:其中图中的数字表示与2022年的事件数量的差值,纵轴表示与2020年事件数量的百分比差值。
2、机器人事件类型分析
这幅图表展示了2022年与2023年间GitHub各事件类型的数量变化及其增长率。通过对比这两年的数据,我们可以洞察机器人账号在开发流程中的使用趋势:
补一张 OpenRank 加权过的 2023 中国开发者经纬度分布图
本周年报会议上有老师指出,绘制地图会存在地图审阅的问题,请问一下本小节地图的图源是什么呢~ @frank-zsy @lhbvvvvv
另外, 请问@frank-zsy 学长这张加权图是最终版本吗,可能需要麻烦 @bifenglin 把这张图加进开发者洞察的部分~
补一张 OpenRank 加权过的 2023 中国开发者经纬度分布图
本周年报会议上有老师指出,绘制地图会存在地图审阅的问题,请问一下本小节地图的图源是什么呢~ @frank-zsy @lhbvvvvv
另外, 请问@frank-zsy 学长这张加权图是最终版本吗,可能需要麻烦 @bifenglin 把这张图加进开发者洞察的部分~
补一张 OpenRank 加权过的 2023 中国开发者经纬度分布图
地图是用echarts画的
@lhbvvvvv 鸿斌,要看下敏感地区的数据源是否正确~ 下面是一个例子:
两张热力图是用dataease画的所以不存在敏感地区的问题,数据是我自己处理完后放上去的。世界经纬度的散点分布图只用到了经纬度数据没有用到其他,中国地区的经纬度分布是frank用openrank加权后显示的,不出意外地理方面的信息也只用到经纬度,我看到几个地区都是有散点分布的。
地理散点图的模版是用的echarts,地图显示应该是没问题的。之前的热力图南海地区没截全,更改后的是完整的。
《2023 中国开源年度报告》的已正式发布~🎉
根据目前的报告内容,可以做些分析与评价:
7、开发者洞察
开发者是开源生态与社区的核心组成,可以将开发者分为探索者、参与者、开发者和维护者四个角色:
7.1 开发者类型分析
TODO
7.2 开发者工作时间分布
1、GitHub 全域开发者工作时间分布
统计 GitHub 全域开发者工作时间,可以看出 GitHub 开发者工作时长分布在 6 时到 21 时更普遍,12 点更为集中,可能是受到定时任务的影响,周六、周日相对更不活跃。
2、Gitee 全域开发者工作时间分布
TODO
3、除去机器人的全域开发者时间分布
TODO
7.3 中国开源项目 OpenRank Top 10 开发者时间分布
7.4 开发者的地区分布
1、全球开发者经纬度分布
通过采样 23 万个 GitHub 活跃用户的经纬度数据,可视化 GitHub 用户的地理位置分布。
在人口数量众多、且互联网发展较快的地区,例如中国沿海地区、欧洲地区、美国、印度、巴西东南沿海地区有着最为密集的 GitHub 用户分布,在其他居住人口少或者互联网较不发达的地区则相对稀疏。
2、全球开发者地区分布
对 130 万个标注了国家信息的 GitHub 活跃用户的国家/地区数据进行分析。
可以发现美国的人数最多为 23.7 万,中国、印度和巴西则紧随其后,其他拥有一定人口数量和经济水平的国家例如加拿大、澳大利亚以及一些欧洲国家也拥有着较多的用户。
3、中国开发者地区分布
对 12.6 万个标注了中国一级地理行政区的活跃用户数据进行分析。
可以发现北京拥有着国内最多的用户,其次是上海、广州和浙江。中国的大部分活跃用户都在东部沿海地区,中部的一些省份例如陕西、湖南、湖北也有拥有不少的活跃用户,值得注意的是四川是除了沿海地区以外拥有最多活跃用户的省份。
7.5 机器人洞察
机器人(bot)自动化是开源协作平台中的重要贡献力量,本部分分析了 2023 年全年近 6 亿条仓库事件,涉及 770 万开源仓库,以及 1200 多个机器人账号。
1、机器人活跃数据分析
分析 2015 年至 2023 年的机器人活动数据,部分观察如下:
2、机器人事件类型分析
这幅图明显不可用,首先需要解释机器人类型背景,然后用简单直观的可视化表达。
3、机器人工作时间分布
类似开发者工作时间分布,可以对机器人的工作时间数据进行分析。
可以得到如下洞察: