inspursoft / board

The "Board" product is a container service platform based on docker + kubernetes, provide cloud solutions for Inspur software group.
MIT License
13 stars 21 forks source link

关于board的token过快失效的问题 #1765

Open 110gogo opened 3 years ago

110gogo commented 3 years ago

经过观察,之前出现board的token很快失效实际可能与board安装目录的prometheus.yml配置的scrape_timeout参数有关。 board宿主机的根目录只有20G,有个挂载的data目录有2T。Board生成的日志放在了根目录下,而Prometheus的日志一天会产生几个G,所有没有多久board宿主机根目录就满了,进而导致在宿主机上无法正常执行命令,需要定期清理Prometheus产生的日志。在将board安装目录的prometheus.yml配置的scrape_timeout参数由3600s调整为10s后,Prometheus不再产生大量日志,但是此时出现了token过快失效的问题,之后将scrape_timeout参数改回为3600s,问题不再出现。 同时,近期Board页面出现500错误,监控页面无法正常显示,应该和Prometheus的问题相关。 所有,需要解决以下相关问题: 1.需要将board日志输出到data目录下,解决根目录空间不足的问题; 2.需要查清楚Prometheus产生大量日志的原因,以及board页面出现500错误,监控页面无法正常显示的原因; 3.需要查清楚token与其他参数的关系,解决会过快失效的问题。

luotian-github commented 3 years ago

board.cfg里可以配置token过期时长,为什么prometheus会影响token过期,请张虎先看看 @wknet123

tmon546596046 commented 3 years ago

@110gogo 有没有环境可以看

tmon546596046 commented 3 years ago

经沟通,现场时内网环境,而且已经确认修复了prometheus后,问题仍然存在。应该是ui,apiserver、tokenserver之间的token问题。