Open xiaoxubeii opened 6 years ago
https://xiaoxubeii.github.io/articles/practice-of-spark-on-kubernetes/
Spark On Kubernetes实践 前言 众所周知,Spark是一个快速、通用的大规模数据处理平台,和Hadoop的MapReduce计算框架类似。但是相对于MapReduce,Spark凭借其可伸缩、基于内存计算等特点,以及可以直接读写Hadoop上任何格式数据的优势,使批处理更加高效,并有更低的延迟。实际上,Spark已经成为轻量级大数据快速处理的统一平台。
写的好, 各种坑都说明了一波, 我司目前也在折腾这块, 很有借鉴作用
https://xiaoxubeii.github.io/articles/practice-of-spark-on-kubernetes/
Spark On Kubernetes实践 前言 众所周知,Spark是一个快速、通用的大规模数据处理平台,和Hadoop的MapReduce计算框架类似。但是相对于MapReduce,Spark凭借其可伸缩、基于内存计算等特点,以及可以直接读写Hadoop上任何格式数据的优势,使批处理更加高效,并有更低的延迟。实际上,Spark已经成为轻量级大数据快速处理的统一平台。