Deep Dive into Apache Spark Apache Spark是目前最受欢迎的开源大数据处理框架,2014年2月成为Apache顶级项目, 2016年7月发布Spark 2.0, 同年12月发布Spark 2.1.0, 这个系列源码学习笔记基于最新发布的稳定版本Spark 2.1.0。 Apache Spark™ is a fast and general engine for large-scale data processing.