- 资源介绍
资源名称:Spark大数据处理技术 完整pdf
第1章 Spark系统概述 1
1.1 大数据处理框架 1
1.2 Spark大数据处理框架 3
1.2.1 RDD表达能力 3
1.2.2 Spark子系统 4
1.3 小结 7
第2章 Spark RDD及编程接口 9
2.1 Spark程序“Hello World” 9
2.2 Spark RDD 12
2.2.1 RDD分区(partitions) 13
2.2.2 RDD优先位置(preferredLocations) 13
2.2.3 RDD依赖关系(dependencies) 15
2.2.4 RDD分区计算(compute) 19
2.2.5 RDD分区函数(partitioner) 20
2.3 创建操作 23
2.3.1 集合创建操作 23
2.3.2 存储创建操作 23
2.4 转换操作 26
2.4.1 RDD基本转换操作 26
2.4.2 键值RDD转换操作 35
2.4.3 再论RDD依赖关系 43
2.5 控制操作(control operation) 46
2.6 行动操作(action operation) 47
2.6.1 集合标量行动操作 47
2.6.2 存储行动操作 52
2.7 小结 56
第3章 Spark运行模式及原理 57
3.1 Spark运行模式概述 57
3.1.1 Spark运行模式列表 57
3.1.2 Spark基本工作流程 58
3.1.3 相关基本类 59
3.2 Local模式 62
3.2.1 部署及程序运行 62
3.2.2 内部实现原理 63
3.3 Standalone模式 64
3.3.1 部署及程序运行 64
3.3.2 内部实现原理 67
3.4 Local cluster模式 68
3.4.1 部署及程序运行 68
资源截图:
猜你喜欢
-
MATLAB实用教程(第二版) 中文
2020-07-21 -
细细品味Hadoop-Hadoop集群文章精华集锦
2020-07-21 -
zookeeper笔记和搭建
2020-07-21 -
Spark大数据处理 原理 算法与实例 pdf
2020-07-21 -
Kafka入门与实践
2020-07-21 -
VMware vSphere 5.1官方技术指南文档汇总
2020-07-21 -
Docker源码分析
2020-07-21 -
Hadoop大数据分析与挖掘实战 中文PDF
2020-07-21 -
尚学堂_大数据_Hbase视频教程
2020-07-21 -
大数据架构详解:从数据获取到深度学习
2020-07-21
-
云计算发展白皮书荟萃
2020-07-21 -
Hba se实战
2020-07-21 -
Mesos 大数据资源调度与大规模容器运行最佳实践 完整pdf
2020-07-21 -
大数据Spark企业级实战 (王家林) 完整版 中文
2020-07-21 -
自动化运维配置文档教程
2020-07-21 -
开源容器云OpenShift构建基于Kubernetes的企业应用云平台
2020-07-21 -
程序员的算法趣题 中文pdf
2020-07-20 -
R语言与网站分析(李明 著)完整版 PDF
2020-07-21 -
自己动手做大数据系统
2020-07-21 -
基于Kubernetes的容器云平台实战 PDF
2020-07-21
猜你在找
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
源码库 » Spark大数据处理技术 完整pdf