- 资源介绍
资源名称:Spark快速数据处理
内容简介:
Spark是一个开源的通用并行分布式计算框架,由加州大学伯克利分校的AMP实验室开发,支持内存计算、多迭代批量处理、即席查询、流处理和图计算等多种范式。Spark内存计算框架适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和准确性,现已逐渐获得很多企业的支持,如阿里巴巴、百度、网易、英特尔等公司。
本书系统讲解Spark的使用方法,包括如何在多种机器上安装Spark,如何配置一个Spark集群,如何在交互模式下运行第一个Spark作业,如何在Spark集群上构建一个生产级的脱机/独立作业,如何与Spark集群建立连接和使用SparkContext,如何创建和保存RDD(弹性分布式数据集),如何用Spark分布式处理数据,如何设置Shark,将Hive查询集成到你的Spark作业中来,如何测试Spark作业,以及如何提升Spark任务的性能。
资源目录:
译者序
作者简介
前言
第1章 安装Spark以及构建Spark集群
1.1 单机运行Spark
1.2 在EC2上运行Spark
1.3 在ElasticMapReduce上部署Spark
1.4 用Chef(opscode)部署Spark
1.5 在Mesos上部署Spark
1.6 在Yarn上部署Spark
1.7 通过SSH部署集群
1.8 链接和参考
1.9 小结
第2章 Sparkshell的使用
2.1 加载一个简单的text文件
2.2 用Sparkshell运行逻辑回归
2.3 交互式地从S3加载数据
2.4 小结
第3章 构建并运行Spark应用
3.1 用sbt构建Spark作业
3.2 用Maven构建Spark作业
3.3 用其他工具构建Spark作业
3.4 小结
第4章 创建SparkContext
4.1 Scala
4.2 Java
4.3 Java和Scala共享的API
4.4 Python
4.5 链接和参考
4.6 小结
第5章 加载与保存数据
5.1 RDD
5.2 加载数据到RDD中
5.3 保存数据
5.4 连接和参考
5.5 小结
第6章 操作RDD
6.1 用Scala和Java操作RDD
6.2 用Python操作RDD
6.3 链接和参考
6.4 小结
第7章 Shark-Hive和Spark的综合运用
7.1 为什么用HiveShark
7.2 安装Shark
7.3 运行Shark
7.4 加载数据
7.5 在Spark程序中运行HiveQL查询
7.6 链接和参考
7.7 小结
第8章 测试
8.1 用Java和Scala测试
8.2 用Python测试
8.3 链接和参考
8.4 小结
第9章 技巧和窍门
9.1 日志位置
9.2 并发限制
9.3 内存使用与垃圾回收
9.4 序列化
9.5 IDE集成环境
9.6 Spark与其他语言
9.7 安全提示
9.8 邮件列表
9.9 链接和参考
9.10 小结
资源截图:
猜你喜欢
-
openstack入门课程视频
2020-07-21 -
Matlab2010经典超强教程 中文
2020-07-21 -
OpenStack云应用开发
2020-07-21 -
大数据概论
2020-07-21 -
OpenStack云计算平台管理
2020-07-21 -
精通matlab金融计算 PDF
2020-07-21 -
从Paxos到Zookeeper:分布式一致性原理与实践
2020-07-21 -
spark案例与实验教程 完整pdf
2020-07-21 -
Spark大数据实例开发教程
2020-07-21 -
大数据技术原理与应用:概念、存储、处理、分析与应用(第2版)
2020-07-21
-
千锋大数据教程:数据可视化
2020-07-21 -
Spark大数据处理技术 完整pdf
2020-07-21 -
Python语法基础和常用模块使用(四)【2019千锋Linux】
2020-07-21 -
大数据技术丛书《数据挖掘与数据化运营实战:思路、方法、技巧与应用》
2020-07-21 -
MATLAB R2016a完全自学一本通 (刘浩著) 完整 pdf
2020-07-21 -
云计算宝典 技术与实践 虚拟化与云计算 pdf
2020-07-20 -
引入大数据技术的数据中心融合架构 中文PDF
2020-07-20 -
Docker实战 PDF
2020-07-21 -
Kafka并不难学!入门、进阶、商业实战
2020-07-21 -
Python+Spark 2.0+Hadoop机器学习与大数据实战
2020-07-21
猜你在找
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
源码资源库 » Spark快速数据处理