- 资源介绍
资源名称:寻路大数据-海量数据与大规模分析 完整版 PDF
第1 部分 大数据时代指引 1
第1 章 数据成功四原则 3
1.1 当数据成为一件“大”事 3
1.2 数据和单台服务器 4
1.3 大数据的权衡 5
1.3.1 构建可(限)扩展的解决方案 6
1.3.2 构建可(在互联网上)共享数据的系统 7
1.3.3 构建解决方案,而非基础设施 8
1.3.4 关注从数据中解放价值 8
1.4 大数据流水线剖析 9
1.5 终极数据库 10
1.6 总结 10
第2 部分 收集和共享海量数据 13
第2 章 托管和共享TB 级原始数据 15
2.1 文件之殇 16
2.1.1 共享大量文件的挑战 16
2.2 存储:基础设施即服务 17
2.2.1 网络很慢 18
2.3 选择合适的数据格式 18
2.3.1 XML :数据,描述你自己 20
2.3.2 JSON :程序员的选择 21
2.4 字符编码 22
2.4.1 文件转换 24
2.5 移动中的数据:数据序列化格式 25
2.5.1 Apache Thrift 和Protocol Buffers 26
2.6 总结 27
第3 章 构建基于NoSQL 的Web 应用采集众包数据 29
3.1 关系型数据库:命令及控制 30
3.1.1 关系数据库的ACID 测试 32
3.2 当关系型数据库遇上互联网 33
3.2.1 CAP 原理与BASE 34
3.3 非关系型数据库的模式 36
3.3.1 键- 值数据库 36
3.3.2 文档存储 38
3.4 为写入性能优化:Redis 40
3.5 在多个Redis 实例上分片 43
3.5.1 使用Twemproxy 自动分区 44
3.5.2 Redis 的替代选项 46
3.6 NewSQL :Codd 归来 46
3.7 总结 47
第4 章 解决数据孤岛问题的策略 49
4.1 堆满术语的仓库 49
4.1.1 实践中的问题 51
4.1.2 数据合规与安全规划 52
4.1.3 走进数据仓库 53
4.1.4 数据仓库的口诀:抽取、转换和加载 54
4.2 Hadoop :数据仓库中的大象 55
4.3 数据孤岛也可能是个优点 55
4.3.1 专注于数据问题,而不是技术 56
4.3.2 鼓励员工提出他们自己的问题 57
4.3.3 投资沟通数据孤岛的技术 57
4.4 融合:数据孤岛的终结 58
4.4.1 Luhn 的商业智能系统是否能成为现实 59
4.5 总结 59
第3 部分 数据探究 61
第5 章 使用Hadoop、Hive 和Shark 探索大规模数据集 63
资源截图:
猜你喜欢
-
千锋Linux进阶教程-千锋Linux进阶教程-Linux和数据库实战
2020-07-21 -
2017零基础自学云计算分析hadoop storm spark大数据开发视频教程
2020-07-21 -
云计算系列讲座视频(13集)
2020-07-21 -
MATLAB数值计算 PDF
2020-07-21 -
自己动手写Docker
2020-07-21 -
用Apache Spark进行大数据处理-第一部分:入门介绍 中文
2020-07-21 -
Matlab2010经典超强教程 pdf
2020-07-21 -
XenApp与XenDesktop售前演示视频
2020-07-21 -
R语言与网站分析(李明 著)完整版 PDF
2020-07-21 -
架构大数据 大数据技术及算法解析 中文pdf
2020-07-20
-
Apache Spark源码剖析
2020-07-21 -
实战Matlab之并行程序设计 (刘维著) 中文
2020-07-21 -
从Paxos到Zookeeper:分布式一致性原理与实践
2020-07-21 -
《OpenStack实战》与《OpenStack新手开发指南》高清pdf合集
2020-07-21 -
AMD云学院云计算系列视频课程
2020-07-21 -
云计算和物联网
2020-07-21 -
炼数成金Hadoop视频
2020-07-21 -
海牛大数据ETL项目视频
2020-07-21 -
Docker 容器与容器云(第2版)
2020-07-21 -
云:7种清晰的商业模式
2020-07-21
猜你在找
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
源码库 » 寻路大数据-海量数据与大规模分析 完整版 PDF