当前位置:首页>正文

【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 pdf 115盘 kindle 下载 tct lit mobi 在线

免费下载书籍地址:PDF下载地址

精美图片

【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648书籍详细信息

  • ISBN:9787115479648
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2018-04
  • 页数:暂无页数
  • 价格:52.44
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

寄语:

团购可联系在线客服询优惠价 可开发票 正版保证

内容简介:

暂无相关简介,正在全力查找中!

书籍目录:

前言ix

部分  分布式计算入门

章  数据产品时代2

1.1  什么是数据产品2

1.2  使用Hadoop构建大规模数据产品4

1.2.1  利用大型数据集4

1.2.2  数据产品中的Hadoop5

1.3  数据科学流水线和Hadoop生态系统6

1.4  小结8

第2章  大数据操作系统9

2.1  基本概念10

2.2  Hadoop架构11

2.2.1  Hadoop集群12

2.2.2  HDFS14

2.2.3  YARN15

2.3  使用分布式文件系统16

2.3.1  基本的文件系统操作16

2.3.2  HDFS文件权限18

2.3.3  其他HDFS接口19

2.4  使用分布式计算20

2.4.1  MapReduce:函数式编程模型20

2.4.2  MapReduce:集群上的实现22

2.4.3  不止一个MapReduce:作业链27

2.5  向YARN提交MapReduce作业28

2.6  小结30

第3章  Python框架和HadoopStreaming31

3.1  HadoopStreaming32

3.1.1  使用Streaming在CSV数据上运行计算34

3.1.2  执行Streaming作业38

3.2  Python的MapReduce框架39

3.2.1  短语计数42

3.2.2  其他框架45

3.3  MapReduce进阶46

3.3.1  biner46

3.3.2  partitioner47

3.3.3  作业链47

3.4  小结50

第4章  Spark内存计算52

4.1  Spark基础53

4.1.1  Spark栈54

4.1.2  RDD55

4.1.3  使用RDD编程56

4.2  基于PySpark的交互性Spark59

4.3  编写Spark应用程序61

4.4  小结67

第5章  分布式分析和模式69

5.1  键计算70

5.1.1  复合键71

5.1.2  键空间模式74

5.1.3  pair与stripe78

5.2  设计模式80

5.2.1  概要81

5.2.2  索引85

5.2.3  过滤90

5.3  迈向第后一英里分析95

5.3.1  模型拟合96

5.3.2  模型验证97

5.4  小结98

第二部分  大数据科学的工作流和工具

第6章  数据挖掘和数据仓102

6.1  Hive结构化数据查询103

6.1.1  Hive命令行接口(CLI)103

6.1.2  Hive查询语言104

6.1.3  Hive数据分析108

6.2  HBase113

6.2.1  NoSQL与列式数据库114

6.2.2  HBase实时分析116

6.3  小结122

第7章  数据采集123

7.1  使用Sqoop导入关系数据124

7.1.1  从MySQL导入HDFS124

7.1.2  从MySQL导入Hive126

7.1.3  从MySQL导入HBase128

7.2  使用Flume获取流式数据130

7.2.1  Flume数据流130

7.2.2  使用Flume获取产品印象数据133

7.3  小结136

第8章  使用API进行分析137

8.1  Pig137

8.1.1  PigLatin138

8.1.2  数据类型142

8.1.3  关系运算符142

8.1.4  用户定义函数143

8.1.5  Pig小结144

8.2  SparkAPI144

8.2.1  SparkSQL146

8.2.2  DataFrame148

8.3  小结153

第9章  机器学习154

9.1  使用Spark进行可扩展的机器学习154

9.1.1  协同过滤156

9.1.2  分类161

9.1.3  聚类163

9.2  小结166

0章  总结:分布式数据科学实战167

10.1  数据产品生命周期168

10.1.1  数据湖泊169

10.1.2  数据采集171

10.1.3  计算数据存储172

10.2  机器学习生命周期173

10.3  小结175

附录A  创建Hadoop伪分布式开发环境176

附录B  安装Hadoop生态系统产品184

术语表193

关于作者211

关于封面211

作者介绍:

暂无相关内容,正在全力查找中

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648在线阅读

在线听书地址:【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648在线收听

在线购买地址:【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648在线购买

原文赏析:

暂无原文赏析,正在全力查找中!

其它内容:

暂无其它内容!

书籍真实打分

故事情节:4分

人物塑造:5分

主题深度:9分

文字风格:5分

语言运用:4分

文笔流畅:4分

思想传递:7分

知识深度:5分

知识广度:8分

实用性:5分

章节划分:6分

结构布局:5分

新颖与独特:3分

情感共鸣:5分

引人入胜:9分

现实相关:4分

沉浸感:9分

事实准确性:8分

文化贡献:3分

网站评分

书籍多样性:9分

书籍信息完全性:7分

网站更新速度:6分

使用便利性:5分

书籍清晰度:4分

书籍格式兼容性:5分

是否包含广告:6分

加载速度:5分

安全性:9分

稳定性:7分

搜索功能:8分

下载便捷性:8分

下载点评

  • 赚了(234+)
  • 购买多(259+)
  • 少量广告(65+)
  • 书籍多(240+)
  • 盗版少(153+)
  • 章节完整(616+)
  • 无盗版(534+)

下载评价

网友 家***丝:好6666666

网友 龚***湄:差评,居然要收费!!!

网友 冯***卉:听说内置一千多万的书籍,不知道真假的

网友 濮***彤:好棒啊!图书很全

网友 冯***丽:卡的不行啊

网友 师***怡:说的好不如用的好,真心很好。越来越完美

网友 苍***如:什么格式都有的呀。

网友 詹***萍:好评的,这是自己一直选择的下载书的网站

网友 国***芳:五星好评

版权声明

1本文:【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • 埃及旅行Let'sGO(全新第3版)/亲历者旅游书架 pdf 115盘 kindle 下载 tct lit mobi 在线
  • WTO与中国经济的案例研究(第1辑) 盛洪,陈宪 主编 著 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 2013铁道版全国物业管理师执业资格考试两年真题十次模拟——物业管理综合能力(2013) pdf 115盘 kindle 下载 tct lit mobi 在线
  • 【年末清仓】导游业务(第5版)——全国导游人员资格考试系列教材 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 中小水产品加工企业成长研究——基于扎根理论方法的分析 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 常见传染性疾病临证药对 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 王国维传 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 【正版新书】中华人民共和国劳动合同法 大字实用版 法律 社科 法律单行本 法律汇编/法律法规 图法律 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 心惊肉跳的推理 pdf 115盘 kindle 下载 tct lit mobi 在线
  • 青春的陷阱 pdf 115盘 kindle 下载 tct lit mobi 在线