Online Resource
[Erscheinungsort nicht ermittelbar] : Posts & Telecom Press
|
Boston, MA : Safari
ISBN:
9787115479648
Language:
English
,
Chinese
Pages:
1 online resource (229 pages)
Edition:
1st edition
Keywords:
Electronic books ; local
Abstract:
通过提供分布式数据存储和并行计算框架,Hadoop已经从集群计算的抽象演变成了大数据操作系统。本书从数据科学的视角,介绍Hadoop集群计算和分析,重点关注可构建的具体分析、数据仓储技术和高阶数据流。 书中主要内容如下: Hadoop和集群计算背后的核心概念 使用设计模式和并行分析算法创建分布式数据分析作业 在分布式环境下使用Apache Hive和HBase进行数据管理、数据挖掘和数据仓储 使用Sqoop和Apache Flume从关系数据库采集数据 使用Apache Pig和Spark DataFrame编写复杂的Hadoop和Spark应用程序 通过Spark MLlib运用分类、聚类和协同过滤等机器学习技术
Note:
Online resource; Title from title page (viewed April 1, 2018)
,
Mode of access: World Wide Web.
Permalink
Library |
Location |
Call Number |
Volume/Issue/Year |
Availability |