大数据挖掘(大数据技术与应用)

  • ISBN:978-7-5478-2961-5
  • 著译者:熊贇,朱扬勇,陈志渊 编著
  • 定价:¥元
  • 出版时间:2016-09-20
  • 版次:01
  • 印次:01
  • 装帧:
  • 开本:16
  • 字数:
  • 页数:
       编者熊贇、朱扬勇、陈志渊将本书取名《大数据挖掘》,主要介绍了两件事情:传统的数据挖掘算法及其面向大数据的改进;面向复杂数据集的数据挖掘算法,如异质网络挖掘。 本书各章内容如下:第1章介绍大数据挖掘的基本概念、大数据挖掘的任务,以及与大数据挖掘相关的技术。第2章介绍大数据计算框架。第3章到第8章介绍数据挖掘的主要任务,包括关联分析、聚类分析、分类分析、异常分析、特异群组挖掘、演变分析,介绍了这些算法面对大数据的改进。其中,特异群组挖掘是一类典型的面向大数据高价值、低密度特征的数据挖掘任务。第9章介绍了异质数据网络挖掘,这是针对大数据的复杂性而设计的一类新的大数据挖掘方法。**0章以推荐系统为例,介绍了大数据挖掘的应用。第11章对大数据隐私技术进行了介绍。

目  录

 

第1章 绪论

.1.1 理解大数据挖掘

1.1.1 大数据挖掘的定义

1.1.2 大数据挖掘的任务

1.1.3 大数据挖掘的特点

1.1.4 大数据挖掘与相关技术的差异

.1.2 大数据挖掘的相关技术

1.2.1 大数据获取

1.2.2 大数据存储与管理

1.2.3 大数据可视化

.1.3 小结

参考文献

第2章 大数据计算框架

.2.1 HDFS

.2.2 MapReduce

2.2.1 MapReduce框架及范例

2.2.2 MapReduce存在的问题和解决方法

.2.3 NoSQL(非关系型)数据库

2.3.1 NoSQL数据库的分类

2.3.2 NoSQL数据库实例

.2.4 SQL(关系型)数据库

2.4.1 Apache HIVE

2.4.2 其他SQL数据库

.2.5 小结

参考文献

第3章关联分析

.3.1 关联分析的基本概念

3.1.1 关联分析的定义

3.1.2 关联规则的定义

3.1.3 关联规则的分类

.3.2 关联规则挖掘的原理

3.2.1 挖掘简单关联规则

3.2.2 挖掘量化关联规则

3.2.3 挖掘多层关联规则

3.2.4 挖掘多维关联规则

.3.3 关联规则挖掘的基础算法

3.3.1 Apriori算法

3.3.2 Apriori算法的优化

3.3.3 FP-Growth算法

3.3.4 序列模式挖掘算法

.3.4 挖掘算法的进阶方法

3.4.1 USpan:高效用序列模式挖掘算法

3.4.2 HulsMaR:基于MapReduCC的序列模式挖掘算法

.3.5 小结

参考文献

第4章 聚类分析

.4.1 聚类分析的基本概念

4.1.1 簇与聚类

4.1.2 相似性度量和聚类原理

.4.2 聚类分析的基础算法

4.1.1 层次的方法——单连接算法、BIRCH算法

4.2.2 划分的方法——κ-means和κ-medoids算法

4.2.3 基于密度的方法——OPTICS算法

.4.3 聚类分析的进阶方法

4.3.1 Density Peaks算法(AA算法)

4.3.2 κ-means:真基于MapReduce的κ-means算法

.4.4 小结

参考文献


数据质量管理与安全管理
数据质量管理与安全管理

著者:[韩]金范 主编,
定价:¥ 34.00元购买

数据库性能管理与调优
数据库性能管理与调优

著者:[韩]金范 主编,
定价:¥ 27.00元购买

数据建模与DB设计
数据建模与DB设计

著者:[韩]金范 主编,
定价:¥ 34.00元购买

大数据质量(大数据技术与应用)
大数据质量(大数据技术与应

著者:蔡莉 朱扬勇编著,
定价:¥ 60.00元购买

大数据测评(大数据技术与应用)
大数据测评(大数据技术与应

著者:蔡立志 武星 刘振宇 主编,
定价:¥ 52元购买

会员登录
还没有账号立即注册