注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2018年4月

出版社:清华大学出版社

以下为《数据分析与数据挖掘》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 清华大学出版社
  • 9787302493662
  • 209888
  • 46190597-8
  • 16开
  • 2018年4月
  • 工学
  • 计算机科学与技术
  • TP274
  • 计算机
  • 本专科
内容简介
《数据分析与数据挖掘》主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。书中涉及到的模型和算法均给予了相应的实例。
目录
目录
第1章概述1
1.1数据分析与数据挖掘1
1.1.1数据分析1
1.1.2数据挖掘1
1.1.3区别和联系3
1.2分析与挖掘的数据类型3
1.3数据分析与数据挖掘的方法7
1.4数据分析与数据挖掘使用的技术9
1.5应用场景及存在的问题12
1.5.1数据分析与数据挖掘的应用12
1.5.2存在的主要问题13
1.6本书结构概述14
1.7习题14
第2章数据15
2.1数据对象与属性类别15
2.1.1属性的定义15
2.1.2属性的分类15
2.2数据基本统计描述16
2.2.1中心趋势度量17
2.2.2数据散布度量19
2.2.3数据的图形显示20
2.3数据的相似性和相异性度量25
2.3.1数据矩阵与相异性矩阵25
2.3.2标称属性的邻近性度量25
2.3.3二元属性的邻近性度量26
2.3.4数值属性的相异性27
2.3.5序数属性的邻近性度量29
2.3.6余弦相似性30
2.4习题30目录数据分析与数据挖掘第3章数据预处理32
3.1数据预处理及任务32
3.1.1数据预处理的必要性32
3.1.2数据预处理的主要任务34
3.2数据清理35
3.2.1缺失值、噪声和不一致数据的处理35
3.2.2数据清理方式38
3.3数据集成39
3.4数据归约42
3.4.1直方图43
3.4.2数据立方体聚集44
3.4.3属性子集选择45
3.4.4抽样46
3.5数据变换与数据离散化47
3.5.1数据变换策略及分类47
3.5.2数据泛化47
3.5.3数据规范化48
3.5.4数据离散化49
3.6习题51
第4章数据仓库与OLAP52
4.1数据仓库的基本概念52
4.1.1数据仓库的定义52
4.1.2数据仓库的性质52
4.1.3数据仓库体系结构53
4.1.4数据仓库设计模型54
4.2数据仓库设计55
4.2.1数据仓库的概念模型设计55
4.2.2数据仓库的逻辑模型设计58
4.2.3数据仓库的物理模型设计60
4.3数据仓库实现61
4.4联机分析处理70
4.4.1OLAP简介71
4.4.2OLAP与OLTP的关系72
4.4.3典型的OLAP操作73
4.5元数据模型76
4.5.1元数据的类型77
4.5.2元数据的作用77
4.5.3元数据的使用78
4.6习题79
第5章回归分析80
5.1回归分析概述80
5.1.1变量间的两类关系80
5.1.2回归分析的步骤81
5.2一元线性回归82
5.2.1原理分析82
5.2.2回归方程求解及模型检验82
5.2.3一元线性回归实例85
5.2.4案例分析: 使用Weka实现一元线性回归88
5.3多元线性回归94
5.3.1原理分析94
5.3.2回归方程求解及模型检验95
5.3.3多元线性回归实例97
5.3.4案例分析: 使用Weka实现多元线性回归99
5.4多项式回归102
5.4.1原理分析102
5.4.2多项式回归实例103
5.4.3案例分析: 使用Excel实现多项式回归104
5.5习题111
第6章频繁模式挖掘113
6.1概述113
6.1.1案例分析114
6.1.2相关概念114
6.1.3先验性质116
6.2关联模式评估117
6.2.1支持度置信度框架117
6.2.2相关性分析117
6.2.3模式评估度量119
6.3Apriori算法120
6.3.1Apriori算法分析120
6.3.2案例分析: 使用Weka实现Apriori算法124
6.4FPgrowth算法129
6.4.1FPgrowth算法分析129
6.4.2案例分析: 使用Weka实现FPgrowth算法133
6.5压缩频繁项集136
6.5.1挖掘闭模式136
6.5.2挖掘极大模式136
6.6习题137
第7章分类139
7.1分类概述139
7.1.1分类的基本概念139
7.1.2分类的相关知识139
7.1.3分类的评价指标143
7.2决策树144
7.2.1决策树基本概念144
7.2.2决策树分类器的算法过程145
7.2.3ID3算法146
7.2.4C4.5算法149
7.2.5Weka中使用C4.5算法进行分类预测实例151
7.2.6决策树的剪枝156
7.2.7随机森林算法157
7.2.8使用Weka的随机森林进行分类预测160
7.3朴素贝叶斯分类164
7.3.1朴素贝叶斯学习基本原理164
7.3.2朴素贝叶斯分类过程165
7.3.3使用Weka的朴素贝叶斯分类器进行分类实例166
7.4惰性学习法170
7.4.1K近邻算法描述170
7.4.2K近邻算法性能172
7.4.3使用Weka进行K近邻分类实例173
7.5逻辑回归176
7.5.1逻辑回归基本概念176
7.5.2二项逻辑回归过程177
7.5.3使用逻辑回归分类算法的实例179
7.5.4使用Weka进行逻辑回归分类实例180
7.6支持向量机183
7.6.1线性可分支持向量机算法184
7.6.2线性可分支持向量机算法过程188
7.6.3使用Weka进行支持向量机分类实例189
7.7神经网络192
7.7.1神经网络基本概念192
7.7.2BP神经网络算法过程194
7.7.3BP神经网络分类算法的实例196
7.7.4使用Weka进行神经网络的分类实例198
7.8习题205
第8章聚类207
8.1聚类概述207
8.1.1聚类的基本概念207
8.1.2聚类算法的分类208
8.2基于划分的聚类210
8.2.1K均值算法210
8.2.2K中心点算法214
8.2.3使用Weka进行基于划分的聚类实例217
8.3基于层次的聚类221
8.3.1基于层次的聚类的基本概念221
8.3.2类间距离度量222
8.3.3分裂层次聚类222
8.3.4凝聚层次聚类224
8.3.5BIRCH算法226
8.3.6使用Weka进行基于层次的聚类实例228
8.4基于密度的聚类233
8.4.1基于密度的聚类的基本概念233
8.4.2DBSCAN算法233
8.4.3使用Weka进行基于密度的聚类实例236
8.5基于网格的聚类241
8.5.1基于网格的聚类的基本概念241
8.5.2STING算法241
8.5.3CLIQUE算法243
8.6聚类质量的评估245
8.7习题247
第9章离群点检测248
9.1离群点的定义与类型248
9.1.1离群点的定义248
9.1.2离群点类型249
9.2离群点的检测250
9.2.1检测方法的分类250
9.2.2统计学方法251
9.2.3近邻性方法253
9.2.4基于聚类的方法255
9.2.5基于分类的方法258
9.3习题259
附录AWeka的安装及使用规范260
A.1Weka的安装260
A.1.1Weka260
A.1.2JRE的安装260
A.1.3Weka的安装263
A.2Weka使用方法267
A.3Weka数据格式271
参考文献275