注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2023-05

出版社:电子工业出版社

以下为《SPSS Modeler 数据挖掘方法及应用(第3版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
试读
  • 电子工业出版社
  • 9787121363191
  • 1-7
  • 293630
  • 47245280-4
  • 平塑勒
  • 16开
  • 2023-05
  • 576
  • 360
  • 理学
  • 统计学
  • 数学
  • 本科 研究生(硕士、EMBA、MBA、MPA、博士)
作者简介

薛薇,工学硕士,经济学博士,中国人民大学应用统计学科研究中心副主任,中国人民大学统计学院副教授。主要研究领域:机器学习和文本挖掘、复杂网络建模等。关注统计和数据挖掘算法及软件应用。涉足企业客户终身价值测算,基于文本挖掘的热点事件主题提取和分类,金融、贸易等复杂网络动态建模等方面。主要代表性教材:《SPSS统计分析方法及应用》、《R语言数据挖掘方法及应用》、《R语言:大数据分析中的统计方法及应用》、《SPSS Modeler数据挖掘方法及应用》等。

查看全部
目录
目 录 第1章 数据挖掘和SPSS Modeler使用概述 1 1.1 数据挖掘的产生背景 1 1.1.1 海量大数据的分析需求催生数据挖掘 1 1.1.2 应用对理论的挑战催生数据挖掘 2 1.2 什么是数据挖掘 4 1.2.1 数据挖掘和数据库中的知识发现 5 1.2.2 数据挖掘方法论 6 1.2.3 数据挖掘的任务和应用 9 1.2.4 数据挖掘得到的知识形式 11 1.2.5 数据挖掘算法的分类 14 1.3 SPSS Modeler软件概述 17 1.3.1 SPSS Modeler的数据流 17 1.3.2 SPSS Modeler的窗口 19 1.3.3 数据流的基本管理 21 1.3.4 缓存节点和超节点 24 1.3.5 从一个示例看SPSS Modeler的使用 25 第2章 SPSS Modeler的数据读入和数据集成 31 2.1 变量类型 31 2.1.1 从数据挖掘角度看变量类型 31 2.1.2 从计算机存储角度看变量类型 32 2.2 读入数据 32 2.2.1 读自由格式的文本文件 33 2.2.2 读Excel电子表格数据 36 2.2.3 读SPSS格式文件 37 2.3 数据集成 38 2.3.1 数据的纵向合并 38 2.3.2 数据的横向合并 40 2.3.3 数据源替换 43 第3章 SPSS Modeler的数据理解 45 3.1 变量说明 45 3.1.1 变量的重新实例化 46 3.1.2 有效变量值和无效值调整 47 3.1.3 变量角色的说明 49 3.2 数据质量的评估和调整 50 3.2.1 数据的基本特征与质量评价报告 50 3.2.2 变量值的调整 53 3.2.3 数据质量管理 56 3.3 数据的排序 58 3.3.1 单变量排序 58 3.3.2 多重排序 59 3.4 数据的分类汇总 60 3.4.1 单变量分类汇总 60 3.4.2 多重分类汇总 61 第4章 SPSS Modeler的数据准备 62 4.1 变量变换 62 4.1.1 CLEM表达式 62 4.1.2 变量值的重新计算 65 4.1.3 变量类别值的调整 67 4.2 变量派生 68 4.2.1 生成新变量 68 4.2.2 生成服从正态分布的新变量 72 4.2.3 派生哑变量 75 4.3 数据精简 76 4.3.1 随机抽样 76 4.3.2 根据条件选取样本 79 4.4 建模中的数据集处理策略 80 4.4.1 样本的平衡处理 80 4.4.2 样本子集的划分 81 第5章 SPSS Modeler的基本分析 85 5.1 数值型变量的基本分析 85 5.1.1 计算基本描述统计量 85 5.1.2 绘制散点图 88 5.1.3 绘制线图 91 5.2 两分类型变量相关性的研究 93 5.2.1 两分类型变量相关性的图形分析 93 5.2.2 两分类型变量相关性的数值分析 98 5.3 两总体的均值比较 102 5.3.1 两总体均值比较的图形分析 102 5.3.2 独立样本的均值检验 104 5.3.3 配对样本的均值检验 108 5.4 RFM分析 110 5.4.1 什么是RFM分析 110 5.4.2 RFM汇总 110 5.4.3 计算RFM得分 112 第6章 SPSS Modeler的数据精简 115 6.1 变量值的离散化处理 115 6.1.1 无监督的数据分组 115 6.1.2 有监督的数据分组 116 6.1.3 变量值离散化处理的应用示例 119 6.2 特征选择 122 6.2.1 特征选择的一般方法 123 6.2.2 特征选择的应用示例 124 6.3 因子分析 128 6.3.1 什么是因子分析 128 6.3.2 因子提取和因子载荷矩阵的求解 131 6.3.3 因子的命名解释 134 6.3.4 计算因子得分 135 6.3.5 因子分析的应用示例 136 第7章 分类预测:SPSS Modeler的决策树 141 7.1 决策树算法概述 141 7.1.1 什么是决策树 141 7.1.2 决策树的几何理解 143 7.1.3 决策树的核心问题 143 7.2 SPSS Modeler的C5.0算法及其应用 146 7.2.1 信息熵和信息增益 146 7.2.2 C5.0决策树的生长算法 147 7.2.3 C5.0决策树的剪枝算法 152 7.2.4 C5.0决策树的基本应用示例 154 7.2.5 C5.0的推理规则集 158 7.2.6 损失矩阵 163 7.2.7 N折交叉验证和Boosting技术 165 7.3 SPSS Modeler的分类回归树及其应用 169 7.3.1 分类回归树的生长过程 169 7.3.2 分类回归树的剪枝过程 171 7.3.3 损失矩阵对分类回归树的影响 174 7.3.4 分类回归树的基本应用示例 174 7.3.5 分类回归树的交互建模 178 7.3.6 交互建模中分类回归树的评价 180 7.4 SPSS Modeler的CHAID算法及其应用 185 7.4.1 CHAID算法 185 7.4.2 穷举CHAID算法 186 7.4.3 CHAID算法的剪枝 187 7.4.4 CHAID算法的应用示例 187 7.5 SPSS Modeler的QUEST算法及其应用 189 7.5.1 QUEST算法 189 7.5.2 QUEST算法的应用示例 191 7.6 模型的对比分析 192 7.6.1 不同模型的误差对比 192 7.6.2 不同模型的收益对比 195 第8章 分类预测:SPSS Modeler的人工神经网络 198 8.1 人工神经网络算法概述 198 8.1.1 人工神经网络的概念和种类 198 8.1.2 人工神经网络中的节点和意义 200 8.1.3 人工神经网络建立的一般步骤 202 8.2 SPSS Modeler的B-P反向传播网络 204 8.2.1 感知机模型 204 8.2.2 B-P反向传播网络的特点 207 8.2.3 B-P反向传播算法 209 8.2.4 B-P反向传播网络的其他问题 212 8.3 SPSS Modeler的B-P反向传播网络的应用 214 8.3.1 基本操作 215 8.3.2 结果说明 215 8.4 SPSS Modeler的径向基函数网络及其应用 216 8.4.1 径向基函数网络中的隐节点和输出节点 217 8.4.2 径向基函数网络的学习过程 217 8.4.3 径向基函数网络的应用示例 219 第9章 分类预测:SPSS Modeler的支持向量机 221 9.1 支持向量分类的基本思路 221 9.1.1 支持向量分类的数据和目标 221 9.1.2 支持向量分类的三种情况 223 9.2 线性可分问题下的支持向量分类 224 9.2.1 如何求解超平面 224 9.2.2 如何利用超平面进行分类预测 226 9.3 广义线性可分下的支持向量分类 227 9.3.1 如何求解超平面 227 9.3.2 可调参数的意义:把握程度和精度的权衡 228__eol