注册 登录 进入教材巡展 进入在线书城
#

出版时间:2023-07

出版社:电子工业出版社

以下为《Python机器学习——数据建模与分析(第2版)》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 电子工业出版社
  • 9787121459351
  • 1-1
  • 466143
  • 47246063-3
  • 平塑勒
  • 16开
  • 2023-07
  • 647
  • 392
  • 计算机科学与技术
  • 本科 研究生(硕士、EMBA、MBA、MPA、博士)
内容简介
机器学习是一套先进、深刻且内容丰富的算法集合,已成为数据科学最主流的分析方法;Python是一款简明、高效且功能强大的开源工具,已成为数据科学最常用的计算机编程语言。它们相得益彰,构成了当今大数据技术、人工智能等前沿领域的必备知识,是数据科学人才培养的必要内容。__eol__本书采用理论与实践相结合的方式,引导读者以Python为工具,以机器学习为方法,进行数据的建模与分析。本书共13章,对机器学习的原理部分进行了深入透彻的讲解,对机器学习算法部分进行了Python实现,并给出应用实践案例。__eol__
目录
目 录 第1章 机器学习概述 1 1.1 机器学习的发展:人工智能中的机器学习 1 1.1.1 符号主义人工智能 2 1.1.2 基于机器学习的人工智能 2 1.2 机器学习的核心:数据和数据建模 4 1.2.1 机器学习的对象:数据集 4 1.2.2 机器学习的任务:数据建模 6 1.3 机器学习的典型应用 11 1.3.1 机器学习的典型行业应用 11 1.3.2 机器学习在客户细分中的应用 12 1.3.3 机器学习在客户流失分析中的应用 13 1.3.4 机器学习在营销响应分析中的应用 14 1.3.5 机器学习在交叉销售中的应用 15 1.3.6 机器学习在欺诈甄别中的应用 16 本章总结 16 本章习题 16 第2章 Python机器学习基础 17 2.1 Python:机器学习的首选工具 17 2.2 Python的集成开发环境:Anaconda 18 2.2.1 Anaconda的简介 19 2.2.2 Anaconda Prompt的使用 19 2.2.3 Spyder的使用 20 2.2.4 Jupyter Notebook的使用 22 2.3 Python第三方包的引用 23 2.4 NumPy使用示例 23 2.4.1 NumPy数组的创建和访问 24 2.4.2 NumPy的计算功能 26 2.5 Pandas使用示例 28 2.5.1 Pandas的序列和索引 28 2.5.2 Pandas的数据框 29 2.5.3 Pandas的数据加工处理 30 2.6 NumPy和Pandas的综合应用:空气质量监测数据的预处理和基本分析 32 2.6.1 空气质量监测数据的预处理 32 2.6.2 空气质量监测数据的基本分析 34 2.7 Matplotlib的综合应用:空气质量监测数据的图形化展示 37 2.7.1 AQI的时间序列变化特点 37 2.7.2 AQI的分布特征及相关性分析 38 本章总结 40 本章相关函数列表 40 本章习题 47 第3章 数据预测与预测建模 48 3.1 从线性回归模型说起 49 3.1.1 线性回归模型的含义 49 3.1.2 线性回归模型的几何理解 50 3.1.3 线性回归模型的评价 50 3.1.4 Python应用实践:PM2.5浓度预测 51 3.2 认识线性分类模型 56 3.2.1 线性分类模型的含义 56 3.2.2 线性分类模型的几何理解 58 3.2.3 线性分类模型的评价 60 3.2.4 Python应用实践:空气质量等级预测 62 3.3 从线性预测模型到非线性预测模型 67 3.4 预测模型的参数估计 68 3.4.1 损失函数与有监督学习 68 3.4.2 参数搜索策略 70 3.5 预测模型的选择 72 3.5.1 泛化误差的估计 72 3.5.2 Python模拟和启示:理解泛化误差 75 3.5.3 预测模型过拟合问题 78 3.5.4 模型选择:偏差和方差 79 本章总结 82 本章相关函数列表 83 本章习题 83 第4章 数据预测建模:贝叶斯分类器 84 4.1 贝叶斯概率和贝叶斯法则 84 4.1.1 贝叶斯概率 84 4.1.2 贝叶斯法则 85 4.2 朴素贝叶斯分类器 85 4.2.1 从顾客行为分析角度看朴素贝叶斯分类器 85 4.2.2 Python模拟和启示:认识朴素贝叶斯分类器的分类边界 88 4.2.3 Python应用实践:空气质量等级预测 91 4.3 朴素贝叶斯分类器在文本分类中的应用 93 4.3.1 Python文本数据预处理:文本分词和量化计算 94 4.3.2 Python文本描述性分析:词云图和文本相似性 97 4.3.3 Python文本分析综合应用:裁判文书的要素提取 99 4.4 贝叶斯参数估计简介* 102 4.4.1 从科比投篮分析角度看贝叶斯参数估计的基本思想 102 4.4.2 共轭先验分布 103 4.4.3 Python应用实践:科比投篮命中率的研究 106 本章总结 108 本章相关函数列表 108 本章习题 109 第5章 数据预测建模:近邻分析 110 5.1 近邻分析:K-近邻法 110 5.1.1 距离:K-近邻法的近邻度量 111 5.1.2 参数K:1-近邻法和K-近邻法 112 5.2 回归预测中的K-近邻法 113 5.2.1 Python模拟和启示:认识K-近邻回归线 113 5.2.2 Python模拟和启示:认识K-近邻回归面 115 5.3 分类预测中的K-近邻法 117 5.3.1 基于1-近邻法和K-近邻法的分类 117 5.3.2 Python模拟和启示:参数K和分类边界 118 5.4 基于观测相似性的加权K-近邻法 120 5.4.1 加权K-近邻法的权重 121 5.4.2 Python模拟和启示:认识加权K-近邻分类边界 123 5.5 K-近邻法的Python应用实践 124 5.5.1 空气质量等级的预测 124 5.5.2 国产电视剧大众评分的预测 126 5.6 K-近邻法的适用性探讨* 127 本章总结 129 本章相关函数列表 130 本章习题 130 第6章 数据预测建模:决策树 131 6.1 决策树的基本概念 131 6.1.1 什么是决策树 131 6.1.2 决策树的深层含义 133 6.2 回归预测中的决策树 134 6.2.1 决策树的回归面 134 6.2.2 Python模拟和启示:树深度对回归面的影响 135 6.3 分类预测中的决策树 136 6.3.1 决策树的分类边界 137 6.3.2 Python模拟和启示:树深度对分类边界的影响 137 6.4 决策树的生长和剪枝 139 6.4.1 决策树的生长 140 6.4.2 决策树的剪枝 141 6.5 经典决策树算法:CART 142 6.5.1 CART的生长 142 6.5.2 CART的后剪枝 145 6.6 决策树的Python应用实践 148 6.6.1 PM2.5浓度的预测 148 6.6.2 空气质量等级的预测 149 6.6.3 药物适用性研究 151 6.7 决策树的高方差性* 153 本章总结 154 本章相关函数列表 154 本章习题 155 第7章 数据预测建模:集成学习 156 7.1 集成学习概述 156 7.1.1 高方差性问题的解决途径 157 7.1.2 从弱模型到强模型的构建 157 7.2 基于重抽样自举法的集成学习 158 7.2.1 重抽样自举法 158 7.2.2 袋装法的基本思想 158 7.2.3 随机森林的基本思想 160 7.2.4 Python应用实践:基于袋装法和随机森林预测PM2.5浓度 162 7.3 从弱模型到强模型的构建:提升法 165 7.3.1 提升法的基本思路 165 7.3.2 Python模拟和启示:弱模型联合成为强模型 166 7.3.3 分类预测中的提升法:AdaBoost.M1算法 168 7.3.4 Python模拟和启示:认识AdaBoost.M1算法中高权重的样本观测 171 7.3.5 回归预测中的提升法 173 7.3.6 Python应用实践