注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2018年7月

出版社:机械工业出版社

以下为《Python数据科学:技术详解与商业实践》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111603092
  • 1版
  • 262563
  • 44208981-9
  • 16开
  • 2018年7月
  • 434
  • 工学
  • 计算机科学与技术
  • 计算机通信类
  • 本科
内容简介
本书共19章,第1章介绍数据科学中涉及的基本领域;第2~3章介绍与数据工作紧密相关的Python语言基础;第4章讲解描述性统计分析在宏观业务领域的分析;第5章讲解数据规整、清洗的重要技能;第6章介绍数据科学领域实用的四大统计检验;第7章讲解当被解释变量为连续变量时,如何使用线性回归作预测;第8章讲解使用逻辑回归作评分卡模型;第9章讲解另外一个可解释模型——决策树。第10~12章分别讲解了BP神经网络、朴素贝叶斯、近邻域、支持向量机的原理和在决策类模型中的运用;第13~14章作为一个整体讲解商业分析场景下的信息压缩;第15章以产品推荐作为案例,讲解发现事件与事件伴生关系的关联分析和序列分析算法;第16章使用欺诈识别案例讲解当被解释变量分布极 端不平衡时的处理方法;第17章继续使用欺诈识别案例讲解集成学习算法;第18章讲解了使用效应分解和ARIMA方法实现宏观业务指标预测;第19章用案例展现了分类和聚类模型的CRISP-DM和SEMMA流程。
目录
目录前言第1章数据科学家的武器库1.1数据科学的基本概念1.2数理统计技术1.2.1描述性统计分析1.2.2统计推断与统计建模1.3数据挖掘的技术与方法1.4描述性数据挖掘算法示例1.4.1聚类分析——客户细分1.4.2关联规则分析1.5预测性数据挖掘算法示例1.5.1决策树1.5.2KNN算法1.5.3Logistic回归1.5.4神经网络1.5.5支持向量机1.5.6集成学习1.5.7预测类模型讲解1.5.8预测类模型评估概述第2章Python概述2.1Python概述2.1.1Python简介2.1.2Python与数据科学2.1.3Python2与Python32.2Anaconda Python的安装、使用2.2.1下载与安装2.2.2使用Jupyter Notebook2.2.3使用Spyder2.2.4使用conda或pip管理第三方库第3章数据科学的Python编程基础3.1Python的基本数据类型3.1.1字符串(str)3.1.2浮点数和整数(float、int)3.1.3布尔值(Bool:True/False)3.1.4其他3.2Python的基本数据结构3.2.1列表(list)3.2.2元组(tuple)3.2.3集合(set)3.2.4字典(dict)3.3Python的程序控制3.3.1三种基本的编程结构简介3.3.2顺承结构3.3.3分支结构3.3.4循环结构3.4Python的函数与模块3.4.1Python的函数3.4.2Python的模块3.5Pandas读取结构化数据3.5.1读取数据3.5.2写出数据第4章描述性统计分析与绘图4.1描述性统计进行数据探索4.1.1变量度量类型与分布类型4.1.2分类变量的统计量4.1.3连续变量的分布与集中趋势4.1.4连续变量的离散程度4.1.5数据分布的对称与高矮4.2制作报表与统计制图4.3制图的步骤第5章数据整合和数据清洗5.1数据整合5.1.1行列操作5.1.2条件查询5.1.3横向连接5.1.4纵向合并5.1.5排序5.1.6分组汇总5.1.7拆分、堆叠列5.1.8赋值与条件赋值5.2数据清洗5.2.1重复值处理5.2.2缺失值处理5.2.3噪声值处理5.3RFM方法在客户行为分析上的运用5.3.1行为特征提取的RFM方法论5.3.2使用RFM方法计算变量5.3.3数据整理与汇报第6章数据科学的统计推断基础6.1基本的统计学概念6.1.1总体与样本6.1.2统计量6.1.3点估计、区间估计和中心极限定理6.2假设检验与单样本t检验6.2.1假设检验6.2.2单样本t检验6.3双样本t检验6.4方差分析(分类变量和连续变量关系检验)6.4.1单因素方差分析6.4.2多因素方差分析6.5相关分析(两连续变量关系检验)6.5.1相关系数6.5.2散点矩阵图6.6卡方检验(二分类变量关系检验)6.6.1列联表6.6.2卡方检验第7章客户价值预测:线性回归模型与诊断7.1线性回归7.1.1简单线性回归7.1.2多元线性回归7.1.3多元线性回归的变量筛选7.2线性回归诊断7.2.1残差分析7.2.2强影响点分析7.2.3多重共线性分析7.2.4小结线性回归诊断7.3正则化方法7.3.1岭回归7.3.2LASSO回归第8章Logistic回归构建初始信用评级8.1Logistic回归的相关关系分析8.2Logistic回归模型及实现8.2.1Logistic回归与发生比8.2.2Logistic回归的基本原理8.2.3在Python中实现Logistic回归8.3Logistic回归的极大似然估计8.3.1极大似然估计的概念8.3.2Logistics回归的极大似然估计8.4模型评估8.4.1模型评估方法8.4.2ROC曲线的概念8.4.3在Python中实现ROC曲线第9章使用决策树进行初始信用评级9.1决策树概述9.2决策树算法9.2.1ID3建树算法原理9.2.2C4.5建树算法原理9.2.3CART建树算法原理9.2.4决策树的剪枝9.3在Python中实现决策树9.3.1建模9.3.2模型评估9.3.3决策树的可视化9.3.4参数搜索调优第10章神经网络10.1神经元模型10.2单层感知器10.3BP神经网络10.4多层感知器的scikitlearn代码实现第11章分类器入门:最近邻域与朴素贝叶斯11.1KNN算法11.1.1KNN算法原理11.1.2在Python中实现KNN算法11.2朴素贝叶斯分类11.2.1贝叶斯公式11.2.2朴素贝叶斯分类原理11.2.3朴素贝叶斯的参数估计11.2.4在Python中实现朴素贝叶斯第12章高级分类器:支持向量机12.1线性可分与线性不可分12.2线性可分支持向量机12.2.1函数间隔和几何间隔12.2.2学习策略12.2.3对偶方法求解12.2.4线性可分支持向量机例题12.3线性支持向量机与软间隔最大化12.4非线性支持向量机与核函数12.4.1核函数12.4.2非线性支持向量机的学习12.4.3示例与Python实现12.5使用支持向量机的案例第13章连续变量的特征选择与转换13.1方法概述13.2主成分分析13.2.1主成分分析简介13.2.2主成分分析原理13.2.3主成分分析的运用13.2.4在Python中实现主成分分析13.3基于主成分的冗余变量筛选13.4因子分析13.4.1因子分析模型13.4.2因子分析算法13.4.3在Python中实现因子分析第14章客户分群与聚类14.1聚类算法概述14.2聚类算法基本概念14.2.1变量标准化与分布形态转换14.2.2变量的维度分析14.3聚类模型的评估14.4层次聚类14.4.1层次聚类原理14.4.2层次聚类在Python中的实现14.5基于划分的聚类14.5.1kmeans聚类原理14.5.2kmeans聚类