全国大中专教材网络采选系统

推荐纸质教材推荐数字资源

Python数据科学：技术详解与商业实践

定价：￥99.00

作者：常国珍，赵仁乾等

出版时间：2018-07

出版社：机械工业出版社

以下为《Python数据科学：技术详解与商业实践》的配套数字资源，这些资源在您购买图书后将免费附送给您：

关闭

基本信息评价

出版社：机械工业出版社
ISBN：9787111603092
版次：1版
本季征订号：44208981-9
开本：16开
出版时间：2018-07
适用专业：计算机通信类
适用分级：本科

内容简介

本书共19章，第1章介绍数据科学中涉及的基本领域；第2～3章介绍与数据工作紧密相关的Python语言基础；第4章讲解描述性统计分析在宏观业务领域的分析；第5章讲解数据规整、清洗的重要技能；第6章介绍数据科学领域实用的四大统计检验；第7章讲解当被解释变量为连续变量时，如何使用线性回归作预测；第8章讲解使用逻辑回归作评分卡模型；第9章讲解另外一个可解释模型——决策树。第10～12章分别讲解了BP神经网络、朴素贝叶斯、近邻域、支持向量机的原理和在决策类模型中的运用；第13～14章作为一个整体讲解商业分析场景下的信息压缩；第15章以产品推荐作为案例，讲解发现事件与事件伴生关系的关联分析和序列分析算法；第16章使用欺诈识别案例讲解当被解释变量分布极端不平衡时的处理方法；第17章继续使用欺诈识别案例讲解集成学习算法；第18章讲解了使用效应分解和ARIMA方法实现宏观业务指标预测；第19章用案例展现了分类和聚类模型的CRISP-DM和SEMMA流程。

目录前言第1章数据科学家的武器库1.1数据科学的基本概念1.2数理统计技术1.2.1描述性统计分析1.2.2统计推断与统计建模1.3数据挖掘的技术与方法1.4描述性数据挖掘算法示例1.4.1聚类分析——客户细分1.4.2关联规则分析1.5预测性数据挖掘算法示例1.5.1决策树1.5.2KNN算法1.5.3Logistic回归1.5.4神经网络1.5.5支持向量机1.5.6集成学习1.5.7预测类模型讲解1.5.8预测类模型评估概述第2章Python概述2.1Python概述2.1.1Python简介2.1.2Python与数据科学2.1.3Python2与Python32.2Anaconda Python的安装、使用2.2.1下载与安装2.2.2使用Jupyter Notebook2.2.3使用Spyder2.2.4使用conda或pip管理第三方库第3章数据科学的Python编程基础3.1Python的基本数据类型3.1.1字符串(str)3.1.2浮点数和整数（float、int）3.1.3布尔值（Bool：True/False）3.1.4其他3.2Python的基本数据结构3.2.1列表（list）3.2.2元组（tuple）3.2.3集合（set）3.2.4字典（dict）3.3Python的程序控制3.3.1三种基本的编程结构简介3.3.2顺承结构3.3.3分支结构3.3.4循环结构3.4Python的函数与模块3.4.1Python的函数3.4.2Python的模块3.5Pandas读取结构化数据3.5.1读取数据3.5.2写出数据第4章描述性统计分析与绘图4.1描述性统计进行数据探索4.1.1变量度量类型与分布类型4.1.2分类变量的统计量4.1.3连续变量的分布与集中趋势4.1.4连续变量的离散程度4.1.5数据分布的对称与高矮4.2制作报表与统计制图4.3制图的步骤第5章数据整合和数据清洗5.1数据整合5.1.1行列操作5.1.2条件查询5.1.3横向连接5.1.4纵向合并5.1.5排序5.1.6分组汇总5.1.7拆分、堆叠列5.1.8赋值与条件赋值5.2数据清洗5.2.1重复值处理5.2.2缺失值处理5.2.3噪声值处理5.3RFM方法在客户行为分析上的运用5.3.1行为特征提取的RFM方法论5.3.2使用RFM方法计算变量5.3.3数据整理与汇报第6章数据科学的统计推断基础6.1基本的统计学概念6.1.1总体与样本6.1.2统计量6.1.3点估计、区间估计和中心极限定理6.2假设检验与单样本t检验6.2.1假设检验6.2.2单样本t检验6.3双样本t检验6.4方差分析（分类变量和连续变量关系检验）6.4.1单因素方差分析6.4.2多因素方差分析6.5相关分析（两连续变量关系检验）6.5.1相关系数6.5.2散点矩阵图6.6卡方检验（二分类变量关系检验）6.6.1列联表6.6.2卡方检验第7章客户价值预测：线性回归模型与诊断7.1线性回归7.1.1简单线性回归7.1.2多元线性回归7.1.3多元线性回归的变量筛选7.2线性回归诊断7.2.1残差分析7.2.2强影响点分析7.2.3多重共线性分析7.2.4小结线性回归诊断7.3正则化方法7.3.1岭回归7.3.2LASSO回归第8章Logistic回归构建初始信用评级8.1Logistic回归的相关关系分析8.2Logistic回归模型及实现8.2.1Logistic回归与发生比8.2.2Logistic回归的基本原理8.2.3在Python中实现Logistic回归8.3Logistic回归的极大似然估计8.3.1极大似然估计的概念8.3.2Logistics回归的极大似然估计8.4模型评估8.4.1模型评估方法8.4.2ROC曲线的概念8.4.3在Python中实现ROC曲线第9章使用决策树进行初始信用评级9.1决策树概述9.2决策树算法9.2.1ID3建树算法原理9.2.2C4.5建树算法原理9.2.3CART建树算法原理9.2.4决策树的剪枝9.3在Python中实现决策树9.3.1建模9.3.2模型评估9.3.3决策树的可视化9.3.4参数搜索调优第10章神经网络10.1神经元模型10.2单层感知器10.3BP神经网络10.4多层感知器的scikitlearn代码实现第11章分类器入门：最近邻域与朴素贝叶斯11.1KNN算法11.1.1KNN算法原理11.1.2在Python中实现KNN算法11.2朴素贝叶斯分类11.2.1贝叶斯公式11.2.2朴素贝叶斯分类原理11.2.3朴素贝叶斯的参数估计11.2.4在Python中实现朴素贝叶斯第12章高级分类器：支持向量机12.1线性可分与线性不可分12.2线性可分支持向量机12.2.1函数间隔和几何间隔12.2.2学习策略12.2.3对偶方法求解12.2.4线性可分支持向量机例题12.3线性支持向量机与软间隔最大化12.4非线性支持向量机与核函数12.4.1核函数12.4.2非线性支持向量机的学习12.4.3示例与Python实现12.5使用支持向量机的案例第13章连续变量的特征选择与转换13.1方法概述13.2主成分分析13.2.1主成分分析简介13.2.2主成分分析原理13.2.3主成分分析的运用13.2.4在Python中实现主成分分析13.3基于主成分的冗余变量筛选13.4因子分析13.4.1因子分析模型13.4.2因子分析算法13.4.3在Python中实现因子分析第14章客户分群与聚类14.1聚类算法概述14.2聚类算法基本概念14.2.1变量标准化与分布形态转换14.2.2变量的维度分析14.3聚类模型的评估14.4层次聚类14.4.1层次聚类原理14.4.2层次聚类在Python中的实现14.5基于划分的聚类14.5.1kmeans聚类原理14.5.2kmeans聚类