注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2019年12月

出版社:机械工业出版社

以下为《数据流机器学习:MOA实例》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111641391
  • 1版
  • 283815
  • 47229629-2
  • 平装
  • 16开
  • 2019年12月
  • 317
  • 211
  • 工学
  • 软件工程
  • 计算机通信类
  • 本科
内容简介
这本书首先简要介绍了机器学习的主题,涵盖了大数据挖掘、数据流挖掘的基本方法,以及一个简单的MOA示例。接下来进行更详细的讨论,其中有关于草图技术、变更、分类、集成方法、回归、聚类和频繁模式挖掘的章节。这些章节中的大部分内容包括练习、基于MOA的实验,或者两者都有。*后,本书讨论了MOA软件,涵盖了MOA图形用户界面、命令行、其API的使用以及MOA中新方法的开发。对于那些想要使用数据流挖掘作为工具的读者、数据流挖掘的研究人员,以及想要为MOA创建新算法的程序员来说,这本书将是一个重要的参考。

本书分成三个部分。*部分简要地介绍大数据流挖掘,包含三章。前两章介绍大数据流及其基本挖掘方法。后一章是MOA上手指南,读者可以作为参考,自行探索MOA。第二部分详细地展现了数据流挖掘中的常见问题和重要算法。由于涉及的知识面广阔,本书优先讲解MOA中已涵盖的算法。该部分*章提到了sketch技巧,本书认为数据流挖掘领域人员很有必要对该技巧加以了解。大部分章节含有一套练习题或MOA上手教程,或两者兼具。第三部分全篇讲解MOA,从用户界面开始,到命令行和API,*后讲解如何实现新方法。

目录
译者序前言第一部分 概述第1章 简介 21.1 大数据 21.1.1 工具:开源革命 41.1.2 大数据带来的挑战 41.2 实时分析 61.2.1 数据流 61.2.2 时间和内存 61.2.3 应用一览 61.3 关于本书 7第2章 大数据流挖掘 82.1 算法 82.2 分类算法 92.2.1 如何在数据流中评估分类器 102.2.2 多数类分类器 112.2.3 无变化分类器 112.2.4 惰性分类器 112.2.5 朴素贝叶斯分类器 122.2.6 决策树分类器 122.2.7 集成分类器 132.3 回归算法 132.4 聚类算法 142.5 频繁模式挖掘 14第3章 MOA的实际操作介绍 163.1 入门开始 163.2 分类模型的图形用户界面 183.3 用命令行操作 23第二部分 数据流挖掘第4章 数据流和Sketch数据结构 264.1 背景知识:近似算法 274.2 集中不等式 284.3 取样 304.4 统计总数 314.5 去重统计 324.5.1 线性计数 334.5.2 科恩对数计数器 334.5.3 Flajolet-Martin计数器和HyperLogLog算法 344.5.4 应用:图论的计算距离函数 364.5.5 讨论:对数与线性 374.6 频率问题 374.6.1 SpaceSaving sketch 384.6.2 CM-Sketch算法 404.6.3 CountSketch算法 424.6.4 时刻计算 444.7 滑动窗口的指数矩形图 454.8 分布式sketch计算的可合并性 474.9 一些技术方面的讨论和其他资料 484.9.1 哈希函数 484.9.2 创建(, )近似算法 494.9.3 其他sketch技术 494.10 练习 50第5章 处理变化 525.1 数据流中变化的定义 525.2 评估器 565.2.1 滑动窗口和线性评估器 575.2.2 指数加权移动平均评估器 575.2.3 单维度卡尔曼滤波器 585.3 变化探测 585.3.1 评估变化探测 595.3.2 CUSUM测试和Page-Hinkley测试 595.3.3 统计测试 605.3.4 漂移探测法 615.3.5 自适应滑动窗口算法 625.4 与其他Sketch和多维数据结合 645.5 练习 64第6章 分类 666.1 分类器评估 676.1.1 误差估算 686.1.2 分布评估 696.1.3 性能的评估测量 706.1.4 统计显著性 726.1.5 测量挖掘成本 736.2 基线分类器 736.2.1 多数类 736.2.2 无变化分类器 746.2.3 朴素贝叶斯 746.2.4 多项式朴素贝叶斯 776.3 决策树 786.3.1 估算切分标准 796.3.2 Hoeffding决策树 806.3.3 CVFDT 826.3.4 VFDTc和UFFT 836.3.5 Hoeffding适应树 846.4 处理数字属性 856.4.1 VFML 856.4.2 穷举二叉树 866.4.3 Greenwald和 Khanna的分位数摘要 866.4.4 高斯近似 876.5 感知器模型 886.6 惰性学习 896.7 多标签分类器 896.8 主动学习 916.8.1 随机策略 926.8.2 固定不确定策略 936.8.3 可变不确定策略 936.8.4 随机不确定策略 946.9 概念演变 946.10 MOA实战操作 95第7章 集成方法 997.1 准确率加权集成 997.2 加权多数算法 1007.3 堆叠算法 1027.4 装袋算法 1027.4.1 在线装袋算法 1037.4.2 装袋算法如何应对数据流变化 1037.4.3 杠杆装袋算法 1037.5 提升算法 1047.6 Hoeffding树集成算法 1057.6.1 Hoeffding选项树算法 1057.6.2 随机森林算法 1057.6.3 有限的Hoeffding树的感知器堆叠 1067.6.4 自适应大小的Hoeffding树算法 1077.7 重复性概念 1077.8 MOA实战操作 108第8章 回归 1108.1 什么是回归 1108.2 如何评估回归 1118.3 感知器学习 1128.4 惰性学习 1128.5 决策树学习 1128.6 决策规则 1138.7 MOA中的回归 114第9章 聚类 1159.1 聚类的评估方法 1169.2 k-means算法 1179.3 BIRCH、BICO和CluStream 1189.4 基于密度的方法: DBSCAN和Den-Stream 1209.5 ClusTree 1219.6 StreamKM :核心集 1229.7 延伸阅读 1239.8 MOA实战操作 124第10章 频繁模式挖掘 12710.1 什么是模式挖掘 12710.1.1 模式的定义和例子 12710.1.2 频繁模式挖掘的批量算法 12910.1.3 闭合模式和最大模式 13110.2 数据流中频繁模式挖掘的方法 13110.3 如何在数据流中进行频繁项集挖掘 13410.3.1 简化为高频繁项 13410.3.2 Moment算法 13510.3.3 频繁模式数据流算法 13510.3.4 IncMine算法 13610.4 数据流的频繁子图挖掘 13710.4.1 WinGraphMiner框架 13810.4.2 AdaGraphMiner框架 13910.5 延伸阅读 14010.6 练习 141第三部分 MOA软件第11章 MOA及其软件体系 14411.1 MOA架构 14511.2 安装 14511.3 MOA的近期发展 14511.4 MOA扩展包 14611.5 ADAMS优化 14711.6 MEKA优化 14911.7 OpenML环境 15011.8 StreamDM软件 15011.9 Streams工具 15111.10 Apache SAMOA 流媒体ML库 151第12章 图形用户界面 15412.1 初识图形用户界面 15412.2 分类和回归 15412.2.1 主要任务一览 15612.2.2 数据源和数据生成器 15712.2.3 贝叶斯分类器一览 16012.2.4 决策树一览 16012.2.5 元分类器(集成)一览 16112.2.6 函数分类器一览 16212.2.7 漂移分类器一览 16212.2.8 主动学习分类器 16312.3 聚类 16312.3.1 数据源和数据生成器 16312.3.2 数据流聚类算法一览 16312.3.3 如何进行可视化和数据分析 164第13章 用命令行操作 16613.1 给分类和回归创建学习任务 16613.2 给分类和回归创建评估任务 16713.3 给分类和回归创建学习与评估任务 16713.4 两种分类器的对比 168第14章 调用API 17014.1 MOA对象 17014.2 选项 17014.3 示例:先序评估 173第15章 在MOA中开发新的方法 17515.1 MOA中的主要类 17515.2 创建新的分类器 17615.3 编译分类器 18315.4 MOA中的良好编程方法 183参考文献 185