注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2017年5月

出版社:机械工业出版社

以下为《大数据导论》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111565772
  • 1版
  • 227204
  • 47229833-0
  • 平装
  • 16开
  • 2017年5月
  • 262
  • 187
  • 工学
  • 计算机科学与技术
  • TP274
  • 计算机通信类
  • 本科
作者简介
Thomas Erl畅销IT书作者,Arcitura教育机构的创始人,《服务技术杂志》编辑。作为Arcitura教育公司的CEO,Thomas领导研发了国际公认的大数据科学职业认证(Big Data Science Certified Professional,BDSCP)和SOA职业认证(SOA Certificated Professional,SOACP)的课程大纲。
Wajid Khattak Arcitura教育机构的大数据研究人员和培训师。
Dr. Paul Buhler是一位活跃于商业、政府机构和学术领域的经验丰富的专业人士。
查看全部
内容简介
本书是面向商业和技术专业人员的大数据权威指南,清楚地介绍了大数据相关的概念、理论、术语与基础技术,并使用真实连贯的商业案例以及简单的图表,帮助读者更清晰地理解大数据技术。本书可作为高等院校相关专业”大数据基础”、”大数据道路”等课程的教材,也可供有一定实践经验的软件开发人员、管理人员和所有对大数据感兴趣的人士阅读。
目录
目  录译者序致谢作者简介第一部分 大数据基础第1章 理解大数据31.1 概念与术语41.1.1 数据集41.1.2 数据分析51.1.3 数据分析学51.1.4 商务智能111.1.5 关键绩效指标111.2 大数据特征121.2.1 容量121.2.2 速率131.2.3 多样性131.2.4 真实性141.2.5 价值141.3 不同数据类型151.3.1 结构化数据161.3.2 非结构化数据171.3.3 半结构化数据171.3.4 元数据181.4 案例学习背景181.4.1 历史背景181.4.2 技术基础和自动化环境191.4.3 商业目标和障碍201.5 案例学习211.5.1 确定数据特征221.5.2 确定数据类型24第2章 采用大数据的商业动机与驱动252.1 市场动态252.2 业务架构272.3 业务流程管理302.4 信息与通信技术312.4.1 数据分析与数据科学312.4.2 数字化312.4.3 开源技术与商用硬件322.4.4 社交媒体332.4.5 超连通社区与设备332.4.6 云计算342.5 万物互联网352.6 案例学习35第3章 大数据采用及规划考虑393.1 组织的先决条件403.2 数据获取403.3 隐私性403.4 安全性413.5 数据来源423.6 有限的实时支持433.7 不同的性能挑战433.8 不同的管理需求433.9 不同的方法论443.10 云443.11 大数据分析的生命周期453.11.1 商业案例评估453.11.2 数据标识473.11.3 数据获取与过滤473.11.4 数据提取483.11.5 数据验证与清理493.11.6 数据聚合与表示503.11.7 数据分析523.11.8 数据可视化523.11.9 分析结果的使用533.12 案例学习543.12.1 大数据分析的生命周期553.12.2 商业案例评估553.12.3 数据标识563.12.4 数据获取与过滤563.12.5 数据提取573.12.6 数据验证与清理573.12.7 数据聚合与表示573.12.8 数据分析573.12.9 数据可视化583.12.10 分析结果的使用58第4章 企业级技术与大数据商务智能594.1 联机事务处理604.2 联机分析处理604.3 抽取、转换和加载技术614.4 数据仓库614.5 数据集市624.6 传统商务智能624.6.1 即席报表634.6.2 仪表板634.7 大数据商务智能654.7.1 传统数据可视化654.7.2 大数据的数据可视化664.8 案例学习674.8.1 企业技术674.8.2 大数据商务智能68第二部分 存储和分析大数据第5章 大数据存储的概念715.1 集群725.2 文件系统和分布式文件系统725.3 NoSQL735.4 分片745.5 复制755.5.1 主从式复制765.5.2 对等式复制775.6 分片和复制805.6.1 结合分片和主从式复制805.6.2 结合分片和对等式复制815.7 CAP定理825.8 ACID855.9 BASE885.10 案例学习91第6章 大数据处理的概念936.1 并行数据处理936.2 分布式数据处理946.3 Hadoop946.4 处理工作量956.4.1 批处理型956.4.2 事务型956.5 集群966.6 批处理模式976.6.1 MapReduce批处理976.6.2 Map和Reduce任务986.6.3 MapReduce的简单实例1036.6.4 理解MapReduce算法1046.7 实时模式处理1076.7.1 SCV原则1076.7.2 事件流处理1106.7.3 复杂事件处理1106.7.4 大数据实时处理与SCV1106.7.5 大数据实时处理与MapReduce1116.8 案例学习1126.8.1 处理工作量1126.8.2 批处理模式处理1126.8.3 实时模式处理113第7章 大数据存储技术1157.1 磁盘存储设备1157.1.1 分布式文件系统1167.1.2 RDBMS数据库1177.1.3 NoSQL数据库1197.1.4 NewSQL数据库1287.2 内存存储设备1297.2.1 内存数据网格1317.2.2 内存数据库1387.3 案例学习141第8章 大数据分析技术1438.1 定量分析1448.2 定性分析1458.3 数据挖掘1458.4 统计分析1468.4.1 A/B测试1468.4.2 相关性分析1478.4.3 回归性分析1498.5 机器学习1508.5.1 分类(有监督的机器学习)1518.5.2 聚类(无监督的机器学习)1528.5.3 异常检测1528.5.4 过滤1538.6 语义分析1548.6.1 自然语言处理1558.6.2 文本分析1558.6.3 情感分析1568.7 视觉分析1578.7.1 热点图1578.7.2 时间序列图1598.7.3 网络图1608.7.4 空间数据制图1618.8 案例学习1628.8.1 相关性分析1628.8.2 回归性分析1628.8.3 时间序列图1638.8.4 聚类1638.8.5 分类163附录A 案例结论165索引167