注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2018年11月

出版社:机械工业出版社

以下为《高性能计算系统与大数据分析》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111611752
  • 1版
  • 262573
  • 44219535-0
  • 16开
  • 2018年11月
  • 374
  • 288
  • 计算机科学与技术
  • 计算机通信类
  • 本科
内容简介
大数据时代,数据的规模、速度、范围和结构对计算、存储和网络基础设施提出了更高的要求,如何构建更加高效的基础设施对于获得良好的大数据分析结果至关重要。本书从大数据分析中对高性能技术的需求讲起,分析了进行高性能大数据分析需要的网络基础设施、存储基础设施,如何使用高性能计算进行实时分析,高性能计算范型,大数据分析中的高性能集成系统、数据库和数据仓库,高性能大数据分析的可视化等内容。
目录
译者序序前言第1章 IT领域的变革以及未来趋势11.1 引言11.2 新兴的IT趋势11.3 数字化实体的实现与发展41.4 物联网/万物互联51.5 对社交媒体网站的广泛采用71.6 预测性、规范性、个性化分析时代71.7 用于大数据及分析的Apache Hadoop111.8 大数据、大洞见、大动作131.9 结论151.10 习题15第2章 大数据/快速数据分析中的高性能技术162.1 引言162.2 大数据分析学科的出现172.3 大数据的战略意义182.4 大数据分析的挑战192.5 高性能计算范型192.6 通过并行实现高性能的方法212.7 集群计算222.8 网格计算242.9 云计算272.10 异构计算292.11 用于高性能计算的大型机312.12 用于大数据分析的超级计算322.13 用于大数据分析的设备322.13.1 用于大规模数据分析的数据仓库设备332.13.2 in-memory大数据分析352.13.3 大数据的in-database处理372.13.4 基于Hadoop的大数据设备382.13.5 高性能大数据存储设备412.14 结论422.15 习题42参考文献43第3章 大数据与快速数据分析对高性能计算的渴望443.1 引言443.2 重新审视大数据分析范型453.3 大数据和快速数据的含义473.4 用于精确、预测性、规范性洞见的新兴数据源483.5 大数据分析为何不俗503.6 传统的和新一代的数据分析案例研究513.7 为何采用基于云的大数据分析553.8 大数据分析:主要处理步骤573.9 实时分析583.10 流分析623.11 传感器分析633.11.1 大数据分析与高性能计算的同步:附加价值633.12 结论643.13 习题64第4章 高性能大数据分析的网络基础设施654.1 引言654.2 当前网络基础设施的局限664.3 高性能大数据分析网络基础设施的设计方法684.3.1 网络虚拟化684.3.2 软件定义网络764.3.3 网络功能虚拟化784.4 用于传输大数据的广域网优化794.5 结论814.6 习题81参考文献81第5章 高性能大数据分析的存储基础设施825.1 引言825.2 直连式存储835.2.1 DAS的缺点845.3 存储区域网络855.3.1 块级访问855.3.2 文件级访问855.3.3 对象级访问855.4 保存大数据的存储基础设施需求865.5 光纤通道存储区域网络875.6 互联网协议存储区域网络885.6.1 以太网光纤通道885.7 网络附属存储895.8 用于高性能大数据分析的流行文件系统895.8.1 Google文件系统895.8.2 Hadoop分布式文件系统915.8.3 Panasas925.8.4 Luster文件系统945.9 云存储简介965.9.1 云存储系统的架构模型965.9.2 存储虚拟化985.9.3 云存储中使用的存储优化技术1005.9.4 云存储的优点1015.10 结论1015.11 习题101参考文献102进一步阅读102第6章 使用高性能计算进行实时分析1036.1 引言1036.2 支持实时分析的技术1036.2.1 in-memory处理1036.2.2 in-database分析1056.3 大规模在线分析1066.4 通用并行文件系统1076.4.1 GPFS用例1076.5 GPFS客户案例研究1116.5.1 广播公司:VRT1116.5.2 石油公司从Lustre迁移到GPFS1136.6 GPFS:关键的区别1136.6.1 基于GPFS的解决方案1146.7 机器数据分析1146.7.1 Splunk1146.8 运营分析1156.8.1 运营分析中的技术1156.8.2 用例以及运营分析产品1166.8.3 其他IBM运营分析产品1176.9 结论1176.10 习题118第7章 高性能计算范型1197.1 引言1197.2 为何还需要大型机1197.3 大型机中HPC是如何演化的1207.3.1 成本:HPC的一个重要因素1207.3.2 云计算中的集中式HPC1207.3.3 集中式HPC的要求1217.4 HPC远程模拟1217.5 使用HPC的大型机解决方案1217.5.1 智能大型机网格1217.5.2 IMG的工作原理1227.5.3 IMG架构1227.6 架构模型1257.6.1 具有共享磁盘的存储服务器1257.6.2 没有共享磁盘的存储服务器1257.6.3 无存储服务器的通信网络1257.7 对称多处理1267.7.1 什么是SMP1267.7.2 SMP与集群方法1267.7.3 SMP是否真的重要1267.7.4 线程模型1277.7.5 NumaConnect技术1277.8 用于HPC的虚拟化1277.9 大型机方面的创新1277.10 FICON大型机接口1287.11 大型机对手机的支持1297.12 Windows高性能计算1297.13 结论1307.14 习题131第8章 in-database处理与in-memory分析1328.1 引言1328.1.1 分析工作负载与事务工作负载的对比1328.1.2 分析工作负载的演化1338.1.3 传统分析平台1358.2 in-database分析1358.2.1 架构1378.2.2 优点和局限1388.2.3 代表性的系统1388.3 in-memory分析1408.3.1 架构1418.3.2 优点和局限1428.3.3 代表性的系统1428.4 分析设备1458.4.1 Oracle Exalytics1458.4.2 IBM Netezza1458.5 结论1478.6 习题147参考文献148进一步阅读148第9章 大数据/快速数据分析中的高性能集成系统、数据库和数据仓库1499.1 引言1499.2 下一代IT基础设施和平台的关键特征1509.3 用于大