注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2018年1月

出版社:中国人民大学出版社

以下为《非结构化大数据分析》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 中国人民大学出版社
  • 9787300262970
  • 226916
  • 48213057-2
  • 16开
  • 2018年1月
  • 346
  • 统计学
  • TP274
  • 统计、经管
  • 研究生、本科
内容简介
非结构化大数据分析课程是大数据方向应用统计专业硕士学生的专业必修课,通过本课程的学习使学生能够掌握文本、社会网络、数据流等非结构大数据的分析方法,加深学生对这些方法的原理和思想的理解,培养学生分析和挖掘非结构大数据中的数据模式的能力。
目录
第1章 文本挖掘概述
1.1 时代背景
1.2 文本挖掘与数据挖掘
第2章 文本预处理
2.1 自然语言处理
2.2 分词技术
2.3 文本表示
第3章 文本分类
3.1 预测建模
3.2 决策树分类
3.3 贝叶斯分类
3.4 支持向量机分类
3.5 实践案例———垃圾短信识别
第4章 文本聚类和话题检测
4.1 概述
4.2 基于相似度的文本聚类
4.3 基于模型的文本聚类
4.4 实践案例———用LDA实现话题检测
第5章 情感分析和观点挖掘
5.1 概述
5.2 问题定义
5.3 文档级情感分析
5.4 句子级情感分析
5.5 方面级情感分析
5.6 存在的问题和挑战
5.7 实践案例———发债企业负面新闻识别系统
第6章 社交网络及其统计特性
6.1 社交网络简介
6.2 相关基本概念
6.3 常见统计特性
6.4 实践案例———微博用户关系分析
第7章 社区发现
7.1 概述
7.2 社区发现方法
7.3 社区发现相关的研究领域
7.4 实践案例———用边聚类探测算法发现社区
第8章 个体社会影响力分析
8.1 概述
8.2 个体社会影响力及影响强度度量
8.3 实践案例———用PageRank算法计算个体社会影响力
第9章 链路预测
9.1 简介
9.2 基于相似度的链路预测算法
9.3 基于等级结构模型的链路预测算法
9.4 实践案例———链路预测
第10章 网络信息扩散
10.1 热点主题的发现方法
10.2 信息扩散过程的建模与分析
10.3 实践案例———信息扩散计算过程
第11章 数据流中的数据挖掘
11.1 简介
11.2 数据流中的变化探测
11.3 实时更新数据流中的直方图
11.4 数据流中的聚类
11.5 数据流的分类
11.6 数据流方法的评估
第12章 多媒体数据分析
12.1 概述
12.2 基础知识
12.3 特征提取
12.4 多媒体内容检索
12.5 多媒体内容识别
12.6 国际评测
12.7 问题与挑战