注册 登录 进入教材巡展
#

出版时间:2025-08

最新印次日期:2025-8

出版社:中国铁道出版社

以下为《人工智能交互技术及应用》的配套数字资源,这些资源在您购买图书后将免费附送给您:
试读
  • 中国铁道出版社
  • 9787113319700
  • 1版
  • 572100
  • 16开
  • 2025-08
  • 工学
  • 计算机类
  • 计算机类
  • 本科
作者简介
王菲菲,吉林外国语大学人工智能学院副院长,美国新泽西城市大学博士,讲授大学计算机、办公自动化、大数据技术导论、现代教育技术、人工智能等相关课程,主持省级及以上教科研项目12项,公开发表省级及以上论文33篇(EI论文2篇)。

刘伟,科大讯飞人才培养业务部教学运营部院校教学负责人,高级工程师,多年IT从业经验,曾服务于吉林省人社厅、长春市政府、吉林银行等政府与大型企业的信息研发部门,参与社保、医保、企业管理、移动互联网等多个行业的智能软件研发、设计、管理工作。
查看全部
内容简介
本书是普通高等教育“十四五”人工智能专业系列教材之一,结合科大讯飞公司的人工智能交互技术,讲解智能语音技术和计算机视觉技术的基本原理与应用方法,同时提供实验案例及代码示例。全书共8章,内容包括Python与Anaconda环境配置、语音特征分析技术、语音降噪算法、MFCC特征提取技术、声纹识别技术、AIUI平台语音技术应用、计算机视觉技术与应用和人工智能交互系统设计案例。
本书引入企业技术与真实案例,凸显应用性与前沿性。每章附视频讲解及代码资源,助力读者通过实践深化知识的理解与掌握。
本书适合作为普通高等院校人工智能专业、数据科学与大数据等专业的教材,也可作为人工智能交互技术爱好者的参考书。
目录
第1章Python与Anaconda环境配置1
1.1Python编程语言1
1.2Anaconda环境介绍3
1.3IDE与PyCharm介绍3
1.3.1IDE基础4
1.3.2PyCharm基础4
1.4Anaconda安装与基本配置5
1.4.1相关知识6
1.4.2环境要求6
1.4.3安装与测试步骤6
小结12
思考与练习112
第2章语音特征分析技术13
2.1语音特征概述13
2.1.1语音特征的概念13
2.1.2语音特征分析技术的主要应用场景14
2.1.3语音特征与其他技术类型特征15
2.1.4语音特征的分类及主要特征信息17
2.1.5语音信号特征提取的工作原理17
2.2语音特征提取开发环境的构建18
2.2.1语音处理库Librosa的介绍18
2.2.2语音处理库Librosa的安装与使用19
2.3语音特征提取实验20
2.3.1语音特征提取实验介绍21
2.3.2实验程序框架说明21
2.3.3实验数据集说明22
2.3.4语音信号时域特征提取实验代码实现22
2.3.5语音信号频域特征提取实验代码实现25
2.3.6实验最终效果与评价27
小结27
思考与练习228
第3章语音降噪算法29
3.1噪声抑制技术29
3.1.1噪声概述29
3.1.2语音降噪及其意义30
3.1.3噪声抑制技术31
3.2谱减法33
3.2.1谱减法降噪的基本原理33
3.2.2谱减法降噪的关键步骤33
3.2.3谱减法的优缺点34
3.3基于谱减法的语音降噪实验35
3.3.1术语解释35
3.3.2谱减法语音降噪代码实现36
3.4基于维纳滤波法的语音降噪实验38
3.4.1术语解释38
3.4.2维纳滤波法语音降噪代码实现40
3.5音频降噪效果对比与分析43
3.5.1输入与输出43
3.5.2结果分析44
3.5.3谱减法的改进与优化45
3.5.4维纳滤波法的改进与优化46
小结47
思考与练习347
第4章MFCC特征提取技术48
4.1MFCC特征概述48
4.1.1MFCC特征的概念48
4.1.2MFCC特征应用及重要性49
4.2MFCC特征提取流程介绍50
4.2.1MFCC特征提取流程50
4.2.2Librosa库介绍50
4.3基于Librosa工具的MFCC特征自动化提取实验51
4.3.1实验介绍51
4.3.2实验程序框架说明52
4.3.3实验数据集说明52
4.3.4实验代码实现53
4.3.5实验最终效果与评价55
4.4基于Librosa实现MFCC特征的计算过程实验56
4.4.1实验介绍56
4.4.2实验程序框架说明57
4.4.3实验数据集说明57
4.4.4实验代码实现57
4.4.5实验最终效果与评价62
小结64
思考与练习464
第5章声纹识别技术65
5.1声纹识别概述65
5.1.1声纹识别概念65
5.1.2声纹识别的任务及应用场景66
5.1.3声纹识别与其他生物识别技术的对比67
5.1.4声纹识别与语音识别的对比68
5.1.5声纹识别技术原理69
5.1.6声纹识别流程70
5.1.7MFCC-GMM联合模型算法原理70
5.2基于Scikit-learn的声纹模型库构建的API介绍72
5.2.1Librosa的API功能介绍72
5.2.2GMM的调用方法介绍73
5.3声纹识别实验74
5.3.1实验介绍74
5.3.2实验程序框架说明75
5.3.3实验数据集说明75
5.3.4实验代码实现77
5.3.5实验结果与评价81
小结82
思考与练习582
第6章AIUI平台语音技术应用83
6.1讯飞开放平台83
6.1.1讯飞开放平台介绍83
6.1.2讯飞开放平台使用方法84
6.2UI功能调用的通信原理89
6.2.1语音识别通信原理89
6.2.2语音合成通信原理90
6.3基于WebSocket和Flask的双向通信90
6.3.1WebSocket介绍91
6.3.2Flask介绍91
6.3.3Flask+WebSocket双向通信92
6.4信息加密与鉴权93
6.5语音识别实验94
6.5.1语音识别实验介绍94
6.5.2实验程序框架说明95
6.5.3语音识别实验代码实现95
6.5.4实验效果与评价103
6.6语音合成实验103
6.6.1语音合成实验介绍103
6.6.2实验程序框架说明104
6.6.3语音合成实验代码实现104
6.6.4实验最终效果与评价111
小结111
思考与练习6112
第7章计算机视觉技术与应用113
7.1计算机视觉与深度学习113
7.1.1计算机视觉113
7.1.2深度学习114
7.2开源深度学习算法库介绍115
7.2.1TensorFlow和Keras115
7.2.2PyTorch116
7.2.3OpenCV116
7.2.4其他常用深度学习库117
7.3CUDA+CUDNN+TensorFlow计算环境搭建117
7.3.1CUDA与CUDNN介绍118
7.3.2CUDA和CUDNN的安装与配置118
7.3.3TensorFlow的安装与环境配置119
7.3.4安装CUDA和CUDNN遇到的常见问题119
7.4基于LeNet5网络模型的手写数字识别实验119
7.4.1实验介绍119
7.4.2实验程序框架说明120
7.4.3实验数据集说明121
7.4.4手写数字识别代码实现125
7.4.5实验结果128
7.5性能分析与算法优化128
7.5.1性能分析概述与优化128
7.5.2性能优化工具129
小结129
思考与练习7130
第8章人工智能交互系统设计案例131
8.1系统构成131
8.1.1系统概述131
8.1.2需求分析131
8.1.3设计原则132
8.1.4系统组成133
8.2模块与流程135
8.2.1综合管控135
8.2.2视频智能监控142
8.2.3智慧园区147
8.2.4AR实景地图148
8.2.5园区智能通150
8.2.6车辆智能管控161
8.2.7智能报警检测173
8.2.8智能运维与系统管理178
8.3基于组件封装的程序构架181
8.3.1业务架构181
8.3.2逻辑架构182
8.3.3部署架构183
8.3.4部分核心功能的程序代码实现183
8.4系统运行与性能测试197
8.4.1系统运行环境197
8.4.2性能测试198
8.5软件工程原理实践——系统的可持续性维护200
小结202
思考与练习8202