注册 登录 进入教材巡展 进入在线书城
#
  • #

出版时间:2017年5月

出版社:机械工业出版社

以下为《大规模元搜索引擎技术》的配套数字资源,这些资源在您购买图书后将免费附送给您:
  • 机械工业出版社
  • 9787111556176
  • 1版
  • 283912
  • 44219682-0
  • 平装
  • 16开
  • 2017年5月
  • 237
  • 158
  • 计算机科学与技术
  • 计算机通信类
  • 本科
内容简介
本书广泛而深入地介绍了大规模元搜索引擎技术,详细讨论了大规模元搜索引擎的主要部件——搜索引擎选择、搜索引擎加入和结果合并,重点关注部件的高度可扩展性和自动化解决方案。作为Web搜索的竞争技术,本书对大规模元搜索引擎技术的可行性进行了强有力的论证。本书可作为高等院校Web数据管理和信息检索等Web技术相关课程的教材,也可作为Web搜索领域的研究人员的参考书。
目录
丛书前言译者序前 言作者简介第1章 绪言 11.1 Web上查找信息 31.1.1 浏览 31.1.2 搜索 41.2 文本检索概述 71.2.1 系统体系结构 71.2.2 文档表示 81.2.3 文档-查询匹配 91.2.4 查询处理 111.2.5 检索有效性度量 131.3 搜索引擎技术概述 141.3.1 Web的专门特性 141.3.2 Web爬虫 151.3.3 利用标签信息 171.3.4 利用链接信息 181.3.5 结果组织 231.4 本书概述 25第2章 元搜索引擎体系结构 272.1 系统体系结构 282.2 为什么使用元搜索引擎技术 332.3 挑战环境 392.3.1 异构及其影响 402.3.2 规范化研究 43第3章 搜索引擎选择 473.1 粗糙表记方法 493.2 基于学习的方法 503.3 基于样本文档的方法 553.4 统计表记方法 593.4.1 D-WISE 593.4.2 CORINet 613.4.3 gGlOSS 633.4.4 潜在有用文档数目 653.4.5 最相似文档的相似度 683.4.6 搜索引擎表记生成 72第4章 搜索引擎加入 774.1 搜索引擎连接 774.1.1 搜索引擎的HTML表单标签 784.1.2 搜索引擎自动连接 814.2 搜索结果抽取 864.2.1 半自动包装器生成 884.2.2 自动包装器生成 93第5章 结果合并 1085.1 基于完全文档内容的合并 1115.2 基于搜索结果记录的合并 1135.3 基于结果本地排序的合并 1195.3.1 基于轮转的方法 1205.3.2 基于相似度转换的方法 1215.3.3 基于投票的方法 1245.3.4 基于机器学习的方法 130第6章 总结与后续研究 132参考文献 136