新工科 课程 信息检索与搜索引擎
课程封面
信息检索与搜索引擎
大数据 信息检索 搜索引擎 弹性检索
本课程系统地讲述了信息检索及搜索引擎的基础知识和高级主题,结合lucene这一重要的全文检索工具包和ElasticSearch这一完整分布式多用户的全文搜索引擎,全面展示现代信息检索的相关研究和应用领域。
课程大纲
    第一章 信息检索概论
    1.1 信息检索的基本概念
    1.2 信息检索的发展演变
    1.3 信息检索的系统概要
    1.4 本章测试
    第二章 信息检索的模型与架构
    2.1 信息检索模型
    2.2 TF-IDF与余弦相似度
    2.3 信息检索系统的基本架构
    2.4 谷歌搜索引擎架构解
    2.5 本章测试
    第三章 信息检索系统的评估方法
    3.1 评测的意义
    3.2 常见评估指标
    3.3 综合评估指标
    3.4 标准测试集
    3.5 本章测试
    第四章 Lucene介绍
    4.1 Lucene概述
    4.2 Lucene的安装、部署与调试
    4.3 本章测试
    第五章 Solr介绍
    5.1 Solr概述
    5.2 Solr的安装、部署与调试
    5.3 本章测试
    第六章 ElasticSearch介绍
    6.1 ElasticSearch概述
    6.2 ElasticSearch的安装、部署与调试
    6.3 本章测试
    第七章 网络爬虫
    7.1 网络爬虫概述
    7.2 抓取策略
    7.3 网站的爬虫管理
    7.4 开源网络爬虫
    7.5 本章测试
    第八章 文本处理
    8.1 文本处理概述
    8.2 英文文本处理
    8.3 中文文本处理
    8.4 中文分词的现状与工具包介绍
    8.5 本章测试
    第九章 查询处理
    9.1 查询处理概述
    9.2 查询语言
    9.3 相关反馈
    9.4 查询扩展
    9.5 本章测试
    第十章 文本索引与检索
    10.1 倒排索引
    10.2 倒排索引的搜索与构建
    10.3 倒排索引的维护与性能分析
    10.4 后缀树和后缀数组
    10.5 序列搜索
    10.6 其他索引和检索方法
    10.7 本章测试
    第十一章 文本排序
    11.1 基于链接的网页排序算法
    11.2 查询相关排序算法
    11.3 排序学习
    11.4 排序评估方法
    11.5 本章测试
    第十二章 ElasticSearch集群
    12.1 分布式集群的概念与操作
    12.2 分布式集群的安全
    12.3 数据输入与输出
    12.4 分布式文档存储
    12.5 本章测试
    第十三章 ElasticSearch索引与搜索
    13.1 ElasticSearch基本搜索
    13.2 映射与分析
    13.3 请求体查询
    13.4 分布式检索
    13.5 索引管理
    13.6 深入搜索
    13.7 本章测试
    第十四章 ElasticSearch高级主题
    14.1 聚合
    14.2 地理位置
    14.3 百度ElasticSearch实践
    14.4 本章测试
课件资源
  • 视频数

    73
  • 文档数

    59
  • 题目数

    227

如果您想对我们的产品和服务更进一步了解
请用下面的方式和我们联系

电子邮箱:business@yundaxue.org(会在1个工作日之内和您接洽)

联系电话:400-828-1210(周一至周五 9:00-18:00 )