- 1.1.1、基本要求
- 1.1.2、网页搜索基础简介
- 1.1.3、预处理基础简介
- 1.1.4、查询服务基础简介
- 1.1.5、体系结构
- 2.1、页面搜集原理、技术和系统基础知识
- 2.2、页面搜集原理、技术和系统搜集过程
- 2.3、页面搜集原理、技术和系统天网存储结构定义
- 2.4、页面搜集原理、技术和系统如何避免网页重复搜集
- 2.5、页面搜集原理、技术和系统如何首先搜集重要的网页
- 2.6、页面搜集原理、技术和系统可扩展搜索子系统
- 2.6.1、可扩展搜索子系统节点间URL的划分策略
- 2.6.2、可扩展搜索子系统系统的动态可配置性设计
- 3.1、搜集信息的预处理系统结构
- 3.1.1、搜集信息的预处理索引网页库
- 3.1.2、搜集信息的预处理中文分词技术
- 3.1.3、搜集信息的预处理分析页面和建立倒排文件
- 3.2、搜集信息的预处理网页净化和消重
- 3.2.1、搜集信息的预处理净化与数据提取
- 3.2.2、搜集信息的预处理网页消重
- 4.1、搜集引擎信息查询服务网页信息检索
- 4.2、搜集引擎信息查询服务中文自动摘要
- 4.3、搜集引擎信息查询服务生成搜索结果页
- 4.4、搜集引擎信息查询服务搜索结果页缓存
- 5.1、用户行为分析用户查询与点击日志
- 5.2、用户行为分析查询日志分析
- 5.3、用户行为分析点击日志分析
- 6.1、相关排序网页权重的计算
- 6.2、相关排序网页词项权重的计算
- 6.3、相关排序链接权值的计算
- 6.4、相关排序用户评价权值的计算
- 6.5、相关排序最终权值的计算
- 7、中文网页自动分类技术
- 8、总结
- 附1、WIN7下使用Virtualbox安装Ubuntu
- 附2、如何搭建TSE搜索引擎
- 附3、如何让TSE搜索引擎重新抓取网页
现在我们大部分人,已经每天都离不开搜索引擎,都需要经常性在搜索引擎上查询各种资料。
我们都知道,现在网络上的网页数量大的惊人,数量如些大的网页数量,搜索引擎到底是如何工作的呢?
搜索引擎系统工作步骤和原理视频,就把它的原理分享给大家。
虽然搜索引擎的首页看着设计的极简单,事实上它的技术难度还是极大的,从输入关键词,到百度给出搜索结果的过程,往往仅需几毫秒即可完成。百度是如何在浩如烟海的互联网资源中,以如此之快的速度将您的网站内容展现给用户?这背后蕴藏着什么样的工作流程和运算逻辑?
搜索引擎为用户展现的每一条搜索结果,都对应着互联网上的一个页面。每一条搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取、过滤、建立索引和输出结果。
虽然具体的技术极复杂,但原理并没有想象中的麻烦。
对于多们大数人来讲,根本没有必要知道过清楚搜索引擎的具体技术,只需要知道大概的原理就足够了。
如果你不太了解,可以听一听这个讲座。
在相对较短的时间内,这个讲座把搜索引擎的原理讲解的通俗易懂。
- Copyright (c) M.51xue8.com 版权所有
- 豫ICP备12005873号-1
- 51学吧,免费学习平台,活到老学到老。