ASP300源码

ASP300首页 > 站长学堂 > 搜索引擎

搜索引擎的排名是这样的?

2018-10-14 【合肥育婴师培训
① 文本采集
搜索引擎爬虫组件:用来发现和抓取信息源,将抓取的信息源中的文档转换为文本或某种数据形式,然后存储到搜索引擎数据库中。
② 文本转换
解析器组件:用来处理文本转换,比如分词、停止词去除、词干提取、超链接提取等。
③ 索引的创建
搜索引擎需要先统计文档,对文档进行加权,倒排,索引分派等。
④ 用户交互
用户在搜索引擎窗口中只需要输入查询词,然后就可以一键显示结果。但搜索引擎需要接受这些查询词,进行分词处理、词干提取、去停用词等查询转换操作,筛选出与查询词相关的结果。
⑤ 排序
通过一定的排序算法,将已经得到的相关结果进行索引排序。
⑥ 评价
通过大量日志为参考数据,对页面排名进行调整,从而改善搜索引擎系统带给用户的搜索体验。