ASP300源码

ASP300首页 > 站长学堂 > 搜索引擎

360搜索常见算法总要讲解

2017-11-28 【安徽房产资质代办
 ICO算法:

 ICO 全称:Index clear optimize,简单来说就是处理重复内容的算法,这是继Google、百度之后,又一家敢公布算法的搜索引擎,也是自信的一种表现。

 ICO算法是对已经入索引库的低质量URL和无效URL数据进行清理的算法,在不同的阶段会对不同类型的无效数据进行清理,该算法是一个长期执行的算法。

 算法公布规范:一次清理超过10亿页面的算法360搜索都将提前公布告知站长,并告知算法优化处理的主要方向。

 处理量级:10亿以上

 处理网页特点:该算法主要是针对重复内容进行清理,对用户没有价值的内容页面,内容时效性强且过期的页面,采集站类,URL地址含有无效参数的页面等。

 例如:招聘类网站不同子站中内容相同的页面,小说采集站尤其处理对用户无价值的页面,旧新闻页且内容重复的页面也会处理一部分,以及其他的部分无效页面。


悟空算法

 “悟空”算法:

 针对网站被黑现象,360搜索研发并上线了“悟空”算法,可以快速准确地识别针对网站的各种黑客攻击行为,及时发现被黑网站,有效减少网站被黑的不良影响,保护网站安全。

 360搜索致力于为网民提供安全可信的搜索结果,新上线的“悟空算法”,将与360安全卫士、360浏览器等安全产品一起,全方位保护上网用户安全,避免遭受被黑网站伤害。

 “悟空”算法2.0:

 这是目前360最新升级的算法,360平台介绍针对日趋严重的网站被黑现象,对原有悟空算法进行了升级,新发布“悟空算法2.0”。能更加准确快速地识别各种网站被黑客攻击的行为,降低恶意网站在搜索引擎中的不良展现和对用户的影响,严厉打击此类针对360搜索的作弊行为。

后羿算法

 “后羿”算法:

 对于内容丰富的优质网页(如原创、稀缺资源、精心编辑的内容页等),会增加其在用户面前展现的机会;对于滥用采集手段的行为(如整站大规模采集,页面内容拼凑、含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等),会显著降低其展现机会和网页收录量。