爱搜客新闻资讯

2017年各大搜索引擎的工作原理分析

时间:2017-03-10 16:40:38 来源:爱搜客

  SEO是什么?SEO就是搜索引擎优化,学习SEO之前,我们先要了解搜索引擎原理。毕竟seo是针对搜索引擎原理操作的,那么弄明白搜索引擎的工作原理。在遇到一些问题的时候,就可以知道产生的原因了。

  2017年各大搜索引擎的工作原理分析:无论是哪个搜索引擎,主要流程都是用下面几个模块组成的:

  具体是:抓取、过滤、收录、索引、排序。

  一:抓取

  1.抓取是怎么样抓取的呢?

  通过链接进行抓取的,站内、站外的链接进行抓取,站外:外链、广告

  通过从上到下、发现这个位置的链接,首页,

  2.怎么让蜘蛛来抓取我们的网站

  高质量、相关的网站发布外链

  可以通过提交,通过百度站长平台提交

  百度的自动抓取,没有提交链接,百度纸质会自动来到你的网站

  3.怎样知道百度蜘蛛有没有来到你的网站呢?

  百度的站长平台:索引量、抓取频次如下图所示:

  2017搜索引擎排名的工作原理

  也可以通过Iis日志,服务器日志:记录一个网站运行的东西,进行查看百度蜘蛛有没有访问你的网站。

  4.不利于蜘蛛抓取的路径:

  中文路径:www.xxxx.xxxx/xxxxx/123/我爱你

  路径太长www.xxxxx.xxxxx/xxxxx/123/images/12465

  http://xxxxx.xxxxx.com/disk/home#list/path=%2F%E6%AF%8F%E5%A4%A9%E8%AF%BE%E7%A8%8B%E5%8F%8A%E7%AC%94%E8%AE%B0

  拒绝蜘蛛抓取:robots屏蔽

  服务器问题:空间的问题,提示503,

  路径最多不雅冲过5层,最好的网站路径不超过3层

  抓取的一些信息放在临时数据库里,

  二:过滤

  1.为什么要过滤:

  存在信息太多,需要过滤垃圾信息需要过滤低质量的页面

  2.影响过滤的因素:

  识别文字、链接能识别,图片、视频不能识别,图片要加ait属性。视频要加文字说明

  3.网站速度慢的:ping测试

  测速度的网站:站长工具

  如下图所示:

  搜索引擎工作原理

  4.国内100毫秒、国外200毫秒

  5.速度网站保证正常访问、网站权重:新站很正常,权重太低网站页面权重流逝

  怎样才算正常

  网站能被访问、上线一个月被收录、建立索引,属于正常

  6.页面的质量:

  是跟我们网站收录有关系的,一个网站产品只有一个图片,就需要自己去做

  网站的页面是空页面,打开都没有内容、内容只有一个、两个

  每个栏目3-5,5-10篇文章

  7.页面的相似度

  页面相似度查询网址:http://tools.aizhan.com/sl/

  如下图所示:

  百度抓取收录的原理

  打开页面相似度网址,输入两个网站文章链接,如上图所示操作,即可看到页面相似度。

  超过80%都会被过滤掉,能够控制在30%-40%就可以了。

  三:收录系统模块

  1当你上面的进行过滤,会给排名,将网站文章的网址复制到百度搜索框进行查询收录,site+域名,全站查询收录,站长平台看到收录

  收录和索引是同等的,

  索引;http://zhanzhang.baidu.com/college/articleinfo?id=806

  1,收录和索引分别指什么

  收录:页面被Baiduspider发现、分析过

  索引:Baiduspider经初步分析后认为有意义,做建库处理

  2,收录和索引的关系

  搜索引擎的抓取与收录机制

  包含关系,先收录才可以建索引,收录量大于索引量。百度站长平台链接提交工具是通往收录的大门。

  3,收录和索引的意义

  【收录意义1】收录是索引的前提,站点需要保持服务器稳定(参考抓取诊断工具、抓取异常工具)、robots正确(《robots写法和需求用法对应表》),为Baiduspider抓取铺平道路

  【收录意义2】Baiduspider只能处理已分析过的页面,面对新旧页301和移动适配,可为已收录页面完成权值评分以及流量切换

  【索引意义1】只有被建入索引库的网页才有获得流量的机会(网页虽然被建入索引库,但获得流量的机会并不同,无效索引很难获得流量)

  【索引意义2】新闻源站点(新闻源目录)内的链接,必须先被网页库建索引,才有机会出现在新闻检索中

  4,如何查询收录量和索引量

  真实索引量只能通过百度站长平台索引量工具查询

  5.有收录才有排名,收录是保证排名的前提

  6.有收录并不一定有排名

  网站有很多页面,并不能保证每个页面都收录,收录不一定会有排名

  7.新站前面收录很慢,是什么问题?

  信用度低、权重地、做好优化、内容更新,最起码每天更新一篇高质量的文章。当你的网站核心词、排名稳定、内容可以选择不做。

  新站上线,百度蜘蛛很快进行抓取、收录,说明你的网站域名好,信用度低

  8.为什么一个页面一个月都没有收录

  因为百度蜘蛛把你的网站当成垃圾网站了,这个时候要去查看自己的网站的内容来源是采集、还是伪原创、怎么查找,把网站内容复制一小段,复制到搜索框,进行查看,如果首页前面十条都出现飘红,说明你的网站内容有问题了。

  9.网站,会放在百度数据库,临时数据库

  四:排序

  1.会经过一系列的算法,进行排序,它把你网站的基础优化进行评分,内容也进行打分,这是打分体系,进行排序

  要做好基础优化,用户投票

  用户占了很大部分,当你的网站跳出率很高,用户体验,所以用户投票占据很大部分。

  比如你搜索一个词的时候,排名,点击百度在进行计算,不是你点击就立刻进行计算的,是已经计算好的。

  一二属于抓取、过滤系统,三四属于收录、排序系统,这就是搜索引擎原理,关注爱搜客学习更多SEO知识。

  2017年各大搜索引擎的工作原理基本还是这个流程,抓取、过滤、收录、索引、排序

相关新闻

  • 【网站SEO推广】文案写作5个关键要点

    【网站SEO推广】文案写作5个关键要点

    网站SEO推广中,往往SEO新人在写文案的时候,却不知第一步该怎么做?可能又有些人认为就是根据产品特征、用户的诉求。而爱搜客SEO顾问大卫分析认为写作文案的要点:第一步就是确定文案目的,这也是不少SEO人在写文案时候可能忽视掉的关键一步。

  • 分享网站推广中经常用到的一些优化方法

    分享网站推广中经常用到的一些优化方法

    众所周知,网站做推广排名需要不断的去优化,才能提升网站的等级权重、收录、Pr值等,这样才能为网站带来更多的流量进行转换。那,网站推广都经常用到哪些优化方法呢?

  • SEO优化网站跳出率偏高该怎样降低?

    SEO优化网站跳出率偏高该怎样降低?

    SEO优化过程中导致网站访客跳出的原因有很多,其中包括:打开网页的速度、网站的排版、网站的内容等这些都有可能导致访客跳出的因素。如果各方面细节处理不当,访客毫不留情面的离开,所以一个优质的网站,后期要做的就是要注重优化细节,这样尽量减少访客的跳出率。那,网站跳出率偏高该如何降低呢?

  • 怎样策划高转化的信息流广告创意素材?注意这4大误区

    怎样策划高转化的信息流广告创意素材?注意这4大误区

    在讲什么是好的信息流广告创意素材之前,我们先说一下什么是不好的,这样能够帮助我们找出好的创意素材的特点。

  • 【SEO优化】网站挖掘关键词都有哪些方法?

    【SEO优化】网站挖掘关键词都有哪些方法?

    要想利用SEO优化来提升网站的整体效果,其中一项就是关键词的挖掘工作,做好这一点尤其很重要。正确的挖掘网站的关键词不仅对网站整体排名带来提升,而且,从的长远角度来看也起到决定性作用。假如网站关键词选取不当或不够精准的话,可能在排名和转化方面都不会达到令人满意的程度。

  • 网站SEO优化|在选择关键词需要注意哪些点?

    网站SEO优化|在选择关键词需要注意哪些点?

    目前大多数中小企业网站都进行SEO优化,但是经常能看到一部分网站的关键词布局不怎么合理化;那究竟怎样选择关键词呢,首先,我们还得需要根据搜索引擎的算法不断改变,适当来做出相对应的调整,同时还要在选择关键词的原则做一些分析,另外在选择关键词还需要注意避免以下几点:


免费赠送价值3000元专家在线诊断 - 1对1定制网站与推广改进方案

关注我们

联系我们

地址:广州市白云区西槎路骏富国际C座401室

电话:020-29801628

业务咨询:18819239501 (微信askcbz)

版权所有:广州搜客网络科技有限公司 粤ICP备16038268号-1

粤公网安备 44011102000553号

返回顶部
扫码咨询
扫码咨询
020-29801628

地址:广州白云西槎路骏富国际C座6层