作者:秦自红
搜索引擎的工作原理分为四大块,第一块是抓取,第二块是过滤,第三块是收录,第四块是排序。
搜索引擎也叫做蜘蛛,蜘蛛有百度蜘蛛,有谷歌蜘蛛,也有360蜘蛛等等。蜘蛛工作的第一步抓取就是将网页抓取到它的数据库里面,抓取的路径是通过外部链接,向搜索引擎提交链接及搜索引擎主动访问你的页面。
搜索引擎抓取访问的页面不是经过服务器渲染过的页面,搜索引擎抓取的页面全部是代码所包围的文字内容组成,也就是我们在源码中所看到的样子。它是通过页面里面的一个一个链接来访问另一个链接地址。
站长也可以通过向搜索引擎入口来抓取页面,如果你的网站更新有规律的话,等于是给搜索引擎培养了它的抓取规律,那么这一生中 情况搜索引擎会定时来你的网站访问抓取你的页面内容。
向搜索引擎提交了链接之后或者是搜索引擎访问了你的网站之后,我们是怎么知道搜索引擎访问了我们的页面的呢?
这就是通过服务器日志及百度平台的抓取频率可以看到搜索引擎什么时候访问了你的网站。
既然搜索引擎会抓取我们的网站,那么又有什么因素可 以影响搜索引擎对我们网站的访问呢?
这有三个方面的因素可以影响搜索引擎访问抓取我们的网站。
一个是路径的长短能影响,如果你的路径字符超过255个的话,那么就会影响到搜索引擎抓取你的网站的频次了。还有一个因素就是服务器的打开速度也会直接的影响到搜索引擎对这个网站的抓取,因为速度慢的话,搜索引擎就会放弃对你的网站的访问。最后一个影响因素便是中文路径会影响搜索引擎对你的网站的访问速度。中文域名对搜索引擎是不友好的,所以我们在注册域名的时候不要用中文域名。
当搜索引擎抓取了你的页面放到它的数据库之后,就要对搜索引擎所抓取的页面进行过滤了。
搜索引擎会过滤掉它认为不好的页面,然后再将优质的页面释放出来,过滤的目地是为了滤去一些垃圾页面。
搜索引擎在过滤页面的时候先要识别页面内容,一般搜索引擎会识别文字内容,链接及代码。这些都是比较容易抓取的内容,搜索引擎不能识别的内容是图片及视频。
这就告诉我们页面中要有文字信息,要有链接及代码。不要将文字信息放在图片里面隐藏起来,这样搜索引擎是识别不了你的内容的,如果搜索引擎识别不了的话就谈不上给你排名了。
搜索引擎给你的页面打分一般是通过文字信息来匹配你的标题关键词,如果你的内容里面全部是图片而没有文字关键词的话,那么搜索引擎将匹配不到你的关键词的相关性,不知道你要做的内容是什么,也就不会给你一个好的得分。
如果我们的页面想要有一个好的收录的话,我们就要在页面重量上下功夫,在用户受众上努力及在尽量做内容稀缺的原创内容,同时网站的权重也会决定着搜索引擎对你的页面的得分高底。
下面再说一下收录查看方式,是通过site:域名及百度站长平台可以知道搜索引擎是否收录了我们的页面。
页面被收录之后就是搜索引擎根据自已的算法来对你的网站进行排名。这也是我们做SEO优化排名的重点内容。
搜索引擎的工作原理就大体的分为四大块,一个是抓取,一个是过滤,再一次是收录,最后才是排名。
本站文章由SEO技术博客撰稿人原创,作者:萧红SEO创作,如若转载请注明原文及出处:https://www.ainiseo.com/jichu/83.html