网站就像是一张网,而百度蜘蛛就是根据网站这张网的结构来对网站进行抓取,一般的网站结构形式分为两种,一种为树形结构,另一种为扁平结构,这些都是属于比较利于网站进行优化的,但是要注意一点,在对网站进行优化的时候,一定要注意到网站的内页url路径层级,如果链接层级过深,是不利于网站抓取以及优化的,今天就来为大家介绍一下url的种类以及如何区分。
一、url种类
1.静态url
静态url的每一个页面都是真实存在的,每一个静态的url页面内容都是固定的,不会因为其它页面的内容改变而改变,另外静态url页面也是属于容易被搜索引擎抓取收录的页面。
2.动态url
动态url页面不同于静态页面,动态页面内容会随着网站某个地方的内容改变而改变,可以很大程度上节省时间效率,因为修改一个地方,其它页面就会做出相对应的改变,但是动态页面想比静态页面不利于搜索引擎抓取,并且动态的url路径一般比较长,所以在抓取方面也给百度蜘蛛制造出了困难。
3.伪静态url
第三种就是伪静态的url页面,伪静态页面介于动态页面与静态页面之前,算是吸纳了另外两种页面的优点,可以修改为调用统一调取,也可以锁定某一个页面不让其发生改变,所以还是比较不错的页面。
二、区分url层级以及页面类型
网站URL的层级不要超过5层,最好的状态是三层,网站的域名属于根,不算层级。
层级过多的话,不利于搜索引擎的抓取,上面也说了,动态页也不利于搜索引擎的抓取,静态和伪静态利于抓取。下面就说一下如何区分url层级以及如何区分动态、静态、伪静态页面。
1.区分url层级:
例:
三层:
http://www.baidu.com/1/2/3
五层:
http://www.baidu.com/1/2/3/4/5
URL越简短越好抓取
2.区分动态、静态、伪静态页面:
动态页:有一个问号的
http://www.baidu.com/1/....?.....
静态和伪静态:页面都有一个固定的URL,且网页URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”。
,