網站就(jiù)像是一張網,而百度蜘蛛就(jiù)是根據網站這(zhè)張網的結構來對(duì)網站進(jìn)行抓取,一般的網站結構形式分爲兩(liǎng)種(zhǒng),一種(zhǒng)爲樹形結構,另一種(zhǒng)爲扁平結構,這(zhè)些都(dōu)是屬于比較利于網站進(jìn)行優化的,但是要注意一點,在對(duì)網站進(jìn)行優化的時(shí)候,一定要注意到網站的内頁url路徑層級,如果鏈接層級過(guò)深,是不利于網站抓取以及優化的,今天就(jiù)來爲大家介紹一下url的種(zhǒng)類以及如何區分。
一、url種(zhǒng)類
1.靜态url
靜态url的每一個頁面(miàn)都(dōu)是真實存在的,每一個靜态的url頁面(miàn)内容都(dōu)是固定的,不會(huì)因爲其它頁面(miàn)的内容改變而改變,另外靜态url頁面(miàn)也是屬于容易被搜索引擎抓取收錄的頁面(miàn)。
2.動态url
動态url頁面(miàn)不同于靜态頁面(miàn),動态頁面(miàn)内容會(huì)随著(zhe)網站某個地方的内容改變而改變,可以很大程度上節省時(shí)間效率,因爲修改一個地方,其它頁面(miàn)就(jiù)會(huì)做出相對(duì)應的改變,但是動态頁面(miàn)想比靜态頁面(miàn)不利于搜索引擎抓取,并且動态的url路徑一般比較長(cháng),所以在抓取方面(miàn)也給百度蜘蛛制造出了困難。
3.僞靜态url
第三種(zhǒng)就(jiù)是僞靜态的url頁面(miàn),僞靜态頁面(miàn)介于動态頁面(miàn)與靜态頁面(miàn)之前,算是吸納了另外兩(liǎng)種(zhǒng)頁面(miàn)的優點,可以修改爲調用統一調取,也可以鎖定某一個頁面(miàn)不讓其發(fā)生改變,所以還(hái)是比較不錯的頁面(miàn)。
二、區分url層級以及頁面(miàn)類型
網站URL的層級不要超過(guò)5層,最好(hǎo)的狀态是三層,網站的域名屬于根,不算層級。
層級過(guò)多的話,不利于搜索引擎的抓取,上面(miàn)也說(shuō)了,動态頁也不利于搜索引擎的抓取,靜态和僞靜态利于抓取。下面(miàn)就(jiù)說(shuō)一下如何區分url層級以及如何區分動态、靜态、僞靜态頁面(miàn)。
1.區分url層級:
例:三層:http://www.baidu.com/1/2/3
五層:http://www.baidu.com/1/2/3/4/5
URL越簡短越好(hǎo)抓取.
2.區分動态、靜态、僞靜态頁面(miàn):
動态頁:有一個問号的
http://www.baidu.com/1/....?.....
靜态和僞靜态:頁面(miàn)都(dōu)有一個固定的URL,且網頁URL以.htm、.html、.shtml等常見形式爲後(hòu)綴,而不含有“?”。
|