濰坊網站設計公司:SEO三大核心算法

2020-11-08| 發(fā)布者:雲創科技| 查看: 173|

       外鏈是搜索引擎排名算法中,判斷網站權重高低的重要指标,當用戶在搜索框中輸入關鍵時(shí),搜索引擎面(miàn)對(duì)大量擁有相同内容的網頁,首先需要解決的就(jiù)是,通過(guò)哪些參數覺得網頁排名的高低。今天就(jiù)簡單介紹外鏈建設中,比較有名的核心算法:PageRank算法、Hilltop算法、DirectHit算法。
       一、Hilltop算法
       HillTop,是一項搜索引擎結果排序的專利,是Google的一個工程師Bharat在2001年獲得的專利。HillTop算法的指導思想和PageRank是一緻的,即都(dōu)通過(guò)反向(xiàng)鏈接的數量和質量來确定搜索結果的排序權重。但HillTop認爲隻計算來自具有相同主題的相關文檔鏈接對(duì)于搜索者的價值會(huì)更大,即主題相關網頁之間的鏈接對(duì)于權重計算的貢獻比主題不相關的鏈接價值要更高。在1999-2000年,當這(zhè)個算法被Bharat與其他Google開(kāi)發(fā)人員開(kāi)發(fā)出來的時(shí)候,他們稱這(zhè)種(zhǒng)對(duì)主題有影響的文檔爲“專家”文檔,而隻有從這(zhè)些專家文檔頁面(miàn)到目标文檔的鏈接決定了被鏈接網頁“權重得分”的主要部分。
       淺談搜索引擎排名的核心算法  Hilltop算法的過(guò)程:首先計算查詢主題最相關的“專家”資源列表;其次在選中的“專家”集中識别相關的鏈接,并追蹤它們以識别相關的網頁目标;然後(hòu)將(jiāng)目标根據非關聯的指向(xiàng)它們的“專家”數量和相關性排序。由此,目标網頁的得分反映了關于查詢主題的最中立的專家的集體觀點。如果這(zhè)樣的專家池不存在,Hilltop不會(huì)給出結果。
       從Hilltop算法過(guò)程可見,該算法包括兩(liǎng)個主要的方面(miàn):尋找專家;目标排序。通過(guò)對(duì)搜索引擎抓取的網頁進(jìn)行預處理,找出專家頁面(miàn)。對(duì)于一個關鍵詞的查詢,首先在專家中查找,并排序返回結果。
       權威頁面(miàn)是對(duì)于一個查詢主題來說(shuō)最好(hǎo)的專家指向(xiàng)的頁面(miàn)。專家也有可能(néng)在更寬泛的領域或其它領域的主題上也是專家。在專家頁面(miàn)中隻有一部分鏈接與主題相關。因此,把查詢主題的專家中相關的外向(xiàng)鏈接合并,以找到查詢主題相關頁面(miàn)高度認可的頁面(miàn)。
       從排名在前的匹配專家頁面(miàn)和相聯系的匹配信息中選擇專家頁面(miàn)中一個超鏈接的子集。尤其選擇那些與所有的查詢相關的鏈接。基于這(zhè)些選中的鏈接找出一個它們的目标子集作爲查詢主題最相關的網頁。這(zhè)個目标子集包含至少被兩(liǎng)個非親屬的專家頁面(miàn)鏈接到的網頁。目标集根據指向(xiàng)它們的專家的綜合成(chéng)績來排序。
       Hilltop在應用中還(hái)存在一些不足。專家頁面(miàn)的搜索和确定對(duì)算法起(qǐ)關鍵作用,專家頁面(miàn)的質量決定了算法的準确性;而專家頁面(miàn)的質量和公平性在一定程度上難以保證。Hiltop忽略了大多數非專家頁面(miàn)的影響。在Hiltop的原型系統中,專家頁面(miàn)隻占到整個頁面(miàn)的1.79%,不能(néng)全面(miàn)代表整個互聯網。
       Hiltop算法在無法得到足夠的專家頁面(miàn)子集時(shí)(少于兩(liǎng)個專家頁面(miàn)),返回爲空,即Hiltop适合于對(duì)查詢排序進(jìn)行求精,而不能(néng)覆蓋。這(zhè)意味著(zhe)Hilltop可以與某個頁面(miàn)排序算法結合,提高精度,而不适合作爲一個獨立的頁面(miàn)排序算法。Hilltop中根據查詢主題從專家頁面(miàn)集合中選取與主題相關的子集也是在線運行的,這(zhè)與前面(miàn)提到的HITS算法一樣會(huì)影響查詢響應時(shí)間。随著(zhe)專家頁面(miàn)集合的增大,算法的可伸縮性存在不足之處。
       分析:HITS搜索引擎排名算法的優點在于它能(néng)更好(hǎo)地描述互聯網的組織特點,由于它隻是對(duì)互聯網中的很小的一個子集進(jìn)行分析,所以它需要的叠代次數更少,收斂速度更快,減少了時(shí)間複雜度。
       但HITS算法也存在如下缺點:中心網頁之間的相互引用以增加其網頁評價,當一個網站上的多篇網頁指向(xiàng)一個相同的鏈接,或者一個網頁指向(xiàng)另一個網站上的多個文件時(shí)會(huì)引起(qǐ)評分的不正常增加,這(zhè)會(huì)導緻易受“垃圾鏈接”的影響;網頁中存在自動生成(chéng)的鏈接;
       主題漂移,在鄰接圖中經(jīng)常包括一些和搜索主題無關的鏈接,如果這(zhè)些鏈接自身也是中心網頁或權威網頁就(jiù)會(huì)引起(qǐ)主題漂移:對(duì)于每個不同的查詢算法都(dōu)需要重新運行一次來獲取結果。這(zhè)使得它不可能(néng)用于實時(shí)系統,因爲對(duì)于上千萬次的并發(fā)查詢這(zhè)樣的開(kāi)銷實在太大。
       二、DirectHit算法
       與前面(miàn)的算法相比,AskJeeves公司的DirectHit算法是一種(zhǒng)注重信息的質量和用戶反饋的排序方法。它的基本思想是,搜索引擎將(jiāng)查詢的結果返回給用戶,并跟蹤用戶在檢索結果中的點擊。如果返回結果中排名靠前的網頁被用戶點擊後(hòu),浏覽時(shí)間較短,用戶又重新返回點擊其它的檢索結果,那麼(me)可以認爲其相關度較差,系統將(jiāng)降低該網頁的相關性。另一方面(miàn),如果網頁被用戶點擊打開(kāi)進(jìn)行浏覽,并且浏覽的時(shí)間較長(cháng),那麼(me)該網頁的受歡迎程度就(jiù)高,相應地,系統將(jiāng)增加該網頁的相關度。可以看出,在這(zhè)種(zhǒng)方法中,相關度在不停地變化,對(duì)于同一個詞在不同的時(shí)間進(jìn)行檢索,得到結果集合的排序也有可能(néng)不同,它是一種(zhǒng)動态排序。
       分析:該算法的優點是能(néng)夠節省大量時(shí)間,因爲用戶閱讀的是從搜索結果中篩選出來的更加符合要求的結果。同時(shí),這(zhè)種(zhǒng)算法直接融入用戶的反饋信息,能(néng)夠保證頁面(miàn)的質量。
       然而,統計表明,DirectHit算法隻适合于檢索關鍵詞較少的情況,因爲它實際上并沒(méi)有進(jìn)行排序,而是一種(zhǒng)篩選和抽取,在檢索數據庫很大、關鍵詞很多的時(shí)候,返回的搜索結果成(chéng)千上萬,用戶不可能(néng)一一審閱。因此,這(zhè)種(zhǒng)方式也不能(néng)作爲主要的排序算法來使用,而是一種(zhǒng)很好(hǎo)的輔助排序算法,目前在許多搜索引擎當中仍然在使用。
       其實對(duì)于網頁的搜索排名,都(dōu)是多種(zhǒng)算法綜合作用的結果,簡單分析上面(miàn)的三種(zhǒng)算法,Pagerank可以給網站上的所有網頁給予一個重要性的排序,但是沒(méi)有針對(duì)性、相關性,而且現在PR值作弊已經(jīng)到了一個泛濫的地步,所以PR就(jiù)網頁排名的重要性已經(jīng)大爲下降;
       三、PageRank算法
       1998年,SergeyBrin和LawrencePage提出了PageRank算法。該算法基于“從許多優質的網頁鏈接過(guò)來的網頁,必定還(hái)是優質網頁”的回歸關系,來判定網頁的重要性。該搜索引擎排名算法認爲從網頁A導向(xiàng)網頁B的鏈接可以看作是頁面(miàn)A對(duì)頁面(miàn)B的支持投票,根據這(zhè)個投票數來判斷頁面(miàn)的重要性。當然,不僅僅隻看投票數,還(hái)要對(duì)投票的頁面(miàn)進(jìn)行重要性分析,越是重要的頁面(miàn)所投票的評價也就(jiù)越高。根據這(zhè)樣的分析,得到了高評價的重要頁面(miàn)會(huì)被給予較高的PageRank值,在檢索結果内的名次也會(huì)提高。PageRank是基于對(duì)“使用複雜的算法而得到的鏈接構造”的分析,從而得出的各網頁本身的特性。
       分析:PageRank算法的優點在于它對(duì)互聯網上的網頁給出了一個全局的重要性排序,并且算法的計算過(guò)程是可以離線完成(chéng)的,這(zhè)樣有利于迅速響應用戶的請求。不過(guò),其缺點在于主題無關性,沒(méi)有區分頁面(miàn)内的導航鏈接、廣告鏈接和功能(néng)鏈接等,容易對(duì)廣告頁面(miàn)有過(guò)高評價;另外,PageRank算法的另一弊端是,舊的頁面(miàn)等級會(huì)比新頁面(miàn)高,因爲新頁面(miàn),即使是非常好(hǎo)的頁面(miàn),也不會(huì)有很多鏈接,除非他是一個站點的子站點。這(zhè)就(jiù)是PageRank需要多項算法結合的原因。
       Hilltop算法的提出,對(duì)于廣大站長(cháng)做外部鏈接建設,將(jiāng)起(qǐ)到指導作用。在Hilltop算法中,每個領域都(dōu)會(huì)有若幹專家頁面(miàn),如果搜索相關關鍵詞,搜索引擎首先會(huì)從專家頁面(miàn)查找,如果匹配度不夠,再從專家頁面(miàn)鏈接的下一級頁面(miàn)查找,以此類推。
       DirectHit算法可以作爲Hilltop和pagerank很好(hǎo)的補充,DirectHit更多的是,考慮了用戶體驗的影響,對(duì)搜索結果的質量,進(jìn)行實時(shí)的更新,一個最符合搜索用戶要求的頁面(miàn),應該是用戶從搜索框中點擊頁面(miàn)鏈接開(kāi)始,用戶浏覽網站超過(guò)一定時(shí)間,則被認爲結果頁面(miàn),更符合用戶搜索的要求,長(cháng)期有效的點擊,頁面(miàn)在搜索引擎中排名,就(jiù)會(huì)有相應的提高。
       通過(guò)以上搜索引擎排名三種(zhǒng)算法,就(jiù)可以明白,無論是做外鏈還(hái)是網站内容建設,首先需要考慮的就(jiù)是相關性,在外鏈建設中,要努力尋找主題相關中,權威度高的網站,軟文、友情鏈接等,都(dōu)可以看作是這(zhè)些網站,對(duì)你的支持,同時(shí),注意網站的跳出率和浏覽時(shí)間,時(shí)刻反饋用戶數據,對(duì)一些重點頁面(miàn),用戶點擊量較高的頁面(miàn),做好(hǎo)相關性推薦,引導用戶點擊更多的頁面(miàn)。


本站關鍵詞:濰坊網站建設    濰坊網站設計   濰坊網站制作
QQ在線咨詢
售前咨詢熱線
1453005097
售後(hòu)服務熱線
1453005097
返回頂部