首頁 » SEO基礎知識 » 搜索引擎抓取排名原理分析

搜索引擎抓取排名原理分析

2015年12月03日 10:10:51 | 推薦:昆明e領域 | 標簽: | 瀏覽次數:1,036 次

大家都知道SEO是搜索引擎優化,我們在做SEO的時候,對了解搜索引擎抓取排名的原理就顯得十分的重要了。那么,搜索引擎的抓取排名的原理是什么呢?
搜索引擎抓取排名原理分解昆明e領域微信二維碼

在學習好網站SEO優化之前,必須對搜索引擎的工作原理有所了解,知道搜索引擎抓取排名原理,因為SEO主要是通過搜索引擎進行操作的,這樣當我們遇到一些問題的時候,就可以知道問題的原因了。

1、搜索引擎是什么?

像百度、360的好搜、Google、愛問、bing、搜狗、soso、中搜、youdao等等就是我們的搜索引擎。

2、搜索引擎蜘蛛是什么?

搜索引擎蜘蛛可以理解為一種爬蟲,或者是一種程序,一套信息抓取的程序。各大搜索引擎對自己的引擎蜘蛛有不同的命名。百度蜘蛛:baiduspider。谷歌蜘蛛:Googlebot。360蜘蛛:360spider。搜狗蜘蛛:sogou News spider。

3、關鍵詞是什么?

例如:”SEO”就是關鍵詞,”什么是SEO”也是關鍵詞,但它是長尾關鍵詞,它也能帶來一些流量,它是由主關鍵詞”SEO”產生的。長尾關鍵詞可能是有兩個詞或者是一個小短語組成的。

關鍵詞:可以理解為凡是可以帶來一些流量,用戶在搜索框里搜索的詞就是叫關鍵詞。

4、影響排名的因素有哪些?

a、搜索結果中,標題參與著非常重要的排名。

搜索引擎原理分析

b、排名還有一個重要的因素就是內容的質量。? ?參與網站排名的更多的是網站的頁面參與排名。每一個頁面都可以參與排名,但前提是你的頁面的內容質量要相當的高,參與排名的最小單位就是一個頁面。

c、搜索引擎保存高質量的頁面。

5、搜索引擎抓取的原理。四個階段:

[1]、抓取。

a、爬蟲spider順著網頁中的超鏈接,在互聯網中發現,收集百度信息。

b、抓取的方式:一種是深度抓取:例如,抓取首頁之后,碰到第一個欄目頁,就去抓這個欄目頁,抓完第一個欄目頁之后再去抓它下面的詳細頁,抓完這個之后,返回去首頁再去抓第二個欄目頁,以此類推。一種是廣度抓取:抓完首頁抓欄目頁之后在抓詳細頁。抓取方式取決于搜索引擎蜘蛛。無論哪種,關鍵是抓到網站。

c、不利于蜘蛛抓取的內容:js、圖片、Flash、iframe框架、嵌套table、需要登錄信息之后的頁面。網站上使用圖片一定要用alt標簽。

d、網站的路徑太深不利于網站的抓取,最好是三層。

e、網站的登陸、表單是不能抓取的。

f、怎樣知道我們的網站

[2]、過濾。篩選過濾掉一些低質量的頁面。

a、采集、價格低。采集就是直接從網站復制粘貼,采集的內容是非常的垃圾的,收錄也是非常的低的。采集的內容被過濾的可能性是非常大的,因為蜘蛛已經有這樣的頁面,為什么還要來收錄你的呢?最好還是原創,原創是百度最喜歡的。

b、文不對題。掛羊頭賣狗肉,也就是垃圾內容。或者是寫了一個標題,沒有內容,是空內容,是垃圾內容。

c、沒有豐富的內容。

[3]、儲存索引庫。對數據信息進行有質量的提取和組織建立的索引庫。至于怎么索引是根據百度算法。

[4]、展現排序。

a、檢索器根據用戶輸入的查詢關鍵字,在索引中快速檢出文檔,進行與查詢的相關程度。

b、當我們在搜索引擎看到的只有一種結果,搜索根據各種算法,把某個關鍵詞的展示在首頁的第一位。

6、為什么網站沒有收錄。

原因:

[1]、可能屏蔽了蜘蛛,不讓蜘蛛來抓取。要看一下,網站是否有蜘蛛來爬取,如果沒有來過,就不可能有存儲數據庫。

[2]、網站的頁面質量低,可能就被百度蜘蛛屏蔽過濾掉了。

[3]、寫的是一些js、flash、iframe這些框架,不利于蜘蛛的抓取,使蜘蛛無法識別。

[4]、蜘蛛來爬取了,但是還是沒有收錄?原因:第一種可能被過濾掉,第二種不符合蜘蛛,蜘蛛不喜歡,是垃圾的內容,蜘蛛不喜歡這樣的頁面。

[5]、索引庫到展示出來,還需要一層過濾。也是在篩選,過濾掉一下質量差的網站。

7、網站的生態式。

網站生態式:用戶、站長、百度三個層。注意:百度是第三方的搜索引擎,你的對象不一定是百度,而且更多的側重點應該是滿足用戶的需求,解決用戶的問題。因為百度更多是把這些網站提供出來,給用戶展示,滿足用戶的需求。優化不能為了百度進行優化,更多側重的是用戶需求。

8、如何查網站頁面收錄。

[1]、site:www.rdv1.net

[2]、直接打開對應的頁面,復制鏈接到百度里去,看能不能找到。找到就說明收錄了,沒有找到就說明沒有收錄。

9、已經收錄的頁面不能隨意的改動。

[1]、例如:在”常見問題”里的文章被收錄了,那么這篇文章就不能移動到其他的欄目下,一旦移動,就會造成死鏈接。
[2]、已經收錄的頁面可以適當的調整頁面的內容。但是一定不能更改它的路徑。

10、內容好之后,就要去吸引蜘蛛。

[1]、主動向搜索引擎提交。

[2]、鏈接。做外鏈,到權重高的地方或者是蜘蛛經常去的地方,留下你地址的鏈接。例如:到高權重的網站上去發自己網站的鏈接,增加搜索引擎的爬取。

總結:

對于學習SEO,搜索引擎抓取排名原理分析很重要,不然到時候如果新站不收錄怎么辦都不知道怎么回事?搜索引擎就是像百度、360、Google等的就是搜索引擎;而搜索引擎蜘蛛是爬取網站的一套信息抓取程序,蜘蛛在不同的搜索引擎中有不同的名稱;對于網站排名首先參與排名的就是標題,所以打造快速排名的網站標題的標題很重要,在搜索引擎的抓取中分為四個階段、抓取、過濾、存儲、展現排序,很多時候網站不收錄的原因就出在這里,特別注意當網站頁面被收錄之后,鏈接不能發生改變,容易造成死鏈接,當內容做好之后就應該去吸引蜘蛛來抓取你的網站。如果你在學習過程中有疑問,可以在文章下留言或者掃描文章上方的二維碼,我們將在一天內給你答復。

后記:

上面的介紹中給你講到了搜索引擎抓取排名的原理,以及搜索引擎和搜索引擎蜘蛛是什么?但是最重要的是搜索引擎抓取排名的四個階段,學會這個,當你網站不收錄的時候可以對應進行分析,查找問題所在。當你學會了搜索引擎的抓取原理,可以為你的網站選取符合快速排名的關鍵詞,有時候關鍵詞選取的對,優化難度將大大降低。

「優化網站你必須學會」

原文地址:http://www.rdv1.net/seo-jichuzhishi/238.html(轉載注明出處)

★王中王论坛★