來源:本站日期:2014-2-8
我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是對搜索引擎友好的。其實優化各種類型的網站是萬變不離其宗的,搜索引擎喜歡什么就給它什么,搜索引擎不喜歡什么就不給它什么,反之會造成嚴
我們從搜索引擎蜘蛛的角度去看待一個網頁,在抓取,索引和排名的時候會遇到哪些問題呢?解決了這些問題的網站設計就是對搜索引擎友好的。其實優化各種類型的網站是萬變不離其宗的,搜索引擎喜歡什么就給它什么,搜索引擎不喜歡什么就不給它什么,反之會造成嚴重的后果。那么如何設計對搜索引擎友好的網站?
第一點是:搜索引擎能不能找到網頁。要讓搜索引擎找到你的網頁就必須要有外部鏈接或提交百度,當搜索引擎找到網頁后還必須找到網站更深的內容頁,所以這就要要求網站有良好的網站結構,是符合邏輯的、扁平化的或樹形結構的。而且這些頁面之間要有良好的鏈接結構,這些鏈接要以文字或圖片進行鏈接,可能有的站長喜歡用javascript鏈接、下拉菜單鏈接、flash鏈接等,這些如果能少用就盡量去少用,除非你的網站做的非常大,比如你可以是第二個淘寶就可以大搖大擺的去使用,為什么讓站長少用這些鏈接呢?主要原因是因為搜索引擎無法沿著鏈接找到更多的網頁,說白了就是蜘蛛陷阱。
這里推薦站長為網站做一個網站地圖,一般來說網站都是有網站地圖的,如果沒有網站地圖的網站建議看一下。站長在做完網站地圖后可以把所有重要的部分和網頁以文字鏈接放進去,如果網站比較大建議把網站地圖分為多個,這樣以來用戶就可以爬行各個網頁了。
第二點是:搜索引擎蜘蛛找到網頁后能不能抓取。首先,要明確一點的是網頁的URL必須是可以被抓取的,如果沒法搜索引擎沒法抓取到網頁URL,那只能說明這個網站廢了,所以要確保網頁是否能被抓取。一般來說URL都是可以被抓取的,如果你的網頁是由數據庫動態生成的,那么URL要做偽靜態處理,也就是說站長要去掉URL里帶有問號參數之類的東西,我見過很多網站都沒有去掉這類的參數,最終出現搜索引擎不信任這類URL,所以為了避免這樣的現象發生最好還是做好優化。
如果你網站上有大量的flash文件,建議去掉或者做改善,經驗告訴了我搜索引擎很難讀取上面的內容,而且這種也稱為蜘蛛陷阱。可能現在百度這塊在解決讀取flash信息的問題,但目前為止估計是行不通了。另外還要去避免框架結構frame,現在很少有網站做框架結構了,要記住一點千萬別做,這是蜘蛛的大敵。
第三點:搜索引擎蜘蛛抓取網頁后怎樣提煉有用的信息。既然搜索引擎都抓取了我們的網站,那么就得讓搜索引擎來提煉有用的信息,不然再怎么去抓取都是無用功的,這里我分出了幾小塊希望對站長有幫助:
①:網頁的HTML代碼必須優化,也就是格式標簽占比例越低越好,真正內容占得越多越好,整個文件越小越好。
②:把CSS、javascript等放在外部文件。
③:把關鍵詞放在應該出現的地方。
④:檢查網頁對不同操作系統和不同瀏覽器的兼容性。
⑤:檢查是否符合W3C的標準,一般都符合的。
⑥:只有搜索引擎能順利找到你的所有網頁,然后抓取這些網頁并提煉出其中真正有相關性的內容,這樣才能被視為是搜索引擎友好的網站。