婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 快速排名 > 常見問題 > SEO教程:SEO中爬行、抓取、索引、收錄的精準判

SEO教程:SEO中爬行、抓取、索引、收錄的精準判

POST TIME:2018-12-03 19:08

         深入分析網站SEO中爬行、抓取、索引、收錄的精準判斷,在我們日常的網站SEO工作中經常會考慮到搜索引擎的工作機制,如何抓取頁面、爬行頁面、索引頁面、收錄頁面。下面重點談下這4個詞的機制原理。     1、爬行,抓取,索引,收錄     爬行是指蜘蛛在頁面上沿著鏈接發現新頁面,然后“爬”過去抓取新頁面。抓取是指蜘蛛發現新頁面后,像瀏覽器一樣打開頁面,把頁面HTML代碼存入數據庫。兩個概念在英文中通常都是用crawl或spider(這里是動詞)表示,視上下文才能分出是指哪個。     顯然,爬行和抓取是相互交織的。抓取是實際發生的我們能夠觀察到的過程,在原始日志中,蜘蛛的抓取是有完整記錄的,比如:抓取確切時間、狀態碼、抓取的文件是哪個、抓取了多大文件等等。蜘蛛對頁面的抓取就和瀏覽器讀取文件是完全一樣的。     而爬行只是一個形象的比喻,實際上并不存在蜘蛛抓取文件時發現鏈接然后立即跟蹤過去這樣一個過程。蜘蛛抓取文件后存入數據庫,程序解析出文件中的鏈接后將URL存入頁面地址庫,然后蜘蛛從地址庫中按一定規則選取URL進行抓取。蜘蛛不是真的訪問頁面時看到一個URL就爬過去。     索引指的是將一個URL的信息進行各種整理,如去重、分詞等等,然后將關于這個URL的信息存入數據庫,被稱為索引庫。真正用于搜索的是倒排索引,以后有機會再細說。要注意的是,索引庫中關于URL的信息不僅是組成頁面內容的關鍵詞及其特征(位置、格式等),還有鏈接、更新情況等信息。英文索引這個詞是index。     收錄是SEO們最關心也最常用的詞,其實也是4個概念中最不明確的。被收錄指的是我們能查到頁面被搜索引擎存入了索引庫。但后面我們會看到,進入索引庫的URL并不一定被抓取過,這和SEO們的直覺可能是不一樣的。     當然,精準掌握概念不是為了咬文嚼字,而是對很多SEO問題的理解和處理有影響。     2、收錄不全是什么原因?     頁面不收錄是SEO們最頭疼的問題之一,不收錄就談不上排名、流量了。太多人在博客、論壇里問頁面不被收錄是什么原因,也給出了域名,但這種問題是沒法回答的,即使愿意花時間去診斷也不能回答(除非列出所有可能的原因,等于沒回答),因為缺了一個關鍵信息:頁面被抓取了沒有?這只有查原始日志才能知道,看網站是看不出來的,查流量也是查不出來的。了解前面的概念就知道,被抓取不一定被收錄,沒被收錄也不一定意味著沒被抓取。     如果頁面被抓取過卻沒被索引和收錄,應該往內容是否有問題(原創?采集?所謂偽原創?敏感內容或產品?復制內容?)方向去找原因。網站結構應該沒有大問題,搜索引擎是看了內容之后覺得不適合收錄的。如果頁面壓根就沒被抓取過,則應該往網站和鏈接結構、搜索引擎不友好的技術障礙、域名權重等方面去找。     3、索引了,但一定抓取了嗎?     使用site:指令或直接搜索URL都可以檢查URL是否被索引,能查到URL卻不一定說明頁面被抓取了。經常有人問搜索結果中URL沒有說明文字,只有URL,標題也和頁面真正標題不一樣是什么情況,原因之一就是頁面被索引了,但沒有被抓取。如圖所示淘寶在百度的收錄就是典型。     百度索引了淘寶首頁,但百度蜘蛛并沒有抓取淘寶首頁內容,因為淘寶的robots文件禁止百度抓取。存在于百度索引庫的關于淘寶首頁的是其它來源的信息,主要是外部鏈接,百度按照鏈接信息給出了猜想的標題(和真正頁面標題不一樣),但沒有說明文字,點擊快照進去看也是空的。如果你的頁面出現這種情況,說明搜索引擎知道頁面的存在,卻因為某種原因不能抓取頁面。也許robots文件有問題?也許服務器設置出錯禁止百度抓取了?也許宕機時間太長了?     4、索引了,但索引全了嗎?     即使抓取了,也索引了,但不一定頁面所有內容都被索引了。     通常情況下,頁面被抓取時抓取了多少?只有查日志才能知道。如果抓取時是完整的,那么頁面上的鏈接都是能被爬行的,雖然快照里顯示的并不全,所以影響倒不大。如果抓取時就不全,那問題就比較大了,頁面將失去展現內頁的意義,趕緊精簡代碼吧。一般來說,蜘蛛能抓取的比索引的大得多。     就算抓取時是完整的,不影響鏈接爬行跟蹤,那如果是內頁,正文內容會不會沒被索引完整呢?沒被索引到的內容就不會被搜索到。這種情況下,看著貌似一切正常,也抓取了,也索引收錄了,但頁面不會有排名,而怎么調整頁面內容都是沒用的,因為真正該索引的沒被索引。

標簽:林芝 東營 九江 鹽城 烏魯木齊



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 康乐县| 西吉县| 舟曲县| 敦化市| 招远市| 外汇| 于田县| 湘乡市| 洪雅县| 磐安县| 房山区| 岢岚县| 安新县| 瑞昌市| 于田县| 南皮县| 灌阳县| 西盟| 宁南县| 临湘市| 安吉县| 民和| 平泉县| 上饶县| 丰城市| 梁河县| 鄂伦春自治旗| 梅河口市| 临洮县| 上林县| 合肥市| 黑山县| 剑川县| 平阴县| 中方县| 铜梁县| 阜南县| 铜川市| 桂林市| 小金县| 商河县|