婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Google蜘蛛爬蟲可以運行網頁中的JS腳本和CSS樣式

Google蜘蛛爬蟲可以運行網頁中的JS腳本和CSS樣式

熱門標簽:廣西電銷外呼系統哪家公司做的好 外呼系統對方顯示什么號碼 信陽智能電銷機器人 紐約broadway地圖標注 昆明八百呼外呼系統 外呼系統價格優選南牛網絡 柳州市智能電銷機器人價格 地圖標注需要收費嗎 信陽便宜外呼系統運營商

舊觀念

在我的既有觀念中,搜索引擎的網頁爬蟲/蜘蛛/機器人(Crawler/Spider/Robot)只抓取頁面的 HTML 代碼,對于內部或外部的 JS 與 CSS 代碼是一律無視的。所以我們也經常會說,Ajax 不利于搜索引擎的抓取,不利于 SEO。

因為在我們看來,搜索引擎爬蟲畢竟不是功能強大的瀏覽器,它無法運行 JS,也無法渲染 CSS。那些五彩繽紛的頁面,在爬蟲眼中不過是純粹的文本流(或包含了結構標記的文本信息流)而已。

然而,近期看到的兩則關于 Google 的新聞,徹底顛覆了我對搜索引擎爬蟲的認知。

新聞一

一段來自 Google 資深工程師 Matt Cutts 的視頻震驚了我。Matt 告誡我們,不僅文本與背景同色、字體大小設置為 0、用 CSS 隱藏文字等等這些伎倆已經是小兒科了,而且 Google 現在還可以識別通過 JS 來隱藏文字的作弊方法。

在視頻中,一段隱晦的 JS 代碼將某元素的 .style.display 屬性設置為 'none',試圖隱藏那些只打算提供給搜索引擎、而不展示給用戶的文字。Matt 表示,這種作弊方式現在已經瞞不了 Google 了。

新聞二

新聞二更加恐怖,據說 Google 可以抓取 Ajax 內容!該文表示,給 URL 的 hash 部分加上特定的標識符(即 domain.com/#abc 改為 domain.com/#!abc),會讓 Googlebot 領悟到該 URL 是一個 Ajax 頁面(而非頁面中的錨點),并進行抓取。

你可能對 Google 的這一技術改進沒多少興趣,但你肯定注意到了問題的本質:Googlebot 可以抓取 Ajax 內容,也就是說,Googlebot 完全有能力運行頁面中的 JS,而且功能完善!

爬蟲與瀏覽器

如果這兩則新聞都是真的,那么,從某種意義上說,爬蟲的行為和能力已經與瀏覽器越來越接近了。這也意味著,搜索引擎爬蟲將抓取更多的內容(包括 JS 和 CSS 文件),網站的流量負載將會加大。

另一方面,爬蟲在抓取頁面的過程中也將產生更多的資源消耗——畢意僅僅處理文本信息的資源開銷要遠遠小于完整地渲染頁面和運行客戶端程序。

因此,我目前仍然對這兩則新聞半信半疑。難道這是 Google 放出的煙幕彈?或者是好事者炮制的假新聞?如果 Googlebot 真的已經具備了運行 JS 或渲染 CSS 的能力,那么為了將資源開銷控制在合理的范圍內,或許 Google 會在內部啟用黑/白名單機制?

站長們

如果擔心爬蟲對主機流量的侵蝕,或許可以考慮在 robots.txt 文件中禁止爬蟲對 *.js*.css 文件的抓取。不過暫不確定這樣做是否存在不良的副作用。

或許也有人會擔心,正常的頁面布局有時候也需要使用一些隱藏文字的手段,比如 【CSS 圖代文】、【隱藏模塊的 hx 標識信息】等等。這樣會不會被 Google 判定為作弊呢?

我相信對于像 Google 這樣“聰明”的搜索引擎來說,它即然有能力讓爬蟲運行 JS 和 CSS,它也必然有能力來判斷什么是作弊、什么是正常的布局需要。所以我覺得站長們大可不必驚慌,平常該怎樣就怎樣,身正不怕影斜,規則總是用來約束那些“不法之徒”的。

所以,對于某些 SEOer 來說,這似乎是個壞消息。如果他們還在考慮是否還有新的作弊方案,那么我覺得意義不大。很顯然,SEO 作弊手段的生存空間將越來越小,與此同時,網站自身內容的價值才是 SEO 的真實基礎。

標簽:朝陽 北京 秦皇島 漳州 濱州 辛集 赤峰 錦州

巨人網絡通訊聲明:本文標題《Google蜘蛛爬蟲可以運行網頁中的JS腳本和CSS樣式》,本文關鍵詞  Google,蜘蛛,爬蟲,可以,運行,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Google蜘蛛爬蟲可以運行網頁中的JS腳本和CSS樣式》相關的同類信息!
  • 本頁收集關于Google蜘蛛爬蟲可以運行網頁中的JS腳本和CSS樣式的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 宕昌县| 淳安县| 乾安县| 西乌珠穆沁旗| 海安县| 台南县| 白玉县| 四平市| 永和县| 阳城县| 古蔺县| 泸州市| 思南县| 太白县| 常熟市| 忻城县| 阿拉善右旗| 靖边县| 江永县| 绩溪县| 信丰县| 秦皇岛市| 和平区| 宝鸡市| 施甸县| 阿坝县| 库伦旗| 合水县| 山东省| 科技| 临桂县| 绥化市| 华坪县| 天镇县| 龙南县| 分宜县| 句容市| 长泰县| 长治市| 云阳县| 西安市|