可以在任何文本編輯器中創(chuàng)建此文件。該文件應(yīng)為 ASCII 編碼的文本文件,而非 HTML 文件。文件名應(yīng)使用小寫(xiě)字母。
語(yǔ)法
最簡(jiǎn)單的 robots.txt 文件使用兩條規(guī)則:
- User-Agent:適用下列規(guī)則的漫游器
- Disallow:要攔截的網(wǎng)頁(yè)
這兩行被視為文件中的一個(gè)條目。您可根據(jù)需要包含任意多個(gè)條目。您可在一個(gè)條目中包含多個(gè) Disallow 行和多個(gè) User-Agent。
應(yīng)在 User-Agent 行中列出什么內(nèi)容?
user-agent 是特定的搜索引擎漫游器。網(wǎng)絡(luò)漫游器數(shù)據(jù)庫(kù)列出了許多常用漫游器。您可設(shè)置應(yīng)用于特定漫游器的條目(通過(guò)列示名稱)或設(shè)置為應(yīng)用于所有漫游器(通過(guò)列示星號(hào))。應(yīng)用于所有漫游器的條目應(yīng)與下列條目類(lèi)似:
User-Agent:*
Google 使用多種不同漫游器(用戶代理)。用于網(wǎng)絡(luò)搜索的漫游器是 Googlebot。Googlebot-Mobile 和 Googlebot-Image 等其他漫游器遵循您為 Googlebot 設(shè)置的規(guī)則,您還可為這些特定漫游器設(shè)置附加規(guī)則。
應(yīng)在 Disallow 行中列出什么內(nèi)容?
Disallow 行列出了您要攔截的網(wǎng)頁(yè)。您可列出具體網(wǎng)址或網(wǎng)址模式。條目應(yīng)以正斜杠開(kāi)頭 (/)。
網(wǎng)址區(qū)分大小寫(xiě)。例如,Disallow: /private_file.html 將攔截 http://www.example.com/private_file.html,但允許 http://www.example.com/Private_File.html。
更多內(nèi)容請(qǐng)?jiān)L問(wèn):http://www.google.com/support/webmasters
僅當(dāng)您的網(wǎng)站包含不希望搜索引擎編入索引的內(nèi)容時(shí),才需要使用 robots.txt 文件。如果您希望搜索引擎將網(wǎng)站上的所有內(nèi)容編入索引,則不需要 robots.txt 文件(甚至連空文件也不需要)。
------------------------------------------------------------------------------------------------------------------------------------------