前天在百度搜索王柏元的博客網站關鍵詞時,猛地在百度結果的第一頁中發現了一個標題、簡介和我完全一樣的網站,不看不知道,這個網站還不是傳統意義上的抄襲、盜鏈,不僅僅把我的網站全部照搬,而且把網頁里所有的鏈接都置換成那個鏡像網站地址的。
我這才知道:我的網站被人家惡意鏡像了。
惡意鏡像很危險
惡意鏡像由于照搬了源站的所有內容,如果你的網站權重不夠高就苦逼了,傻逼的百度如果分不清哪個源站,難保把你當抄襲,如果你的權重干不過人家的話。不管你的權重高不高,被惡意鏡像的網站無疑會削弱你的權重,因為百度蜘蛛發現了大量和你網站一模一樣的內容。雖然網上有很多惡意鏡像的解決辦法,但是我感覺我這次遇到的情況和網上的都不太一樣,使用網上許多方法都不奏效。
解決與反制措施
在嘗試多種方法無效后,我想到了一個權宜之計:禁止惡意鏡像網站的訪問IP,之所以說是權宜之計,因為難保它的IP會變,還有這個IP不是鏡像網址的解析IP
因為多次嘗試解決問題過程中,我發現這個惡意鏡像的網站的原理大概是:別人訪問abc.ytlqpo.com 的時候,它會訪問一下(www)abc.com(cn\net\cc\xyz\wang),然后把訪問的結果修改一下鏈接返回給你。所以,它必須有一個訪問源站的過程。于是乎解決方案就是禁止這個訪問IP.
在搜尋海量的網站日志沒有確認這個IP后,我寫了一個PHP文件來截獲這個訪問IP。
1.截獲IP
將上述文件命名為“ip.php”放在網站根目錄,然后我通過鏡像網站網址訪問wangbaiyuan.ytlqpo.com/ip.php,然后在上述PHP程序生成的ip.txt中獲取了這個IP:
?php
$file = "ip.txt";//保存的文件名
$ip = $_SERVER['REMOTE_ADDR'];
$handle = fopen($file, 'a');
fwrite($handle, "IP Address: ");
fwrite($handle, "$ip");
fwrite($handle, "\n");
fclose($handle);
?>
104.194.16.230 (美國)
2.屏蔽IP
在htaccess中添加下述代碼:
Deny from 104.194.16.230
當你再次用鏡像網址訪問你的網站的時候就會報4.3錯誤了,現在百度即使收錄了這個網址對你的網站也不會產生任何影響
如果你的服務器是windows服務器就是屏蔽一下ip就可以了,如果網站使用了cdn需要讓cdn官方技術幫你屏蔽一下即可。
3.反制措施
為了給這個鏡像網站小小的“反擊”,我決定把這個403錯誤頁面設置為其他網站網址,實現方法是在屏蔽IP的htaccess代碼中添加:
ErrorDocument 403 http://news.baidu.com/
這樣你訪問你的鏡像網址時,會發現它鏡像的是其實百度新聞。(不知道百度蜘蛛發現一個網站在完全抄襲自己家的東西會是什么感覺)
當然你寫可以根據個人需求讓你的鏡像網址轉向鏡像其他的網站,比如:
借助它fanqiang!