本文實例講述了php使用curl獲取header檢測開啟GZip壓縮的方法。分享給大家供大家參考,具體如下:
獲得網頁header信息,是網站開發人員和維護人員常用的技術。網頁的header信息,非常豐富,非專業人士一般較難讀懂和理解各個項目的含義。
獲取網頁header信息,方法多種多樣,就php語言來說,我作為一個菜鳥,知道的方法也有4種那么多。下面逐一獻上。
方法一:使用get_headers()
函數
這個方法很多人使用,也很簡單便捷,只需要兩行代碼即可搞定。如下:
$thisurl = "https://www.jb51.net/";
print_r(get_headers($thisurl, 1));
得到的結果為:
Array
(
[0] => HTTP/1.1 200 OK
[Content-Type] => text/html
[Last-Modified] => Wed, 15 Aug 2018 01:23:03 GMT
[ETag] => "99a921833634d41:0"
[Server] => Microsoft-IIS/7.5
[X-Powered-By] => jb51.net
[Date] => Wed, 15 Aug 2018 01:31:48 GMT
[Connection] => close
[Content-Length] => 89251
)
方法二:使用http_response_header
代碼也很簡單,僅需三行:
$thisurl = "https://www.jb51.net/";
$html = file_get_contents($thisurl );
print_r($http_response_header);
得到的結果為:
Array
(
[0] => HTTP/1.1 200 OK
[1] => Content-Type: text/html
[2] => Last-Modified: Wed, 15 Aug 2018 01:33:04 GMT
[3] => ETag: "7b9757e93734d41:0"
[4] => Server: Microsoft-IIS/7.5
[5] => X-Powered-By: jb51.net
[6] => Date: Wed, 15 Aug 2018 01:34:15 GMT
[7] => Connection: close
[8] => Content-Length: 89282
)
方法三:使用stream_get_meta_data()
函數
代碼也只有三行:
$thisurl = "https://www.jb51.net/";
$fp = fopen($thisurl, 'r');
print_r(stream_get_meta_data($fp));
得到的結果為:
Array
(
[wrapper_data] => Array
(
[0] => HTTP/1.1 200 OK
[1] => Content-Type: text/html
[2] => Last-Modified: Wed, 15 Aug 2018 01:38:45 GMT
[3] => ETag: "ecc8f8b43834d41:0"
[4] => Server: Microsoft-IIS/7.5
[5] => X-Powered-By: jb51.net
[6] => Date: Wed, 15 Aug 2018 01:39:35 GMT
[7] => Connection: close
[8] => Content-Length: 89421
)
[wrapper_type] => http
[stream_type] => tcp_socket/ssl
[mode] => r
[unread_bytes] => 7945
[seekable] =>
[uri] => https://www.jb51.net/
[timed_out] =>
[blocked] => 1
[eof] =>
)
上述三種方法都可以輕松獲得網頁header信息,且包含的信息都已經相當豐富,滿足一般要求,不過比較遺憾的是,上述三種方法都不能用來檢測網頁是否啟用了GZip壓縮。要檢測GZip壓縮,還需其他的方法才行。這里介紹的是用curl()
函數來檢測。
使用curl獲得header可以檢測GZip壓縮
先貼出代碼:
?php
$szUrl = 'http://www.webkaka.com/';
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $szUrl);
curl_setopt($curl, CURLOPT_HEADER, 1); //輸出header信息
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); //不顯示網頁內容
curl_setopt($curl, CURLOPT_ENCODING, ''); //允許執行gzip
$data=curl_exec($curl);
if(!curl_errno($curl))
{
$info = curl_getinfo($curl);
$httpHeaderSize = $info['header_size']; //header字符串體積
$pHeader = substr($data, 0, $httpHeaderSize); //獲得header字符串
$split = array("\r\n", "\n", "\r"); //需要格式化header字符串
$pHeader = str_replace($split, 'br>', $pHeader); //使用br>換行符格式化輸出到網頁上
echo $pHeader;
}
?>
輸出結果如下:
HTTP/1.1 200 OK
Cache-Control: max-age=86400
Content-Length: 15189
Content-Type: text/html
Content-Encoding: gzip
Content-Location: http://www.webkaka.com/index.html
Last-Modified: Fri, 19 Jul 2013 03:52:28 GMT
Accept-Ranges: bytes
ETag: "0268633384ce1:5cb3"
Vary: Accept-Encoding
Server: Microsoft-IIS/6.0
X-Powered-By: ASP.NET
Date: Fri, 19 Jul 2013 09:27:21 GMT
上面輸出結果里可以看到一個項目:Content-Encoding: gzip,這個正是我們用來判斷網頁是否啟用GZip壓縮的項目。
另外,需要認真注意下本實例里的注釋部分,不能少了任何一項,否則可能獲取header信息有誤。
更多關于PHP相關內容感興趣的讀者可查看本站專題:《php curl用法總結》、《PHP網絡編程技巧總結》、《PHP數組(Array)操作技巧大全》、《php字符串(string)用法總結》、《PHP數據結構與算法教程》及《PHP中json格式數據操作技巧匯總》
希望本文所述對大家PHP程序設計有所幫助。
您可能感興趣的文章:- PHP curl偽造IP地址和header信息代碼實例
- php curl中gzip的壓縮性能測試實例分析
- php使用curl檢測網頁是否被百度收錄的示例分享
- php中通過curl檢測頁面是否被百度收錄
- php使用curl判斷網頁404(不存在)的方法
- php下利用curl判斷遠程文件是否存在的實現代碼
- PHP使用curl_multi_select解決curl_multi網頁假死問題的方法
- php使用curl詳細解析及問題匯總
- 關于PHP的curl開啟問題探討
- 關于php curl獲取301或302轉向的網址問題的解決方法