婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 幫你打造屬于自己的搜索引擎---百度篇

幫你打造屬于自己的搜索引擎---百度篇

熱門標簽:金昌電話機器人價格 萊西電子地圖標注 縣域地圖標注打印店 外呼系統API接口 武夷山旅游地圖標注 個人可以辦理400電話么 怎么在地圖標注自己 鳳臺百度地圖標注店 修改地圖標注
想擁有屬于自己的搜索引擎嗎?采用目前流行的數據采集方法,你就可以立即擁有。下面就教你一步步地去實現。

一、認識百度搜索

百度搜索,全球最大中文搜索引擎,2005年8月5日在美國納斯達克上市交易,目前是國內用戶使用率最高的搜索引擎,提供網頁、新聞、圖片、音樂、地圖等各種搜索

1、百度網頁搜索的查詢參數

必備參數

☆ wd--查詢的關鍵詞(Keyword)
☆ pn--顯示結果的頁數(Page Number)
☆ cl--搜索類型(Class),cl=3為網頁搜索

可選參數
☆ rn--搜索結果顯示條數(Record Number),取值范圍在10--100條之間,缺省設置rn=10
☆ ie--查詢輸入文字的編碼(Input Encoding),缺省設置ie=gb2312,即為簡體中文
☆ tn--提交搜索請求的來源站點
幾個有用的tn 
tn=baidulocal 表示百度站內搜索,返回的結果很干凈,無廣告干擾。比如,在百度站內搜索"快樂",看看返回結果是不是很清爽。
tn=baiducnnic 想把百度放在框架中嗎?試試這個參數就可以了,是百度為Cnnic定制的

☆ si--在限定的域名中搜索,比如想在新浪的站內搜索可使用參數si=sina.com.cn,要使這個參數有效必須結合ct參數一起使用。

☆ ct--此參數的值一般是一串數字,估計應該是搜索請求的驗證碼

si和ct參數結合使用,比如在sina.com.cn中搜索"理想",可用:http://www.baidu.com/baidu?ie=utf-8am ... ncl=3word=理想

☆ bs--上一次搜索的關鍵詞(Before Search),估計與相關搜索有關

2、百度搜索結果頁面結構

按源代碼結構自上而下為:

搜索框
右側的火爆地帶固定排名
搜索結果
分頁區
相關搜索
底部搜索框
版權區

其中"搜索結果、分頁區"這兩部分就是我們需要的有效數據,根據其代碼結果可以發現其唯一的字符串標識,通過這個標識截取內容就可以了,具體看后面的代碼。

二、核心函數--使用asp的xmlhttp組件

數據采集程序,俗稱小偷程序,其核心部分就是這個xmlhttp組件,用xmlhttp采集數據有些老生常談了,網上資料也不少,一般的采集代碼都是

set http=Server.createobject("MSXML2.XMLHTTP") 
Http.open "GET",url,false '打開xmlhttp
Http.send() '發送請求
if Http.readystate>4 then
exit function 
end if 
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312") '返回結果(一般是字節流),并將字節流轉換為字符串
set http=nothing '釋放xmlhttp

詳細應用見下面的完整代碼

三、完整代碼(文件名:searchi_bd.asp)

%
option explicit
Dim wd,pn
wd = Request("wd")
pn = Request.QueryString("pn")
'開始錯誤處理
On Error Resume Next
If Err.Number > 0 Then
Response.Clear
'顯示錯誤信息給用戶 
Response.Write "p align='center' >font size=3> 出錯了,請重新打開百度搜索./font>/p>"
end if
%>
HTML>
HEAD>
TITLE>百度搜索--%=wd%>/TITLE>
/HEAD>
STYLE type=text/css>
!--
body,td{font-family:arial}
TD{FONT-SIZE:9pt;LINE-HEIGHT:18px}
.cred{color:#FF0000}
//-->
/STYLE>

BODY leftmargin="0" topmargin="3" marginwidth="0" marginheight="0">
table align="center" width="98%" cellspacing="0" cellpadding="0" border="0" bgcolor="#ffffff" >
tr>
form name="f1" method="post" action="searchi_bd.asp">
td width=150 height=50>
你的LOGO
/td>
td align="left">
input name=wd size="40" maxlength="100" title="輸入關鍵字,然后Let's Searching..." value="%=wd%>">
input type="submit" value=" 百度搜索 ">
/td>/form>/tr>
/table>
%
Dim strUrl,strTmp_bd,strInfo,strPage,strPageSum_bd,strQtime_bd
Dim bNoResult_bd,regEx,patrn
'百度查詢字符串
strUrl = "http://www.baidu.com/s?ie=gb2312wd="wdam ... pn"cl=3"
'開始采集
strTmp_bd = GetHTTPPage(strUrl)
If InStr(strtmp_bd,"未找到和您的查詢")>0 Then
bNoResult_bd=1
End If

'截取"搜索結果"部分的內容
strinfo = strCut(strTmp_bd,"DIV id=ScriptDiv>/DIV>","br clear=all>",2)
patrn="/td>/tr>/table>br>"
Set regEx = New RegExp ' 建立正則表達式。
regEx.Pattern = patrn ' 設置模式。
regEx.IgnoreCase = true 
regEx.Global = false 
strinfo=regEx.replace(strinfo,"") 

'截取"分頁區"部分的內容
strPage = strCut(strTmp_bd,"br clear=all>","br>",2)
strPage = Replace(strPage,"href=s?","href=searchi_bd.asp?")
'結果數量與用時
strPageSum_bd=strCut(strtmp_bd,"找到相關網頁約","篇",2)
if not IsNumeric(strPageSum_bd) then
strPageSum_bd=strCut(strtmp_bd,"找到相關網頁","篇",2)
end if
strQtime_bd=strCut(strtmp_bd,"用時","秒",2)
Set strTmp_bd=nothing

%>
!-- T1-Start -->
table cellspacing=0 cellpadding=0 border=0 width=98% align="center">
tr valign=center align=middle height=18>
td width=1 bgcolor=#999999>

td nowrap style="FONT-WEIGHT:bold;COLOR:#ffffff;BACKGROUND-COLOR:#0033cc" width=64>互聯網/td>

td align=right bgcolor=#eeeeee>nobr>找到符合b>%=wd%>/b>的相關網頁b>%=strPageSum_bd%>/b>篇,用時b>%=strQtime_bd%>/b>秒/nobr>nbsp;/td>
/tr>
tr>td bgcolor=#999999 colspan=3 height=2>/td>/tr>/table>
/td>
/tr>
/table>

%
if wd="" then
Response.Write "p align='center' >font size=-1> 您好,請在搜索框中輸入關鍵詞./font>/p>"
elseif bNoResult_bd=1 then
Response.Write "p align='center' >font size=-1> 抱歉,未找到任何符合您查詢條件的信息,請重新選擇合適的關鍵詞進行查詢./font>/p>"
else
%>
table width="98%" align="center" cellspacing="0" cellpadding="0" border="0">
tr>
td style=line-height:160% bgcolor="#ffffff" width="75%" valign=top>br>
%=strinfo%>
/td>
td width="25%" valign=top>br> 這是你發揮的空間! 
/td>
/tr>
/table>
table width="98%" align="center" cellspacing="0" cellpadding="4" border="0">
tr>
td align="center">
br>font size=3>%=strPage%>/font>
/td>
/tr>
/table>
%End If 
set strinfo=nothing

%>
hr size="1" width="760" color="#0000ff">

div align="center">font size=-1>
程序更新請到這里span class="cred">(知識分享論壇)/span>查看/font>
/div>
/BODY>
/HTML>

%
'采集函數
Function getHTTPPage(url) 
On Error Resume Next
dim http 
set http=Server.createobject("MSXML2.XMLHTTP") 
Http.open "GET",url,false 
Http.send() 
if Http.readystate>4 then
exit function 
end if 
getHTTPPage=bytesToBSTR(Http.responseBody,"GB2312")
set http=nothing
If Err.number>0 then 
Response.Write "div align='center'>b>服務器獲取文件內容出錯/b>/div>" 
Err.Clear
End If 
End function
'字節流轉換為字符串
Function BytesToBstr(body,Cset)
dim objstream
set objstream = Server.createObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = Cset
BytesToBstr = objstream.ReadText 
objstream.Close
set objstream = nothing
End Function

'截取字符串,1.包括前后字符串,2.不包括前后字符串
Function strCut(strContent,StartStr,EndStr,CutType)
Dim S1,S2
On Error Resume Next
select Case CutType
Case 1
S1 = InStr(strContent,StartStr)
S2 = InStr(S1,strContent,EndStr)+Len(EndStr)
Case 2
S1 = InStr(strContent,StartStr)+Len(StartStr)
S2 = InStr(S1,strContent,EndStr)
End select
If Err Then
strCute = "p align='center' >font size=-1>截取字符串出錯./font>/p>"
Err.Clear
Exit Function
Else
strCut = Mid(strContent,S1,S2-S1)
End If
End Function

%>


把上面的代碼Copy到記事本保存為searchi_bd.asp,就可以使用了。如果你要更改文件名,請同時把以下代碼中藍色標識部分改為你的文件名

strPage = Replace(strPage,"href=s?","href=searchi_bd.asp?")

幾點說明:

1、百度搜索基本上沒有什么反采集的措施,主要一點就是百度隔一段時間會更改返回結果頁面的源代碼,所以要經常觀察百度的搜索結果頁面,發現代碼變動了,就將幾處字符串標識改動一下。在反采集方面,百度比Google大度多了,目前還沒發現由于頻繁查詢百度而出現暫時屏蔽來源站點IP的現象,而在Google查詢中經常出現這個現象,如何解決就在下篇文章里談一談。

2、采集比較耗資源,搜索小偷程序一樣,所以程序中盡量早點釋放變量或對象。如果你的空間資源不多,建議就不要搞這些了。

3、有些人可能不愿意在自己做的搜索小偷中保留任何百度的功能連接,比如百度快照和站內搜索等功能。為此我在下載包中提供一個無百度任何連接的精簡版,你可以根據需要使用,在本文中就不列出代碼了,其實和完整版的差不多。

標簽:上海 通遼 清遠 涼山 南京 楚雄 邢臺 赤峰

巨人網絡通訊聲明:本文標題《幫你打造屬于自己的搜索引擎---百度篇》,本文關鍵詞  幫你,打造,屬于,自己的,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《幫你打造屬于自己的搜索引擎---百度篇》相關的同類信息!
  • 本頁收集關于幫你打造屬于自己的搜索引擎---百度篇的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    五月天婷婷综合| 亚洲二区在线观看| 99久久免费视频.com| 日韩欧美一级二级三级久久久| 欧美性大战久久久久久久蜜臀| 91猫先生在线| 欧美一区永久视频免费观看| 午夜精品在线视频一区| 91福利社在线观看| 欧美日韩国产首页| 日本精品视频一区二区三区| 国产婷婷一区二区| 亚洲视频 欧洲视频| 久久久99免费| 国产精品亚洲综合一区在线观看| 欧洲国产伦久久久久久久| 中文字幕一区二区三区乱码在线| 亚洲国产一区视频| 欧美午夜寂寞影院| 久久这里只精品最新地址| 精品国产乱码久久久久久老虎| 性做久久久久久久久| 国产一区二区不卡老阿姨| 在线观看一区二区视频| 日韩欧美自拍偷拍| 精品制服美女丁香| 欧美一级午夜免费电影| 国产精品久久久久久福利一牛影视| 国产视频一区在线观看| 日本在线不卡视频一二三区| 中文字幕一区二区三区不卡在线| 国产精品一区二区久久不卡| 欧美日韩一级大片网址| 国产精品天美传媒| 欧美另类久久久品| 成人va在线观看| 高清免费成人av| 久久久欧美精品sm网站| 久久婷婷国产综合国色天香 | 在线观看区一区二| 亚洲综合视频在线观看| voyeur盗摄精品| 狠狠色综合播放一区二区| 丝袜美腿亚洲色图| 亚洲一二三四区不卡| 成人精品视频.| 国产传媒一区在线| 欧美精品一卡两卡| 国产精品午夜在线观看| 国产91精品久久久久久久网曝门| 国产一区亚洲一区| 99免费精品视频| 国产精品色呦呦| 亚洲国产精品成人综合 | 欧美电影免费观看高清完整版| 日本高清不卡视频| 99精品国产视频| 在线观看亚洲a| 69久久99精品久久久久婷婷| aaa欧美日韩| 国产欧美日韩在线观看| 99久久久久免费精品国产| 久久天天做天天爱综合色| 蜜臀久久99精品久久久久宅男 | 国产美女娇喘av呻吟久久| 欧美一个色资源| 三级一区在线视频先锋| 欧美乱妇20p| 黑人精品欧美一区二区蜜桃| 国产日韩欧美a| 99精品视频一区| 午夜激情综合网| 久久在线观看免费| proumb性欧美在线观看| 亚洲男人天堂一区| 日韩电影免费一区| 紧缚奴在线一区二区三区| 色婷婷狠狠综合| 中文字幕在线不卡国产视频| 舔着乳尖日韩一区| 日韩欧美卡一卡二| 午夜精品一区二区三区免费视频 | 国产精品视频你懂的| 国产一区二区三区最好精华液| 欧美一区二区三区啪啪| 日韩在线一区二区三区| 日韩欧美国产精品| 精品午夜久久福利影院| 亚洲国产精品ⅴa在线观看| 国产成人在线视频网站| 中文字幕一区在线观看视频| 在线精品国精品国产尤物884a| 亚洲1区2区3区视频| 久久久久久久久久久久久女国产乱 | 另类调教123区 | 中日韩免费视频中文字幕| 成人的网站免费观看| 欧美成人a视频| 国产精品亚洲午夜一区二区三区| 亚洲视频1区2区| 欧美精品一区二区三区久久久| 亚洲va韩国va欧美va| 99精品欧美一区二区三区小说 | 国产成人精品亚洲午夜麻豆| 中文字幕日本不卡| 日韩一区二区三区电影| 中文字幕在线不卡一区二区三区 | 亚洲一区二区三区精品在线| 国产精品一区二区三区99| 午夜电影网一区| 国产精品毛片a∨一区二区三区| 日韩一区二区三区电影| 欧美精品99久久久**| av在线不卡电影| 国产iv一区二区三区| 精品综合免费视频观看| 亚洲欧洲日韩一区二区三区| 久久一区二区视频| 日韩欧美一二三区| 制服丝袜在线91| 日韩小视频在线观看专区| 日韩一区二区在线观看视频| 欧美天天综合网| 国产99久久久国产精品| 午夜天堂影视香蕉久久| 五月婷婷另类国产| 日韩av不卡一区二区| 免费的成人av| 国产精品456露脸| 国产精品一区免费在线观看| 国模娜娜一区二区三区| 丰满岳乱妇一区二区三区| 亚洲欧美色一区| 视频一区在线播放| 亚洲综合在线五月| 日韩激情视频在线观看| 亚洲福利电影网| 韩国三级电影一区二区| 国产乱码精品一品二品| 色综合久久66| 日韩限制级电影在线观看| 久久久久久久综合日本| 曰韩精品一区二区| 免费精品视频在线| 91年精品国产| 久久久99久久| 一区二区高清在线| 亚洲女同ⅹxx女同tv| 国产精品女主播av| 日本成人在线电影网| 精品一区二区av| 91精品1区2区| 最新国产精品久久精品| 日韩av一区二区三区四区| 国产精品88888| 欧洲精品视频在线观看| 国产亚洲va综合人人澡精品| 亚洲大尺度视频在线观看| 99久久伊人久久99| 久久视频一区二区| 国产精品一区免费在线观看| 欧美精品亚洲一区二区在线播放| 日本一区二区在线不卡| 精品一区二区三区在线视频| 欧美一三区三区四区免费在线看| 精品国产一区久久| 日韩精品1区2区3区| 欧美一区二区三区四区久久| 亚洲高清免费观看| 欧亚一区二区三区| 亚洲精品伦理在线| 北条麻妃一区二区三区| 国产精品第一页第二页第三页| 成人激情开心网| 国产精品久久久久久久久图文区| 99久久精品99国产精品| 日本高清视频一区二区| 毛片不卡一区二区| 精品免费日韩av| 色婷婷一区二区三区四区| 日韩av一区二区三区| 国产欧美一区二区三区沐欲| 99久久99久久精品国产片果冻| 成人av在线影院| 久久久91精品国产一区二区三区| 欧美日本一区二区三区四区| 日韩美女视频一区| 国产精品高潮呻吟久久| 欧美一级精品大片| 日韩欧美成人一区| 欧美大片国产精品| 日韩中文字幕不卡| 精品捆绑美女sm三区| 色偷偷成人一区二区三区91| 97久久超碰国产精品| 亚洲欧美欧美一区二区三区| 精品久久久久一区| 国产精品综合av一区二区国产馆| 国产精品的网站| eeuss鲁一区二区三区|