婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 網站建設 > 建站知識 > DEDECMS V5.3采集簡易教程

DEDECMS V5.3采集簡易教程

POST TIME:2017-11-13 01:00

關鍵字描述:教程 簡易 采集 我們 內容 網址   如果 作者 V5.3

DedeCms V5.3 采集基礎教程。

  首先說明一下的是,第一次寫這種教程,有不當的地方請大家包涵。

  進入正文:

  采集過程其實就是copy的過程,只不過,我們copy的是顯示結果,而采集主要針對源碼進行。

  第1步,建立節點

  我們以圖片中的網址為例,目標頁面編碼一定要選對,不然采集回來的內容會亂碼,如果你采集回來的內容有亂碼,首先要考慮的是編碼問題,這里我們選utf-8,怎么知道別人的編碼是什么呢?看看源碼<content="text/html; charset=utf-8" />就會明白了。


“區域匹配模式”我選擇是的正則表達式,因為如果選“字符串”,將有一些廣告代碼過濾不掉。

  第2步:文章網址匹配規則。 生活Tips歡迎您(http://ez4life.cn)

  這個就要看采集網站的源代碼(圖2)了,找到一個包含所有要采集內容網址的代碼(要唯一,建議多使用Ctrl F),這樣我們就確定了要采集區域的網址,不放心就測試一下。


圖2
  最后結果如圖3

圖3

  第3步:在前面2步的基礎上我們已經找到了需要采集的網址,下面來看具體的采集內容。

  在內容配置選項中,如果你比較懶,可以象我一樣不要選那么多的選項,只選擇你感興趣的部分,如文章標題,作者及來源等,在dede cmsV5.3中已經把dede V5.1的規則進行了改造,易于初學者使用了,其基本形式是標簽和內容放在一塊的,V5.1要分開始標簽和結束標簽,其實原理都是一樣的。

  這里講講自定義作者的問題。V5.3以前的版本采集時可以用@me="作者“的形式自定義作者,而v5.3只能用替換的方法實現了,當然也有不便之處,這樣我們就確定了基本的東西了。



  第4步:便是我們要的內容核心了,這里會用到比較多的過濾規則,幸好dede V5.3給我們準備了一些常用的,不過,如果你想采集比較復雜的網頁那還得學會一些常用的正則表達式了。這樣我們就基本學會了dedecms V5.3的采集,是不是有點簡單?

俠客站長站 (www. )



  第5步:導出內容,這個我就不多講了。


收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢

  • 400-1100-266
主站蜘蛛池模板: 武宣县| 乌恰县| 宜城市| 观塘区| 壶关县| 天门市| 江阴市| 石景山区| 惠来县| 泰安市| 陵川县| 合川市| 保山市| 武义县| 徐闻县| 凤凰县| 穆棱市| 阿瓦提县| 阿鲁科尔沁旗| 奉节县| 武义县| 南陵县| 罗定市| 美姑县| 乐都县| 重庆市| 仙游县| 资兴市| 光山县| 新干县| 曲松县| 宜兴市| 达日县| 台安县| 芦溪县| 神池县| 榆社县| 台中市| 太湖县| 浮梁县| 泌阳县|