婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁(yè) > 網(wǎng)站建設(shè) > 建站知識(shí) > 織夢(mèng)DedeCms采集規(guī)則教程

織夢(mèng)DedeCms采集規(guī)則教程

POST TIME:2017-11-22 22:53

  楚截圖和文字分不清楚,因此用粉色背景來(lái)區(qū)分。

  第一步、確定采集的網(wǎng)站(我們以DEDE的官方站做為采集站做示范)

  第二步、確定被采集站的編碼。打開(kāi)被采集的網(wǎng)頁(yè)之后,查看源代碼(IE:查看 - > 源代碼)

  在 之間找到 charset 這個(gè),后面就顯示網(wǎng)頁(yè)的編碼了,截圖的是 “gb2312”

  第三步、采集列表獲取規(guī)則寫(xiě)法

  [var:分頁(yè)]

  文章網(wǎng)址需包含 網(wǎng)址不能包含 這兩個(gè)一般不用寫(xiě),用于采集列表范圍有很多不需要的連接才用到他來(lái)做過(guò)濾使用。

  如果只有一個(gè)列表頁(yè),那么在來(lái)源網(wǎng)址就直接寫(xiě)上網(wǎng)址就OK了。

  注意這里,最關(guān)鍵就是這里。

  下面就是“采集獲取文章列表的規(guī)則寫(xiě)法”,

  就是上面打開(kāi)的被采集頁(yè)面的源代碼文件,找到文章列表之前 和本頁(yè)面沒(méi)有其他相同的代碼

  在DedeCms官方站的列表頁(yè)文章列表之前和之后最近的且沒(méi)有相同的是“

  ”和“ ”,分別寫(xiě)入“起始HTML”和“結(jié)束HTML”,寫(xiě)法看截圖

  第四步、采集文章標(biāo)題,文章內(nèi)容,文章作者,文章來(lái)源等規(guī)則寫(xiě)法,分頁(yè)采集等。

  “起始HTML”和“結(jié)束HTML”寫(xiě)法參考第三步中的“獲取文章列表的規(guī)則寫(xiě)法”

  下面講的是如何采集分頁(yè)內(nèi)容 看截圖圈著的地方 截圖

  文檔是否分頁(yè) 里面選擇“全部列出的分頁(yè)列表”

  “起始HTML”和“結(jié)束HTML”寫(xiě)法參考第三步中的“獲取文章列表的規(guī)則寫(xiě)法”

  當(dāng)然 上面這些不能用來(lái)采集帶有視頻的,因?yàn)橐呀?jīng)過(guò)濾了,后面的四行是過(guò)濾掉視頻的。



收縮
  • 微信客服
  • 微信二維碼
  • 電話咨詢(xún)

  • 400-1100-266
主站蜘蛛池模板: 玉山县| 永春县| 霍城县| 阳西县| 新昌县| 南丰县| 永登县| 修水县| 宝丰县| 鄯善县| 万年县| 翁源县| 崇文区| 姜堰市| 游戏| 九龙县| 襄城县| 安陆市| 安庆市| 嘉善县| 玉环县| 湘西| 屏山县| 漾濞| 平昌县| 社旗县| 富平县| 徐水县| 吉首市| 南乐县| 长子县| 恭城| 永城市| 玉门市| 白山市| 重庆市| 米脂县| 平武县| 德钦县| 中阳县| 沾益县|