POST TIME:2021-05-24 02:50
織夢(mèng)5.6采集到了內(nèi)容,可沒有自動(dòng)生成摘要和關(guān)鍵字,關(guān)鍵字和摘要都是空的。
可能很多人都遇到了和我一樣的問題,在論壇實(shí)在沒找到好的解決辦法,就自己動(dòng)手去改改文件。廢話不多說了。
下面是我的解決辦法
比如我采集了網(wǎng)站:http://www.52iphone8.com
首頁(yè)的meta代碼是:
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
引用的內(nèi)容:[www.dede58.com]
如果用dedecms的采集的時(shí)候就沒有辦法自動(dòng)獲取description和keywords的值的。
大家注意到了這段代碼和其它網(wǎng)站的區(qū)別了沒??
<meta name=description content=... />
<meta name=keywords content=... />
就是name="description" 和 name="keywords" 少了雙引號(hào)""
這個(gè)可能是dedecms中自動(dòng)分析關(guān)鍵字和摘要的一個(gè)bug吧,沒有考慮到<meta name=keywords content ='' />這種情況!
采集的選項(xiàng)里面也沒有自己填寫關(guān)鍵字和摘要的選項(xiàng)。那我只能自己動(dòng)手修改文件了。
1、修改 include/dedecollection.class.php
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
引用的內(nèi)容:[www.dede58.com]用下面一段代碼替換上面的
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
(此圖片來源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除! )
引用的內(nèi)容:[www.dede58.com]
preg_match("/<meta[\s]+name=['\&;]keywords['\&;] content=['\&;](.*)['\&;]/isU",$this->tmpHtml,$inarr); preg_match("/<meta[\s]+content=['\&;](.*)['\&;] name=['\&;]keywords['\&;]/isU",$this->tmpHtml,$inarr2); preg_match("/<meta[\s]+name=keywords content=['\&;](.*)['\&;]/isU",$this->tmpHtml,$inarr3); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; } if(!isset($inarr[1]) && isset($inarr3[1])) { $inarr[1] = $inarr3[1]; } |
改了上面的, 還有另一個(gè)地方需要修改的
Copy to ClipboardLiehuo.Net Codes引用的內(nèi)容:[www.dede58.com] preg_match("/<meta[\s]+name=['\&;]description['\&;] content=['\&;](.*)['\&;]/isU",$this->tmpHtml,$inarr); preg_match("/<meta[\s]+content=['\&;](.*)['\&;] name=['\&;]description['\&;]/isU",$this->tmpHtml,$inarr2); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; } |
用下面的代碼替換掉上面的:
Copy to ClipboardLiehuo.Net Codes引用的內(nèi)容:[www.dede58.com] preg_match("/<meta[\s]+name=['\&;]description['\&;] content=['\&;](.*)['\&;]/isU",$this->tmpHtml,$inarr); preg_match("/<meta[\s]+content=['\&;](.*)['\&;] name=['\&;]description['\&;]/isU",$this->tmpHtml,$inarr2); preg_match("/<meta[\s]+name=description content=['\&;](.*)['\&;]/isU",$this->tmpHtml,$inarr3); if(!isset($inarr[1]) && isset($inarr2[1])) { $inarr[1] = $inarr2[1]; } if(!isset($inarr[1]) && isset($inarr3[1])) { $inarr[1] = $inarr3[1]; } |