婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Mysql實現全文檢索、關鍵詞跑分的方法實例

Mysql實現全文檢索、關鍵詞跑分的方法實例

熱門標簽:廣東400企業電話申請流程 石家莊400電話辦理公司 地圖標注客戶付款 臨沂做地圖標注 新鄉智能外呼系統好處 申請400電話電話價格 許昌外呼增值業務線路 宜賓全自動外呼系統廠家 咸陽防封電銷卡

一、前言

今天一個同事問我,如何使用 Mysql 實現類似于 ElasticSearch 的全文檢索功能,并且對檢索關鍵詞跑分?我當時腦子里立馬產生了疑問?為啥不直接用es呢?簡單好用還賊快。但是聽他說,數據量不多,客戶給的時間非常有限,根本沒時間去搭建es,所以還是看一下 Mysql 的全文檢索功能吧!

MySQL 從 5.7.6 版本開始,MySQL就內置了ngram全文解析器,用來支持中文、日文、韓文分詞。在 MySQL 5.7.6 版本之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分詞器把中文段落預處理拆分成單詞,然后存入數據庫。本篇文章測試的時候,采用的 Mysql 5.7.6 ,InnoDB數據庫引擎。mysql全文檢索

二、全文解析器ngram

ngram就是一段文字里面連續的n個字的序列。ngram全文解析器能夠對文本進行分詞,每個單詞是連續的n個字的序列。
例如,用ngram全文解析器對“你好世界”進行分詞:

n=1: '你', '好', '世', '界' 
n=2: '你好', '好世', '世界' 
n=3: '你好世', '好世界' 
n=4: '你好世界'

MySQL 中使用全局變量 ngram_token_size 來配置 ngram 中 n 的大小,它的取值范圍是1到10,默認值是 2。通常ngram_token_size設置為要查詢的單詞的最小字數。如果需要搜索單字,就要把ngram_token_size設置為 1。在默認值是 2 的情況下,搜索單字是得不到任何結果的。因為中文單詞最少是兩個漢字,推薦使用默認值 2。

咱們看一下Mysql默認的ngram_token_size大小:

show variables like 'ngram_token_size'

ngram_token_size 變量的兩種設置方式:

1、啟動mysqld命令時指定

mysqld --ngram_token_size=2

2、修改mysql配置文件

[mysqld] 
ngram_token_size=2

三、全文索引

以某文書數據為例,新建數據表 t_wenshu ,并且針對文書內容字段創建全文索引,導入10w條測試數據。

1、建表時創建全文索引

CREATE TABLE `t_wenshu` (
 `province` varchar(255) DEFAULT NULL,
 `caseclass` varchar(255) DEFAULT NULL,
 `casenumber` varchar(255) DEFAULT NULL,
 `caseid` varchar(255) DEFAULT NULL,
 `types` varchar(255) DEFAULT NULL,
 `title` varchar(255) DEFAULT NULL,
 `content` longtext,
 `updatetime` varchar(255) DEFAULT NULL,
 FULLTEXT KEY `content` (`content`) WITH PARSER `ngram`
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2、通過 alter table 方式

ALTER TABLE t_wenshu ADD FULLTEXT INDEX content_index (content) WITH PARSER ngram;

3、通過 create index 方式

CREATE FULLTEXT INDEX content_index ON t_wenshu (content) WITH PARSER ngram;

四、檢索模式

自然語言檢索

(IN NATURAL LANGUAGE MODE)自然語言模式是 MySQL 默認的全文檢索模式。自然語言模式不能使用操作符,不能指定關鍵詞必須出現或者必須不能出現等復雜查詢。

布爾檢索

(IN BOOLEAN MODE)剔除一半匹配行以上都有的詞,例如,每行都有this這個詞的話,那用this去查時,會找不到任何結果,這在記錄條數特別多時很有用,原因是數據庫認為把所有行都找出來是沒有意義的,這時,this幾乎被當作是stopword(中斷詞);布爾檢索模式可以使用操作符,可以支持指定關鍵詞必須出現或者必須不能出現或者關鍵詞的權重高還是低等復雜查詢。

   ● IN BOOLEAN MODE的特色:
      ·不剔除50%以上符合的row。
      ·不自動以相關性反向排序。
      ·可以對沒有FULLTEXT index的字段進行搜尋,但會非常慢。
      ·限制最長與最短的字符串。
      ·套用Stopwords。

   ● 搜索語法規則:
     +   一定要有(不含有該關鍵詞的數據條均被忽略)。
     -   不可以有(排除指定關鍵詞,含有該關鍵詞的均被忽略)。
     >   提高該條匹配數據的權重值。
        降低該條匹配數據的權重值。
     ~   將其相關性由正轉負,表示擁有該字會降低相關性(但不像-將之排除),只是排在較后面權重值降低。
     *   萬用字,不像其他語法放在前面,這個要接在字符串后面。
     " " 用雙引號將一段句子包起來表示要完全相符,不可拆字。

查詢擴展檢索

注釋:(WITH QUERY EXPANSION)由于查詢擴展可能帶來許多非相關性的查詢,謹慎使用!

五、檢索查詢

1)查詢 content 中包含“盜竊罪”的記錄,查詢語句如下

select caseid,content, MATCH ( content) AGAINST ('盜竊罪') as score from t_wenshu where MATCH ( content) AGAINST ('盜竊罪' IN NATURAL LANGUAGE MODE)

2)查詢 content 中包含“尋釁滋事”的記錄,查詢語句如下

select caseid,content, MATCH ( content) AGAINST ('尋釁滋事') as score from t_wenshu where MATCH ( content) AGAINST ('尋釁滋事' IN NATURAL LANGUAGE MODE) ;

3)單個漢字,查詢 content 中包含“我”的記錄,查詢語句如下

select caseid,content, MATCH ( content) AGAINST ('我') as score from t_wenshu where MATCH ( content) AGAINST ('我' IN NATURAL LANGUAGE MODE) ;

備注:因為設置的全局變量 ngram_token_size 的值為 2。如果想查詢單個漢字,需要在配置文件 my.ini 中修改 ngram_token_size = 1 ,并重啟 mysqld 服務,此處不做嘗試了。

4)查詢字段 content 中包含 “危險駕駛”和“尋釁滋事”的語句如下:

select caseid,content, MATCH (content) AGAINST ('+危險駕駛 +尋釁滋事') as score from t_wenshu where MATCH (content) AGAINST ('+危險駕駛 +尋釁滋事' IN BOOLEAN MODE);

5)查詢字段 content 中包含 “危險駕駛”,但不包含“尋釁滋事”的語句如下:

select caseid,content, MATCH (content) AGAINST ('+危險駕駛 -尋釁滋事') as score from t_wenshu where MATCH (content) AGAINST ('+危險駕駛 -尋釁滋事' IN BOOLEAN MODE);

6)查詢字段 conent 中包含“危險駕駛”或者“尋釁滋事”的語句如下:

select caseid,content, MATCH (content) AGAINST ('危險駕駛 尋釁滋事') as score from t_wenshu where MATCH (content) AGAINST ('危險駕駛 尋釁滋事' IN BOOLEAN MODE);

六、總結

1)使用 Mysql 全文索引之前,搞清楚各版本支持情況;

2)全文索引比 like + % 快 N 倍,但是可能存在精度問題;

3)如果需要全文索引的是大量數據,建議先添加數據,再創建索引;

4)對于中文,可以使用 MySQL 5.7.6 之后的版本,或者 Sphinx、Lucene 等第三方的插件;

5)MATCH()函數使用的字段名,必須要與創建全文索引時指定的字段名一致,且只能是同一個表的字段不能跨表;

到此這篇關于Mysql實現全文檢索、關鍵詞跑分的文章就介紹到這了,更多相關Mysql全文檢索、關鍵詞跑分內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • PHP+MySQL+sphinx+scws實現全文檢索功能詳解
  • mysql 全文檢索中文解決方法及實例代碼
  • 深度解析MySQL 5.7之中文全文檢索
  • MySQL 全文檢索的使用示例

標簽:臺灣 鷹潭 北京 合肥 鎮江 阜新 日照 貴州

巨人網絡通訊聲明:本文標題《Mysql實現全文檢索、關鍵詞跑分的方法實例》,本文關鍵詞  Mysql,實現,全文檢索,關鍵詞,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Mysql實現全文檢索、關鍵詞跑分的方法實例》相關的同類信息!
  • 本頁收集關于Mysql實現全文檢索、關鍵詞跑分的方法實例的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    欧美性xxxxx极品少妇| 久久夜色精品一区| 亚洲国产视频a| 久久综合视频网| 在线看不卡av| 国产精华液一区二区三区| 亚洲一卡二卡三卡四卡| 欧美激情在线一区二区| 日韩欧美中文字幕公布| 欧美日韩一区二区三区不卡| av资源网一区| 国产乱一区二区| 免费高清在线一区| 亚洲成人激情综合网| 亚洲欧美怡红院| 国产三级精品三级在线专区| 日韩一级片网站| 欧美一区二区三区影视| 欧美电影在线免费观看| 欧美图片一区二区三区| 在线视频欧美区| 91九色02白丝porn| 在线观看av一区| 色成年激情久久综合| www.久久久久久久久| 不卡免费追剧大全电视剧网站| 国产盗摄一区二区| 国产乱人伦偷精品视频不卡| 国产精品69毛片高清亚洲| 麻豆精品一区二区av白丝在线| 日韩av高清在线观看| 日韩国产欧美一区二区三区| 日本麻豆一区二区三区视频| 日韩va欧美va亚洲va久久| 青青青伊人色综合久久| 精品影视av免费| 国产精品主播直播| www.色综合.com| 日本道免费精品一区二区三区| 欧美性色黄大片| 欧美一区二区三区婷婷月色| 久久一日本道色综合| 一区二区中文视频| 亚洲成av人片在线| 久久99久久精品| 成人av网站在线| 欧美性xxxxxxxx| 日韩一区二区电影在线| 久久久夜色精品亚洲| 国产精品少妇自拍| 夜夜揉揉日日人人青青一国产精品| 亚洲成人精品一区二区| 激情文学综合网| 91猫先生在线| 欧美tk丨vk视频| 亚洲欧美日韩国产手机在线 | 天天综合天天综合色| 日日夜夜免费精品视频| 国产福利一区在线| 欧美日韩色一区| 国产欧美日产一区| 肉肉av福利一精品导航| 99国产精品久久久久久久久久 | 亚洲精品国产一区二区精华液| 亚洲成在人线免费| 国产激情视频一区二区三区欧美 | 91精品国产综合久久小美女| 久久精品亚洲麻豆av一区二区 | 蜜桃久久久久久| 成人教育av在线| 日韩天堂在线观看| 亚洲精品视频在线观看免费| 精品一区二区三区免费观看| 欧美日韩国产高清一区二区三区| 国产欧美一区二区在线观看| 免费欧美高清视频| 欧美午夜宅男影院| 日韩国产一区二| 欧美精品一区二区精品网| 日韩 欧美一区二区三区| 日韩精品一区二区三区在线观看 | 日韩精品一区二区三区老鸭窝| 久久久无码精品亚洲日韩按摩| 夜夜精品视频一区二区| 成人18视频日本| 26uuu色噜噜精品一区二区| 亚洲免费av观看| 91网站在线播放| 国产精品福利一区二区| 成人在线视频一区二区| 久久精品视频在线看| 日韩电影在线一区二区| 欧美日韩国产美| 午夜精品久久久久影视| 在线观看成人免费视频| 亚洲精品久久久蜜桃| 不卡视频在线看| 国产精品成人免费精品自在线观看| 国产美女精品人人做人人爽 | 精品一区二区三区在线观看国产 | 中文字幕av一区二区三区免费看 | 久久免费电影网| 美女诱惑一区二区| 欧美精品黑人性xxxx| 午夜在线成人av| 欧美美女黄视频| 男人的天堂亚洲一区| 日韩欧美美女一区二区三区| 日欧美一区二区| 日韩欧美在线网站| 精品sm在线观看| 国产成人在线影院| 国产精品久久久久影视| 91小宝寻花一区二区三区| 亚洲乱码中文字幕| 欧美色老头old∨ideo| 日韩二区在线观看| 久久综合久久久久88| 成人动漫精品一区二区| 一区二区三区不卡视频在线观看 | 国产精品毛片高清在线完整版| 伊人性伊人情综合网| 成人免费小视频| 国产精品资源站在线| 免费日本视频一区| 大胆欧美人体老妇| 99视频超级精品| 制服丝袜av成人在线看| 欧美在线观看视频在线| 欧美日韩国产精品自在自线| 欧美一级欧美三级在线观看 | 91精品国产综合久久精品图片| 在线精品观看国产| 香蕉成人伊视频在线观看| 4438成人网| 国产精品一区二区三区乱码 | 视频精品一区二区| 欧美一区三区四区| 国产不卡免费视频| 亚洲激情第一区| 精品久久久久一区二区国产| 91在线你懂得| 国产精品亚洲а∨天堂免在线| 一区二区高清免费观看影视大全| 91精品国产日韩91久久久久久| 成人免费观看av| 另类小说一区二区三区| 亚洲国产一区视频| 国产精品视频在线看| 日韩欧美激情四射| 欧美视频精品在线观看| 中文字幕乱码亚洲精品一区| 欧美情侣在线播放| 99久久精品国产网站| 视频一区二区国产| 亚洲视频一二区| 精品国产乱码久久久久久久久| 91在线观看视频| 国产在线精品一区二区三区不卡 | 国产91精品免费| 久久精品99久久久| 亚洲午夜精品在线| 欧美高清视频不卡网| 色婷婷香蕉在线一区二区| 国产精品一区二区在线观看不卡 | 欧美日韩国产一级二级| 国产激情偷乱视频一区二区三区| 日韩高清不卡在线| 亚洲视频一区二区在线| 精品国产麻豆免费人成网站| 欧美人狂配大交3d怪物一区| 成人精品免费网站| 免费观看久久久4p| 免费人成黄页网站在线一区二区 | 国产精品亚洲午夜一区二区三区 | 欧美在线一区二区三区| 国产精品亚洲一区二区三区妖精 | 91精品国产aⅴ一区二区| 日韩理论在线观看| 日韩久久精品一区| 欧美一区二区三区在| 成人综合婷婷国产精品久久免费| 樱花草国产18久久久久| 粉嫩一区二区三区性色av| 亚洲国产成人午夜在线一区| 日韩av网站在线观看| 成人高清在线视频| 国产午夜精品一区二区| 成人自拍视频在线观看| 一区二区三区免费观看| 久久亚洲春色中文字幕久久久| 日韩欧美色电影| 欧美福利视频一区| 亚洲国产成人一区二区三区| 99精品久久免费看蜜臀剧情介绍| 成人黄色片在线观看| 成人午夜视频免费看| 不卡一二三区首页| 91国偷自产一区二区开放时间 | 久色婷婷小香蕉久久|