婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 基于 Mysql 實現(xiàn)一個簡易版搜索引擎

基于 Mysql 實現(xiàn)一個簡易版搜索引擎

熱門標簽:臨清電話機器人 拉卡拉外呼系統(tǒng) 高清地圖標注道路 大眾點評星級酒店地圖標注 云南電商智能外呼系統(tǒng)價格 400電話可以辦理嗎 外東北地圖標注 話務外呼系統(tǒng)怎么樣 智能外呼系統(tǒng)復位

基于 Mysql 實現(xiàn)一個搜索引擎

前言:

其實 Mysql 很早就支持全文索引了,只不過一直只支持英文的檢索,從5.7.6 版本開始,Mysql 就內(nèi)置了 ngram 全文解析器,用來支持中文、日文、韓文分詞。

Mysql 全文索引采用的是倒排索引的原理,在倒排索引中關鍵詞是主鍵,每個關鍵詞都對應著一系列文件,這些文件中都出現(xiàn)了這個關鍵詞。這樣當用戶搜索某個關鍵詞時,排序程序在倒排索引中定位到這個關鍵詞,就可以馬上找出所有包含這個關鍵詞的文件。

本文測試,基于 Mysql 8.0 版本,數(shù)據(jù)庫引擎采用的是 InnoDB

一、ngram 全文解析器

ngram 就是一段文字里面連續(xù)的 n 個字的序列。ngram 全文解析器能夠?qū)ξ谋具M行分詞,每個單詞是連續(xù)的 n 個字的序列。例如,用 ngram 全文解析器對“你好靚仔”進行分詞:

n=1: '你', '好', '靚', '仔' 
n=2: '你好', '好靚', '靚仔' 
n=3: '你好靚', '好靚仔' 
n=4: '你好靚仔'

MySQL 中使用全局變量 ngram_token_size 來配置 ngram 中 n 的大小,它的取值范圍是1到10,默認值是 2。通常 ngram_token_size 設置為要查詢的單詞的最小字數(shù)。如果需要搜索單字,就要把 ngram_token_size 設置為 1。在默認值是 2 的情況下,搜索單字是得不到任何結果的。因為中文單詞最少是兩個漢字,推薦使用默認值 2。

可以通過以下命令查看 Mysql 默認的 ngram_token_size 大小:

show variables like 'ngram_token_size'

有兩種方式可以設置全局變量 ngram_token_size 的值:

(1)啟動 mysqld 命令時指定:

mysqld --ngram_token_size=2

(2)修改 Mysql 配置文件 my.ini,末尾增加一行參數(shù):

ngram_token_size=2

二、創(chuàng)建全文索引

1、建表時創(chuàng)建全文索引

CREATE TABLE `article` (
  `id` bigint NOT NULL,
  `url` varchar(1024) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `title` varchar(256) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `source` varchar(32) COLLATE utf8mb4_general_ci DEFAULT '',
  `keywords` varchar(32) COLLATE utf8mb4_general_ci DEFAULT NULL,
  `publish_time` timestamp NULL DEFAULT NULL,
  PRIMARY KEY (`id`),
  FULLTEXT KEY `title_index` (`title`) WITH PARSER `ngram`
) 

ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

2、通過 alter table 方式

ALTER TABLE article ADD FULLTEXT INDEX title_index(title) WITH PARSER ngram;

3、通過 create index 方式

CREATE FULLTEXT INDEX title_index ON article (title) WITH PARSER ngram;

三、檢索方式

1、自然語言檢索(NATURAL LANGUAGE MODE)

自然語言模式是 MySQL 默認的全文檢索模式。自然語言模式不能使用操作符,不能指定關鍵詞必須出現(xiàn)或者必須不能出現(xiàn)等復雜查詢。

示例:

select * from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

// 不指定模式,默認使用自然語言模式
select * from article where MATCH(title) AGAINST ('北京旅游');

可以看出,該模式下根據(jù)“北京旅游”搜索,可以搜索出包含“北京”的或者包含“旅游”的內(nèi)容,因為它是根據(jù)自然語言分成了兩個關鍵詞。

上面示例中返回的結果會自動按照匹配度排序,匹配度高的在前面,匹配度是一個非負浮點數(shù)。

示例:

// 查看匹配度
select * , MATCH(title) AGAINST ('北京旅游') as score from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

2、布爾檢索(BOOLEAN MODE)

布爾檢索模式可以使用操作符,可以支持指定關鍵詞必須出現(xiàn)或者必須不能出現(xiàn)或者關鍵詞的權重高還是低等復雜查詢。

示例:

// 無操作符
// 包含“約會”或“攻略”
select * from article where MATCH(title) AGAINST ('約會 攻略' IN BOOLEAN MODE);

// 使用操作符
// 必須包含“約會”,可包含“攻略”
select * from article where MATCH(title) AGAINST ('+約會 攻略' IN BOOLEAN MODE);

更多操作符示例:

'約會 攻略' 
無操作符,表示或,要么包含“約會”,要么包含“攻略”

'+約會 +攻略'
必須同時包含兩個詞

'+約會 攻略'
必須包含“約會”,但是如果也包含“攻略”的話,匹配度更高。

'+約會 -攻略'
必須包含“約會”,同時不能包含“攻略”。

'+約會 ~攻略'
必須包含“約會”,但是如果也包含“攻略”的話,匹配度要比不包含“攻略”的記錄低。

'+約會 +(>攻略 技巧)'
查詢必須包含“約會”和“攻略”或者“約會”和“技巧”的記錄,但是“約會 攻略”的匹配度要比“約會 技巧”高。

'約會*'
查詢包含以“約會”開頭的記錄。

'"約會攻略"'
使用雙引號把要搜素的詞括起來,效果類似于like '%約會攻略%',
例如“約會攻略初級篇”會被匹配到,而“約會的攻略”就不會被匹配。

四、與 Like 對比

全文索引和 like 查詢對比,有以下優(yōu)點:

  • like 只是進行模糊匹配,全文索引卻提供了一些語法語義的查詢功能,會將要查的字符串進行分詞操作,這決定于 Mysql 的詞庫。
  • 全文索引可以自己設置詞語的最小、最大長度,要忽略的詞,這些都是可以設置的。
  • 用全文索引去某個列查一個字符串,會返回匹配度,可以理解為匹配的關鍵字個數(shù),是個浮點數(shù)。

而且全文檢索的性能也是優(yōu)于 like 查詢的

以下是以 50w 左右數(shù)據(jù)進行的測試:

// like 查詢
select * from article where title like '%北京%';

// 全文索引查詢
select * from article where MATCH(title) AGAINST ('北京' IN BOOLEAN MODE);

可以看出 like 查詢是 1.536s,全文索引查詢是 0.094s,快了16倍左右。

全文索引能快速搜索,但是也存在維護索引的開銷。字段長度越大,創(chuàng)建的全文索引也越大,會影響DML語句的吞吐量。數(shù)據(jù)量不大的情況下可以采用全文索引來做搜索,簡單方便,但是數(shù)據(jù)量大的話還是建議用專門的搜索引擎 ElasticSearch 來做這件事。

以上就是基于 Mysql 實現(xiàn)一個簡易版搜索引擎的詳細內(nèi)容,更多關于 Mysql 實現(xiàn)搜索引擎的資料請關注腳本之家其它相關文章!希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • mysql字符集和數(shù)據(jù)庫引擎修改方法分享
  • MySQL修改字符集的實戰(zhàn)教程
  • MySQL查看與修改字符集的方法實例教程
  • mysql 啟動1067錯誤及修改字符集重啟之后復原無效問題
  • Linux下MySQL 5.5/5.6的修改字符集編碼為UTF8的方法
  • Mysql數(shù)據(jù)庫支持的存儲引擎對比
  • Mysql中存儲引擎的區(qū)別及比較
  • MySQL 學習總結 之 初步了解 InnoDB 存儲引擎的架構設計
  • MySQL修改默認引擎和字符集詳情

標簽:山西 揚州 福州 阿里 溫州 三明 無錫 定西

巨人網(wǎng)絡通訊聲明:本文標題《基于 Mysql 實現(xiàn)一個簡易版搜索引擎》,本文關鍵詞  基于,Mysql,實現(xiàn),一個,簡易,;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《基于 Mysql 實現(xiàn)一個簡易版搜索引擎》相關的同類信息!
  • 本頁收集關于基于 Mysql 實現(xiàn)一個簡易版搜索引擎的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    日韩在线观看一区二区| 日本不卡一区二区| 午夜欧美一区二区三区在线播放| 天堂va蜜桃一区二区三区| 国产一区二区不卡老阿姨| 日本精品裸体写真集在线观看| 精品国产免费人成电影在线观看四季| 亚洲视频狠狠干| 国产精品一线二线三线精华| 欧美久久久久久久久中文字幕| 国产精品毛片a∨一区二区三区| 美国毛片一区二区三区| 欧美亚洲国产一卡| 国产精品免费av| 国产麻豆精品95视频| 日韩午夜激情视频| 视频一区二区欧美| 欧美日韩在线不卡| 亚洲一区在线视频观看| www.久久精品| 国产精品美女久久久久久久| 国产精华液一区二区三区| 日韩女优制服丝袜电影| 日韩专区一卡二卡| 欧美日韩aaaaaa| 亚洲国产人成综合网站| 91国偷自产一区二区使用方法| 中文字幕一区二区三区在线播放| 成人午夜在线视频| 国产精品网站导航| 成人99免费视频| 国产精品久久看| 99久久久无码国产精品| 国产日产亚洲精品系列| 国产成人精品一区二区三区四区| 精品国产乱码久久久久久蜜臀| 蜜臀久久99精品久久久画质超高清| 91精品国产综合久久久久久久久久| 亚洲国产成人91porn| 欧美在线free| 午夜激情综合网| 777奇米四色成人影色区| 日韩—二三区免费观看av| 日韩三级免费观看| 国产老女人精品毛片久久| 国产欧美日韩综合| 色综合婷婷久久| 午夜精品久久久久久久久| 精品免费一区二区三区| 国产精品一二三区在线| 亚洲视频狠狠干| 这里只有精品视频在线观看| 国产精品一区二区不卡| 亚洲视频一二三区| 91麻豆精品国产91久久久更新时间 | 精品国产乱码久久久久久浪潮| 国产伦精品一区二区三区免费迷| 久久综合狠狠综合| 色综合久久久久综合体桃花网| 亚洲一区二区影院| 日韩一卡二卡三卡四卡| 大胆亚洲人体视频| 亚洲电影一区二区| 久久久三级国产网站| 色婷婷av久久久久久久| 奇米888四色在线精品| 国产精品色眯眯| 欧美性猛交xxxx黑人交| 久久99国产精品久久99果冻传媒| 国产精品视频麻豆| 欧美久久久久免费| 91一区二区在线| 国产一区二区精品久久99| 亚洲精品乱码久久久久久黑人| 26uuu亚洲| 欧美日韩综合在线免费观看| 成人做爰69片免费看网站| 日本va欧美va瓶| 国产精品久久久一区麻豆最新章节| 7777精品伊人久久久大香线蕉超级流畅| 国产盗摄一区二区三区| 五月婷婷久久丁香| 国产精品二三区| 精品国产免费视频| 欧美日本一区二区在线观看| 成人网在线播放| 久久99久久久久| 亚洲一级二级在线| 亚洲欧洲日产国码二区| 日韩欧美国产高清| 欧美三级在线视频| 色狠狠色噜噜噜综合网| 成人网页在线观看| 国产精品综合久久| 韩国v欧美v日本v亚洲v| 日本女优在线视频一区二区 | 欧美亚洲综合另类| 不卡的av电影在线观看| 国产一区二区电影| 精品影院一区二区久久久| 亚洲一区二区三区四区在线免费观看| 欧美激情一区二区三区四区| 欧美videofree性高清杂交| 8x福利精品第一导航| 欧美日韩国产综合草草| 欧美中文字幕亚洲一区二区va在线 | 日本一区二区三区高清不卡 | 国产不卡在线视频| 偷拍日韩校园综合在线| 亚洲国产一区在线观看| 亚洲精品日韩一| 国产精品成人一区二区艾草| 国产精品乱码一区二三区小蝌蚪| 26uuu欧美| 欧美一区二区三区免费观看视频| 在线精品视频小说1| 欧美日韩精品一区二区| 欧美精品少妇一区二区三区| 777a∨成人精品桃花网| 日韩一区二区三区在线观看| 日韩欧美国产一区在线观看| 日韩午夜小视频| 久久看人人爽人人| 国产欧美精品一区aⅴ影院| 国产精品国产三级国产有无不卡| 中文字幕乱码久久午夜不卡 | 国产精品麻豆久久久| 国产精品久久久久影院老司| 国产精品区一区二区三区| 国产精品精品国产色婷婷| 亚洲欧美日韩国产综合| 亚洲激情第一区| 水野朝阳av一区二区三区| 久久99久久精品欧美| 丰满白嫩尤物一区二区| 99免费精品在线| 欧美日韩在线电影| 欧美精品一区二区在线播放| 亚洲国产精品v| 亚洲一区在线视频| 久久电影网站中文字幕| 国产91精品久久久久久久网曝门| 9人人澡人人爽人人精品| 在线中文字幕一区二区| 日韩欧美国产午夜精品| 国产精品―色哟哟| 天天色图综合网| 丁香天五香天堂综合| 欧美亚洲一区三区| 久久久www成人免费无遮挡大片| 国产精品大尺度| 免费成人在线视频观看| 成人午夜伦理影院| 正在播放一区二区| 综合色天天鬼久久鬼色| 久久91精品国产91久久小草| 91原创在线视频| 欧美xxxx在线观看| 亚洲一线二线三线视频| 国产成人精品免费一区二区| 欧美一区二区日韩| 亚洲欧美另类图片小说| 精品一二三四区| 欧美日韩日本视频| 国产精品成人免费在线| 蜜桃av噜噜一区| 色88888久久久久久影院野外| 久久综合视频网| 日韩中文字幕91| 91在线观看污| 国产欧美一区二区三区沐欲 | www日韩大片| 婷婷开心久久网| 91蜜桃免费观看视频| 久久日韩精品一区二区五区| 亚洲成人自拍网| 91麻豆免费观看| 中文字幕在线一区| 国产一区二区三区高清播放| 91精品国产乱| 日韩综合一区二区| 欧美日韩成人综合| 亚洲国产精品麻豆| 在线免费观看视频一区| 综合色天天鬼久久鬼色| 成人av电影免费在线播放| 国产片一区二区三区| 国产麻豆一精品一av一免费| 3751色影院一区二区三区| 亚洲成人一二三| 欧美色老头old∨ideo| 樱花草国产18久久久久| www.亚洲免费av| 中文字幕免费在线观看视频一区| 国产成人午夜片在线观看高清观看| 日韩一区二区在线免费观看| 日韩高清在线观看| 日韩视频一区二区三区在线播放| 日韩vs国产vs欧美| 欧美一区二区三区在|