婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > Mysql實現簡易版搜索引擎的示例代碼

Mysql實現簡易版搜索引擎的示例代碼

熱門標簽:高清地圖標注道路 拉卡拉外呼系統 話務外呼系統怎么樣 外東北地圖標注 臨清電話機器人 大眾點評星級酒店地圖標注 云南電商智能外呼系統價格 智能外呼系統復位 400電話可以辦理嗎

前言

前段時間,因為項目需求,需要根據關鍵詞搜索聊天記錄,這不就是一個搜索引擎的功能嗎?

于是我第一時間想到的就是 ElasticSearch 分布式搜索引擎,但是由于一些原因,公司的服務器資源比較緊張,沒有額外的機器去部署一套 ElasticSearch 服務,而且上線時間也比較緊張,數據量也不大,然后就想到了 Mysql 的全文索引。

簡介

其實 Mysql 很早就支持全文索引了,只不過一直只支持英文的檢索,從5.7.6 版本開始,Mysql 就內置了 ngram 全文解析器,用來支持中文、日文、韓文分詞。

Mysql 全文索引采用的是倒排索引的原理,在倒排索引中關鍵詞是主鍵,每個關鍵詞都對應著一系列文件,這些文件中都出現了這個關鍵詞。這樣當用戶搜索某個關鍵詞時,排序程序在倒排索引中定位到這個關鍵詞,就可以馬上找出所有包含這個關鍵詞的文件。

本文測試,基于 Mysql 8.0 版本,數據庫引擎采用的是 InnoDB

ngram 全文解析器

ngram 就是一段文字里面連續的 n 個字的序列。ngram 全文解析器能夠對文本進行分詞,每個單詞是連續的 n 個字的序列。例如,用 ngram 全文解析器對“你好靚仔”進行分詞:

n=1: '你', '好', '靚', '仔' 
n=2: '你好', '好靚', '靚仔' 
n=3: '你好靚', '好靚仔' 
n=4: '你好靚仔'

MySQL 中使用全局變量 ngram_token_size 來配置 ngram 中 n 的大小,它的取值范圍是1到10,默認值是 2。通常 ngram_token_size 設置為要查詢的單詞的最小字數。如果需要搜索單字,就要把 ngram_token_size 設置為 1。在默認值是 2 的情況下,搜索單字是得不到任何結果的。因為中文單詞最少是兩個漢字,推薦使用默認值 2。

可以通過以下命令查看 Mysql 默認的 ngram_token_size 大小:

show variables like 'ngram_token_size'

有兩種方式可以設置全局變量 ngram_token_size 的值:

1、啟動 mysqld 命令時指定:

mysqld --ngram_token_size=2

2、修改 Mysql 配置文件 my.ini,末尾增加一行參數:

ngram_token_size=2

創建全文索引

1、建表時創建全文索引

CREATE TABLE `article` (
  `id` bigint NOT NULL,
  `url` varchar(1024) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `title` varchar(256) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
  `source` varchar(32) COLLATE utf8mb4_general_ci DEFAULT '',
  `keywords` varchar(32) COLLATE utf8mb4_general_ci DEFAULT NULL,
  `publish_time` timestamp NULL DEFAULT NULL,
  PRIMARY KEY (`id`),
  FULLTEXT KEY `title_index` (`title`) WITH PARSER `ngram`
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;

2、通過 alter table 方式

ALTER TABLE article ADD FULLTEXT INDEX title_index(title) WITH PARSER ngram;

3、通過 create index 方式

CREATE FULLTEXT INDEX title_index ON article (title) WITH PARSER ngram;

檢索方式

1、自然語言檢索(NATURAL LANGUAGE MODE)

自然語言模式是 MySQL 默認的全文檢索模式。自然語言模式不能使用操作符,不能指定關鍵詞必須出現或者必須不能出現等復雜查詢。

示例

select * from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

// 不指定模式,默認使用自然語言模式
select * from article where MATCH(title) AGAINST ('北京旅游');

可以看出,該模式下根據“北京旅游”搜索,可以搜索出包含“北京”的或者包含“旅游”的內容,因為它是根據自然語言分成了兩個關鍵詞。

上面示例中返回的結果會自動按照匹配度排序,匹配度高的在前面,匹配度是一個非負浮點數。

示例

// 查看匹配度
select * , MATCH(title) AGAINST ('北京旅游') as score from article where MATCH(title) AGAINST ('北京旅游' IN NATURAL LANGUAGE MODE);

2、布爾檢索(BOOLEAN MODE)

布爾檢索模式可以使用操作符,可以支持指定關鍵詞必須出現或者必須不能出現或者關鍵詞的權重高還是低等復雜查詢。

示例

// 無操作符
// 包含“約會”或“攻略”
select * from article where MATCH(title) AGAINST ('約會 攻略' IN BOOLEAN MODE);

// 使用操作符
// 必須包含“約會”,可包含“攻略”
select * from article where MATCH(title) AGAINST ('+約會 攻略' IN BOOLEAN MODE);

更多操作符示例:

'約會 攻略' 
無操作符,表示或,要么包含“約會”,要么包含“攻略”

'+約會 +攻略'
必須同時包含兩個詞

'+約會 攻略'
必須包含“約會”,但是如果也包含“攻略”的話,匹配度更高。

'+約會 -攻略'
必須包含“約會”,同時不能包含“攻略”。

'+約會 ~攻略'
必須包含“約會”,但是如果也包含“攻略”的話,匹配度要比不包含“攻略”的記錄低。

'+約會 +(>攻略 技巧)'
查詢必須包含“約會”和“攻略”或者“約會”和“技巧”的記錄,但是“約會 攻略”的匹配度要比“約會 技巧”高。

'約會*'
查詢包含以“約會”開頭的記錄。

'"約會攻略"'
使用雙引號把要搜素的詞括起來,效果類似于like '%約會攻略%',
例如“約會攻略初級篇”會被匹配到,而“約會的攻略”就不會被匹配。

與 Like 對比

全文索引和 like 查詢對比,有以下優點:

  • like 只是進行模糊匹配,全文索引卻提供了一些語法語義的查詢功能,會將要查的字符串進行分詞操作,這決定于 Mysql 的詞庫。
  • 全文索引可以自己設置詞語的最小、最大長度,要忽略的詞,這些都是可以設置的。
  • 用全文索引去某個列查一個字符串,會返回匹配度,可以理解為匹配的關鍵字個數,是個浮點數。

而且全文檢索的性能也是優于 like 查詢的

以下是以 50w 左右數據進行的測試:

// like 查詢
select * from article where title like '%北京%';

// 全文索引查詢
select * from article where MATCH(title) AGAINST ('北京' IN BOOLEAN MODE);

可以看出 like 查詢是 1.536s,全文索引查詢是 0.094s,快了16倍左右。

總結

全文索引能快速搜索,但是也存在維護索引的開銷。字段長度越大,創建的全文索引也越大,會影響DML語句的吞吐量。數據量不大的情況下可以采用全文索引來做搜索,簡單方便,但是數據量大的話還是建議用專門的搜索引擎 ElasticSearch 來做這件事。

到此這篇關于Mysql實現簡易版搜索引擎的示例代碼的文章就介紹到這了,更多相關Mysql 搜索引擎內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • MySQL全文索引實現簡單版搜索引擎實例代碼
  • 詳細介紹基于MySQL的搜索引擎MySQL-Fullltext
  • scrapy+flask+html打造搜索引擎的示例代碼
  • python基于搜索引擎實現文章查重功能
  • Python實戰之手寫一個搜索引擎
  • Python大批量搜索引擎圖像爬蟲工具詳解
  • 360搜索引擎自動收錄php改寫方案
  • php記錄搜索引擎爬行記錄的實現代碼
  • Python無損音樂搜索引擎實現代碼
  • 基于 Mysql 實現一個簡易版搜索引擎

標簽:定西 溫州 山西 無錫 三明 阿里 揚州 福州

巨人網絡通訊聲明:本文標題《Mysql實現簡易版搜索引擎的示例代碼》,本文關鍵詞  Mysql,實現,簡易,版,搜索引擎,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Mysql實現簡易版搜索引擎的示例代碼》相關的同類信息!
  • 本頁收集關于Mysql實現簡易版搜索引擎的示例代碼的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    视频一区在线播放| 五月婷婷久久综合| 99re这里只有精品首页| 一区二区三区不卡在线观看| 一区二区三区欧美| 99热99精品| 一本到高清视频免费精品| 欧美一级午夜免费电影| 欧美岛国在线观看| 国产精品天美传媒沈樵| 一区二区久久久久| 国产一区久久久| 色婷婷精品大在线视频| 日韩久久久久久| 亚洲综合丁香婷婷六月香| 日韩福利视频网| 极品瑜伽女神91| 天使萌一区二区三区免费观看| 亚洲国产精品自拍| 亚洲不卡一区二区三区| 日本视频免费一区| 色香蕉成人二区免费| 久久久精品免费免费| 久久99精品久久久久| 91精品视频网| 精品一区二区免费视频| 成人午夜视频在线| 国产午夜精品一区二区三区嫩草| 日韩国产精品大片| 91精品国产综合久久久久久久| 亚洲大片在线观看| 制服丝袜成人动漫| 激情五月播播久久久精品| 久久综合色婷婷| 久久99精品久久久久| 中文字幕国产精品一区二区| 韩国一区二区在线观看| 99视频一区二区| 日韩一级片在线观看| 国产精品综合二区| 一区二区三区四区视频精品免费 | 日韩成人伦理电影在线观看| 91精品中文字幕一区二区三区| 久久电影网站中文字幕| 久久精品视频免费| 欧洲av一区二区嗯嗯嗯啊| 日韩福利视频导航| 久久综合色鬼综合色| 色噜噜狠狠色综合欧洲selulu| 亚洲丝袜美腿综合| 91精品麻豆日日躁夜夜躁| av激情亚洲男人天堂| 日韩在线卡一卡二| 国产精品超碰97尤物18| 91麻豆精品国产自产在线观看一区 | 久久99精品国产麻豆婷婷| 国产欧美日本一区视频| 欧美在线三级电影| 色婷婷精品大视频在线蜜桃视频| 久久精品噜噜噜成人av农村| 亚洲永久免费av| 亚洲色图视频网| 国产精品区一区二区三区 | 国产欧美日韩三级| 久久久影视传媒| 91精品国产黑色紧身裤美女| 在线看国产一区二区| 99视频热这里只有精品免费| 国产精品欧美久久久久一区二区| 欧美一区二区视频观看视频| 欧美在线免费播放| 国产精品538一区二区在线| 国产美女一区二区| proumb性欧美在线观看| 色琪琪一区二区三区亚洲区| 在线不卡免费av| 国产日韩欧美精品一区| 国产日韩欧美精品电影三级在线| 欧美激情中文不卡| 亚洲va韩国va欧美va精品 | 7777精品伊人久久久大香线蕉经典版下载 | 欧美日韩亚洲综合一区二区三区| 欧美日韩色综合| 欧美国产日本韩| 久久99国产乱子伦精品免费| 91麻豆6部合集magnet| 久久五月婷婷丁香社区| 亚洲少妇最新在线视频| 丝袜国产日韩另类美女| 亚洲不卡一区二区三区| 成人精品亚洲人成在线| 日韩精品一区二区三区视频在线观看 | 欧美视频一区二区在线观看| 久久精品亚洲一区二区三区浴池| 亚洲成人黄色小说| 欧洲国内综合视频| 一区二区三区91| 在线视频欧美精品| 亚洲欧美国产77777| 日本韩国视频一区二区| 国产精品国产三级国产三级人妇 | 国产蜜臀97一区二区三区| 麻豆91免费观看| 欧美哺乳videos| 高潮精品一区videoshd| www久久精品| 日韩和欧美一区二区三区| 久久电影网站中文字幕| 日韩三级精品电影久久久| 日本不卡一二三区黄网| 91精品国产综合久久精品麻豆| 午夜欧美大尺度福利影院在线看| 欧美日韩色一区| 久久精品久久99精品久久| 日韩欧美色综合网站| 成人福利在线看| 欧美mv和日韩mv国产网站| 国产不卡在线播放| 亚洲一区二区在线观看视频 | 欧美日韩免费视频| 国产精品一区免费在线观看| 亚洲天堂中文字幕| 4438x亚洲最大成人网| 国产一区免费电影| 亚洲国产欧美在线人成| 精品伦理精品一区| 在线观看视频一区二区欧美日韩| 免费成人你懂的| 亚洲国产美国国产综合一区二区| 精品国产一区二区三区四区四 | 91农村精品一区二区在线| 青娱乐精品视频| 亚洲黄一区二区三区| 国产精品久久久久久久久免费相片| 538在线一区二区精品国产| 国产夜色精品一区二区av| 欧美日韩在线一区二区| 成人在线一区二区三区| 国产精品69毛片高清亚洲| 久久国产精品一区二区| 精彩视频一区二区三区| 欧美日韩综合在线免费观看| 国产精品日产欧美久久久久| 日韩欧美美女一区二区三区| 欧美二区乱c少妇| 欧美精品第1页| 日韩精品一区二区三区老鸭窝| 欧美久久高跟鞋激| 精品国产青草久久久久福利| 久久综合九色综合97婷婷 | 久久国产成人午夜av影院| 日日摸夜夜添夜夜添精品视频| 国产精品欧美一级免费| 自拍偷拍欧美精品| 国产一区999| 91国偷自产一区二区三区成为亚洲经典| 91小视频免费观看| 91看片淫黄大片一级| 欧美精品第1页| 精品少妇一区二区三区免费观看 | 视频一区欧美日韩| 日韩精品一区二区三区视频播放| 日韩免费电影一区| 婷婷六月综合网| 成人精品电影在线观看| 欧美精品丝袜中出| 国产视频一区在线观看| 免费成人在线观看视频| 9191久久久久久久久久久| 综合电影一区二区三区| 色呦呦国产精品| 亚洲黄色av一区| 日韩亚洲欧美中文三级| 奇米888四色在线精品| 久久久亚洲精品一区二区三区| 亚洲成人动漫在线免费观看| 亚洲丝袜制服诱惑| 91麻豆精品久久久久蜜臀| 日韩精品在线网站| 国产一区欧美一区| 日韩伦理电影网| 日韩一级片网站| 不卡的看片网站| 日韩成人一级大片| 国产精品伦理在线| 久久久久久久久久久久久久久99| 成人av一区二区三区| 日本欧美加勒比视频| 中文字幕在线不卡一区| 欧美一卡二卡在线| 欧美做爰猛烈大尺度电影无法无天| 午夜精品福利一区二区蜜股av | 日韩视频一区在线观看| 99免费精品视频| 色综合天天综合色综合av | 风间由美一区二区三区在线观看 | 亚洲成人激情av| 一本久久综合亚洲鲁鲁五月天| 91在线视频在线| 欧美大片在线观看一区|