婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 淺談MySQL 統計行數的 count

淺談MySQL 統計行數的 count

熱門標簽:臨沂做地圖標注 石家莊400電話辦理公司 申請400電話電話價格 新鄉智能外呼系統好處 宜賓全自動外呼系統廠家 許昌外呼增值業務線路 地圖標注客戶付款 廣東400企業電話申請流程 咸陽防封電銷卡

MySQL count() 函數我們并不陌生,用來統計每張表的行數。但如果你的表越來越大,且是 InnoDB 引擎的話,會發現計算的速度會越來越慢。在這篇文章里,會先介紹 count() 實現的原理及原因,然后是 count 不同用法的性能分析,最后給出需要頻繁改變并需要統計表行數的解決方案。

Count() 的實現

InnoDB 和 MyISAM 是 MySQL 常用的數據引擎,由于兩者實現的不同,導致 count() 操作計算的效率也不同。

對于 MyISAM 來說,它把每個表的總行數都存在了磁盤上,因此使用 count(*) 計算時,效率很高直接返回結果。但如果加入了 where 條件,依然會進行搜索,所以效率是不高的。

對于 InnoDB 來說,在進行 count(*) 運算時,會把數據從引擎中一行行讀出來,然后累計計數,自然表大了之后,效率就變低了。

那么,為什么 InnoDB 不能像 MyISAM 在表中記錄呢?原因就在于 InnoDB 比 MyISAM 多了支持事務的特性,同時也需要一定的取舍。由于 MVCC 的控制,使得 MySQL 具有并發的能力,也就是說對于同一時刻,InnoDB 返回的表的行數是不一定的,事務看到的行數與開啟后的一致性視圖有關,換句話說,每個事務能看到的數據版本是不一樣的,只能一行行拿出來進行判斷。

像下面的事務,假設表 t 有 10000 條數據:

Session A Session B Session C
select count(*) from t;
insert into t ();
begin;
insert into t();
select count(*) from t; select count(*) from t; select count(*) from t;
10000; 結果是 10002 結果是 10001

對于 Session A 來說,Session B 未提交不可見,Session C 提交了,但是在 Session A 啟動后提交的,也不可見。所以是 10000.

而對于 Session B 而言,Session C 在啟動之前提交,自己又插入了一條,所以結果是 10002.

其實 InnoDB 在進行 count(*) 操作時,還是做了優化的,在進行 count(*) 操作時,由于普通索引會保存主鍵的 id 值,所以會找到最小的那顆普通索引樹進行查找,而不是去遍歷主鍵索引樹。

在保證邏輯正確的前提下,減少掃描的數據量,是數據庫系統設計的通用法則。

另外在使用 show table status 時,也可以查詢出行數,而且速度很快,但需要注意的是,該命令是通過索引統計的值來采樣估算的。官方文檔說誤差可以有 40%-50%.

但如果我們真的需要實時的獲取的某個表的行數,應該怎么辦呢?

手動保存表的數量

用緩存系統來保存計數

對于進行更新的表,可能會想到用緩存系統來支持。比如 Redis 里來保存某個表總行數。

每次插入數據庫時,Redis 計數加一,相反則減一,這樣看起來讀寫操作都很快,但會存在一些問題。

緩存系統會丟失更新:

對于 Redis 在內存中的數據,需要定期的同步到磁盤中,但對于 Redis 異常重啟,就沒有辦法了。比如在 Redis 中插入后,Redis 重啟,數據沒有持久化到硬盤。這時可以在重啟 Redis 后,從數據庫執行下 count(*) 操作,然后更新到 Redis 中。一次全表掃描還是可行的。

邏輯不精確:

假設一個頁面中,需要顯示一張表的行數,以及每一條數據。在實現時,可以先從 Redis 取數量,然后從數據庫里取記錄。

但可能會出現這樣的情況:

  1. 數據庫查到 100 行結果里有最新插入的記錄,而 Redis 計數里少 1.
  2. 數據庫查到 100 行結果沒有最新的記錄,但 Redis 計數卻多了 1.
Session A Session B
插入一條數據; T1
讀 Redis 計數; T2
從數據庫中查記錄;
Redis 計數加 1; T3

對于 Session B 來說,在 T2 時刻,會發現 Redis 的數量比數據庫少 1 條。

Session A Session B
Redis 計數加 1; T1
讀 Redis 計數; T2
從數據庫中查記錄;
插入一條數據; T3

對于 Session B 來說,在 T2 時刻,會發現 Redis 的數量比數據庫多 1 條。

其實產生問題的原因就是因為 Redis 和數據庫查記錄沒有在同一個事務中。

用數據庫保存

由于 InnoDB 引擎的支持,MySQL 本身是支持事務的,所以將 Redis 的插入操作換成在數據庫的更新操作,就可以利用在RR級別下的事務特性,進而保證數據的精確性。

而且還有一點,由于 redo log 的支持,在 MySQL 發生異常時,是可以保證 crash-safe。

不同 count 用法的執行效率

count() 本身是一個聚合函數,對于返回的結果集,一行行地判斷。如果參數不是 NULL 的話,會一直累加,最后返回結果。

所以 count(*), count(id), count(1) 表示都是返回滿足條件的結果集總行數。

而 count(字段),則表示滿足條件的數據行里,不為 NULL 的字段。

對于 count(id) 來說,InnoDB 會遍歷整張表,把每行 id 取出來,給 server 層。Server 判斷 id 是否為空,然后累加。

對于 count(1) 來說,InnoDB 會遍歷整張表,但不取值。Server 層會自己放入 1,然后累加。

所以對于 count(1) 的執行會比 count(*) 要快,少了解析數據行以及拷貝字段值的操作。

對于 count(字段) 來說,如果字段定義時是 not null, 會一行行讀出,并判斷不能為 null,然后累加。如果定義時可以為 null,執行時,需要將值去除,判斷不是 null 才累加。

count(*) 除外,專門做了優化,不取值,直接按行累加,并且會找到最小的索引樹進行計算。

總結

MySQL count() 函數的執行效率和底層的數據引擎有關。MyISAM 不加 where 條件,查詢會很快,但不支持事務。InnoDB 支持事務,由于 MVCC 的實現,導致每次查詢都需要一行行的掃描,效率不高。

解決方法可以通過設計外部緩存如 Redis,保存記錄。但存在異常重啟和數據不準確的情況。可以通過在 InnoDB 中新建一張表,保存記錄這樣的解決方案。

最后,InnoDB 對 count(*) 做了獨立的優化,而其他的 count 操作,則需要額外的操作。

以上就是淺談MySQL 統計行數的 count的詳細內容,更多關于Mysql count的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • MySQL 大表的count()優化實現
  • MySQL中聚合函數count的使用和性能優化技巧
  • 關于mysql中innodb的count優化問題分享
  • 聊聊MySQL的COUNT(*)的性能
  • 詳解 MySQL中count函數的正確使用方法
  • mysql count提高方法總結
  • MySQL中無過濾條件的count詳解
  • MySQL中count(*)、count(1)和count(col)的區別匯總
  • mySQL count多個表的數據實例詳解
  • MySQL COUNT函數的使用與優化

標簽:北京 鷹潭 合肥 日照 臺灣 阜新 鎮江 貴州

巨人網絡通訊聲明:本文標題《淺談MySQL 統計行數的 count》,本文關鍵詞  淺談,MySQL,統計,行數,的,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《淺談MySQL 統計行數的 count》相關的同類信息!
  • 本頁收集關于淺談MySQL 統計行數的 count的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 久治县| 新巴尔虎右旗| 宜都市| 山西省| 蒙自县| 扶余县| 阿尔山市| 吴桥县| 阿尔山市| 泰来县| 专栏| 青铜峡市| 万州区| 莱芜市| 儋州市| 南和县| 高淳县| 越西县| 铁力市| 信宜市| 花莲市| 隆林| 广丰县| 三都| 京山县| 南开区| 瑞金市| 焦作市| 永城市| 阿拉善盟| 桦南县| 越西县| 沙坪坝区| 洪泽县| 平果县| 广宗县| 巴塘县| 九寨沟县| 云林县| 志丹县| 中超|