婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > postgreSQL 非count方法算記錄數(shù)操作

postgreSQL 非count方法算記錄數(shù)操作

熱門標簽:合肥公司外呼系統(tǒng)運營商 打電話智能電銷機器人授權(quán) 地圖標注和圖片名稱的區(qū)別 漯河外呼電話系統(tǒng) 美容工作室地圖標注 重慶自動外呼系統(tǒng)定制 辦公外呼電話系統(tǒng) 海豐有多少商家沒有地圖標注 外呼調(diào)研系統(tǒng)

一般方法

select count(1) from table_name;

全量掃描一遍表,記錄越多,查詢速度越慢

新法

PostgreSQL 還真提供了一個這樣的途徑,那就是系統(tǒng)表 pg_class,這個系統(tǒng)表里頭,存儲著每個表的統(tǒng)計信息,其中 reltuples 就是對應(yīng)的表的統(tǒng)計行,統(tǒng)計行的數(shù)據(jù)是pg有個獨立進程,定期掃描不同的表,收集這些表的統(tǒng)計信息,保存在系統(tǒng)表里頭。

方法如下:

select 
 reltuples::int as total 
from 
 pg_class 
where 
 relname = 'table_name' 
 and relnamespace = (select oid from pg_namespace where nspname = 'schema');

新方法不是通用的,如果要求特精確還是使用select count(1),如果是類似分頁的,且分頁數(shù)量超過比較多的,也不是要求特別精準的,這就是一個好方法!

count(1) over 計算記錄數(shù)

select count(1) over(), * from table_name;

補充

count 是最常用的聚集函數(shù)之一,看似簡單,其實還是有坑的,如:

1、count(*):返回結(jié)果集的行數(shù),是null也統(tǒng)計

2、count(1):和count(*)基本沒區(qū)別,pg92之前都是掃描全表的,pg92之后增加了index only scan一般會變成掃主鍵索引,如果沒有主鍵或者是表的列很多的情況下,count(1)快一些,因為不會考慮表的全部字段

3、count(field):返回數(shù)據(jù)表中指定字段值不等于null的行數(shù)

拓展:理解 PostgreSQL 的 count 函數(shù)的行為

關(guān)于 count 函數(shù)的使用一直存在爭議,尤其是在 MySQL 中,作為流行度越來越高的 PostgreSQL 是否也有類似的問題呢,我們通過實踐來理解一下 PostgreSQL 中 count 函數(shù)的行為。

構(gòu)建測試數(shù)據(jù)庫

創(chuàng)建測試數(shù)據(jù)庫,并創(chuàng)建測試表。測試表中有自增 ID、創(chuàng)建時間、內(nèi)容三個字段,自增 ID 字段是主鍵。

create database performance_test;

create table test_tbl (id serial primary key, created_at timestamp, content varchar(512));

生成測試數(shù)據(jù)

使用 generate_series 函數(shù)生成自增 ID,使用 now() 函數(shù)生成 created_at 列,對于 content 列,使用了 repeat(md5(random()::text), 10) 生成 10 個 32 位長度的 md5 字符串。使用下列語句,插入 1000w 條記錄用于測試。

performance_test=# insert into test_tbl select generate_series(1,10000000),now(),repeat(md5(random()::text),10); INSERT 0 10000000 Time: 212184.223 ms (03:32.184)

由 count 語句引發(fā)的思考

默認情況下 PostgreSQL 不開啟 SQL 執(zhí)行時間的顯示,所以需要手動開啟一下,方便后面的測試對比。

\timing on

count(*) 和 count(1) 的性能區(qū)別是經(jīng)常被討論的問題,分別使用 count(*) 和 count(1) 執(zhí)行一次查詢。

performance_test=# select count(*) from test_tbl;
 count
----------
 10000000
(1 row)
 
Time: 115090.380 ms (01:55.090)
 
performance_test=# select count(1) from test_tbl;
 count
----------
 10000000
(1 row)
 
Time: 738.502 ms

可以看到兩次查詢的速度差別非常大,count(1) 真的有這么大的性能提升?接下來再次運行查詢語句。

performance_test=# select count(*) from test_tbl;
 count
----------
 10000000
(1 row)
 
Time: 657.831 ms
 
performance_test=# select count(1) from test_tbl;
 count
----------
 10000000
(1 row)
 
Time: 682.157 ms

可以看到第一次查詢時候會非常的慢,后面三次速度非??觳⑶視r間相近,這里就有兩個問題出現(xiàn)了:

為什么第一次查詢速度這么慢?

count(*) 和 count(1) 到底存不存在性能差別?

查詢緩存

使用 explain 語句重新執(zhí)行查詢語句

explain (analyze,buffers,verbose) select count(*) from test_tbl;

可以看到如下輸出:

Finalize Aggregate (cost=529273.69..529273.70 rows=1 width=8) (actual time=882.569..882.570 rows=1 loops=1)
  Output: count(*)
  Buffers: shared hit=96 read=476095
  -> Gather (cost=529273.48..529273.69 rows=2 width=8) (actual time=882.492..884.170 rows=3 loops=1)
     Output: (PARTIAL count(*))
     Workers Planned: 2
     Workers Launched: 2
     Buffers: shared hit=96 read=476095
     -> Partial Aggregate (cost=528273.48..528273.49 rows=1 width=8) (actual time=881.014..881.014 rows=1 loops=3)
        Output: PARTIAL count(*)
        Buffers: shared hit=96 read=476095
        Worker 0: actual time=880.319..880.319 rows=1 loops=1
         Buffers: shared hit=34 read=158206
        Worker 1: actual time=880.369..880.369 rows=1 loops=1
         Buffers: shared hit=29 read=156424
        -> Parallel Seq Scan on public.test_tbl (cost=0.00..517856.98 rows=4166598 width=0) (actual time=0.029..662.165 rows=3333333 loops=3)
           Buffers: shared hit=96 read=476095
           Worker 0: actual time=0.026..661.807 rows=3323029 loops=1
            Buffers: shared hit=34 read=158206
           Worker 1: actual time=0.030..660.197 rows=3285513 loops=1
            Buffers: shared hit=29 read=156424
 Planning time: 0.043 ms
 Execution time: 884.207 ms

注意里面的 shared hit,表示命中了內(nèi)存中緩存的數(shù)據(jù),這就可以解釋為什么后面的查詢會比第一次快很多。接下來去掉緩存,并重啟 PostgreSQL。

service postgresql stop
echo 1 > /proc/sys/vm/drop_caches
service postgresql start

重新執(zhí)行 SQL 語句,速度慢了很多。

 Finalize Aggregate (cost=529273.69..529273.70 rows=1 width=8) (actual time=50604.564..50604.564 rows=1 loops=1)
  Output: count(*)
  Buffers: shared read=476191
  -> Gather (cost=529273.48..529273.69 rows=2 width=8) (actual time=50604.508..50606.141 rows=3 loops=1)
     Output: (PARTIAL count(*))
     Workers Planned: 2
     Workers Launched: 2
     Buffers: shared read=476191
     -> Partial Aggregate (cost=528273.48..528273.49 rows=1 width=8) (actual time=50591.550..50591.551 rows=1 loops=3)
        Output: PARTIAL count(*)
        Buffers: shared read=476191
        Worker 0: actual time=50585.182..50585.182 rows=1 loops=1
         Buffers: shared read=158122
        Worker 1: actual time=50585.181..50585.181 rows=1 loops=1
         Buffers: shared read=161123
        -> Parallel Seq Scan on public.test_tbl (cost=0.00..517856.98 rows=4166598 width=0) (actual time=92.491..50369.691 rows=3333333 loops=3)
           Buffers: shared read=476191
           Worker 0: actual time=122.170..50362.271 rows=3320562 loops=1
            Buffers: shared read=158122
           Worker 1: actual time=14.020..50359.733 rows=3383583 loops=1
            Buffers: shared read=161123
 Planning time: 11.537 ms
 Execution time: 50606.215 ms

shared read 表示沒有命中緩存,通過這個現(xiàn)象可以推斷出,上一小節(jié)的四次查詢中,第一次查詢沒有命中緩存,剩下三次查詢都命中了緩存。

count(1) 和 count(*) 的區(qū)別

接下來探究 count(1) 和 count(*) 的區(qū)別是什么,繼續(xù)思考最開始的四次查詢,第一次查詢使用了 count(*),第二次查詢使用了 count(1) ,卻依然命中了緩存,不正是說明 count(1) 和 count(*) 是一樣的嗎?

事實上,PostgreSQL 官方對于 is there a difference performance-wise between select count(1) and select count(*)? 問題的回復(fù)也證實了這一點:

Nope. In fact, the latter is converted to the former during parsing.[2]

既然 count(1) 在性能上沒有比 count(*) 更好,那么使用 count(*) 就是更好的選擇。

sequence scan 和 index scan

接下來測試一下,在不同數(shù)據(jù)量大小的情況下 count(*) 的速度,將查詢語句寫在 count.sql 文件中,使用 pgbench 進行測試。

pgbench -c 5 -t 20 performance_test -r -f count.sql

分別測試 200w - 1000w 數(shù)據(jù)量下的 count 語句耗時

數(shù)據(jù)大小 count耗時(ms)
200w 738.758
300w 1035.846
400w 1426.183
500w 1799.866
600w 2117.247
700w 2514.691
800w 2526.441
900w 2568.240
1000w 2650.434

繪制成耗時曲線

曲線的趨勢在 600w - 700w 數(shù)據(jù)量之間出現(xiàn)了轉(zhuǎn)折,200w - 600w 是線性增長,600w 之后 count 的耗時就基本相同了。使用 explain 語句分別查看 600w 和 700w 數(shù)據(jù)時的 count 語句執(zhí)行。

700w:

Finalize Aggregate (cost=502185.93..502185.94 rows=1 width=8) (actual time=894.361..894.361 rows=1 loops=1)
  Output: count(*)
  Buffers: shared hit=16344 read=352463
  -> Gather (cost=502185.72..502185.93 rows=2 width=8) (actual time=894.232..899.763 rows=3 loops=1)
     Output: (PARTIAL count(*))
     Workers Planned: 2
     Workers Launched: 2
     Buffers: shared hit=16344 read=352463
     -> Partial Aggregate (cost=501185.72..501185.73 rows=1 width=8) (actual time=889.371..889.371 rows=1 loops=3)
        Output: PARTIAL count(*)
        Buffers: shared hit=16344 read=352463
        Worker 0: actual time=887.112..887.112 rows=1 loops=1
         Buffers: shared hit=5459 read=118070
        Worker 1: actual time=887.120..887.120 rows=1 loops=1
         Buffers: shared hit=5601 read=117051
        -> Parallel Index Only Scan using test_tbl_pkey on public.test_tbl (cost=0.43..493863.32 rows=2928960 width=0) (actual time=0.112..736.376 rows=2333333 loops=3)
           Index Cond: (test_tbl.id  7000000)
           Heap Fetches: 2328492
           Buffers: shared hit=16344 read=352463
           Worker 0: actual time=0.107..737.180 rows=2344479 loops=1
            Buffers: shared hit=5459 read=118070
           Worker 1: actual time=0.133..737.960 rows=2327028 loops=1
            Buffers: shared hit=5601 read=117051
 Planning time: 0.165 ms
 Execution time: 899.857 ms

600w:

Finalize Aggregate (cost=429990.94..429990.95 rows=1 width=8) (actual time=765.575..765.575 rows=1 loops=1)
  Output: count(*)
  Buffers: shared hit=13999 read=302112
  -> Gather (cost=429990.72..429990.93 rows=2 width=8) (actual time=765.557..770.889 rows=3 loops=1)
     Output: (PARTIAL count(*))
     Workers Planned: 2
     Workers Launched: 2
     Buffers: shared hit=13999 read=302112
     -> Partial Aggregate (cost=428990.72..428990.73 rows=1 width=8) (actual time=763.821..763.821 rows=1 loops=3)
        Output: PARTIAL count(*)
        Buffers: shared hit=13999 read=302112
        Worker 0: actual time=762.742..762.742 rows=1 loops=1
         Buffers: shared hit=4638 read=98875
        Worker 1: actual time=763.308..763.308 rows=1 loops=1
         Buffers: shared hit=4696 read=101570
        -> Parallel Index Only Scan using test_tbl_pkey on public.test_tbl (cost=0.43..422723.16 rows=2507026 width=0) (actual time=0.053..632.199 rows=2000000 loops=3)
           Index Cond: (test_tbl.id  6000000)
           Heap Fetches: 2018490
           Buffers: shared hit=13999 read=302112
           Worker 0: actual time=0.059..633.156 rows=1964483 loops=1
            Buffers: shared hit=4638 read=98875
           Worker 1: actual time=0.038..634.271 rows=2017026 loops=1
            Buffers: shared hit=4696 read=101570
 Planning time: 0.055 ms
 Execution time: 770.921 ms

根據(jù)以上現(xiàn)象推斷,PostgreSQL 似乎在 count 的數(shù)據(jù)量小于數(shù)據(jù)表長度的某一比例時,才使用 index scan,通過查看官方 wiki 也可以看到相關(guān)描述:

It is important to realise that the planner is concerned with minimising the total cost of the query. With databases, the cost of I/O typically dominates. For that reason, "count(*) without any predicate" queries will only use an index-only scan if the index is significantly smaller than its table. This typically only happens when the table's row width is much wider than some indexes'.[3]

根據(jù) Stackoverflow 上的回答,count 語句查詢的數(shù)量大于表大小的 3/4 時候就會用使用全表掃描代替索引掃描[4]。

結(jié)論

不要用 count(1) 或 count(列名) 代替 count(*)

count 本身是非常耗時的

count 可能是 index scan 也可能是 sequence scan,取決于 count 數(shù)量占表大小的比例

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • 在postgresql數(shù)據(jù)庫中判斷是否是數(shù)字和日期時間格式函數(shù)操作
  • PostgreSQL 實現(xiàn)將多行合并轉(zhuǎn)為列
  • postgresql 實現(xiàn)sql多行語句合并一行
  • Postgresql自定義函數(shù)詳解
  • PostgreSQL刪除更新優(yōu)化操作
  • Postgresql排序與limit組合場景性能極限優(yōu)化詳解
  • postgresql通過索引優(yōu)化查詢速度操作
  • postgresql rank() over, dense_rank(), row_number()用法區(qū)別

標簽:珠海 衡陽 株洲 來賓 烏海 晉城 錦州 蚌埠

巨人網(wǎng)絡(luò)通訊聲明:本文標題《postgreSQL 非count方法算記錄數(shù)操作》,本文關(guān)鍵詞  postgreSQL,非,count,方法,算,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《postgreSQL 非count方法算記錄數(shù)操作》相關(guān)的同類信息!
  • 本頁收集關(guān)于postgreSQL 非count方法算記錄數(shù)操作的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    精品久久久久久久人人人人传媒| 成人涩涩免费视频| 夜夜揉揉日日人人青青一国产精品| 国产色产综合产在线视频| 欧美tickling挠脚心丨vk| 日韩欧美aaaaaa| 精品久久久久一区| 国产午夜精品久久| 国产精品久久久久影院色老大| 国产精品成人免费在线| 怡红院av一区二区三区| 亚洲午夜久久久久| 日韩成人午夜精品| 国产伦精品一区二区三区免费迷| 懂色中文一区二区在线播放| 91蜜桃免费观看视频| 欧美日韩一二三区| 精品国产成人系列| 成人免费视频在线观看| 亚洲精品一二三| 三级亚洲高清视频| 国产精品一区在线观看乱码| 成人av资源站| 欧美日韩精品电影| 国产欧美日韩激情| 亚洲成av人片一区二区梦乃| 激情国产一区二区| 欧美自拍偷拍一区| 久久久久久久久久久久久女国产乱| 国产精品黄色在线观看| 日本女优在线视频一区二区| 国产馆精品极品| 欧美日韩国产高清一区| 国产拍揄自揄精品视频麻豆| 亚洲成av人片一区二区| 国产ts人妖一区二区| 欧美日韩国产综合一区二区| 国产精品毛片久久久久久久| 午夜电影一区二区三区| 成人h动漫精品一区二| 日韩一区二区高清| 中文字幕在线不卡一区| 国产在线一区观看| 欧美丰满一区二区免费视频| 自拍偷拍欧美精品| 国产电影一区在线| 日韩一区国产二区欧美三区| 亚洲卡通动漫在线| 成人激情免费网站| 2023国产精品视频| 免费黄网站欧美| 欧美日韩一区在线观看| 综合婷婷亚洲小说| 国产精品一二一区| 精品久久久久久久久久久院品网| 亚洲狠狠爱一区二区三区| 97精品电影院| 国产精品情趣视频| 高清不卡一区二区在线| 2020国产精品久久精品美国| 青青草伊人久久| 91精品欧美一区二区三区综合在| 亚洲影院在线观看| 91九色02白丝porn| 亚洲一区在线免费观看| 在线免费视频一区二区| 一区二区在线观看免费| 91丨九色porny丨蝌蚪| 中文字幕在线一区免费| 丁香六月综合激情| 国产精品久久久久久久久快鸭| 国产成人福利片| 中文字幕免费一区| jizzjizzjizz欧美| 亚洲另类中文字| 欧美午夜精品一区| 蜜臀99久久精品久久久久久软件| 在线播放中文字幕一区| 美女性感视频久久| 久久亚洲春色中文字幕久久久| 国产成人亚洲精品青草天美| 国产喷白浆一区二区三区| 成人av在线网| 一区二区免费在线播放| 欧美日本国产一区| 麻豆精品在线视频| 久久久久国产精品麻豆| av在线一区二区三区| 亚洲一区二区三区在线看| 69堂精品视频| 韩国一区二区在线观看| 国产精品家庭影院| 欧美精品在线观看播放| 国产精品1024| 一区二区三区丝袜| 精品久久一区二区三区| 99国产精品久久| 亚洲成av人**亚洲成av**| 精品电影一区二区三区| 波波电影院一区二区三区| 亚洲一区在线观看视频| 337p日本欧洲亚洲大胆精品 | 国产日韩亚洲欧美综合| 97超碰欧美中文字幕| 青青国产91久久久久久| 国产女同性恋一区二区| 欧美色网一区二区| 国产高清成人在线| 亚州成人在线电影| 国产精品女主播av| 日韩美女视频在线| 成人国产精品视频| 男男gaygay亚洲| 亚洲精品中文在线观看| 久久免费视频一区| 欧美少妇bbb| 99综合影院在线| 国产精品一区专区| 人妖欧美一区二区| 亚洲午夜激情av| 中文字幕一区二| 国产亚洲一二三区| 91精品国产一区二区人妖| 91女厕偷拍女厕偷拍高清| 国产精品一区二区在线播放| 日本va欧美va精品发布| 亚洲国产色一区| 亚洲欧美偷拍另类a∨色屁股| 国产亚洲综合av| 欧美一区二区三区四区高清| 欧美视频在线一区二区三区| 99国产麻豆精品| 丁香天五香天堂综合| 国产激情视频一区二区三区欧美 | 日韩美女视频19| 亚洲国产高清在线观看视频| 久久综合网色—综合色88| 91麻豆精品国产自产在线| 欧美日韩在线免费视频| 欧美日韩国产高清一区| 欧美少妇xxx| 欧美二区三区91| 欧美日本韩国一区| 7777精品伊人久久久大香线蕉最新版 | 日韩欧美在线一区二区三区| 欧美性生活久久| 在线观看一区日韩| 色琪琪一区二区三区亚洲区| 91麻豆产精品久久久久久| 色婷婷一区二区三区四区| 欧美私模裸体表演在线观看| 欧美中文字幕久久| 在线不卡的av| 精品久久久久香蕉网| 国产欧美一区二区精品性色超碰| 久久久久国产成人精品亚洲午夜 | 日韩欧美电影一区| 精品日韩一区二区三区| 久久精品一区蜜桃臀影院| 国产精品网站在线播放| 亚洲男女毛片无遮挡| 亚洲成av人**亚洲成av**| 男男成人高潮片免费网站| 韩国在线一区二区| 成人久久久精品乱码一区二区三区| kk眼镜猥琐国模调教系列一区二区| 97久久超碰国产精品| 欧美精品电影在线播放| 久久综合久久综合久久综合| 国产精品网站在线观看| 亚洲一区二区三区四区五区黄 | 成人av网站免费观看| 色狠狠综合天天综合综合| 欧美一区国产二区| 亚洲国产成人一区二区三区| 亚洲中国最大av网站| 国产中文一区二区三区| 91浏览器在线视频| 精品欧美久久久| 亚洲影院理伦片| 国产成人午夜精品5599| 色琪琪一区二区三区亚洲区| 精品日产卡一卡二卡麻豆| 亚洲精品国产无天堂网2021| 麻豆成人久久精品二区三区红 | 国产一区二区在线观看免费| 91一区在线观看| 精品久久久久久无| 亚洲第一主播视频| a级高清视频欧美日韩| 日韩美女视频在线| 亚洲自拍偷拍av| 岛国精品在线观看| 精品免费日韩av| 图片区日韩欧美亚洲| 色综合天天综合网国产成人综合天 | 日韩国产精品久久久久久亚洲| 成人丝袜18视频在线观看| 日韩免费观看高清完整版| 亚洲一区在线视频|