前言
話說搞運維的人沒有兩把“刷子”,都不好意思上服務器操作。還好,我還不是搞運維的,我一直都自詡是開發人員,奈何現在的東家運維人員“水”的一比,還要我這個自詡是開發的人擼起袖子親自上陣,好吧,沒有辦法,重拾以前的命令,再次走起~~~
說到運維,那就離不開監控磁盤了。而說到磁盤監控,那又不得不說道說道iostat命令了。這篇文章就對那個我曾經非常熟悉的iostat命令進行詳細的總結。
命令詳解
Linux系統中的iostat是I/O statistics(輸入/輸出統計)的縮寫,iostat工具將對系統的磁盤操作活動進行監視。它的特點是匯報磁盤活動統計情況,同時也會匯報出CPU使用情況。同vmstat一樣,iostat也有一個弱點,就是它不能對某個進程進行深入分析,僅對系統的整體情況進行分析。
iostat常用命令格式如下:
iostat [參數] [時間] [次數]
命令參數說明如下:
-c 顯示CPU使用情況
-d 顯示磁盤使用情況
-k 以K為單位顯示
-m 以M為單位顯示
-N 顯示磁盤陣列(LVM) 信息
-n 顯示NFS使用情況
-p 可以報告出每塊磁盤的每個分區的使用情況
-t 顯示終端和CPU的信息
-x 顯示詳細信息
下面就對我們常用的使用方式進行詳細的總結。
使用實例
命令:iostat -x
說明:每隔2秒刷新顯示,且顯示3次
輸出:
[user1@Test_Server ~]$ iostat -x
Linux 3.10.0-693.2.2.el7.x86_64 (jellythink) 01/05/2019 _x86_64_ (1 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
1.83 0.00 0.31 0.09 0.00 97.77
Device: rrqm/s wrqm/s r/s w/s rkB/s wkB/s avgrq-sz avgqu-sz await r_await w_await svctm %util
vda 0.03 0.78 0.24 1.38 12.64 20.67 41.01 0.02 10.98 55.50 3.17 0.71 0.12
輸出內容詳解:
- %user:CPU處在用戶模式下的時間百分比
- %nice:CPU處在帶NICE值的用戶模式下的時間百分比
- %system:CPU處在系統模式下的時間百分比
- %iowait:CPU等待輸入輸出完成時間的百分比
- %steal:管理程序維護另一個虛擬處理器時,虛擬CPU的無意識等待時間百分比
- %idle:CPU空閑時間百分比
當然了,iostat命令的重點不是用來看CPU的,重點是用來監測磁盤性能的。
- Device:設備名稱
- rrqm/s:每秒合并到設備的讀取請求數
- wrqm/s:每秒合并到設備的寫請求數
- r/s:每秒向磁盤發起的讀操作數
- w/s:每秒向磁盤發起的寫操作數
- rkB/s:每秒讀K字節數
- wkB/s:每秒寫K字節數
- avgrq-sz:平均每次設備I/O操作的數據大小
- avgqu-sz:平均I/O隊列長度
- await:平均每次設備I/O操作的等待時間 (毫秒),一般地,系統I/O響應時間應該低于5ms,如果大于 10ms就比較大了
- r_await:每個讀操作平均所需的時間;不僅包括硬盤設備讀操作的時間,還包括了在kernel隊列中等待的時間
- w_await:每個寫操作平均所需的時間;不僅包括硬盤設備寫操作的時間,還包括了在kernel隊列中等待的時間
- svctm:平均每次設備I/O操作的服務時間 (毫秒)(這個數據不可信!)
- %util:一秒中有百分之多少的時間用于I/O操作,即被IO消耗的CPU百分比,一般地,如果該參數是100%表示設備已經接近滿負荷運行了
命令:iostat -d 2 3
輸出:
[jelly@jellythink ~]$ iostat -d 2 3
Linux 3.10.0-693.2.2.el7.x86_64 (jellythink) 01/05/2019 _x86_64_ (1 CPU)
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
vda 1.62 12.64 20.67 337375593 551756524
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
vda 1.00 0.00 8.00 0 16
Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn
vda 0.00 0.00 0.00 0 0
輸出內容詳解:
- tps:每秒I/O數(即IOPS。磁盤連續讀和連續寫之和)
- kB_read/s:每秒從磁盤讀取數據大小,單位KB/s
- kB_wrtn/s:每秒寫入磁盤的數據的大小,單位KB/s
- kB_read:從磁盤讀出的數據總數,單位KB
- kB_wrtn:寫入磁盤的的數據總數,單位KB
性能監控指標
面說了這么多,也看了那么多的系統輸出,那我們在日常運維中到底需要關注哪些字段呢?下面就來說說這篇文章的重點了,我們到底該關注哪些輸出內容就可以確定這臺服務器是否存在IO性能瓶頸。
- %iowait:如果該值較高,表示磁盤存在I/O瓶頸
- await:一般地,系統I/O響應時間應該低于5ms,如果大于10ms就比較大了
- avgqu-sz:如果I/O請求壓力持續超出磁盤處理能力,該值將增加。如果單塊磁盤的隊列長度持續超過2,一般認為該磁盤存在I/O性能問題。需要注意的是,如果該磁盤為磁盤陣列虛擬的邏輯驅動器,需要再將該值除以組成這個邏輯驅動器的實際物理磁盤數目,以獲得平均單塊硬盤的I/O等待隊列長度
- %util:一般地,如果該參數是100%表示設備已經接近滿負荷運行了
最后,除了關注指標外,我們更需要結合部署的業務進行分析。對于磁盤隨機讀寫頻繁的業務,比如圖片存取、數據庫、郵件服務器等,此類業務嗎,tps才是關鍵點。對于順序讀寫頻繁的業務,需要傳輸大塊數據的,如視頻點播、文件同步,關注的是磁盤的吞吐量。
總結
關于iostat命令的總結就到此結束了。在平時的運維工作中,我們更多的要根據實際場景進行分析。iostat作為一個工具,掌握基本的用法這個是基礎,希望通過這篇文章大家可以掌握iostat命令的基本用法,至于后期的升華,就需要大家在工作中多運用、多摸索和多總結了。
好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。