MySQL在進(jìn)行alter table等DDL操作時,有時會出現(xiàn)Waiting for table metadata lock的等待場景。而且,一旦alter table TableA的操作停滯在Waiting for table metadata lock的狀態(tài),后續(xù)對TableA的任何操作(包括讀)都無法進(jìn)行,因?yàn)樗麄円矔贠pening tables的階段進(jìn)入到Waiting for table metadata lock的鎖等待隊(duì)列。如果是產(chǎn)品環(huán)境的核心表出現(xiàn)了這樣的鎖等待隊(duì)列,就會造成災(zāi)難性的后果。
造成alter table產(chǎn)生Waiting for table metadata lock的原因其實(shí)很簡單,一般是以下幾個簡單的場景:
場景一:長事物運(yùn)行,阻塞DDL,繼而阻塞所有同表的后續(xù)操作
通過show processlist可以看到TableA上有正在進(jìn)行的操作(包括讀),此時alter table語句無法獲取到metadata 獨(dú)占鎖,會進(jìn)行等待。
這是最基本的一種情形,這個和mysql 5.6中的online ddl并不沖突。一般alter table的操作過程中(見下圖),在after create步驟會獲取metadata 獨(dú)占鎖,當(dāng)進(jìn)行到altering table的過程時(通常是最花時間的步驟),對該表的讀寫都可以正常進(jìn)行,這就是online ddl的表現(xiàn),并不會像之前在整個alter table過程中阻塞寫入。(當(dāng)然,也并不是所有類型的alter操作都能online的,具體可以參見官方手冊:http://dev.mysql.com/doc/refman/5.6/en/innodb-create-index-overview.html)
處理方法: kill 掉 DDL所在的session.
場景二:未提交事物,阻塞DDL,繼而阻塞所有同表的后續(xù)操作
通過show processlist看不到TableA上有任何操作,但實(shí)際上存在有未提交的事務(wù),可以在 information_schema.innodb_trx中查看到。在事務(wù)沒有完成之前,TableA上的鎖不會釋放,alter table同樣獲取不到metadata的獨(dú)占鎖。
處理方法:通過 select * from information_schema.innodb_trx\G, 找到未提交事物的sid, 然后 kill 掉,讓其回滾。
場景三:
通過show processlist看不到TableA上有任何操作,在information_schema.innodb_trx中也沒有任何進(jìn)行中的事務(wù)。這很可能是因?yàn)樵谝粋€顯式的事務(wù)中,對TableA進(jìn)行了一個失敗的操作(比如查詢了一個不存在的字段),這時事務(wù)沒有開始,但是失敗語句獲取到的鎖依然有效,沒有釋放。從performance_schema.events_statements_current表中可以查到失敗的語句。
官方手冊上對此的說明如下:
If the server acquires metadata locks for a statement that is syntactically valid but fails during execution, it does not release the locks early. Lock release is still deferred to the end of the transaction because the failed statement is written to the binary log and the locks protect log consistency.
也就是說除了語法錯誤,其他錯誤語句獲取到的鎖在這個事務(wù)提交或回滾之前,仍然不會釋放掉。because the failed statement is written to the binary log and the locks protect log consistency 但是解釋這一行為的原因很難理解,因?yàn)殄e誤的語句根本不會被記錄到二進(jìn)制日志。
處理方法:通過performance_schema.events_statements_current找到其sid, kill 掉該session. 也可以 kill 掉DDL所在的session.
總之,alter table的語句是很危險(xiǎn)的(其實(shí)他的危險(xiǎn)其實(shí)是未提交事物或者長事務(wù)導(dǎo)致的),在操作之前最好確認(rèn)對要操作的表沒有任何進(jìn)行中的操作、沒有未提交事務(wù)、也沒有顯式事務(wù)中的報(bào)錯語句。如果有alter table的維護(hù)任務(wù),在無人監(jiān)管的時候運(yùn)行,最好通過lock_wait_timeout設(shè)置好超時時間,避免長時間的metedata鎖等待。
您可能感興趣的文章:- MySQL表結(jié)構(gòu)變更你不可不知的Metadata Lock詳解
- MYSQL METADATA LOCK(MDL LOCK)MDL鎖問題分析
- MySQL slave 延遲一列 外鍵檢查和自增加鎖
- 淺談MySQL next-key lock 加鎖范圍
- MySQL 加鎖控制并發(fā)的方法
- PHP+MySQL高并發(fā)加鎖事務(wù)處理問題解決方法
- MYSQL METADATA LOCK(MDL LOCK) 理論及加鎖類型測試