本文講述了如何通過 Docker 的多階段構建功能來大幅度減小鏡像大小,適用于需要在 Dockerfile 中構建程式(如 javac),且需要另外安裝編譯工具鏈的鏡像。(如 Java)
先來學習單詞(本文全部采用中文詞匯,如需查詢外文文檔可對照該詞匯表。理論上個人不贊成翻譯術語):
- multi-stage 多階段
- build 構建
- image 鏡像
- stage 階段
再來看一下效果: 原 110M+,現 92M。
對比一下 Dockerfile
優化前 Dockerfile:
FROM openjdk:8u171-jdk-alpine3.8
ADD . /app
WORKDIR /app
RUN apk add maven \
&& mvn clean package \
&& apk del maven \
&& mv target/final.jar / \
&& cd / \
&& rm -rf /app \
&& rm -rf /root/.m2
ENTRYPOINT java -jar /final.jar
優化后 Dockerfile:
FROM openjdk:8u171-jdk-alpine3.8 as builder
ADD . /app
WORKDIR /app
RUN apk add maven \
&& mvn clean package \
&& apk del maven \
&& mv target/final.jar /
FROM openjdk:8u181-jre-alpine3.8 as environment
WORKDIR /
COPY --from=builder /final.jar .
ENTRYPOINT java -jar /final.jar
很明顯,優化后的 Dockerfile 新增了 FROM AS 這個命令,并出現了兩個 FROM。這就是多階段構建。
了解一下多階段構建
多階段構建是 Docker 17.05 的新增功能,它可以在一個 Dockerfile 中使用多個 FROM 語句,以創建多個 Stages(階段)。每個階段間獨立(來源請求),可以通過 COPY --from 來獲取其它階段的文件。我們來打個比方,把最終鏡像比作一盤菜(炒青椒)。把原料青椒炒完后上桌。
# 對比清單
鏡像 -> 一盤菜
第一個階段 -> 炒
第二個階段 -> 上桌
兩個階段的目標是做好(生成)最終的菜(鏡像)。我們要做的是將第一個階段「炒」出來的食物進行「上桌」。我們的目標是 做出菜,且 菜盤子(盛菜和中間產物)最輕。
可視化流程如下:
# 做菜流程
... 省略原料
原料 -> [第一個階段——炒] # 此時盤子里有炒的工具、炒的結果和中間產物
# 這時候開啟第二個階段,只保留炒的結果,而不再需要其它。
-> 炒的結果 -> [開始上桌,只保留結果] # 把炒出來的青椒拿來(COPY --from),其它不要
-> 最終是一盤菜。
現在應該大致理解多階段構建的流程了吧。我們把話筒交給 Java,看看在 Dockerfile 中使用編譯工具構建一個 JAR,并只保留構建完的 JAR 和運行時交給 Image,其它則扔掉應該怎么做:
# 第一階段——編譯(炒)
FROM openjdk:8u171-jdk-alpine3.8 as builder # 自帶編譯工具
ADD . /app
WORKDIR /app
RUN ... 省略編譯和清理工作...
# 現在,JAR 已經出爐。JDK 不再需要,所以不能留在鏡像中。
# 所以我們開啟第二階段——運行(上桌),并扔掉第一階段的所有文件(包括編譯工具)
FROM openjdk:8u181-jre-alpine3.8 as environment # 只帶運行時
# 目前,編譯工具等上一階段的東西已經被我們拋下。目前的鏡像中只有運行時,我們需要把上一階段(炒)的結果拿來,其它不要。
COPY --from=0 /final.jar .
# 好了,現在鏡像只有必要的運行時和 JAR 了。
ENTRYPOINT java -jar /final.jar
如上就是多階段構建的介紹。
使用多階段構建
多階段構建的核心命令是 FROM。FORM 對于身經百戰的你來說已經不用多講了。在多階段構建中,每次 FROM 都會開啟一個新的 Stage(階段),可以看作一個新的 Image(不夠準確、來源請求),與其它階段隔離(甚至包括環境變量)。只有最后的 FROM 才會被納入 Image 中。
我們來做一個最 simple 的多階段構建例子:
# Stage 1
FROM alpine:3.8
WORKDIR /demo
RUN echo "Hello, stage 1" > /demo/hi-1.txt
# Stage 2
FROM alpine:3.8
WORKDIR /demo
RUN echo "Hello, stage 2" > /demo/hi-2.txt
可以自己構建一下這個 Dockerfile,然后 docker save <tag> > docker.tar 看看其中的內容。不出意外應該只有 /demo/hi-2.txt 和 Alpine。
在這個 Dockerfile 中,我們創建了兩個階段。第一個階段創建 hi-1.txt,第二個階段創建 hi-2.txt,且第二個階段會被加入最終 Image,其它不會。
復制文件——階段間的橋梁
如果階段間完全隔離,那么多階段就沒有意義——上一個階段的結果會被完全拋棄,并進入全新的下一階段。
我們可以通過 COPY 命令來獲取其它階段的文件。在多階段中使用 COPY 和普通應用完全一致,僅需要添加 –form ` 即可。那么,我們修正上一個例子,使最終鏡像包含兩個階段的產物:
# Stage 1
FROM alpine:3.8
WORKDIR /demo
RUN echo "Hello, stage 1" > /demo/hi-1.txt
# Stage 2
FROM alpine:3.8
WORKDIR /demo
COPY --from=0 /demo/hi-1.txt /demo
RUN echo "Hello, stage 2" > /demo/hi-2.txt
重新構建并保存(Save),你會發現多了一層 Layer,其中包含 hi-1.txt。
階段命名——快速識別
對于只有七秒記憶的我們來說,每次使用 stage index 并不是一件很妙的事情。這時候,可以通過階段命名的方式給它們賦予名字,以方便識別。
為階段添加名字很簡單,只需要在 FROM 后加上 as <name> 即可。
現在,我們更新 Dockerfile,給予階段名稱并使用名稱來 COPY。
# Stage 1, it's name is "build1"
FROM alpine:3.8 as build1
WORKDIR /demo
RUN echo "Hello, stage 1" > /demo/hi-1.txt
# Stage 2, it's name is "build2"
FROM alpine:3.8 as build2
WORKDIR /demo
# No longer use indexes
COPY --from=build1 /demo/hi-1.txt /demo
RUN echo "Hello, stage 2" > /demo/hi-2.txt
重新構建并保存,結果應該同上次相同。
僅構建部分階段——輕松調試
Docker 還為我們提供了一個很方便的調試方式——僅構建部分階段。它可以使構建停在某個階段,并不構建后面的階段。這可以方便我們調試;區分生產、開發和測試。
仍然沿用上次的 Dockerfile,但使用 --target <stage> 參數進行構建:
$ docker build --target build1 .
再次 Save,你會發現只有 build1 的內容。
總結
這就是多階段構建的全部用法了。我們再回到開篇的兩個 Dockerfile 對比,你能發現優化前的鏡像胖在哪里了嗎?
很顯然,它包含了無用的 JDK,JDK 只在編譯時起作用,編譯完便無用了,只需要 JRE 即可。所以,利用多階段構建可以隔離編譯階段和運行階段,以達到鏡像最優化。
參考文獻
https://docs.docker.com/develop/develop-images/multistage-build/#name-your-build-stages
https://yeasy.gitbooks.io/docker_practice/image/multistage-builds.html
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。