aiastia / note

笔记
17 stars 5 forks source link

如何合并两个Docker 镜像 #37

Open aiastia opened 5 years ago

aiastia commented 5 years ago

如何合并两个Docker 镜像 【编者的话】当我们想让一个容器做两件事情,或者使一个Docker镜像包含来自两个不同镜像的依赖库时,我们就需要知道每个镜像的Dockerfile。本文介绍了如何通过docker history命令来对Docker镜像进行反向工程,得到它们的Dockerfile,并组织到一个Dockerfile里然后build,从而实现我们想做的事情。

常言道,“不要重复发明轮子!”

在使用Docker时,构建自己的镜像之前,最好在Docker Hub寻找一些可以直接使用的镜像做练习。把你的软件架构分布到一系列容器中,每一个容器只做一件事情,这样的效果非常好。构建分布式应用的最好的基石是使用来自Docker Hub的官方镜像,因为你可以信任它们的质量。

在某些情况下,你可能想让一个容器做两件不同的事情。而在另外一些情况下,你可能想让一个Docker镜像包含来自两个不同镜像的依赖库。如果你有每个镜像的Dockerfile,这是非常简单的。将它们组织到一个Dockerfile里然后build就行。

然而,大多数时间你都在使用Docker Hub上准备好的镜像,你不会有它们的源Dockerfile。我花时间找一个可以合并(或flatten)两个不同Docker镜像的工具,当然我没有它们的Dockerfile。也就是说我在找一个能做下面这件事的东西: image 1 -- \ ---> merged_image_12 / image 2 --

此前在GitHub上有两个相关的讨论(1、2),尽管它们都被关闭了。 这可能吗? 那么,是否存在工具能够像这样做吗:docker merge image2 image2 merged_image? 没有! 你甚至不可以用下面的方式来构建Dockerfile: FROM image1 FROM image2

简而言之,在一个Dockerfile里不能有多个基础镜像。 但是我需要这个功能! 唯一的解决办法是取得这些镜像的Dockerfile,然后把它们组织到一个文件中,再进行构建。那么,我能在Docker Hub上获得一个镜像的Dockerfile吗? 幸运的是可以。它不能离线获取(译注:原文是online,但显然online时对于来自GitHub的自动构建镜像是可以直接获取的),但是你可以使用docker history命令,通过反向工程获取。 怎么来使用? 在你的机器上使用docker pull从Docker Hub下载镜像。 docker pull image1 docker pull image2

然后使用docker history来取得构建这两个容器时运行的命令。 docker history --no-trunc=true image > image1-dockerfile docker history --no-trunc=true image2 > image2-dockerfile

接下来打开这两个文件,你可以看到每个镜像的命令堆栈。这是因为Docker镜像通过层(阅读更多)的方式来构建。即你在Dockerfile中键入的每一个命令所构建的新镜像,都是在之前的命令产生的镜像之上。所以你可以对镜像进行逆向工程。 限制 你不能对镜像进行反向工程的唯一场景,是镜像的维护者在他的Dockerfile中使用了ADD或COPY命令。你会看到这样一行: ADD file:1ac56373f7983caf22 或 ADD dir:cf6fe659e9d21535844

这是因为你不知道维护者在他自己的机器上,包括镜像里使用了什么本地文件。

Happy Reverse-Engineering