先说Docker干啥用的。

兰亭文艺 2020-02-10

展开全文

先说Docker干啥用的。因为现在物理服务器是很强大的，我们如果在一台物理服务器上只跑一个服务就浪费了，而同时跑很多服务他们又互相影响，比如说一个服务出了内存泄漏把整个服务器的内存都占满了，其他服务都跟着倒霉。所以要把每个服务都隔离起来，让它们只使用自己那部分有限的cpu，内存和磁盘，以及自己依赖的软件包。这个早先是用虚拟机来实现隔离的，但是每个虚拟机都要装自己的操作系统核心，这是对资源有点浪费。于是就有了Docker, 一个机器上可以装十几个到几十个docker，他们共享操作系统核心，占用资源少，启动速度快。但又能提供了资源（cpu, 内存，磁盘等）的一定程度的隔离。

然后使用docker给软件开发又带来了不少额外的好处。比如说运维省心啊，所有物理服务器的配置几乎都是一样的，只是上面跑的docker container不同。以前某个服务访问量大了，需要多几台服务器，你得一台一台准备，现在直接docker配好，要几个就给几个。

还有依赖关系管理也容易了，每个docker image都可以独立配置自己需要的软件包，准备一个配置文件就可以发布，不像以前配置个apache + php就在一台物理主机上从头编译到尾，如果想再多个插件，往往是从头又来一遍，机器多了是受不了的。而且依赖有冲突也没那么怕了，都隔离了嘛。

现在docker的隔离性已经做的非常好了。我觉得docker有个问题是linux宿主和windows宿主的docker实现差异还挺大的。linux是基于linux核心的namespaces和cgroup等来隔离资源，还有libvirt这样的接口实现，基本上能当个虚拟机来用，又很轻量级。windows方面主要是靠微软，微软做得也还不错，前后搞了好几种container方案，前段时候我试过的是基于hyper-v的, 功能应该都在了，所以说现在docker在windows主机上也是能用的, 这对国内庞大的windows服务器保有量也是个福音。不过在windows上面使用docker开发是没问题，生产环境我就不确定了。

-------------

要解释清楚Docker，首先要说解释清楚容器（Container）的概念。要解释容器的话，需要从操作系统说起。太深入的一两本书都说不清楚，直接引用维基的说法，操作系统就是管理计算机的硬件软件和资源，并且为软件运行提供通用服务的系统软件。

·硬件管理，包括分配CPU时间、内存；从网络、存储设备等IO设备读写数据。

·软件管理，就是各种软件的运行，线程、进程调度之类的工作。

·为软件提供运行环境，这个运行环境通常一部分由操作系统内核（Kernel）提供，另一部分由运行库（Runtime Library）提供。

硬件、操作系统、应用程序之间的关系可以简单的用下图表示：

+--------------------------+

| Applications |

+--------------------------+

|+------------------------+|

|| Runtime Library ||

|+------------------------+|

|| Kernel ||

|+------------------------+|

| Operating System |

+-----+--------+-----------+

| CPU | Memory | IO Device |

+-----+--------+-----------+

随着硬件的性能提升，以及软件种类的丰富，有两种情况变得很常见：

1.硬件性能过剩——很多计算机的硬件配置，即使不能完全满足峰值性能的要求，也往往会有大量时间处于硬件资源闲置的状态。例如一般家用电脑，已经是四核、六核的配置了，除了3A游戏、视频制作、3D渲染、高性能计算等特殊应用外，通常有90%以上时间CPU是闲置的。

2.软件冲突——因为业务需要，两个或者多个软件之间冲突，或者需要同一个软件的不同版本。例如早几年做web前端的，要测试网页在不同版本的IE上是否能正常显示，然而Windows只能装一个版本的IE。

为了解决软件冲突，只能配置多台计算机，或者很麻烦的在同一台电脑上安装多个操作系统，通过重启来进行切换。显然这两个方案都有其缺点：多台计算机成本太高，多操作系统的安装、切换都很麻烦。在硬件性能过剩的时候，硬件虚拟化的普及就很自然而然的提出来了。

所谓硬件虚拟化，就是某个特殊的软件，仿真出一台或者多台计算机的各种硬件，用户可以在这一台虚拟机上安装、运行操作系统（一般叫来宾操作系统，Guest OS）和各种应用，并且把Guest OS和上面应用软件对硬件资源的访问转发到底层的硬件上来实现。对于Guest OS和上面的应用程序来说，这台虚拟机和普通的物理计算机是完全一样没有任何区别的——除了性能可能差一点。著名的VMware就是这么一个软件，这类软件英语有一个专用的单词是Hypervisor（维基的Hypervisor词条说另一种叫法是虚拟机监视器，Virtual Machine Monitor，vmm。但我个人觉得叫虚拟机管理器，Virtual Machine Manager，更合适一点，虽然可能会和微软的System Center Virtual Machine Manager以及Redhat的Virtual Machine Manager这两个软件混淆），中文大概应该叫虚拟化软件/应用之类的。

Hypervisor根据其对硬件资源的访问方式，可以分为两大类，Type I是Hypervisor直接访问硬件资源，通常会有另一个操作系统运行于Hypervisor之上来对硬件资源，例如VMware EXSi，Windows的Hyper-V，Linux的Xen；Type II是Hypervisor和普通的应用一样，运行在某个操作系统（例如Windows或者Linux等，这里称之为宿主机操作系统，Host OS）之上，Hypervisor通过Host OS访问硬件资源，例如VMware Workstation，Virtual Box等。两种类型的Hypervisor区别如图所示。

+-----+-----+-----+-----+

+-----+-----+-----+-----+

| OS0 | OS1 | OS2 | OS3 |

+-----+-----+-----+-----+

| Hypervisor |

+-----------------------+

| Hardware |

+-----------------------+

Type I

+-----+-----+-----+-----+

+-----+-----+-----+-----+

| OS0 | OS1 | OS2 | OS3 |

+-----+-----+-----+-----+

| Hypervisor |

+-----------------------+

| Host OS |

+-----------------------+

| Hardware |

+-----------------------+

Type II

虚拟机的一个缺点在于Guest OS通常会占用不少硬件资源。例如Windows安装开机不运行任何运用，就需要占用2~3G内存，20~30G硬盘空间。即使是没有图形界面的Linux，根据发行版以及安装软件的不同也会占用100~1G内存，1~4G硬盘空间。而且为了应用系统运行的性能，往往还要给每台虚拟机留出更多的内存容量。虽然不少Hypervisor支持动态内存，但基本上都会降低虚拟机的性能。如果说这样的资源占用少量的虚拟机还可以接受的话，同时运行十数台数十台虚拟机的时候，浪费的硬件资源就相当可观了。通常来说，其中相当大部分甚至全部Guest OS都是相同的。

能不能所有的应用使用同一个的操作系统减少硬件资源的浪费，但是又能避免包括运行库运行库在内的软件冲突呢？操作系统层虚拟化——容器概念的提出，就是为了解决这个问题。在Linux可以通过控制组（Control Group，通常简写为cgroup）隔离，并把应用和运行库打包在一起，来实现这个目的。容器和Type II虚拟机、物理机的区别见下图：

+-----+-----+-----+-----+

+-----+-----+-----+-----+

|+---------------------+|

|| Runtime Library ||

|+---------------------+|

|| Kernel ||

|+---------------------+|

| Operating System |

+-----------------------+

| Hardware |

+-----------------------+

Physical Machine

+-----+-----+-----+-----+

+-----+-----+-----+-----+

+-----+-----+-----+-----+

| Container Engine |

+-----------------------+

| Host OS |

+-----------------------+

| Hardware |

+-----------------------+

Container

+-----+-----+-----+-----+

+-----+-----+-----+-----+

| OS0 | OS1 | OS2 | OS3 |

+-----+-----+-----+-----+

| Hypervisor |

+-----------------------+

| Host OS |

+-----------------------+

| Hardware |

+-----------------------+

Type II Hypervisor

上图中，每一个App和Lib的组合，就是一个容器。也就是Docker图标里面的一个集装箱。和虚拟机相比，容器有以下优点：

1.迅速启动：没有虚拟机硬件的初始化，没有Guest OS的启动过程，可以节约很多启动时间，这就是容器的“开箱即用”。

2.占用资源少：没有运行Guest OS所需的内存开销，无需为虚拟机预留运行内存，无需安装、运行App不需要的运行库/操作系统服务，内存占用、存储空间占用都小的多。相同配置的服务器，如果运行虚拟机只能运行十多台的，通常可以运行上百个容器毫无压力——当然前提是单个容器应用本身不会消耗太多资源。

当然，和虚拟机相比，因为共用内核，只靠cgroup隔离，应用之间的隔离是不如虚拟机彻底的，如果某个应用运行时导致内核崩溃，所有的容器都会崩溃。而虚拟机内的应用崩溃，理论上是不会影响其它虚拟机以及上面运行的应用的，除非是硬件或者Hypervisor有Bug。

Docker把App和Lib的文件打包成为一个镜像，并且采用类似多次快照的存储技术，例如aufs/device mapper/btrfs/zfs等，可以实现：

1.多个App可以共用相同的底层镜像（初始的操作系统镜像）

2.App运行时的IO操作和镜像文件隔离；

3.通过挂载包含不同配置/数据文件的目录或者卷（Volume），单个App镜像可以同时用来运行无数个不同业务的容器。

+---------+ +---------+ +---------+

+----+----+ +----+----+ +----+----+

| | |

+----+----+ +----+----+ +----+----+

+----+----+ +----+----+ +----+----+

| | |

+------------+------------+

+------+------+

| Nginx Image |

+------+------+

+-----+ +-----+ +-----+

| DB1 | | DB2 | | DB3 |

+--+--+ +--+--+ +--+--+

| | |

+--+--+ +--+--+ +--+--+

| DB1 | | DB2 | | DB3 |

+--+--+ +--+--+ +--+--+

| | |

+-------+-------+

+------+------+

| MySQL Image |

+------+------+

1 2

| |

+----------------+----------------+

+------+-------+

| Alpine Image |

+------+-------+

上图是基于一个Alpine Linux的镜像，分别建立了Nginx和MySQL的镜像，并且挂载不同的配置/数据同时运行3个网站应用3个数据库应用的示意图。

此外，Docker公司提供公共的镜像仓库（Docker称之为Repository），Github connect，自动构建镜像，大大简化了应用分发、部署、升级流程。加上Docker可以非常方便的建立各种自定义的镜像文件，这些都是Docker成为最流行的容器技术的重要因素。

通过以上这些技术的组合，最后的结果就是，绝大部分应用，开发者都可以通过docker build创建镜像，通过docker push上传镜像，用户通过docker pull下载镜像，用docker run运行应用。用户不需要再去关心如何搭建环境，如何安装，如何解决不同发行版的库冲突——而且通常不会需要消耗更多的硬件资源，不会明显降低性能。这就是其他答主所说的标准化、集装箱的原因所在。

题外话：除了Docker以外，还有其它很多种容器，例如Linux上的LXC、OpenVZ，FreeBSD的Jail，Solaris的Zones等等。此外，Unix-Like操作系统的chroot命令从某种角度来说也是一种特殊的容器实现方式。和*nix采用宏内核，且内核和各种运行库耦合松散，很方便实现容器不同，Windows因为采用微内核，且内核与各种运行库耦合紧密，虽然从Windows 10/2016开始也支持容器，但事实上还是通过Hyper-V运行不同的虚拟机进行内核级隔离——虽然也有线程级的隔离，但只有Windows Server支持，并且只能运行相同版本的镜像[1]。而且即使是Hyper-V，也只支持运行更低版本的镜像而不能运行更高版本的镜像。另外Windows容器的镜像体积通常还是很大。