聊聊ab、wrk、JMeter、Locust这些压测工具的并发模型差别

聊聊ab、wrk、JMeter、Locust这些压测工具的并发模型差别 by 质量价值

选择压测工具是在选什么？

压力测试是测试工程师日常工作中一项比较“有技术含量”的工作，很多人都对这项工作充满了好奇。除了少数特殊场景得靠自己开发压测脚本外，大部分压测工作是可以选用成熟的压测工具来进行的。压测工具有非常多，有开源的、有商业化的，我下面罗列一些常见的：

工具	项目地址
ApacheBench	https://httpd.apache.org/docs/2.4/programs/ab.html
wrk	https://github.com/wg/wrk
Apache JMeter	https://jmeter.apache.org/
Locust	https://locust.io/
K6	https://k6.io/
Artillery	https://artillery.io/

除了LoadRunner这种商业压测工具之外，大部分测试人员在压测工具的选型时最重要的一点：是否熟悉。这种熟悉往往是出于过往的工作经历、身边同事的推荐、网上教程的多寡、脚本语言等因素。比如我在很多年前开始用Locust时，就是因为我个人擅长Python开发语言，即便在当时几乎没有中文教程。

但我在使用Locust一段时间之后，大约在2015年中，我意识到Locust作为一款压测工具，其能够产生的压力好像远远逊色于JMeter之类，于是开始关注压测工具背后的并发模型，去理解不同压测工具运行逻辑，尝试去解释我看到的性能差异。

同步、异步、阻塞、非阻塞

要讲并发模型，我们绕不开以下四个名词：

同步（Synchronous）
异步（Asynchronous）
阻塞（Blocking)
非阻塞（Nonblocking）

而且我还要特地指出：目前你能通过搜索引擎找到的、能准确解释这四个概念的中文资料，是极少的。

我这边不会班门弄斧地来解释这四个词的差别，只是提一些大部分资料中忽视的点：

要区分同步、异步，必须讲清楚其所处的层，比如框架、用户空间、内核、IO模型
同步调用发起后，没有得到结果不返回，那么毫无疑问就是被阻塞了
异步调用发起后直接返回，毫无疑问，这个进程没有被阻塞

在Operating System Concepts [9th Edition]该书中描述对进程间通信进行了一些描述

也就是说，站在进程通信纬度上来看，阻塞、非阻塞与同步、异步是同义词，但是需要区分发送方、接收方：

阻塞发送
非阻塞发送
阻塞接受
非阻塞接受

上述不同类型的发送方法和不同类型的接收方法可以自由组合

另外，我们还知道Linux有五种I/O模型：

阻塞式IO（Blocking I/O）
非阻塞式IO（Nonblocking I/O）
IO复用（I/O multiplexing）

select
poll
epoll

信号驱动式IO（Signal Driver I/O）

异步IO（Asynchronous I/O）

以上1-4其实都是同步IO，只有第五种模型才是异步IO

了解以上这些概念后，我们再来讲讲文章标题中提到的这些压测工具背后的并发模型

基于多线程并发的ab、JMeter

ab、JMeter分别是用C、Java开发的、基于多线程并发模型的压测工具，也是目前最流行的开源压测工具，两者的工作原理类似，如下图：

不管ab还是JMeter，其所谓的虚拟用户(vuser)就是对应一个线程
在单个线程中，每个请求（query）都是同步调用的，下一个请求要等待前一个请求完成才能进行
一个请求（query）分成三部分：

send - 施压端发送开始，直到承压端接收完成
wait - 承压端接收完成开始，直至业务处理结束
recv - 承压端返回数据，直至施压端接收完成

同一线程中连续的两个请求之间存在等待时间这种概念，即图中的空白处

在多线程并发模型下，是不是可以通过不断增加线程数量生产出更大的压力？

答案是否定的。

事实上一个进程在一个时间点只能执行一个线程，而所谓的并发是指在进程里不断切换线程实现了看上去的多个任务的并发，但是线程上下文切换有很高的成本，过多的线程数反而会造成性能的严重下滑。

从应用角度来看，基于多线程的并发模型，往往需要设置最大并发数参数，而如果压测场景需要不断往上加压，那这类工具其实挺难应付的。

wrk为什么比ab快？

wrk是一款很类似ab的压测工具，同样是使用C语言开发，不过更加的『现代化』：

wrk is a modern HTTP benchmarking tool capable of generating significant load when run on a single multi-core CPU. It combines a multithreaded design with scalable event notification systems such as epoll and kqueue.

我们通过wrk的执行参数来来解释其并发模型：