Linux流量复制工具

流量复制

线下的测试难以模拟真实流量, 尤其难以模拟正常流量混杂着各色异常流量;所以复制线上流量进行测试,能够覆盖很多无法预见的异常流量.

流量复制工具有很多, 例如Gor、tcpreplay、tcpcopy等; 这些工具贴合真实场景,能模拟真实流量, 并支持流量的放大或缩小,更容易测试出程序的瓶颈和潜在问题.

Nginx插件

ngx_http_mirror_module 模块可以复制原始请求(镜像)通过内部跳转到另一个location.

配置如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
server {
listen 8080;
access_log /home/work/log/nginx/org.log;
root html/org;
}

server {
listen 8081;
access_log /home/work/log/nginx/mir.log ;
root html/mir;
}

upstream backend {
server 127.0.0.1:8080;
}

upstream test_backend {
server 127.0.0.1:8081;
}

server {
listen 80;
server_name localhost;

# original 配置
location / {
# mirror指定镜像uri为 /mirror
mirror /mirror;
# off|on 指定是否镜像请求body部分(开启为on,则请求自动缓存;)
mirror_request_body off;
# 指定上游server的地址
proxy_pass http://backend;
}

# mirror 配置
location /mirror {
# 指定此location只能被“内部的”请求调用
internal;
# 指定上游server的地址
proxy_pass http://test_backend$request_uri;
# 设置镜像流量的头部
proxy_set_header X-Original-URI $request_uri;
}

}

流量放大, 配置两个mirror即可.

1
2
3
4
5
location / {
mirror /mirror;
mirror /mirror;
proxy_pass http://backend;
}

使用是很方便,但是线上nginx一般都承载了不止一个业务,修改nginx配置后需要nginx -s reload来使之生效,这种操作在线上还是尽量需要避免的.

Goreplay

Goreplay是用Golang写的一个 HTTP 实时流量复制工具。功能更强大,支持流量的放大、缩小,频率限制,还支持把请求记录到文件,方便回放和分析,也支持和 ElasticSearch 集成,将流量存入 ES 进行实时分析。

安装部署

1
2
> wget https://github.com/buger/goreplay/releases/download/v0.16.1/gor_0.16.1_x64.tar.gz
> tar xzvf gor_0.16.1_x64.tar.gz

流量复制

可以将流量复制到文件,然后再对他们进行回放。回放的时候,流量会维持原始的时间间隔。如果你使用了百分比来进行速率限制,那么回放的速率会相应的增加或减少。有了这种速率限制,gor就可以用来进行压力测试.

1
2
3
4
5
# write to file
gor --input-raw :80 --output-file requests_origin.gor

# read from file
gor --input-file requests_origin.gor --output-http "http://localhost:8081"

可以使用时间戳命名录制文件,默认情况下,文件是按“块”存储的, 即文件大小到达上限后, 添加后缀并新建另一个文件, 示例如下:

1
2
3
4
5
6
7
gor --input-raw :80 --output-file %Y%m%d.gor
# append false

20140608_0.gor
20140608_1.gor
20140609_0.gor
20140609_1.gor

默认是按”块”存储文件的方式,但是可以参数配置–output-file-append,效果如下

1
2
3
4
5
gor --input-raw :80 --output-file %Y%m%d.gor --output-file-append
# append true

20140608.gor
20140609.gor

时间格式化文件名的配置说明:

  • %Y: year including the century (at least 4 digits)

  • %m: month of the year (01..12)

  • %d: Day of the month (01..31)

  • %H: Hour of the day, 24-hour clock (00..23)

  • %M: Minute of the hour (00..59)

  • %S: Second of the minute (00..60)

默认格式是 %Y%m%d%H

流量回放

目前这种方式只支持”input-file”, 而且只能用百分比去控制回放速率; 这个回放的速率比例是相对于input的, 即按照录下来的流量的时间戳去进行回放.

以2倍速率回放

1
gor --input-file "requests_origin.gor|200%" --output-http "http://localhost:8081"

如果”input-flie”是多个文件,可以用正则去匹配

1
gor --input-file "requests_origin*.gor|200%" --output-http "http://localhost:8081"

配合如下配置参数,可以更好进行压力测试:

  • --input-file-loop: 重复循环执行input-file

  • --exit-after 30s: 在30s后停止, 可以控制压力测试的时间, 分钟的单位是m.

常用命令

简单的HTTP流量复制

1
> gor --input-raw :80 --output-http "http://localhost:8081"

HTTP流量复制频率控制(获取每秒超过10个请求)

1
> gor --input-tcp :28020 --output-http "http://localhost:8081|10"

HTTP流量复制缩小

1
> gor --input-raw :80 --output-tcp "http://localhost:8081|10%"

HTTP流量记录到本地文件

1
> gor --input-raw :80 --output-file requests_origin.gor

HTTP流量回放和压测

1
> gor --input-file "requests_origin.gor|200%" --output-http "http://localhost:8081"

HTTP流量过滤复制

1
> gor --input-raw :8080 --output-http http://localhost:8081 --output-http-url-regexp ^www.

自定义一些流量复制的参数

1
> gor --input-raw :80 --output-http http://localhost:8081 --http-allow-method POST --http-set-header 'User-Agent: Gor' -output-http-workers=1 -http-allow-url test.php

将流量复制两份到不同的测试服务

1
> gor --input-tcp :8080 --output-http "http://localhost:8081" --output-http "http://localhost:8082"

将流量像负载均衡一样分配到不同的服务器

1
> gor --input-tcp :8080 --output-http "http://localhost:8081" --output-http "http://localhost:8082" --split-output true

配置参数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
> gor --help

-http-allow-header value
gor --input-raw :8080 --output-http localhost:8081 --http-allow-header api-version:v1.1
用一个正则表达式来匹配http头部,如果请求的头部没有匹配上,则被拒绝

-http-allow-method value
gor --input-raw :8080 --output-http localhost:8081 --http-allow-method GET
类似于一个白名单机制来允许通过的http请求方法,除此之外的方法都被拒绝.

-http-allow-url value
gor --input-raw :8080 --output-http localhost:8081 --http-allow-url ^www
一个正则表达式用来匹配url, 用来过滤完全匹配的的url,在此之外的都被过滤掉

-http-disallow-header value
gor --input-raw :8080 --output-http localhost:8081 --http-disallow-header "User-Agent: Replayed by Gor"
用一个正则表达式来匹配http头部,匹配到的请求会被拒绝掉

-http-disallow-url value
gor --input-raw :8080 --output-http localhost:8081 --http-disallow-url ^www
用一个正则表达式来匹配url,如果请求匹配上了,则会被拒绝

-http-set-header value
gor --input-raw :8080 --output-http localhost:8081 --http-set-header 'User-Agent: Gor'
设置头信息,如果已经存在会覆盖

-http-set-param value
gor --input-raw :8080 --output-http localhost:8081 --http-set-param api_key=v1.1
设置请求参数,如果已经存在会覆盖

更多参数请查阅官方文档 https://github.com/buger/goreplay/wiki

TcpCopy

Tcpcopy是一种请求复制工具。可以将线上流量拷贝到测试机器,实时的模拟线上环境。在不影响线上用户的情况下,使用线上流量进行测试,以尽早发现bug。也可以通过放大流量,进行压力测试,评估系统承载能力.

参考文档