tcpcopy 安装部署及案例介绍
一:安装部署
yum -y install pcre pcre-devel zlib zlib-devel libpcap*
checking for pcap.h ... not found
yum -y install libpcap*
yum -y install pcre pcre-devel zlib zlib-devel libpcap*
3台虚拟机服务器
192.168.0.79 (web httpd 服务)
192.168.0.80 (intercept 中转服务)
192.168.0.82 (web httpd 服务,tcpcopy 流量复制服务)
1.文件下载:
下载:
https://codeload.github.com/session-replay-tools/tcpcopy/tar.gz/1.0.0
https://codeload.github.com/session-replay-tools/intercept/tar.gz/1.0.0
2.安装 tcpcopy (client)
tar zxvf tcpcopy-1.0.0.tar.gz
cd tcpcopy-1.0.0
./configure
make
make install
#复制命令
cp /usr/local/tcpcopy/sbin/tcpcopy /usr/bin
3.安装 intercept (服务端)
tar zxvf intercept-1.0.0.tar.gz
cd intercept-1.0.0
./configure
make
make install
#复制命令
cp /usr/local/intercept/sbin/intercept /usr/bin
4.启动对应的服务
a.启动tcpcopy服务,进行流量复制
192.168.0.82 上执行:
tcpcopy -x 80-192.168.0.79:80 -s 192.168.0.80 -c 192.168.100.x -n 2
含义:
将 本机(82)上的 80 端口流量 转发到 192.168.0.79 的 80 端口上
-x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口
-s 指定intercept进程所在的服务器。(丢包服务器)
-c 修改请求的host地址为192.168.100.x,以便在79上设置路由(设置路由是为了将应答转向80【丢包服务器】)
-n 流量放大倍数
b.启动 intercept 服务
192.168.0.80 上执行
intercept -i eth0 -F tcp and src port 80 -d
c.配置网关转发服务
192.168.0.79 上执行
route add -net 192.168.100.0 netmask 255.255.255.0 gw 192.168.0.80
访问82 (3次记录)
79上有6条记录
#现网实例
1.先启动 intercept 服务器
在 haproxy 139 上
intercept -i eth0 -F tcp and src port 8282 -d
#haproxy 138 上
tcpcopy -x 80-218.17.157.250:8181 -s 58.251.135.75 -c 192.168.100.x -n 2
tcpcopy -x 80-218.17.157.250:8181 -s 10.0.0.139 -c 192.168.100.x -n 2 &
二:如何无限增大在线压力?
方法有四种,这里讲述效果较好的两种,比较适合于中小网站,方法如下:
针对0.5版本及其以后版本
./tcpcopy -x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口 -n xx -f yy
举例如下:
1)在在线服务器上执行多个tcpcopy实例,但命令稍微不同,在原有命令基础上会增加 -f参数
比如你想复制3倍的在线流量或者逐步增加流量,你可以执行如下命令
./tcpcopy -x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口
./tcpcopy -x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口 -f 1
./tcpcopy -x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口 -f 2
2)同一个tcpcopy实例内复制多份流量
./tcpcopy -x 服务器应用端口号-测试服务器ip地址:测试服务器应用端口 -n xx
其中-n后面的xx值代表复制的份数
这两种方法效果真实,推荐使用,对于0.5版本之前的版本,-f -n参数一样,但tcpcopy的复制命令稍微不同
三:使用tcpcopy拷贝线上流量压测测试环境
1:环境描述
架设三台服务器
10.53.132.52
10.53.132.55
10.53.132.101
101我们认为是线上服务器,52和55是测试环境。我们在101上运行tcpcopy把线上流量拷贝到55,在55上我们通过路由将应答转向52,在52上把应答丢弃。
分别在101和55上部署apache,端口是8090
2:步骤
101上部署tcpcopy
tcpcopy -x 8090-10.53.132.55:8090 -s 10.53.132.52 -c 192.168.100.x -n 5
将本机8090上的流量复制到55的8090端口。
-s指定intercept进程所在的服务器。(丢包服务器)
-c修改请求的host地址为192.168.100.x,以便在55上设置路由(设置路由是为了将应答转向52【丢包服务器】)
-n流量放大倍数
55上设置路由
route add -net 192.168.100.0 netmask 255.255.255.0 gw 10.53.132.52
52上运行intercept
intercept -i eth1 -F tcp and src port 8090 -d
四:tcpcopy1.0系列使用方法
tcpcopy运行需要intercept的支持,tcpcopy负责抓包和发包工作,而intercept负责截获应答包
tcpcopy代码下载地址:
Git clone http://github.com/session-replay-tools/tcpcopy
configure:
./configure (默认raw socket方式抓包)
或者
./configure --pcap-capture (pcap方式抓包,在某些场景下,丢包率会高于raw socket方式抓包,这时候需要类似pf_ring的支持)
对于intercept:
代码下载地址:
git clone http://github.com/session-replay-tools/intercept
configure方式:
./configure
运行方法参考下面具体例子(tcpcopy采用了configure来编译):
这是一个内网的应用例子,我们的目的是复制下图中adserver应用服务器的请求到测试系统中去。
在线adserver有2台,主要供nginx调用,所以客户端IP地址来自于nginx所在机器的IP地址,均为同一网段的IP地址。
我们假设在线adserver机器为10.100.10.1,10.100.10.2,nginx所在的机器ip地址为:10.100.10.11,10.100.10.12,10.100.10.13,
测试服务器有10.100.10.31,10.100.10.32(辅助服务器)
其中,10.100.10.31运行着类似在线adserver的应用,端口为11511,而在线应用端口是11311
我们在10.100.10.31上面添加如下路由:
route add -host 10.100.10.11 gw 10.100.10.32
route add -host 10.100.10.12 gw 10.100.10.32
route add -host 10.100.10.13 gw 10.100.10.32
这里的意思就是说,在测试服务器10.100.10.31返回给客户端10.100.10.11~13的响应走默认网关10.100.10.32,但10.100.10.32机器其实并没有开启路由模式,所以这些响应包到了10.100.10.32机器后,会在ip层被drop掉,留给我们的机会就是可以在10.100.10.32的数据链路层抓到这些响应包。
我们在10.100.10.32机器(辅助服务器)上面运行intercept,用来捕获响应包,命令如下:
执行intercept命令(需要root权限):
./intercept -i eth0 -F 'tcp and src port 11511' -d
我们在在线机器上面运行tcpcopy(root权限):
./tcpcopy -x 11311-10.100.10.31:11511 -s 10.100.10.32 -d
这里tcpcopy的含义是复制在线11311端口的数据包到10.100.10.31上面的11511端口中去,-s指定运行intercept所在机器的ip地址。
这样请求就过去了,测试结果如下:
[root@hz12-26 logs]# grep 'Thu 10:30' access_0516_10.log -c
99415
[root@hz12-25 logs]# grep 'Thu 10:30' access_0516_10.log -c
99414
[root@bgp176-148 logs]# grep 'Thu 10:30' access_0516_10.log -c
198693
最后,需要注意新架构的若干细节:
1)发起请求的客户端所在机器,不能同时运行相应的intercept,因为响应数据包路由回来后,这台机器的tcp层会发送reset数据包给测试服务器,这样就会干扰测试的进行。
2)在线服务和测试服务不要在一台机器
如果在线服务响应的目的ip地址和测试服务响应的目的ip地址是一样的,路由设置的时候,是无法区分在线的响应和测试的响应
3)对于外网应用,由于客户端ip地址来自于世界各地,路由策略如下:
a)用两个网卡,一个外网网卡,一个内网网卡,让外网请求都路由到第二台测试服务器上面去
比如改变测试服务器上面的默认路由:
route del default gw 真正的网关ip地址
route add default gw 辅助服务器的ip地址
b)利用tcpcopy的-c参数,修改客户端源ip地址,这样就方便设置路由
比如:./tcpcopy -x 11311-10.100.10.31:11511 -s 10.100.10.32 -c 192.168.100.x
相应路由设置:
route add -net 192.168.100.0 netmask 255.255.255.0 gw 10.100.10.32
4)如果是在同一网段利用外网地址访问,在机器B上面设置去往机器A的响应,走机器C,那么设置默认外网网卡路由不会生效,需要显式指定,比如:
route add -host 机器A的外网ip地址 gw 机器C的外网ip地址
5)如果是内网应用,由于客户端ip地址少,建议采用如下:
route add -host 内网客户端ip地址 gw 辅助服务器的ip地址
或者
//如果客户端ip地址来自于其它网段的话
route add -net xxx.xxx.xxx.0 netmask 255.255.255.0 gw 辅助服务器的ip地址
不要采用默认网关的方式
)如果tcpcopy遇到大量“unsend:too many packets”的报警,请采用raw socket方式来抓请求数据包
7)如果客户端来自于同一网段,那么响应包可能会直接通过mac地址返回给客户端,导致路由设置不起作用,响应包不会被intercept所截获,导致复制失败
解决策略有两个:
1)检测路由命令是否有冲突,导致响应包直接返回给客户端
2)tcpcopy运行的时候通过-c参数来改变客户端的ip地址为不同网段的ip地址,就可以解决此问题。
8)如果同时有内网访问和外网访问,应该分别针对外网应用和内网应用,设置相应路由
9)运行intercept的辅助服务器,为方便路由设置,最好要和测试服务器在同一个网段,而且不要设置ip_forward
本文暂时没有评论,来添加一个吧(●'◡'●)