Tcpcopy是一个分布式在线压力测试工具,可以将线上流量拷贝到测试机器,实时的模拟线上环境,达到在程序不上线的情况下实时承担线上流量的效果,尽早发现bug,增加上线信心。
Tcpcopy是由网易技术部王斌(http://weibo.com/tcpcopy)在王波的工作基础上开发的,2011年9月开源的项目(https://github.com/session-replay-tools/tcpcopy https://github.com/wangbin579/tcpcopy ),目前最新版本 1.0.0 ,后续相关内容都是基于 1.0.0 的。
tcpcopy的工作原理
TCPCopy 是一种请求复制(复制基于 TCP 的 packets)工具 ,通过复制在线数据包,修改 TCP/IP 头部信息,发送给测试服务器,达到欺骗测试服务器的TCP 程序的目的,从而为欺骗上层应用打下坚实基础。
tcpcopy 不是基于应用层的复制,而是基于底层数据包的请求复制,这么做的好处是:可以做到无需穿透整个协议栈,路程最短的,可以从数据链路层抓请求包,从数据链路层发包,路程一般的,可以在IP层抓请求包,从IP层发出去,不管怎么走,只要不走TCP,对在线的影响就会小得多。
七层网络模型如下图:

tcpcopy 经历了三次架构调整,参考:http://blog.csdn.net/wangbin579/article/details/8949315
这三次架构的基本原理都一样,本质是利用在线数据包信息,模拟tcp客户端协议栈,欺骗测试服务器的上层应用服务。由于tcp交互是相互的,一般情况下需要知道测试服务器的响应数据包信息,才能利用在线请求数据包,构造出适合测试服务器的请求数据包,因此只要基于数据包的方式,无论怎么实现(除非是tcp协议改的面目全非),都需要返回响应包的相关信息。
三种架构的差别就在于在什么地方截获响应包。
具体这三种架构的差别请看上面文章,简单差别如下:
方案一:tcpcopy是从数据链路层(pcap接口)抓请求数据包,发包是从IP层发出去
方案二:tcpcopy默认从IP层抓包,从IP层发包
方案三:跟方案一一样,不过引入了独立的 intercept(assistant server)
后面的内容我们以第三套方案来展开。
tcpcopy 架构
tcpcopy运行需要intercept的支持,tcpcopy负责抓包和发包工作,而intercept负责截获应答包
它的数据流转和部署架构如下图:

tcpcopy代码下载地址:
git clone http://github.com/session-replay-tools/tcpcopy
configure:
./configure (默认raw socket方式抓包)
或者
./configure --pcap-capture (pcap方式抓包,在某些场景下,丢包率会高于raw socket方式抓包,这时候需要类似pf_ring的支持)
对于intercept:
代码下载地址:
git clone http://github.com/session-replay-tools/intercept
configure方式:
./configure
参考: http://blog.csdn.net/wangbin579/article/details/8950282
具体的生产环境和镜像环境数据传递流程图如下:

TCPcopy 从数据链路层 copy 端口请求,然后更改目的 ip 和目的端口。
将修改过的数据包传送给数据链路层,并且保持 tcp 连接请求。
通过数据链路层从 online
.........................................................