本章不會直接分析Netty源碼,而是通過使用Netty的能力實現一個自定義協議的服務器和客戶端。通過這樣的實踐,可以更深刻地理解Netty的相關代碼,同時可以瞭解,在設計實現自定義協議的過程中需要解決的一些關鍵問題。
本週章涉及到的代碼可以從github上下載: https://github.com/brandonlyg/tinytransport.git。
設計協議
本章要設計的協議是基於TCP的應用層協議。在設計一個協議之前需要先回答以下幾個問題:
- 使用場景是什麼?
- 這個協議有哪些功能?
- 性能上有什麼要求?
- 對網絡帶寬有什麼要求?
- 安全上有哪些要求?
接下來依次回答這些問題:
使用場景
在可信任的內部網絡中,不同進程之間高速交換消息。
功能
- 在客戶端和服務器進行消息交換。
- 發送消息然後異步接收響應。
- 客戶端和服務器之間可以保持長連接。
- 傳輸大量的數據。
性能
數據包的提取性能接近內存copy。
擴展性
可以通過擴展header字段,進而擴展協議的功能。
帶寬
儘量少的冗餘數據,佔用儘量小的帶寬。
安全
由於是在可信任的內網中交互消息,沒有特別端安全性要求。
這些問題的答案,就是整個協議的設計要求。下面就按照這些設計要求來設計一套完整的協議,具體類容包括以下兩個部分:
- 數據包的格式。
- 客戶端和服務器端消息的交互規則。
數據包格式的設計
設計自己的數據包格式之前,我們先來回顧以下LengthFieldBasedFrameDecoder能夠處理的數據包格式:
| header | contentLength | conent |
這個類把header的設計留給了子類,現在我們的注意力只需要集中在header字段上即可。下面是header設計:
| begin | version | cmd | contentType | compression | sequenceId | resCode |
整個數據包的格式就是:
| begin | version | cmd | contentType | compression | sequenceId | resCode | contentLength | content |
現在來看一下這個數據包能實現哪些設計要求。
begin
類型: 32位無符號整數(uint32),這字段是一個常量,用來準確第定位到數據包的開始位置,這樣就能更準確地分離出數據包,進而保證了“客戶端和服務器端進行消息交換”。它的設計還要平衡數據包提取性能和準確性。嚴格來說,數據包中只能有一個begin,形式化描述如下:
1. 設一個數據包P的長度是L,P(i)表示數據包中任意一個Byte,begin=0XADEF4BC9(這個值可以任意選擇,儘量不選擇有意義的數字)。
2. 設反序列化一個uint32的算法是ui=deserUint32(i), i>=0 && i < L。
3. 必須滿足: deserUint32(0) == begin, 且deserUint32(i) != begin, i > 0 && i < L。
要在(1)(2)兩個前提條件下滿足第(3)點,需要設計一個轉義符EC=0xFF, 對P中除begin以外的部分進行轉義,轉義算法是:
如果deserUint32(i)==begin或P(i)==EC, 在P(i)前面插入EC。
找到begin的算法是:
如果deserUint32(i)==begin且P(i-1)!=EC。
逆轉義算法是:
如果P(i)==EC, P(i+1)==EC或deserUint32(i+1)==begin, 刪除P(i)。
以上使用轉義符的方案,雖然能夠準確地找到begin,但算法複雜度是O(L),顯然不能滿足“接近內存copy"這個要求。但是如果不使用轉義符,就可以達到這個性能要求。如果仔細計算一下begin重複的概率就會發現, 它的重複概率只有1/0x100000000,如果再結合length字段一起檢查數據包的正確性,得到錯誤數據包的概率就會更低。不使用轉義符,以極小的出錯概率換取性能大幅提升是一筆合適的買賣。
總的來說,begin可以滿足兩個設計要求: 消息交換,數據包的提取性能接近內存copy。
version
類型:uint8。協議的版本號,這個字段用來滿足“擴展性”要求。每個version對應一種不同的header結構,換言之,知道了版本號,就知道怎樣解析header。
cmd
類型: uint8。這個字段用來定義不同數據包的功能。可以使用這個字段定義心跳數據包,使用心跳數據包讓"服務器和客戶端保持長連接"。此外業務層可使用這個字段定義自己需要的數據包。
contentType
類型: uint8。這個字段是content的類型。使用這個字段可以在content數據交給業務層之前,對他進行一下特殊的處理。用戶可以定義自己的的消息類型。它可以加"消息交換"的能力。
compression
類型: uint8。 壓縮算法。這個字段可以用來表示content使用的壓縮算法。通過使用適當的壓縮算法,壓縮滿足"傳輸大量數據"和"帶寬"的要求。
sequenceId
類型: uint32。這個字段是數據包的唯一序列號。只需要保證在一個socket連接建立-斷開週期內保證它的唯一性即可。使用這個ID,可以實現“發送消息然後異步接收響應”。
resCode
類型: uint8。響應數據包的狀態碼,用來在響應數據包中附帶異常信息。
至此數據包的格式已經設計完畢。接下來設計必要的交互規則。
協議交互規則設計
使用心跳保持長連接
cmd: PING(0x01), PONG(0x02)。客戶端連接到服務器之後,每隔一段時間發送一個PING包,服務器端收到之後立即響應PONG包。服務器端在一個超時時間後沒有收到PING就認爲TCP連接不可用,主動端開。客戶端在發送PING之後,經過一個超時時間後沒有收到PONG就認爲連接不可用,重新建立連接。
消息的請求和響應
cmd: REQUEST(0x10), RESPONSE(0x02)。客戶端使用REQUEST包向服務器發送請求,服務使用RESPONSE包響應。請求和響應的sequenceId一致。
推送消息
cmd: PUSH(0x20)。使用PUSH向對方推送消息,不需要響應。
代碼分析
這個輕量級的客戶端和服務器框架在架構上分爲4個部分:
- 數據包: Frame, FrameDecoder, FrameEncoder, FrameGzipCodec。
- 消息: FMessage, FrameToMessageDecoder, MessageToFrameEncode, FMessageHandler, FMessageTrait, FMTraits。
- 客戶端框架: TcpConnector, TcpClient。
- 服務器端框架: TcpServer。
由於前面已經詳細講解了設計原理,這裏只重點分析一下關鍵代碼。
Frame
Frame是數據包類型,它的主要功能是數據包的序列化(encode方法)和反序列化(decode)。
序列化方法:
1 /**
2 * 把Frame對象編碼成數據包
3 * @param out
4 */
5 public void encode(ByteBuf out){
6 out.writeInt(BEGIN);
7 out.writeByte(header.getVersion());
8 out.writeByte(header.getCmd().getValue());
9 out.writeByte(header.getContentType());
10 out.writeByte(header.getCompression());
11 out.writeInt(header.getSequenceId());
12 out.writeByte(header.getResCode());
13
14 int contentLength = 0;
15 if(null != content){
16 contentLength = content.readableBytes();
17 }
18 if(contentLength > MAX_CONTENT_LENGTH){
19 throw new TooLongFrameException("content too long. contentLength:"+contentLength);
20 }
21 out.writeShort(contentLength);
22 if(null != content){
23 out.writeBytes(content);
24 }
25 }
6-12行,序列化header中除contentLength的其他字段。
14-21行,序列化contentLength字段。
22-24行,序列content。
反序列化方法
1 /**
2 * 從數據包解碼得到Frame
3 * @param in 一個完整的數據包
4 * @return Frame對象
5 */
6 public static Frame decode(ByteBuf in){
7 if(in.readableBytes() < HEADER_LENGTH){
8 throw new CorruptedFrameException("pack length less than header length("+HEADER_LENGTH+")");
9 }
10
11 //得到header
12 Header header = new Header();
13 in.readInt();
14 header.setVersion(in.readByte());
15 header.setCmd(Command.valueOf(in.readByte() & 0xFF));
16 header.setContentType((byte)(in.readByte() & 0xFF));
17 header.setCompression((byte)(in.readByte() & 0xFF));
18 header.setSequenceId(in.readInt());
19 header.setResCode((byte)(in.readByte() & 0xFF));
20
21 //讀出content
22 int contentLength = in.readShort() & 0xFFFF;
23 if(in.readableBytes() != contentLength){
24 throw new CorruptedFrameException("content is not match."+in.readableBytes() + "-" + contentLength);
25 }
26
27 ByteBuf content = contentLength > 0 ? in.retainedSlice(in.readerIndex(), contentLength) : null;
28 in.skipBytes(contentLength);
29
30 //創建Frame對象
31 Frame frame = new Frame();
32 frame.setHeader(header);
33 frame.setContent(content);
34
35 if(null != content) content.release();
36
37 return frame;
38 }
這段代碼,註釋已經比較清晰了,這裏就不再多說。
FrameDecoder
這個類繼承了LengthFieldBasedFrameDecoder,所以只需要很少的代碼就可以從Byte流中分離出數據包。
1 public FrameDecoder(){
2 super(Frame.MAX_LENGTH, Frame.HEADER_LENGTH - 2, 2);
3 }
4
5 @Override
6 protected Object decode(ChannelHandlerContext ctx, ByteBuf in) throws Exception {
7 //找到begin位置
8 int start = in.readerIndex();
9 int begin = in.getInt(start + 0);
10 if(begin != Frame.BEGIN){
11 dropFailedData(in);
12 }
13
14 //解碼得到Frame對象
15 ByteBuf dataPack = null;
16 try{
17 dataPack = (ByteBuf)super.decode(ctx, in);
18 Frame frame = Frame.decode(dataPack);
19 return frame;
20 }finally {
21 if(null != dataPack){
22 dataPack.release();
23 }
24 }
25 }
2行,設置了數據包的最大長度Frame.MAX_LENGTH, 數據包header除contentLength之外的長度Frame.HEADER_LENGTH-2, contentLength字段的長度。這樣,只要正確地找到數據包的開始位置就能LengthFieldBasedFrameDecoder就能幫助我們把數據包提取出來。
8-12行,確定數據包的開始位置。
17-18行,提取數據包,並把數據包反序列化成Frame。
FMessageTrait
爲了能夠靈活地處理FMessage的content, 框架中定義了FMessageTrait接口,可以使用不同個FMessageTrait實現處理不同的content類型。
1 /**
2 * FMessage消息特徵接口,根據不同的contentType進行Frame和FMessage之間的轉換
3 */
4 public interface FMessageTrait {
5
6 /**
7 * 得到匹配的contentType
8 * @return contentType的值
9 */
10 int getContentType();
11
12 /**
13 * 把FMessage轉換成Frame
14 * @param fmsg
15 * @return
16 * @throws EncoderException
17 */
18 Frame encode(FMessage fmsg) throws EncoderException;
19
20 /**
21 * 把Frame轉換成FMessage
22 * @param frame
23 * @return
24 * @throws DecoderException
25 */
26 FMessage decode(Frame frame) throws DecoderException;
27 }
FrameToMessageDecoder和MessageToFrameEncoder使用FMessageTrait進行FMessage和Frame之間的轉換。
1 /**
2 * 把Frame轉換成FMessage
3 */
4 @ChannelHandler.Sharable
5 public class FrameToMessageDecoder extends MessageToMessageDecoder<Frame> {
6
7 private Map<Integer, FMessageTrait> fmTraits = new HashMap<>();
8
9
10 public void addFMessageTrait(FMessageTrait trait){
11 fmTraits.put(trait.getContentType(), trait);
12 }
13
14 @Override
15 protected void decode(ChannelHandlerContext ctx, Frame frame, List<Object> out) throws Exception {
16 int contentType = frame.getHeader().getContentType();
17 FMessageTrait trait = fmTraits.get(contentType);
18 if(null == trait){
19 throw new EncoderException("can't find trait. contentType:"+contentType);
20 }
21
22 FMessage fmsg = trait.decode(frame);
23 out.add(fmsg);
24 }
25 }
10-12行,把FMessageTrait放入map中。構建contentType-FMessageTrait之間的映射。
17行,從map中得到FMessageTrait。
22行,使用FMessageTrait把Frame轉換成FMessage。
MessageToFrameEncoder的實現類似。不同的是在22處調用FMessageTrait的encode方法把FMessage轉換成Frame。
FMTraits中給出了幾種常見的FMessageTrait實現:
- FMTraitBytes: 處理byte array類型的content。
- FMTraitString: 處理String類型的content。
- FMTraitJson: 處理Json格式是content。
- FMTraitProtobuf: 處理protobuf格式的content。
他們都有一個共同的祖先AbstractFMTrait, 這個抽象類實現FMessageTrait的encode和decode方法,定義了兩個抽象方法encodeContent和decodeContent,子類只需專注於content的處理就可以了。
下面以FMTraitBytes爲例,講解一下FMessageTrait的具體實現。FMTraitBytes處理的FMessage類型要求conent是byte[]類型。
1 public static final int BYTES = 0x01;
2 public static final FMessageTrait FMTBytes = new FMTraitBytes();
3 public static class FMTraitBytes extends AbstractFMTrait {
4 protected int contentType;
5
6 public FMTraitBytes(){
7 this(BYTES);
8 }
9
10 public FMTraitBytes(int contentType){
11 this.contentType = contentType;
12 }
13
14 @Override
15 public int getContentType() {
16 return contentType;
17 }
18
19 @Override
20 protected ByteBuf encodeContent(FMessage fmsg) throws EncoderException{
21 byte[] bytes = (byte[])fmsg.getContent();
22
23 ByteBuf buf = null;
24 if(null != bytes && bytes.length > 0){
25 buf = ByteBufAllocator.DEFAULT.buffer(bytes.length);
26 buf.writeBytes(bytes);
27 }
28
29 return buf;
30 }
31
32 @Override
33 protected Object decodeContent(Frame frame) throws DecoderException {
34 ByteBuf buf = frame.getContent();
35 byte[] bytes = null;
36 if(null != buf && buf.readableBytes() > 0){
37 bytes = new byte[buf.readableBytes()];
38 buf.readBytes(bytes);
39 }
40
41 return bytes;
42 }
43 }
6-17行,實現了contentType的設置和獲取。
21-29行,把FMessage的content轉換成ByteBuf。
34-42行, 發Frame的content轉換成byte[]。
FMessageHandler
這是一個專門用來處理FMessage的ChannelInboundHandler。channelRead0方法負責把不同cmd的FMessage派發到專用方法處理,這些方法有:
- onPing: 收到PING, 會自動響應一個PONG。
- onPong: 收到PONG。
- onRequest: 收到REQUEST。
- onResponse: 收到RESPONSE。
- onPush: 收到PUSH。
客戶端框架
TcpConnector功能是發起連接,它的主要功能集中在以下三個方法中。
1 public void addFMessageTrait(FMessageTrait trait){
2 fmEncoder.addFMessageTrait(trait);
3 fmDecoder.addFMessageTrait(trait);
4 }
5
6 public TcpClient connect(InetSocketAddress address) throws Exception{
7 ChannelFuture future = bootstrap.connect(address);
8 Channel channel = future.channel();
9
10 TcpClient client = new TcpClient(channel, workerElg.next());
11 channel.attr(TcpClient.CLIENT).set(client);
12
13 future.sync();
14
15 return client;
16 }
17
18 protected void doInitChannel(SocketChannel ch) throws Exception {
19 ChannelPipeline pl = ch.pipeline();
20
21 pl.addLast(H_FRAME_DECODER, new FrameDecoder());
22 pl.addLast(H_FRAME_ENCODER, frameEncoder);
23
24 pl.addLast(H_READ_TIMEOUT, new ReadTimeoutHandler(readTimeout, TimeUnit.SECONDS));
25
26 pl.addLast(H_FM_DECODER, fmDecoder);
27 pl.addLast(H_FM_ENCODER, fmEncoder);
28
29 pl.addLast(H_FM_HANDLER, clientHandler);
30 }
addFMessageTrait設置FMessageTrait,開發者可以根據需要定製FMessage的處理能力,FMTraitBytes會默認添加。
connect用來發起連接,創建TcpClient對象。
doInitChannel初始化Channel, 開發者可以覆蓋這個方法,定製channel的ChannelHandler。
另外,TcpConnector內部實現了一個FMessageHandler的派生類ClientHandler。這個類的channelActive方法中啓動一個定時任務定時發送PING。onResponse方法負責調用TcpClient的onResponse方法。
TcpClient是客戶端連接對象,它主要有兩個方法:
public boolean send(FMessage msg);
public Promise<FMessage> send(FMessage msg, TimeUnit timeUnit, long timeout);
第一個不處理響應。第二個可以異步數量響應。
另外還有一個給TcpConnector使用的onResponse方法,用來觸發第二個send返回Promise對象的回調。
服務器端框架
TcpServer是服務器端框架,它比較簡單。開發者只需要覆蓋doInitChannel,添加自己的ChannelHandler,就可以實現服務器端的定製。