likes
comments
collection
share

详解 WebSocket 实现

作者站长头像
站长
· 阅读数 16

前言

为什么写这篇文章?

对于应用协议的了解,相信大部分👨‍🎓始终停留在使用上,可能读了如 《图解HTTP》、《计算机网络》 一类的书籍,了解了更深层次的理论,但理论始终是理论,我们很难有机会能在工作场景里面去触碰到协议的实现上,对应用层协议的理解是片面的。

WebSocket 的实现非常适合前端的同学学习,通过了解 WebSocket Node版实现,站在更高的维度上去看待这些应用层协议,无论是WebRTC,还是HTTP都好,有了对一种协议实现的整体思路,就有了面对各种协议的技术自信。

详解 WebSocket 实现

WebSocket简介

WebSocket 是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工(full-duplex)通讯的协议。没有了 Request 和 Response 的概念,两者地位完全平等,连接一旦建立,就建立了真•持久性连接,双方可以随时向对方发送数据。

注:全双工(Full Duplex)是一种通信方式,指通信的双方可以同时发送和接收数据,而且在同一时刻,发送和
接收是独立进行的。

概念老生常谈了,不妨思考两个问题:

WebSocket 为什么能进行全双工通信?HTTP 却不行?

HTTP是非持久化连接,每次客户端向服务器发送请求时,都需要建立一个新的 TCP 连接。这个连接在响应结束后就会被关闭,不保留在系统中,而 websocket 会保留,所以可以继续保持通信。

HTTP 为什么是非持久化连接而 WebSocket 是持久化连接?

HTTP 协议的设计初衷是为了传输静态文本信息,如 HTML、CSS、JS 等等,传输静态文本大部分时间连接并不会被频繁地打开和关闭,所以使用持久化连接带来的复杂度可能会超过它的收益。而不像 websocket 更多是为了实时通信的场景,所以采用持久化连接。

详解 WebSocket 实现

WebSocket握手过程

我们经常听到一种说法,WebSocket 基于 HTTP,实际上只有在建立握手时,数据是通过 HTTP 传输的。但是建立之后,在真正传输时候是不需要 HTTP协议。握手具体过程如图所示:

详解 WebSocket 实现

注:websocket 会保留 HTTP 握手后的 socket 连接,后续即可利用这个 socket 进行通讯,无需再关注 HTTP。

websocket 为什么采用 HTTP 握手?

WebSocket 是相对较新的协议,可能并不是所有的网络设备和服务器都支持。因此,在浏览器请求服务器进行 WebSocket 握手时,使用基于 HTTP 协议的握手方式可以避免协议兼容性问题。

WebSocket实现原理

WebSocket数据帧说明

WebSocket 以帧的形式进行数据传输,帧组成包括以下几个部分:

  1. 头部(Header):包括了一些控制信息,如 FIN、RSV1、RSV2、RSV3、Opcode、MASK、Payload Length 以及 Masking Key 等字段,用于描述该帧的类型、长度以及是否经过掩码操作等信息。它有 2~14 个字节不等,其中前 2 个字节是必需的。

  2. 掩码(Masking Key):用于对载荷(Payload)进行加密解密操作,它的长度固定为 4 个字节,如果 MASK 标志被设置为 1,则该字段必须存在。

  3. 载荷(Payload):包含了应用层发送的数据,具体内容由 Opcode 字段指定的数据类型决定。如果有 MASK 标志,则需要对其进行解码。

详解 WebSocket 实现

各字段含义如表格所示:

字段含义长度
FIN是否为最后一帧1 bit
RSV预留位,方便后续拓展协议3 bit
opcode解释 payload data 的用途4 bit
MASK定义“payload data”是否被添加掩码1 bit
payload data length数据长度7 bit 7+16 bit 7+64 bit
Serial Number序列号16bit
Masking-key掩码32bit
payload data传输数据payload data length

把数据帧组成搞清楚,可以说 websocket 你就了解了一大半,协议实现里大部分操作都是对于数据帧的处理。

构造帧

websocket 的数据是以帧的形式传输,那么我们就需要了解如何构造帧。构造帧只是听起来很复杂,构造一个数据帧我们只需要遵守协议规则填写即可,按照WebSocket的协议标准,构造一个最短数据帧我们只需要三个字节就能完成,构成如表格所示下:

字节编号 填入内容
1 FIN、RSV、opcode
2 MASK、payload data length
3 payload data

代码实现:

详解 WebSocket 实现

注:本质就是做一些字节拼接操作,把对应的标识放到对应的位置即可。

数据传输

了解往构造帧的过程,那 websocket 是如何把帧发送出去的?

WebSocket 在握手过程中会保留 HTTP 握手后的 socket 连接,这在前面有提到,所以我们可以通过这个 socket 连接进行数据的传输。

代码实现如下:

详解 WebSocket 实现

心跳机制

在连接过中,防止连接因长时间无数据传输而被提前关闭,WebSocket 还引入了心跳机制,原理可以概括为:定期发送心跳包,以确认客户端与服务器的连接状态,并避免连接因长时间空闲而被中断。 代码实现如下:

详解 WebSocket 实现

mini-ws

以下为一个 websocket server 的简易实现(代码来源):

var crypto = require("crypto");
var { EventEmitter } = require("events");
var MAX_FRAME_SIZE = 1024; // 最长长度限制
var MAGIC_STRING = "258EAFA5-E914-47DA-95CA-C5AB0DC85B11";

/**
 *  数据类型操作码 TEXT 字符串
 *  BINARY 二进制数据 常用来保存照片
 *  PING,PONG 用作心跳检测
 *  CLOSE 关闭连接的数据帧 (有很多关闭连接的代码 1001,1009,1007,1002)
 */
var OPCODES = {
    CONTINUE: 0,
    TEXT: 1,
    BINARY: 2,
    CLOSE: 8,
    PING: 9,
    PONG: 10,
};

var hashWebSocketKey = function (key) {
    var sha1 = crypto.createHash("sha1");
    sha1.update(key + MAGIC_STRING, "ascii");
    return sha1.digest("base64");
};
/**
 * 解掩码
 * @param maskBytes 掩码数据
 * @param data payload
 * @returns {Buffer}
 */
var unmask = function (maskBytes, data) {
    var payload = Buffer.alloc(data.length);
    for (var i = 0; i < data.length; i++) {
        payload[i] = maskBytes[i % 4] ^ data[i];
    }
    return payload;
};

/**
 * 编码数据
 * @param opcode 操作码
 * @param payload   数据
 * @returns {*}
 */
var encodeMessage = function (opcode, payload, isFinal = true) {
    var buf;
    var b1 = (isFinal ? 0x80 : 0x00) | opcode;
    var b2;
    var length = payload.length;
    if (length < 126) {
        buf = Buffer.alloc(payload.length + 2 + 0);
        b2 |= length;
        //buffer ,offset
        buf.writeUInt8(b1, 0); //读前8bit
        buf.writeUInt8(b2, 1); //读8―15bit
        payload.copy(buf, 2); //复制数据,从2(第三)字节开始
    } else if (length < 1 << 16) {
        buf = Buffer.alloc(payload.length + 2 + 2);
        b2 |= 126;
        buf.writeUInt8(b1, 0);
        buf.writeUInt8(b2, 1);
        buf.writeUInt16BE(length, 2);
        payload.copy(buf, 4);
    } else {
        buf = Buffer.alloc(payload.length + 2 + 8);
        b2 |= 127;
        buf.writeUInt8(b1, 0);
        buf.writeUInt8(b2, 1);
        buf.writeUInt32BE(0, 2);
        buf.writeUInt32BE(length, 6);
        payload.copy(buf, 10);
    }

    return buf;
};

class WebSocket extends EventEmitter {
    constructor(req, socket, upgradeHead) {
        super();
        var resKey = hashWebSocketKey(req.headers["sec-websocket-key"]);

        // 构造响应头
        var resHeaders = [
            "HTTP/1.1 101 Switching Protocols",
            "Upgrade: websocket",
            "Connection: Upgrade",
            "Sec-WebSocket-Accept: " + resKey,
        ]
            .concat("", "")
            .join("\r\n");

        socket.on("data", (data) => {
            this.buffer = Buffer.concat([this.buffer, data]);
            while (this._processBuffer()) {}
        });

        socket.on("close", (had_error) => {
            if (!this.closed) {
                this.emit("close", 1006);
                this.closed = true;
            }
        });

        socket.write(resHeaders);

        this.socket = socket;
        this.buffer = Buffer.alloc(0);
        this.closed = false;
        this.frames = Buffer.alloc(0);
        this.frameOpcode = 0;
        this.keepLiveTimer = null;
    }
    /*
 发送数据函数
 * */
    send(obj) {
        var opcode;
        var payload;
        // 如果是二进制
        if (Buffer.isBuffer(obj)) {
            opcode = OPCODES.BINARY;
            payload = obj;
        } else if (typeof obj) {
            // 承载的文本内容
            opcode = OPCODES.TEXT;
            //创造一个utf8的编码,可以被编码为字符串
            payload = Buffer.from(obj, "utf8");
        } else {
            throw new Error("cannot send object.Must be string of Buffer");
        }

        this._doSend(opcode, payload);
    }

    // 默认 45 秒 保持发送心跳
    keepLive(timeout = 45000) {
        var self = this;
        function keepit() {
            self._doSend(OPCODES.PING, Buffer.from("ping"));
            console.log("server send ping...");
            // 在关闭连接的情况下就不再需要发送 ping 请求了
            if (!self.closed) {
                self.keepLiveTimer = setTimeout(keepit, timeout);
            }
        }
        keepit();
    }

    /*
 关闭连接函数
 * */
    close(code, reason) {
        var opcode = OPCODES.CLOSE;
        var buffer;
        if (code) {
            buffer = Buffer.alloc(Buffer.byteLength(reason) + 2);
            buffer.writeUInt16BE(code, 0);
            buffer.write(reason, 2);
        } else {
            buffer = Buffer.alloc(0);
        }
        this._doSend(opcode, buffer);
        this.closed = true;
    }

    _processBuffer() {
        var buf = this.buffer;
        if (buf.length < 2) {
            return;
        }
        var idx = 2;
        var byte1 = buf.readUInt8(0); // 读取数据帧的前 8 bit
        var FIN = byte1 & 0x80; // 如果为0x80,则标志传输结束,获取高位 bit
        var opcode = byte1 & 0x0f; //截取第一个字节的后 4 位,即 opcode 码

        // 如果是 0 的话,说明是延续帧,需要保存好 opCode
        if (!FIN) {
            this.frameOpcode = opcode || this.frameOpcode; // 确保不为 0;
        }

        var byte2 = buf.readUInt8(1); // 读取数据帧第二个字节
        var MASK = byte2 & 0x80; // 判断是否有掩码,客户端必须要有,获取高位 bit
        var length = byte2 & 0x7f; //获取length属性,也是小于126数据长度的数据真实值
        if (length > 125) {
            if (buf.length < 8) {
                return; // 如果大于125,而字节数小于 8,则显然不合规范要求
            }
        }
        if (length === 126) {
            //获取的值为126 ,表示后两个字节(16位)用于表示数据长度
            length = buf.readUInt16BE(2); // 读取 16bit 的值
            idx += 2; // +2
        } else if (length === 127) {
            //获取的值为 127 ,表示后 8 个字节(64位)用于表示数据长度,其中高 4 字节是 0
            var highBits = buf.readUInt32BE(2); //(1/0)1111111,切记 MSB 最高位是 0
            if (highBits != 0) {
                this.close(1009, ""); //1009 关闭代码,说明数据太大; 协议里是支持 63 位长度,不过这里我们自己实现的话,只支持 32 位长度,防止数据过大;
            }
            length = buf.readUInt32BE(6); // 从第 6 到第 10 个字节(32位)为真实存放的数据长度
            idx += 8;
        }
        if (buf.length < idx + 4 + length) {
            //不够长 4为掩码字节数
            return;
        }
        // 如果有 mask 标志位,默认都是有的
        if (MASK) {
            var maskBytes = buf.slice(idx, idx + 4); //获取掩码数据
            idx += 4; //指针前移到真实数据段
            var payload = buf.slice(idx, idx + length); // 数据长度的单位是字节
            payload = unmask(maskBytes, payload); //解码真实数据
        } else {
            payload = buf.slice(idx, idx + length);
        }

        this.buffer = buf.slice(idx + length); // 缓存 buffer
        // 有可能是分帧,需要拼接数据
        this.frames = Buffer.concat([this.frames, payload]); // 保存到 frames 中

        if (!FIN) {
            console.log(
                "server detect fragment, sizeof payload:",
                Buffer.byteLength(payload)
            );
        }

        if (FIN) {
            payload = this.frames.slice(0); // 获取所有拼接完整的数据
            opcode = opcode || this.frameOpcode; // 如果是 0 ,则保持获取之前保存的 code
            this.frames = Buffer.alloc(0); // 清空 frames
            this.frameOpcode = 0; // 清空 opcode
            this._handleFrame(opcode, payload); // 处理操作码
        }

        return true; // 继续处理
    }
    /**
     * 针对不同操作码进行不同处理
     * @param 操作码
     * @param 数据
     */
    _handleFrame(opcode, buffer) {
        var payload;
        switch (opcode) {
            case OPCODES.TEXT:
                payload = buffer.toString("utf8"); //如果是文本需要转化为utf8的编码
                this.emit("data", opcode, payload); //Buffer.toString()默认utf8 这里是故意指示的
                break;
            case OPCODES.BINARY: //二进制文件直接交付
                payload = buffer;
                this.emit("data", opcode, payload);
                break;
            case OPCODES.PING: // 发送 pong 做响应
                this._doSend(OPCODES.PONG, buffer);
                break;
            case OPCODES.PONG: //不做处理
                console.log("server receive pong");
                break;
            case OPCODES.CLOSE: // close有很多关闭码
                let code, reason; // 用于获取关闭码和关闭原因
                if (buffer.length >= 2) {
                    code = buffer.readUInt16BE(0);
                    reason = buffer.toString("utf8", 2);
                }
                this.close(code, reason);
                this.emit("close", code, reason);
                break;
            default:
                this.close(1002, "unhandle opcode:" + opcode);
        }
    }
    // 这里可以针对 payload 的长度做分片
    _doSend(opcode, payload) {
        var len = Buffer.byteLength(payload);

        // 分片的距离逻辑
        var count = 0;
        while (len > MAX_FRAME_SIZE) {
            var framePayload = payload.slice(0, MAX_FRAME_SIZE);
            payload = payload.slice(MAX_FRAME_SIZE);
            this.socket.write(
                encodeMessage(
                    count > 0 ? OPCODES.CONTINUE : opcode,
                    framePayload,
                    false
                )
            ); //编码后直接通过socket发送
            count++;
            len = Buffer.byteLength(payload);
        }

        this.socket.write(
            encodeMessage(count > 0 ? OPCODES.CONTINUE : opcode, payload)
        ); //编码后直接通过socket发送
    }
}

module.exports = WebSocket;

测试代码:

var http = require('http');
var WebSocket = require('./websocket');
// HTTP服务器部分
var server = http.createServer(function(req, res) {
  res.end('websocket test\r\n');
});

console.log('starting...');

// Upgrade请求处理
server.on('upgrade', callback);

function callback(req, socket, upgradeHead) {
  var ws = new WebSocket(req, socket, upgradeHead);
  // ws.keepLive(); // 保持心跳连接,否则一般经过一定的时间没有数据交互,浏览器端会主动关闭 ws 链接
  ws.on('data', function(opcode, payload) {
    console.log('receive data:', opcode, payload.length);
    ws.send('good job');
  });


  ws.on('close', function(code, reason) {
    console.log('close:', code, reason);
  });

}

server.listen(3000);

运行测试代码,打开浏览器访问:http://localhost:3000/,在控制台输入:

var ws = new WebSocket("ws://localhost:3000/");
ws.onmessage = function(evt) {
console.log( "Received Message: " + evt.data);
};

详解 WebSocket 实现

建立连接后发送消息:

ws.send('hello world');

成功发送并收到回复!

详解 WebSocket 实现

也可以通过报文查看:

详解 WebSocket 实现

参考文档