详解 WebSocket 实现
前言
为什么写这篇文章?
对于应用协议的了解,相信大部分👨🎓始终停留在使用上,可能读了如 《图解HTTP》、《计算机网络》 一类的书籍,了解了更深层次的理论,但理论始终是理论,我们很难有机会能在工作场景里面去触碰到协议的实现上,对应用层协议的理解是片面的。
WebSocket 的实现非常适合前端的同学学习,通过了解 WebSocket Node版实现,站在更高的维度上去看待这些应用层协议,无论是WebRTC,还是HTTP都好,有了对一种协议实现的整体思路,就有了面对各种协议的技术自信。
WebSocket简介
WebSocket 是 HTML5 开始提供的一种在单个 TCP 连接上进行全双工(full-duplex)通讯的协议。没有了 Request 和 Response 的概念,两者地位完全平等,连接一旦建立,就建立了真•持久性连接,双方可以随时向对方发送数据。
注:全双工(Full Duplex)是一种通信方式,指通信的双方可以同时发送和接收数据,而且在同一时刻,发送和
接收是独立进行的。
概念老生常谈了,不妨思考两个问题:
WebSocket 为什么能进行全双工通信?HTTP 却不行?
HTTP是非持久化连接,每次客户端向服务器发送请求时,都需要建立一个新的 TCP 连接。这个连接在响应结束后就会被关闭,不保留在系统中,而 websocket 会保留,所以可以继续保持通信。
HTTP 为什么是非持久化连接而 WebSocket 是持久化连接?
HTTP 协议的设计初衷是为了传输静态文本信息,如 HTML、CSS、JS 等等,传输静态文本大部分时间连接并不会被频繁地打开和关闭,所以使用持久化连接带来的复杂度可能会超过它的收益。而不像 websocket 更多是为了实时通信的场景,所以采用持久化连接。
WebSocket握手过程
我们经常听到一种说法,WebSocket 基于 HTTP,实际上只有在建立握手时,数据是通过 HTTP 传输的。但是建立之后,在真正传输时候是不需要 HTTP协议。握手具体过程如图所示:
注:websocket 会保留 HTTP 握手后的 socket 连接,后续即可利用这个 socket 进行通讯,无需再关注 HTTP。
websocket 为什么采用 HTTP 握手?
WebSocket 是相对较新的协议,可能并不是所有的网络设备和服务器都支持。因此,在浏览器请求服务器进行 WebSocket 握手时,使用基于 HTTP 协议的握手方式可以避免协议兼容性问题。
WebSocket实现原理
WebSocket数据帧说明
WebSocket 以帧的形式进行数据传输,帧组成包括以下几个部分:
-
头部(Header):包括了一些控制信息,如 FIN、RSV1、RSV2、RSV3、Opcode、MASK、Payload Length 以及 Masking Key 等字段,用于描述该帧的类型、长度以及是否经过掩码操作等信息。它有 2~14 个字节不等,其中前 2 个字节是必需的。
-
掩码(Masking Key):用于对载荷(Payload)进行加密解密操作,它的长度固定为 4 个字节,如果 MASK 标志被设置为 1,则该字段必须存在。
-
载荷(Payload):包含了应用层发送的数据,具体内容由 Opcode 字段指定的数据类型决定。如果有 MASK 标志,则需要对其进行解码。
各字段含义如表格所示:
字段 | 含义 | 长度 |
---|---|---|
FIN | 是否为最后一帧 | 1 bit |
RSV | 预留位,方便后续拓展协议 | 3 bit |
opcode | 解释 payload data 的用途 | 4 bit |
MASK | 定义“payload data”是否被添加掩码 | 1 bit |
payload data length | 数据长度 | 7 bit 7+16 bit 7+64 bit |
Serial Number | 序列号 | 16bit |
Masking-key | 掩码 | 32bit |
payload data | 传输数据 | payload data length |
把数据帧组成搞清楚,可以说 websocket 你就了解了一大半,协议实现里大部分操作都是对于数据帧的处理。
构造帧
websocket 的数据是以帧的形式传输,那么我们就需要了解如何构造帧。构造帧只是听起来很复杂,构造一个数据帧我们只需要遵守协议规则填写即可,按照WebSocket的协议标准,构造一个最短数据帧我们只需要三个字节就能完成,构成如表格所示下:
字节编号 | 填入内容 |
---|---|
1 | FIN、RSV、opcode |
2 | MASK、payload data length |
3 | payload data |
代码实现:
注:本质就是做一些字节拼接操作,把对应的标识放到对应的位置即可。
数据传输
了解往构造帧的过程,那 websocket 是如何把帧发送出去的?
WebSocket 在握手过程中会保留 HTTP 握手后的 socket 连接,这在前面有提到,所以我们可以通过这个 socket 连接进行数据的传输。
代码实现如下:
心跳机制
在连接过中,防止连接因长时间无数据传输而被提前关闭,WebSocket 还引入了心跳机制,原理可以概括为:定期发送心跳包,以确认客户端与服务器的连接状态,并避免连接因长时间空闲而被中断。 代码实现如下:
mini-ws
以下为一个 websocket server 的简易实现(代码来源):
var crypto = require("crypto");
var { EventEmitter } = require("events");
var MAX_FRAME_SIZE = 1024; // 最长长度限制
var MAGIC_STRING = "258EAFA5-E914-47DA-95CA-C5AB0DC85B11";
/**
* 数据类型操作码 TEXT 字符串
* BINARY 二进制数据 常用来保存照片
* PING,PONG 用作心跳检测
* CLOSE 关闭连接的数据帧 (有很多关闭连接的代码 1001,1009,1007,1002)
*/
var OPCODES = {
CONTINUE: 0,
TEXT: 1,
BINARY: 2,
CLOSE: 8,
PING: 9,
PONG: 10,
};
var hashWebSocketKey = function (key) {
var sha1 = crypto.createHash("sha1");
sha1.update(key + MAGIC_STRING, "ascii");
return sha1.digest("base64");
};
/**
* 解掩码
* @param maskBytes 掩码数据
* @param data payload
* @returns {Buffer}
*/
var unmask = function (maskBytes, data) {
var payload = Buffer.alloc(data.length);
for (var i = 0; i < data.length; i++) {
payload[i] = maskBytes[i % 4] ^ data[i];
}
return payload;
};
/**
* 编码数据
* @param opcode 操作码
* @param payload 数据
* @returns {*}
*/
var encodeMessage = function (opcode, payload, isFinal = true) {
var buf;
var b1 = (isFinal ? 0x80 : 0x00) | opcode;
var b2;
var length = payload.length;
if (length < 126) {
buf = Buffer.alloc(payload.length + 2 + 0);
b2 |= length;
//buffer ,offset
buf.writeUInt8(b1, 0); //读前8bit
buf.writeUInt8(b2, 1); //读8―15bit
payload.copy(buf, 2); //复制数据,从2(第三)字节开始
} else if (length < 1 << 16) {
buf = Buffer.alloc(payload.length + 2 + 2);
b2 |= 126;
buf.writeUInt8(b1, 0);
buf.writeUInt8(b2, 1);
buf.writeUInt16BE(length, 2);
payload.copy(buf, 4);
} else {
buf = Buffer.alloc(payload.length + 2 + 8);
b2 |= 127;
buf.writeUInt8(b1, 0);
buf.writeUInt8(b2, 1);
buf.writeUInt32BE(0, 2);
buf.writeUInt32BE(length, 6);
payload.copy(buf, 10);
}
return buf;
};
class WebSocket extends EventEmitter {
constructor(req, socket, upgradeHead) {
super();
var resKey = hashWebSocketKey(req.headers["sec-websocket-key"]);
// 构造响应头
var resHeaders = [
"HTTP/1.1 101 Switching Protocols",
"Upgrade: websocket",
"Connection: Upgrade",
"Sec-WebSocket-Accept: " + resKey,
]
.concat("", "")
.join("\r\n");
socket.on("data", (data) => {
this.buffer = Buffer.concat([this.buffer, data]);
while (this._processBuffer()) {}
});
socket.on("close", (had_error) => {
if (!this.closed) {
this.emit("close", 1006);
this.closed = true;
}
});
socket.write(resHeaders);
this.socket = socket;
this.buffer = Buffer.alloc(0);
this.closed = false;
this.frames = Buffer.alloc(0);
this.frameOpcode = 0;
this.keepLiveTimer = null;
}
/*
发送数据函数
* */
send(obj) {
var opcode;
var payload;
// 如果是二进制
if (Buffer.isBuffer(obj)) {
opcode = OPCODES.BINARY;
payload = obj;
} else if (typeof obj) {
// 承载的文本内容
opcode = OPCODES.TEXT;
//创造一个utf8的编码,可以被编码为字符串
payload = Buffer.from(obj, "utf8");
} else {
throw new Error("cannot send object.Must be string of Buffer");
}
this._doSend(opcode, payload);
}
// 默认 45 秒 保持发送心跳
keepLive(timeout = 45000) {
var self = this;
function keepit() {
self._doSend(OPCODES.PING, Buffer.from("ping"));
console.log("server send ping...");
// 在关闭连接的情况下就不再需要发送 ping 请求了
if (!self.closed) {
self.keepLiveTimer = setTimeout(keepit, timeout);
}
}
keepit();
}
/*
关闭连接函数
* */
close(code, reason) {
var opcode = OPCODES.CLOSE;
var buffer;
if (code) {
buffer = Buffer.alloc(Buffer.byteLength(reason) + 2);
buffer.writeUInt16BE(code, 0);
buffer.write(reason, 2);
} else {
buffer = Buffer.alloc(0);
}
this._doSend(opcode, buffer);
this.closed = true;
}
_processBuffer() {
var buf = this.buffer;
if (buf.length < 2) {
return;
}
var idx = 2;
var byte1 = buf.readUInt8(0); // 读取数据帧的前 8 bit
var FIN = byte1 & 0x80; // 如果为0x80,则标志传输结束,获取高位 bit
var opcode = byte1 & 0x0f; //截取第一个字节的后 4 位,即 opcode 码
// 如果是 0 的话,说明是延续帧,需要保存好 opCode
if (!FIN) {
this.frameOpcode = opcode || this.frameOpcode; // 确保不为 0;
}
var byte2 = buf.readUInt8(1); // 读取数据帧第二个字节
var MASK = byte2 & 0x80; // 判断是否有掩码,客户端必须要有,获取高位 bit
var length = byte2 & 0x7f; //获取length属性,也是小于126数据长度的数据真实值
if (length > 125) {
if (buf.length < 8) {
return; // 如果大于125,而字节数小于 8,则显然不合规范要求
}
}
if (length === 126) {
//获取的值为126 ,表示后两个字节(16位)用于表示数据长度
length = buf.readUInt16BE(2); // 读取 16bit 的值
idx += 2; // +2
} else if (length === 127) {
//获取的值为 127 ,表示后 8 个字节(64位)用于表示数据长度,其中高 4 字节是 0
var highBits = buf.readUInt32BE(2); //(1/0)1111111,切记 MSB 最高位是 0
if (highBits != 0) {
this.close(1009, ""); //1009 关闭代码,说明数据太大; 协议里是支持 63 位长度,不过这里我们自己实现的话,只支持 32 位长度,防止数据过大;
}
length = buf.readUInt32BE(6); // 从第 6 到第 10 个字节(32位)为真实存放的数据长度
idx += 8;
}
if (buf.length < idx + 4 + length) {
//不够长 4为掩码字节数
return;
}
// 如果有 mask 标志位,默认都是有的
if (MASK) {
var maskBytes = buf.slice(idx, idx + 4); //获取掩码数据
idx += 4; //指针前移到真实数据段
var payload = buf.slice(idx, idx + length); // 数据长度的单位是字节
payload = unmask(maskBytes, payload); //解码真实数据
} else {
payload = buf.slice(idx, idx + length);
}
this.buffer = buf.slice(idx + length); // 缓存 buffer
// 有可能是分帧,需要拼接数据
this.frames = Buffer.concat([this.frames, payload]); // 保存到 frames 中
if (!FIN) {
console.log(
"server detect fragment, sizeof payload:",
Buffer.byteLength(payload)
);
}
if (FIN) {
payload = this.frames.slice(0); // 获取所有拼接完整的数据
opcode = opcode || this.frameOpcode; // 如果是 0 ,则保持获取之前保存的 code
this.frames = Buffer.alloc(0); // 清空 frames
this.frameOpcode = 0; // 清空 opcode
this._handleFrame(opcode, payload); // 处理操作码
}
return true; // 继续处理
}
/**
* 针对不同操作码进行不同处理
* @param 操作码
* @param 数据
*/
_handleFrame(opcode, buffer) {
var payload;
switch (opcode) {
case OPCODES.TEXT:
payload = buffer.toString("utf8"); //如果是文本需要转化为utf8的编码
this.emit("data", opcode, payload); //Buffer.toString()默认utf8 这里是故意指示的
break;
case OPCODES.BINARY: //二进制文件直接交付
payload = buffer;
this.emit("data", opcode, payload);
break;
case OPCODES.PING: // 发送 pong 做响应
this._doSend(OPCODES.PONG, buffer);
break;
case OPCODES.PONG: //不做处理
console.log("server receive pong");
break;
case OPCODES.CLOSE: // close有很多关闭码
let code, reason; // 用于获取关闭码和关闭原因
if (buffer.length >= 2) {
code = buffer.readUInt16BE(0);
reason = buffer.toString("utf8", 2);
}
this.close(code, reason);
this.emit("close", code, reason);
break;
default:
this.close(1002, "unhandle opcode:" + opcode);
}
}
// 这里可以针对 payload 的长度做分片
_doSend(opcode, payload) {
var len = Buffer.byteLength(payload);
// 分片的距离逻辑
var count = 0;
while (len > MAX_FRAME_SIZE) {
var framePayload = payload.slice(0, MAX_FRAME_SIZE);
payload = payload.slice(MAX_FRAME_SIZE);
this.socket.write(
encodeMessage(
count > 0 ? OPCODES.CONTINUE : opcode,
framePayload,
false
)
); //编码后直接通过socket发送
count++;
len = Buffer.byteLength(payload);
}
this.socket.write(
encodeMessage(count > 0 ? OPCODES.CONTINUE : opcode, payload)
); //编码后直接通过socket发送
}
}
module.exports = WebSocket;
测试代码:
var http = require('http');
var WebSocket = require('./websocket');
// HTTP服务器部分
var server = http.createServer(function(req, res) {
res.end('websocket test\r\n');
});
console.log('starting...');
// Upgrade请求处理
server.on('upgrade', callback);
function callback(req, socket, upgradeHead) {
var ws = new WebSocket(req, socket, upgradeHead);
// ws.keepLive(); // 保持心跳连接,否则一般经过一定的时间没有数据交互,浏览器端会主动关闭 ws 链接
ws.on('data', function(opcode, payload) {
console.log('receive data:', opcode, payload.length);
ws.send('good job');
});
ws.on('close', function(code, reason) {
console.log('close:', code, reason);
});
}
server.listen(3000);
运行测试代码,打开浏览器访问:http://localhost:3000/,在控制台输入:
var ws = new WebSocket("ws://localhost:3000/");
ws.onmessage = function(evt) {
console.log( "Received Message: " + evt.data);
};
建立连接后发送消息:
ws.send('hello world');
成功发送并收到回复!
也可以通过报文查看:
参考文档
转载自:https://juejin.cn/post/7236954203555151933