Linux网络编程:TCP与UDP详解
今天是一篇关于socket网络编程的原创文章。虽然Linux上的socket网络编程技术多用于服务器编程,但其实客户端中也有使用这个技术的关键场景:长连接。比如笔者所在项目的客户端,其长连接也是使用socket的c++编程实现的。基于TCP协议的socket编程实现非常适合需要轻量稳定的客户端长连接。
Linux网络编程中,TCP和UDP是两种主要的传输层协议。本文将详细分析TCP和UDP在网络编程中的使用、原理、代码示例、数据流动,一些异常情况的处理方式,以及如何使用socket编程实现客户端长连接。
一、TCP与UDP概述
1.1 TCP的原理
TCP是一种面向连接的协议,它通过三次握手建立连接,然后在连接上进行可靠的数据传输。TCP使用序列号和确认应答(ACK)来保证数据的可靠传输,通过滑动窗口和拥塞控制算法进行流量控制和拥塞控制。
1.2 UDP的原理
相比于TCP,UDP是一种更简单的协议。UDP是无连接的,它直接在IP协议之上发送数据报,不提供数据的可靠传输、流量控制或拥塞控制。因此,UDP的延迟和开销较小,适用于对实时性要求高的应用,如语音和视频通信。
1.3 数据流动
在TCP和UDP通信中,数据是从客户端流向服务器的。客户端首先建立连接(TCP)或直接发送数据报(UDP),然后服务器接收并处理这些数据,可能会返回响应给客户端。在TCP通信中,数据的流动是双向的,客户端和服务器都可以发送数据和接收数据。在UDP通信中,数据的流动也是双向的,但是由于UDP是无连接的,客户端和服务器可以独立地发送和接收数据。
二、Socket的使用
在Linux网络编程中,我们使用socket来实现TCP和UDP通信。以下是TCP和UDP的socket使用示例:
2.1 TCP Socket示例
服务器端:
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>
#include <string.h>
#include <iostream>
int main() {
int server_fd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in server_addr;
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(8080);
server_addr.sin_addr.s_addr = INADDR_ANY;
bind(server_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));
listen(server_fd, 5);
while (true) {
struct sockaddr_in client_addr;
socklen_t client_addr_len = sizeof(client_addr);
int client_fd = accept(server_fd, (struct sockaddr *)&client_addr, &client_addr_len);
char buffer[1024];
ssize_t read_len = read(client_fd, buffer, sizeof(buffer) - 1);
buffer[read_len] = '\0';
std::cout << "Received: " << buffer << std::endl;
write(client_fd, buffer, strlen(buffer));
close(client_fd);
}
close(server_fd);
return 0;
}
客户端:
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <iostream>
int main() {
int client_fd = socket(AF_INET, SOCK_STREAM, 0);
struct sockaddr_in server_addr;
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(8080);
inet_pton(AF_INET, "127.0.0.1", &server_addr.sin_addr);
connect(client_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));
const char *message = "Hello, Server!";
write(client_fd, message, strlen(message));
char buffer[1024];
ssize_t read_len = read(client_fd, buffer, sizeof(buffer) - 1);
buffer[read_len] = '\0';
std::cout << "Received: " << buffer << std::endl;
close(client_fd);
return 0;
}
在Linux网络编程中,socket()
, sockaddr_in
结构体和相关常量都是用于创建和配置套接字的关键组件。以下是上面代码的含义和用法:
-
AF_INET
:这是一个地址族(Address Family)常量,表示我们使用的是IPv4协议。在创建套接字时,需要指定地址族以确定使用哪种协议。另一个常见的地址族是AF_INET6
,表示使用IPv6协议。 -
SOCK_STREAM
:这是一个套接字类型(Socket Type)常量,表示我们使用的是面向连接的、可靠的字节流。在TCP协议中,我们使用SOCK_STREAM
类型的套接字。另一个常见的套接字类型是SOCK_DGRAM
,表示无连接的、不可靠的数据报文,通常用于UDP协议。 -
socket(AF_INET, SOCK_STREAM, 0)
:这是一个系统调用,用于创建一个新的套接字。它接受三个参数:地址族(如AF_INET
)、套接字类型(如SOCK_STREAM
)和协议(通常设置为0,让系统自动选择协议,如TCP或UDP)。此函数返回一个套接字文件描述符,用于后续的网络操作。 -
struct sockaddr_in
:这是一个用于表示IPv4套接字地址的结构体。它包含了地址族、端口号和IPv4地址。在网络编程中,我们需要使用此结构体来设置服务器和客户端的地址信息。 -
server_addr.sin_family = AF_INET
:设置sockaddr_in
结构体中的地址族字段为AF_INET
,表示使用IPv4协议。 -
server_addr.sin_port = htons(8080)
:设置sockaddr_in
结构体中的端口号字段。htons()
函数将主机字节序(Host Byte Order)转换为网络字节序(Network Byte Order)。这里我们设置端口号为8080。 -
INADDR_ANY
:这是一个特殊的IPv4地址(0.0.0.0),表示服务器将监听所有可用的网络接口。当服务器有多个网络接口时,使用INADDR_ANY
可以让服务器接受来自任何接口的连接请求。 -
server_addr.sin_addr.s_addr = INADDR_ANY
:设置sockaddr_in
结构体中的IPv4地址字段为INADDR_ANY
,表示服务器将监听所有可用的网络接口。
2.2 UDP Socket示例
服务器端:
#include <sys/socket.h>
#include <netinet/in.h>
#include <unistd.h>
#include <string.h>
#include <iostream>
int main() {
int server_fd = socket(AF_INET, SOCK_DGRAM, 0);
struct sockaddr_in server_addr;
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(8080);
server_addr.sin_addr.s_addr = INADDR_ANY;
bind(server_fd, (struct sockaddr *)&server_addr, sizeof(server_addr));
while (true) {
char buffer[1024];
struct sockaddr_in client_addr;
socklen_t client_addr_len = sizeof(client_addr);
ssize_t read_len = recvfrom(server_fd, buffer, sizeof(buffer) - 1, 0, (struct sockaddr *)&client_addr, &client_addr_len);
buffer[read_len] = '\0';
std::cout << "Received: " << buffer << std::endl;
sendto(server_fd, buffer, strlen(buffer), 0, (struct sockaddr *)&client_addr, client_addr_len);
}
close(server_fd);
return 0;
}
客户端:
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#include <iostream>
int main() {
int client_fd = socket(AF_INET, SOCK_DGRAM, 0);
struct sockaddr_in server_addr;
server_addr.sin_family = AF_INET;
server_addr.sin_port = htons(8080);
inet_pton(AF_INET, "127.0.0.1", &server_addr.sin_addr);
const char *message = "Hello, Server!";
sendto(client_fd, message, strlen(message), 0, (struct sockaddr *)&server_addr, sizeof(server_addr));
char buffer[1024];
struct sockaddr_in recv_addr;
socklen_t recv_addr_len = sizeof(recv_addr);
ssize_t read_len = recvfrom(client_fd, buffer, sizeof(buffer) - 1, 0, (struct sockaddr *)&recv_addr, &recv_addr_len);
buffer[read_len] = '\0';
std::cout << "Received: " << buffer << std::endl;
close(client_fd);
return 0;
}
三、数据流动时序图
以下是TCP和UDP通信的时序图,展示了客户端与服务器之间的数据流动。
3.1 TCP通信详解
在TCP通信中,我们首先需要建立一个TCP连接,然后才能在这个连接上进行数据传输。以下是TCP通信的详细步骤和时序图:
- 服务器执行
socket()
函数,创建一个新的套接字。 - 服务器执行
bind()
函数,将套接字绑定到一个指定的地址(包括IP地址和端口号)。 - 服务器执行
listen()
函数,使套接字进入监听模式,等待客户端的连接请求。 - 服务器执行
accept()
函数,阻塞并等待客户端的连接请求。当一个客户端连接请求到来时,accept()
函数返回,并创建一个新的套接字与客户端进行通信。 - 客户端执行
socket()
和connect()
函数,向服务器发起连接请求。connect()
函数会发送一个SYN(同步)数据包到服务器。 - 服务器收到SYN数据包,在
accept()
函数返回后,回复一个SYN+ACK(确认应答)数据包给客户端。 - 客户端收到SYN+ACK数据包,回复一个ACK数据包给服务器,完成TCP连接的建立。
- TCP连接建立后,客户端和服务器可以通过
read()
和write()
函数进行数据传输。
以下是TCP通信的时序图:
Server Client
| |
| socket() |
| |
| bind() |
| |
| listen() |
| |
| accept() |
| |
|--等待客户端连接请求--->|
| |
| |
| socket(), connect() |
|<--- SYN ------------|
| |
|-- SYN + ACK ------->|
| |
|<--- ACK ------------|
| |
|<-- Data ------------|
| read(), write() |
| |
|-- Data -----------> |
| read(), write() |
| |
3.2 UDP通信详解
与TCP不同,UDP是一种无连接的协议,客户端和服务器不需要建立连接就可以直接发送数据。以下是UDP通信的详细步骤:
- 服务器执行
socket()
函数,创建一个新的套接字。 - 服务器执行
bind()
函数,将套接字绑定到一个指定的地址(包括IP地址和端口号)。 - 客户端执行
socket()
函数,创建一个新的套接字。 - 客户端可以直接通过
sendto()
函数发送数据到服务器。 - 服务器通过
recvfrom()
函数接收客户端发送的数据。
以下是UDP通信的时序图:
Server Client
| |
| socket() |
| |
| bind() |
| |
|----等待客户端数据---->|
| |
| |
| socket()|
| sendto()|
|<--- Data -----------|
| recvfrom() |
| |
在这种情况下,服务器已经准备好接受客户端的数据。当客户端执行socket()
和sendto()
函数发送数据时,服务器会通过recvfrom()
函数接收这些数据。
四、客户端长连接
笔者所在客户端项目的网络层是用C++实现,其中的长连接部分就是用socket接口编程实现的。本节就来看看如何在客户端使用socket和服务器建立连接、读取和发送数据。
4.1 建立长连接
下面是使用socket建立连接的实现,AsyncSocket::connect
函数用于异步连接目标服务器:
- 检查是否在正确的线程上调用并设置连接状态和回调函数。
- 解析主机名(如果需要)并遍历地址列表,尝试创建套接字。
- 设置套接字选项并调用连接前的回调函数。
- 尝试连接目标地址并处理错误码。
- 监听套接字的可写事件,以便在连接成功时通知。
int AsyncSocket::connect(const CompletionCallback& callback, const BeforeConnectCallback& beforeConnectCallback) {
// 检查是否在正确的线程上调用
DCHECK(thread_checker_.CalledOnValidThread());
// 检查连接状态是否为 CONNECT_STATE_NONE
DCHECK(connect_state_ == CONNECT_STATE_NONE);
// 设置连接状态为 CONNECT_STATE_CONNECT
connect_state_ = CONNECT_STATE_CONNECT;
// 设置回调函数
write_callback_ = callback;
before_connect_callback_ = beforeConnectCallback;
// 如果主机名不为空且地址列表为空,则解析主机名
if (hostname_.length() && sockaddrs_.empty()) {
int ret = resolveHostBeforeConnect();
if (ret != 0) return ERR_IO_PENDING;
}
// 遍历地址列表,尝试创建套接字
while (!sockaddrs_.empty()) {
hostaddr_ = sockaddrs_.front();
sockaddrs_.erase(sockaddrs_.begin());
struct sockaddr_storage *addr = (struct sockaddr_storage *)hostaddr_.data();
LOG(WARNING) << "AsyncSocket connect IP: " << Sockaddr2IP((const sockaddr*)addr);
socket_fd_ = socket(addr->ss_family, SOCK_STREAM, IPPROTO_TCP);
if (socket_fd_ < 0) {
// 如果创建套接字失败,根据错误码输出错误日志
switch errno {
case EAFNOSUPPORT:
LOG(ERROR) << "AsyncSocket create socket encounter EAFNOSUPPORT";
break;
case EPROTONOSUPPORT:
LOG(ERROR) << "AsyncSocket create socket encounter EPROTONOSUPPORT";
break;
case ENFILE:
LOG(ERROR) << "AsyncSocket create socket encounter ENFILE";
break;
case EMFILE:
LOG(ERROR) << "AsyncSocket create socket encounter EMFILE";
break;
default:
LOG(ERROR) << "AsyncSocket create socket returned an error, errno=" << errno;
break;
}
} else {
break;
}
}
// 如果套接字创建失败,调用回调函数并返回错误码
if (socket_fd_ < 0) {
if (!beforeConnectCallback.is_null()) beforeConnectCallback.Run(false);
if (!callback.is_null()) callback.Run(ERR_ADDRESS_INVALID);
return socket_fd_;
}
// 设置套接字选项
SetNonBlocking(socket_fd_);
SetTCPNoDelay(socket_fd_, true);
SetTCPKeepAlive(socket_fd_, true, 900);
SetTCPNoSigPipe(socket_fd_);
SetTCPTimeout(socket_fd_, 15);
// 调用连接前的回调函数
if (!beforeConnectCallback.is_null()) beforeConnectCallback.Run(true);
// 尝试连接目标地址
int rv = ::connect(socket_fd_, (sockaddr *)hostaddr_.data(), (socklen_t)hostaddr_.length());
// 将错误码映射为对应的错误类型
int ret = rv == 0 ? OK : MapConnectError(errno);
// 如果连接不需要等待,则直接调用回调函数并返回结果
if (ret != ERR_IO_PENDING) {
callback.Run(ret);
return ret;
}
// 监听套接字的可写事件,以便在连接成功时通知
if (!base::MessageLoopForIO::current()->WatchFileDescriptor(
socket_fd_, true, base::MessageLoopForIO::WATCH_WRITE,
&write_socket_watcher_, this)) {
PLOG(ERROR) << "WatchFileDescriptor failed on connect, errno " << errno;
return errno;
}
return ret;
}
通过这个函数,可以实现异步连接目标服务器,并在连接成功或失败时调用相应的回调。
4.2 长连接上的数据读写
建立完长连接后,基于socket实现异步读写如下,AsyncSocket::read
和 AsyncSocket::write
分别用于异步读取和写入数据:
- 检查是否在正确的线程上调用、回调函数是否为空以及缓冲区长度是否大于 0。
- 检查连接状态并调用系统函数读取或写入数据。
- 处理返回值或错误码,并在结果不为 0 且不为ERR_IO_PENDING时,调用回调函数并返回结果。
- 监听套接字的可读(对于
AsyncSocket::read
)或可写(对于AsyncSocket::write
)事件,以便在数据到来时通知。 - 保存缓冲区、长度和回调函数,并返回ERR_IO_PENDING表示操作正在进行。
// AsyncSocket::read函数,用于从socket读取数据
int AsyncSocket::read(IOBuffer* buf, size_t buf_len, const CompletionCallback& callback) {
// 检查是否在正确的线程上调用
DCHECK(thread_checker_.CalledOnValidThread());
// 检查读取回调是否为空
CHECK(read_callback_.is_null());
// 不支持同步操作,回调函数不能为空
DCHECK(!callback.is_null());
// 检查缓冲区长度是否大于0
DCHECK_LT(0, buf_len);
// 检查连接状态
if (connect_state_ != CONNECT_STATE_CONNECT_COMPLETE) {
// 如果连接未完成,回调并返回错误
callback.Run(ERR_SOCKET_NOT_CONNECTED);
return 0;
}
// 调用系统read函数读取数据
ssize_t rv = ::read(socket_fd_, buf->data(), buf_len);
// 将返回值或错误码映射为结果
int ret = rv >= 0 ? (int)rv : MapSystemError(errno);
// 如果结果不为0且不为ERR_IO_PENDING,回调并返回结果
if (ret != 0 && ret != ERR_IO_PENDING) {
callback.Run(ret);
return ret;
}
// 监听套接字的可读事件,以便在数据到来时通知
if (!base::MessageLoopForIO::current()->WatchFileDescriptor(
socket_fd_, true, base::MessageLoopForIO::WATCH_READ,
&read_socket_watcher_, this)) {
PLOG(ERROR) << "WatchFileDescriptor failed on read, errno " << errno;
return errno;
}
// 保存缓冲区、长度和回调函数
read_buf_ = buf;
read_buf_len_ = buf_len;
read_callback_ = callback;
// 返回ERR_IO_PENDING表示操作正在进行
return ERR_IO_PENDING;
}
// AsyncSocket::write函数,用于向socket写入数据
int AsyncSocket::write(IOBuffer* buf, size_t buf_len, const CompletionCallback& callback) {
// 检查是否在正确的线程上调用
DCHECK(thread_checker_.CalledOnValidThread());
// 检查连接状态是否为CONNECT_STATE_CONNECT_COMPLETE
DCHECK(connect_state_ == CONNECT_STATE_CONNECT_COMPLETE);
// 检查写入回调是否为空
CHECK(write_callback_.is_null());
// 不支持同步操作,回调函数不能为空
DCHECK(!callback.is_null());
// 检查缓冲区长度是否大于0
DCHECK_LT(0, buf_len);
// 调用WriteWrapper函数写入数据
ssize_t rv = WriteWrapper(socket_fd_, buf->data(), buf_len);
// 将返回值或错误码映射为结果
int ret = rv >= 0 ? (int)rv : MapSystemError(errno);
// 如果结果不为0且不为ERR_IO_PENDING,回调并返回结果
if (ret != 0 && ret != ERR_IO_PENDING) {
callback.Run(ret);
return ret;
}
// 监听套接字的可写事件,以便在可以写入数据时通知
if (!base::MessageLoopForIO::current()->WatchFileDescriptor(
socket_fd_, true, base::MessageLoopForIO::WATCH_WRITE,
&write_socket_watcher_, this)) {
PLOG(ERROR) << "WatchFileDescriptor failed on write, errno " << errno;
return errno;
}
// 保存缓冲区、长度和回调函数
write_buf_ = buf;
write_buf_len_ = buf_len;
write_callback_ = callback;
// 返回ERR_IO_PENDING表示操作正在进行
return ERR_IO_PENDING;
}
通过这两个函数,可以实现异步读取和写入数据。当数据准备好读取或可以写入时,将调用相应的回调函数。这样可以避免阻塞操作,提高程序的性能和响应速度。
五、异常情况处理
在网络通信中,可能会遇到一些异常情况,如TCP握手过程中服务器ACK丢失、第三次握手的ACK丢失等。以下是这些异常情况的处理方式:
5.1 第一次握手的服务器ACK丢失
当第一次握手服务器发送的ACK丢失时,客户端将无法收到确认,因此会重新发送SYN。服务器在收到重复的SYN后,会再次发送ACK。这个过程会持续进行,直到客户端收到ACK或达到最大重传次数。
5.2 第三次握手的ACK丢失
当TCP握手过程中第三次握手的ACK丢失时,客户端和服务器分别会发生以下情况:
- 服务器端:
服务器端在收到客户端的SYN包后,会回复SYN+ACK包,并进入SYN_RCVD状态。此时,服务器端将该连接放入半连接队列。当第三次握手的ACK丢失时,服务器端没有收到客户端的ACK包,服务器端会认为连接尚未建立。根据TCP的超时重传机制,服务器端会等待一定时间(例如3秒、6秒、12秒等),然后重新发送SYN+ACK包给客户端,期待客户端重新发送ACK包。
在等待过程中,服务器端会继续监听其他新的连接请求。如果重试次数达到上限(例如5次),服务器端可能会放弃等待,将该连接从半连接队列中移除。
- 客户端:
客户端在收到服务器端的SYN+ACK包后,会发送ACK包并将连接状态设置为ESTABLISHED。然而,如果第三次握手的ACK丢失,服务器端无法收到该ACK包。在这种情况下,客户端会在超时后尝试重新发送ACK包,以确保服务器端收到。通常,客户端会在等待一段时间后触发重传机制,避免长时间等待。
在重试过程中,如果服务器端已经因为半连接队列超时而将该连接移除,当服务器端收到客户端重新发送的ACK包时,服务器端可能会回复一个RST包(用于强制关闭TCP连接),此时客户端会感知到连接建立失败。
总之,当第三次握手的ACK丢失时,服务器端和客户端都会尝试重新发送SYN+ACK包和ACK包,以确保连接能够成功建立。这种重试机制可以提高TCP连接的可靠性,确保即使在网络不稳定的情况下,连接仍然能够建立。
六、总结
本文详细讨论了Linux网络编程中TCP和UDP两种方式的socket使用、原理分析、代码示例、数据流动时序图,一些异常情况的处理方式,以及如何使用socket编程实现客户端长连接。理解这些概念有助于更高效地进行socket网络编程,应对各种网络通信场景。
推荐阅读
转载自:https://juejin.cn/post/7357172505960169487