本文讲述了TCP套接字编程模块,包括服务器端的创建套接字、绑定、监听、接受、读/写、终止连接,客户端的创建套接字、连接、读/写、终止连接。先给出实例,进而结合代码分析。

PS:本文权当复习套接字编程的读书笔记。

1. TCP套接字编程模型

同一台计算机上运行的进程可以利用管道、消息队列、信号量、共享内存等进行相互通信,不同计算机上运行的进程可以通过套接字网络IPC接口进行相互通信。套接字编程基本步骤如下图所示:

img

图 TCP套接字编程模型[1]

2. 源代码

本实例旨在实现简单的echo服务,客户端发送数据给服务端,在服务端打印出来并且回发给客户端,并在客户端显示。

TCP_socket_programming_example源文件:TCP_socket_programming_example.rar

2.1 TCP服务端

//filename:TCPserver.c
#include <stdio.h>
#include <errno.h>
#include <sys/socket.h>
#include <netinet/in.h>

#define BACKLOG 10
#define BUFFER_SIZE 1024

int main(int argc, char *argv[])
{
  if(2 != argc)
  {
    printf("Usage:%s portnumber\n", argv[0]);
    return - 1;
  }

  /***1.create a socket***/
  int fd_server = socket(AF_INET, SOCK_STREAM, 0); //TCP
  if( - 1 == fd_server)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }

  /***2.bind the socket***/
  int listen_port = atoi(argv[1]);
  struct sockaddr_in addr_server;
  //memset(&addr_server, 0, sizeof(addr_server));
  addr_server.sin_family = AF_INET;
  addr_server.sin_port = htons(listen_port);
  addr_server.sin_addr.s_addr = htonl(INADDR_ANY);

  if(bind(fd_server, (struct sockaddr*) &addr_server, sizeof(addr_server)) == - 1)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }

  /***3.listen the socket***/
  if(listen(fd_server, BACKLOG) == - 1)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }

  /***4.accept the requirement of some client***/
  struct sockaddr_in addr_client;
  int len_addr_client = sizeof(addr_client);
  int fd_client = accept(fd_server, (struct sockaddr*) &addr_client, &len_addr_client);
  if( - 1 == fd_client)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }

  /****5.serve the client******/
  char buf[BUFFER_SIZE];
  int size;
  while(1)
  {
    /***read from client***/
    size = recv(fd_client, buf, sizeof(buf), 0);
    buf[size] = '\0';
    printf("%s\n", buf);

    /***write to client***/
    size = send(fd_client, buf, strlen(buf), 0);
  }

  /****6.close the socket******/
  close(fd_server);
  close(fd_client);
}

2.2 TCP客户端

//filename:TCPclient.c
#include <stdio.h>
#include <errno.h>
#include <sys/socket.h>
#include <netinet/in.h>

#define BUFFER_SIZE 1024

int main(int argc, char *argv[])
{
  if(3 != argc)
  {
    printf("Usage:%s hostname portnumber\n", argv[0]);
    return - 1;
  }

  /***1.create a socket***/
  int fd_client = socket(AF_INET, SOCK_STREAM, 0); //TCP
  if( - 1 == fd_client)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }
  /***2.connect to the server***/
  int portnumber = atoi(argv[2]);
  struct sockaddr_in addr_server;
  addr_server.sin_family = AF_INET;
  addr_server.sin_port = htons(portnumber);
  if(0 == inet_pton(AF_INET, argv[1], (void*) &addr_server.sin_addr.s_addr))
  {
    printf("Invalid address.\n");
    return - 1;
  }

  if(connect(fd_client, (struct sockaddr*) &addr_server, sizeof(addr_server)) == - 1)
  {
    printf("%s\n", strerror(errno));
    return - 1;
  }


  /****3.get the server******/
  char buf[BUFFER_SIZE];
  int size;
  while(1)
  {
    /***write to server***/
    scanf("%s", buf);
    size = send(fd_client, buf, strlen(buf), 0);

    /***read from server***/
    size = recv(fd_client, buf, BUFFER_SIZE, 0);

    buf[size] = '\0';
    printf("%s\n", buf);

  }
  /****4.close the socket******/
  close(fd_client);
}

2.3 测试结果

$ ./TCPserver 2000

img

$ ./TCPclient 127.0.0.1 2000

img

3. 源码分析

3.1 创建套接字

int socket(int domain, int type, int protocol);//成功返回套接字描述符.出错返回-1

这一步事实上是确定通信特征,各个域domain有自己的格式表示地址,以AF_开头(address family);type确定套接字类型,如数据报、字节流;协议protocol对同一个域和套接字类型支持的多个协议进行选择,通常为0,即按给定的域和套接字类型选择默认的协议。典型的TCP、UDP如下:

TCP:(AF_INET, SOCK_STREAM, 0)
UDP:(AF_INET, SOCK_DGRAM, 0)

注:尽管套接字本质是文件描述符,但不是所有用于文件操作的函数都能用于套接字操作,比如lseek,套接字不支持文件偏移量。

3.2 绑定

int bind(int sockfd, const struct sockaddr *addr, socklen_t len);//成功返回0.出错返回-1

bind函数用于将地址绑定到一个套接字。服务器需要给一个接收客户端请求套接字绑定一个众所周知的地址,而客户端可以让系统选一个默认地址绑定(无须绑定)。

(1) 套接字地址sockaddr_in

在IPv4因特网域AF_INET中,套接字地址用结构sockaddr_in表示,如下:

struct sockaddr_in
{
  sa_family_t sin_family; //unsigned short 地址族
  in_port_t sin_sport; //uint16_t
  struct in_addr sin_addr; //IPv4
};

struct in_addr
{
  in_addr_t s_addr; //uint32_t
};

注:

初始化sockaddr_in结构体时,因为sin_portsin_addr被封装在网络传输,所以端口号和地址必须用网络字节序;而sin_family只是被内核用来决定数据结构包含什么类型的地址,没有发送到到网络,应该是本机字节顺序。处理器与网络字节序之间转换函数为htonlhtonsntohlntohshhost主机,nnetwork网络,llong32位,sshort16位)。

理论上,端口号可以是0~65535,但1~1023已由IANA管理,绑定时端口号不少于1024[2]。

此处的地址s_addr是二进制地址格式,如果参数是点分十进制字符串表示,则需通过函数inet_ntop(将网络字节序的二进制地址转换成点分十进制字符串表示)、inet_pton进行相互转换。其转换过程如下:

127.0.0.1 --> 7F.0.0.1 --> 100007F=16777343(网络字节序为大端)

如果地址s_addrANADDR_ANY,套接字端点可以被绑定到所有系统网络接口,即可以收到这个系统所安装的所有网卡的数据包。

(2) 通用地址格式sockaddr

地址格式与特定的通信域有关(如AF_INETAF_INET6),为使不同地址格式地址能够传入套接字函数,地址被强制转换成通用的地址结构sockaddr,如下(以Linux为例):

struct sockaddr
{
  unsigned short sa_family; /* address family, AF_xxx */
  char sa_data[14]; /* 14 bytes of protocol address */
};

3.3 监听listen

int listen(int sockfd, int backlog);//成功返回0,出错返回-1

一旦服务器调用listen,套接字就能接收连接请求。backlog用于表示该进程所要入队的连接请求数量,实际值由系统决定,但上限由SOMAXCONN指定。一旦队列满,系统会拒绝多余连接请求。

3.4 接受连接请求accept

//成功返回套接字描述符,出错返回-1
int accept(int sockfd, struct sockaddr *restrict addr, socklen_t *restrict len);

使用accept获得连接请求并建立连接,新的套接字描述符连接到调用connect的客户端。传给accept的原始套接字(sockfd)没有关联到这个连接,而是接收保持可用状态并接受其他请求连接,这样做是为了使新的套接字描述符和原始套接字具有相同的地址族domain和套接字类型type

如果服务器调用accept并且当前没有连接请求,服务器会阻塞直到一个请求到来。如果不关心客户端标识,可以将参数addrlen设为NULL

注:关键字restrict是C99新引入的,所有修改该指针所指向内容的操作全部都是基于该指针的,即不存在其它进行修改操作的途径;从而帮助编译器进行更好的代码优化,生成更有效率的汇编代码[4]。

3.5 建立连接connect

//成功返回0,出错返回-1
int connect(int sockfd, const struct sockaddr *addr, socklen_t len);

addr是想与之通信的服务器地址,如果sockfd没有绑定到一个地址,connect会给调用者绑定一个默认的地址。成功连接需要以下条件:要连接的机器开启且正在运行,服务器绑定到一个想与之连接的地址,服务器的等待连接队列有足够的空间。

3.6 读取数据

ssize_t read(int fd, void *buf, size_t nbytes); //成功返回读到的字节数,已到文件末尾返回0,出错返回-1

ssize_t recv(int sockfd, const void *buf, size_t nbytes, int flags); //成功返回字节计数的消息长度,无可用消息或对方已经按序结束返回0,出错返回-1

ssize_t recvfrom(int sockfd,void *restrict buf, size_t len, int flags, struct sockaddr *restrict addr, socketlen_t *restruct addrlen); //成功返回字节计数的消息长度,无可用消息或对方已经按序结束返回0,出错返回-1

ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);//成功返回字节计数的消息长度,无可用消息或对方已经按序结束返回0,出错返回-1

可以使用read通过套接字通信,但read只能交换数据,若想指定选项、从多个客户端接收数据包,则需选择套接字函数recv(指定标志控制接收数据的方式)、recvfrom(得到数据发送者的源地址)、resvmsg(将接收到数据送入多个缓冲区或接收辅助数据)。

img

3.7 写入数据

ssize_t write(int fd, void *buf, size_t count); //成功返回写入字节数,出错返回-1

ssize_t send(int sockfd, const void *buf, size_t nbytes, int flags); //成功返回发送的字节数,出错返回-1

ssize_t sendto(int sockfd, const void *buf, size_t nbytes, int flags, 
              const struct sockaddr *destaddr, socklen_t destlen); //成功返回发送的字节数,出错返回-1

ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags); //成功返回发送的字节数,出错返回-1

注:sendsendtoflags含义相同,sendmsgflags与前两者不同

可以使用write通过套接字通信,但write只能交换数据,若想指定选项、发送带外数据,则需选择套接字函数send(指定标志改变处理传输数据的方式)、sendto(允许无连接的套接字上指定一个目标地址)、sendmsg(指定多重缓冲传输数据)。

img

3.8 终止连接

int close(int fd); //成功返回0,出错返回-1

int shutdown(int sockfd, int how);//成功返回0,出错返回-1

关闭套接字close只有在最后一个活动引用被关闭后才释放网络端点,而shutdown提供更精细的控制,套接字通信是双向的,可以用shutdown禁止套接字上的输入/输出,即howSHUT_RDSHUT_WRSHUT_RDWR。除此之外,shutdown允许使一个套接字处于不活动状态(不管引用它的文件描述符数目多少),便于复制一个套接字(如dup)。

附:套接字调用标志源文件

参考资料:

[1] 百度文库《》

[2] 《UNIX环境高级编程》[M].

[3] 维基百科词条:

[4] 博文《C99中的restrict关键字

本文系Spark & Shine原创,转载需注明出处本文最近一次修改时间 2022-03-24 16:52

results matching ""

    No results matching ""