书签分享收藏举报版权申诉 / 6

立即下载加入VIP,免费下载

当前位置：首页 > 小学教育 > 语文 > IO多路复用学习总结李向勇讲解.docx

IO多路复用学习总结李向勇讲解.docx

文档编号：11655458
上传时间：2023-03-29
格式：DOCX
页数：6
大小：19.49KB

《IO多路复用学习总结李向勇讲解.docx》由会员分享，可在线阅读，更多相关《IO多路复用学习总结李向勇讲解.docx（6页珍藏版）》请在冰豆网上搜索。

IO多路复用学习总结李向勇讲解.docx

IO多路复用学习总结李向勇讲解

IO多路复用学习总结

学生姓名：

李向勇

指导教师：

乔永锋

完成时间：

2019年7月12日

IO多路复用学习总结

一．基本概念

IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取，它就通知该进程。

IO多路复用适用如下场合：

●当客户处理多个描述字时（一般是交互式输入和网络套接口），必须使用I/O复用。

●当一个客户同时处理多个套接口时。

●如果一个TCP服务器既要处理监听套接口，又要处理已连接套接口，一般也要用到I/O复用。

●如果一个服务器即要处理TCP，又要处理UDP，一般要使用I/O复用。

●如果一个服务器要处理多个服务或多个协议，一般要使用I/O复用。

与多进程和多线程技术相比，I/O多路复用技术的最大优势是系统开销小，系统不必创建进程/线程，也不必维护这些进程/线程，从而大大减小了系统的开销。

二．IO多路复用的函数

1.select（）

select函数准许进程指示内核等待多个事件中的任何一个发送，并只在有一个或多个事件发生或经历一段指定的时间后才唤醒。

函数原型如下：

#include

intselect（intmaxfdp1,fd_set*readset,fd_set*writeset,fd_set*exceptset,conststructtimeval*timeout）

返回值：

就绪描述符的数目，超时返回0，出错返回-1

函数参数介绍如下：

1）第一个参数maxfdp1指定待测试的描述字个数，它的值是待测试的最大描述字加1（因此把该参数命名为maxfdp1），描述字0、1、2...maxfdp1-1均将被测试。

2）中间的三个参数readset、writeset和exceptset指定我们要让内核测试读、写和异常条件的描述字。

如果对某一个的条件不感兴趣，就可以把它设为空指针。

structfd_set可以理解为一个集合，这个集合中存放的是文件描述符，可通过以下四个宏进行设置：

voidFD_ZERO（fd_set*fdset）; //清空集合

voidFD_SET（intfd,fd_set*fdset）; //将一个给定的文件描述符加入集合之中

voidFD_CLR（intfd,fd_set*fdset）; //将一个给定的文件描述符从集合中删除

intFD_ISSET（intfd,fd_set*fdset）; //检查集合中指定的文件描述符是否可以读写

3）timeout告知内核等待所指定描述字中的任何一个就绪可花多少时间。

其timeval结构用于指定这段时间的秒数和微秒数。

structtimeval{

longtv_sec; //seconds

longtv_usec; //microseconds

};

这个参数有三种可能：

（1）永远等待下去：

仅在有一个描述字准备好I/O时才返回。

为此，把该参数设置为空指针NULL。

（2）等待一段固定时间：

在有一个描述字准备好I/O时返回，但是不超过由该参数所指向的timeval结构中指定的秒数和微秒数。

（3）根本不等待：

检查描述字后立即返回，这称为轮询。

为此，该参数必须指向一个timeval结构，而且其中的定时器值必须为0。

基本原理：

图一

select的几大缺点：

（1）每次调用select，都需要把fd集合从用户态拷贝到内核态，这个开销在fd很多时会很大

（2）同时每次调用select都需要在内核遍历传递进来的所有fd，这个开销在fd很多时也很大

（3）select支持的文件描述符数量太小了，默认是1024

2.poll（）

poll（）函数：

这个函数是用于执行与select（）函数同等功能的函数。

函数原型如下：

#include

intpoll（structpollfdfds[],nfds_tnfds,inttimeout）；

pollfd结构体定义如下：

struct pollfd {

int fd; /* 文件描述符 */

short events; /* 等待的事件 */

short revents; /* 实际发生了的事件 */

} ;

　每一个pollfd结构体指定了一个被监视的文件描述符，可以传递多个结构体，指示poll（）监视多个文件描述符。

每个结构体的events域是监视该文件描述符的事件掩码，由用户来设置这个域。

revents域是文件描述符的操作结果事件掩码，内核在调用返回时设置这个域。

events域中请求的任何事件都可能在revents域中返回。

合法的事件如下：

　　POLLIN 有数据可读。

　　POLLRDNORM 　　　　有普通数据可读。

　　POLLRDBAND　　　　　有优先数据可读。

　　POLLPRI　　　　　　　　有紧迫数据可读。

　　POLLOUT　　　　　　写数据不会导致阻塞。

　　POLLWRNORM　　　　　写普通数据不会导致阻塞。

　　POLLWRBAND　　　　　写优先数据不会导致阻塞。

　　POLLMSGSIGPOLL 　　　消息可用。

　　此外，revents域中还可能返回下列事件：

　　POLLER　　指定的文件描述符发生错误。

　　POLLHUP　　指定的文件描述符挂起事件。

　　POLLNVAL　　指定的文件描述符非法。

参数说明:

fds：

是一个structpollfd结构类型的数组，用于存放需要检测其状态的Socket描述符；每当调用这个函数之后，系统不会清空这个数组，操作起来比较方便；特别是对于socket连接比较多的情况下，在一定程度上可以提高处理的效率；这一点与select（）函数不同，调用select（）函数之后，select（）函数会清空它所检测的socket描述符集合，导致每次调用select（）之前都必须把socket描述符重新加入到待检测的集合中；因此，select（）函数适合于只检测一个socket描述符的情况，而poll（）函数适合于大量socket描述符的情况；

nfds：

nfds_t类型的参数，用于标记数组fds中的结构体元素的总数量；

timeout：

是poll函数调用阻塞的时间，单位：

毫秒；

返回值:

>0：

数组fds中准备好读、写或出错状态的那些socket描述符的总数量；

==0：

数组fds中没有任何socket描述符准备好读、写，或出错；此时poll超时，超时时间是timeout毫秒；换句话说，如果所检测的socket描述符上没有任何事件发生的话，那么poll（）函数会阻塞timeout所指定的毫秒时间长度之后返回，如果timeout==0，那么poll（）函数立即返回而不阻塞，如果timeout==INFTIM，那么poll（）函数会一直阻塞下去，直到所检测的socket描述符上的感兴趣的事件发生是才返回，如果感兴趣的事件永远不发生，那么poll（）就会永远阻塞下去；

-1：

poll函数调用失败，同时会自动设置全局变量errno；

如果待检测的socket描述符为负值，则对这个描述符的检测就会被忽略，也就是不会对成员变量events进行检测，在events上注册的事件也会被忽略，poll（）函数返回的时候，会把成员变量revents设置为0，表示没有事件发生；

另外，poll（）函数不会受到socket描述符上的O_NDELAY标记和O_NONBLOCK标记的影响和制约，也就是说，不管socket是阻塞的还是非阻塞的，poll（）函数都不会收到影响；而select（）函数则不同，select（）函数会受到O_NDELAY标记和O_NONBLOCK标记的影响，如果socket是阻塞的socket，则调用select（）跟不调用select（）时的效果是一样的，socket仍然是阻塞式TCP通讯，相反，如果socket是非阻塞的socket，那么调用select（）时就可以实现非阻塞式TCP通讯；

3.epoll（）

epoll使用一个文件描述符管理多个描述符，将用户关系的文件描述符的事件存放到内核的一个事件表中，这样在用户空间和内核空间的copy只需一次。

epoll操作过程需要三个接口，分别如下：

#include

intepoll_create（intsize）;

intepoll_ctl（intepfd,intop,intfd,structepoll_event*event）;

intepoll_wait（intepfd,structepoll_event*events,intmaxevents,inttimeout）;

1）intepoll_create（intsize）;

创建一个epoll的句柄，size用来告诉内核这个监听的数目一共有多大。

这个参数不同于select（）中的第一个参数，给出最大监听的fd+1的值。

需要注意的是，当创建好epoll句柄后，它就是会占用一个fd值，在linux下如果查看/proc/进程id/fd/，是能够看到这个fd的，所以在使用完epoll后，必须调用close（）关闭，否则可能导致fd被耗尽。

2）intepoll_ctl（intepfd,intop,intfd,structepoll_event*event）;

epoll的事件注册函数，它不同与select（）是在监听事件时告诉内核要监听什么类型的事件epoll的事件注册函数，它不同与select（）是在监听事件时告诉内核要监听什么类型的事件，而是在这里先注册要监听的事件类型。

第一个参数是epoll_create（）的返回值，第二个参数表示动作，用三个宏来表示：

EPOLL_CTL_ADD：

注册新的fd到epfd中；

EPOLL_CTL_MOD：

修改已经注册的fd的监听事件；

EPOLL_CTL_DEL：

从epfd中删除一个fd；

第三个参数是需要监听的fd，第四个参数是告诉内核需要监听什么事，structepoll_event结构如下：

structepoll_event{

__uint32_tevents;/*Epollevents*/

epoll_data_tdata;/*Userdatavariable*/

};

events可以是以下几个宏的集合：

EPOLLIN：

表示对应的文件描述符可以读（包括对端SOCKET正常关闭）；

EPOLLOUT：

表示对应的文件描述符可以写；

EPOLLPRI：

表示对应的文件描述符有紧急的数据可读（这里应该表示有带外数据到来）；

EPOLLERR：

表示对应的文件描述符发生错误；

EPOLLHUP：

表示对应的文件描述符被挂断；

EPOLLET：

将EPOLL设为边缘触发（EdgeTriggered）模式，这是相对于水平触发（LevelTriggered）来说的。

EPOLLONESHOT：

只监听一次事件，当监听完这次事件之后，如果还需要继续监听这个socket的话，需要再次把这个socket加入到EPOLL队列里。

3）intepoll_wait（intepfd,structepoll_event*events,intmaxevents,inttimeout）;

等待事件的产生，类似于select（）调用。

参数events用来从内核得到事件的集合，maxevents告之内核这个events有多大，这个maxevents的值不能大于创建epoll_create（）时的size，参数timeout是超时时间（毫秒，0会立即返回，-1将不确定，也有说法说是永久阻塞）。

该函数返回需要处理的事件数目，如返回0表示已超时。

4）工作模式：

epoll对文件描述符的操作有两种模式：

LT（leveltrigger）和ET（edge

trigger）。

LT模式是默认模式，LT模式与ET模式的区别如下：

LT模式：

当epoll_wait检测到描述符事件发生并将此事件通知应用程序，应用程序可以不立即处理该事件。

下次调用epoll_wait时，会再次响应应用程序并通知此事件。

ET模式：

当epoll_wait检测到描述符事件发生并将此事件通知应用程序，应用程序必须立即处理该事件。

如果不处理，下次调用epoll_wait时，不会再次响应应用程序并通知此事件。

三．总结区别

（1）select，poll实现需要自己不断轮询所有fd集合，直到设备就绪，期间可能要睡眠和唤醒多次交替。

而epoll其实也需要调用epoll_wait不断轮询就绪链表，期间也可能多次睡眠和唤醒交替，但是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。

虽然都要睡眠和交替，但是select和poll在“醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了，这节省了大量的CPU时间。

这就是回调机制带来的性能提升。

（2）select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，并且要把current往设备等待队列中挂一次，而epoll只要一次拷贝，而且把current往等待队列上挂也只挂一次（在epoll_wait的开始，注意这里的等待队列并不是设备等待队列，只是一个epoll内部定义的等待队列）。