IO多路复用学习总结李向勇讲解.docx
- 文档编号:11655458
- 上传时间:2023-03-29
- 格式:DOCX
- 页数:6
- 大小:19.49KB
IO多路复用学习总结李向勇讲解.docx
《IO多路复用学习总结李向勇讲解.docx》由会员分享,可在线阅读,更多相关《IO多路复用学习总结李向勇讲解.docx(6页珍藏版)》请在冰豆网上搜索。
IO多路复用学习总结李向勇讲解
IO多路复用学习总结
学生姓名:
李向勇
指导教师:
乔永锋
完成时间:
2019年7月12日
IO多路复用学习总结
一.基本概念
IO多路复用是指内核一旦发现进程指定的一个或者多个IO条件准备读取,它就通知该进程。
IO多路复用适用如下场合:
●当客户处理多个描述字时(一般是交互式输入和网络套接口),必须使用I/O复用。
●当一个客户同时处理多个套接口时。
●如果一个TCP服务器既要处理监听套接口,又要处理已连接套接口,一般也要用到I/O复用。
●如果一个服务器即要处理TCP,又要处理UDP,一般要使用I/O复用。
●如果一个服务器要处理多个服务或多个协议,一般要使用I/O复用。
与多进程和多线程技术相比,I/O多路复用技术的最大优势是系统开销小,系统不必创建进程/线程,也不必维护这些进程/线程,从而大大减小了系统的开销。
二.IO多路复用的函数
1.select()
select函数准许进程指示内核等待多个事件中的任何一个发送,并只在有一个或多个事件发生或经历一段指定的时间后才唤醒。
函数原型如下:
#include
#include
intselect(intmaxfdp1,fd_set*readset,fd_set*writeset,fd_set*exceptset,conststructtimeval*timeout)
返回值:
就绪描述符的数目,超时返回0,出错返回-1
函数参数介绍如下:
1)第一个参数maxfdp1指定待测试的描述字个数,它的值是待测试的最大描述字加1(因此把该参数命名为maxfdp1),描述字0、1、2...maxfdp1-1均将被测试。
2)中间的三个参数readset、writeset和exceptset指定我们要让内核测试读、写和异常条件的描述字。
如果对某一个的条件不感兴趣,就可以把它设为空指针。
structfd_set可以理解为一个集合,这个集合中存放的是文件描述符,可通过以下四个宏进行设置:
voidFD_ZERO(fd_set*fdset); //清空集合
voidFD_SET(intfd,fd_set*fdset); //将一个给定的文件描述符加入集合之中
voidFD_CLR(intfd,fd_set*fdset); //将一个给定的文件描述符从集合中删除
intFD_ISSET(intfd,fd_set*fdset); //检查集合中指定的文件描述符是否可以读写
3)timeout告知内核等待所指定描述字中的任何一个就绪可花多少时间。
其timeval结构用于指定这段时间的秒数和微秒数。
structtimeval{
longtv_sec; //seconds
longtv_usec; //microseconds
};
这个参数有三种可能:
(1)永远等待下去:
仅在有一个描述字准备好I/O时才返回。
为此,把该参数设置为空指针NULL。
(2)等待一段固定时间:
在有一个描述字准备好I/O时返回,但是不超过由该参数所指向的timeval结构中指定的秒数和微秒数。
(3)根本不等待:
检查描述字后立即返回,这称为轮询。
为此,该参数必须指向一个timeval结构,而且其中的定时器值必须为0。
基本原理:
图一
select的几大缺点:
(1)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大
(2)同时每次调用select都需要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大
(3)select支持的文件描述符数量太小了,默认是1024
2.poll()
poll()函数:
这个函数是用于执行与select()函数同等功能的函数。
函数原型如下:
#include
intpoll(structpollfdfds[],nfds_tnfds,inttimeout);
pollfd结构体定义如下:
struct pollfd {
int fd; /* 文件描述符 */
short events; /* 等待的事件 */
short revents; /* 实际发生了的事件 */
} ;
每一个pollfd结构体指定了一个被监视的文件描述符,可以传递多个结构体,指示poll()监视多个文件描述符。
每个结构体的events域是监视该文件描述符的事件掩码,由用户来设置这个域。
revents域是文件描述符的操作结果事件掩码,内核在调用返回时设置这个域。
events域中请求的任何事件都可能在revents域中返回。
合法的事件如下:
POLLIN 有数据可读。
POLLRDNORM 有普通数据可读。
POLLRDBAND 有优先数据可读。
POLLPRI 有紧迫数据可读。
POLLOUT 写数据不会导致阻塞。
POLLWRNORM 写普通数据不会导致阻塞。
POLLWRBAND 写优先数据不会导致阻塞。
POLLMSGSIGPOLL 消息可用。
此外,revents域中还可能返回下列事件:
POLLER 指定的文件描述符发生错误。
POLLHUP 指定的文件描述符挂起事件。
POLLNVAL 指定的文件描述符非法。
参数说明:
fds:
是一个structpollfd结构类型的数组,用于存放需要检测其状态的Socket描述符;每当调用这个函数之后,系统不会清空这个数组,操作起来比较方便;特别是对于socket连接比较多的情况下,在一定程度上可以提高处理的效率;这一点与select()函数不同,调用select()函数之后,select()函数会清空它所检测的socket描述符集合,导致每次调用select()之前都必须把socket描述符重新加入到待检测的集合中;因此,select()函数适合于只检测一个socket描述符的情况,而poll()函数适合于大量socket描述符的情况;
nfds:
nfds_t类型的参数,用于标记数组fds中的结构体元素的总数量;
timeout:
是poll函数调用阻塞的时间,单位:
毫秒;
返回值:
>0:
数组fds中准备好读、写或出错状态的那些socket描述符的总数量;
==0:
数组fds中没有任何socket描述符准备好读、写,或出错;此时poll超时,超时时间是timeout毫秒;换句话说,如果所检测的socket描述符上没有任何事件发生的话,那么poll()函数会阻塞timeout所指定的毫秒时间长度之后返回,如果timeout==0,那么poll()函数立即返回而不阻塞,如果timeout==INFTIM,那么poll()函数会一直阻塞下去,直到所检测的socket描述符上的感兴趣的事件发生是才返回,如果感兴趣的事件永远不发生,那么poll()就会永远阻塞下去;
-1:
poll函数调用失败,同时会自动设置全局变量errno;
如果待检测的socket描述符为负值,则对这个描述符的检测就会被忽略,也就是不会对成员变量events进行检测,在events上注册的事件也会被忽略,poll()函数返回的时候,会把成员变量revents设置为0,表示没有事件发生;
另外,poll()函数不会受到socket描述符上的O_NDELAY标记和O_NONBLOCK标记的影响和制约,也就是说,不管socket是阻塞的还是非阻塞的,poll()函数都不会收到影响;而select()函数则不同,select()函数会受到O_NDELAY标记和O_NONBLOCK标记的影响,如果socket是阻塞的socket,则调用select()跟不调用select()时的效果是一样的,socket仍然是阻塞式TCP通讯,相反,如果socket是非阻塞的socket,那么调用select()时就可以实现非阻塞式TCP通讯;
3.epoll()
epoll使用一个文件描述符管理多个描述符,将用户关系的文件描述符的事件存放到内核的一个事件表中,这样在用户空间和内核空间的copy只需一次。
epoll操作过程需要三个接口,分别如下:
#include
intepoll_create(intsize);
intepoll_ctl(intepfd,intop,intfd,structepoll_event*event);
intepoll_wait(intepfd,structepoll_event*events,intmaxevents,inttimeout);
1)intepoll_create(intsize);
创建一个epoll的句柄,size用来告诉内核这个监听的数目一共有多大。
这个参数不同于select()中的第一个参数,给出最大监听的fd+1的值。
需要注意的是,当创建好epoll句柄后,它就是会占用一个fd值,在linux下如果查看/proc/进程id/fd/,是能够看到这个fd的,所以在使用完epoll后,必须调用close()关闭,否则可能导致fd被耗尽。
2)intepoll_ctl(intepfd,intop,intfd,structepoll_event*event);
epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件epoll的事件注册函数,它不同与select()是在监听事件时告诉内核要监听什么类型的事件,而是在这里先注册要监听的事件类型。
第一个参数是epoll_create()的返回值,第二个参数表示动作,用三个宏来表示:
EPOLL_CTL_ADD:
注册新的fd到epfd中;
EPOLL_CTL_MOD:
修改已经注册的fd的监听事件;
EPOLL_CTL_DEL:
从epfd中删除一个fd;
第三个参数是需要监听的fd,第四个参数是告诉内核需要监听什么事,structepoll_event结构如下:
structepoll_event{
__uint32_tevents;/*Epollevents*/
epoll_data_tdata;/*Userdatavariable*/
};
events可以是以下几个宏的集合:
EPOLLIN:
表示对应的文件描述符可以读(包括对端SOCKET正常关闭);
EPOLLOUT:
表示对应的文件描述符可以写;
EPOLLPRI:
表示对应的文件描述符有紧急的数据可读(这里应该表示有带外数据到来);
EPOLLERR:
表示对应的文件描述符发生错误;
EPOLLHUP:
表示对应的文件描述符被挂断;
EPOLLET:
将EPOLL设为边缘触发(EdgeTriggered)模式,这是相对于水平触发(LevelTriggered)来说的。
EPOLLONESHOT:
只监听一次事件,当监听完这次事件之后,如果还需要继续监听这个socket的话,需要再次把这个socket加入到EPOLL队列里。
3)intepoll_wait(intepfd,structepoll_event*events,intmaxevents,inttimeout);
等待事件的产生,类似于select()调用。
参数events用来从内核得到事件的集合,maxevents告之内核这个events有多大,这个maxevents的值不能大于创建epoll_create()时的size,参数timeout是超时时间(毫秒,0会立即返回,-1将不确定,也有说法说是永久阻塞)。
该函数返回需要处理的事件数目,如返回0表示已超时。
4)工作模式:
epoll对文件描述符的操作有两种模式:
LT(leveltrigger)和ET(edge
trigger)。
LT模式是默认模式,LT模式与ET模式的区别如下:
LT模式:
当epoll_wait检测到描述符事件发生并将此事件通知应用程序,应用程序可以不立即处理该事件。
下次调用epoll_wait时,会再次响应应用程序并通知此事件。
ET模式:
当epoll_wait检测到描述符事件发生并将此事件通知应用程序,应用程序必须立即处理该事件。
如果不处理,下次调用epoll_wait时,不会再次响应应用程序并通知此事件。
三.总结区别
(1)select,poll实现需要自己不断轮询所有fd集合,直到设备就绪,期间可能要睡眠和唤醒多次交替。
而epoll其实也需要调用epoll_wait不断轮询就绪链表,期间也可能多次睡眠和唤醒交替,但是它是设备就绪时,调用回调函数,把就绪fd放入就绪链表中,并唤醒在epoll_wait中进入睡眠的进程。
虽然都要睡眠和交替,但是select和poll在“醒着”的时候要遍历整个fd集合,而epoll在“醒着”的时候只要判断一下就绪链表是否为空就行了,这节省了大量的CPU时间。
这就是回调机制带来的性能提升。
(2)select,poll每次调用都要把fd集合从用户态往内核态拷贝一次,并且要把current往设备等待队列中挂一次,而epoll只要一次拷贝,而且把current往等待队列上挂也只挂一次(在epoll_wait的开始,注意这里的等待队列并不是设备等待队列,只是一个epoll内部定义的等待队列)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IO 多路复用 学习 总结 讲解