Linux select 返回0,可能出现的原因和解决方法 (linux select 返回0)

在 Linux 系统编程中,select 函数是常用的一种 I/O 多路复用方式,可用于同时监测多个文件描述符(socket,标准输入输出等)的状态变化。然而,在 select 函数的使用过程中,可能遇到返回值为 0 的情况,这意味着没有任何文件描述符有变化。本文将探讨一下 select 返回 0 的可能原因以及对应的解决方法。

1. 没有设置监测的文件描述符

select 函数的之一个参数是文件描述符的更大值加一,第二个参数是被监测的读文件描述符集,第三个参数是被监测的写文件描述符集,第四个参数是被监测的异常文件描述符集。如果这些参数中的某个参数没有被正确设置,那么 select 函数会返回 0。

通常来说,我们在使用 select 函数的时候,可以通过 FD_ZERO、FD_SET 等相关函数来设置需要监测的文件描述符。因此,如果没有正确执行这些函数,导致 select 函数没有监测到文件描述符的变化,返回 0。

这种情况的解决方法就是要确保正确设置了需要监测的文件描述符,特别是 FD_ZERO 和 FD_SET 函数应该被正确调用。

2. 监测的文件描述符没有发生变化

select 函数会一直等待被监测的文件描述符的状态发生变化,例如数据已经到来、连接已经建立等。如果 select 函数在等待时间到达之前就返回了 0,那么就有可能是因为没有发生任何状态变化。

这种情况的解决方法就是在下一次循环中再次调用 select 函数。另外,我们也可以通过调整 select 函数的超时时间来避免过长的等待时间,提升程序的效率。

3. 文件描述符集被错误地修改了

在 select 函数的使用中,有时可能会在监测文件描述符集时,意外地修改了文件描述符集,导致 select 函数返回了 0。

这种情况的解决方法就是要注意在使用 select 函数时要避免修改文件描述符集的情况,特别是对于在其他线程中使用的文件描述符集,需要加锁保护。

4. select 函数被信号中断

当进行多路复用等操作时,我们需要注意一些信号的可能中断操作,例如 SIGINT 或者 SIGQUIT,在处理信号时,会导致 select 函数返回 0。

这种情况的解决方法就是在捕捉信号的时候要注意避免中断调用 select 函数。

5. 标准输入输出没有关闭

在使用 select 函数时,默认情况下,标准输入和标准输出都是被监测的文件描述符,如果标准输入或标准输出没有被正确关闭,也可能导致 select 函数返回 0。

这种情况的解决方法就是要注意在使用 select 函数时,特别是在非阻塞模式下,检查标准输入和标准输出是否已经关闭,以避免影响到 select 函数的正常运行。

select 函数是 Linux 系统编程中的重要函数,在使用中可能会出现的问题也不容忽视。我们需要根据具体情况,针对性地解决问题,以确保程序正确、高效地运行。

相关问题拓展阅读:

关于Linux下的select/epoll

select这个系统调用的原型如下

之一个参数nfds用来告诉内核

要扫描的socket fd的数量+1

,select系统调用更大接收的数量是1024,但是如果每次都去扫描1024,实际上的数量并不多,则效率太低,这里可以指定需要扫描的数量。

更大数量为1024,如果需要修改这个数量,则需要重新编译Linux内核源码。

第2、3、4个参数分别是readfds、writefds、exceptfds,传递的埋明参数应该是fd_set 类型的引用,内核会检测每个socket的fd,

如果没有读事件,就将对应的fd从第二个参数传入的fd_set中移除,如果没有写事件,就将对应的fd从第二个参数的fd_set中移除,如果没有异常事件,就将对应的fd从第三个参数的fd_set中移除

。这里我们应该

要将实际的readfds、writefds、exceptfds拷贝一份副本传进去,而不是传入原引用,因为如果传递的是原引用,某些socket可能就已经丢失

最后一个参数是等待时间,

传入0表示非阻塞,传入>0表示等待一定时间,传入NULL表示阻塞,直到等到某个socket就绪

FD_ZERO()这个函数将fd_set中的所有bit清0,一般用来进行初始化等。

FD_CLR()这个函数用来将bitmap(fd_set )中的某个bit清0,在客户端异常退出时就会用到这个函数,将fd从fd_set中删除。

FD_ISSET()用来判断某个bit是否被置1了,也就是判断某个fd是否在fd_set中。

FD_SET()这个函数用来将某个fd加入fd_set中,当客户端新加入连接时就会使用到这个函数。

epoll_create系统调用用来创建epfd,会在开辟一块内存空间(epoll的结构空间)。size为epoll上能关注的更大描述符数,不够会进行扩展,size只要>0就行,早期的设计size是固定大小,但是现在size参数没什么用,会自动扩展。

返回值是epfd,如果为-1则说明创建epoll对象失败

之一个参数epfd传入的就是epoll_create返回的epfd。

第二个参数传入对应操作的宏,包括

增删改(EPOLL_CTL_ADD、EPOLL_CTL_DEL、EPOLL_CTL_MOD)

第三个参数传入的是

需要增删改的socket的fd

第四个参数传入的是

需要操作的fd的哪些事件

,具体的事件可以看后续。

返回值是一个int类型,如果为-1则说明操作失败

之一个参数是epfd,也就是epoll_create的返回值。

第二个参数是一个epoll_event类型的指针,也就是传入的是一个数组指针。

内核会将就绪的socket的事件拷贝到这个数组中,用户可以根据这个数组简销拿到事件和消息等

第三个参数是maxevents,传入的是

第二个参数的数组的容量

第四个参数是timeout,

如果设为-1一直阻塞直到有就绪数据为止,如果设为0立即返回,如果>0那么阻塞一段时间

返回值是一个int类型,也就是就绪的socket的事件的数量(内核拷贝给用户的events的元素的数量),通过弯咐告这个数量可以进行遍历处理每个事件

一般需要传入 ev.data.fd 和 ev.events ,也就是fd和需要监控的fd的事件。事件如果需要传入多个,可以通过按位与来连接,比如需要监控读写事件,只需要像如下这样操作即可: ev.events=EPOLLIN | EPOLLOUT 。

LT(水平触发),

默认

的工作模式,

事件就绪后用户可以选择处理和不处理,如果用户不处理,内核会对这部分数据进行维护,那么下次调用epoll_wait()时仍旧会打包出来

ET(边缘触发),事件就绪之后,

用户必须进行处理

,因为内核把事件打包出来之后就把对应的就绪事件给清掉了,

如果不处理那么就绪事件就没了

。ET可以减少epoll事件被重复触发的次数,效率比LT高。

如果需要设置为边缘触发只需要设置事件为类似 ev.events=EPOLLIN | EPOLLET 即可

select/poll/epoll是nio多路复用技术,

传统的bio无法实现C10K/C100K

,也就是无法满足1w/10w的并发量,在这么高的并发量下,在进行上下文切换就很容易将服务器的负载拉飞。

1.将fd_set从用户态拷贝到内核态

2.根据fd_set扫描内存中的socket的fd的状态,时间复杂度为O(n)

3.检查fd_set,如果有已经就绪的socket,就给对应的socket的fd打标记,那么就return 就绪socket的数量并唤醒当前线程,如果没有就绪的socket就继续阻塞当前线程直到有socket就绪才将当前线程唤醒。

4.如果想要获取当前已经就绪的socket列表,则还需要进行一次系统调用,使用O(n)的时间去扫描socket的fd列表,将已经打上标记的socket的fd返回。

CPU在同一个时刻只能执行一个程序,通过RR时间片轮转去切换执行各个程序。没有被挂起的进程(线程)则在工作队列中排队等待CPU的执行,将进程(线程)从工作队列中移除就是挂起,反映到Java层面的就是线程的阻塞。

什么是中断?当我们使用键盘、鼠标等IO设备的时候,会给主板一个电流信号,这个电流信号就给CPU一个中断信号,CPU执行完当前的指令便会保存现场,然后执行键盘/鼠标等设备的中断程序,让中断程序获取CPU的使用权,在中断程序后又将现场恢复,继续执行之前的进程。

如果之一次没检测到就绪的socket,就要将其进程(线程)从工作队列中移除,并加入到socket的等待队列中。

socket包含读缓冲区+写缓冲区+等待队列(放线程或eventpoll对象)

当从客户端往服务器端发送数据时,使用TCP/IP协议将通过物理链路、网线发给服务器的网卡设备,网卡的DMA设备将接收到的的数据写入到内存中的一块区域(网卡缓冲区),然后会给CPU发出一个中断信号,CPU执行完当前指令则会保存现场,然后网卡的中断程序就获得了CPU的使用权,然后CPU便开始执行网卡的中断程序,将内存中的缓存区中的数据包拿出,判断端口号便可以判断它是哪个socket的数据,将数据包写入对应的socket的读(输入)缓冲区,去检查对应的socket的等待队列有没有等待着的进程(线程),如果有就将该线程(进程)从socket的等待队列中移除,将其加入工作队列,这时候该进程(线程)就再次拥有了CPU的使用权限,到这里中断程序就结束了。

之后这个进程(线程)就执行select函数再次去检查fd_set就能发现有socket缓冲区中有数据了,就将该socket的fd打标记,这个时候select函数就执行完了,这时候就会给上层返回一个int类型的数值,表示已经就绪的socket的数量或者是发生了错误。这个时候就再进行内核态到用户态的切换,对已经打标记的socket的fd进行处理。

将原本1024bit长度的bitmap(fd_set)换成了数组的方式传入

,可以

解决原本1024个不够用的情况

,因为传入的是数组,长度可以不止是1024了,因此socket数量可以更多,在Kernel底层会将数组转换成链表。

在十多年前,linux2.6之前,不支持epoll,当时可能会选择用Windows/Unix用作服务器,而不会去选择Linux,因为select/poll会随着并发量的上升,性能变得越来越低,每次都得检查所有的Socket列表。

1.select/poll每次调用都必须根据提供所有的socket,然后就

会涉及到将这个从用户空间拷贝到内核空间,在这个过程中很耗费性能

。但是

其实每次的socket的变化也许并不大,也许就1-2个socket

,但是它会全部进行拷贝,全部进行遍历一一判断是否就绪。

2.select/poll的返回类型是int,只能代表当前的就绪的socket的数量/发生了错误,

如果还需要知道是哪些socket就绪了,则还需要再次使用系统调用去检查哪些socket是就绪的,又是一次O(n)的操作,很耗费性能

1.epoll在Kernel内核中存储了对应的数据结构(eventpoll)。我们可以

使用epoll_create()这个系统调用去创建一个eventpoll对象

,并返回eventpoll的对象id(epfd),eventpoll对象主要包括三个部分:需要处理的正在监听的socket_fd列表(红黑树结构)、socket就绪列表以及等待队列(线程)。

2.我们可以使用epoll_ctl()这个系统调用对socket_fd列表进行CRUD操作,因为可能频繁地进行CRUD,因此

socket_fd使用的是红黑树的结构

,让其效率能更高。epoll_ctl()传递的参数主要是epfd(eventpoll对象id)。

3.epoll_wait()这个系统调用默认会

将当前进程(线程)阻塞,加入到eventpoll对象的等待队列中,直到socket就绪列表中有socket,才会将该进程(线程)重新加入工作队列

,并返回就绪队列中的socket的数量。

socket包含读缓冲区、写缓冲区和等待队列。当使用epoll_ctl()系统调用将socket新加入socket_fd列表时,就会将eventpoll对象引用加到socket的等待队列中,

当网卡的中断程序发现socket的等待队列中不是一个进程(线程),而是一个eventpoll对象的引用,就将socket引用追加到eventpoll对象的就绪列表的尾部

。而eventpoll对象中的等待队列存放的就是调用了epoll_wait()的进程(线程),网卡的中断程序执行会将等待队列中的进程(线程)重新加入工作队列,让其拥有占用CPU执行的资格。epoll_wait()的返回值是int类型,返回的是就绪的socket的数量/发生错误,-1表示发生错误。

epoll的参数有传入一个epoll_event的数组指针(作为输出参数),在调用epoll_wait()返回的同时,Kernel内核还会将就绪的socket列表添加到epoll_event类型的数组当中。

关于linux select 返回0的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。


数据运维技术 » Linux select 返回0,可能出现的原因和解决方法 (linux select 返回0)