`
abs200311235
  • 浏览: 122522 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Socket编程中select()的妙用

阅读更多
Socket编程中select()的妙用
用过 WinSock API 网友们知道:WinSock 编程中有一很方便的地方便是其  息驱动机制,不管是底层 API 的 WSAAsyncSelect() 还是 MFC 的异步Socket类:  CAsyncSocket,都提供了诸如 FD_ACCEPT、FD_READ、FD_CLOSE 之类的消息  供编程人员捕捉并处理。FD_ACCEPT 通知进程有客户方Socket请求连接,  FD_READ通知进程本地Socket有东东可读,FD_CLOSE通知进程对方Socket已  关闭。那么,BSD Socket 是不是真的相形见拙呢? 
非也! 'cause cpu love unix so.  BSD UNIX中有一系统调用芳名select()完全可以提供类似的消息驱动机制。  cpu郑重宣布:WinSock的WSAAsyncSeclet()不过是此select()的fork版!  bill也是fork出来的嘛,xixi. 
select()的机制中提供一fd_set的数据结构,实际上是一long类型的数组,  每一个数组元素都能与一打开的文件句柄(不管是Socket句柄,还是其他  文件或命名管道或设备句柄)建立联系,建立联系的工作由程序员完成,  当调用select()时,由内核根据IO状态修fd_set的内容,由此来通知执  行了select()的进程哪一Socket或文件可读,下面具体解释: 
#include  <sys/types.h> 
#include  <sys/times.h> 
#include  <sys/select.h> 
int select(nfds, readfds, writefds, exceptfds, timeout) 
int nfds; 
fd_set *readfds, *writefds, *exceptfds; 
struct timeval *timeout; 
ndfs:select监视的文件句柄数,视进程中打开的文件数而定,一般设为呢要监视各文件 中的最大文件号加一。 
readfds:select监视的可读文件句柄集合。 
writefds: select监视的可写文件句柄集合。 
exceptfds:select监视的异常文件句柄集合。 
timeout:本次select()的超时结束时间。(见/usr/sys/select.h, 
        可精确至百万分之一秒!) 
当readfds或writefds中映象的文件可读或可写或超时,本次select() 
就结束返回。程序员利用一组系统提供的宏在select()结束时便可判 
断哪一文件可读或可写。对Socket编程特别有用的就是readfds。 
几只相关的宏解释如下: 
FD_ZERO(fd_set *fdset):清空fdset与所有文件句柄的联系。 
FD_SET(int fd, fd_set *fdset):建立文件句柄fd与fdset的联系。 
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd与fdset的联系。 
FD_ISSET(int fd, fdset *fdset):检查fdset联系的文件句柄fd是否 
                                可读写,>0表示可读写。 
(关于fd_set及相关宏的定义见/usr/include/sys/types.h) 
这样,你的socket只需在有东东读的时候才读入,大致如下: 
... 
int     sockfd; 
fd_set  fdR; 
struct  timeval timeout = ..; 
... 
for(;;) { 
        FD_ZERO(&fdR); 
        FD_SET(sockfd, &fdR); 
        switch (select(sockfd + 1, &fdR, NULL, &timeout)) { 
                case -1: 
                        error handled by u; 
                case 0: 
                        timeout hanled by u; 
                default: 
                        if (FD_ISSET(sockfd)) { 
                                now u read or recv something; 
                                /* if sockfd is father and  
                                server socket, u can now 
                                accept() */ 
                        }        }  } 
所以一个FD_ISSET(sockfd)就相当通知了sockfd可读。 
至于struct timeval在此的功能,请man select。不同的timeval设置  使使select()表现出超时结束、无超时阻塞和轮询三种特性。由于timeval可精确至百万分之一秒,所以Windows的SetTimer()根本不算 什么。你可以用select()做一个超级时钟。 
FD_ACCEPT的实现?依然如上,因为客户方socket请求连接时,会发送 连接请求报文,此时select()当然会结束,FD_ISSET(sockfd)当然大于零,因为有报文可读嘛!至于这方面的应用,主要在于服务方的父 Socket,你若不喜欢主动accept(),可改为如上机制来accept()。至于FD_CLOSE的实现及处理,颇费了一堆cpu处理时间,未完待续。 
-- 
讨论关于利用select()检测对方Socket关闭的问题: 
仍然是本地Socket有东东可读,因为对方Socket关闭时,会发一个关闭连接通知报文,会马上被select()检测到的。关于TCP的连接(三次握手)和关闭(二次握手)机制,敬请参考有关TCP/IP的书籍。 
不知是什么原因,UNIX好象没有提供通知进程关于Socket或Pipe对方关闭的 信号,也可能是cpu所知有限。总之,当对方关闭,一执行recv()或read(),马上回返回-1,此时全局变量errno的值是115,相应的sys_errlist[errno]  为"Connect refused"(请参考/usr/include/sys/errno.h)。所以,在上  篇的for(;;)...select()程序块中,当有东西可读时,一定要检查recv()或 read()的返回值,返回-1时要作出关断本地Socket的处理,否则select()会 一直认为有东西读,其结果曾几令cpu伤心欲断针脚。不信你可以试试:不检查recv()返回结果,且将收到的东东(实际没收到)写至标准输出... 
在有名管道的编程中也有类似问题出现。具体处理详见拙作:发布一个有用 的Socket客户方原码。 至于主动写Socket时对方突然关闭的处理则可以简单地捕捉信号SIGPIPE并作 
出相应关断本地Socket等等的处理。SIGPIPE的解释是:写入无读者方的管道。 
在此不作赘述,请详man signal。 
以上是cpu在作tcp/ip数据传输实验积累的经验,若有错漏,请狂炮击之。 
唉,昨天在hacker区被一帮孙子轰得差点儿没短路。ren cpu(奔腾的心) z80补充关于select在异步(非阻塞)connect中的应用,刚开始搞socket编程的时候 我一直都用阻塞式的connect,非阻塞connect的问题是由于当时搞proxy scan  而提出的呵呵 通过在网上与网友们的交流及查找相关FAQ,总算知道了怎么解决这一问题.同样 
用select可以很好地解决这一问题.大致过程是这样的: 
1.将打开的socket设为非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完 
成(有的系统用FNEDLAY也可). 
2.发connect调用,这时返回-1,但是errno被设为EINPROGRESS,意即connect仍旧 
在进行还没有完成. 
3.将打开的socket设进被监视的可写(注意不是可读)文件集合用select进行监视, 如果可写,用 getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int)); 
来得到error的值,如果为零,则connect成功. 
在许多unix版本的proxyscan程序你都可以看到类似的过程,另外在solaris精华 区->编程技巧中有一个通用的带超时参数的connect模块. 
http://zzqiang85.spaces.live.com/blog/cns!6DC38B2DBCCC2AF8!430.entry
      
                socket之select函数
Select在Socket编程中还是比较重要的,它能够监视我们需要监视的文件描述符的变化情况——读写或是异常。
    Select的函数格式(Unix系统下的伯克利socket编程,和windows下的略有区别,体现两个方面:一是select函数的第一个参数,在windows下可以忽略,但在linux下必须设为最大文件描述符加1;二是结构fd_set在两个系统里定义不一样):
int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);
先说明两个结构体:
第一,struct fd_set可以理解为一个集合,这个集合中存放的是文件描述符(file descriptor),即文件句柄,这可以是我们所说的普通意义的文件,当然Unix下任何设备、管道、FIFO等都是文件形式,全部包括在内,所以毫无疑问一个socket就是一个文件,socket句柄就是一个文件描述符。fd_set集合可以通过一些宏由人为来操作,比如清空集合 FD_ZERO(fd_set *),将一个给定的文件描述符加入集合之中FD_SET(int ,fd_set *),将一个给定的文件描述符从集合中删除FD_CLR(int ,fd_set*),检查集合中指定的文件描述符是否可以读写FD_ISSET(int ,fd_set* )。一会儿举例说明。
第二,struct timeval是一个大家常用的结构,用来代表时间值,有两个成员,一个是秒数,另一个是毫秒数。
具体解释select的参数:
int maxfdp是一个整数值,是指集合中所有文件描述符的范围,即所有文件描述符的最大值加1,不能错!在Windows中这个参数的值无所谓,可以设置不正确。
fd_set *readfds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的读变化的,即我们关心是否可以从这些文件中读取数据了,如果这个集合中有一个文件可读,select就会返回一个大于0的值,表示有文件可读,如果没有可读的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的读变化。
fd_set *writefds是指向fd_set结构的指针,这个集合中应该包括文件描述符,我们是要监视这些文件描述符的写变化的,即我们关心是否可以向这些文件中写入数据了,如果这个集合中有一个文件可写,select就会返回一个大于0的值,表示有文件可写,如果没有可写的文件,则根据timeout参数再判断是否超时,若超出timeout的时间,select返回0,若发生错误返回负值。可以传入NULL值,表示不关心任何文件的写变化。
fd_set *errorfds同上面两个参数的意图,用来监视文件错误异常。
struct timeval* timeout是select的超时时间,这个参数至关重要,它可以使select处于三种状态,第一,若将NULL以形参传入,即不传入时间结构,就是将select置于阻塞状态,一定等到监视文件描述符集合中某个文件描述符发生变化为止;第二,若将时间值设为0秒0毫秒,就变成一个纯粹的非阻塞函数,不管文件描述符是否有变化,都立刻返回继续执行,文件无变化返回0,有变化返回一个正值;第三,timeout的值大于0,这就是等待的超时时间,即 select在timeout时间内阻塞,超时时间之内有事件到来就返回了,否则在超时后不管怎样一定返回,返回值同上述。
返回值:
负值:select错误 正值:某些文件可读写或出错 0:等待超时,没有可读写或错误的文件
在有了select后可以写出像样的网络程序来!举个简单的例子,就是从网络上接受数据写入一个文件中。
     #include <winsock.h>
     #include <stdio.h>
     #define PORT       5150
     #define MSGSIZE     1024
     #pragma comment(lib, "ws2_32.lib")
     int     g_iTotalConn = 0;
     SOCKET g_CliSocketArr[FD_SETSIZE];
     DWORD WINAPI WorkerThread(LPVOID lpParameter);
     int main()
     {  
         WSADATA     wsaData;  
         SOCKET       sListen, sClient;  
         SOCKADDR_IN local, client;  
         int         iaddrSize = sizeof(SOCKADDR_IN);  
         DWORD       dwThreadId;  
         // Initialize Windows socket library  
         WSAStartup(0x0202, &wsaData);  
         // Create listening socket  
         sListen = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);  
         // Bind          
         local.sin_addr.S_un.S_addr = htonl(INADDR_ANY);
         local.sin_family = AF_INET;
         local.sin_port = htons(PORT);  
         bind(sListen, (struct sockaddr *)&local, sizeof(SOCKADDR_IN));  
         // Listen   listen(sListen, 3);  
         // Create worker thread  
         CreateThread(NULL, 0, WorkerThread, NULL, 0, &dwThreadId);    
         while (TRUE)  
         {               // Accept a connection    
             sClient = accept(sListen, (struct sockaddr *)&client, &iaddrSize);    
             printf("Accepted client:%s:%d\n", inet_ntoa(client.sin_addr), ntohs(client.sin_port));    
             // Add socket to g_CliSocketArr    
             g_CliSocketArr[g_iTotalConn++] = sClient;  
         }    
         return 0;
     }
     DWORD WINAPI WorkerThread(LPVOID lpParam)
     {  
         int             i;  
         fd_set         fdread;  
         int             ret;  
         struct timeval tv = {1, 0};  
         char           szMessage[MSGSIZE];    
         while (TRUE)  
         {    
             FD_ZERO(&fdread);    
             for (i = 0; i < g_iTotalConn; i++)
             {
                 FD_SET(g_CliSocketArr, &fdread);
             }                     // We only care read event
             ret = select(0, &fdread, NULL, NULL, &tv);
             if (ret == 0)
             {       // Time expired
                 continue;
             }
             for (i = 0; i < g_iTotalConn; i++)
             {
                 if (FD_ISSET(g_CliSocketArr, &fdread))
                   {         // A read event happened on g_CliSocketArr
                       ret = recv(g_CliSocketArr, szMessage, MSGSIZE, 0);
                       if (ret == 0 || (ret == SOCKET_ERROR && WSAGetLastError() == WSAECONNRESET))
                         {
                             // Client socket closed          
                             printf("Client socket %d closed.\n", g_CliSocketArr);
                             closesocket(g_CliSocketArr);
                             if (i < g_iTotalConn - 1)
                             {
                                 g_CliSocketArr[i--] = g_CliSocketArr[--g_iTotalConn];
                             }
                         }
                         else
                         {
                               // We received a message from client
                               szMessage[ret] = '\0';
                               send(g_CliSocketArr, szMessage, strlen(szMessage), 0);
                         }
                   } //if
             }//for
         }//while    
         return 0;
     }
     服务器的几个主要动作如下:
     1.创建监听套接字,绑定,监听;
     2.创建工作者线程;
     3.创建一个套接字数组,用来存放当前所有活动的客户端套接字,每accept一个连接就更新一次数组;
     4.接受客户端的连接。
     这里有一点需要注意的,就是我没有重新定义FD_SETSIZE宏,所以服务器最多支持的并发连接数为64。而且,这里决不能无条件的ccept,服务器应该根据当前的连接数来决定
是否接受来自某个客户端的连接。一种比较好的实现方案就是采用WSAAccept函数,而且让WSAAccept回调自己实现的Condition Function。
     如下所示:
     int CALLBACK ConditionFunc(LPWSABUF lpCallerId,LPWSABUF lpCallerData, LPQOS lpSQOS,LPQOS lpGQOS,LPWSABUF lpCalleeId, LPWSABUF lpCalleeData,GROUP FAR *
g,DWORD dwCallbackData)
     {
         if (当前连接数 < FD_SETSIZE)
             return CF_ACCEPT;
         else  
             return CF_REJECT;
     }
     工作者线程里面是一个死循环,一次循环完成的动作是:
     1.将当前所有的客户端套接字加入到读集fdread中;
     2.调用select函数;
     3.查看某个套接字是否仍然处于读集中,如果是,则接收数据。如果接收的数据长度为0,或者发生WSAECONNRESET错误,则表示客户端套接字主动关闭,这时需要将服务器中
对应的套接字所绑定的资源释放掉,然后调整我们的套接字数组(将数组中最后一个套接字挪到当前的位置上)。
     除了需要有条件接受客户端的连接外,还需要在连接数为0的情形下做特殊处理,因为如果读集中没有任何套接字,select函数会立刻返回,这将导致工作者线程成为一个毫无
停顿的死循环,CPU的占用率马上达到100%。
     关系到套接字列表的操作都需要使用循环,在轮询的时候,需要遍历一次,再新的一轮开始时,将列表加入队列又需要遍历一次.也就是说,Select在工作一次时,需要至少遍历2次
列表,这是它效率较低的原因之一.
     在大规模的网络连接方面,还是推荐使用IOCP或EPOLL模型.但是Select模型可以使用在诸如对战类游戏上,比如类似星际这种,因为它小巧易于实现,且对战类游戏的网络连接量
并不大. 对于Select模型想要突破Windows 64个限制的话,可以采取分段轮询,一次轮询64个.例如套接字列表为128个,在第一次轮询时,将前64个放入队列中用Select进行状态查询,
待本次操作全部结束后.将后64个再加入轮询队列中进行轮询处理.这样处理需要在非阻塞式下工作.以此类推,Select也能支持无限多个.
http://hi.baidu.com/bestseraph/blog/item/1d5ce94e8dc0c100b3de05ce.html
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics