epoll实现机制分析:
epoll是Linux特有的I/O复用函数。它在实现和使用上与select和poll有很大的差异。首先,epoll使用一组函数来完成任务,而不是单个的函数。其次,epoll把用户关心的文件描述符上的事件放在内核的一个时间表中,从而无需像select和epoll那样每次调用都要重复传入文件描述符和集或事件集。但epoll需要使用一个额外的文件描述符,来唯一标识内核中的这个事件表。而这个文件描述符使用epoll_create函数来创建。
size参数现在并不起作用,只是给内核一个提示。告诉它时间表需要多大。该函数返回的文件描述符将用作其他所有epoll系统调用的第一个参数,以指定要访问的内核事件表。
实质:epoll_create函数的返回值为epfd,每个epfd在内核中有一个对应的eventpoll结构体对象。其中关键的成员是一个就绪队列和一颗红黑树。一个fd被添加到epoll中之后,系统就会为它生成一个对应的epitem结构对象。epitem被添加到eventpoll的红黑树中。红黑树的作用是使用者调用EPOLL_CTL_MOD、EPOLL_CTL_ADD或EPOLL_CTL_DEL的时候可以迅速找到对应的就绪事件。
epoll_ctl:
epfd参数是要操作的文件描述符,op参数则指定操作类型。event参数指定事件,它是epoll_event结构体指针类型。epoll_event的定义如下:
epoll_event中的events成员描述事件类型。epoll支持的事件类型和poll基本相同。data成员用于存储用户数据。
epoll_data是一个联合体,其4个成员中使用最多的是fd和ptr。但他们不能同时使用。epoll_ctl成功时返回0,失败时返回-1并设置errno。
epitem重新添加到readylist(就绪队列)必须满足下列条件。
1.epitem上有用户关注的事件触发。
2.epitem被设置为水平触发模式(如果一个epitem被设置为边界触发则这个epitem不会被重新添加到readylist中)
epoll_wait:
epoll_wait是epoll系列系统调用的主要接口,它在一段超时时间内等待一组文件描述符上的事件。
该函数成功时返回就绪的文件描述符的个数,失败时返回-1并设置errno。
原理:
epoll_wait函数如果检测到时间,就将所有就绪的事件从内核事件表(由epfd参数指定)中复制到它的第二个参数events指向的数组中。这个数组只用于输出epoll_wait检测到的就绪事件,不想select和poll的参数是输入输出型参数,这样就极大提高了应用程序索引就绪文件描述符的效率。
代码实现:
/*************************************************************************
> File Name: epoll_server.c
> Author: ZX
> Mail: [email protected]
> Created Time: Sat 18 Mar 2017 10:21:03 PM PDT
************************************************************************/
#include<stdio.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<assert.h>
#include<unistd.h>
#include<sys/epoll.h>
#include<stdlib.h>
#include<string.h>
#define _SIZE_ 1024
typedef struct epbuf
{
int fd;
char buf[_SIZE_];
}epbuf_t,*epbuf_p,**epbuf_pp;
static epbuf_p alloc_epbuf(int fd)
{
epbuf_p ptr = (epbuf_p)malloc(sizeof(epbuf_t));
if(ptr == NULL)
{
perror("malloc");
exit(6);
}
ptr->fd = fd;
printf("ptr->fd:%d\n",fd);
return ptr;
}
static void delete_epbuf(epbuf_p ptr)
{
if(ptr != NULL)
{
free(ptr);
}
ptr = NULL;
}
int startup(const char* _ip, int _port)
{
assert(_ip);
int sock = socket(AF_INET, SOCK_STREAM, 0);
if(sock < 0)
{
perror("sock");
exit(1);
}
int opt = 1;
setsockopt(sock, SOL_SOCKET,SO_REUSEADDR, &opt, sizeof(opt));
struct sockaddr_in local;
local.sin_family = AF_INET;
local.sin_addr.s_addr = inet_addr(_ip);
local.sin_port = htons(_port);
socklen_t len = sizeof(local);
if(bind(sock, (struct sockaddr*)&local, len) < 0)
{
perror("bind");
exit(2);
}
if(listen(sock, 5) < 0)
{
perror("listen");
exit(3);
}
return sock;
}
int main(int argc, char* argv[])
{
if(argc != 3)
{
printf("Usage: %s [local_ip] [local_port]",argv[0]);
return 4;
}
int epfd = epoll_create(256);
if(epfd < 0)
{
perror("epoll_create");
return 5;
}
int listen_sock = startup(argv[1], atoi(argv[2]));
struct epoll_event _ev;
_ev.events = EPOLLIN;
_ev.data.ptr = alloc_epbuf(listen_sock);
// _ev.data.fd = listen_sock;
epoll_ctl(epfd, EPOLL_CTL_ADD, listen_sock, &_ev);
struct epoll_event _evs[32];
int max = 32;
int timeout = 2000;
int nums = 0;
while(1)
{
switch(nums = epoll_wait(epfd, _evs, max, timeout))
{
case 0:
printf("timeout...\n");
break;
case -1:
perror("epoll_wait");
break;
default:
{
printf("nums: %d\n",nums);
int i = 0;
for(; i<nums; i++){
sleep(1);
int fd = ((epbuf_p)(_evs[i].data.ptr))->fd;
printf("after fd: %d\n",fd);
if(fd == listen_sock && (_evs[i].events & EPOLLIN)){
struct sockaddr_in peer;
socklen_t len = sizeof(peer);
int new_sock = accept(listen_sock, (struct sockaddr*)&peer, &len);
printf("after accept,new_sock:%d\n",new_sock);
if(new_sock < 0){
perror("accept");
continue;
}
else if(new_sock > 0){
printf("get a new client# port %d\n",ntohs(peer.sin_port));
_ev.events = EPOLLIN;
//_ev.data.fd = new_sock;
_ev.data.ptr = alloc_epbuf(new_sock);
epoll_ctl(epfd, EPOLL_CTL_ADD, new_sock, &_ev);
}
}//if
else if(fd != listen_sock && (_evs[i].events & EPOLLIN))
{
char* buf = ((epbuf_p)(_evs[i].data.ptr))->buf;
printf("read fd: %d\n",fd);
ssize_t _s = read(fd, buf, _SIZE_-1);
if(_s > 0){
//succeed, change file descriptor
buf[_s] = 0;
printf("%s\n", buf);
_ev.events = EPOLLOUT;
epoll_ctl(epfd, EPOLL_CTL_MOD, fd, &_ev);
}
else if(_s == 0){
printf("client is quit!\n");
delete_epbuf(_evs[i].data.ptr);
_evs[i].data.ptr = NULL;
epoll_ctl(epfd, EPOLL_CTL_DEL, fd, NULL);
close(fd);
}
else{
perror("read");
continue;
}
}//else if read file descriptor
else if(fd != listen_sock && (_evs[i].events & EPOLLOUT))
{
printf("write:\n");
const char* msg = "HTTP/1.0 200 OK \r\n\r\n<html><h1>HELLO WORLD!</h1></html>\n";
write(fd, msg, strlen(msg));
delete_epbuf(_evs[i].data.ptr);
_evs[i].data.ptr = NULL;
epoll_ctl(epfd, EPOLL_CTL_DEL, fd, NULL);
close(fd);
}//else if write file descriptor
}//for
}
break;
}//switch
}//while
return 0;
}