lwip---(六)ARP表

  ARP,全称Address Resolution Protocol,译作地址解析协议,是位于TCP/IP协议栈底层的协议任何网络的通信都是基于底层硬件链路的,底层的数据链路有着自己的一套寻址机制,在以太网中,往往是通过一个48位的MAC地址来标示不同的网络通信设备的TCP/IP协议的上层是使用IP地址作为各个主机间通信寻址机制的。当源主机上层要向目标主机发送数据时,它只知道目标主机的IP地址,此时,源主机需要将该IP地址转换为目的主机对应的MAC地址,这样才能在数据链路上选择正确的通道将数据传送出去,这就是ARP的作用。

  协议里面的一段描述可能更明了:在ARP背后有一个基本概念,那就是每个网络接口有一个硬件地址(一个 48 bit的值,标识不同的以太网或令牌环网络接口),在硬件层次上进行的数据帧交换必须有正确的硬件接口地址。但是,TCP/IP有自己的地址:32bit的IP地址。知道主机的IP地址并不能让内核发送一帧数据给主机。内核(如以太网驱动程序)必须知道目的端的硬件地址才能发送数据。ARP的功能是在32 bit的I P地址和采用不同网络技术的硬件地址之间提供动态映射ARP协议基本功能就是通过目标设备的IP地址,查询目标设备的MAC地址,以保证通信的进行

  ARP协议实现的核心是ARP缓存表ARP的实质就是对缓存表的建立、更新、查询等操作。ARP缓存表是由一个个的**缓存表项(entry)**组成的,LWIP中描述缓存表项的数据结构叫etharp_entry,上源代码:

struct etharp_entry {
   
   
#if ARP_QUEUEING
	struct etharp_q_entry *q;     // 数据包缓冲队列指针

#endif
	struct ip_addr ipaddr;        // 目标IP地址
	struct eth_addr ethaddr;      //  MAC地址
	enum etharp_state state;      // 描述该entry的状态
	u8_t ctime;                   // 描述该entry的时间信息
	struct netif *netif;          // 相应网络接口信息
};

  ARP_QUEUEING编译选项表示是否允许缓存表项有数据包缓冲队列,在opt.h里面设置。为什么要用数据包缓冲队列指针,随后慢慢道来。ipaddrethaddr字段就是分别用于存储IP地址MAC地址的,它们是ARP缓存表项的核心部分了。state是个枚举类型,它表示该缓存表项的状态,一个表项有三个可能的状态,我们用枚举型etharp_state进行描述。

enum etharp_state {
   
   
	ETHARP_STATE_EMPTY = 0,
	ETHARP_STATE_PENDING,
	ETHARP_STATE_STABLE
};

  LWIP内核通过数组的方式来创建ARP缓存表,如下,

static struct etharp_entry arp_table[ARP_TABLE_SIZE];

  初始化缓存表中的各个缓存表项都处于初始状态,没有记录任何信息,此时每个表项都处于ETHARP_STATE_EMPTY状态,ETHARP_STATE_PENDING状态表示该表项处于不稳定状态,很可能的情况是,该表项只记录到了IP地址,但是还未记录到对应该IP地址MAC地址,此时就该表项就处于ETHARP_STATE_PENDING状态。在该状态下,LWIP内核会发出一个广播ARP请求到数据链路上,以让对应IP地址的主机回应其MAC地址,当源主机接收到MAC地址时,它就更新对应的ARP表项。当ARP表项得到更新后,它就完全记录了一对IP地址和MAC地址,此时该表项就处于ETHARP_STATE_STABLE状态。注意当某表项处在PENDING状态时,要发往该表项中IP地址处的数据包会被连接在表项对应的数据包缓冲队列上,当等到该表项稳定后,这些数据包才会被发送出去。这就是为什么每个表项需要有数据包缓冲队列指针了。

  ctime字段记录表项处于某个状态的时间当某表项的ctime值大于规定的表项最大生存值时,该表项会被内核删除。在第一讲中,我们就说到了关于LWIP的超时事件,要使用ARP功能,就必须设置一个ARP超时事件,该超时事件的基本功能就是对每个表项的ctime字段值加1,然后删除那些生存时间大于最大生存值的表项

  好了,下面讲讲能够正确建立ARP缓存的基础:ARP数据包。要在源主机上建立关于目标主机的IP地址与MAC地址对应表项,则源主机和目的主机间的基本信息交互是必须的,简单的说就是,源主机如何告诉目的主机:我需要你的MAC地址;而目的主机如何回复:这就是我的MAC地址。ARP数据包,这就派上用场了。

  ARP数据包可以分为ARP请求数据包ARP应答数据包ARP数据包到达底层链路时会被加上以太网数据包头发送出去,最终呈现在链路上的数据报头格式如下图,

《LwIP协议栈源码详解——TCP/IP协议的实现》ARP表

  以太网包头中的前两个字段是以太网的目的MAC地址源MAC地址,在前面一章已经有讲解。目的地址为全 1的特殊地址是广播地址。在ARP表项建立前,源主机只知道目的主机的IP地址,并不知道其MAC地址,所以在数据链路上,源主机只有通过广播的方式将ARP请求数据包发送出去。电缆上的所有以太网接口都要接收广播的数据包,并检测数据包是否是发给自己的,这点通过对照目的IP地址来实现,如果是发给自己的,目的主机需要回复一个ARP应答数据包给源主机,以告诉源主机自己的MAC地址

  两个字节长的以太网帧类型表示后面数据的类型。对于ARP请求或应答数据包来说该字段的值为0x0806对于IP数据包来说,该字段的值为0x0800

  以太网数据报头说完,来说ARP数据报头。

  硬件类型字段表示硬件地址的类型,它的值为 1即表示以太网MAC地址,长度为6个字节。协议类型字段表示要映射的协议地址类型。它的值为0x0800即表示要映射为IP地址。它的值与包含IP数据报的以太网数据帧头中的类型字段的值相同。

  接下来的两个1字节的字段硬件地址长度协议地址长度分别指出硬件地址和协议地址的长度,以字节为单位。对于以太网上A R P请求或应答来说,它们的值分别为64

  操作字段op指出四种操作类型,它们是 A R P请求(值为1)、A R P应答(值为2)、R A R P请求(值为3)和R A R P应答(值为4,这里我们只关心前两个类型。这个字段必需的,因为A R P请求和A R P应答的帧类型字段值是相同的。

  接下来的四个字段发送端的以太网MAC地址、发送端的I P地址、目的端的以太网MAC地址和目的端的I P地址。

  注意,这里有一些重复信息:在以太网的数据帧报头中和A R P请求数据帧中都有发送端的以太网MAC地址。对于一个ARP请求来说,除目的端MAC地址外的所有其他的字段都有填充值。当目的主机收到一份给自己的ARP请求报文后,它就把自己的硬件地址填进去,然后将该请求数据包的源主机信息和目的主机信息交换位置,并把操作字段op置为2,最后把该新构建的数据包发送回去,这就是ARP响应

  最后,用源码来看看LWIP是如何描述上面的这个数据报头的:

struct etharp_hdr {
   
   
	PACK_STRUCT_FIELD(struct eth_hdr ethhdr);    // 14字节的以太网数据报头
	PACK_STRUCT_FIELD(u16_t hwtype);             // 2字节的硬件类型
	PACK_STRUCT_FIELD(u16_t proto);              // 2字节的协议类型
	PACK_STRUCT_FIELD(u16_t _hwlen_protolen);    // 两个1字节的长度字段
	PACK_STRUCT_FIELD(u16_t opcode);             // 2字节的操作字段op
	PACK_STRUCT_FIELD(struct eth_addr shwaddr);  // 6字节源MAC地址
	PACK_STRUCT_FIELD(struct ip_addr2 sipaddr);  // 4字节源IP地址
	PACK_STRUCT_FIELD(struct eth_addr dhwaddr);  // 6字节目的MAC地址
	PACK_STRUCT_FIELD(struct ip_addr2 dipaddr);  // 4字节目的IP地址
} PACK_STRUCT_STRUCT;

  和前面的各个描述完全相符。PACK_STRUCT_FIELD()防止编译器字对齐的宏定义

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章