lwip---（六）ARP表

ARP，全称Address Resolution Protocol，译作地址解析协议，是位于TCP/IP协议栈底层的协议。任何网络的通信都是基于底层硬件链路的，底层的数据链路有着自己的一套寻址机制，在以太网中，往往是通过一个48位的MAC地址来标示不同的网络通信设备的。而 TCP/IP协议的上层是使用IP地址作为各个主机间通信寻址机制的。当源主机上层要向目标主机发送数据时，它只知道目标主机的IP地址，此时，源主机需要将该IP地址转换为目的主机对应的MAC地址，这样才能在数据链路上选择正确的通道将数据传送出去，这就是ARP的作用。

协议里面的一段描述可能更明了：在ARP背后有一个基本概念，那就是每个网络接口有一个硬件地址（一个 48 bit的值，标识不同的以太网或令牌环网络接口），在硬件层次上进行的数据帧交换必须有正确的硬件接口地址。但是，TCP/IP有自己的地址：32bit的IP地址。知道主机的IP地址并不能让内核发送一帧数据给主机。内核（如以太网驱动程序）必须知道目的端的硬件地址才能发送数据。ARP的功能是在32 bit的I P地址和采用不同网络技术的硬件地址之间提供动态映射。ARP协议的基本功能就是通过目标设备的IP地址，查询目标设备的MAC地址，以保证通信的进行。

ARP协议实现的核心是ARP缓存表，ARP的实质就是对缓存表的建立、更新、查询等操作。ARP缓存表是由一个个的**缓存表项（entry）**组成的，LWIP中描述缓存表项的数据结构叫etharp_entry，上源代码：

struct etharp_entry {
   
   
#if ARP_QUEUEING
	struct etharp_q_entry *q;     // 数据包缓冲队列指针

#endif
	struct ip_addr ipaddr;        // 目标IP地址
	struct eth_addr ethaddr;      //  MAC地址
	enum etharp_state state;      // 描述该entry的状态
	u8_t ctime;                   // 描述该entry的时间信息
	struct netif *netif;          // 相应网络接口信息
};

ARP_QUEUEING是编译选项，表示是否允许缓存表项有数据包缓冲队列，在opt.h里面设置。为什么要用数据包缓冲队列指针，随后慢慢道来。ipaddr和ethaddr字段就是分别用于存储IP地址和MAC地址的，它们是ARP缓存表项的核心部分了。state是个枚举类型，它表示该缓存表项的状态，一个表项有三个可能的状态，我们用枚举型etharp_state进行描述。

enum etharp_state {
   
   
	ETHARP_STATE_EMPTY = 0,
	ETHARP_STATE_PENDING,
	ETHARP_STATE_STABLE
};

LWIP内核通过数组的方式来创建ARP缓存表，如下，

static struct etharp_entry arp_table[ARP_TABLE_SIZE];

初始化缓存表中的各个缓存表项都处于初始状态，没有记录任何信息，此时每个表项都处于ETHARP_STATE_EMPTY状态，ETHARP_STATE_PENDING状态表示该表项处于不稳定状态，很可能的情况是，该表项只记录到了IP地址，但是还未记录到对应该IP地址的MAC地址，此时就该表项就处于ETHARP_STATE_PENDING状态。在该状态下，LWIP内核会发出一个广播ARP请求到数据链路上，以让对应IP地址的主机回应其MAC地址，当源主机接收到MAC地址时，它就更新对应的ARP表项。当ARP表项得到更新后，它就完全记录了一对IP地址和MAC地址，此时该表项就处于ETHARP_STATE_STABLE状态。注意当某表项处在PENDING状态时，要发往该表项中IP地址处的数据包会被连接在表项对应的数据包缓冲队列上，当等到该表项稳定后，这些数据包才会被发送出去。这就是为什么每个表项需要有数据包缓冲队列指针了。

ctime字段记录表项处于某个状态的时间，当某表项的ctime值大于规定的表项最大生存值时，该表项会被内核删除。在第一讲中，我们就说到了关于LWIP的超时事件，要使用ARP功能，就必须设置一个ARP超时事件，该超时事件的基本功能就是对每个表项的ctime字段值加1，然后删除那些生存时间大于最大生存值的表项。

好了，下面讲讲能够正确建立ARP缓存的基础：ARP数据包。要在源主机上建立关于目标主机的IP地址与MAC地址对应表项，则源主机和目的主机间的基本信息交互是必须的，简单的说就是，源主机如何告诉目的主机：我需要你的MAC地址；而目的主机如何回复：这就是我的MAC地址。ARP数据包，这就派上用场了。

ARP数据包可以分为ARP请求数据包和ARP应答数据包，ARP数据包到达底层链路时会被加上以太网数据包头发送出去，最终呈现在链路上的数据报头格式如下图，

以太网包头中的前两个字段是以太网的目的MAC地址和源MAC地址，在前面一章已经有讲解。目的地址为全 1的特殊地址是广播地址。在ARP表项建立前，源主机只知道目的主机的IP地址，并不知道其MAC地址，所以在数据链路上，源主机只有通过广播的方式将ARP请求数据包发送出去。电缆上的所有以太网接口都要接收广播的数据包，并检测数据包是否是发给自己的，这点通过对照目的IP地址来实现，如果是发给自己的，目的主机需要回复一个ARP应答数据包给源主机，以告诉源主机自己的MAC地址。

两个字节长的以太网帧类型表示后面数据的类型。对于ARP请求或应答数据包来说，该字段的值为0x0806，对于IP数据包来说，该字段的值为0x0800。

以太网数据报头说完，来说ARP数据报头。

硬件类型字段表示硬件地址的类型，它的值为 1即表示以太网MAC地址，长度为6个字节。协议类型字段表示要映射的协议地址类型。它的值为0x0800即表示要映射为IP地址。它的值与包含IP数据报的以太网数据帧头中的类型字段的值相同。

接下来的两个1字节的字段，硬件地址长度和协议地址长度分别指出硬件地址和协议地址的长度，以字节为单位。对于以太网上A R P请求或应答来说，它们的值分别为6和4。

操作字段op指出四种操作类型，它们是 A R P请求（值为1）、A R P应答（值为2）、R A R P请求（值为3）和R A R P应答（值为4），这里我们只关心前两个类型。这个字段必需的，因为A R P请求和A R P应答的帧类型字段值是相同的。

接下来的四个字段是发送端的以太网MAC地址、发送端的I P地址、目的端的以太网MAC地址和目的端的I P地址。

注意，这里有一些重复信息：在以太网的数据帧报头中和A R P请求数据帧中都有发送端的以太网MAC地址。对于一个ARP请求来说，除目的端MAC地址外的所有其他的字段都有填充值。当目的主机收到一份给自己的ARP请求报文后，它就把自己的硬件地址填进去，然后将该请求数据包的源主机信息和目的主机信息交换位置，并把操作字段op置为2，最后把该新构建的数据包发送回去，这就是ARP响应。

最后，用源码来看看LWIP是如何描述上面的这个数据报头的：

struct etharp_hdr {
   
   
	PACK_STRUCT_FIELD(struct eth_hdr ethhdr);    // 14字节的以太网数据报头
	PACK_STRUCT_FIELD(u16_t hwtype);             // 2字节的硬件类型
	PACK_STRUCT_FIELD(u16_t proto);              // 2字节的协议类型
	PACK_STRUCT_FIELD(u16_t _hwlen_protolen);    // 两个1字节的长度字段
	PACK_STRUCT_FIELD(u16_t opcode);             // 2字节的操作字段op
	PACK_STRUCT_FIELD(struct eth_addr shwaddr);  // 6字节源MAC地址
	PACK_STRUCT_FIELD(struct ip_addr2 sipaddr);  // 4字节源IP地址
	PACK_STRUCT_FIELD(struct eth_addr dhwaddr);  // 6字节目的MAC地址
	PACK_STRUCT_FIELD(struct ip_addr2 dipaddr);  // 4字节目的IP地址
} PACK_STRUCT_STRUCT;

和前面的各个描述完全相符。PACK_STRUCT_FIELD()是防止编译器字对齐的宏定义。

lwip---（六）ARP表

诈骗（杀猪盘）网站进行渗透测试

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

外行也能读懂的网络硬件设备功能原理速成

硬核觀察 | 極客用了 55 小時 B 站直播復刻爆火的 Clubhouse

linux發郵件方法

BGP（3）--路由策略

在 Ubuntu Linux 上安裝 Deb 文件的 3 種方法

如何使用java實現Open Addressing

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結