Linux ARP协议源码解析Word文档下载推荐.docx
- 文档编号:16936550
- 上传时间:2022-11-27
- 格式:DOCX
- 页数:11
- 大小:26.46KB
Linux ARP协议源码解析Word文档下载推荐.docx
《Linux ARP协议源码解析Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《Linux ARP协议源码解析Word文档下载推荐.docx(11页珍藏版)》请在冰豆网上搜索。
gc_timer。
这是一个常规垃圾回收的定时器,其定时处理函数是neigh_periodic_timer。
该定时器超时后,处理函数处理hash_buckets表中的一项,下次超时后,再处理下一项,这里的垃圾回收比强制垃圾回收条件要宽松得多,如果邻居的状态为NUD_PERMANENT或
NUD_IN_TIMER(该邻居正在解析中),则不能回收。
当邻居的引用计数为1时,并且邻居状态为NUD_FAILED(解析失败)或者该邻居距最近一次被使用时间已超过参数表中gc_staletime的值(缺省为60秒),则可以作为垃圾回收。
回收完毕后,要设置下一次进行回收的时间(gc_timer的超时时间),下次回收时间为参数表中base_reachable_time的值(缺省设为30秒)的一半,再除以hash_buckets哈希表中的项数。
也就是,基本上15秒左右会把整个arp_tbl缓存表进行一次垃圾回收。
proxy_timer,proxy_queue,proxy_redo。
proxy_timer是一个关于代理ARP的定时器,proxy_queue是一个待处理的代理ARP数据包的队列,每次定时器超时,处理函数neigh_proxy_process依次检查队列中每一个代理ARP数据包(structsk_buff),对于超时,且满足相关条件的,调用proxy_redo进行处理。
有关代理ARP,将专门分析讲述,这里暂时略过。
constructor。
这是一个邻居的初始化函数指针,每次创建出一个邻居后,需要马上调用这
个函数对新创建的邻居进行一些初始化操作。
邻居创建完,已经被赋于一个IP地址(邻居结构体的primary_key成员),该函数首先根据这个IP地址来确定其地址类型,然后为邻居选择相应的操作函数集(初始化邻居结构体的一些成员,在讲到邻居结构体内容时再进行分析)。
pconstructor,pdestructor。
这是代理ARP的邻居的构建和析构函数指针,在IPv4模块中,未提供这两个函数,所以它们的指针值为空。
parms。
这是一个结构体structneigh_parms的链表,系统中每个网络设备接口对应链表中一个节点,表示该设备接口上的邻居的一些传输参数。
同时,链表中还有一个缺省的项。
last_rand,hash_rand
这两个成员其实没有联系,hash_rand是用于邻居哈希表hash_buckets的一个随机数,last_rand用于记录一个时间,即上次为parms链表中每个节点生成reachable_time的时间,reachable_time是需要被定时刷新的。
stats。
记录arp_tbl被操作次数的一些统计数据。
结构体structneigh_table是一个哈希表,用于描述物理上互相连接的机器的信息。
ARP缓存myarp_tbl就是这样的一个结构。
在分析ARP相关的初始化之前,我们先来看一下这个结构体:
tructneigh_table
{
structneigh_table*next;
intfamily;
intentry_size;
intkey_len;
__u32(*hash)(constvoid*pkey,
conststructnet_device*);
int(*constructor)(structneighbour*);
int(*pconstructor)(structpneigh_entry*);
void(*pdestructor)(structpneigh_entry*);
void(*proxy_redo)(structsk_buff*skb);
char*id;
structneigh_parmsparms;
/*HACK.gc_*shoulfollowparmswithoutagap!
*/
intgc_interval;
intgc_thresh1;
intgc_thresh2;
intgc_thresh3;
unsignedlonglast_flush;
structtimer_listgc_timer;
structtimer_listproxy_timer;
structsk_buff_headproxy_queue;
atomic_tentries;
rwlock_tlock;
unsignedlonglast_rand;
kmem_cache_t*kmem_cachep;
struct
neigh_statistics*stats;
structneighbour**hash_buckets;
unsignedint
hash_mask;
__u32hash_rnd;
unsignedinthash_chain_gc;
structpneigh_entry**phash_buckets;
#ifdefCONFIG_PROC_FS
structproc_dir_entry*pde;
#endif
};
entry_size是一个入口的长度,一个入口代表一个neighbour的信息,hash_buckets即为存放所有邻居的一个哈希数组,每一项对应一条neighbour链表。
struct
neighbour用于代表一个neighbour,包含了其信息,下面是其重要的一些成员:
dev代表与这个邻居相连的网络设备;
nud_state代表邻居的状态(未完成,无法访问,过时,失败);
ha表示邻居的mac地址;
hh是以太网包的
头部缓存;
arp_queue是等待这个邻居的硬件地址的IP包队列;
ops是对该neighbour节点操作的一套函数;
primary_key是哈希
表的主键,一般为IP地址。
key_len是哈希表主键的长度,一般IP地址长度为4。
几个函数分别为哈希函数,构造和析构函数。
parms是ARP缓存的一些参数,包括ARP包传输时间,重发时间,队列长度和代理队列长度等等。
ARP缓存有一个回收机制(garbage
collection),上面以gc_开头的参数用来设置回收的频率和阀值等等。
stats是一些关于邻居的统计信息。
ARP初始化的第一个步是初始化ARP缓存myarp_tbl,并把它加到全局链表neigh_tables的表头,其实,系统中所有的neigh_table都放在这个表中。
ptype_base
是一个有16项的哈希数组,每种协议包类型都注册在这个数组中。
arp包,其类型是ETH_P_ARP,其接收函数是
myarp_rcv。
有了这个注册信息,当设备上收到一个网络包(packet)的时候,会分配一个sk_buff(skb),将数据拷贝进这个缓冲区,
然后调用netif_rx把skb放入等待队列(input_pkt_queue)中,并且产生一个软中断。
当系统处理这个软中断的时候,会调用
net_rx_action,它根据网络包的类型,调用相应的接收函数来处理。
如果是ARP包,则调用myarp_rcv。
ARP缓存myarp_tbl是用于描述物理上相互连接的机器的信息的一个哈希表,关于这个缓存,我们前面作过分析。
现在我们来看看,当主机收到一个需要本地接收的ARP请求时,如何向ARP缓存中更新一个ARP信息。
当网络设备收到一个ARP数据包后,最终会调用到协议栈中的myarp_process处理函数,这个函数的处理会涉及到路由表的查询和更新。
但我们现在的my_inet模块还没有真正完成路由表的初始化,所以略过其中很多细节,只关注ARP缓存的更新与查询。
myarp_process通过调用__neigh_lookup函数更新ARP缓存,下面是该函数的定义:
staticinlinestructneighbour*__neigh_lookup(structneigh_table*tbl,
constvoid*pkey,
structnet_device*dev,
intcreat)
参数tbl是ARP缓存哈希表,传入全局变量myarp_tbl。
pkey是哈希主键,传入发送端ip地址,在我们的实验环境中,是通过
172.16.48.1向172.16.48.11发送icmp回显请求包来触发myarp_process的执行,所以,pkey就是ip地址
172.16.48.1。
dev是接收到该数据包的网络接口。
create表示在缓存中不存在该机器的信息时,是否需要创建一个,我们现在的目的是更新,所以选择是,传入1。
该函数首先调用neigh_lookup在ARP缓存中查找。
neigh_lookup首先通过pkey,dev计算得到一个哈希值hash_val,再找到myarp_tbl中的一个链表
myarp_tbl->
hash_buckets[hash_val],遍历该链表,如果能找到dev,
pkey都相等的项,就是我们所要找的structneighbour。
在这里,还要更新myarp_tbl的成员stats中的一统计数据。
显然,第一次收到ARP请求包,我们是找不到ARP缓存信息的,所以neigh_lookup返回NULL,__neigh_lookup判断
create值,如果不需要创建,就直接返回,如果需要,则调用neigh_create进行缓存信息的创建。
neigh_create首先在内存中分配一个struct
neighbour结构体。
myarp_tbl的成员entries记录了该ARP缓存中已经存在了多少条缓存信息,如果数量超过了gc_thresh3
(1024),或者数量超过了gc_thresh2(512),并且距离上次缓存刷新时间还不到5秒,则需要先强制进行缓存垃圾回收,对于一些未使用的缓
存信息进行清理。
如果清理后,缓存数量还是超过gc_thresh3,则无法再进行创建,出错返回。
对于新创建的neighbour,先给赋一些缺省值。
然后调用myarp_tbl的构造函数,对新创建的
neighbour进一步初始化。
具体的初始化步骤不再详述,我们可以从最后创建出来的neighbour的内容看到一些东西。
接下来,由于新增加了缓存项,需要对myarp_tbl的大小进行调整,如果有需要,需要扩大其容量。
最后,把新创建的neighbour添加到链表示,
新创建的neighbour的内容应该是这样子的:
structneighbour
structneighbour*next=原来的链表头;
structneigh_table*tbl=myarp_tbl;
structneigh_parms*parms=in_dev->
arp_parms;
structnet_device*dev=dev;
unsignedlongused=now;
unsignedlongconfirmed=now
-60秒;
unsignedlongupdated=now;
__u8flags;
__u8nud_state=NUD_NONE;
__u8type=RTN_LOCAL;
__u8dead=1;
atomic_tprobes;
unsignedcharha[(MAX_ADDR_LEN+sizeof(unsigned
long)-1)&
~(sizeof(unsignedlong)-1)];
//ha是mac地址,在后续的操作会给它赋上值。
structhh_cache*hh=NULL;
atomic_trefcnt=1;
int(*output)(structsk_buff
*skb)=this->
ops->
connected_output;
structsk_buff_headarp_queue;
structtimer_listtimer;
timer.function=neigh_timer_handler;
timer.data=this;
structneigh_ops*ops=&
myarp_hh_ops;
u8primary_key[0]=172.16.48.1(分配内存时,本身就加了4的);
在发送一个IP数据报时,当在确定数据报的输出路由时,需要为本次通讯绑定一个邻居,TCP/IP协议栈用结构体struct
neighbour表示一个邻居。
绑定邻居首先调用的函数是arp_bind_neighbour,该函数调用_neigh_lookup_errno函
数从ARP缓存表中以目的IP地址(网关IP或者同一子网内的对端IP地址)为哈希主键,寻找相应的邻居,如果找不到,则创建。
首先是调用neigh_lookup函数从arp_tbl的成员hash_buckets中寻找,如果找到的邻居的成员dev等于当前的网络设备接口,且primary_key等于当前的目的IP地址,则即为需要的邻居,返回即可。
如果找不到,则需要通过调用neigh_create函数创建一个新的邻居。
下面看一下表示邻居的结构体struct
neighbour的成员,以及创建时为这些成员初始化了什么样的值。
parms指向ARP缓存表arp_tbl的parms成员,包含了该邻居上的一些传输参数。
dev。
dev成员指向该邻居所在子网内的本机网络设备接口。
type。
该邻居的IP地址类型,这个值由FIB表根据邻居的IP地址来确定,比如类型RTN_UNICAST,RTN_LOCAL等。
ops,output。
ops是该邻居的一组操作函数集,包括输出函数output,直接输出函数dev_queue_xmit,错误报告函数
arp_error_report,arp解析函数solicit等。
根据type的不同,操作函数集略有不同,这在arp_tbl的
constructor函数中确定。
output即为ops中的普通输出函数output,因为其比较常用,所以单独为其设置一个成员。
timer。
这是邻居的定时器,用于解析ARP,其超时函数是neigh_timer_handler。
arp_queue
这是一个structsk_buff的队列,协议栈在发送一个IP数据包时,如果还未进行arp解析,则先把该IP数据包放入arp_queue,然后进行ARP解析。
下面重点看一下structneighbour的成员nud_state,它是邻居的当前状态,邻居在创建,解析的过程中,其状态经历了一系例的变迁过程。
当一个邻居刚刚被创建,其状态是NUD_NONE,此时,邻居被创建出来,并根据其IP地址被加入到arp_tbl的哈希表hash_buckets中,
但它还没有被解析,其成员ha(邻居的硬件地址)为空。
直到向这个邻居发送IP数据报,并且发送流程到达网络层的最后一个发送函数
ip_finish_output2时,调用邻居的output成员函数,一般这个函数是neigh_resolve_output(根据type的不同
会略有不同)。
它会先进行ARP解析,然后把IP数据报发往正确的邻居。
因为当前状态是
NUD_NONE,neigh_resolve_output首先判断parms的成员mcast_probes加上app_probes
的值,这两个参数表示ARP解析时尝试的次数,mcast_probes缺省值置为3,app_probes是0,如果它们的和为零,则不作ARP解析尝
试,直接将状态置为NUD_FAILED。
当前不为零,所以进行解析,首先置邻居的成员probes为parms的ucast_probes,缺省为3,
这样,该邻居等于是已经尝试了3次了,另外还只能多3次(mcast_probes),即该邻居的解析最多尝试3次,如果3次不成功,则失败,结束。
然后
将状态置为NUD_INCOMPLETE,表示正在解析中,并把待解析的socket缓冲skb放入arp_queue队列中,然后启动邻居的定时器开始
ARP解析。
定时器处理函数neigh_timer_handler首先确定下次的超时时间(如果这次解析没有成功)为当前时间加上parms的成员
retrans_time的值(缺省设置为1秒)。
所以,ARP解析的发包超时时间是1秒,连续尝试3次。
ARP解析是通过ops的成员函数
solicit去做的,该成员函数指针指向的arp_solicit函数,arp_solicit会实际发送ARP请求包。
如果arp_solicit发送ARP请求包,连续三次没有得到正确的回应,则把nud_state置为NUD_FAILED,调用ops的成员函数
error_report报告错误。
并把skb从arp_queue队列中取出。
error_report错误报告置dst的超时时间为当前时间,并删除
skb,关于dst,跟FIB相关,涉及到FIB时再详细分析。
置为NUD_FAILED的邻居在下次进行常规垃圾回收时,被删除回收掉。
协议栈在发送一个IP数据报之前,需要发送ARP请求是为了解析IP数据报的目的IP地址对应的硬件地址。
ARP协议可以承载多种硬件类型和多种协议,这里我们只关注以太网上的IP协议,那ARP请求的目的就是为了解析邻居的以太网MAC地址。
ARP请求/应答数据报总共有28字节,其具体格式如下所示(在以太网,IP协议的情况下):
字段含义:
硬件类型协议类型
硬件地址长度协议地址长度op
字段长度:
22112
发送端以太网地址
发送端IP地址目的以太网地址目的IP地址
6464
硬件类型,对于10Mbps以太网,其取值是ARPHRD_ETHER(值为1),协议类型,对于IP协议来说,就是ETH_P_IP(0x0800),
在上述条件限定下,硬件地址长度为6,协议地址长度为4,op的值为ARPOP_REQUEST(值为1,表示是ARP请求,或者ARPOP_REPLY
(值为2,表示是ARP应答)。
发送端以太网地址填发送接口的MAC地址,发送端IP地址填源IP地址
(关于源IP地址的选取下文会有详细分析),目的以太网地址,因为当前是ARP请求,所以填入以太网广播地址
0xFF:
0xFF,目的IP地址填入IP数据报的目的地址。
这里,发送端IP地址的选取是一个可配置的选项,文件/proc
/sys/net/ipv4/conf/设备名/arp_announce记录的是它的配置值,这是一个整型数值,取值范围为0-2,0表示只要待发送
IP数据报的源地址为本地地址,就取该地址为发送端IP地址,这也是缺省配置;
1表示若待发送IP数据报的源地址为本地地址,并且该IP地址与目的IP地
址在同一子网内,则取该地址为发送端IP地址,否则从所有的本地地址中取一个与目的IP地址在同一子网内的地址;
2表示完全忽略IP数据报中的地址,直接
从所有本地输出网络接口中选取一个最为合适的发送端IP地址。
配置级别越高,我们能够获得
ARP回应的机率也就越大。
构建好的ARP请求数据报通过函数dev_queue_xmit发送出去。
在分析接收和处理ARP的回应数据之前,先复习一下协议栈接收网络数据的一个基本流程,网卡驱动程序会创建一个skb,并填入接收到的数据,并把这个
skb传给协议栈的第一个接收函数neti
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux ARP协议源码解析 ARP 协议 源码 解析
![提示](https://static.bdocx.com/images/bang_tan.gif)