Linux 310 kernel bridge转发逻辑Word下载.docx
- 文档编号:22620960
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:16
- 大小:19.07KB
Linux 310 kernel bridge转发逻辑Word下载.docx
《Linux 310 kernel bridge转发逻辑Word下载.docx》由会员分享,可在线阅读,更多相关《Linux 310 kernel bridge转发逻辑Word下载.docx(16页珍藏版)》请在冰豆网上搜索。
}
这个函数可以给设备(net_device)注册接收函数,然后在__netif_receive_skb函数中根据接收skb的设备接口,再调用这个被注册的接收函数。
比如为网桥下的接口注册br_handle_frame函数,为bonding接口注册bond_handle_frame函数。
这相对于老式的网桥处理更灵活,有了这个机制也可以在模块中自行注册处理函数。
比如3.10中的openvswitch(OpenvSwitch在3.10已经合入了内核)创建netdevvport的函数netdev_create。
lnetdev_create
staticstructvport*netdev_create(conststructvport_parms*parms)
structvport*vport;
/....../
err=netdev_rx_handler_register(netdev_vport->
dev,netdev_frame_hook,vport);
这个函数在创建netdevvport时将设备的接收函数设置为netdev_frame_hook函数,这也是整个openvswitch的入口函数,如果查看OpenvSwitch的源码可以看到当安装于2.6内核时这里是替换掉bridge的br_handle_frame_hook函数,从而由bridge逻辑进入OpenvSwitch逻辑。
2.Bridge转发逻辑分析
还是先从netif_receive_skb函数分析,这个函数算是进入协议栈的入口。
lnetif_receive_skb
intnetif_receive_skb(structsk_buff*skb)
intret;
if(skb_defer_rx_timestamp(skb))
returnNET_RX_SUCCESS;
rcu_read_lock();
/*RPS逻辑处理,现在内核中使用了RPS机制,将报文分散到各个cpu的接收队列中进行负载均衡处理*/
#ifdefCONFIG_RPS
if(static_key_false(&
rps_needed)){
structrps_dev_flowvoidflow,*rflow=&
voidflow;
intcpu=get_rps_cpu(skb->
dev,skb,&
rflow);
if(cpu>
=0){
ret=enqueue_to_backlog(skb,cpu,&
rflow->
last_qtail);
rcu_read_unlock();
returnret;
}
#endif
ret=__netif_receive_skb(skb);
netif_receive_skb只是对数据包进行了RPS的处理,然后调用__netif_receive_skb。
__netif_receive_skb并没有其他多余的处理逻辑,主要调用__netif_receive_skb_core,这个函数才真正相当于2.6内核的netif_receive_skb。
以下代码省略了和bridge无关的逻辑。
l__netif_receive_skb_core
staticint__netif_receive_skb_core(structsk_buff*skb,boolpfmemalloc)
structpacket_type*ptype,*pt_prev;
rx_handler_func_t*rx_handler;
structnet_device*orig_dev;
structnet_device*null_or_dev;
booldeliver_exact=false;
intret=NET_RX_DROP;
__be16type;
/*......*/
orig_dev=skb->
dev;
skb_reset_network_header(skb);
pt_prev=NULL;
skb->
skb_iif=skb->
dev->
ifindex;
/*ptype_all协议处理,tcpdump抓包就在这里*/
list_for_each_entry_rcu(ptype,&
ptype_all,list){
if(!
ptype->
dev||ptype->
dev==skb->
dev){
if(pt_prev)
ret=deliver_skb(skb,pt_prev,orig_dev);
pt_prev=ptype;
/*调用接收设备的rx_handler*/
rx_handler=rcu_dereference(skb->
rx_handler);
if(rx_handler){
if(pt_prev){
switch(rx_handler(&
skb)){
caseRX_HANDLER_CONSUMED:
ret=NET_RX_SUCCESS;
gotoout;
caseRX_HANDLER_ANOTHER:
gotoanother_round;
caseRX_HANDLER_EXACT:
deliver_exact=true;
caseRX_HANDLER_PASS:
break;
default:
BUG();
/*根据skb->
protocol传递给上层协议*/
type=skb->
protocol;
list_for_each_entry_rcu(ptype,&
ptype_base[ntohs(type)&
PTYPE_HASH_MASK],list){
if(ptype->
type==type&
&
(ptype->
dev==null_or_dev||ptype->
dev||ptype->
dev==orig_dev)){
if(unlikely(skb_orphan_frags(skb,GFP_ATOMIC)))
gotodrop;
else
ret=pt_prev->
func(skb,skb->
dev,pt_prev,orig_dev);
}else{
drop:
atomic_long_inc(&
skb->
rx_dropped);
kfree_skb(skb);
ret=NET_RX_DROP;
out:
如果一个dev被添加到一个bridge(做为bridge的一个接口),的这个接口设备的rx_handler被设置为br_handle_frame函数,这是在br_add_if函数中设置的,而br_add_if(net/bridge/br_if.c)是在向网桥设备上添加接口时设置的。
进入br_handle_frame也就进入了bridge的逻辑代码。
lbr_add_if
intbr_add_if(structnet_bridge*br,structnet_device*dev)
err=netdev_rx_handler_register(dev,br_handle_frame,p);
lbr_handle_frame
rx_handler_result_tbr_handle_frame(structsk_buff**pskb)
structnet_bridge_port*p;
structsk_buff*skb=*pskb;
constunsignedchar*dest=eth_hdr(skb)->
h_dest;
br_should_route_hook_t*rhook;
if(unlikely(skb->
pkt_type==PACKET_LOOPBACK))
returnRX_HANDLER_PASS;
is_valid_ether_addr(eth_hdr(skb)->
h_source))
skb=skb_share_check(skb,GFP_ATOMIC);
skb)
returnRX_HANDLER_CONSUMED;
/*获取dev对应的bridgeport*/
p=br_port_get_rcu(skb->
dev);
/*特殊目的mac地址的处理*/
if(unlikely(is_link_local_ether_addr(dest))){
/*
*SeeIEEE802.1DTable7-10Reservedaddresses
*
*AssignmentValue
*BridgeGroupAddress01-80-C2-00-00-00
*(MACControl)802.301-80-C2-00-00-01
*(LinkAggregation)802.301-80-C2-00-00-02
*802.1XPAEaddress01-80-C2-00-00-03
*802.1ABLLDP01-80-C2-00-00-0E
*Othersreservedforfuturestandardization
*/
switch(dest[5]){
case0x00:
/*BridgeGroupAddress*/
/*IfSTPisturnedoff,thenmustforwardtokeeploopdetection*/
if(p->
br->
stp_enabled==BR_NO_STP)
gotoforward;
case0x01:
/*IEEEMAC(Pause)*/
/*Allowselectiveforwardingformostotherprotocols*/
group_fwd_mask&
(1u<
<
dest[5]))
/*LOCAL_INhook点,注意经过这个hook点并不代表发送到主机协议栈(只有特殊目的mac01-80-C2才会走到这里)*/
if(NF_HOOK(NFPROTO_BRIDGE,NF_BR_LOCAL_IN,skb,skb->
dev,
NULL,br_handle_local_finish)){
/*consumedbyfilter*/
*pskb=skb;
/*continueprocessing*/
/*转发逻辑*/
forward:
switch(p->
state){
caseBR_STATE_FORWARDING:
rhook=rcu_dereference(br_should_route_hook);
if(rhook){
if((*rhook)(skb)){
dest=eth_hdr(skb)->
/*fallthrough*/
caseBR_STATE_LEARNING:
/*skb的目的mac和bridge的mac一样,则将skb发往本机协议栈*/
if(ether_addr_equal(p->
dev_addr,dest))
pkt_type=PACKET_HOST;
/*NF_BR_PRE_ROUTINGhook点*/
NF_HOOK(NFPROTO_BRIDGE,NF_BR_PRE_ROUTING,skb,skb->
dev,NULL,br_handle_frame_finish);
default:
returnRX_HANDLER_CONSUMED;
经过NF_BR_LOCAL_INhook点会执行br_handle_local_finish函数。
lbr_handle_local_finish
staticintbr_handle_local_finish(structsk_buff*skb)
structnet_bridge_port*p=br_port_get_rcu(skb->
u16vid=0;
/*获取skb的vlanid(3.10的bridge支持vlan)*/
br_vlan_get_tag(skb,&
vid);
/*更新bridge的mac表,注意vlanid也是参数,说明每个vlan有一个独立的mac表*/
br_fdb_update(p->
br,p,eth_hdr(skb)->
h_source,vid);
/*processfurther*/
经过NF_BR_PRE_ROUTINGhook点会执行br_handle_frame_finish函数。
lbr_handle_frame_finish
intbr_handle_frame_finish(structsk_buff*skb)
structnet_bridge*br;
structnet_bridge_fdb_entry*dst;
structnet_bridge_mdb_entry*mdst;
structsk_buff*skb2;
p||p->
state==BR_STATE_DISABLED)
/*这个判断主要是vlan的相关检查,如是否和接收接口配置的vlan相同*/
br_allowed_ingress(p->
br,nbp_get_vlan_info(p),skb,&
vid))
/*insertintoforwardingdatabaseafterfilteringtoavoidspoofing*/
br=p->
br;
/*更新转发数据库*/
br_fdb_update(br,p,eth_hdr(skb)->
/*多播mac的处理*/
is_broadcast_ether_addr(dest)&
is_multicast_ether_addr(dest)&
br_multicast_rcv(br,p,skb))
state==BR_STATE_LEARNING)
BR_INPUT_SKB_CB(skb)->
brdev=br->
/*Thepacketskb2goestothelocalhost(NULLtoskip).*/
skb2=NULL;
/*如果网桥被设置为混杂模式*/
if(br->
flags&
IFF_PROMISC)
skb2=skb;
dst=NULL;
/*如果skb的目的mac是广播*/
if(is_broadcast_ether_addr(dest))
elseif(is_multicast_ether_addr(dest)){/*多播*/
mdst=br_mdb_get(br,skb,vid);
if(mdst||BR_INPUT_SKB_CB_MROUTERS_ONLY(skb)){
if((mdst&
mdst->
mglist)||
br_multicast_is_router(br))
br_multicast_forward(mdst,skb,skb2);
skb=NULL;
skb2)
}else
br->
stats.multicast++;
}elseif((dst=__br_fdb_get(br,dest,vid))&
dst->
is_local){/*目的地址是本机mac,则发往本机协议栈*/
/*Donotforwardthepacketsinceit'
slocal.*/
if(skb){
if(dst){
used=jiffies;
br_forward(dst->
dst,skb,skb2);
//转发给目的接口
br_flood_forward(br,skb,skb2);
//找不到目的接口则广播
if(skb2)
returnbr_pass_frame_up(skb2);
//发往本机协议栈
我们先看发往本机协议栈的函数br_pass_frame_up。
lbr_pass_frame_up
staticintbr_pass_frame_up(structsk_buff*skb)
structnet_device*indev,*brdev=BR_INPUT_SKB_CB(skb)->
brdev;
structnet_bridge*br=netdev_priv(brdev);
//更新统计计数(略)
/*Bridgeisjustlikeanyotherport.Makesurethe
*packetisallowedexceptinpromiscmoduewhensomeone
*mayberunningpacketcapture.
(brdev->
IFF_PROMISC)&
!
br_allowed_egress(br,br_get_vlan_info(br),skb)){
//如果不是混杂模式且vlan处理不合要求则丢弃
returnNET_RX_DROP;
//vlan处理逻辑
skb=br_handle_vlan(br,br_get_vlan_info(br),skb);
indev=skb->
dev=brdev;
//重点,这里修改了skb->
dev为bridge
//经过NF_BR_LOCAL_IN再次进入协议栈
returnNF_HOOK(NFPROTO_BRIDGE,NF_BR_LOCAL_IN,skb,indev,NULL,
netif_receive_skb);
再次进入netif_receive_skb,由于skb-dev被设置成了bridge,而bridge设备的rx_handler函数是没有被设置的,所以就不会再次进入bridge逻辑,而直接进入了主机上层协议栈。
下面看转发逻辑,转发逻辑主要在br_forward函数中,而b
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Linux 310 kernel bridge转发逻辑 bridge 转发 逻辑
![提示](https://static.bdocx.com/images/bang_tan.gif)