0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

pwru的使用方法、經(jīng)典場景及實現(xiàn)原理

馬哥Linux運維 ? 來源:Houmin ? 作者:Houmin ? 2022-06-28 17:27 ? 次閱讀

pwru 是 Cilium 推出的基于 eBPF 開發(fā)的網(wǎng)絡(luò)數(shù)據(jù)包排查工具,它提供了更細粒度的網(wǎng)絡(luò)數(shù)據(jù)包排查方案。本文將介紹 pwru 的使用方法和經(jīng)典場景,并介紹其實現(xiàn)原理。

安裝部署

部署要求

pwru 要求內(nèi)核代碼在 5.5 版本之上,--output-skb 要求內(nèi)核版本在 5.9 之上,并且要求內(nèi)核開啟以下配置:

Option Note
CONFIG_DEBUG_INFO_BTF=y Available since >= 5.3
CONFIG_KPROBES=y
CONFIG_PERF_EVENTS=y
CONFIG_BPF=y
CONFIG_BPF_SYSCALL=y

使用方法

Usageof./pwru:
--filter-dst-ipstringfilterdestinationIPaddr
--filter-dst-portuint16filterdestinationport
--filter-funcstringfilterkernelfunctionstobeprobedbyname(exactmatch,supportsRE2regularexpression)
--filter-markuint32filterskbmark
--filter-netnsuint32filternetnsinode
--filter-protostringfilterL4protocol(tcp,udp,icmp)
--filter-src-ipstringfiltersourceIPaddr
--filter-src-portuint16filtersourceport
--output-limit-linesuintexittheprogramafterthenumberofeventshasbeenreceived/printed
--output-metaprintskbmetadata
--output-relative-timestampprintrelativetimestampperskb
--output-skbprintskb
--output-stackprintstack
--output-tupleprintL4tuple

案例演示

下圖案例演示了 pwru 展現(xiàn)出快速定位出數(shù)據(jù)包被 iptables 規(guī)則 drop 掉的原因:

becdfe8a-f61e-11ec-ba43-dac502259ad0.gif

在不設(shè)置 iptables 規(guī)則之前:

bedbc11e-f61e-11ec-ba43-dac502259ad0.png

添加了 iptables 規(guī)則之后

iptables-tfilter-IOUTPUT1-mtcp--prototcp--dst1.1.1.1/32-jDROP

可以看到在 nf_hook_slow 函數(shù)后發(fā)生了變化:

bef9b250-f61e-11ec-ba43-dac502259ad0.png

我們可以看到數(shù)據(jù)包在 nf_hook_slow 判決為 NF_DROP,調(diào)用了 kfree_skb

intnf_hook_slow(structsk_buff*skb,structnf_hook_state*state,
conststructnf_hook_entries*e,unsignedints)
{
unsignedintverdict;
intret;

for(;snum_hook_entries;s++){
verdict=nf_hook_entry_hookfn(&e->hooks[s],skb,state);
switch(verdict&NF_VERDICT_MASK){
caseNF_ACCEPT:
break;
caseNF_DROP:
kfree_skb(skb);
ret=NF_DROP_GETERR(verdict);
if(ret==0)
ret=-EPERM;
returnret;
caseNF_QUEUE:
ret=nf_queue(skb,state,s,verdict);
if(ret==1)
continue;
returnret;
default:
/*ImplicithandlingforNF_STOLEN,aswellasanyother
*nonconventionalverdicts.
*/
return0;
}
}

return1;
}

原理實現(xiàn)

pwru 本質(zhì)上是向 kprobe 注冊了一些 eBPF code,根據(jù) pwru 傳入的參數(shù)可以更新 eBPF Map,改變限制條件,從而更新輸出。

比如在 FilterCfg 里面制定了過濾的 IP 地址和協(xié)議等條件

typeFilterCfgstruct{
FilterMarkuint32

//Filterl3
FilterIPv6uint8
FilterSrcIP[16]byte
FilterDstIP[16]byte

//Filterl4
FilterProtouint8
FilterSrcPortuint16
FilterDstPortuint16

//TODO:iftherearemoreoptionslater,thenyoucanconsiderusingabitmap
OutputRelativeTSuint8
OutputMetauint8
OutputTupleuint8
OutputSkbuint8
OutputStackuint8

Padbyte
}

會根據(jù) pwru 傳入的參數(shù)更新這個 eBPF Map

funcConfigBPFMap(flags*Flags,cfgMap*ebpf.Map){
cfg:=FilterCfg{
FilterMark:flags.FilterMark,
}

ifflags.FilterSrcPort>0{
cfg.FilterSrcPort=byteorder.HostToNetwork16(flags.FilterSrcPort)
}
ifflags.FilterDstPort>0{
cfg.FilterDstPort=byteorder.HostToNetwork16(flags.FilterDstPort)
}


switchstrings.ToLower(flags.FilterProto){
case"tcp":
cfg.FilterProto=syscall.IPPROTO_TCP
case"udp":
cfg.FilterProto=syscall.IPPROTO_UDP
case"icmp":
cfg.FilterProto=syscall.IPPROTO_ICMP
case"icmp6":
cfg.FilterProto=syscall.IPPROTO_ICMPV6
}

//...

iferr:=cfgMap.Update(uint32(0),cfg,0);err!=nil{
log.Fatalf("Failedtosetfiltermap:%v",err)
}
}

在 eBPF code 中,可以看到會讀取配置 bpf_map_lookup_elem,然后進而執(zhí)行真正的 filter:

structconfig{
u32mark;
u8ipv6;
unionaddrsaddr;
unionaddrdaddr;
u8l4_proto;
u16sport;
u16dport;
u8output_timestamp;
u8output_meta;
u8output_tuple;
u8output_skb;
u8output_stack;
u8pad;
}__attribute__((packed));

static__always_inlineint
handle_everything(structsk_buff*skb,structpt_regs*ctx){
structevent_tevent={};

u32index=0;
structconfig*cfg=bpf_map_lookup_elem(&cfg_map,&index);

if(cfg){
if(!filter(skb,cfg))
return0;

set_output(ctx,skb,&event,cfg);
}

event.pid=bpf_get_current_pid_tgid();
event.addr=PT_REGS_IP(ctx);
event.skb_addr=(u64)skb;
event.ts=bpf_ktime_get_ns();
bpf_perf_event_output(ctx,&events,BPF_F_CURRENT_CPU,&event,sizeof(event));

return0;
}

可以看到,這里通過 bpf_perf_event_output 將過濾結(jié)果以 Perf event 傳遞上來。

rd,err:=perf.NewReader(events,os.Getpagesize())
iferr!=nil{
log.Fatalf("Creatingperfeventreader:%s",err)
}
deferrd.Close()

//...
vareventpwru.Event
for{
record,err:=rd.Read()
iferr!=nil{
ifperf.IsClosed(err){
return
}
log.Printf("Readingfromperfeventreader:%s",err)
}

ifrecord.LostSamples!=0{
log.Printf("Perfeventringbufferfull,dropped%dsamples",record.LostSamples)
continue
}

iferr:=binary.Read(bytes.NewBuffer(record.RawSample),binary.LittleEndian,&event);err!=nil{
log.Printf("Parsingperfevent:%s",err)
continue
}

output.Print(&event)

select{
case<-ctx.Done():
??break
default:
continue
}
}

原文標(biāo)題:pwru: 一款基于 eBPF 的細粒度網(wǎng)絡(luò)數(shù)據(jù)包排查工具

文章出處:【微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1336

    瀏覽量

    40084
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7389

    瀏覽量

    88217
  • 數(shù)據(jù)包
    +關(guān)注

    關(guān)注

    0

    文章

    238

    瀏覽量

    24250

原文標(biāo)題:pwru: 一款基于 eBPF 的細粒度網(wǎng)絡(luò)數(shù)據(jù)包排查工具

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    DC/DC模擬的基本使用方法和特性確認(rèn)方法

    本篇介紹了DC/DC模擬的基本使用方法及確認(rèn)基本特性的方法
    的頭像 發(fā)表于 08-20 17:08 ?330次閱讀
    DC/DC模擬的基本<b class='flag-5'>使用方法</b>和特性確認(rèn)<b class='flag-5'>方法</b>

    圖片動畫控件和Video image控件的使用方法

    在UI開發(fā)過程中,序列幀基本是繞不開的,AWTK 支持多種方法實現(xiàn)序列幀顯示,本文介紹圖片動畫控件和Video image控件的使用方法。
    的頭像 發(fā)表于 08-06 16:44 ?414次閱讀
    圖片動畫控件和Video image控件的<b class='flag-5'>使用方法</b>

    淺談錫膏的儲存及使用方法

    錫膏(焊錫膏)是電子組裝過程中常用的材料,它的儲存和使用方法對保證焊接質(zhì)量和性能至關(guān)重要。以下是詳細的儲存及使用方法
    的頭像 發(fā)表于 06-27 10:02 ?484次閱讀

    PLC IO接口的功能及使用方法

    與外部設(shè)備通信的關(guān)鍵。PLC的IO接口功能強大且使用靈活,能夠滿足各種工業(yè)自動化場景的需求。本文將詳細闡述PLC的IO接口的功能及使用方法,旨在為讀者提供全面而深入的了解。
    的頭像 發(fā)表于 06-15 16:49 ?1219次閱讀

    可編程電源使用方法

    可編程電源使用方法 可編程電源使用方法 摘要:本文詳細介紹了可編程電源的使用方法,包括其基本概念、主要功能、選擇原則、操作步驟、注意事項以及實際應(yīng)用案例,旨在幫助讀者全面了解可編程電源
    的頭像 發(fā)表于 06-10 15:29 ?569次閱讀

    現(xiàn)場總線的使用方法與注意事項

    的穩(wěn)定可靠運行,正確的使用方法和注意事項至關(guān)重要。本文將詳細介紹現(xiàn)場總線的使用方法和注意事項,以供讀者參考。
    的頭像 發(fā)表于 06-06 11:49 ?474次閱讀

    手柄控制代碼及使用方法

    手柄控制代碼及使用方法
    的頭像 發(fā)表于 05-15 10:19 ?925次閱讀

    555集成芯片的使用方法

    555集成芯片的使用方法主要依賴于其特定的引腳功能和電路設(shè)計。
    的頭像 發(fā)表于 03-25 14:39 ?930次閱讀

    SUMIF函數(shù)的使用方法

    SUMIF函數(shù)是Excel中常用的求和函數(shù)之一,它可以根據(jù)指定的條件對范圍內(nèi)的數(shù)值進行求和。本文將詳細介紹SUMIF函數(shù)的使用方法,并通過實例演示其具體操作。 SUMIF函數(shù)的語法如下: SUMIF
    的頭像 發(fā)表于 11-30 16:34 ?4488次閱讀

    MFM推拉力測試機的應(yīng)用領(lǐng)域和使用方法

    MFM推拉力測試機的應(yīng)用領(lǐng)域和使用方法
    的頭像 發(fā)表于 11-22 09:08 ?397次閱讀
    MFM推拉力測試機的應(yīng)用領(lǐng)域和<b class='flag-5'>使用方法</b>

    電力電子器件大全及使用方法

    電子發(fā)燒友網(wǎng)站提供《電力電子器件大全及使用方法.pdf》資料免費下載
    發(fā)表于 11-18 14:46 ?2次下載
    電力電子器件大全及<b class='flag-5'>使用方法</b>

    AT32 MCU Printf的功能使用方法

    AT32 MCU Printf的功能使用方法
    的頭像 發(fā)表于 10-27 09:27 ?835次閱讀
    AT32 MCU Printf的功能<b class='flag-5'>使用方法</b>

    AT32F系列主頻1MHz的使用方法

    演示AT32F系列 主頻1MHz的使用方法。MCU系統(tǒng)時鐘只可由HICK、HEXT或PLL提供,其時鐘最小只能達到4MHz。為了降低功耗,有時應(yīng)用期望系統(tǒng)時鐘只跑1MHz或者更低,此時就可通過AHB
    發(fā)表于 10-27 07:27

    AT32F系列ACC的使用方法

    AT32F系列ACC使用演示AT32F系列ACC的使用方法。
    發(fā)表于 10-27 06:44

    AT32F系列MCO輸出的使用方法

    AT32F系列MCO輸出演示AT32F系列MCO輸出的使用方法
    發(fā)表于 10-27 06:36