Skip to content

Latest commit

 

History

History

ebpf

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

环境准备

# 启动虚拟机
limactl start ebpf.yaml

# 进入虚拟机
limactl shell ebpf

启动第一个 eBPF 程序

eunomia-bpf 是一个开源的 eBPF 动态加载运行时和开发工具链,是为了简化 eBPF 程序的开发、构建、分发、运行而设计的,基于 libbpf 的 CO-RE 轻量级开发框架。

我们会先从一个简单的 eBPF 程序开始 (minimal.bpf.c),它会在内核中打印一条消息。我们会使用 eunomia-bpf 的编译器工具链将其编译为 bpf 字节码文件,然后使用 ecli 工具加载并运行该程序。作为示例,我们可以暂时省略用户态程序的部分。

这段程序通过定义一个 handle_tp 函数并使用 SEC 宏把它附加到 sys_enter_write tracepoint(即在进入 write 系统调用时执行)。该函数通过使用 bpf_get_current_pid_tgid 和 bpf_printk 函数获取调用 write 系统调用的进程 ID,并在内核日志中打印出来。

  • bpf_trace_printk(): 一种将信息输出到 trace_pipe(/sys/kernel/debug/tracing/trace_pipe)简单机制。 在一些简单用例中这样使用没有问题, 但它也有一些限制:最多3 参数; 第一个参数必须是%s(即字符串);同时trace_pipe在内核中全局共享,其他并行使用trace_pipe的程序有可能会将 trace_pipe 的输出扰乱。 一个更好的方式是通过 BPF_PERF_OUTPUT(), 稍后将会讲到。
  • void *ctx:ctx 本来是具体类型的参数, 但是由于我们这里没有使用这个参数,因此就将其写成void *类型。
  • return 0;:必须这样,返回 0 (如果要知道原因, 参考 #139 https://github.com/iovisor/bcc/issues/139)。

要编译和运行这段程序,可以使用 ecc 工具和 ecli 命令。首先使用 ecc 编译程序:

cd quickstart
docker run -it -v `pwd`/:/src/ yunwei37/ebpm:latest

然后使用 ecli 运行编译后的程序,编译后会生成 package.json 和 minimal.skel.json 两个文件。

$ sudo ecli run ./package.json
Runing eBPF program...

运行这段程序后,可以通过查看 /sys/kernel/debug/tracing/trace_pipe 文件来查看 eBPF 程序的输出:

$ sudo cat /sys/kernel/debug/tracing/trace_pipe
<...>-3840345 [010] d... 3220701.101143: bpf_trace_printk: write system call from PID 3840345.
<...>-3840345 [010] d... 3220701.101143: bpf_trace_printk: write system call from

tracepoint 监控 Go 程序写入

启动 Go 程序执行写入操作。

go run testwrite/main.go
当前的PID是: 965676
写入成功 2023-06-06 14:24:05.536120899 +0000 UTC m=+0.000339041
写入成功 2023-06-06 14:24:10.538152765 +0000 UTC m=+5.002370896

修改 tracepoint/test.bpf.c 文件,只对指定 PID 的程序进行跟踪。

const int myappid=965676; // 替换成 Go 程序的 PID

使用 ecc 编译程序:

cd tracepoint
docker run -it -v `pwd`/:/src/ yunwei37/ebpm:latest

编译出来后执行:

ecli run ./package.json

查看效果:

cat /sys/kernel/debug/tracing/trace_pipe

# 输出
main-965676  [001] d...1 1730125.361244: bpf_trace_printk: jtthink-BPF triggered from PID 965676.

main-965676  [001] d...1 1730125.361303: bpf_trace_printk: jtthink-BPF triggered from PID 965676.

main-965676  [001] d...1 1730130.361559: bpf_trace_printk: jtthink-BPF triggered from PID 965676.

main-965676  [001] d...1 1730130.361612: bpf_trace_printk: jtthink-BPF triggered from PID 965676.

kprobe 监控 Go 程序写入

kprobes :动态内核跟踪技术,可以定义自己的回调函数,在内核几乎所有的函数中动态地插入探测点,当内核执行流程执行到指定的探测函数时,会调用该回调函数,用户即可收集所需的信息。虽然灵活,但是可能相对 tracepoint (预定义跟踪点进行采样)有性能影响。 我们可以通过 cat /proc/kallsyms 来查看内核函数,至于函数体可能需要查看你所因此内核的源码。

继续使用 kprobe 来监控上面运行的 Go 程序,修改 tracepoint/test.bpf.c 文件,只对指定 PID 的程序进行跟踪。

if (data.pid!=965676){ // 替换成 Go 程序的 PID 
        return 0;
    }

使用 ecc 编译程序:

cd kprobe
docker run -it -v `pwd`/:/src/ yunwei37/ebpm:latest

编译出来后执行:

ecli run ./package.json

查看效果:

cat /sys/kernel/debug/tracing/trace_pipe

# 输出
main-965676  [000] d...1 1730410.560730: bpf_trace_printk: pid= 965676,name:main. writing data

main-965676  [000] d...1 1730410.560773: bpf_trace_printk: pid= 965676,name:main. writing data

main-965676  [000] d...1 1730415.564056: bpf_trace_printk: pid= 965676,name:main. writing data

main-965676  [000] d...1 1730415.564105: bpf_trace_printk: pid= 965676,name:main. writing data

XDP 拦截 ICMP 协议

xdp_md 在头文件 /usr/include/linux/bpf.h 有定义:

  • data: 数据包数据的地址。 指向数据包数据的开头。
  • data_end: 数据包数据的结束地址。指向数据包的结尾。
  • data_meta: 数据包元数据的地址。存储有关数据包的附加信息。
  • ingress_ifindex: 接收数据包的网络接口的索引。
  • rx_queue_index: 接收数据包的接收队列的索引。

头文件中定义 if_ether.h。它代表以太网链路层报头。其主要目的是定义以太网报头的结构,其中包括源 MAC 地址和目的 MAC 地址,以及以太网协议类型。

struct ethhdr
{
unsigned char h_dest[ETH_ALEN]; //目的MAC地址
unsigned char h_source[ETH_ALEN]; //源MAC地址
__u16 h_proto ; //网络层所使用的协议类型
}__attribute__((packed))

头文件 iphdr 中定义 <linux/ip.h>。它用于描述 IPv4 数据包的 IP 标头。该结构包括 IP 版本、报头长度、服务类型、数据包总长度、标识号、标志、生存时间、协议、校验和、源 IP 地址和目标 IP 地址等字段。协议常见数值:

  • 1:ICMP(Internet 控制报文协议)
  • 2:IGMP(Internet 组管理协议)
  • 6:TCP(传输控制协议)
  • 17:UDP(用户数据报协议)
  • 41:IPv6 封装的 IPv6 数据报
  • 47:GRE(通用路由封装)
  • 50:ESP(封装安全载荷)
  • 51:AH(认证头部)
  • 89:OSPF(开放式最短路径优先协议)
  • 132:SCTP(流控制传输协议)

使用 ecc 编译程序:

cd xdp
docker run -it -v `pwd`/:/src/ yunwei37/ebpm:latest

启用 XDP 之前先创建一个容器。

docker run -itd --name nginx nginx

获取容器的 IP 地址。

docker inspect -f "{{ .NetworkSettings.IPAddress }}" nginx

# 输出
172.17.0.3

此时 curl 和 ping 容器都是可以成功访问的。

> curl 172.17.0.3

<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
html { color-scheme: light dark; }
body { width: 35em; margin: 0 auto;
font-family: Tahoma, Verdana, Arial, sans-serif; }
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>

<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>

<p><em>Thank you for using nginx.</em></p>
</body>
</html>

> ping 172.17.0.3
PING 172.17.0.3 (172.17.0.3) 56(84) bytes of data.
64 bytes from 172.17.0.3: icmp_seq=1 ttl=64 time=0.059 ms
64 bytes from 172.17.0.3: icmp_seq=2 ttl=64 time=0.058 ms
64 bytes from 172.17.0.3: icmp_seq=3 ttl=64 time=0.044 ms

启用 XDP,使用 docker0 或者自己创建网桥来处理,不要对 eth0 下手,以免连不上主机。

# ip link set dev <网卡> xdp obj <文件名> sec xdp verbose
ip link set dev docker0 xdp obj xdp.bpf.o sec xdp verbose

执行 ip link 命令可以看到 docker0 网卡上挂载了 XDP 程序。

3: docker0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 xdpgeneric qdisc noqueue state UP mode DEFAULT group default
    link/ether 02:42:75:d8:d6:43 brd ff:ff:ff:ff:ff:ff
    prog/xdp id 29200 tag d0ecfbec9b51b126 jited

此时再次访问容器,会发现无法通过 Ping 访问容器了,但是 curl 还是可以访问容器。

> ping 172.17.0.3
PING 172.17.0.3 (172.17.0.3) 56(84) bytes of data.
^C
--- 172.17.0.3 ping statistics ---
45 packets transmitted, 0 received, 100% packet loss, time 45051ms

> curl 172.17.0.3
<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
html { color-scheme: light dark; }
body { width: 35em; margin: 0 auto;
font-family: Tahoma, Verdana, Arial, sans-serif; }
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>

<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>

<p><em>Thank you for using nginx.</em></p>
</body>
</html>

查看 trace 日志。

cat /sys/kernel/debug/tracing/trace_pipe

# 输出
ping-152078  [000] d.s11 1732113.788260: bpf_trace_printk: Drop ICMP packets

ping-969242  [001] d.s11 1732114.208199: bpf_trace_printk: Drop ICMP packets

ping-152078  [000] d.s11 1732114.788594: bpf_trace_printk: Drop ICMP packets

ping-969242  [000] d.s11 1732115.232141: bpf_trace_printk: Drop ICMP packets

卸载 XDP:

ip link set dev docker0 xdp off

用户态开发 cilium/ebpf 入门

安装 bpf2go 工具,执行 go install 后 bpf2go 会安装到 $GOPATH/bin 目录下。

go get github.com/cilium/ebpf/cmd/bpf2go
go install github.com/cilium/ebpf/cmd/bpf2go

安装依赖,参考资料:https://www.ghl.name/archives/how-to-fix-asm-types-h-no-found.html

apt install -y libelf-dev llvm

# 安装 clang-14
apt install -y lsb-release wget software-properties-common gnupg
wget https://apt.llvm.org/llvm.sh
chmod +x llvm.sh
sudo ./llvm.sh 14 all
# 上一步安装过程中会安装无用的 clang-11 的包,这一条命令是用来卸载它们的
sudo apt autoremove

# 设置 clang 的默认版本为 clang-14
update-alternatives --install /usr/bin/llc llc /usr/bin/llc-14 100
update-alternatives --install /usr/bin/clang clang /usr/bin/clang-14 100

apt install -y gcc-multilib

查看 clang 版本:

# clang -v
Ubuntu clang version 14.0.6
Target: aarch64-unknown-linux-gnu
Thread model: posix
InstalledDir: /usr/bin
Found candidate GCC installation: /usr/bin/../lib/gcc/aarch64-linux-gnu/9
Selected GCC installation: /usr/bin/../lib/gcc/aarch64-linux-gnu/9
Candidate multilib: .;@m64
Selected multilib: .;@m64

在 goebpf/cebpf/tc 目录中的 tc_write.bpf.c 文件是 eBPF 程序,doc.go 中 bpf2go 命令根据 tc_write.bpf.c 文件生成相关的 o 文件和 go 文件。

//go:generate bpf2go -cc $BPF_CLANG -cflags $BPF_CFLAGS tc_write tc_write.bpf.c -- -I $BPF_HEADERS

在项目根目录执行 make 命令生成文件。

make

# 输出
go generate ./...
Compiled /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfel.o
Stripped /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfel.o
Wrote /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfel.go
Compiled /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.o
Stripped /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.o
Wrote /root/kubernetes-guide/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.go

启动 eBPF 程序。

cd goebpf/cmd/tc/
go run main.go

启动被监控的程序。

cd testwrite
./testwrite

查看监听的 trace 日志。

# cat /sys/kernel/debug/tracing/trace_pipe
testwrite-773766  [000] d...1 1084879.915646: bpf_trace_printk: pid= 773766,name:testwrite. writing data

testwrite-773766  [000] d...1 1084879.919001: bpf_trace_printk: pid= 773766,name:testwrite. writing data

testwrite-773766  [000] d...1 1084879.919241: bpf_trace_printk: pid= 773766,name:testwrite. writing data

eBPF Maps 入门

传递 struct 给用户态解析

cilium/ebpf 提供了一些头文件 https://github.com/cilium/ebpf/tree/master/examples/headers ,下载以后放到 goebpf/cebpf/headers 目录中。

之前我们在 tc_write.bpf.c 文件中引用的头文件可以直接改成 #include <common.h>

//#include <bpf/bpf_helpers.h>
//#include <bpf/bpf_tracing.h>
//#include <linux/limits.h>
#include <common.h>

Map 是用户空间和内核空间进行数据交换、信息传递的桥梁,它以 key/value 方式将数据存储在内核中,可以被任何知道它们的 BPF 程序访问。

需要包含 <linux/bpf.h>,使用 SEC 语法糖创建:

struct bpf_map_def SEC("maps") my_bpf_map = {
.type       = BPF_MAP_TYPE_HASH,
.key_size   = sizeof(int),
.value_size   = sizeof(int),
.max_entries = 100,
.map_flags   = BPF_F_NO_PREALLOC,
};

场景的 Map 类型:

  • BPF_MAP_TYPE_HASH:哈希表类型的 map,可以用于快速存取键值对,适用于高速数据查询场景。
  • BPF_MAP_TYPE_ARRAY:数组类型的 map,可以用于存储连续的数据元素,适用于按照顺序访问数据的场景。
  • BPF_MAP_TYPE_PROG_ARRAY:程序数组类型的 map,可以用于存储 eBPF 程序,适用于动态加载和卸载 eBPF 程序的场景。
  • BPF_MAP_TYPE_PERF_EVENT_ARRAY:性能事件数组类型的 map,可以用于收集系统性能数据,例如 CPU 使用率、内存使用率等。
  • BPF_MAP_TYPE_STACK_TRACE:堆栈跟踪类型的 map,可以用于跟踪函数调用堆栈,适用于调试和性能分析场景。
  • BPF_MAP_TYPE_LRU_HASH:LRU哈希表类型的 map,可以用于快速存取键值对,并在内存不足时自动删除最近最少使用的键值对,适用于高速数据查询场景。
  • BPF_MAP_TYPE_LRU_PERCPU_HASH:LRU 哈希表类型的 map,支持多个 CPU 核心并发访问,适用于高速数据查询和多线程场景。
  • BPF_MAP_TYPE_ARRAY_OF_MAPS:map数组类型的 map,可以用于存储其他类型的 map,适用于复杂数据结构的场景。
  • BPF_MAP_TYPE_DEVMAP:设备映射类型的 map,可以将网络设备和 eBPF 程序绑定,适用于网络协议栈优化和网络安全场景。
  • BPF_MAP_TYPE_CPUMAP:CPU 映射类型的 map,可以将 eBPF 程序和 CPU 核心绑定,适用于多核心系统性能优化场景。

tc_write.bpf.c 文件中创建一个 Map,类型是 BPF_MAP_TYPE_PERF_EVENT_ARRAY。

struct bpf_map_def SEC("maps") log_map = {
    .type = BPF_MAP_TYPE_PERF_EVENT_ARRAY,
    .key_size = sizeof(int),
    .value_size = sizeof(__u32),
    .max_entries = 0,
};

向用户态发送程序,BPF_MAP_TYPE_PERF_EVENT_ARRAY 的核心函数是 bpf_perf_event_output()。

bpf_perf_event_output(ctx, &log_map, 0, &data, sizeof(data));

在项目根目录执行 make 命令生成 go 和 o 文件。

make

# 输出
go generate ./...
Compiled /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfel.o
Stripped /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfel.o
Wrote /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfel.go
Compiled /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.o
Stripped /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.o
Wrote /root/sync/ebpf/goebpf/cebpf/tc/tc_write_bpfeb.go

loader.go 文件中添加在用户态读取 Map 的代码。

// 在用户态需要定义 struct 匹配内核态中的 Map
type DataT struct {
    Pid  uint32
    Comm [256]byte
}

// 创建 reader 来读取内核 Map 中的数据
rd, err := perf.NewReader(tc_obj.LogMap, os.Getpagesize())
if err != nil {
    log.Fatalf("creating perf event reader: %s", err)
}
defer rd.Close()

for {
    record, err := rd.Read()
    if err != nil {
        if errors.Is(err, perf.ErrClosed) {
            log.Println("Received signal, exiting..")
            return
        }
        log.Printf("reading from reader: %s", err)
        continue
    }
    if len(record.RawSample) > 0 {
        data := (*DataT)(unsafe.Pointer(&record.RawSample[0]))
        log.Println("进程名:", string(bytes.TrimRight(data.Comm[:], "0x00")))
    }
}

启动 eBPF 程序。

cd goebpf/cmd/tc/
go run main.go

启动被监控的程序。

cd testwrite
./testwrite

# 输出
当前的PID是: 3637570
写入成功 2023-07-08 02:40:25.404906763 +0000 UTC m=+0.000473673
写入成功 2023-07-08 02:40:30.4083393 +0000 UTC m=+5.003906209

运行的 eBPF 程序会输出以下内容:

2023/07/08 02:40:30 进程名: testwrite
2023/07/08 02:40:35 进程名: testwrite

Ring Buffer 入门

Ring Buffer 环形缓冲区:

  • 1 Linux 内核需要 >=5.8
  • 2.解决了 BPF 性能缓冲区的内存效率和事件重排序问题
  • 3.它是一个多生产者单消费者(MPSC)队列,可以同时在多个 CPU 之间安全地共享
  • 4.目前成为内核态到用户空间的优先选择

参考链接:

Ring Buffer 类型的 map 使用内置宏的方式创建。

struct {
    __uint(type, BPF_MAP_TYPE_RINGBUF);
    __uint(max_entries,1<<20);
} log_map SEC(".maps");

使用 Ring Buffer 向用户态发送程序。

  • 方式一:bpf_ringbuf_output() API 的目的是允许从 BPF perfbuf 平滑过渡到 BPF ringbuf,而无需对BPF 代码进行任何实质性更改。但这也意味着它具有 BPF perfbuf API 的一些缺点:额外的内存复制和滞后的数据预留。
struct data_t data = {};
data.pid = bpf_get_current_pid_tgid() >> 32; //获取PID
bpf_get_current_comm(&data.comm, sizeof(data.comm)); //获取进程名称
bpf_ringbuf_output(&log_map, &data, sizeof(data), 0);
  • 方式二:bpf_ringbuf_reserve()/bpf_ringbuf_commit()。Reserve允许你执行以下操作:尽早预留空间或确定不可能的空间(在这种情况下返回NULL)。如果我们没有足够的数据来提交样本,则可以跳过花费所有资源来捕获数据步骤。但是,如果预留成功,那么我们可以保证,一旦完成数据收集,将其发布到用户空间将永远不会失败。即如果bpf_ringbuf_reserve() 返回一个非NULL指针,则后续的 bpf_ringbuf_commit() 将始终成功。在大多数情况下,reserve/commit 是你应该首选的方法。
// 尽早预留空间或确定不可能的空间(在这种情况下返回NULL)
data=bpf_ringbuf_reserve(&log_map, sizeof(*data), 0);
if(!data){
  return 0;
}

data->pid = bpf_get_current_pid_tgid() >> 32; //获取PID
bpf_get_current_comm(&data->comm, sizeof(data->comm)); //获取进程名称
bpf_ringbuf_submit(data, 0); // 向用户态发送数据

启动 eBPF 程序。

cd goebpf/ringbuffer/tc/
go run main.go

运行的 eBPF 程序会输出以下内容:

2023/07/08 03:41:24 进程名: containerd-shim
2023/07/08 03:41:24 进程名: ovs-vswitchd
2023/07/08 03:41:24 进程名: sh
2023/07/08 03:41:24 进程名: sh
2023/07/08 03:41:24 进程名: timeout
2023/07/08 03:41:24 进程名: timeout
2023/07/08 03:41:24 进程名: ovs-vswitchd
2023/07/08 03:41:24 进程名: container_liven
2023/07/08 03:41:24 进程名: container_liven
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash
2023/07/08 03:41:24 进程名: bash

用户态和 XDP 交互

获取 IP, TCP 数据

XDP 程序在 goebpf/cebpf/xdp 目录中。

// 将 xdp 程序挂载到网卡上
l, err := link.AttachXDP(link.XDPOptions{
    Program:   xdpObj.MyPass,
    Interface: iface.Index,
})

启动 eBPF 程序。

cd goebpf/cmd/xdp/
go run main.go

在宿主机中启动一个 HTTP 程序。

python3 -m http.server 8080

启动一个 Docker 容器,访问宿主机的 HTTP 服务。

# 172.17.0.1 是 docker0 网卡
docker run --rm nginx:1.20 curl 172.17.0.1:8080

运行的 eBPF 程序会输出以下内容:

来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:74,入口网卡index:3,来源端口:49342,目标端口:8080
来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:66,入口网卡index:3,来源端口:49342,目标端口:8080
来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:145,入口网卡index:3,来源端口:49342,目标端口:8080
来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:66,入口网卡index:3,来源端口:49342,目标端口:8080
来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:66,入口网卡index:3,来源端口:49342,目标端口:8080
来源IP:172.17.0.2,目标IP:172.17.0.1,包大小:66,入口网卡index:3,来源端口:49342,目标端口:8080

只允许指定 IP 访问

启动两个容器。

docker run -itd --name client1 nginx:1.20 
docker run -itd --name client2 nginx:1.20

查看这两个容器的 IP。

docker inspect -f "{{ .NetworkSettings.IPAddress }}" client1
# 返回结果
172.17.0.2

docker inspect -f "{{ .NetworkSettings.IPAddress }}" client2
# 返回结果
172.17.0.3

在用户态中设置白名单,将 client1 的 IP 加入白名单(标记为 1)。

func initAllowIpMap(m *ebpf.Map) {
	ip1 := binary.BigEndian.Uint32(net.ParseIP("172.17.0.2").To4())
	err := m.Put(ip1, uint8(1))
	if err != nil {
		log.Fatalln("设置白名单出错:", err)
	}
}

在 eBPF 程序中设置 Map,对 value 进行判断,如果为 1,就放行。

 // IP 白名单
struct bpf_map_def SEC("maps") allow_ips_map = {
     .type = BPF_MAP_TYPE_HASH,
     .key_size = sizeof(__u32),
     .value_size = sizeof(__u8), // 设置为 1 表示允许放行
     .max_entries = 1024,
 };
 
 
 
// 如果 IP 在白名单中,就放行 
__u32 sip=bpf_ntohl(ip->saddr);
__u8 *allow=bpf_map_lookup_elem(&allow_ips_map, &sip);
if(allow && *allow==1){ // 在 loader.go 的 initAllowIpMap 方法中会将允许的 IP 地址设置为 1
  return XDP_PASS;
}

return XDP_DROP;

启动 eBPF 程序。

cd goebpf/cmd/xdp/
go run main.go

在宿主机中启动一个 HTTP 程序。

python3 -m http.server 8080

启动一个 Docker 容器,访问宿主机的 HTTP 服务。

# client1 可以访问
docker exec client1 curl 172.17.0.1:8080
# client1 禁止访问
docker exec client2 curl 172.17.0.1:8080