Linux bpftrace 命令

Linux 命令大全

bpftrace 是一个基于 eBPF (扩展伯克利包过滤器) 的高级追踪工具，它允许开发者在不修改内核代码的情况下，动态地观察和分析 Linux 系统的运行状态。

eBPF 是 Linux 内核中的一项革命性技术，它提供了一个安全的虚拟机环境，可以在内核中运行用户定义的代码。bpftrace 构建在 eBPF 之上，提供了一个更简单、更高级的抽象层。

bpftrace 的核心优势

实时系统观测

无需重启系统或应用
极低的性能开销
可以观测内核和用户空间程序

灵活的探测能力

支持多种探测点类型：函数入口/出口、定时器、硬件事件等
可以追踪系统调用、网络事件、磁盘 I/O 等

简单的脚本语言

类似 AWK 的语法，学习曲线平缓
内置丰富的函数和变量
支持条件过滤和聚合统计

bpftrace 安装与配置

安装方法

实例

# Ubuntu/Debian
sudo apt install bpftrace

# CentOS/RHEL
sudo yum install bpftrace

# 从源码编译
git clone https://github.com/iovisor/bpftrace.git
mkdir bpftrace/build && cd bpftrace/build
cmake ..
make
sudo make install

验证安装

sudo bpftrace -e 'BEGIN { printf("Hello, bpftrace!n"); }'

bpftrace 基本语法

bpftrace 程序由探测点(probe)和关联的动作(action)组成，基本结构如下：

probe /filter/ {
    action
}

探测点类型

探测点类型	描述	示例
`kprobe`	内核函数入口	`kprobe:vfs_read`
`kretprobe`	内核函数返回	`kretprobe:vfs_read`
`uprobe`	用户空间函数入口	`uprobe:/bin/bash:readline`
`tracepoint`	内核静态追踪点	`tracepoint:syscalls:sys_enter_open`
`interval`	定时触发	`interval:s:5`
`software`	软件事件	`software:faults:major`

常用内置变量

pid：当前进程 ID
tid：当前线程 ID
comm：当前进程名
nsecs：纳秒级时间戳
arg0-argN：函数参数
retval：函数返回值

bpftrace 实用示例

1. 追踪系统调用

实例

# 统计 open 系统调用的次数
sudo bpftrace -e 'tracepoint:syscalls:sys_enter_open { @[comm] = count(); }'

2. 分析函数执行时间

实例

# 测量 vfs_read 的执行时间
sudo bpftrace -e '
kprobe:vfs_read { @start[tid] = nsecs; }
kretprobe:vfs_read /@start[tid]/ {
@times = hist(nsecs - @start[tid]);
delete(@start[tid]);
}'

3. 监控进程的文件访问

实例

# 跟踪指定进程打开的文件
sudo bpftrace -e 'tracepoint:syscalls:sys_enter_openat /pid == 1234/ { printf("%s -> %sn", comm, str(args->filename)); }'

4. 统计 TCP 连接

实例

# 按进程统计 TCP 连接数
sudo bpftrace -e 'kprobe:tcp_connect { @[comm] = count(); }'

bpftrace 高级特性

1. 地图(Map)功能

bpftrace 提供了多种内置地图类型用于数据聚合：

实例

# 统计直方图
@hist = hist(nsecs);

# 计算平均值
@avg = avg(nsecs);

# 统计唯一值
@unique = count();

2. 条件过滤

实例

# 只追踪特定进程的 read 调用
tracepoint:syscalls:sys_enter_read /pid == 1234/ {
printf("PID %d reading %d bytesn", pid, args->count);
}

3. 多探针组合

实例

# 跟踪从 socket 创建到连接的全过程
kprobe:sock_alloc {
@socket[tid] = 1;
}

kprobe:tcp_connect /@socket[tid]/ {
printf("socket %d connecting to %s:%dn", args->sock->__sk_common.skc_dport,
ntop(args->sock->__sk_common.skc_daddr),
args->sock->__sk_common.skc_dport);
delete(@socket[tid]);
}

bpftrace 最佳实践

限制追踪范围：使用 PID 或命令名过滤，减少系统开销
避免过度打印：过多的 printf 会影响性能
使用聚合：尽量使用 count()、sum() 等聚合函数
清理资源：长时间运行的脚本要定期清理地图数据
安全考虑：bpftrace 需要 root 权限，谨慎运行未知脚本

bpftrace 与其他工具对比

工具	优点	缺点
bpftrace	灵活、高性能、易用	需要 root 权限
strace	简单、无需编译	性能开销大
perf	功能全面、低开销	学习曲线陡峭
SystemTap	功能强大	需要编译、配置复杂

学习资源推荐

bpftrace 是系统性能分析和故障排查的强大工具，通过实践这些示例和掌握其核心概念，你将能够更深入地理解和优化 Linux 系统的运行行为。

Linux 命令大全

菜鸟教程 -- 学的不仅是技术，更是梦想！

Shell 教程

Linux 参考手册

Linux bpftrace 命令

bpftrace 的核心优势

实时系统观测

灵活的探测能力

简单的脚本语言

bpftrace 安装与配置

安装方法

实例

验证安装

bpftrace 基本语法

探测点类型

常用内置变量

bpftrace 实用示例

1. 追踪系统调用

实例

2. 分析函数执行时间

实例

3. 监控进程的文件访问

实例

4. 统计 TCP 连接

实例

bpftrace 高级特性

1. 地图(Map)功能

实例

2. 条件过滤

实例

3. 多探针组合

实例

bpftrace 最佳实践

bpftrace 与其他工具对比

学习资源推荐

点我分享笔记

菜鸟教程 -- 学的不仅是技术，更是梦想！

Shell 教程

Linux 参考手册

Linux bpftrace 命令

bpftrace 的核心优势

实时系统观测

灵活的探测能力

简单的脚本语言

bpftrace 安装与配置

安装方法

实例

验证安装

bpftrace 基本语法

探测点类型

常用内置变量

bpftrace 实用示例

1. 追踪系统调用

实例

2. 分析函数执行时间

实例

3. 监控进程的文件访问

实例

4. 统计 TCP 连接

实例

bpftrace 高级特性

1. 地图(Map)功能

实例

2. 条件过滤

实例

3. 多探针组合

实例

bpftrace 最佳实践

bpftrace 与其他工具对比

学习资源推荐

点我分享笔记

微信关注