一文教你轻松搞定Linux内核内存泄漏
扫描二维码
随时随地手机看文章
内存泄漏是指由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失,而是应用程序分配某段内存后,由于设计错误,导致在释放该段内存之前就失去了对该段内存的控制,从而造成了内存的浪费。
在Linux中调试内存泄漏,可以使用以下工具:
Valgrind:Valgrind是一个用于检测C/C++程序中内存错误的工具,它可以检测到内存泄漏。安装后,使用valgrind --leak-check=full your_program来运行你的程序,它会在程序结束时报告内存泄漏的详细信息。
GDB:GDB是Linux下的调试工具,可以用来检查程序在运行时的内存使用情况。但是GDB本身不能直接用来检测内存泄漏,但可以配合其他工具如gcore来生成core dump文件,然后用像Valgrind这样的工具分析这个core dump。
MALLOC_TRACE:如果你的程序使用了mmap或其他方式分配了大量的内存,但是没有及时释放,你可以设置环境变量MALLOC_TRACE来跟踪内存分配。例如:
export MALLOC_TRACE=memory.log./your_programmalloc_trace memory.log
这将会在memory.log文件中记录所有的内存分配和释放操作,然后你可以手动检查这个文件来查找可能的内存泄漏。
Application Instrumentation:你可以在你的代码中添加自定义的内存分配和释放的跟踪代码,记录每个内存块的分配和释放信息,这样可以更精确地定位内存泄漏的位置。
DTrace/SystemTap:这些动态跟踪工具可以用来跟踪程序的内存分配和释放行为,帮助定位内存泄漏。
LeakSanitizer:如果你在使用LLVM/Clang编译器,可以使用LeakSanitizer来检测内存泄漏。在编译时加上-fsanitize=leak标志,运行时会报告内存泄漏的位置。
选择合适的工具根据你的程序和需求进行使用。通常情况下,Valgrind是最简单和最直接的选择。
我们平时开发过程中不可避免的会遇到内存泄漏问题,你是如何排查的呢?估计你是使用下面这几个工具吧?
valgrind
mtrace
dmalloc
ccmalloc
memwatch
debug_new
这里程序喵向大家推荐新的一个排查内存泄漏的工具:AddressSanitizer(ASan),该工具为gcc自带,4.8以上版本都可以使用,支持Linux、OS、Android等多种平台,不止可以检测内存泄漏,它其实是一个内存错误检测工具,可以检测的问题有:
内存泄漏
堆栈和全局内存越界访问
free后继续使用
局部内存被外层使用
Initialization order bugs(中文不知道怎么翻译才好,后面有代码举例,重要)
1、Kmemleak介绍
在Linux内核开发中,Kmemleak是一种用于检测内核中内存泄漏的工具。
内存泄漏指的是程序中已经不再使用的内存没有被妥善地释放,导致内存的浪费。内核中的内存泄漏同样会导致系统性能下降、系统崩溃等问题。
Kmemleak能够检测内核中的内存泄漏,通过检测内核中未被释放但又无法找到其使用位置的内存,进一步定位、修复内存泄漏的问题。
在用户空间,我们常用Valgrind来检测;在内核空间,我们常用Kmemleak来检测。
2、如何使用Kmemleak
2.1 内核配置
内核打开相应配置:
CONFIG_DEBUG_KMEMLEAK:Kmemleak被加入到内核
CONFIG_DEBUG_KMEMLEAK_EARLY_LOG_SIZE设置为16000:该参数为记录内存泄露信息的内存池,越大记录信息越多。
CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF :Kmemleak默认开关状态
依赖的配置:
CONFIG_DEBUG_KERNEL:打开内核调试功能
CONFIG_DEBUG_FS:需要借助到debugfsCONFIG_STACKTRACE:记录进程的堆栈信息
2.2 用户空间配置
我们要想使用Kmemleak,需要挂在debugfs,来查看泄露的情况。
进入文件系统后,进行挂载:
代码语言:javascript
复制
mount -t debugfs nodev /sys/kernel/debug/ # 挂在debugfs
设置扫描时间:
代码语言:javascript
复制
echo scan=10 > /sys/kernel/debug/kmemleak # 10S扫描一次
默认内存泄露检测时间为10min,上面设置为10s一次
查看泄露情况:
代码语言:javascript
复制
cat /sys/kernel/debug/kmemleak # 查看内存泄露情况
其他指令:
代码语言:javascript
复制
echo scan > /sys/kernel/debug/kmemleak #触发一次扫描
echo clear > /sys/kernel/debug/kmemleak #清除当前 kmemleak 记录的泄露信息
echo off > /sys/kernel/debug/kmemleak #关闭kmemleak(不可逆转的)
echo stack=off > /sys/kernel/debug/kmemleak #关闭任务栈扫描
echo stack=on > /sys/kernel/debug/kmemleak #使能任务栈扫描
echo scan=on > /sys/kernel/debug/kmemleak #启动自动内存扫描线程
echo scan=off > /sys/kernel/debug/kmemleak #停止自动内存扫描线程
echo scan= > /sys/kernel/debug/kmemleak#设置自动扫描线程扫描间隔,默认是600,设置0则是停止扫描
echo dump= > /sys/kernel/debug/kmemleak #dump某个地址的内存块信息,比如上面的echo dump=0xffffffc008efd200 > /sys/kernel/debug/kmemleak即可查看详细信息
2.3 通过Linux启动参数控制开关
Kmemleak的默认开关状态可以通过CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF 配置来控制,当然也可以通过向Linux内核启动参数中加入kmemleak=off来控制。
3、Kmemleak原理
Kmemleak提供了一种跟踪垃圾回收器tracing garbage collector的原理,来检测内核中存在的内存泄露,其不同之处在于:孤立的对象并没有被释放掉,而是通过/sys/kernel/debug/kmemleak仅仅被报告。
这种方法同样应用于Valgrind中,不过该工具主要用于检测用户空间不同应用的内存泄露情况。在用户空间,我们常用Valgrind来检测应用进程;在内核空间,我们常用Kmemleak来检测内核代码。
通过kmalloc()、vmalloc()、kmem_cache_alloc()等函数分配内存时,会跟踪指针,堆栈等信息,将其存储在一个红黑树中。
同时跟踪相应的释放函数调用,并从kmemleak数据结构中删除指针。
简单理解:相当于追踪内存分配相关接口,记录分配内存的首地址,堆栈大小等信息,在内存释放阶段将其删除。
我们通过查看相关内核文档可知,内存泄露检测的扫描算法步骤如下:
将所有对象标记为白色(最后剩余的白色对象将被视为孤立对象)
从数据段和堆栈开始扫描内存,根据红黑树中存储的地址信息来检查值,如果找到指向白色对象的指针,则添加到灰色列表
扫描灰色列表以查找地址匹配的对象,直到灰色列表完成
剩下的白色对象被视为孤立对象,并通过/sys/kernel/debug/kmemleak进行报告
4、Kmemleak API接口
代码语言:javascript
复制
kmemleak_init - 初始化 kmemleak
kmemleak_alloc - 内存块分配通知
kmemleak_alloc_percpu - 通知 percpu 内存块分配
kmemleak_vmalloc - 通知 vmalloc() 内存分配
kmemleak_free - 通知内存块释放
kmemleak_free_part - 通知释放部分内存块
kmemleak_free_percpu - 通知 percpu 内存块释放
kmemleak_update_trace - 更新对象分配堆栈跟踪
kmemleak_not_leak - 将对象标记为非泄漏
kmemleak_ignore - 不扫描或报告对象泄漏
kmemleak_scan_area - 在内存块内添加扫描区域
kmemleak_no_scan - 不扫描内存块
kmemleak_erase - 擦除指针变量中的旧值
kmemleak_alloc_recursive - 作为kmemleak_alloc,但检查递归性
kmemleak_free_recursive - 作为kmemleak_free,但检查递归性
5、Kmemleak特殊情况
漏报:真正内存泄露了,但是未报告,因为在内存扫描期间找到的值指向此类对象。为了减少误报的数量,kmemleak提供了kmemleak_ignore,kmemleak_scan_area,kmemleak_no_scan和kmemleak_erase功能
误报:实际没有泄露,但是却错误的报告了内存泄露。kmemleak提供了kmemleak_not_leak功能。
6、Kmemleak验证
内核也提供了一个示例:kmemleak-test模块,该模块用以判断是否打开了Kmemleak功能。通过配置CONFIG_DEBUG_KMEMLEAK_TEST选项可以选择。
代码语言:javascript
复制
# modprobe kmemleak-test
# echo scan > /sys/kernel/debug/kmemleak
代码语言:javascript
复制
# cat /sys/kernel/debug/kmemleak
unreferenced object 0xffff89862ca702e8 (size 32):
comm "modprobe", pid 2088, jiffies 4294680594 (age 375.486s)
hex dump (first 32 bytes):
6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b kkkkkkkkkkkkkkkk
6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b a5 kkkkkkkkkkkkkkk.
backtrace:
[<00000000e0a73ec7>] 0xffffffffc01d2036
[<000000000c5d2a46>] do_one_initcall+0x41/0x1df
[<0000000046db7e0a>] do_init_module+0x55/0x200
[<00000000542b9814>] load_module+0x203c/0x2480
[<00000000c2850256>] __do_sys_finit_module+0xba/0xe0
[<000000006564e7ef>] do_syscall_64+0x43/0x110
[<000000007c873fa6>] entry_SYSCALL_64_after_hwframe+0x44/0xa9
...