一文教你轻松搞定Linux内核内存泄漏

[导读]内存泄漏是指由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失，而是应用程序分配某段内存后，由于设计错误，导致在释放该段内存之前就失去了对该段内存的控制，从而造成了内存的浪费。

内存泄漏是指由于疏忽或错误造成程序未能释放已经不再使用的内存。内存泄漏并非指内存在物理上的消失，而是应用程序分配某段内存后，由于设计错误，导致在释放该段内存之前就失去了对该段内存的控制，从而造成了内存的浪费。

在Linux中调试内存泄漏，可以使用以下工具：

Valgrind：Valgrind是一个用于检测C/C++程序中内存错误的工具，它可以检测到内存泄漏。安装后，使用valgrind --leak-check=full your_program来运行你的程序，它会在程序结束时报告内存泄漏的详细信息。

GDB：GDB是Linux下的调试工具，可以用来检查程序在运行时的内存使用情况。但是GDB本身不能直接用来检测内存泄漏，但可以配合其他工具如gcore来生成core dump文件，然后用像Valgrind这样的工具分析这个core dump。

MALLOC_TRACE：如果你的程序使用了mmap或其他方式分配了大量的内存，但是没有及时释放，你可以设置环境变量MALLOC_TRACE来跟踪内存分配。例如：

export MALLOC_TRACE=memory.log./your_programmalloc_trace memory.log

这将会在memory.log文件中记录所有的内存分配和释放操作，然后你可以手动检查这个文件来查找可能的内存泄漏。

Application Instrumentation：你可以在你的代码中添加自定义的内存分配和释放的跟踪代码，记录每个内存块的分配和释放信息，这样可以更精确地定位内存泄漏的位置。

DTrace/SystemTap：这些动态跟踪工具可以用来跟踪程序的内存分配和释放行为，帮助定位内存泄漏。

LeakSanitizer：如果你在使用LLVM/Clang编译器，可以使用LeakSanitizer来检测内存泄漏。在编译时加上-fsanitize=leak标志，运行时会报告内存泄漏的位置。

选择合适的工具根据你的程序和需求进行使用。通常情况下，Valgrind是最简单和最直接的选择。

我们平时开发过程中不可避免的会遇到内存泄漏问题，你是如何排查的呢?估计你是使用下面这几个工具吧?

valgrind

mtrace

dmalloc

ccmalloc

memwatch

debug_new

这里程序喵向大家推荐新的一个排查内存泄漏的工具：AddressSanitizer(ASan)，该工具为gcc自带，4.8以上版本都可以使用，支持Linux、OS、Android等多种平台，不止可以检测内存泄漏，它其实是一个内存错误检测工具，可以检测的问题有：

内存泄漏

堆栈和全局内存越界访问

free后继续使用

局部内存被外层使用

Initialization order bugs(中文不知道怎么翻译才好，后面有代码举例，重要)

1、Kmemleak介绍

在Linux内核开发中，Kmemleak是一种用于检测内核中内存泄漏的工具。

内存泄漏指的是程序中已经不再使用的内存没有被妥善地释放，导致内存的浪费。内核中的内存泄漏同样会导致系统性能下降、系统崩溃等问题。

Kmemleak能够检测内核中的内存泄漏，通过检测内核中未被释放但又无法找到其使用位置的内存，进一步定位、修复内存泄漏的问题。

在用户空间，我们常用Valgrind来检测;在内核空间，我们常用Kmemleak来检测。

2、如何使用Kmemleak

2.1 内核配置

内核打开相应配置：

CONFIG_DEBUG_KMEMLEAK：Kmemleak被加入到内核

CONFIG_DEBUG_KMEMLEAK_EARLY_LOG_SIZE设置为16000：该参数为记录内存泄露信息的内存池，越大记录信息越多。

CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF ：Kmemleak默认开关状态

依赖的配置：

CONFIG_DEBUG_KERNEL：打开内核调试功能

CONFIG_DEBUG_FS：需要借助到debugfsCONFIG_STACKTRACE：记录进程的堆栈信息

2.2 用户空间配置

我们要想使用Kmemleak，需要挂在debugfs，来查看泄露的情况。

进入文件系统后，进行挂载：

代码语言：javascript

复制

mount -t debugfs nodev /sys/kernel/debug/ # 挂在debugfs

设置扫描时间：

代码语言：javascript

复制

echo scan=10 > /sys/kernel/debug/kmemleak # 10S扫描一次

默认内存泄露检测时间为10min，上面设置为10s一次

查看泄露情况：

代码语言：javascript

复制

cat /sys/kernel/debug/kmemleak # 查看内存泄露情况

其他指令：

代码语言：javascript

复制

echo scan > /sys/kernel/debug/kmemleak #触发一次扫描

echo clear > /sys/kernel/debug/kmemleak #清除当前 kmemleak 记录的泄露信息

echo off > /sys/kernel/debug/kmemleak #关闭kmemleak(不可逆转的)

echo stack=off > /sys/kernel/debug/kmemleak #关闭任务栈扫描

echo stack=on > /sys/kernel/debug/kmemleak #使能任务栈扫描

echo scan=on > /sys/kernel/debug/kmemleak #启动自动内存扫描线程

echo scan=off > /sys/kernel/debug/kmemleak #停止自动内存扫描线程

echo scan= > /sys/kernel/debug/kmemleak#设置自动扫描线程扫描间隔，默认是600，设置0则是停止扫描

echo dump= > /sys/kernel/debug/kmemleak #dump某个地址的内存块信息，比如上面的echo dump=0xffffffc008efd200 > /sys/kernel/debug/kmemleak即可查看详细信息

2.3 通过Linux启动参数控制开关

Kmemleak的默认开关状态可以通过CONFIG_DEBUG_KMEMLEAK_DEFAULT_OFF 配置来控制，当然也可以通过向Linux内核启动参数中加入kmemleak=off来控制。

3、Kmemleak原理

Kmemleak提供了一种跟踪垃圾回收器tracing garbage collector的原理，来检测内核中存在的内存泄露，其不同之处在于：孤立的对象并没有被释放掉，而是通过/sys/kernel/debug/kmemleak仅仅被报告。

这种方法同样应用于Valgrind中，不过该工具主要用于检测用户空间不同应用的内存泄露情况。在用户空间，我们常用Valgrind来检测应用进程;在内核空间，我们常用Kmemleak来检测内核代码。

通过kmalloc()、vmalloc()、kmem_cache_alloc()等函数分配内存时，会跟踪指针，堆栈等信息，将其存储在一个红黑树中。

同时跟踪相应的释放函数调用，并从kmemleak数据结构中删除指针。

简单理解：相当于追踪内存分配相关接口，记录分配内存的首地址，堆栈大小等信息，在内存释放阶段将其删除。

我们通过查看相关内核文档可知，内存泄露检测的扫描算法步骤如下：

将所有对象标记为白色(最后剩余的白色对象将被视为孤立对象)

从数据段和堆栈开始扫描内存，根据红黑树中存储的地址信息来检查值，如果找到指向白色对象的指针，则添加到灰色列表

扫描灰色列表以查找地址匹配的对象，直到灰色列表完成

剩下的白色对象被视为孤立对象，并通过/sys/kernel/debug/kmemleak进行报告

4、Kmemleak API接口

代码语言：javascript

复制

kmemleak_init - 初始化 kmemleak

kmemleak_alloc - 内存块分配通知

kmemleak_alloc_percpu - 通知 percpu 内存块分配

kmemleak_vmalloc - 通知 vmalloc() 内存分配

kmemleak_free - 通知内存块释放

kmemleak_free_part - 通知释放部分内存块

kmemleak_free_percpu - 通知 percpu 内存块释放

kmemleak_update_trace - 更新对象分配堆栈跟踪

kmemleak_not_leak - 将对象标记为非泄漏

kmemleak_ignore - 不扫描或报告对象泄漏

kmemleak_scan_area - 在内存块内添加扫描区域

kmemleak_no_scan - 不扫描内存块

kmemleak_erase - 擦除指针变量中的旧值

kmemleak_alloc_recursive - 作为kmemleak_alloc，但检查递归性

kmemleak_free_recursive - 作为kmemleak_free，但检查递归性

5、Kmemleak特殊情况

漏报：真正内存泄露了，但是未报告，因为在内存扫描期间找到的值指向此类对象。为了减少误报的数量，kmemleak提供了kmemleak_ignore，kmemleak_scan_area，kmemleak_no_scan和kmemleak_erase功能

误报：实际没有泄露，但是却错误的报告了内存泄露。kmemleak提供了kmemleak_not_leak功能。

6、Kmemleak验证

内核也提供了一个示例：kmemleak-test模块，该模块用以判断是否打开了Kmemleak功能。通过配置CONFIG_DEBUG_KMEMLEAK_TEST选项可以选择。

代码语言：javascript

复制

# modprobe kmemleak-test

# echo scan > /sys/kernel/debug/kmemleak

代码语言：javascript

复制

# cat /sys/kernel/debug/kmemleak

unreferenced object 0xffff89862ca702e8 (size 32):

comm "modprobe", pid 2088, jiffies 4294680594 (age 375.486s)

hex dump (first 32 bytes):

6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b kkkkkkkkkkkkkkkk

6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b 6b a5 kkkkkkkkkkkkkkk.

backtrace:

[<00000000e0a73ec7>] 0xffffffffc01d2036

[<000000000c5d2a46>] do_one_initcall+0x41/0x1df

[<0000000046db7e0a>] do_init_module+0x55/0x200

[<00000000542b9814>] load_module+0x203c/0x2480

[<00000000c2850256>] __do_sys_finit_module+0xba/0xe0

[<000000006564e7ef>] do_syscall_64+0x43/0x110

[<000000007c873fa6>] entry_SYSCALL_64_after_hwframe+0x44/0xa9

...

一文教你轻松搞定Linux内核内存泄漏

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

从容应对未知风险----解密亚马逊云科技的韧性之道

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

独立自主！华为董事：致力打造不依赖西方的技术

华为张平安：数字世界话语权最终由生态繁荣决定！

中国通信服务公布2024年中期业绩

NVI技术创新联盟成立！自主生态将带动产业链高速发展

软通动力与长三角投资达成战略合作共谋数字生态新发展

海南区6家凯悦系酒店与岚图达成战略合作，共同推动新能源出行体验

安岚携手妮可•巴菲特开启疗愈之旅在秋日红叶的浪漫中疗愈身心

不惧美国封锁！华为：我们给大家提供系统、存储等

尼尔森IQ深耕中国四十载，共绘未来新篇章

第二十二届跨盈年度B2B营销高管峰会2025聚焦"营销竞取，打破市场内卷实现认知进化"

恒久动力驰骋天地美孚1号携手周冠宇邀您纵擎驰骋，劲享驾趣体验

美通社母公司Cision发布CisionOne平台，进军亚太地区媒体监测市场

移远通信推出大模型解决方案，重塑千行百业智能边界

高途公布2024年第二季度未经审计业绩

华为发布AI百校计划：培养AI人才每年获最高100万支持