【中断】那么重要，它的本质到底是什么？

[导读]在软件开发中，中断是一个绕不开的重要话题，但是，不知道您是否遇到过这样的困惑：很多书籍、文章在介绍中断相关的知识点时，说的都挺有道理。这篇文章对中断的讲解很正确，那篇文章在描述中断的时候也挺对的，但是，这两篇文章中，怎么有些内容是矛盾的啊？！单独看任何一篇文章感觉都有道理，看的越...

在软件开发中，中断是一个绕不开的重要话题，但是，不知道您是否遇到过这样的困惑：

很多书籍、文章在介绍中断相关的知识点时，说的都挺有道理。

这篇文章对中断的讲解很正确，那篇文章在描述中断的时候也挺对的，但是，这两篇文章中，怎么有些内容是矛盾的啊？！

单独看任何一篇文章感觉都有道理，看的越多，反而越迷糊？

好比在森林里迷路了，如果只有一个指南针，肯定能走出来。

但是，如果你有 2 个指南针，所指的方向却是相反的，这个时候应该相信谁呢？！

我们仔细梳理了一下就会发现：每一篇文章都是在一定的语境、一定的上下文环境中来讲解的，不同文章的矛盾之处，恰恰是它们所描述的那个上下文大环境不同。

上下文环境，就是描述当前正在执行的程序相关的静态信息，比如：有哪些代码段，栈空间在哪里，进程描述信息在什么位置，当前执行到哪一条指令等等。

如果我们没有一个全局的视角，在同一个上下文环境中来对比不同的文章，就会让自己的理解和认识越来越蒙圈。

因此，对于这种概念比较庞杂，无法用某种确定的逻辑来贯穿的知识点，在脑袋中一定要有一幅全局的地图。

只有对这个全局的地图掌握了，在具体学习每一个局部的知识点时，才能知道自己所处的位置在哪里，才不至于走偏。

这篇文章，我们继续去繁从简，从 8086 这个最简单的处理器入手，来聊一下关于中断的一些知识。

有了这个储备，理清了基本的脉络之后，以后再去学习 Linux 系统中的中断相关内容时，才会有原来如此的感觉！

中断向量与中断描述符

中断向量这个词很时髦，也很神秘！

按道理，不应该在第一部分就端上中断向量这盘硬菜，应该从中断源开始聊起。

但是，毕竟我们已经学习过那么多关于中断的知识了，脑袋中肯定是对中断已经有了一些的基本认知。

所以，在这里我们还是首先来明确一下中断向量和中断描述符这个问题。

在前面的文章中已经聊过关于实模式和保护模式的问题，在【Linux 从头学】这个系列中，我们一直以来描述的都是实模式下的事情。

本文是实模式下的最后一篇文章，下一篇文章将会进入保护模式。

那么，中断向量就是工作在实模式下的，处理器通过中断号和中断向量，来定位到相应的中断处理程序。

而中断描述符呢，就是工作在保护模式下，处理器通过中断号和中断描述符，来定位到相应的中断处理程序。

也就是说：中断向量和中断描述符，它俩的根本作用是一样的。

只是它们存在于不同的大环境中，而且从描述上也能感觉到，保护模式下的中断描述符会更复杂一些，功能也更强大一些。

它俩就像一对兄弟一样，从外表上看是差不多，功能也是类似。但是透入到内部去看，就会发现有很多的不同之处。

因此，这篇文章我们讲解的就是在实模式下的中断，这一点请大家先明白。

中断的分类

在 x86 系统中，中断的分类如下：

内部中断

所谓的内部中断，是在 CPU 内部产生并进行处理的。比如：

CPU 遇到一条除以 0 的指令时，将产生 0 号中断，并调用相应的中断处理程序;
CPU 遇到一条不存在的非法指令时，将产生 6 号中断，并调用相应的中断处理程序;

对于内部中断，有时候也称之为异常。

软中断也属于内部中断，是非常有用的，它是由 int 指令触发的。比如 int3 这条指令，gdb 就是利用它来实现对应用程序的调试。

很久之前写过这样的一篇文章原来gdb的底层调试原理这么简单，其中就描述了 gdb 是如何通过插入一个 int 指令，来替换被调试程序的指令码，从而实现断点调试功能的。

外部中断

x86 CPU 上有 2 个中断引脚：INT 和 INTR，分别对应：不可屏蔽中断和可屏蔽中断。

所谓不可屏蔽，就是说：中断不可以被忽视，CPU 必须处理这个中断。

如果不处理，程序就没法继续执行。

而对于可屏蔽中断，CPU 可以忽略它不执行，因为这类中断不会对系统的执行造成致命的影响。

对于外部的可屏蔽中断，CPU 上只有一根 INTR 引脚，但是需要产生中断信号的设备那么多，如何对众多的中断信号进行区分呢？

一般都是通过可编程中断控制器(Programmable Interrupt Controller, PIC)，在计算机中使用最多的就是 8259a 芯片。

虽然现代计算机都已经是 APIC(高级可编程中断控制器) 了，但是由于 8259a 芯片是那么的经典，大部分描述外部中断的文章都会用它来举例。

每一片 8259a 可以提供 8 个中断输入引脚，两片芯片级联在一起，就可以提供 15 个中断信号：

主片的输出引脚 INT 连接到 CPU 的 INTR 引脚上;
从片的输出引脚 INT 连接到主片的引脚 2 上;

这样的话，两片 8259a 芯片就可以向 CPU 提供 15 个中断信号了，比如：鼠标、键盘、串口、硬盘等等外设。

1. 8259a 之所以称作可编程，是因为它的内部有相关的寄存器。
2. 可以通过指定的端口号，对这些寄存器进行设置，让 8 根 IRQ 中断线上的信号，在送到 CPU 时，对应不同的中断号。

另外，对于外部可屏蔽中断，有 2 层的屏蔽机制：

在 8259 芯片中，有中断屏蔽寄存器，可以对 IRQ0 ~ IRQ7 输入引脚进行屏蔽;
在 CPU 内部，也有一个标志寄存器，可以对某一类中断信号进行屏蔽;

中断号

在 x86 处理器中，一共支持 256 个中断，每一个中断都分配了一个中断号，从 0 到 255。

其中，0 ~ 31 号中断向量被保留，用来处理异常和非屏蔽中断(其中只有 2 号向量用于非屏蔽中断，其余全部是异常)。

当 BIOS 或者操作系统提供了异常处理程序之后，当一个异常产生时，就会通过中断向量表找到响应的异常处理程序，查找的过程马上就会介绍到。

从中断号 32 开始，全部分配给外部中断。

比如：

1. 系统定时器中断 IRQ0，分配的就是 32 号中断;
2. Linux 的系统调用，分配的就是 128 号中断;

我们来分别看一下内部中断和外部中断相关的中断号：

对于通过 8259a 可编程中断控制器接入的中断信号分配如下图所示：

刚才已经说过，8259a 是可编程的，假如我们通过配置寄存器，把 IRQ0 的中断号设置为 32, 那么主片上 IRQ1 ~ IRQ7 所对应的中断号依次加 1，从片上 IRQ8~IRQ15 对应的中断号也是依次递增。

所以，有时候我们可以在代码中断看到下面的宏定义：

中断向量和中断处理程序

当一个中断发生的时候，CPU 获取到该中断对应的中断号，下一步就是要确定调用哪一个函数来处理这个中断，这个函数就称作中断服务程序(Interrupt Service Routine，ISR)，有时候也称作中断处理程序、中断处理函数，本质都一样。

中断向，就是通过中断号去查找处理程序的重要的桥梁！

中断向量的本质

在 8086 中，一个中断向量，就是一个段地址:中断处理函数偏移量这样的一对数据，通过这个数据，就可以定位到内存中指定位置的那个中断处理函数。

非常类似于高级编程语言中的函数指针，就是用来指向一个函数的开始地址。

8086 规定：256 个中断向量，必须从内存的 0 地址处开始存放。

每一个中断向量占用 4 个字节(2 个字节的段地址，2 个字节的偏移地址)，256 个中断一共占用了 1024 个字节的空间。

之前的文章中，已经介绍过相关的内存模型，如下图所示：

如果把一个中断向量看作函数指针，那么这个中断向量表就相当于是函数指针数组。

举例：

假设 2 号中断被触发了，CPU 就会到中断向量表中查找 2 号中断的中断向量。

因为每一个中断向量占据 4 个字节，那么 2 号中断向量的开始地址就是 2 * 4 = 8，第 8 个字节。

然后在第 8 个字节开始，取 4 个字节的内容：0x1000:0x2000。

意思是：2 号中断的处理函数，在段地址为 0x1000，偏移量为 0x2000 的位置处。

那么 CPU 就按照 8086 的物理地址计算方式，得到中断处理函数的物理地址为 0x12000 (段地址左移 4 位偏移地址)，于是就跳转到该函数地址处去执行。

1. 由于 Linux 系统是运行在保护模式，在这个模式下，当发生中断时，是通过中断描述符来查找中断处理函数的。
2. 每一个中断描述符，描述了一个中断处理函数所在段的选择子和偏移量，本质上也是用来查找一个中断处理函数。

中断处理程序的安装

既然通过中断向量，找到了中断处理程序，那么这些中断处理程序都是谁放在内存中的呢？

如果您看过一些比较底层的计算机书籍，就能看到一般都会举例：如何手动的把一个普通函数设置为一个中断处理函数。

操作步骤是：

在代码中，写一个普通函数;
把这个函数的指令码，搬运到内存中的某一个位置;
把这个位置(段地址:偏移量)，作为一个中断向量，设置到中断向量表中;

此时，如果发生了该中断，你所提供的函数就作为中断处理函数被执行了。

当然了，在一个计算机系统中，BIOS、操作系统和各种外设，会自动为我们提供很多基本的中断处理函数的。

比如：BIOS 中就提供了软中断、内部中断、硬件中断等处理函数，这些函数是固化在 BIOS 的代码中的(映射到 BIOS 所在的 ROM 芯片上)，BIOS 只需要把这些处理函数的地址，写入到中断向量表中的相应位置即可。

在之前的文章中提到过，内存中的某些位置是映射到外设的 ROM，在这些外设的 ROM 中也存在一些外设自带的程序。

BIOS 在启动时，会扫描这些映射到外设的内存空间，通过某些关键字信息，如果发现外设有自带的程序，就会去执行。

这些外设程序一般是进行一些自身的初始化，并填写相关的中断向量表，使它们指向外设自带的中断处理程序。

对于操作系统来说就更不用说了，它会重新安排自己需要的中断处理函数，这部分内容我们以后再一起学习、讨论！

中断现场的保护和恢复

当一个中断发生的时候，肯定有一个正在执行的程序被打断。

当中断处理函数执行结束之后，这个被打断的程序需要从刚才被打断的地方继续执行(暂时先不要考虑从中断返回点，进行多任务切换的事情)。

而一个程序执行的上下文环境，就是处理器中的各种寄存器内容：代码段寄存器 cs，指令指针寄存器 sp，标志寄存器 FLAGS。

但是，在中断处理程序中，也需要使用这些寄存器。

处理器中的这些寄存器，就是每一个程序执行时上下文信息的存储容器，当然也包括终端处理程序！

因此，在进入中断处理程序之前，CPU 会自动的把这些寄存器 push 到栈中保存起来，然后再跳转到中断处理程序中去执行。

当中断处理程序执行结束后，CPU 会从栈中弹出这些内容，恢复到相应的寄存器中，于是被打断的程序就可以继续执行了。

总结：中断的本质

从功能的角度看，中断有 2 个作用：

提供执行异步序列的机制；
给应用程序提供进入系统层的入口；

关于第 2 点，以后在介绍到 Linux 中的 int 0x80 中断就非常清楚了，也就是通过中断，让应用层的程序有机会进入到系统代码中去执行。

因为应用层与操作系统层的代码，是工作在不同的安全级别。

为了系统的安全，Linux 操作系统提供了这样的一个机制，让低安全级别的应用程序，进入到高安全级别的操作系统代码中去执行，毕竟所有的硬件等系统资源都是由操作系统来统一管理的。

我们再从中断处理程序的安装角度来看，中断本质上就是增加了一层间接性：通过固定位置的中断向量表，让中断处理函数的实际地址可以被动态的放在任意位置。

为什么这么做？

假如操作系统想为某一个中断提供处理函数，那么这个处理函数的地址放在内存中的什么位置比较合适?

需要考虑 CPU, 内存大小和布局等多种因素，非常复杂！

而通过使用中断向量表，就在一个固定位置处存放了很多个“指针”。

当中断处理函数放在内存中某个任意位置之后，让“指针”指向这个函数的地址就可以了，从而达到解耦的目的。

这样的话，无论是发生硬件中断，还是应用层代码通过中断门来调用操作系统提供的函数，只要触发相应的中断就可以了，简化了 CPU 的设计。

- EOF -