Linux2.6内核进程管理分析
扫描二维码
随时随地手机看文章
linux内核是linux操作系统中最核心的部分,用于实现对硬件部件的编程控制和接口操作。Linux内核主要由5个模块构成,分别是:进程调度模块、内存管理模块、虚拟文件系统模块、进程间通信模块。 Linux经常使用散列表来实现高速缓存,高速缓存是需要快速访问的信息。
本文将介绍Linux2.6内核的进程管理。我们首先来了解它的定义。
何为进程 ?
进程的模型包括进程控制块(PCB)、程序部分和数据集合三部分。
1、进程控制块PCB
PCB是进程存在的唯一标识。
PCB按功能分主要包含以下四部分:进程标示符、处理机状态、进程调度信息、进程控 制信息。
(1)进程标示符:唯一标识一个进程。
(2)处理机状态:有处理机的各种寄存器中的内容组成,寄存器包括通用寄存器、指令寄存器、程序状态字PSW、和用户栈指针。当初立即被中断时,进程运行信息必须保存在PCB中,以便运行时从断点继续执行。
(3)进程调度信息:存放进程状态、进程优先级、进程调度所需其他信息(如调度算法,进程已运行时间,等待CPU时间)、时间或阻塞原因。
(4)进程控制信息:包括程序和数据的内存或者外存地址,进程同步和通信机制,资源清单(除CPU以外进程所需的全部资源以及已经分配的资源)、链接指针(下一进程PCB地址)。
Linux的进程控制块PCB使用一个成为task_struct的结构体来描述。该结构体中定义了进程的几种状态:
(1)TASK_RUNNING状态。Linux的进程运行状态包括实际的运行和就绪状态,对两者的区分是根据当前是否占有CPU,结构体中current变量可以区分两者。
(2)TASK_INTERRUPTIBLE状态。即可中断的等待状态,当进程在等待某个事件和某个资源,可中断等待状态的进程可以被信号唤醒而进入就绪状态等待调度。
(3)TASK_UNINTERRUPTIBLE状态。即不可中断等待状态,该状态进程由于硬件不能满足,不能被信号唤醒,必须等到得到所等待的资源之后才能被唤醒。
(4)TASK_ZOMBIE状态。即僵死状态,终止进程所占有的资源全部释放之后,还保存着PCB信息,这种占有PCB但已被撤销的进程处于僵死状态(如僵死进程)。
(5)TASK_STOPPED状态。即暂停状态,一般都是有运行状态转换来,正等待某种特殊处理,如调试跟踪的程序。
(6)TASK_DEAD状态。新增加的状态,指已经退出但是不需要父进程回收的进程。 Linux内核创建一个进程时,首先会新建一个空的task_struct结构体,并将相应信息填入结构体中,然后将该结构体的指针添加进task数组,这个数组大小由NR_TASK(默认一般为512)指定。调度程序一直维持着一个current指针,它指向当前正在运行的程序。Task[0]必须指向init_task进程(0号进程)。
Linux中,内核将所有struct_task结构体以两种方式组织:
(1)哈希表,将进程的PID作为哈希算法的输入,可以用一个给定PID快速查找到进程,通过find_task_pid()来定位相应进程。
(2)双向循环链表,这样可以使系统很容易遍历所有的进程。通过调用for_each_task()来实现遍历。task_struct结构体中的变量list_head的作用就是将进程通过双向链表将进程连接起来。链表的首部和头部都是init_task进程。
2、进程的创建
Linux提供了三种创建新进程的方法:fork()、vfork()、clone() 三者分别对应系统调用的sys_fork()、sys_vfork()、sys_clone(),最终三者都是通过do_fork() 调用完成的。
目前Linux在创建进程时,采用“写时拷贝”技术,即在创建进程时并不将父进程所有的资源都复制给子进程,而是需要时才进行资源的拷贝,可以大大提高Linux的性能。
(1)fork()函数
调用fork后,系统会创建一个子进程,子进程和父进程不同的只有它的进程ID和父进程ID,其他都一样。地址空间不共享,由于采用“写时拷贝”技术,子进程并不完全拷贝父进程的数据段和栈、堆等的复制,这些区域作为父子进程的共享区域,而且内核将他们访问权限设置为只读,如果父子进程任何一个试图修改此区域,内核就为那块内存拷贝制作一个副本。
之所以采用“写时拷贝”是因为一般fork后会调用exec调用其他的执行体。
父子进程的执行顺序不确定。
fork函数被调用一次,但是返回两次值。两次返回值的区别是,子进程的返回值是0,父进程返回值是子进程的进程ID。调用失败的话返回-1。
(2)vfork()函数
该函数与fork基本一致,只不过父子进程共享父进程的地址空间。
对于vfork创建新进程后,父进程会阻塞,子进程借用父进程的地址空间运行,直到子进程退出或者调用exec(exec函数族的作用是启动另一个程序的执行),父进程才可以运行。vfork和fork返回值相同。
(3)clone()函数
clone函数和fork、vfork不同,它接受一个指向函数的指针和该函数的参数,在创建子进程成功时就调用这个函数执行。
3、进程终止
分为自愿终止和被动终止。
(1)自愿终止
a.显式自愿终止:在进程中调用exit()函数 b.隐式自愿终止:进程从某个程序的主函数退出
(2)被动终止
a.当进程接收到一个它既不能处理也不能忽略的信号和异常 b.进程接收到SIGABRT或者其他终止信号。
上述进程终止主要分为两步来完成:
(1) 首先通过调用do_exit()函数释放掉与进程相关的大部分资源,并使进程处于僵死状态,但是进程描述符不释放。
(2) 然后对进程的处理应看子进程与父进程谁先终止。子进程先终止的话,则子进程一直处于僵死状态,直到父进程调用wait()或者waitpid()。调用完成后则完全释放。父进程先终止,则内核必须为子进程找到新的父进程,方法是首先给子进程在当前组内找一个线程最为父进程,不行就让init做父进程。
wait()函数的两个作用:获取内核发送来的子进程终止消息和清除子进程的所有独享资源。wait函数会首先挂起调用它的进程,知道该进程的一个子进程终止,此时函数会返回该子进程的PID给父进程。
4、线程的实现
Linux内核中没有专门的实现线程的机制,而是通过用户级程序库来实现的,例如pthread库,以便将所有的线程映射到一个单独的内核级进程中。Linux提供的一种不区分进程和线程的方案:通过使用一种类似于Solaris轻量级进程的方法,用户级线程被映射到内核级进程上,组成一个用户级进程的多个用户级线程被映射到共享同一个ID的多个Linux内核级进程上。这使得这些进程可以共享文件和内存等资源,使得同一组中的进程调度切换时不需要切换上下文。
5、Linux进程调度
Linux是一个抢占式多任务系统,高优先级的可以抢占低优先级的CPU运行。Linux优先级分为静态优先级和动态优先级。
Linux进程分为普通进程和实时进程两类。实时进程创建时静态优先级就已经分配而且不会改变,不为实时进程计算动态优先级,实时进程的优先级范围为0~99都高于普通进程100~139。普通进程优先级同样有静态优先级,但是没有作用,内核为普通进程计算动态优先级,并根据优先级分配时间片,来调度进程。
Linux提供了三种调度策略:
(1)SCHED_NORMAL面向普通进程的时间片轮转策略。时间片用完后再选择一个优先级相对较高的进程进程调度。
(2)SCHED_FIFO面向对响应时间要求比较高、运行所需时间较短的实时进程。
(3)SCHED_RR面向对响应时间要求比较高、运行所需时间较长的实时进程。
总结调度,根据进程的分类调度可分为实时调度和非实时调度。
(1)实时调度—针对实时进程静态优先级。
对于实时进程,静态优先级决定了对CPU的抢占,当高优先级的进程到达时,会抢占低优先级进程的CPU,同样可以知道实时进程总是能抢占普通进程的CPU。对于同一优先级的实时进程则又可采用两种调度算法:FIFO(先来先服务)和RR(时间片轮转)。
例如,当前进程有A(30),B(20),C(20),D(5)且B早于C到达,括号内为进程的静态优先级。则采用FIFO为:D优先级最高先执行B,然后是B和C优先级相同,由于B早到达,所以先执行B再C,最后是优先级最低的A。执行顺序为D—B—C—A.采用RR则仍然是先运行D,完毕后则交换运行B和C,运行完毕后是A。顺序为D—B—C—B—C—A。
(2)非实时调度—普通进程动态优先级。
内核为普通进程计算动态优先级,根据此优先级为进程分配不同的时间片(RR),此优先级只作为分配时间片的基础,不能够通过动态优先级高低抢占CPU。每次当进程的时间片使用完后都会为其重新计算动态优先级及分配的时间片。