说一说 Linux 进程控制
扫描二维码
随时随地手机看文章
引言
在上一则发表的关于 Linux 的文章中,叙述了 Linux 的相关概念,其中就包括进程的资源,进程的状态,以及进程的属性等相关内容,在本则教程中,将着重叙述 Linux 进程管理的内容,其中就包括 Linux 进程的创建,进程的终止,进程的等待相关内容。Linux 进程的创建
函数 fork
现有的一个进程可以调用 fork 函数创建一个新进程:#include
pid_t fork(void);
/* 返回值:子进程返回 0,父进程返回子进程 ID;若出错,返回 -1 */
由 fork 创建的新进程被称为子进程。fork 函数被调用一次,但返回两次。两次返回的区别是子进程返回值是0,而父进程的返回值是新建子进程的进程 ID,子进程创建的过程大概是这样的:从调用系统调用 fork 后就有了子进程,fork 创建子进程是以父进程为模板的、下面是一个 fork 函数创建一个进程的例子:int main(int argc, char **argv)
{
printf("I am process!\r\n");
pid_t id = fork();
if (id < 0)
{
printf("fork error\r\n");
}
else if (id == 0)
{
printf("I am child process and myid is :%d, my parent id is :%d\r\n",getpid(),getppid());
sleep(3);
}
else
{
printf("I am parent process and myid is:%d\r\n",getpid());
sleep(3);
}
printf("Now you can see me!\r\n");
sleep(3);
return 0;
}
下面是代码的运行结果:在使用 fork 创建子进程的时候,内核所做的工作是:- 分配新的内存块和描述进程的数据结构给子进程
- 将父进程部分数据结构内容拷贝到子进程
- 添加子子进程到系统进程列表中
- fork 返回,开始调度器调度
需要注意的是:fork 之前父进程独立运行,fork 之后,父子两个执行流分别运行。且 fork 之后,由调度器决定运行顺序子进程获得父进程数据空间、堆和栈的副本。需要注意的是,这是子进程所拥有的副本。父进程和子进程并不共享这些存储空间部分,但是由于在 fork 之后经常跟随着 exec,所以现在很多实现并不执行一个父进程数据段、堆和栈的完全副本,作为替代,使用了写时复制技术,这些区域由父进程和子进程共享,而且内核将他们的访问权限改变为只读。
写时复制原理
在讲述写时复制的原理之前,首先得弄明白虚拟内存和物理内存两个概念:- 物理内存:也就是相电脑的内存条,如果电脑安装了 2GB 的内存条,那么系统就拥有 0~2GB 的物理内存空间。
- 虚拟内存:虚拟内存是使用软件模拟的,例如在 32 位的操作系统下,那么每个进程都独占 4GB 的虚拟内存空间
- 创建子进程时,将父进程的虚拟内存与物理内存映射关系复制到子进程,并将内存设置为只读
- 当子进程或者父进程对内存数据进行修改的时候,便会触发写时复制机制,将原来的内存页复制一份新的,并重新设置其内存映射关系,将父子进程的内存读写权限设置为可读写。
缺页异常
,而在 缺页异常
处理中会对物理内存进行复制,并且重新映射其内存映射关系,这也就是写时复制的机制。回过头来,对于 fork 来讲,有以下两种用法:- 一个父进程希望复制自己,使得父进程和子进程同时执行不同的代码段,这在网络服务进程中是常见的,父进程等待客户端的服务请求。当这种请求到达的时候,父进程调用 fork ,使子进程处理此请求。父进程则继续等待下一服务请求。
- 一个进程要执行一个不同的程序,在这种情况下,子进程调用 fork 返回后立即调用 exec 。
- 系统中已经有太多的进程了
- 该实际用户 ID 的进程总数超过了系统限制
进程中止
进程有五种正常终止以及3种异常终止方式。首先叙述下5种正常的终止方式:- 在 main 函数中执行 return 语句,这等效于调用 exit。
- 调用 exit 函数
- 调用 _exit或 _Exit,对于 _Exit 来说,其目的是为进程提供一种无需运行终止处理程序或者信号处理程序而终止的方法。
- 进程的最后一个线程在启动例程中执行 return 语句。但是,该线程的返回值不用作进程的返回值。当最后一个线程从其启动例程返回时,该进程以终止状态 0 返回。
- 进程的最后一个线程调用
pthread_exit
函数,与前面一样,进程的终止状态总是0
。
- 调用
abort
,产生 SIGABRT 信号,这是下一种异常终止的特例。 - 当进程收到某些信号时
- 最后一个进程对“取消”请求做出响应
函数 wait 和 waitpid
调用 wait 和 waitpid 会发生如下几件事:- 如果所有子进程都还在运行,那么就阻塞
- 如果一个子进程已经中止,正等待父进程获取其终止状态,则取得该子进程的终止状态并返回
- 如果它没有任何子进程,则立即出错返回。
#include
pid_t wait(int *statloc);
pid_t waitpid(pid_t pid,int *statloc,int options);
/* 两个函数返回值:若成功,则返回进程 ID;若失败,则返回 0 或者 -1 */
除了这两个函数之外,类似的调用还有其他的函数,这里就不进行赘述了。竞争条件
当多个进程都企图对共享数据进行某种处理,而最后的结果又取决于进程运行的顺序时,我们认为发生了竞争条件。如果在 fork 之后的某种逻辑显示或隐式地依赖于在 fork 之后是父进程先运行还是子进程先运行,那么 fork 函数就会是竞争条件活跃的滋生地。如果一个进程希望等待一个子进程终止,则它必须调用 wait 函数中的一个,如果一个进程要等待其父进程终止,则可以使用下列形式的循环:while (getppid() != 1)
sleep(1);
这种形式的循环称为轮询,它的问题是浪费了 CPU 时间,因为调用者每隔 1s 都被唤醒,然后进行条件测试,为了避免竞争条件和轮询,在多个进程之间需要有某种形式的信号发送和接收的方法。详细地在下次进行叙述。函数 exec
在使用了 fork 函数创建新的子进程后,子进程往往要调用一种 exec 函数以执行另一个程序。当进程调用一种 exec 函数时,该进程执行的程序完全替换为新程序。通俗地理解这句话,也就是说,在 Window 平台下,我们可以通过双击运行可执行程序,让这个可执行程序成为一个进程;然而在 Linux 平台下,我们可以通过运行./
,让一个可执行程序成为一个进程。如果我们本来就运行着一个程序(进程),如何在这个进程内部启动一个外部程序,由内核将这个外部程序读入内存,使其执行起来成为一个进程呢?这里通过 exec
函数族来实现。exec
函数族,顾名思义,也就是一族函数,在 Linux 中,也不存在着exec()
函数,exec指的是一组函数 :#include
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
其中只有execve()
是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。进程调用一种 exec 函数时,该进程完全由新程序替换,而新程序则从其 main 函数开始执行。因为调用 exec 并不创建新进程,所以前后的进程 ID (当然还有父进程号、进程组号、当前工作目录……)并未改变。exec 只是用另一个新程序替换了当前进程的正文、数据、堆和栈段(进程替换)。接下来举一个例子,关于execl()
示例代码:#include
#include
int main(int argc, char *argv[])
{
printf("before exec\n\n");
/* /bin/ls:外部程序,这里是/bin目录的 ls 可执行程序,必须带上路径(相对或绝对)
ls:没有意义,如果需要给这个外部程序传参,这里必须要写上字符串,至于字符串内容任意
-a,-l,-h:给外部程序 ls 传的参数
NULL:这个必须写上,代表给外部程序 ls 传参结束
*/
execl("/bin/ls", "ls", "-a", "-l", "-h", NULL);
// 如果 execl() 执行成功,下面执行不到,因为当前进程已经被执行的 ls 替换了
perror("execl");
printf("after exec\n\n");
return 0;
}
下面是代码执行的结果:小结
本次内容的分享就到这里了,主要是叙述了Linux
进程管理的相关内容,其中就包括Linux
进程创建,进程中止,进程等待等内容,在下一则内容中将着重分享进程间通信的相关内容,每周一篇,坚持呀~