进程的创建
作者:Wilbur Lang
在 UNIX 系统中,用户创建一个新进程的唯一方法就是调用系统调用 fork。调 用 fork 的进程称为父进程,而新创建的进程叫做子进程。系统 调用的语法格式:
pid = fork();
在从系统调用 fork 中返回时,两个进程除了返回值 pid 不同外,具有 完全一样的用户级上下文。在子进程中,pid 的值为零。在系统启动时由核心内 部地创建的进程0是唯一不通过系统调用 fork 而创建的进程。
核心为系统调用 fork 完成下列操作:
下面是系统调用 fork 的算法。核心首先确信有足够的资源来成功完成 fork。 如果资源不满足要求,则系统调用 fork 失败。如果资源满足要求,核心在进程 表中找一个空项,并开始构造子进程的上下文。
算法:fork 输入:无 输出:对父进程是子进程的 PID 对子进程是0 { 检查可用的核心资源 取一个空闲的进程表项和唯一的 PID 号 检查用户没有过多的运行进程 将子进程的状态设置为“创建”状态 将父进程的进程表中的数据拷贝到子进程表中 当前目录的索引节点和改变的根目录(如果可以)的引用数加1 文件表中的打开文件的引用数加1 在内存中作父进程上下文的拷贝 在子进程的系统级上下文中压入虚设系统级上下文层 /* 虚设上下文层中含有使子进程能 * 识别自己的数据,并使子进程被调度时 * 从这里开始运行 */ if (正在执行的进程是父进程) { 将子进程的状态设置为“就绪”状态 return (子进程的 PID) // 从系统到用户 } else { 初始化计时区 return 0; } }我们来看看下面的例子。该程序说明的是经过系统调用 fork 之后,对文件的 共享存取。用户调用该程序时应有两个参数,一个是已经有的文件名,另外一个是要 创建的新文件名。该进程打开已有的文件,创建一个新文件,然后,假定没有遇见过 错误,它调用 fork 来创建一个子进程。子进程可以通过使用相同的文件描述 符而继承地存取父进程的文件(即父进程已经打开和创建的文件)。
当然,父进程和子进程要分别独立地调用 rdwrt 函数,并执行一个循环,即从 源文件中读一个字节,然后写一个字节到目标文件中区。当系统调用 read 遇见 文件尾时,函数 rdwrt 立即返回。
#include <fcntl.h> int fdrd, fdwt; char c; main(int argc, char *argv[]) { if (argc != 3) { exit(1); } if ((fdrd = open(argv[1], O_RDONLY)) == -1) { exit(1); } if ((fdwt = creat(argv[2], 0666)) == -1) { exit(1); } fork(); // 两个进程执行同样的代码 rdwrt(); exit(0); } rdwrt() { for (;;) { if (read(fdrd, &c, 1) != 1) { return ; } write(fdwt, &c, 1); } }在这个例子中,两个进程的文件描述符都指向相同的文件表项。这两个进程永远 不会读或写到相同的文件偏移量,因为核心在每次 read 和 write 调用 之后,都要增加文件的偏移量。尽管两个进程似乎是将源文件拷贝了两次,但因为 他们分担了工作任务,因此,目标文件的内容依赖于核心调度两个进程的次序。如果 核心这样调度两个进程:使他们交替地执行他们的系统调用,或甚至使他们交替地 执行每对 read 和 write 调用,则目标文件的内容和源文件的内容完全一致。但考虑 这样的情况:两个进程正要读源文件中的两个连续的字符 "ab"。假定父进程读了字 符 "a",这时,核心在父进程写之前,做了上下文切换来执行子进程。如果子进程 读到字符 "b",并在父进程被调度前,将它写到目标文件,那么目标文件将不再含有 字符串 "ab",而是含有 "ba"了。核心并不保证进程执行的相对速率。
再来看看另外一个例子:
#include <string.h> char string[] = "Hello, world"; main() { int count, i; int to_par[2], to_chil[2]; // 到父、子进程的管道 char buf[256]; pipe(to_par); pipe(to_chil); if (fork() == 0) { // 子进程在此执行 close(0); // 关闭老的标准输入 dup(to_child[0]); // 将管道的读复制到标准输入 close(1); // 关闭老的标准输出 dup(to_par[1]); // 将管道的写复制到标准输出 close(to_par[1]); // 关闭不必要的管道描述符 close(to_chil[0]); close(to_par[0]); close(to_chil[1]); for (;;) { if ((count = read(0, buf, sizeof(buf)) == 0) exit(); write(1, buf, count); } } // 父进程在此执行 close(1); // 重新设置标准输入、输出 dup(to_chil[1]); close(0); dup(to_par[0]); close(to_chil[1]); close(to_par[0]); close(to_chil[0]); close(to_par[1]); for (i = 0; i < 15; i++) { write(1, string, strlen(string)); read(0, buf, sizeof(buf)); } }子进程从父进程继承了文件描述符0和1(标准输入和标准输出)。两次执行系统调用 pipe 分别在数组 to_par 和 to_chil 中分配了两个文件描述符。然后该进程 执行系统调用 fork,并复制进程上下文:象前一个例子一样,每个进程存取 自己的私有数据。父进程关闭他的标准输出文件(文件描述符1),并复制(dup)从管道 线 to_chil 返回的写文件描述符。因为在父进程文件描述符表中的第一个空槽是刚刚 由关闭腾出来的,所以核心将管道线写文件描述符复制到了文件描述符表中的第一 项中,这样,标准输出文件描述符变成了管道线 to_chil 的写文件描述符。 父进程以类似的操作将标准输入文件描述符替换为管道线 to_par 的读文件 描述符。与此类似,子进程关闭他的标准输入文件(文件描述符0),然后复制 (dup) 管道 线 to_chil 的读文件描述符。由于文件描述符表的第一个空项是原先的标准 输入项,所以子进程的标准输入变成了管道线 to_chil 的读文件描述符。 子进程做一组类似的操作使他的标准输出变成管道线 to_par 的写文件描述 符。然后两个进程关闭从 pipe 返回的文件描述符。上述操作的结果是:当 父进程向标准输出写东西的时候,他实际上是写向 to_chil--向子进程发送 数据,而子进程则从他的标准输入读管道线。当子进程向他的标准输出写的时候, 他实际上是写入 to_par--向父进程发送数据,而父进程则从他的标准输入 接收来自管道线的数据。两个进程通过两条管道线交换消息。
无论两个进程执行的顺序如何,这个程序执行的结果是不变的。他们可能去执行睡眠 和唤醒来等待对方。父进程在15次循环后退出。然后子进程因管道线没有写进程而读 到“文件尾”标志,并退出。
如果您对本文有任何意见和建议,请给 Wilbur Lang 写信。如果您自己有什么文章要发表,也请写信。任何反馈意见都非常欢迎。