linux 进程调用相关函数区别

exec 替换进程映像

exec 是一个函数族，用于执行不同的命令参数，除此之外函数族内函数的功能都相同。当一个进程调用了 exec 函数后，它本身就“死亡”了，系统把代码段、数据段替换成 exec 参数指定的程序，并分配新的堆和栈空间，唯一留下的是进程的 ID 等信息，对系统来说还是同一个进程，但实际已经是另一个程序了。

exec 如果成功替换成了新的程序映像运行，将不会有任何返回值，如果执行失败，将会返回 -1 。

fork 复制进程映像

调用 fork 函数后，进程将会发生分叉，如果 fork 返回值是 -1 ，表示系统调用失败，错误码在 errno 中，如果返回值是 0 ，表示处于子进程，如果返回值是大于 0 的整数，表示处于父进程，且返回值是子进程的 PID 。

子进程继承了父进程的进程空间（代码段、数据段、堆、栈、文件描述符等），注意父子进程之间数据都是单独的一份，不再共享。现代操作系统大多采用写时复制（COW）机制，初始时子进程开辟了一块虚拟内存空间，其指向的物理内存和父进程的物理内存相同，同时物理内存被设置为 readonly ，当父子进程一方修改物理内存数据时，触发写时复制，修改内存数据的一方将会复制要修改的物理内存页，进行修改。

如果需要在父进程运行过程中启动一个子进程运行另一个程序，一般先调用 fork 函数，在子进程代码分支中立即调用 exec 函数，将子进程替换为 exec 参数的指定的程序映像，这种情况一般操作系统可以优先调度子进程，这样可以避免不必要的写时复制。

system 启动新进程，带返回值

system 系统调用用于在进程运行过程中调用另一个程序，主进程将会阻塞等待子进程完成，并返回子进程的执行结果。其内部使用了 fork + exec 的机制。

需要注意的是，这种方式是通过启动一个 shell 并调用子程序实现的，即 exec 执行的命令相当于/bin/sh –c cmd，因此 system 函数并非启动其他进程的理想手段，因为对 shell 的依赖较大。

system 方式启动的子进程拥有与父进程完全不同的代码段、数据段、堆和栈。

另外 system 的返回值有如下几种可能：

父进程检查 cmd 字符串为空，返回非零值，一般为 1
父进程 fork 失败或者 waitpid 被信号中断，返回 -1，且 errno 中设置了错误类型值
子进程执行 exec 失败，返回 127 ，且返回值放在高字节，即实际返回为 0x7f00 » 8 = 127
其它情况返回子进程执行的返回值，且返回值放在高字节，即实际返回 result » 8

下面的程序调用system函数，并对返回值进行分析：

#include <stdio.h>
#include <sys/wait.h>
#include <stdlib.h>
 
void pr_exit(int status){
        printf("status = %d\n", status);
        if(WIFEXITED(status)){
                printf("normal terminaton, exit status = %d\n", WEXITSTATUS(status));
        }else if(WIFSIGNALED(status)){
                printf("abnormal termination, signal number = %d%s\n",
                WTERMSIG(status),
#ifdef WCOREDUMP
                WCOREDUMP(status)?"(core file generated)" : "");
#else
                "");
#endif
        }else if(WIFSTOPPED(status)){
                printf("child stopped, signal number = %d\n", WSTOPSIG(status));
        }
}
 
int main(int argc, char* argv[]){
        if(argc != 2){
                printf("usage:./a.out [cmdstring]\n");
                return -1;
        }
        int status;
        status = system(argv[1]);
        pr_exit(status);
        return 0;

}

执行上面的程序：

1. shell执行失败
yan@yan-vm:~/apue$ ./a.out nosuchcmd
sh: 1: nosuchcmd: not found
status = 32512
normal terminaton, exit status = 127
nosuchcmd不是shell支持的命令，所以，shell命令返回了127（exec失败），对于system函数，返回值为127*256 = 32512；
因为shell的返回值是 system返回值的8～15位（所以在程序中返回超过255的错误代码是无意义的）。

2. 命令成功执行，但命令返回错误码
yan@yan-vm:~/apue$ ./a.out "ls /a/b/c"
ls: cannot access /a/b/c: No such file or directory
status = 512
normal terminaton, exit status = 2
虽然没有这个/a/b/c目录，但是命令是成功执行了，所以没有返回127，而是返回了ls /a/b/c命令的错误代码2（2*256 = 512）。

3. 命令成功执行，且返回成功码
yan@yan-vm:~/apue$ ./a.out "date"
Sat Jul 27 20:48:22 CST 2013
status = 0
normal terminaton, exit status = 0
system成功执行了date，date程序退出码为0。

popen 启动新进程，带输出

popen 函数采用管道进行父子进程间通信，并把子进程的输出重定向到管道中，供父进程读取，函数返回的是一个文件指针，通过文件指针可以读取到子进程的输出内容。

子进程的调用方式也是 fork + exec ，exec 执行的命令也是通过调用 shell 执行。

总结

父进程调用子进程的几种方式比较：

如果需要获取子进程执行的返回值，用 system
如果不需要获取子进程执行的返回值，用 fork + exec 更高效
如果需要获取子进程执行的输出，用 popen

参考

文档信息

本文作者：amagcatdog
本文链接：https://amagcatdog.github.io/2021/03/24/linux-process-call/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

amagcatdog