В операционной системе Linux функция fork()
реализована через системный вызов clone()
. Этот системный вызов может принимать в качестве аргументов набор флагов, определяющих, какие ресурсы должны быть общими (если вообще должны) у родительского и порожденного процессов. Далее в разделе "Реализация потоков в ядре Linux" об этих флагах рассказано более подробно. Библиотечные вызовы fork()
, vfork()
и __clone()
вызывают системную функцию clone()
с соответствующими флагами. В свою очередь системный вызов clone()
вызывает функцию ядра do_fork()
.
Основную массу работы по разветвлению процесса выполняет функция do_fork()
, которая определена в файле kernel/fork.c
. Эта функция, в свою очередь, вызывает функцию copy_process()
и запускает новый процесс на выполнение. Ниже описана та интересная работа, которую выполняет функция copy_process()
.
• Вызывается функция dup_task_struct()
, которая создает стек ядра, структуры thread_info
и task_struct
для нового процесса, причем все значения указанных структур данных идентичны для порождающего и порожденного процессов. На этом этапе дескрипторы родительского и порожденного процессов идентичны.
• Проверяется, не произойдет ли при создании нового процесса переполнение лимита на количество процессов для данного пользователя.
• Теперь необходимо сделать порожденный процесс отличным от родительского. При этом различные поля дескриптора порожденного процесса очищаются или устанавливаются в начальные значения. Большое количество данных дескриптора процесса является совместно используемым.
• Далее состояние порожденного процесса устанавливается в значение TASK_UNINTERRUPTIBLE
, чтобы гарантировать, что порожденный процесс не будет выполняться.
• Из функции copy_process()
вызывается функция copy_flags()
, которая обновляет значение поля flags
структуры task struct
. При этом сбрасывается флаг PF_SUPERPRIV
, который определяет, имеет ли процесс права суперпользователя. Флаг PF_FORKNOEXEC
, который указывает на то, что процесс не вызвал функцию exec()
, — устанавливается.
• Вызывается функция get_pid()
, которая назначает новое значение идентификатора PID
для новой задачи.
• В зависимости от значений флагов, переданных в функцию clone()
, осуществляется копирование или совместное использование открытых файлов, информации о файловой системе, обработчиков сигналов, адресного пространства процесса и пространства имен (
• Происходит разделение оставшейся части кванта времени между родительским и порожденным процессами (это более подробно обсуждается в главе 4, "Планирование выполнения процессов").
• Наконец, происходит окончательная зачистка структур данных и возвращается указатель на новый порожденный процесс.
Далее происходит возврат в функцию do_fork()
. Если возврат из функции copy_process()
происходит успешно, то новый порожденный процесс возобновляет выполнение. Порожденный процесс намеренно запускается на выполнение раньше родительского[16].
В обычной ситуации, когда порожденный процесс сразу же вызывает функцию exec()
, это позволяет избежать накладных расходов, связанных с тем, что если родительский процесс начинает выполняться первым, то он будет ожидать возможности записи в адресное пространство посредством механизма копирования при записи.
vfork()