В этой главе мы познакомились с различными альтернативами стандартной модели ввода/вывода: с мультиплексированным вводом/выводом (select() и poll()), вводом/выводом на основе сигналов и программным интерфейсом epoll, доступным только в Linux. Все перечисленные механизмы позволяют отслеживать множество файловых дескрипторов, проверяя, не готов ли какой-либо из них. При этом ни один из представленных подходов не занимается непосредственно чтением или записью: установив, что файловый дескриптор готов, можно выполнять ввод/вывод с помощью традиционных системных вызовов.
Мультиплексирующие вызовы select() и poll() отслеживают сразу несколько файловых дескрипторов, позволяя определять, доступен ли в них ввод или вывод. При любом из этих вызовов мы каждый раз передаем ядру весь список дескрипторов, которые нужно проверить, а ядро возвращает нам те из них, что готовы. Ввиду данного факта вызовы select() и poll() демонстрируют плохую производительность при мониторинге большого количества файловых дескрипторов.
Ввод/вывод на основе сигналов позволяет получать уведомления о возможности чтения или записи для файлового дескриптора. Чтобы включить этот механизм, нужно установить обработчик сигнала SIGIO, указать владельца, который будет получать данный сигнал, и позволить генерировать сигналы путем остановки флага состояния открытого файла O_ASYNC. При наблюдении за большим количеством файловых дескрипторов описанная методика обеспечивает значительный прирост производительности по сравнению с мультиплексированным вводом/выводом. Linux позволяет использовать для уведомлений нестандартные сигналы. Если они будут работать в режиме реального времени, то появится возможность ставить их в очередь, благодаря чему обработчик сумеет определять на основе аргумента siginfo_t файловый дескриптор и тип события, сгенерировавшего сигнал.
Как и ввод/вывод на основе сигналов, интерфейс epoll обеспечивает улучшенную производительность при мониторинге большого количества файловых дескрипторов. В обоих случаях данное преимущество следует из того факта, что ядро «запоминает» список дескрипторов, отслеживаемых процессом (в отличие от вызовов select() и poll(), передающих аналогичные списки при каждом запуске). Программный интерфейс epoll имеет ряд заметных преимуществ по сравнению с вводом/выводом на основе сигналов, позволяя избежать сложностей работы с сигналами и выбрать типы событий ввода/вывода, которые нас интересуют (например, запись или чтение).
На протяжении этой главы мы регулярно упоминали об отличиях между уведомлениями о готовности, срабатывающих по уровню и по фронту. Первые сообщают о том, возможен ли на данный момент ввод/вывод для файлового дескриптора. Вторые сигнализируют о вводе/выводе, произошедшем в дескрипторе с момента последней проверки. Системные вызовы для мультиплексирования ввода/вывода предоставляют модель уведомлений, срабатывающих по уровню. Ввод/вывод на основе сигналов сводится к уведомлениям, срабатывающим по фронту; интерфейс epoll способен работать с обеими моделями (по умолчанию срабатывание происходит по уровню). Уведомления, срабатывающие по фронту, обычно сочетают с неблокирующим вводом/выводом.
В конце данной главы мы рассмотрели проблему, с которой иногда сталкиваются программы, наблюдающие за множеством файловых дескрипторов: как одновременно с этим ждать доставки сигнала. Обычно для такого случая используется так называемый трюк с зацикленным каналом — когда обработчик сигнала записывает один байт в канал, считывающий конец которого является одним из отслеживаемых файловых дескрипторов. Стандарт SUSv3 предусматривает вызов pselect(), являющийся разновидностью операции select() и позволяющий решить данную проблему иначе. Однако он доступен не во всех реализациях UNIX. Linux поддерживает аналогичные нестандартные вызовы — ppoll() и epoll_pwait().
В книге [Stevens et al., 2004] описываются мультиплексированные операции чтения и записи, а также ввод/вывод на основе сигналов; особый упор сделан на использование этих механизмов в сочетании с сокетами. Документ [Gammo et al, 2004] посвящен сравнению производительности вызовов select(), poll() и интерфейса epoll.
На http://www.kegel.com/c10k.html находится крайне любопытная статья под названием The C10K problem (проблема 10 000 соединений), написанная Дэном Кегелом. В ней рассматриваются трудности, с которыми сталкиваются разработчики веб-серверов, спроектированных для обслуживания десятков тысяч клиентов. Там вы сможете найти множество ссылок на информацию по данной теме.
59.1. Отредактируйте программу из листинга 59.2 (poll_pipes.c), заменив операцию poll() вызовом select().
59.2. Напишите сервер echo (см. разделы 56.2 и 56.3), который обслуживает TCP- и UDP-клиентов. Для этого сервер должен создать два слушающих сокета, по одному для каждого протокола, и затем отслеживать их с помощью одной из методик, описанных в настоящей главе.