Если количество байтов, прочитанных до обнаружения новой строки, равно или превышает (n — 1), то функция readLine() отклоняет лишние данные (включая сам символ новой строки). В случае размещения символа новой строки среди первых (n — 1) байт он попадает в итоговую строку (таким образом, для определения, является ли строка усеченной, достаточно проверить, присутствует ли символ новой строки перед нулевым символом). Мы используем данный подход, чтобы прикладные протоколы, принимающие ввод построчно, не рассматривали одну длинную строку как совокупность нескольких строк. Это могло бы нарушить протокол, поскольку приложения на обоих концах соединения потеряли бы синхронность. В качестве альтернативного подхода можно было бы заставить функцию readLine() считывать только те байты, которых достаточно для заполнения буфера, а оставшиеся данные вплоть до символа новой строки передать следующему вызову readLine(). В этом случае вызывающему процессу пришлось бы учитывать возможность частичного чтения строки.
Существует два вида адресов для сокетов интернет-домена: IPv4 и IPv6.
IPv4-адрес сокета хранится в структуре sockaddr_in, определенной в заголовочном файле
struct in_addr { /* 4-байтный адрес IPv4 */
in_addr_t s_addr; /* Беззнаковое целое число */
};
struct sockaddr_in { /* IPv4-адрес сокета */
sa_family_t sin_family; /* Семейство адресов (AF_INET) */
in_port_t sin_port; /* Номер порта */
struct in_addr sin_addr; /* IPv4-адрес */
unsigned char __pad[X]; /* Сведения о размере структуры 'sockaddr' (16 байт) */
};
В разделе 52.4 мы увидели, что обобщенная структура sockaddr начинается с поля, определяющего домен сокета. В структуре sockaddr_in это поле называется sin_family и всегда хранит значение AF_INET. Поля sin_port и sin_addr обозначают номер порта и IP-адрес и соблюдают сетевой порядок следования байтов. Типы данных in_port_t и in_addr_t представляют собой целые беззнаковые числа длиной 16 и соответственно 32 бита.
В протоколе IPv6, как и в IPv4, адрес сокета состоит из IP-адреса и номера порта. Разница заключается в том, что в IPv6 адрес занимает 126 бит вместо 32. IPv6-адрес сокета хранится в структуре sockaddr_in6, определенной в заголовочном файле
struct in6_addr { /* Структура с IPv6-адресом */
uint8_t s6_addr[16]; /* 16 байт == 128 бит */
};
struct sockaddr_in6 { /* IPv6-адрес сокета */
sa_family_t sin6_family; /* Семейство адресов (AF_INET6) */
in_port_t sin6_port; /* Номер порта */
uint32_t sin6_flowinfo; /* Сведения о потоке данных в IPv6 */
struct in6_addr sin6_addr; /* IPv6-адрес */
uint32_t sin6_scope_id; /* Идентификатор диапазона (с Linux 2.4) */
};
Поле sin_family хранит значение AF_INET6. Поля sin6_port и sin6_addr представляют собой номер порта и IP-адрес (тип данных uint8_t, который используется в структуре in6_addr, является 8-разрядным целым беззнаковым числом). Остальные поля, sin6_flowinfo и sin6_scope_id, выходят за рамки этой книги; в нашем случае они всегда равны 0. Все поля в структуре sockaddr_in6 соблюдают сетевой порядок следования байтов.
IPv6-адреса описаны в документе RFC 4291. Подробности об управлении потоком данных в IPv6 (sin6_flowinfo) можно найти в приложении А книги [Stevens et al., 2004] и в документах RFC 2460 и 3697. RFC 3493 и 4007 содержат информацию о поле sin6_scope_id.
Протокол IPv6, как и IPv4, поддерживает универсальный адрес и замыкание на себя. Однако использование данных возможностей усложнено тем фактом, что IPv6-адрес хранится в массиве (а не с помощью скалярного типа). Для демонстрации этого воспользуемся универсальным адресом (0::0). Константа IN6ADDR_ANY_INIT, которая ему соответствует, имеет следующее определение:
#define IN6ADDR_ANY_INIT { { 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0 } }
В Linux некоторые аспекты заголовочного файла отличаются от описания, приведенного в книге. В частности, структура in6_addr содержит объединение, представляющее 128-разрядный IPv6-адрес в виде 16 байт, восьми 2-байтных или четырех 32-байтных чисел. Из-за наличия этого поля определение константы IN6ADDR_ANY_INIT в библиотеке glibc включает в себя еще один дополнительный набор вложенных фигурных скобок, не показанный в нашем описании.
Константу IN6ADDR_ANY_INIT можно использовать в инициализаторе при объявлении переменной, однако нельзя указывать в правой части операции присваивания, поскольку синтаксис языка C не разрешает применять в таких операциях константы-структуры. Вместо этого необходимо задействовать заранее определенную переменную in6addr_any, которая в языке C инициализируется следующим образом:
const struct in6_addr in6addr_any = IN6ADDR_ANY_INIT;
Таким образом, чтобы присвоить данной структуре универсальный адрес, нужно выполнить следующий код:
struct sockaddr_in6 addr;
memset(&addr, 0, sizeof(struct sockaddr_in6));
addr.sin6_family = AF_INET6;