Читаем Linux API. Исчерпывающее руководство полностью

Linux API. Исчерпывающее руководство

При написании сетевых программ следует помнить: в каждой компьютерной архитектуре принято по-своему представлять некоторые типы данных. Мы уже отмечали, что целочисленные значения могут храниться с разным порядком следования байтов. Но существуют и другие особенности. Например, тип данных long в языке C может занимать как 32, так и 64 бита в зависимости от системы. В случае со структурами все только усложняется, ведь платформы задействуют различные правила выравнивания полей структуры по границам адреса, из-за чего величина сдвига между полями может варьироваться.

Из-за указанных отличий в представлении данных приложения, передающие информацию по сети между двумя гетерогенными (несовместимыми) системами, должны использовать некое общее соглашение относительно кодирования и декодирования этой информации. Процесс приведения данных к стандартному формату, подходящему для передачи по сети, называется маршалингом (англ. marshalling — «упорядочивание»). Существуют разные стандарты маршалинга, такие как XDR (External Data Representation — внешнее представление данных; см. RFC 1014), ASN.1-BER (Abstract Syntax Notation 1, см. http://www.itu.int/en/ITU-T/asn1/Pages/asn1_project.aspx), CORBA и XML. Обычно эти стандарты определяют строгий формат для каждого типа данных (описывая, например, порядок следования байтов и количество применяемых битов). Во время кодирования в подходящий формат данные маркируются с помощью одного или нескольких дополнительных полей, которые определяют их тип (и, возможно, длину).

Однако вместо маршалинга часто используется более простая методика: все передаваемые данные переводятся в текстовый вид, а отдельные элементы разделяются специальными символами (обычно символом новой строки). Одним из преимуществ такого подхода является то, что для отладки приложения можно задействовать программу telnet. Для этого достаточно следующей команды:

$ telnet host port

Затем можно вводить строчки текста, которые будут посланы приложению, и просматривать полученные ответы. Данная методика будет продемонстрирована в разделе 55.11.

Проблема, связанная с различиями в представлении информации в гетерогенных системах, касается не только сетевого взаимодействия, но и любых механизмов обмена данными между системами. Например, те же проблемы существуют при передаче файлов, хранящихся на диске или магнитной ленте. Просто сетевое программирование на сегодняшний день является наиболее распространенным контекстом, в котором можно столкнуться с подобной проблемой.

Для работы с данными, передаваемыми с помощью потокового сокета и закодированными в виде разбитого на отдельные строки текста, удобно использовать функцию readLine(), представленную в листинге 55.1.

#include "read_line.h"

ssize_t readLine(int fd, void *buffer, size_t n);

Возвращает либо количество байтов, скопированных в buffer (не считая завершающего нулевого символа), либо 0, если обнаружен конец файла, либо -1 при ошибке

Функция readLine() считывает байты из файла, указанного дескриптором fd, пока не обнаруживает символ новой строки. Входящая последовательность байтов сохраняется в участке памяти, на который ссылается аргумент buffer; размер этого участка должен быть не меньше n байт. Возвращаемая строка всегда содержит в конце нулевой символ; таким образом, объем полученных данных не превышает (n — 1) байт. В случае успеха функция readLine() возвращает количество байтов, помещенных в buffer, не считая конечного нулевого символа.

Читаем Linux API. Исчерпывающее руководство полностью

Linux API. Исчерпывающее руководство

Похожие книги

Все жанры