Более подробное обсуждение стратегий ввода и распределения памяти можно найти в статье “Learning Standard C++ as a New Language” (см. список библиографических ссылок в конце раздела 27.1).
27.5. Строки в стиле языка С
Строка в языке C (в литературе, посвященной языку С++, ее часто называют
char* p = "asdf";
char s[ ] = "asdf";
В языке C нет функций-членов, невозможно перегружать функции и нельзя определить оператор (такой как ==
) для структур. Вследствие этого для манипулирования строками в стиле языка С необходим набор специальных функций (не членов класса). В стандартных библиотеках языков C и C++ такие функции определены в заголовочном файле
.
size_t strlen(const char* s); /* определяет количество символов */
char* strcat(char* s1, const char* s2); /* копирует s2 в конец s1 */
int strcmp(const char* s1, const char* s2); /* лексикографическое
сравнение */
char* strcpy(char* s1,const char* s2); /* копирует s2 в s1 */
char* strchr(const char *s, int c); /* копирует c в s */
char* strstr(const char *s1, const char *s2); /* находит s2 в s1 */
char* strncpy(char*, const char*, size_t n); /* сравнивает n
символов */
char* strncat(char*, const char, size_t n); /* strcat с n
символами */
int strncmp(const char*, const char*, size_t n); /* strcmp с n
символами */
Это не полный список функций для работы со строками, но он содержит самые полезные и широко используемые функции. Кратко проиллюстрируем их применение.
==
) сравнивает значения указателей; стандартная библиотечная функция strcmp()
сравнивает значения C-строк.
const char* s1 = "asdf";
const char* s2 = "asdf";
if (s1==s2) { /* ссылаются ли указатели s1 и s2 на один и тот же
массив? */
/* (обычно это нежелательно) */
}
if (strcmp(s1,s2)==0) { /* хранят ли строки s1 и s2 одни и те же
символы? */
}
Функция strcmp()
может дать три разных ответа. При заданных выше значениях s1
и s2
функция strcmp(s1,s2)
вернет нуль, что означает полное совпадение. Если строка s1
предшествует строке s2
в соответствии с лексикографическим порядком, то она вернет отрицательное число, и если строка s1
следует за строкой s2
в лексикографическом порядке, то она вернет положительное число. Термин
strcmp("dog","dog")==0
strcmp("ape","dodo")<0 /* "ape" предшествует "dodo" в словаре */
strcmp("pig","cow")>0 /* "pig" следует после "cow" в словаре */
Результат сравнения указателей s1==s2
не обязательно равен 0 (false
). Механизм реализации языка может использовать для хранения всех строковых литералов одну и ту же область памяти, поэтому можем получить ответ 1 (true
). Обычно функция strcmp()
хорошо справляется со сравнением С-строк.
Длину С-строки можно найти с помощью функции strlen()
.
int lgt = strlen(s1);
Обратите внимание на то, что функция strlen()
подсчитывает символы, не учитывая завершающий нуль. В данном случае strlen(s1)==4
, а строка "asdf
" занимает в памяти пять байтов. Эта небольшая разница является источником многих ошибок при подсчетах.
Мы можем копировать одну С-строку (включая завершающий нуль) в другую.
strcpy(s1,s2); /* копируем символы из s2 в s1 */
Программист должен сам гарантировать, что целевая строка (массив) имеет достаточный размер, чтобы в ней поместились символы исходной строки.