Читаем C++ для начинающих полностью

C++ для начинающих

Создать копию каждого вектора. Слить все векторы в один. Отсортировать его в алфавитном порядке. Удалить все дубликаты. Снова отсортировать, но уже по длине слов. Подсчитать число слов, длина которых больше шести знаков (предполагается, что длина – это некоторая мера сложности, по крайней мере, в терминах словаря). Удалить семантически нейтральные слова (например, союзы and (и), if (если), or (или), but (но) и т.д.). Напечатать получившийся вектор. На первый взгляд, задача на целую главу. Но с помощью обобщенных алгоритмов мы решим ее в рамках одного подраздела.

Аргументом нашей функции является вектор из векторов строк. Мы принимаем указатель на него, проверяя, не является ли он нулевым:

#include vector

#include string

typedef vectorstring, allocator textwords;

void process_vocab( vectortextwords, allocator *pvec )

{

if ( ! pvec ) {

// выдать предупредительное сообщение

return;

}

// ...

}

Нужно создать один вектор, включающий все элементы исходных векторов. Это делается с помощью обобщенного алгоритма copy() (для его использования необходимо включить заголовочные файлы algorithm и iterator):

#include algorithm

#include iterator

void process_vocab( vectortextwords, allocator *pvec )

{

// ...

vector string texts;

vectortextwords, allocator::iterator iter = pvec-begin();

for ( ; iter != pvec-end(); ++iter )

copy( (*iter).begin(), (*iter).end(), back_inserter( texts ));

// ...

}

Первыми двумя аргументами алгоритма copy() являются итераторы, ограничивающие диапазон подлежащих копированию элементов. Третий аргумент – это итератор, указывающий на место, куда надо копировать элементы. back_inserter называется адаптером итератора; он позволяет вставлять элементы в конец вектора, переданного ему в качестве аргумента. (Подробнее мы рассмотрим адаптеры итераторов в разделе 12.4.).

Алгоритм unique() удаляет из контейнера дубликаты, расположенные рядом. Если дана последовательность 01123211, то результатом будет 012321, а не 0123. Чтобы получить вторую последовательность, необходимо сначала отсортировать вектор с помощью алгоритма sort(); тогда из последовательности 01111223 получится 0123. (Хотя на самом деле получится 01231223.)

unique() не изменяет размер контейнера. Вместо этого каждый уникальный элемент помещается в очередную свободную позицию, начиная с первой. В нашем примере физический результат – это последовательность 01231223; остаток 1223 – это, так сказать, " отходы" алгоритма. unique() возвращает итератор, указывающий на начало этого остатка. Как правило, этот итератор затем передается алгоритму erase() для удаления ненужных элементов. (Поскольку встроенный массив не поддерживает операции erase(), то семейство алгоритмов unique() в меньшей степени подходит для работы с ним.) Вот соответствующий фрагмент функции:

void process_vocab( vector *pvec )

{

// ...

// отсортировать вектор texts

sort( texts.begin(), texts.end() );

// удалить дубликаты

vectorstring, allocator::iterator it;

it = unique( texts.begin(), texts.end() );

texts.erase( it, texts.end() );

// ...

}

Ниже приведен результат печати вектора texts, объединяющего два небольших текстовых файла, после применения sort(), но до применения unique():