• безопасность параллельного чтения. Несколько потоков могут одновременно читать содержимое контейнера, и это не помешает его правильной работе. Естественно, запись в контейнер при этом не допускается;
• безопасность записи в разные контейнеры. Несколько потоков могут одновременно производить запись в разные контейнеры.
Обращаю ваше внимание: это то, на что вы можете
Многопоточное программирование считается сложной задачей, и многие программисты желают, чтобы реализации STL изначально обеспечивали полную потоковую безопасность. Это избавило бы их от необходимости самостоятельно синхронизировать доступ. Конечно, это было бы очень удобно, однако добиться этой цели очень сложно. Рассмотрим несколько способов реализации полной потоковой безопасности контейнеров:
• блокировка контейнера на время вызова любой функции;
• блокировка контейнера в течение жизненного цикла каждого возвращаемого итератора (например посредством вызова begin
или end
);
• блокировка контейнера на протяжении работы каждого алгоритма, вызванного для этого контейнера. В действительности это бессмысленно, поскольку, как будет показано в совете 32, алгоритм не располагает средствами идентификации контейнера, с которым он работает. Тем не менее, мы изучим этот вариант — будет поучительно увидеть, почему он в принципе неработоспособен.
Рассмотрим следующий фрагмент, который ищет в vector
первое вхождение числа 5 и заменяет его нулем:
vector
…
vector
if (first5 != v.end) { // Строка 2
*first5 = 0; // Строка 3
}
В многопоточной среде существует вероятность того, что другой поток изменит содержимое v
сразу же после выполнения строки 1. Если это произойдет, сравнение first5
с v.end
в строке 2 становится бессмысленным, поскольку содержимое v
будет не тем, каким оно было в конце строки 1. Более того, такая проверка может привести к непредсказуемым результатам, поскольку третий поток может перехватить управление между строками 1 и 2 и сделать first5
недействительным (например, при выполнении вставки вектор может заново выделить память, вследствие чего все итераторы данного вектора станут недействительными. За подробностями о перераспределении памяти обращайтесь к совету 14). Присваивание *first5
в строке 3 тоже небезопасно, поскольку между строками 2 и 3 другой поток может удалить элемент, на который указывает (или, по крайней мере, указывал раньше) итератор first5
.
Ни одно из описанных выше решений с блокировкой не решает этих проблем. Вызовы begin
и end
в строке 1 сразу возвращают управление, сгенерированные ими итераторы остаются действительными только до конца строки, а find
тоже возвращает управление в конце строки.
Чтобы этот фрагмент был потоково-безопасным, блокировка v
должна сохраняться от строки 1 до строки 3. Трудно представить, каким образом реализация STL могла бы автоматически придти к такому выводу. А если учесть, что использование примитивов синхронизации (семафоров, мьютексов[1] и т. д.) обычно сопряжено с относительно высокими затратами, еще труднее представить, каким образом реализация могла бы сделать это без значительного снижения быстродействия по сравнению с программами, которым v
будет работать только один программный поток.
Понятно, почему в решении проблем многопоточности не стоит полагаться на реализацию STL. Вместо этого в подобных случаях следует самостоятельно синхронизировать доступ. В приведенном примере это может выглядеть так:
vector
…
getMutexFor(v);
vector
if (first5 != v.end) {// Теперь эта строка безопасна
*first5 = 0; // И эта строка тоже
}
releaseMutexFor(v);
В другом, объектно-ориентированном, решении создается класс Lock
, который захватывает мьютекс в конструкторе и освобождает его в деструкторе, что сводит к минимуму вероятность вызова getMutexFor
без парного вызова releaseMutexFor
. Основа такого класса (точнее, шаблона) выглядит примерно так:
template
class Lock{ // захватывающих и освобождающих мьютексы
public:// для контейнеров: многие технические
// детали опущены
Lock(const Containers container) : c(container) {
getMutexFor(с);// Захват мьютекса в конструкторе
}
~Lock {