В случае, когда необходимо иметь дело с синхронизацией между разными процессорами или разными аппаратными устройствами, иногда возникает требование, чтобы чтение памяти (load) или запись в память (save) выполнялись в том же порядке, как это указано в исходном программном коде. При работе с аппаратными устройствами часто необходимо, чтобы некоторая указанная операция чтения была выполнена перед другими операциями чтения или записи. В дополнение к этому, на симметричной многопроцессорной системе может оказаться необходимым, чтобы операции записи выполнялись строго в том порядке, как это указано в исходном программном коде (обычно для того, чтобы гарантировать, что последовательные операции чтения получают данные в том же порядке). Эти проблемы усложняются тем, что как компилятор, так и процессор могут менять порядок операций чтения и записи[52] для повышения производительности. К счастью, все процессоры, которые переопределяют порядок операций чтения или записи предоставляют машинные инструкции, которые требуют выполнения операций чтения-записи памяти в указанном порядке. Также существует возможность дать инструкцию компилятору, что нельзя изменять порядок выполнения операций при переходе через определенную точку программы. Эти инструкции называются
Рассмотрим следующий код.
а = 1;
b = 2;
На некоторых процессорах запись нового значения в область памяти, занимаемую переменной b
, может выполниться до того, как будет записано новое значение в область памяти переменной а
. Компилятор может выполнить такую перестановку статически и внести в файл объектного кода, что значение переменной b
должно быть установлено перед переменной a
. Процессор может изменить порядок выполнения динамически путем предварительной выборки и планирования выполнения внешне вроде бы независимых инструкций для повышения производительности. В большинстве случаев такая перестановка операций будет оптимальной, так как между переменными a
и b
нет никакой зависимости. Тем не менее иногда программисту все-таки виднее.
Хотя в предыдущем примере и может быть изменен порядок выполнения, ни процессор, ни компилятор никогда не будут менять порядок выполнения следующего кода, где переменные а
и b
являются глобальными.
а = 1;
b = а;
Это происходит потому, что в последнем случае четко видно зависимость между переменными a
и b
. Однако ни компилятор, ни процессор не имеют никакой информации о коде, который выполняется в других контекстах. Часто важно, чтобы результаты записи в память "виделись" в нужном порядке другим кодом, который выполняется за пределами нашей досягаемости. Такая ситуация часто имеет место при работе с аппаратными устройствами, а также возникает на многопроцессорных машинах.
Функция rmb()
позволяет установить барьер чтения памяти (read memory barrier). Она гарантирует, что никакие операции чтения памяти, которые выполняются перед вызовом функции rmb()
, не будут переставлены местами с операциями, которые выполняются после этого вызова. Иными словами, все операции чтения, которые указаны до этого вызова, будут выполнены перед этим вызовом, а все операции чтения, которые указаны после этого вызова никогда не будут выполняться перед ним.
Функция wmb()
позволяет установить барьер записи памяти (write barrier). Она работает так же, как и функция rmb()
, но не с операциями чтения, а с операциями записи — гарантируется, что операции записи, которые находятся по разные стороны барьера, никогда не будут переставлены местами друг с другом.
Функция mb()
позволяет создать барьер на чтение и запись. Никакие операции чтения и записи, которые указаны по разные стороны вызова функции mb()
, не будут переставлены местами друг с другом. Эта функция предоставляется пользователю, так как существует машинная инструкция (часто та же инструкция, что используется вызовом rmb()
), которая позволяет установить барьер на чтение и запись.
Вариант функции rmb()
— read_barrier_depends()
— обеспечивает создание барьера чтения, но только для тех операций чтения, от которых зависят следующие, за ними операции чтения. Гарантируется, что все операции чтения, которые указаны перед барьером выполнятся перед теми операциями чтения, которые находятся после барьера и зависят от операций чтения, идущих перед барьером. Все понятно? В общем, эта функция позволяет создать барьер чтения, так же как и функция rmb()
, но этот барьер будет установлен только для некоторых операций чтения — тех, которые зависят друг от друга.
Для некоторых аппаратных платформ функция read_barrier_depends()
выполняется значительно быстрее, чем функция rmb()
, так как для этих платформ функция read_barrier_depends()
просто не нужна и вместо нее выполняется инструкция noop
(нет операции).
Рассмотрим пример использования функций mb()
и rmb()
. Первоначальное значение переменной а
равно 1, а переменной b
равно 2.
Поток 1 Поток 2
а = 3; -