Как часто ошибаются тесты?
Чувствительность и специфичность — два главных параметра, которые определяют ценность теста в качестве диагностического инструмента. Говоря простым языком, именно от них зависит, насколько можно доверять его результатам. Не путаться в терминах отлично помогает мем про беременность, который воспроизведен на рисунке 11.
Рис. 11
Когда тест не находит заболевание у тех, кто болеет, — это низкая чувствительность. Когда находит у того, кто здоров, — низкая специфичность. Эти два параметра обратно связаны друг с другом: как мы уже обсудили выше, увеличивая одно, мы неизбежно занижаем другое. Обычно тесты, используемые для диагностики заболеваний, выкручивают на максимум чувствительности. Потому что мы хотим обнаружить всех носителей, а в случае генетического теста на COVID-19 еще и изолировать их, чтобы прервать как можно больше возможных цепочек заражения.
В тестах на антитела к SARS-CoV-2 разумнее увеличивать специфичность: если тест будет выдавать положительный результат всем, кто недавно болел простудой коронавирусного происхождения, мы будем думать, что в обществе существенно больше перенесших COVID-19, чем на самом деле. Исходя из этих цифр, политики могут решить, что тот самый коллективный иммунитет уже близок, ослабить меры предосторожности и не держать резервных коек в больницах — ведь почти все уже переболели. Отвлекаясь даже от факта, что мы не знаем, гарантирует ли наличие антител к белкам SARS-CoV-2 длительную защиту от повторного заражения, резкое ослабление мер в популяции, где большинство вовсе не встречалось с вирусом, неизбежно даст всплеск заболеваемости.
Чувствительность большинства используемых сейчас тестов на антитела колеблется около цифры 99 %. Разброс по специфичности больше — он составляет в среднем от 90 до почти 100 %. Кажется, что это неплохие показатели, но в действительности все не так радужно. Да, сами по себе эти значения вполне приличные, но для массового скрининга (тотальной проверки), особенно в популяции, где не очень много людей переболело COVID-19, они не так уж хороши. Чтобы понять, как общее число переболевших влияет на пригодность теста, хотя сам он при этом не меняется, рассмотрим конкретный пример.
Представим, что в некоей популяции — пускай это будет Москва — COVID-19 переболели 5 % жителей (для простоты будем считать, что у всех у них теперь есть антитела). Пускай у нас есть тест на антитела с чувствительностью 99 % и специфичностью 98 %. Мы наугад выбрали 1000 человек и собираемся проверить их нашим тестом. Если выборка совершенно случайная, 5 % — то есть 50 человек — имеют антитела к SARS-CoV-2. Так как чувствительность теста не 100 %, а только 99, 1 % из реально переболевших получат ложноотрицательный результат. 1 % от 50 человек — это 0,5 человека. Казалось бы, никакой разницы. Но продолжим наши рассуждения. Специфичность теста 98 %, то есть 2 % из тех, кто не болел COVID-19, получат ложный результат, будто они болели. В нашей тысяче москвичей не болели 95 %, то есть 950 человек. 2 % от 950 — это 19 человек, которым сообщат, что у них есть антитела к коронавирусу, хотя на самом деле их нет. Теперь важный момент: в реальности сотрудники лаборатории не знают, у кого из тех, кто признан переболевшим, реально есть антитела, — это знаем только мы как авторы этой задачки. Но клиницисты могут подсчитать, какова вероятность, что любой из полученных положительных результатов — ложный. Для этого нужно разделить число тех, кто получил положительный результат ошибочно, на общее число положительных результатов. В нашем случае это 19 человек, а всего узнали, что они перенесли коронавирусную инфекцию, 19+49,5=68,5 человека. 19/68,5=0,27, то есть 27 %. Другими словами, больше четверти положительных результатов в реальности являются ложноположительными.
Теперь представим, что в Москве переболело 50 % населения. Тогда, повторив наши рассуждения, мы получим, что лишь чуть меньше 2 % положительных результатов тестов на COVID-19 окажутся неверными. С ростом доли переболевших знаменатель дроби в формуле, по которой мы рассчитываем вероятность ошибки, становится все больше, а значит, результат деления — все меньше. Другими словами, значимость положительного и отрицательного результатов теста (а следовательно, пригодность этого теста для массовых скринингов) зависит от того, насколько широко распространено изучаемое заболевание. Для вас лично из этой абстрактной математической закономерности вытекают два практических следствия. Чем меньше людей реально переболели COVID-19, тем выше вероятность, что ваш положительный результат неверен (ни у кого еще нет антител, а у меня уже есть, наверно, это какая-то ошибка). И наоборот, чем переболевших больше, тем значительнее шанс, что, если вы получили отрицательный результат, он будет ложным (у всех уже есть антитела, а у меня нет, как так, это явно ошибка).