Один из вариантов среднего, делящий распределение пополам. Чтобы вычислить медиану, нужно упорядочить все элементы выборки по возрастанию (например, выстроить детей в классе в шеренгу по росту), а потом посмотреть, что оказалось ровно посередине. То есть половина выборки будет меньше этого значения, а вторая половина больше него. Пусть рост учеников в классе 123, 125, 126, 126, 126, 128 и 156 сантиметров. Тогда медиана этого распределения будет 126. В отличие от среднего арифметического значения, которое мы обычно привыкли подозревать, говоря о некоем среднем. Для вычисления среднего арифметического нам нужно сложить рост всех учеников и разделить его на количество детей: (123 + 125 + 126 + 126 + 126 +128 + 156)/7 = 130. Мы получили 130 сантиметров, хотя почти все ученики в классе меньше. В данном случае картину нам испортило значение 156, сильно выделяющееся на фоне остальных. Такие, выходящие за границы основного распределения значения называются выбросами. Говорят, что обычное арифметическое среднее не устойчиво к выбросам. Что мы и наблюдали на нашем примере с ростом. Если бы в главе мы использовали арифметическое среднее, а не медиану, то очень-очень длинные или, наоборот, очень-очень короткие белки могли бы исказить представление о настоящей длине большинства белков в человеческом теле. В отличие от арифметического среднего, медиана устойчива к выбросам – на ее значение не повлияло слишком большое значение роста одного из учеников. Помимо медианы и арифметического среднего очень распространено и полезно также среднее под названием мода. Для данного примера мода также будет равняться 126, так как она означает самое популярное, модное из всех имеющихся в выборке значений. Как и медиана, мода устойчива к выбросам. Использовать каждое из этих средних нужно сообразно ситуации. Не используйте среднее арифметическое, если подозреваете, что в ваших данных могут быть экстремальные значения.
Представляете, сколько потенциальных вариантов можно получить с одного лишь среднестатистического гена?!
В нашем игрушечном примере экзонов было максимум 4, а в реальности их может быть гораздо больше! Средний человеческий ген состоит из 9 экзонов и 8 интронов[146][147]. Но бывают и отдельные уникумы, вроде MLL-гена, который состоит из 36 экзонов, да еще доказанно умеет менять их порядок в некоторых случаях[148]! Теперь представляете себе комбинаторную сложность такой задачи и потенциально возможное количество различных мРНК при относительно небольшом количестве генов в геноме?
Порядок, в котором собираются экзоны в мРНК, не случаен, им управляют соответствующие молекулярные механизмы и регуляторы. Кроме того, все возможные формы сплайсинга для конкретного гена не происходят в один и тот же момент времени в одной и той же клетке. В свое время открытие процесса сплайсинга перевернуло мир биологии. Второй переворот в нем произошел в тот момент, когда стало известно о его альтернативных формах.
Итак, из одного гена эукариотического организма может получаться несколько различных белков. Но зачем нам эта глава в книге о ГМО?