Левая верхняя комбинация A1В1С3D5 – это хромосома от одного родителя, а левая нижняя комбинация А3В1С4D3 – хромосома от второго родителя. Вместе они образуют одну хромосомную пару. Колонка из A1 и А3 (буквы выделены жирным шрифтом) составляет позицию генов. Если брать их по отдельности, то A1 – это аллель, или ген от одного родителя с одной наследуемой чертой. Ограниченное количество аллелей возможно в любой позиции генов, а взаимодействие аллелей от матери и отца определяет те качества, которые наследует их потомство. Шеннон перевел в символы возможные аллели с помощью чисел в нижнем индексе. А1 и А3 – это различные проявления одной черты (к примеру, цвета волос – единица обозначает каштановый, а двойка блондин), а качество, которое превалирует, зависит от того, какой ген доминирует.
Теперь еще больше упростим эту схему. Допустим, мы хотим изучить целую популяцию индивидуумов, выбрав всего две черты, А и В.
А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения?
И снова каждый ряд символов получен от одного родителя, а каждая колонка обозначает позицию гена. Скажем, существуют две возможные аллели для А (к примеру, каштановые и светлые волосы) и три для В (высокий, среднего роста и низкорослый). В этом случае получится двадцать один генетически отличный от других индивидуум (поверьте нам), варьирующийся от
A1B1
A1B1
до
A1B3
A2B2
Итак, как мы можем смоделировать генетические изменения населения со временем, или предсказать результаты его произвольного смешения с другой группой? Как будет выглядеть новая популяция через пять поколений? А через тысячу поколений?
Если бы мы были наделены неограниченным количеством времени и бумаги, то могли бы произвести расчеты отдельно для каждого из двадцати одного индивидуума, соединившихся в произвольном порядке с представителями другой группы. В результате мы получили бы одно поколение, а дальше мы могли бы вновь и вновь повторять этот процесс до бесконечности. А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения? Оно должно быть, как отметил Шеннон, одновременно компактным и наглядным: достаточно компактным, чтобы использовать его в качестве единственной величины в уравнении, и наглядным, чтобы его можно было «разобрать» на все его составляющие, когда нам нужно остановить циклы рекомбинации и изучить результаты.
Размышляя подобным образом, Шеннон изобрел символ, чтобы суммировать всю популяцию: λhijk.
Данное выражение действительно, как он указывал, является «целой группой цифр». λ – это популяция в целом, h, j, i и k – это гены. По мере того как мы узнаем ряд генов, возможных для данной популяции, мы можем заменить эти буквы рядом цифр. Колонка hj – это одна позиция гена, и так как первая рассматриваемая черта имеет две аллели, значение h или j может варьироваться от 1 до 2. Колонка ik – это другая позиция гена, и так как вторая рассматриваемая черта имеет три аллели, значение i или k может варьироваться от 1 до 3. λ1322 теперь означает не одного индивидуума, а долю целой популяции, имеющей генетический код:
A1B3
A2B2.
λhijk – это особенно простой способ перевести в символы частоту гена, потому что, как и хорошая оптическая иллюзия, она открывает два разных набора информации, в зависимости от того, как мы ее читаем. Если читать вертикально, то колонки с величинами – hj и ik – означают позиции генов, что подводит нас к качествам любого индивидуума в данной популяции. Если прочитать горизонтально, ряды величин