Работы русского химика профессора А. Колли, выполненные почти столетие назад, показали, что наследственное вещество в бактериальной клетке составляет очень малую часть от общего числа молекул в ней. И данные Колли натолкнули академика Н. Кольцова на идею о матричном синтезе белков. Однако Кольцов представлял себе поток информации в виде схемы белок — белок. Он думал, что «каждая белковая молекула возникает из белковой молекулы путем кристаллизации вокруг нее находящихся в растворе аминокислот и других белковых обломков».
Весь процесс построения белка, как мы сейчас знаем, происходит не так и гораздо сложнее, но идея матричного синтеза, впервые высказанная Кольцовым в двадцатых годах нашего века, оказала неоценимое влияние на все последующее развитие молекулярной биологии.
Если отвлечься на время от химических аспектов взаимодействия аминокислот с РНК, то проблему генетического кода можно рассматривать просто как проблему перевода текста с одного алфавита на другой.
Молекулу белка можно представить себе как фразу с определенным смыслом. Ну, например, «Яумеюпомогатьорганизмувперевариваниипищи». Не очень длинная фраза, не очень сложный белок — всего 40 аминокислотных остатков. Каждая буква в этой фразе — аминокислота. Но только в отличие от русского алфавита в аминокислотном языке всего двадцать букв. Стоит переставить местами несколько букв во фразе, и она потеряет смысл. Стоит переставить аминокислоты, и молекула белка тоже «потеряет смысл» — не сможет выполнять свою функцию: помогать в переваривании пищи.
Молекула ДНК тоже текст. Но текст, в алфавите которого используется лишь четыре буквы. В мире живого белковый текст кодируется нуклеиновым. А что такое кодирование?
Если заданная последовательность нуклеотидов в нуклеиновой кислоте полностью определяет последовательность аминокислот в белке, то мы говорим, что нуклеиновый текст кодирует текст белка.
Как же составляются слова из четырех букв нуклеинового текста? Совершенно ясно, что кодировать одну букву — аминокислоту должны какие-то комбинации из четырех букв — нуклеотидов. Это очевидно, так как четыре нуклеиновых основания, взятые каждое в отдельности, могут определить положение только четырех аминокислот в белковой молекуле. Ну а если брать пары оснований? Нетрудно видеть, что тогда можно кодировать 42, или 16 аминокислот. А если брать тройки, или, как говорят еще, триплеты? Тогда 43, или 64, поскольку число комбинаций из четырех букв по три равно 43.
Каждая аминокислота кодируется триплетом оснований, поскольку дуплет способен закодировать только 42 = 16 аминокислот, а триплет создает некоторую избыточность (43 = 64).
Триплет оснований, кодирующий одну аминокислоту, называется кодовым словом, или кодоном. Поскольку триплетов 64, а организм использует для построения белков всего двадцать аминокислот, то среди триплетов есть и бессмысленные кодоны, то есть кодоны, которые не кодируют никакой аминокислоты.
Вот мы и подошли к самому главному. Существуют ли какие-либо данные, свидетельствующие о том, что код изменяется при переходе от низших форм к высшим?
Для выяснения этого вопроса были проведены тщательные исследования. Их цель состояла в том, чтобы посмотреть, какую аминокислоту кодирует тринуклеотид, выделенный, к примеру, из кишечной палочки, из печени морской свинки, из тканей позвоночных, в том числе и человека.
Так вот оказалось, что если взять, к примеру, тринуклеотид УУУ (подряд три урацила), то из какого организма мы ни взяли бы этот триплет, он всегда кодирует аминокислоту фенилаланин. Этот и многие другие эксперименты доказали, что генетический код универсален.
Правда, из этого правила есть два важных исключения.
Совсем недавно в журнале «Nature» появилось сообщение, что ДНК митохондрий и ядерная ДНК клеток высших организмов по-разному кодируют одну и ту же аминокислоту — метионин. Еще раньше было выяснено, что у кишечной палочки кодон УГА, состоящий из урацила, гуанина и аденина, бессмысленный. В то же время у позвоночных, скажем у морской свинки, он соответствует аминокислоте цистеину.
Эти два важных отклонения от универсальности кода, бесспорно, требуют объяснения. И сегодня принято говорить о коде уже более сдержанно: код практически универсален.
Из палеобиологических данных известно, что вся дарвиновская эволюция насчитывает около 3,5 миллиарда лет и, по-видимому, за это время не произошло принципиальных (существенных) изменений в механизме матричного синтеза, поскольку генетический код практически универсален у всех организмов. На возникновение же самого механизма синтеза и кода остается промежуток времени меньше чем один миллиард лет, если исходить из данных о строении и эволюции планет солнечной системы.