Генетический код — догма и руководство к действию!
Три главных типа биополимеров — ДНК, РНК и белки — существуют в организме не обособленно. Они связаны между собой отношением, которое великий ученый Фрэнсис Крик назвал «основной догмой молекулярной биологии». Суть «догмы» в том, что генетическая информация в клетке хранится в виде последовательности молекулы ДНК, а реализуется в виде последовательности белка, причем посредником в процессе переноса информации является молекула РНК. Процесс перекодирования нуклеотидной последовательности в аминокислотную происходит на специальных молекулярных машинах — рибосомах.
Используя нестрогую компьютерную аналогию, ДНК можно сравнить с программой, написанной на одном из языков программирования высокого уровня (например, С++). Аппарат трансляции, включающий в себя разнообразные РНК, работает как компилятор, переводящий (транслирующий) эту программу в машинный код, понятный компьютеру. А белок можно уподобить исполняемому файлу игры, получившейся на выходе. Если не знать о принципах компилирования, обнаружить какую-либо связь между исходным текстом программы и итоговым EХЕ-файлом практически невозможно. Именно поэтому ученые так долго не могли заметить взаимосвязь между ДНК и белками.
Другой, более бытовой, аналогией может быть связь между рецептом пирога (ДНК) и собственно пирогом (белком). Превращение информации, торопливо записанной на клочке бумаги, в праздничное блюдо происходит благодаря умелым рукам кулинара (рибосомы), который в нужной последовательности соединяет необходимые ингредиенты. Но для человека, не знакомого с письменностью, взаимосвязь между кусочком бумаги и лакомством будет выглядеть как загадка, а может быть, и колдовство.
Кусок ДНК, который кодирует последовательность того или иного белка, называется «ген». Совокупность генов в организме формирует его геном. Это первое — и очень приблизительное — определение молекулярных основ живого, которое постепенно будет уточнено (и усложнено).
Правила, устанавливающие соответствие между последовательностью ДНК и последовательностью белка, которую кодирует данный ген, называются генетическим кодом. Генетический код в основных чертах един для всех живых существ на Земле, и редкие отступления от него у некоторых бактерий и одноклеточных представляют собой исключения, лишь подтверждающие правило. Единство генетического кода является основным доказательством общего происхождения всех форм жизни, известных нам на сегодняшний день.
Генетический код триплетен. Это означает, что одна аминокислота в составе белка кодируется тремя нуклеотидами в составе ДНК. (Аналогично слова «три» и «два», по три буквы в каждом, кодируют в русском языке информацию о цифрах «3» и «2».) Четыре нуклеотида ДНК способны составить 64 триплетных кодона — основных «слов» генетического алфавита. Большая часть этих кодонов кодирует аминокислоты. Причем, поскольку аминокислот всего 20, это значит, что некоторые аминокислоты кодирует несколько разных кодонов, подобно тому как в естественном языке слова-синонимы могут обозначать один и тот же предмет. Это свойство генетического кода, когда несколько кодонов соответствуют одной и той же аминокислоте, называется вырожденностью. Три кодона из 64 не кодируют никаких аминокислот. Это так называемые стоп-кодоны. Их функция — в нужный момент прекращать синтез белка. Стоп-кодон в конце последовательности, кодирующей белок, играет ту же роль, что и точка в конце предложения в человеческих языках.
Замена (мутация) в нуклеотидной последовательности гена влечет за собой ошибку (мутацию) в аминокислотной последовательности белка или даже полное прекращение его синтеза — к такому результату может привести незапланированное появление стоп-кодона в начале гена.
А теперь попробуйте решить несложную, на первый взгляд, задачу. Каждая аминокислота кодируется тремя нуклеотидами, средняя длина белка составляет примерно 200 аминокислотных остатков. Сколько же белков кодирует человеческий геном, имеющий размер 3,1 млрд пар оснований («пар» — потому что обычная структура ДНК в клетке — это двойная спираль)? Неужели больше 5 млн?! (3,1 млрд: (200 * 3)). Но нет. Всего лишь около 20 000–25 000. Откуда же берется такое колоссальное расхождение между размерами генома и количеством белков?
(Строго говоря, приведенные выше цифры не совсем точны, поскольку с одного гена могут считываться несколько разных белков, так что общее число разных белков в человеческом организме будет больше 20 000–25 000, но все равно гораздо меньше 5 млн. При этом в каждой отдельной клетке будет синтезироваться лишь та часть из них, что соответствует ее специализации.)
Оказывается, значительную часть генома образует ДНК, которая не несет никакой информации о белках. На долю ДНК, кодирующей белки в организме человека, приходится всего около 3 %! И даже в генах кодирующие куски ДНК — экзоны — разбиты некодирующими интронами. Английский популяризатор науки Мэтт Ридли остроумно сравнил их с рекламой, прерывающей текст интересной статьи.
Поначалу озадаченные ученые пренебрежительно обозвали эту некодирующую часть ДНК «мусорной» (junk DNA), но в последние годы отношение к ней сильно изменилось. Выяснилось, что некодирующая ДНК играет важную регулирующую роль, особенно в многоклеточных организмах. В частности, было обнаружено, что сложность организации организма (разница между человеком и червем, условно говоря) слабо коррелирует с общим количеством генов в сравниваемых организмах, однако показывает убедительную взаимосвязь с размером некодирующего генома. Чем сложнее организм, тем больше в нем «мусорной» (а на самом деле — регулирующей) ДНК.
Это и другие открытия уточнили наши представления о генах и геноме. На сегодняшний день их можно сформулировать следующим образом. Совокупность ДНК в клетке формирует ее геном. Функция генома заключается в сохранении информации, необходимой для нормального функционирования белков, которые нужны для жизнедеятельности клетки. Эта информация состоит из двух частей. Первая часть — сведения о правильной аминокислотной последовательности белка, которая определяет его трехмерную структуру и биологическую функцию. Эту информацию несут кодирующие участки гена. Проводя соответствие между нуклеотидной последовательностью генома и определенным белком — «ген белка N» — мы имеем в виду именно ее. Вторая часть — это информация о регуляции активности этого белка в клетке: когда и в каких количествах он будет считываться с гена, будет ли ген активен во всех типах клеток или лишь в некоторых и какие факторы будут влиять на его активность (ее еще называют «экспрессией гена»). Эта информация каким-то (пока еще не до конца понятным нам образом) сохраняется в некодирующей, регулирующей части генома.