Глава 2. Когда темная материя становится совсем темной
Ученых поразило, что такая огромная доля генома не кодирует никаких белков. Однако больше всего их удивило не само это явление, а его размах. Специалисты уже много лет знали о существовании участков ДНК, не кодирующих белки. Собственно, это стало одним из первых больших сюрпризов после открытия структуры ДНК. Однако тогда вряд ли кто-нибудь представлял, какими важными окажутся эти области ДНК, и вряд ли кто-нибудь ожидал, что они помогут объяснить причины некоторых генетических заболеваний.
Сейчас не помешает чуть подробнее вглядеться в строительные блоки нашего генома. Напомним, ДНК — своего рода алфавит, к тому же весьма простой. В нем всего четыре буквы — А, Г, Т и Ц (аденин, гуанин, тимин и цитозин). Их называют нуклеотидными основаниями. Этот простенький алфавит несет в себе невероятное количество информации. Человек наследует 3 миллиарда оснований, составляющих наш генетический код, от матери, и аналогичный набор оснований от отца. Представьте себе ДНК как веревочную лестницу, где каждая ступенька — нуклеотидное основание, причем между соседними ступеньками 25 сантиметров. Такая лестница протянулась бы на 75 миллионов километров, то есть приблизительно от Земли до Марса (впрочем, тут многое зависит от того, где эти планеты будут располагаться на своих орбитах в тот момент, когда мы протянем эту воображаемую лестницу).
Еще одно сравнение. Полный корпус произведений Шекспира содержит в себе, по уверениям специалистов, 3 миллиона 695 тысяч 990 букв1. Представим себе, что все это собрали в один толстенный том. Мы наследуем от матери текст объемом чуть больше 811 таких книг. И столько же — от отца. Это, прямо скажем, немалый объем информации.
Если продолжать аналогию с алфавитом, можно заметить, что алфавит ДНК кодирует лишь трехбуквенные слова. Каждое такое слово соответствует определенной аминокислоте — строительному блоку, из которых конструируются белки. Ген можно представить себе как предложение из таких трехбуквенных слов. Такая фраза кодирует последовательность аминокислот, из которых слагается тот или иной белок. (См. рис. 2.1.)
Рис. 2.1. Связь между геном и белком. Каждая трехбуквенная последовательность в гене кодирует один строительный блок соответствующего белка.
В каждой клетке обычно содержится по две копии каждого гена. Одну копию мы наследуем от матери, одну — от отца. Но хотя в клетке лишь две копии каждого гена, она способна создавать тысячи и тысячи белковых молекул, кодируемых тем или иным геном.
Как клетке это удается? В процесс экспрессии генов встроено два механизма амплификации (увеличения числа копий). Последовательность нуклеотидных оснований в ДНК не служит непосредственным шаблоном для создания белка. Клетка создает копии гена. Эти копии очень похожи на исходный ген ДНК, однако не идентичны ему. Они слегка отличаются от него по химическому составу. Их называют РНК (рибонуклеиновая кислота, тогда как ДНК — дезоксирибонуклеиновая кислота). Еще одно отличие: у РНК вместо основания Т (тимин) — основание У (урацил). ДНК состоит из двух нитей, соединенных парами оснований. Чем-то это похоже на железнодорожные пути. Рельсы удерживаются вместе благодаря тому, что нуклеотидное основание одного рельса связывается с основанием другого, как если бы основания пожимали друг другу руки. Такие рукопожатия подчиняются определенным правилам. Т пожимает руку только А, а Ц — лишь Г. Благодаря этому распределению связей ученые часто описывают ДНК как совокупность нуклеотидных пар. РНК — однонитевая молекула («монорельс»)[2]. Главные отличия между ДНК и РНК показаны на рис. 2.2. Клетка способна быстро сделать тысячи РНК-копий гена ДНК, и это — первая амплификационная стадия экспрессии гена.
Рис. 2.2. Вверху: грубая схема ДНК (молекулы, состоящей из двух нитей). Основания (А, Г, Т и Ц) удерживают две нити вместе, попарно соединяясь. При этом А всегда соединяется только с Т, а Г всегда соединяется только с Ц. Внизу: грубая схема РНК (однонитевой молекулы). Ее «хребет» по химическому составу чуть отличается от ДНК (поэтому полоска закрашена другим цветом). Вместо основания Т у РНК — основание У.
РНК-копии гена уносятся от ДНК в другую часть клетки — цитоплазму. В этой клеточной области молекулы РНК действуют как своего рода шаблоны (матрицы) для аминокислот, которые образуют белок. Каждая молекула РНК может много раз выступать в роли такого шаблона, что и представляет собой вторую стадию амплификации при экспрессии гена. (См. рис. 2.3.)
Можно прибегнуть к аналогии с узором для вязания, которую мы уже использовали в первой главе. Ген ДНК — исходный узор на листе бумаги. Этот узор можно много раз ксерокопировать (сравните с производством РНК). Полученные копии можно послать множеству вязальщиц, каждая из которых может много раз воспроизвести один и тот же узор (сравните с синтезом белка). Простая, но эффективная модель. Такая молекула РНК действует как своего рода посланец. Она несет информацию о генетической последовательности от ДНК к «сборочному цеху», где синтезируются белки. Поэтому она и называется информационной РНК (другое название — матричная РНК).
Рис. 2.3. Единичная копия гена ДНК в ядре клетки используется как шаблон для создания множества копий молекулы информационной РНК. Эти молекулы РНК выводятся за пределы ядра. Затем каждая может играть роль инструкции для производства белка. Каждая молекула информационной РНК способна создавать множество копий одного и того же белка. Таким образом, при создании белка на основе кода ДНК имеют место две стадии амплификации. Для простоты картины здесь показана лишь одна копия данного гена, хотя обычно в клетке их две — по одной от каждого из родителей.
Отсекая бессмыслицу
Вам может показаться, что все это — довольно простые процессы. Однако некоторое время назад ученые обнаружили, что здесь есть некая странность. Большинство генов состоит из фрагментов, которые кодируют аминокислоты белков, и каких-то «лишних» кусков, которые ничего такого не кодируют. Эти куски — словно бессмыслица, вклинившаяся в строй понятных слов. Фрагменты бессмысленного генетического текста назвали интронами.
Когда клетка производит РНК, она вначале копирует все ДНК-буквы гена, в том числе и те его куски, которые не кодируют никаких аминокислот. Но затем клетка удаляет эти некодирующие куски, так что в конечном счете получается информационная РНК, представляющая собой удобную инструкцию для синтеза нужного белка. Этот процесс называется сплайсингом («сращиванием»). Он упрощенно показан на рис. 2.4.