Чтобы избежать этих проблем, ученые из Калифорнийского университета в Беркли в 2009 году разработали программное обеспечение, с помощью которого «окна» скользят вдоль цепочки символов в поисках сходств и образцов. В качестве эксперимента ученые таким образом проанализировали геномы млекопитающих и тексты нескольких десятков книг, таких как «Питер Пэн», «Книга Мормона» и «Государство» Платона. Было обнаружено, что одно и то же программное обеспечение способно, с одной стороны, классифицировать ДНК различных видов млекопитающих, а с другой – классифицировать книги по жанрам с идеальной точностью. Обратившись к спорным текстам, ученые погрузились в изучение постоянно вызывающего споры вопроса о том, получил ли Шекспир достаточно хорошее образование для того, чтобы написать свои пьесы. И программа показала, что классик действительно написал драму «Два знатных родича» – пьесу, авторство которой постоянно подвергалось сомнению, – но не написал «Перикла», другую пьесу спорного авторства. Затем команда из Беркли изучила геномы вирусов и архебактерий, самых старых и в массе своей чужеродных для нас форм жизни. Этот анализ выявил новые связи между этими организмами и другими микробами, в результате были выдвинуты новые предложения по их классификации. Из-за огромного объема данных анализ геномов мог получиться весьма глубоким: в течение года 320 компьютеров занимались только тем, что сканировали микробы и архебактерии. Однако анализ этих геномов позволил ученым выйти за рамки обычного пошагового сравнения генов и понять полную естественную историю этих биологических видов.
* * *
Расшифровка полной геномной истории, однако, требует более сложных навыков, чем работа с другими текстами. Расшифровка ДНК требует чтения и слева направо, и справа налево – так называемый бустрофедон. В противном случае можно пропустить важные палиндромы и морднилапы: соответственно слова, которые одинаково читаются с обеих сторон или же приобретают другой смысл при прочтении с конца.
Один из самых древних известных палиндромов – высеченный на стене в Помпеях (и других городах) магический квадрат, слова в котором читаются сверху вниз, снизу вверх, справа налево и слева направо:
S-A-T-O-R
A-R-E-P-O
T-E-N-E-T
O-P-E-R-A
R-O-T-A-S[22]
Насчитывая примерно две тысячи лет от роду, данная надпись на порядок младше, чем по-настоящему древние палиндромы в ДНК, которая создала целых два вида палиндромов. Во-первых, это фразы традиционного («А роза упала на лапу Азора») типа: например, Г-А-Т-Т-А-Ц-А-Т-Т-А-Г. Однако поскольку АТ и ЦГ – это парные основания, ДНК образовывает и другие, менее явные палиндромы, которые спереди читаются по одной нити, а сзади – по другой. Сравните нить Ц-Т-А-Г-Ц-Т-А-Г, затем представьте основания, которые должны появиться на другой нити: Ц-А-Т-Ц-Г-А-Т-Ц. Это совершенные палиндромы.
Безобидный на вид, этот второй тип палиндрома может нагнать страху на любого микроба. Давным-давно многие микробы выделяли специальные белки (под названием «ферменты рестрикции»), которые могли резать ДНК подобно кусачкам. И по какой-то причине эти ферменты могут разрезать ДНК только в ее симметричных, палиндромных участках. Подобные надрезы служат и полезным целям: к примеру, выбрасывают из спирали основания, пораженные радиацией, или снимают напряжение в сильно запутанной ДНК. Однако непослушные микробы в основном использовали эти белки, чтобы воевать друг с другом и перерабатывать чужой генетический материал. В результате микробы методом проб и ошибок научились избегать даже неочевидных палиндромов.
Впрочем, высшие существа, к которым относимся мы сами, тоже не то чтобы толерантны к палиндромам. Снова рассмотрим Ц-Т-А-Г-Ц-Т-А-Г и Г-А-Т-Ц-Г-А-Т-Ц. Отметим, что начало каждого из палиндромных сегментов может образовывать пары оснований со своей второй половиной: первая буква с последней (Ц…Г), вторая с предпоследней (А…Т) и т. д. Но для того, чтобы сформировать эти внутренние связи, одна сторона нити ДНК должна абстрагироваться от другой и выгнуться вверх, образовав выступ. Такая структура (так называемая шпилька) благодаря симметричному строению может образовывать ДНК-палиндром любой длины. Как и следовало ожидать, «шпильки» могут разрушать ДНК так же, как и узлы: разрушая клеточные механизмы.
Палиндромы могут возникнуть в ДНК двумя способами. Самые короткие ДНК-палиндромы, которые становятся причиной появления «шпилек», возникают случайно, когда А, Ц, Г и Т организуются симметрично. Более длинные палиндромы также перетряхивают наши хромосомы, и многие из них – особенно те, которые наносят серьезный ущерб маленькой Y-хромосоме – возможно, возникают в результате специфического двухступенчатого процесса. По различным причинам хромосомы иногда случайным образом дублируют отрезки ДНК, а потом вставляют вторую копию куда-нибудь вниз по линии. Также хромосомы могут (иногда после разрыва сразу двух нитей) разворачивать отрезок ДНК на 180 градусов и прикреплять их задом наперед. Действуя в тандеме, дупликация и инверсия создают палиндром.
Большинство хромосом, однако, препятствуют появлению длинных палиндромов или по крайней мере стараются не допускать инверсий, которые они создают. Инверсия может разрушить или «отключить» гены, оставив хромосому неэффективной. Также инверсии могут резко уменьшить шансы хромосомы на кроссинговер – а это огромная потеря. Кроссинговер (когда одинаковые хромосомы пересекаются и обмениваются сегментами) позволяет хромосоме поменять свой генетический материал, приобрести лучшие версии, или версии, которые лучше работают вместе и делают хромосому более жизнеспособной. Не менее важно то, что хромосомы пользуются преимуществами кроссинговера, чтобы выполнить проверку контроля качества: они могут выстроиться в две шеренги, «глаза в глаза» и заменить мутировавшие гены немутировавшими. Однако хромосома может пересекаться только с хромосомой, которая выглядит точно так же. Если же партнер выглядит подозрительно не похоже, хромосома опасается получить болезнетворную ДНК и отказывается от обмена. Инверсии на этом фоне выглядят чертовски подозрительно, поэтому в подобных обстоятельствах хромосомы с палиндромами просто игнорируются.
У Y-хромосомы нетерпимость к палиндромам проявилась с самого начала. Давным-давно, еще до того, как млекопитающие отделились от рептилий, Х и Y были парными хромосомами и пересекались часто. Затем, 300 миллионов лет назад, один из генов хромосомы Y мутировал и превратился в «главный выключатель», заставляющий яички развиваться. До этого, вероятно, пол животного зависел от температуры, при которой самка высиживает яйца – схожая не имеющая отношения к генетике система определяет пол черепах и крокодилов. Благодаря этому изменению Y стала «мужской» хромосомой и, пройдя через разнообразные процессы, сконцентрировала другие мужские гены, преимущественно связанные с производством сперматозоидов. Как следствие, Х и Y стали выглядеть по-разному и, соответственно, уклоняться от кроссинговера. Хромосома Y не захотела рисковать своими генами, которые могла переписать злобная Х-хромосома, в то время как Х не хочет приобретать грубые гены хромосомы-мужлана, которые могут повредить женским ХХ-организмам.