Ознакомительная версия. Доступно 23 страниц из 113
Трудно переоценить, насколько новые методы прочтения молекулярных последовательностей расширили арсенал ученых-систематиков. Разумеется, пока еще расшифрованы далеко не все молекулярные “предложения” из геномов всех на свете животных, но уже сейчас мы можем пойти в библиотеку и посмотреть точное — слово к слову, буква к букве — построение фраз в предложениях α-гемоглобина собаки, кенгуру, ехидны, курицы, гадюки, тритона, карпа и человека. Не у всех животных есть гемоглобин, но существуют и другие белки, к примеру гистоны, свой вариант которых имеется у любого животного и растения и многие из которых опять-таки уже можно найти в расшифрованном виде в библиотеке. И это не какие-нибудь расплывчатые параметры вроде длины ноги или ширины черепа, зависящие от возраста и состояния здоровья конкретного экземпляра или даже от глазомера естествоиспытателя. Здесь мы имеем дело с четко сформулированными альтернативными вариантами одного и того же предложения, написанными на одном и том же языке, которые можно сопоставить друг с другом с такой же точностью и подробностью, с какой дотошный специалист по древнегреческому мог бы сравнивать два пергамента с текстом одного и того же евангелия. Последовательности ДНК — это и есть подлинные евангелия всего живого, и мы научились разбираться в них.
Основное положение, из которого исходят систематики, состоит в том, что чем близкородственнее виды, тем более сходными вариантами одного и того же молекулярного текста они будут обладать. Это называется “принципом парсимонии”. Парсимония — то же самое, что и скаредная бережливость. Если у нас есть набор организмов, молекулярные “предложения” которых уже расшифрованы, например восемь животных, перечисленных в предыдущем абзаце, то наша задача выяснить, какая из возможных родословных, объединяющих эти организмы, наиболее экономична. Наиболее экономичным генеалогическим древом считается самое “скупое” на предположения, то есть допускающее минимальное количество эволюционных изменений и минимальный уровень конвергенции. Мы вправе считать конвергенцию минимальной исключительно из соображений вероятности. Крайне неправдоподобно, чтобы два неродственных животных могли случайно прийти к абсолютно одной и той же генетической последовательности — слово в слово, буква к букве, — особенно если предполагать, что значительная часть молекулярной эволюции нейтральна.
Однако при попытке рассмотреть все варианты родословной, какие только возможны, мы сталкиваемся с вычислительными трудностями. Когда нам надо классифицировать только три вида животных, возможных генеалогических деревьев всего-навсего три: A родственно B, а C в стороне; A родственно C, а B в стороне; и наконец, B родственно C, а A в стороне. Аналогичные расчеты можно произвести и для большего числа классифицируемых животных, причем количество возможных комбинаций будет расти экспоненциально. Если нам необходимо классифицировать четыре вида животных, то число альтернативных родословных будет еще приемлемым — всего 15. У компьютера не займет много времени вычислить, которая из 15 самая экономичная. Но если нам придется иметь дело с 20 животными, то количество возможных генеалогических деревьев будет уже совсем другим: я насчитал 8 200 794 532 637 891 559 375 (рис. 9). Чтобы найти наиболее экономичное из них, самому быстрому современному компьютеру понадобится 10 000 млн лет — приблизительный возраст нашей вселенной. А систематикам часто бывает необходимо составить родословную более чем 20 животных.
Рис. 9. Это генеалогическое древо является верным. Существует еще 8 200 794 532 637 891 559 374 способа систематизировать данные 20 организмов, и все они неправильные.
Хотя молекулярные систематики первыми стали придавать большое значение проблеме стремительно возрастающих огромных чисел, проблема эта в скрытом виде всегда присутствовала и в традиционной, немолекулярной таксономии. Просто обычные систематики избегали ее при помощи интуитивных догадок. Среди тех генеалогических деревьев, которые теоретически можно было бы рассмотреть, есть такие, которые есть смысл отбросить сразу же, — например, все те миллионы родословных, где люди будут ближе к дождевым червям, чем к шимпанзе. Систематики могут не тратить свое время на рассмотрение таких заведомо абсурдных генеалогических деревьев, а сосредоточиться вместо этого на тех относительно немногочисленных вариантах, которые не столь радикально расходятся с предварительными ожиданиями. Это, вероятно, правомерно, хотя всегда остается опасность того, что самая экономичная версия будет списана со счетов без рассмотрения. Компьютер тоже можно научить рационализировать расчеты, так что, к счастью, проблема больших чисел может оказаться не столь уж велика.
Молекулярная биология снабжает нас таким обилием информации, что мы можем систематизировать организмы снова и снова, каждый раз исходя из сравнения различных белков. Выводы, полученные в результате изучения одних молекул, могут быть использованы для проверки результатов, полученных на других молекулах. И если мы боимся, что в эволюционную историю, рассказанную какой-то одной белковой молекулой, закралась затемняющая истину конвергенция, нам будет нетрудно выяснить, так ли это, взглянув на другую молекулу. Конвергентная эволюция — это, в сущности, особая разновидность совпадения. А совпадение — оно на то и совпадение, чтобы случаться однажды с большей вероятностью, нежели дважды, а дважды — с большей вероятностью, чем трижды. Чем больше молекул белка мы сравниваем, тем ничтожнее возможность случайных совпадений.
Так, например, группа биологов из Новой Зеландии в одном своем исследовании взялась систематизировать 11 видов животных — причем не единожды, а пять раз независимо, с использованием пяти различных белков. Этими животными были овца, макак-резус, лошадь, кенгуру, крыса, кролик, собака, свинья, человек, корова и шимпанзе. Идея была в том, чтобы вначале составить родословную этих 11 видов по одному белку, а затем посмотреть, будет ли она такой же, если использовать другой белок. Теоретически — например, если эволюции не существует, — каждый из этих пяти белков мог бы выявить свою собственную, не похожую на другие картину “родственных взаимоотношений”.
Все последовательности данных пяти белков каждого из 11 видов животных уже имелись в наличии в библиотеках. Для 11 видов существует 654 729 075 возможных вариантов генеалогического древа, и потому пришлось прибегнуть к стандартным приемам рационализации. Компьютер распечатал наиболее экономичные схемы родства, определенные путем независимого сопоставления каждого из пяти белков — пять самых близких догадок относительно того, каким должно быть подлинное генеалогическое древо этих 11 организмов. Идеальным результатом для нас была бы полная идентичность всех пяти получившихся родословных. Вероятность того, что это случайность, была бы в самом деле чрезвычайно мала и равнялась бы числу с 31 нулем после запятой. Однако отсутствие такого полного совпадения вряд ли могло бы сильно нас удивить: определенная доля конвергенции и случайностей неизбежна. Но если бы получившиеся схемы не оказались в существенной степени похожими друг на друга, вот тогда стоило бы забеспокоиться. На самом же деле эти пять генеалогических деревьев получились не полностью идентичными друг другу, но тем не менее почти что одинаковыми. Все пять были единодушны в том, что человека, шимпанзе и резуса следует расположить вместе, но вот насчет того, какое животное считать их самым близким родственником, возникли некоторые разногласия. Гемоглобин B утверждал, что собаку, фибринопептид B — что крысу, фибринопептид A предлагал кластер, состоящий из крысы и кролика, а гемоглобин А — кластер, включающий в себя крысу, кролика и собаку.
Ознакомительная версия. Доступно 23 страниц из 113