Рис. 3-5. Разнообразие мультидоменной архитектуры гомологичных белков. На схеме сравнивается доменная архитектура двух паралогичных наборов древних и функционально незаменимых для всех организмов ортологичных белков: тирозил-тРНК синтетазы (TyrRS) и триптофанил-тРНК синтетазы (TrpRS). Каждый домен обозначен своей собственной геометрической формой (по Wolf et al., 1999a).
Мультидоменные белки обнаружены у всех форм жизни, но особенно характерны для сложных многоклеточных эукариот (Koonin et al., 2000a; Koonin et al., 2000b). Доменная архитектура этих белков демонстрирует различную степень эволюционной пластичности. Изменчивость особенно выражена у белковых архитектур, включающих так называемые «неразборчивые домены» (promiscuous domains), имеющие склонность к слиянию с разнообразными другими доменами (Basu et al., 2009). Разнообразная мультидоменная архитектура белков запутывает понятие ортологии. Считается, что в ходе долгой эволюции ортологичные гены сохраняют свою уникальность, в том числе функциональную (имеют одну и ту же эволюционную историю). Однако это правило нарушается в тех случаях, когда гены, казалось бы подпадающие под определение ортологии (см. табл. 3-1), меняют доменную архитектуру (см. рис. 3-5): в этих случаях лишь части соответствующих белков в разных организмах имеют одну и ту же эволюционную историю и выполняют одни и те же функции (хотя второе и не может быть гарантировано, поскольку взаимодействие доменов вполне может иметь существенные функциональные последствия).
Контраст между эволюционной пластичностью генома и стабильностью индивидуальных генов
Мы видели, что большинство генов в каждом геноме весьма консервативно: гомологи этих генов — чаще всего легко определяемые ортологи — обнаружены у организмов, эволюционно далеких друг от друга. Тем не менее эта поразительная эволюционная устойчивость генов — лишь одна сторона медали сравнительной геномики. Другая же, оборотная сторона — это «текучесть» генного набора и архитектуры геномов всех форм жизни. Геномы прокариот особенно подвержены изменчивости. Наглядным примером этого является сравнение различных штаммов классической модели бактерий, лабораторного штамма K12 и нескольких патогенных штаммов кишечной палочки Escherichia coli (Perna et al., 2001). Последовательности ортологичных генов у этих бактерий почти одинаковы, однако некоторые патогенные штаммы имеют на 30 процентов больше генов, чем штамм K12, и генные наборы патогенных штаммов радикально различаются. Неизбежно возникает заключение, что «лишние» гены, формирующие так называемые островки патогенности, одними штаммами были приобретены, а другими утеряны (в гл. 5 мы еще вернемся к этой теме).
В более общем плане можно измерить дистанцию между геномами, сравнив, с одной стороны, последовательности консервативных генов-маркеров, таких как рРНК или рибосомных (р) белков, а с другой стороны, исследовав ту часть генов, что формирует легко узнаваемые пары совпадающих ортологов (см. табл. 3-1). В отличие от постепенного, относительно медленного изменения нуклеотидной последовательности генов, наблюдается резкое несовпадение генных наборов (см. рис. 3-6). Заметим, что нет никакого противоречия между этим наблюдением и выводом о том, что для значительного большинства генов в геноме бактерии или археи имеются ортологи в некоторых эволюционно удаленных от них организмах. Здесь слово некоторых ключевое, поскольку у многих генов в любом геноме разное эволюционное происхождение и разная история, и потому их ближайшие родственники могут быть обнаружены в разных таксонах (см. гл. 5). Дистанцию между геномами, определяемую как доля общих (ортологичных) генов, можно использовать для описания «геномной вселенной», рассматриваемой далее в этой главе, а также для построения особого рода дерева эволюции (см. гл. 5).