Я получал удовольствие от работы с 454. Наши команды прекрасно дополняли друг друга, люди легко ладили. И все-таки в одном мы отличались. 454 вынуждена была постоянно бороться за признание на рынке современных технологий секвенирования, а рынок этот очень быстро становился остроконкурентным. На тот момент сразу две большие компании заявили о намерении продавать высокопропускные аппараты для секвенирования. Компании 454 желательно было получить широкий общественный резонанс от работы с неандертальским геномом, и хорошо бы прямо сейчас, а не через два или три года, когда мы предполагали представить для публикации прочитанный геном. Как в свое время Майкл Эгхольм принял наши заботы близко к сердцу, теперь настала моя очередь серьезно отнестись к его приоритетам. Поэтому, когда контракт с 454 подписали, 20 июля 2006 года мы организовали пресс-конференцию у нас в институте в Лейпциге. Как раз незадолго до этого мы представили к публикации в Nature статью в соавторстве с 454. Майкл вместе с еще одним руководителем высшего звена прилетели из Америки. На конференцию мы пригласили и Ральфа Шмитца, куратора неандертальского “типового экземпляра” из музея в Бонне; в 1997 году именно Ральф снабдил нас музейным материалом для исследований. Он привез с собой на конференцию историческую кость неандертальца, из которой мы выделили первую митохондриальную нуклеотидную последовательность. В пресс-релизе специально подчеркивалось, что мы соединили все методы анализа древней ДНК, разработанные за много лет в нашей лаборатории, с новейшими высокопроизводительными технологиями, предоставленными нам компанией 454 Life Sciences, и в результате удалось начать секвенирование неандертальского генома. Мы специально отметили, что по удивительному стечению обстоятельств настоящее заявление делается точно день в день через 150 лет после того, как нашли первых неандертальцев в долине Неандерталь.
Пресс-конференция получилась потрясающая! Журналисты, пресса, трансляция по всему миру по интернету… Мы объявили, что беремся за два года прочитать 3 миллиарда нуклеотидов неандертальцев. С гордостью я оглядывался в прошлое: вот он я, двадцать лет назад в Упсале, тайком от руководителя затеваю непонятные опыты, опасаюсь, что он все узнает, – и вот он я теперь! Какой это был необыкновенный момент!
А дальше пошли взлеты и падения. Неприятности начались месяц спустя после пресс-конференции. Еще не вышли обе статьи, наша и группы Эдди Рубина, а мы уже приступили к работе по методу 454. Попутно послали данные по 454 Джонатану Притчарду. Этот молодой и талантливый генетик из Чикагского университета вместе с Эдди принимал участие в обработке той небольшой части данных, которые дало бактериальное клонирование. И тут мы получаем электронное письмо от двух аспирантов Притчарда, Грэма Купа и Шридхара Кударавалли. А там написано, что их кое-что настораживает в результатах по 454. А именно повышенное количество отличий от человеческого эталонного генома в коротких фрагментах по сравнению с длинными. Наш Эд Грин быстренько все перепроверил. Действительно, все обстояло именно так, и аспиранты оказались правы. Плохо дело. Это могло означать, что длинные фрагменты не были неандертальскими, а являлись современными загрязнениями человеческой ДНК. Я написал Эдди, что мы обнаружили подозрительные детали в наших результатах по 454. И мы договорились обменяться данными – мы им пошлем свои, а они нам свои. И быстро получили ответ: Джим Нунан из группы Эдди подтвердил все эти отклонения в данных 454, повторив выводы чикагских аспирантов.
Нам нужно было срочно переписывать или вообще отзывать статью из Nature, а она уже была почти напечатана… Я послал Эдди сообщение, что мы как можно быстрее постараемся выяснить, в чем дело, чтобы не задерживать выход его статьи. Такое у меня уже было, когда я работал у Алана Уилсона: мы обнаружили ошибку в анализах, уже когда статья была принята к печати в Nature, и эта ошибка коренным образом меняла заключение работы. Пришлось забирать ее из журнала. Я боялся, что и теперь получится то же.
Мы все бросились в лихорадочный поиск. Конечно, первое, что по логике вещей приходит на ум, – это занесенные человеческие ДНК. Но напрямую оценить объемы загрязнений не так-то легко. Помимо того, списывать все на загрязнения было бы ошибкой. Мы ведь понимали, как мало знаем о реактивности коротких дефектных кусочков ДНК по сравнению с нормальными человеческими последовательностями. Так что могли сыграть роль и другие факторы. Какие? Соображать надо было очень быстро, ведь наша статья уже лежала в печати, а Эдди не терпелось увидеть свою собственную.
Эд заметил, что в данных по 454 в коротких неандертальских фрагментах содержится больше Г и Ц, чем в длинных. Так что короткие обогащены ГЦ, а длинные АТ нуклеотидами. Нуклеотиды Г и Ц мутируют чаще А и Т, и это в принципе может привести к разнице между короткими и длинными кусочками, если сравнивать их с человеческим эталоном. Гипотезу нужно проверить – и Эд выбрал по отдельности соответствующие неандертальским короткие и длинные фрагменты из человеческого эталона, а потом посмотрел, какова вообще вариабельность именно этих фрагментов в человеческом геноме. Из этого сравнения неандертальские фрагменты были исключены, но тем не менее результат сравнения получился весьма показательным. В человеческих геномах те самые короткие участки показали большую изменчивость по сравнению с длинными, опять же аналогами неандертальских длинных. Это означало, что ГЦ-обогащенные последовательности попросту чаще мутируют и таким образом объясняется большее число различий в коротких последовательностях. Для большей убедительности нужно было рассмотреть и другие варианты объяснений, например, как мы отыскивали место для найденных фрагментов на карте человеческого эталонного генома. Как справедливо подметил Эд, для длинного фрагмента правильное место подыскать проще, чем для короткого просто в силу большего количества информации. Поэтому короткие фрагменты с большей вероятностью могут оказаться вообще бактериальными, так или иначе сходными с человеческими участками. Вот и получится более высокая вариабельность коротких фрагментов. Такая возможность вообще лежала вне круга наших рассуждений про древние геномы. Ведь что у нас было? ДНК мамонтов с относительно длинными последовательностями. Я совершенно растерялся. Мы каждый день узнавали нечто неожиданное про короткие и длинные фрагменты и видели, насколько по-разному они проявляются в общей картине наших анализов. И вообще, что происходит по ходу наших экспериментов?.. И исключить загрязнения современной ДНК мы тоже не могли…
Естественно, мы обсуждали возможность привноса чужеродной ДНК. Ее уровень, насколько мы могли судить по мтДНК, посланным и Эдди, и в 454, на самом деле был совсем невысок. Занести постороннюю ДНК в вытяжки можно было только вне стен нашей лаборатории; и в статье в Nature мы особо это обговорили. Я при этом чувствовал, что единственным надежным источником информации о загрязнениях может служить только мтДНК, потому что про нее-то мы точно знали, где загрязнение, а где нет. Все остальное слишком шатко: то ли действительно сыграла роль изменчивость в ГЦ-позициях, то ли путаница с бактериальными аналогами, то ли еще что-то неизвестное. Я решил, что нужно снова взглянуть на мтДНК, которые нам прислала 454.