Изменения в стратегии «группы пяти» были чрезвычайно выгодны для моего начальства. Ханкапиллер и Уайт с восторгом обеспечивали государственную программу, которая теперь предусматривала покупку секвенаторов модели 3700 и различных реагентов на миллионы долларов. Они напоминали торговцев оружием, начавших войну для того, чтобы продавать свой товар обеим сторонам. Признаться, обидно было потратить столько усилий на сплочение коллектива Celera, а потом наблюдать, как наш деловой «партнер» снабжает оборудованием наших соперников быстрее, чем нас.
Итак, мы и наши конкуренты использовали одни и те же приборы, но при этом наши стратегии различались. «Секвенирование» для большинства людей означает фактическую сборку пар оснований генетического кода в правильном порядке. И действительно, высыпать кусочки пазла на стол еще не означает собрать его. Тем не менее, поскольку государственные лаборатории работали над тысячами мини-проектов расшифровки генома, по одному секвенируя BAC, у них имелись тысячи мини-пазлов для упорядочения, ориентирования и сборки, а у нас – всего один, но огромный. Никогда бы не подумал, что они будут претендовать на осуществление сборки бактериальных клонов или хромосом, располагая только кусочками пазла. Я рассчитывал на честную победу, надеялся на наших программистов, наши программы и наш мощный компьютер, которые обеспечили бы нам победу в соревновании с куда более крупным соперником в лице государственной программы.
Для сборки ДНК по результатам секвенирования методом дробовика требуется определенный минимальный охват последовательностей. Так, однократный (1Х) охват бактериального клона, состоящего из 100 000 пар оснований, означает, что вам удалось генерировать 100 тысяч пар оснований из последовательности ДНК. Это не означает, однако, что вы по одному разу секвенировали каждую букву последовательности. Тонкость состоит в том, что мы имеем дело со случайно генерированными фрагментами. (Если разорвать 50 газет на 50 отдельных страниц каждую, перемешать их в коробке и наугад вынуть 50 страниц, вряд ли у вас получится целиком какая-нибудь газета). Если объединить случайные фрагменты, то, согласно статистическим прогнозам, однократный охват фактически отражает состав лишь около 66 % ДНК клона. (Некоторые фрагменты будут дублироваться, некоторые – отсутствовать.) Для отражения структуры 96 % ДНК требуется троекратный охват (3Х). Метод сборки ДНК, принятый в государственной программе, требует охвата от 8Х до 10Х для того, чтобы упорядочить и сориентировать все участки и, таким образом, реконструировать бактериальный клон. Когда-то мы считали, что и нам необходим подобный уровень. После успешной расшифровки генома дрозофилы, однако, я понял, что нам удастся достичь охвата хромосом человека 99,6 % и выше, прилагая намного меньше усилий. Благодаря нашей стратегии спаренных концов, которая предусматривала секвенирование ДНК с обоих концов клонов, состоявших из 2, 10 или даже 50 тысяч пар оснований, оказалось, что для получения последовательности ДНК с правильным порядком и ориентацией требовался лишь пятикратный охват.
Соревнование с Celera помогло нашим соперникам. Когда начались первые работы по расшифровке генома человека, многие мелкие лаборатории заявляли, что могут секвенировать хромосомы и их фрагменты, еще до получения финансирования, оборудования и специалистов. К сентябрю 1998 года речь уже шла о расшифровке целого генома, однако не все, кто застолбил свой участок, работали достаточно быстро, используя высокопроизводительные секвенаторы. Обладая гораздо большими ресурсами, чем Celera, государственная программа в целом находилась под угрозой срыва из-за дефицита картированных клонов BAC.
Неудивительно, что Эрик Ландер, недовольный подобным положением дел, в октябре 1998 года предложил отменить соглашение о разделе генома на участки для анализа и заняться секвенированием клонов, случайно отобранных из библиотеки, охватывающей весь геном. Эта идея грозила подорвать неустойчивое единодушие участников государственного проекта. В ноябре, однако, Ландер согласился на компромисс, согласно которому Салстон и Уотерстон гарантировали поставки картированных клонов для нужд программы. К марту 1999 года консорциум, вызвав «восторг» у вице-президента Ала Гора, объявил, что намерен к весне 2000 года, «значительно ранее, чем планировалось», представить по меньшей мере 90 % генома человека в виде «рабочего черновика»{158}. В ускоренной государственной программе доминировали четыре крупные лаборатории, что вызывало раздражение и обиду более скромных участников; более того, Коллинз даже хладнокровно высказался за исключение «отстающих центров», «к большому негодованию их руководителей»{159}. Брюс Роу, один из первых ученых, занимавшихся секвенированием ДНК, весьма точно сформулировал эти чувства, заявив, что Коллинза «хорошо обработали вазелином в НИЗ»{160}.
Хотя Ландер прекрасно понимал, что участникам государственной программы не удастся собрать последовательности генома человека без использования моего подхода, он так и не признал преимуществ или хотя бы полезности нашего метода, а предпочел взять его на вооружение тайком, продолжая при этом свои публичные нападки. Более того, Коллинз и другие попытались использовать деньги налогоплательщиков для финансирования коммерческого конкурента Celera, фирмы Incyte Genomics из Пало-Альто. По этой договоренности фирма поставляла бы спаренные концы последовательностей ДНК для лабораторий, финансируемых государством, и получала бы поддержку от консорциума SNP (то есть фактически от Wellcome Trust и группы фармацевтических компаний). Они собирались выявлять случаи однонуклеотидного полиморфизма (снипы). Этот проект не только расширил бы возможности государственной программы сборки генома, но имел бы и полезный побочный эффект в виде генерирования «бесплатных» снипов, что фактически удвоило бы число снипов, имевшихся в распоряжении фармацевтических компаний консорциума, и избавило бы их от необходимости сотрудничать с Celera. Используя услуги SNP, Коллинз получал также возможность отрицать, что «он» (то есть НИЗ) финансирует Incyte для облегчения конкуренции с Celera. Кроме того, консорциум не обязан был публиковать полученные им данные, поскольку на него не распространялись правила, установленные государством или Wellcome Trust. Отрицая использование нашей стратегии спаренных концов, они могли блокировать Celera доступ к их результатам. Об этих попытках Коллинза с возмущением рассказал мне один из членов консорциума Аллен Роузис из Wellcome. Как утверждал Коллинз, «мы не можем допустить, чтобы исследователи по всему миру, стремящиеся решить серьезные медицинские проблемы, хотя бы на одни сутки лишались свободного и открытого доступа к получаемым данным»{161}. В то же время и он, и центры по исследованию генома выявили миллионы случаев однонуклеотидного полиморфизма, которые по сей день остаются опубликованными лишь в качестве компонентов сборки.