Вёзе посвятил этой работе следующее десятилетие и понял историю жизни настолько хорошо, что полностью перевернул казавшееся незыблемым основание биологии – филогенетическое дерево.
Первую попытку систематической классификации живых организмов предпринял один из самых знаменитых натуралистов XVIII в., шведский ученый и врач Карл Линней. В революционном труде «Система природы» (Systema naturae), изданном в 1735 г., он разделил все организмы на три «царства»: растения, животные и минералы. В десятом издании книги, выпущенном в 1758 г., перечислялось 77 сотен видов растений и 44 сотни видов животных, разбитых на группы и категории. В то время такой объем информации казался невероятным, однако в последующие два с половиной столетия количество известных видов росло по экспоненциальному закону. По современным оценкам, на Земле существует примерно 1 млрд видов бактерий, 300 ты. видов растений и от 10 до 30 млн видов животных, бо́льшую часть которых составляют насекомые, которых еще только предстоит обнаружить.
Классификация Линнея была основана на явных внешних признаках организмов: могут ли они двигаться или расти, плавать или летать, имеют ли шерсть или кости. Линней сгруппировал все объекты по принципу физического сходства. Позднее дополнительный смысл в эту схему внесли окаменелости, связав между собой разные виды и обеспечив основу для построения дарвиновской теории естественного отбора.
Дарвин одним из первых попытался построить филогенетическое дерево – семейное дерево живых организмов, восходящее к самым истокам жизни. Он включил простой вариант такого дерева в книгу «О происхождении видов». Это было разветвленное дерево, на котором живущие ныне виды соответствовали окончаниям ветвей. В соответствии со схемой Дарвина возврат от окончаний ветвей к стволу представлял собой путешествие в прошлое, а точки слияния двух линий соответствовали общему предку данных видов. Так, люди и шимпанзе произошли от общего предка, а если двигаться по этой ветви дальше назад, можно достичь следующего слияния, например с ветвью обезьян Нового Света. По дереву можно было перемещаться и дальше назад, прослеживая ответвления линий млекопитающих, позвоночных, животных. Дерево постепенно сужалось и наконец сводилось к одному организму, являвшемуся корнем всей существующей жизни. Дарвин сделал логичное заключение, что все живые существа должны происходить от одного общего предка, которого он назвал «одной первичной формой».
Представление об универсальном общем предке стало главной догмой современной теории эволюции, подтвержденное множеством наблюдений, в частности хиральностью молекул (впервые открытой Пастером в кристаллах), сходством клеточных структур, а также общностью генетического кода у всех живых организмов – от микробов до человека. В наши дни немногие ученые осмеливаются подвергать сомнению идею об универсальном общем предке.
Созданное Дарвином дерево жизни постепенно дополнялось и совершенствовалось благодаря новым данным палеонтологии и возможностям радиоизотопного анализа. Новые методы позволяют измерить возраст костей и, следовательно, более точно определить родственные отношения между видами. По мере развития микробиологических методов анализа организмы стали разделять на одноклеточные и многоклеточные, а позднее на две большие категории: организмы с клеточным ядром стали называть эукариотами, а организмы без ядра – прокариотами. В конечном итоге все живые существа разделили на пять царств: животные, растения, грибы, одноклеточные эукариоты и прокариоты. Однако данных относительно двух последних царств было недостаточно. Палеонтологические летописи о самых многочисленных, простых и, по-видимому, самых древних видах были невероятно скудными, и положение микробов на дереве жизни оставалось неоднозначным.
Карл Вёзе решил прояснить ситуацию. В 1969 г. он написал Френсису Крику удивительное письмо – своего рода план того, что Вёзе собирался сделать в последующие 20 лет и что он надеялся получить (и в конечном итоге получил). Вёзе писал Крику, что планировал использовать ДНК для выявления, как он выразился, «внутренних палеонтологических летописей», указывающих на истинные родственные связи между организмами. «Выявляя предковые последовательности генов, можно надеяться увидеть следы эволюции клеток». Он осознал возможность использовать генетический код для заполнения пробелов в наших знаниях о ранних этапах эволюции, которые не удается заполнить с помощью палеонтологических данных. Он планировал секвенировать ген (то есть определить его полную нуклеотидную последовательность), являющийся общим практически для всех живых существ, а затем на основании его вариаций воссоздать историю эволюции.
К началу 1960-х гг. процесс секвенирования белков (определения последовательности аминокислот в молекуле белка) превратился в рутинный анализ. Эмиль Цукеркандль и Лайнус Полинг выделяли белки из современных организмов, которые можно было разместить на филогенетическом дереве. Они показали, что степень различия белковых последовательностей зависела от того, насколько давно разошлись соответствующие виды организмов в соответствии с палеонтологическими данными. Измеряя различия между белковыми последовательностями из разных источников, можно рассчитать, как давно организмы разошлись от общего предка (ученые называют это принципом «молекулярных часов»).
Однако не все белки встречаются во всех организмах. Вёзе нужно было найти что-то, что содержалось в клетках всех известных организмов, копировалось с высокой точностью и подвергалось мутациям достаточно редко, чтобы можно было проследить за изменениями за несколько миллиардов лет. Он выбрал гены рибосомной 16S РНК (сокращенно 16S рРНК), названной так в соответствии со скоростью ее осаждения при центрифугировании. Гены 16S рРНК достаточно длинные, так что с их помощью можно получить подробную информацию, но не слишком длинные, и поэтому их не очень сложно секвенировать.
К моменту начала работы по секвенированию Вёзе ушел из лаборатории General Electric и оказался в Иллинойском университете в Урбана-Шампейне по приглашению молекулярного биолога Сола Шпигельмана, который когда-то присутствовал на лекции Вёзе в Институте Пастера в Париже. В Иллинойсе Вёзе руководил небольшой группой исследователей, самым талантливым из которых был Джордж Фокс, принимавший активное участие во всех самых важных открытиях научной группы. Вместе они начали сложный процесс секвенирования генов 16S рРНК.
Все анализы приходилось делать вручную – автоматические секвенаторы появились лишь спустя несколько десятилетий. Вёзе с сотрудниками выбрали метод, предложенный в 1965 г. британским биохимиком Фредериком Сенгером – одним из немногих ученых, дважды удостоенных Нобелевской премии. Процедура предполагала ферментативное разделение генов РНК на небольшие фрагменты, с которыми проще было работать. Потом фрагменты подвергали секвенированию, а затем восстанавливали всю молекулу и определяли полную нуклеотидную последовательность. Процедура была дорогой, и Вёзе обратился за финансовой поддержкой в программу НАСА по астробиологии. Работа была чрезвычайно медленной и кропотливой. Поначалу на секвенирование одного гена 16S рРНК уходили месяцы. Большинству ученых такая работа показалась бы невероятно занудной, но Вёзе она нравилась – это было похоже на сборку гигантского пазла.