Наконец, не без понятной робости, мы коснемся чрезвычайно общих аспектов вероятности «уникальных событий» в рамках современных космологических теорий. Это рассуждение позволит нам, по крайней мере, выработать определенные идеи касательно распространенности жизни в космосе.
Происхождение репликации и трансляции и мир РНК
Цикл Дарвина—Эйгена
Главной целью разработанной Манфредом Эйгеном теории самореплицирующихся систем было построение простой модели, объясняющей происхождение биологической информации и, следовательно, самой жизни. Теория Эйгена вскрыла существование фундаментального предела, ограничивающего достоверность репликации (порог Эйгена): если произведение частоты ошибок (мутаций) и информационной емкости системы (размер генома) ниже порога Эйгена, происходит стабильное наследование и, следовательно, эволюция; если же эта величина выше порога, то мутационная катастрофа и вымирание неизбежны (Eigen, 1971). Порог Эйгена лежит где-то в интервале от 1 до 10 мутаций на цикл репликации (Tejero et. al., 2011), но, каков бы он ни был, для стабильного поддержания репликации, что является необходимым условием начала биологической эволюции, система должна непрерывно оставаться над этим порогом (см. рис. 12-1а). Само происхождение первых организмов создает по меньшей мере видимость парадокса, поскольку для репликации необходима некоторая минимальная сложность, а репликация с высокой точностью требует кодирования еще большего объема информации (Penny, 2005). В то же время уровень точности репликации в данной точке эволюционной траектории ограничивает объем информации, которая может быть закодирована в геноме. Таким образом, на первый взгляд рост сложности генома представляется невозможным. Однако комбинация естественного отбора и генетического дрейфа превращает этот, казалось бы, порочный круг в (казалось бы) бесконечную спираль возрастающей сложности (цикл Дарвина—Эйгена в терминологии Д. Пенни; Penny, 2005). Даже малые приобретения в точности репликации идут системе на пользу, хотя бы потому, что они увеличивают число жизнеспособных копий генома и тем понижают репродукционные издержки. Сам по себе большой геном является скорее обузой для системы из-за высоких репродукционных издержек. Однако умеренное увеличение генома, такое как дупликация частей генома или рост вследствие рекомбинации, способно закрепляться в малых популяциях. Репликаторы, обладающие достаточно высокой точностью, могут использовать этот случайно закрепленный и изначально бесполезный генетический материал для эволюции новых функций, не срываясь при этом с «обрыва Эйгена» (рис. 12-1б). Среди этих новых, улучшающих приспособленность функций будут и повышающие точность репликации, что позволяет затем увеличить объем кодируемой информации. Таким образом, цикл Дарвина—Эйгена повторяет себя в спиральной прогрессии, приводя к непрерывному увеличению размера генома (рис. 12-1а).
Рис. 12-1. Точность репликации и эволюция: а — цикл Дарвина—Эйгена; б — эволюция и край обрыва Эйгена.
Решающим в изучении происхождения жизни является вопрос о том, как начался цикл Дарвина—Эйгена, то есть как именно была достигнута наименьшая сложность, необходимая для приемлемой репликации. Даже в простейших современных системах, таких как РНК-вирусы, точность репликации в которых составляет всего 10–3 (то есть в среднем одна ошибка на 1000 нуклеотидов), и вироидах, реплицирующихся с наименьшей известной на сего дня среди всех репликонов точностью (около 10–2; Gago et al., 2009), репликация катализируется сложными белковыми полимеразами. Сами эти полимеразы (репликазы) синтезируются в результате трансляции соответствующих мРНК при посредстве чрезвычайно сложного рибосомного аппарата. Отсюда следует драматический парадокс происхождения жизни: для достижения минимальной начальной сложности, необходимой для того, чтобы биологическая система начала движение по Дарвину—Эйгену, эта система должна обладать гораздо большей начальной сложностью. В рамках обычного эволюционного мышления невозможно даже представить решения этой головоломки, поскольку это мышление относится исключительно к системам, уже находящимся на спирали. Таким образом, решение непременно окажется неординарным. В следующих разделах этой главы мы сначала рассмотрим потенциал подхода сверху вниз, то есть основанного на анализе современных генов, для получения указаний на возможное происхождение систем репликаторов. Затем мы обсудим подход снизу вверх.
Изучение эволюции белковых доменов дает аргументы в пользу сложного мира РНК: взгляд сверху вниз
Как уже упоминалось выше, система трансляции — единственный сложный ансамбль генов, сохранившийся во всех современных клеточных формах жизни. Современная трансляционная система, содержащая около 60 универсальных белок-кодирующих генов и 40 генов структурной РНК, представляет собой наилучшим образом сохранившийся остаток LUCA(S) и лучшее свидетельство того, что в какой-то форме LUCA(S) действительно существовал (см. гл. 11). В силу исключительной консервативности системы трансляции анализ ортологических последовательностей дает крайне мало для понимания ее происхождения, которое находится за горизонтом сравнения современных форм. Реконструкция генного состава LUCA(S) указывает на сложную трансляционную систему, включающую по меньшей мере 18 из 20 аминоацил-тРНК-синтетаз (АРСаз), несколько факторов трансляции, не менее 40 рибосомных белков и некоторое число ферментов, модифицирующих рРНК и тРНК. По-видимому, у LUCA(S) ядро системы трансляции было уже полностью сформировано (Anantharaman et al., 2002).
Однако сравнение последовательностей и структур белковых компонентов и РНК внутри самой системы трансляции оказывается информативным благодаря большому числу паралогов среди соответствующих генов. Когда в реконструированном генном наборе LUCA(S) обнаруживается пара паралогичных генов, давшая ей начало дупликация, естественно, относится к более ранней стадии эволюции, и, таким образом, реконструкция последовательности древнейших дупликаций позволяет взглянуть на очень ранние этапы эволюции. История паралогичных АРСаз особенно показательна. АРСазы образуют два класса по 10 специфичностей каждый (то есть каждый класс отвечает за распознавание и активацию 10 аминокислот), с неродственными каталитическими доменами и различными наборами вспомогательных доменов. Каталитические домены АРСаз классов I и II принадлежат, соответственно, к укладкам Россмана и биотин-синтазы
[126]. Анализ эволюционной истории этих белковых укладок приводит к существенным выводам о ранней эволюции трансляционных систем, и не только об этом (Aravind et al., 2002). Каталитические домены АРСаз класса I образуют лишь небольшую ветвь эволюционного древа доменов укладки Россмана. Таким образом, появлению общего предка АРСаз предшествовало множество ветвлений эволюционного пути от примитивного древнего домена к состоянию с высоким разнообразием, соответствующему LUCA(S). Существенное разнообразие доменов укладки Россмана возникло еще до серии дупликаций, приведших к возникновению, еще до эпохи LUCA(S), АРСаз различных специфичностей (см. рис. 12-2а). Подобная эволюционная картина обнаруживается и при анализе домена биотин-синтазы, давшего начало АРСазам класса II. Даже при рассмотрении только этих двух укладок становится очевидно, что огромное структурное и функциональное разнообразие белковых доменов возникло еще до того, как появилась полноценная, состоящая из РНК и белков система трансляции современного типа.