Искать следы межвидовой гибридизации можно разными способами, и ученые постоянно изобретают новые. Можно просто искать в современных геномах фрагменты ДНК, совпадающие с известными неандертальскими и денисовскими последовательностями. Но таким способом нельзя обнаружить примеси, доставшиеся нам от вымерших популяций, по которым нет палеогенетических данных. Чтобы найти такие примеси, используют другие статистические методы, позволяющие даже и вовсе не принимать во внимание данные по древним геномам. Эти методы основаны на том, что привнесенные (интрогрессированные) фрагменты ДНК должны иметь определенное распределение длин: чем больше времени прошло с момента гибридизации, тем меньше их средняя длина
[23]. Кроме того, они должны содержать наборы тесно сцепленных, то есть расположенных по соседству, редких полиморфизмов. Если речь идет о гибридизации, происходившей уже после того, как предки разных рас и народов начали разбредаться по миру, то привнесенные участки должны встречаться только у некоторых, но не у всех современных популяций. Например, неандертальские примеси есть у всех внеафриканских сапиенсов, но отсутствуют у африканцев. Этот статистический подход, известный под названием “S*-статистика”, разрабатывается и совершенствуется уже довольно давно (Plagnol, Wall, 2006; Vernot, Akey, 2014).
В 2018 году американские генетики разработали новую, улучшенную версию S*-статистики, которую они назвали Sprime. Метод Sprime позволяет анализировать вместо последовательного обсчета коротких фрагментов сразу большие участки генома, а вместо попарных сравнений – данные сразу по множеству геномов. Кроме того, Sprime, в отличие от прежних версий, успешно справляется с таким осложняющим обстоятельством, как ограниченная миграция носителей интрогрессированных фрагментов ДНК в районы, населенные людьми без таких фрагментов. Например, этот метод позволил бы найти неандертальские примеси у неафриканцев, даже если бы некоторое (не слишком большое) число носителей этих примесей в далеком прошлом вернулось в Африку и скрестилось с местным населением. Конечно, без привлечения палеогенетических данных Sprime не определил бы, что это именно неандертальские примеси, но он бы показал, что это привнесенные фрагменты ДНК.
Проверив новый метод на виртуальных (сгенерированных компьютером) геномах с известной историей, исследователи убедились, что он обладает повышенной надежностью и чувствительностью по сравнению с прежними версиями. Так, если две популяции разошлись сотни тысяч лет назад, период гибридизации был десятки тысяч лет назад и при этом в генофонд изучаемой популяции попало 3 % чужих генов, метод Sprime позволит обнаружить половину интрогрессированных фрагментов (остальные окажутся слишком короткими или содержащими слишком мало полиморфизмов, уникальных для второй популяции), а доля ложноположительных результатов будет не более 7 %.
Убедившись, что метод работает, ученые применили его к 5639 полным геномам современных людей со всех концов Евразии, включая и папуасов (Browning et al., 2018). Количество и суммарная длина идентифицированных чужеродных фрагментов в геномах людей из разных популяций совпали с полученными ранее оценками доли неандертальской и денисовской ДНК в этих популяциях. В частности, подтвердилось, что у восточноазиатов примесей больше, чем у европейцев и южноазиатов.
Напомним, что все эти чужеродные фрагменты были выявлены при помощи метода Sprime без использования палеогенетических данных. Теперь, конечно, нужно было сравнить их с известными древними геномами. Ученые так и поступили, взяв для сравнения два наиболее качественно прочтенных генома – алтайского неандертальца (Denisova 5) и денисовской девочки (Denisova 3). Анализировались только те интрогрессированные участки, в пределах которых и у неандертальца, и у денисовца есть не менее десяти однонуклеотидных отличий от современных африканцев (у них, как считается, нет неандертальских и денисовских примесей). Для каждого такого участка определили степень его сходства, с одной стороны, с геномом алтайского неандертальца, а с другой – с геномом денисовца.
Результаты представлены на рисунке 6.2. Диаграммы, построенные для 20 внеафриканских популяций, отражают частоту встречаемости интрогрессированных фрагментов ДНК, характеризующихся разным уровнем сходства с геномами алтайского неандертальца и денисовца. Изолинии на диаграммах соединяют точки, обозначающие одинаковое количество фрагментов, для которых характерно то или иное сходство с двумя древними геномами. Эти диаграммы заслуживают внимательного разглядывания.
На всех диаграммах мы видим маленькую компактную область в левом нижнем углу. Это фрагменты, которые были определены программой Sprime как интрогрессированные, но они при этом имеют мало общего как с неандертальской, так и с денисовской ДНК. Скорее всего, это ложноположительный сигнал, то есть фрагменты, которые на самом деле интрогрессированными не являются и были определены программой ошибочно. Судя по результатам предварительного моделирования, программа должна давать 5–7 % ложноположительных результатов, что и подтверждается.
Рис. 6.2. Изолинии, отражающие частоту встречаемости интрогрессированных фрагментов ДНК с определенным уровнем сходства с геномами алтайского неандертальца и денисовца для геномов 20 внеафриканских популяций. Популяции, представленные на диаграммах 16–19 (от мексиканцев до перуанцев), – это не индейцы, а люди смешанного, преимущественно европейского происхождения. Прочие пояснения в тексте. По рисунку из Browning et al., 2018.
На всех диаграммах мы также видим внушительный подъем в правом нижнем углу. Это наше неандертальское наследие. Фрагменты, унаследованные от неандертальцев, сходны с геномом алтайского неандертальца в среднем на 80 %. При этом сходство с геномом денисовца у них низкое – порядка 10–20 %. Здесь нужно вспомнить, что по ядерному геному денисовцы ближе к неандертальцам, чем к сапиенсам, а это значит, что общие предки денисовцев и неандертальцев успели накопить какое-то количество общих отличий от сапиенсов еще до того, как разделились. Именно поэтому сходство неандертальских фрагментов с денисовским геномом достоверно отличается от нуля.
Денисовских примесей среди исследованных популяций больше всего у папуасов (диаграмма 20). Средний уровень сходства денисовских включений в папуасских геномах с известным геномом денисовца – около 50 %, а с геномом алтайского неандертальца – те же 10–20 %. То, что сходство этих включений с геномом Denisova 3 составляет лишь 50 %, а не больше, означает, что те денисовцы, которые оставили свой след в геномах папуасов, были довольно дальней родней девочки из Денисовой пещеры. Они представляли другую популяцию денисовцев, которая обитала, возможно, далеко от Алтая.