Ключевыми методами в стремительно развивающейся отрасли метагеномики являются новейшие методы секвенирования ДНК и создание компьютерных моделей. Ученые могут определить последовательность нуклеотидов в следовых количествах ДНК множества организмов в единственной пробе. Теперь нет необходимости раздельно культивировать микроорганизмы и выделять ДНК из каждого из них. Параллельное секвенирование позволяет определять последовательности нуклеотидов в разных ДНК одновременно. Применяя сложные биоинформационные алгоритмы, можно определять различные последовательности ДНК и их относительный избыток в пробе. С тех пор как отпала необходимость культивироватяь организмы для того, чтобы охарактеризовать и классифицировать их геномную последовательность, был преодолен главный барьер на пути исследования биологических свойств нашего микробиома. Действительно, несмотря на то что подавляющее большинство микробных видов не могут быть в наше время культивированы вне организма человека, параллельное секвенирование позволяет идентифицировать присутствие микроорганизмов в нашем теле и их относительное количество или относительный избыток в микробиоме кишечника. Облегчает этот анализ то, что всем без исключения клеточным формам, содержащим хромосомы, в которых закодирована генетическая программа генов, необходимы особые структуры – рибосомы. Рибосомы – это биологические машины, отвечающие за интерпретацию генетических последовательностей мРНК (мессенджер-РНК), по шаблонам которых из аминокислот синтезируются белки. Гены рибосомной РНК (присутствующие в 16S субъединице рибосомы) – рРНК, содержащиеся в рибосомах прокариот, являются весьма консервативными структурами, сохранившимися в ходе эволюции. Небольшие вариации последовательностей в этих весьма консервативных генах позволяют точно проследить филогенетические взаимоотношения между разными видами бактерий. Сравнивая эти уникальные «отпечатки пальцев» последовательностей рРНК с последовательностями ДНК, хранящимися в геномных базах данных, ученые быстро идентифицируют виды бактерий или простейших, обнаруженных в данной пробе. Отношение частоты определенной последовательности нуклеотидов в генах рРНК к ее частоте в генах ДНК указывает на относительный избыток этой последовательности в пробе.
К сожалению, пока не существует такой же эффективной методики для выявления вирусного метагенома. Его исследование отстает от исследования метагенома микробного. Мы не можем классифицировать вирусы, присутствующие в данной пробе, с помощью метода, пригодного для идентификации генома прокариот. В вирусном геноме отсутствуют гены рРНК, потому что вирусы не кодируют аппарат для синтеза своих собственных белков. Более того, вирусные геномы демонстрируют невероятное разнообразие генов и нуклеотидных последовательностей в них. В самом деле, нет ни одного единичного гена или потомка единичного гена, который можно было бы обнаружить во всех вирусных геномах; для выявления присутствия в пробе определенных вирусных генов и определения их филогенетического родства отсутствуют уникальные вирусные отпечатки пальцев.
Однако семейства родственных вирусов располагают сходными стратегиями репликации, а следовательно, обладают определенными общими типами ферментов или структурных белков, необходимых для их размножения в различных условиях. У генов, кодирующих эти белки, есть сходство в последовательностях нуклеотидов, что позволяет вывести родословную вирусов. Белки интегразы являются примером вирусных ферментов, присутствующих в вирусных частицах разнообразного происхождения. Несмотря на то что эти белки могут быть разными и обладать различными аминокислотными последовательностями, их можно найти у большинства вирусов – эти белки позволяют интегрировать геном вируса в хромосомы клетки-хозяина. Несмотря на генетическую гетерогенность царства вирусов, у всех них наблюдают всего три структурных шаблона капсида. Представляется, что существует ограниченное количество жизнеспособных решений «проблемы» конструкции вирусного капсида. Инкапсулированные вирусы обладают капсидными белками, упакованными в соответствии с одним из трех трехмерных шаблонов. Именно последовательности аминокислот в этих белках вместе с мощными компьютерными инструментами служат опорой для ученых в их суждении о происхождении и родстве вирусных частиц в пробах. Это отнюдь не точное знание, и положение осложняется тем, что только небольшая часть вирусных последовательностей была каталогизирована и сохранена в геномных базах данных. Мало того, вирусные гены склонны к быстрой эволюции, а, кроме того, вирусы очень охотно меняются генетической информацией, которая может прибавляться к геному или, наоборот, безвозвратно теряться в процессе обмена. Будет честнее сказать, что любая оценка сложности вирусного метагенома является в высшей степени приблизительной. Вычислительные методы позволяют обнаруживать сходство между нуклеотидными последовательностями пробы и последовательностями, хранящимися в базах данных. Новые последовательности, или те, что только что возникли, могут и не иметь такого сходства, а следовательно, не могут быть приписаны вирусам определенного вида.
В наше время ученые исследуют вирусные метагеномы в разнообразных экосистемах. Подсчитать количество вирусов в водной среде в настоящее время несложно. Количественная оценка нуклеиновых кислот вирусных частиц, выделенных из проб океанской воды, пропущенной через фильтр с порами диаметром 0,5 микрон, позволила выявить поразительный факт: в каждом миллилитре океанической воды содержится около 1 миллиона микробных тел и от 10 до 100 миллионов вирусов (Bergh et al., 1989). Прибрежные воды океанов являются, по сути, концентрированными растворами вирусных частиц. По самым скромным подсчетам можно предположить, что виросфера состоит из 1011 индивидуальных вирусов, и именно они являются самыми многочисленными биологическими объектами на Земле, превосходя численностью бактерии и простейшие на порядок (Brüssow, Hendrix, 2002; Suttle, 2007; Breitbart, Rohwer, 2005). Для инопланетянина, снабженного органами чувств, регистрирующими микроскопические и макроскопические объекты, мы и другие представители царства эукариот потеряемся в толпе других биологических сущностей – мы представляем ничтожное меньшинство в планетарном биологическом сообществе.
Сложность и «темная материя»
Разнообразие вирусной генетической информации, выявленное во взятых в окружающей природе пробах, поражает воображение. Область морских вирусных метагеномов открылась взору, когда ученым удалось методом параллельного секвенирования ДНК идентифицировать вирусы в морской воде. По прошествии первого десятилетия двадцать первого века эта область продолжает стремительно расти. Профессор Форест Ровер, специалист по морской экологии из университета Сан-Диего в Калифорнии, является одним из первопроходцев в этой сфере. Он и его сотрудники стали первыми учеными, применившими современные технологии для анализа вирусных метагеномов. В 2006 году они опубликовали одно из самых полных исследований на эту тему (Angly et al., 2006; Suttle, 2007). Они собрали и проанализировали пробы из шестидесяти мест в четырех океанах, выполнив секвенирование ДНК в пробах из Мексиканского залива, прибрежных вод западной части Канады, Северного Ледовитого океана и Саргассова моря. Эти исследования позволили приоткрыть дверь в необозримое царство морских вирусных популяций и их экологии. Вместе с данными других экспедиций их работа позволяет нарисовать относительно связную картину, которая показывает, что вирусная популяция океанов является в высшей мере разнообразной (Suttle, 2007). Среди триллионов вирусных частиц, обнаруженных в 100 литрах морской воды, присутствуют многие тысячи разных видов вирусов, каждый из которых обладает уникальной генетической программой, или, иными словами, генотипом. В одном килограмме отложений морского дна обнаруживается более миллиона различных генотипов. Большинство фагов распространены в мире очень широко – они находятся всюду, – но их количество в разных местах сильно варьирует. Вероятно, различные условия окружающей среды оказывают сильное влияние на преобладание тех или иных вирусов и классов вирусов в разных местах (Angly et al., 2006; Breitbart, Rohwer, 2005).