Законодательная власть – интроны, они определяют программы, осуществляют временну́ю и пространственную координацию, разработку, дифференциацию, специализацию, программы роста и гибели клеток (апоптоза), равно как и адаптацию, иммунный ответ, инновации и максимальную эффективность функционирования организма человека. И в заключение отмечу: комбинаторное соединение генетических участков, осуществляемое путем сплайсинга, обусловливает специфичность человека как вида. И в этом наша сила!
Проект ENCODE, направленный на формирование представления о «мусорной ДНК»
Что происходит с 98% генома человека? 2% генома кодируют белки, а что делает оставшаяся часть, мы не знаем. Поэтому в рамках проекта «Геном человека» был инициирован проект ENCODE («Энциклопедия элементов ДНК»). Целью ENCODE является выяснение, что происходит в «пустынных участках» – так авторы проекта назвали некодирующие (нк) «пустые» пространства, расположенные между кодирующими участками. Только 2% ДНК приписываются к белкам. Большая же часть ДНК, 98%, экспрессируются как некодирующие нкРНК, которые выполняют регуляторную функцию, направленную на организацию оставшейся части РНК, экспрессию белков. Пустынные участки содержат короткие и длинные регуляторные элементы, в частности энхансеры, репрессоры, сайленсеры, с активными и неактивными сайтами, инсуляторы, промоторы, находящиеся рядом с генами, «инструкции» по процессингу (тримминг, обрезка РНК), химическим модификациям, таким как метилирование ДНК и ацетилирование хроматина (возможно также, фосфорилирование и прочие модификации) и РНК-транскрипты генов. Одним из недавних открытий стало выяснение роли «инсуляторов» (insulators, «изолирователи»), название которых говорит само за себя и подразумевает блокировку участков, расположенных между промотором и энхансером. Как действует этот механизм, до сих пор неясно. Задача заключается в том, чтобы понять, каким образом и при каких обстоятельствах проявляется активность гена. Кроме того, будет проведен анализ интенсивности сигнала (насколько активен ген), насколько сильно он экспрессируется и сохраняется в процессе эволюции. Но это не относится к вирусам, поскольку они не консервативны, в связи с чем, вероятно, понадобятся дополнительные исследования.
В последнее время обработка огромного объема данных сопровождается астрономическими цифрами, которые упоминаются и в голландском геномном анализе. Представьте себе нагромождение бумаги высотой 15 м и длиной 35 км, исписанной только четырьмя буквами A, G, T и C в порядке, который пока никто не понимает: объем написанного – 15 Тбайт (или 15 000 Гбайт), и все это нужно понять как текст, разбить на предложения, главы, заголовки и параграфы. Общая длина генома человека 3,2×109 нуклеотидов.
Сейчас, спустя много лет после того, как в 2003 г. начался проект ENCODE, опубликовано более 2500 работ. Поразительно, но некоторые из них озадачивают. У нас всего 20 000 генов, однако в этих публикациях описываются 70 000 промоторов – исходные последовательности и регуляторные участки, расположенные перед генами. Почему же промоторов настолько больше, чем генов? Кроме того, было выявлено 40 000 энхансеров – более отдаленных от гена участков с трансграничными эффектами дальнего действия, не кодирующих белки. Похоже, на пустынных участках, где производится большое количество регуляторных нкРНК, наблюдаются мутации, приводящие к заболеваниям. Были выявлены дефектные регуляторные элементы, провоцирующие болезни. Дерегуляция (ослабление контроля) экспрессии генов часто означает рак. Действительно, как оказалось, болезни обосновываются в некодирующих областях.
В настоящее время ДНК проанализирована лишь на 10%. К концу 2014 г. 440 ученых из 32 групп, работающих со 147 типами клеток в соответствии со стандартными протоколами, провели 1648 экспериментов.
Итак, можно ли сейчас дать определенный ответ, какая доля ДНК приходится на «мусорную» часть? Нет. Как выяснилось, пустынные участки ДНК на 80% функционально активны, а 75% таких участков транскрибируется в РНК не для производства белков, а для регуляции.
Таким образом, бóльшая часть ДНК выполняет какие-нибудь функции. Многие вирусные последовательности оказываются поврежденными настолько, что похожи на «мусор», но часто они все равно выполняют какую-нибудь функцию и их ДКП ранее упоминались как остаточные последовательности, являясь промоторами для прочих генов. Другие же последовательности, возможно, находятся на пути к исчезновению и поэтому вполне могут представлять собой «мусор». Эволюция идет своим чередом и никогда не останавливается! При проведении генетической диагностики нужно иметь в виду, что геномы двух «нормальных» людей отличаются на 0,5%, что составляет 16 млн пар оснований (это число недавно увеличилось в пять раз) из общего числа генов 3,2 млрд. Исходя из этого, нужно определить последовательности, ассоциированные с заболеваниями. Какой из однонуклеотидных полиморфизмов (ОНП) указывает на заболевания, а какой ничего не значит? Этот вопрос требует решения. Чтобы преодолеть соотношение «сигнал–шум», нужно разработать новые технологии.
Вероятно, существуют рациональные способы найти ответы на все или на некоторые из этих вопросов. Крейг Вентер нашел более дешевый и быстрый способ проанализировать геном человека, сократил расходы на исследовательскую работу на несколько порядков и сэкономил человечеству лет 10 работы. Сможет ли он или кто-нибудь другой повторить его успех в рамках проекта ENCODE? Надеюсь. Все данные, получаемые в указанном проекте, становятся предметом гласности, и недавно были организованы курсы по обучению работе с этими данными. Все могут помочь – если смогут!
8. Вирусы – наши самые древние предки?
В начале была РНК
Я полагаю, жизнь началась не от Адама и Евы и зародилась она не в раю, а в океане, около вулканов, где очень высокая температура, и это скорее ад, чем рай. Рассматривается также другой источник жизни – лед! Жизнь могла зародиться в жидких канальцах внутри льда. Если хочется в данном контексте процитировать Библию, можно привести первое предложение Евангелия от Иоанна: «В начале было Слово». Кроме того, Иоганн Вольфганг Гёте в своем выдающемся произведении «Фауст» также сослался на эту фразу из Нового Завета: что было в начале – слово, чувство или сила? Это удивительным образом согласуется с нашим нынешним представлением о происхождении жизни: сначала были буквы и слова. Первые биомолекулы возрастом около 3,9 млрд лет состояли из коротких РНК, а РНК состоят из нуклеотидов, являющихся строительными блоками. Кратко их можно описать в виде четырех букв: A, U, G, C. Чтобы закодировать всю сложность жизни на Земли, достаточно всего четырех букв, что поразительно мало. Основания входят в состав нуклеотидов, а их названия стали сокращениями. Откуда появились эти четыре буквы в самом начале эволюции? Возможно, сначала их было всего две. Они появились в первичном бульоне под воздействием молний и гроз на дне Мирового океана вокруг подводных вулканов и гидротермальных источников, называемых «черные курильщики». В этой среде температура может варьироваться от 0 до 400°С (именно так, поскольку из-за высокого давления температура жидкой воды может превышать 100°С). В настоящее время ученые пытаются воспроизвести условия, которые могли привести к образованию первых РНК-молекул. Это оказалось настолько сложно, что некоторые исследователи использовали это обстоятельство как аргумент, опровергающий роль РНК в образовании жизни. Действительно ли РНК возникла в вечной мерзлоте? РНК при низких температурах и в самом деле демонстрируют стабильность. Исследователи Общества Макса Планка (Гёттинген) хранят ДНК в морозильных камерах, чтобы понять, способны ли они расти, реплицироваться и мутировать. Могла ли во льду зародиться жизнь? Высокая температура могла бы привести к разрушению РНК.