Насколько не дотягивает – покажет время. Поиск генов – нетривиальная задача; области, кодирующие белки, – это просто последовательности А, Г, Т и Ц, «встроенные» в геном посреди других А, Г, Т и Ц; они ничем особо не выделяются. Как вы помните, всего около 2 % генов в геноме человека кодируют белки; все остальное, пренебрежительно именуемое в учебниках «мусорная ДНК», до недавнего времени казалось набором явно нефункциональных отрезков различной длины, многие из которых встречаются неоднократно. Мнение об этом принципиально изменилось в свете данных, полученных в проекте ENCODE (об этом было рассказано в главе 7). Такой «мусор» бывает рассеян даже в самих генах; гены, нашпигованные некодирующими сегментами (интронами), могут занимать обширные участки ДНК, и кодирующие элементы напоминают отдельные городки, расположенные вдоль пустынной молекулярной автомагистрали. Некоторое время самым длинным человеческим геном считался дистрофин (мутации в этом гене вызывают мышечную дистрофию), который простирается более чем на 2,4 миллиона пар оснований. Всего 11 055 из них (0,5 гена) кодируют сам белок; остальная часть гена приходится на 78 интронов (человеческий ген содержит в среднем восемь интронов). Именно из-за такого несуразного устройства генома идентифицировать гены настолько сложно. Но потрясающая воображение длина дистрофина меркнет по сравнению с длиной коннектина (титина), основного белка эластичной решетки цитоскелета и третьего по распространенности мышечного белка. Этот сократительный белок поперечно-полосатых мышц состоит примерно из 33 тысяч аминокислот, и длина его достигает 1 микрометра. Ген, кодирующий титин, расположен во 2-й хромосоме; он простирается почти на 300 тысяч оснований и содержит 363 экзона.
В последние годы поиск человеческих генов значительно упростился, поскольку значительно лучше, чем раньше, изучены геномы мыши, шимпанзе и многих других млекопитающих. Многое стало понятным благодаря знанию процессов эволюции: функциональные части человеческого и мышиного генома весьма схожи (как и геномы всех млекопитающих), за миллионы лет с тех пор, как жил последний общий предок всех видов, они недалеко отошли друг от друга. Напротив, некодирующие области ДНК были «диким полем» эволюции: поскольку они не подпадали под естественный отбор, накопление мутаций в них ничем не сдерживалось (в отличие от кодирующих сегментов). Поэтому мутации накопились там в изобилии, и именно в некодирующих регионах геномы человека и мыши существенно различаются. Поэтому, отыскивая схожие участки в генетических последовательностях у человека и у других млекопитающих, можно эффективно обнаруживать функциональные области, то есть гены.
Идентификация человеческих генов еще более упростилась после того, как был подготовлен черновой вариант генома рыбы-иглобрюха. Ценителям японской кухни эта рыба более известна под названием фугу, в ее организме содержится сильный яд тетродотоксин. Умелый шеф-повар удаляет у рыбы ядовитые органы, так что, пообедав ею, вы можете ощутить лишь небольшое онемение во рту. Тем не менее около 80 человек в год умирают от плохо приготовленной рыбы фугу, а представителям японской императорской семьи законодательно запрещено лакомиться этим деликатесом. В конце 1980-х годов мой давний друг, нобелевский лауреат Сидней Бреннер, всерьез увлекся иглобрюхими, по меньшей мере в качестве генетического материала. Геном фугу в десять раз меньше человеческого, и там гораздо меньше «мусорной» ДНК, чем у нас с вами; приблизительно треть всех имеющихся генов кодирует белки. Под руководством Бреннера примерный вариант генома рыбы фугу удалось выполнить за 12 миллионов долларов – просто находка по меркам секвенирования геномов, бытовавшим в начале 2000-х годов. Число генов, то есть участков генома, кодирующих белки, у фугу составляет 19 200 – примерно столько же, сколькои у человека. Однако интересно, что, хотя число интронов в геноме фугу примерно такое же, как в геноме человека и геноме мыши, сами интроны фугу обычно гораздо короче.
Сравнение ДНК человека и мыши в одном и том же гене. В частности, показан интрон (некодирующая последовательность внутри гена, ограниченная рамкой считывания) и участки двух экзонов (областей, кодирующих белок, синтезируемый геном). В двух последовательностях выделены те основания, которые не изменились в ходе эволюции. Дефис означает утрату основания у человека или у мыши. Общее сходство генетических последовательностей у человека и у мыши демонстрирует, что естественный отбор исключительно эффективно отбраковывает мутации. В интронах, где мутации, как правило, несущественны, разница заметнее, чем в экзонах; ведь экзоны могут влиять на функцию белка
Даже при оценке в 21 тысячу генов или около того создается немного преувеличенное представление о том, насколько сложно устроен человек с генетической точки зрения. Правда, в ходе эволюции некоторые гены породили общности из родственных генов, так получились группы схожих генов, лишь слегка различающихся с функциональной точки зрения. Так называемые совокупности родственных генов возникают случайно, когда при образовании сперматозоида или яйцеклетки фрагмент с хромосомой случайно дублируется и в хромосоме оказывается два экземпляра одного и того же гена. Если одна из копий является функциональной, то вторая копия не отсеивается в ходе естественного отбора и может развиваться в любом направлении, в том числе накапливая мутации. Иногда в результате мутаций ген приобретает новую функцию, как правило тесно связанную с функцией исходного гена. Действительно, многие гены человека являются вариацией на относительно немногочисленные генетические темы. Так, например, геном человека содержит около пятисот генов протеинкиназ, которые составляют около 2 % всех генов. В клетке протеинкиназы регулируют метаболические пути, а также пути сигнальной трансдукции и передачи сигналов внутри клетки. Кроме того, у человека имеется около тысячи генов, отвечающих за обоняние; кодируемые ими белки – это рецепторы запахов, каждый из которых распознает свою пахучую молекулу или свой класс молекул. У мыши также примерно тысяча генов отвечает за запах, но по сравнению с человеком есть различия: мыши адаптировались к преимущественно ночному образу жизни, поэтому сильнее полагаются на обоняние. Естественный отбор среди мышей благоприятствовал самым лучшим «нюхачам», и большинство генов, отвечающих за запах, остались в рабочем состоянии. У человека примерно 60 % этих генов в процессе эволюции успешно деградировали, такие генетические реликты называются «псевдогенами». Возможно, это произошло потому, что мы в большей степени полагались на зрение и нам требовалось меньше обонятельных рецепторов. Вот поэтому естественный отбор и не отсеивал тех мутаций, из-за которых многие из наших обонятельных генов вышли из строя. В результате человек оказался относительно неумелым «нюхачом» по сравнению с другими теплокровными.
Много ли у нас генов по сравнению с другими организмами?
Итак, по набору кодирующих генов мы не дотягиваем даже до обычного травянистого растения. Еще более удручает сравнение с нематодой – это существо состоит всего из 959 клеток (против примерно 30 триллионов клеток у нас), 302 из которых – нервные, образующие изрядно примитивный «мозг» червя (наш мозг состоит из 100 миллиардов нервных клеток). Структурная сложность у человека и у нематоды различается на порядки, однако и у нас, и у этого червячка примерно одинаковое число генов. Как объяснить такое удручающее для человека несоответствие? В действительности же расстраиваться здесь совершенно ни к чему: просто контроль у человека работает гораздо эффективнее.