Исследование № 2
Трудный путь к совершенству по ландшафту приспособленности
«Ландшафт приспособленности» — это воображаемый график, показывающий, как зависит функциональность гена от его нуклеотидной последовательности (или работоспособность белка от его аминокислотной последовательности). Биологи привыкли считать ландшафт приспособленности абстракцией, полезной для теоретических рассуждений, но недосягаемой для реального изучения. Однако стремительное развитие биотехнологий уже позволяет картировать небольшие области ландшафта приспособленности конкретных белков. Американские биологи экспериментально изучили свойства всех возможных аминокислотных комбинаций, занимающих четыре ключевые позиции в одном из белков кишечной палочки. Неожиданно оказалось, что из 160 000 комбинаций работоспособны целых 1659 (более 1 %). При этом эволюционные маршруты от одних «разрешенных» последовательностей к другим, как правило, оказываются длинными и окольными. Это связано с сильным эпистазом — зависимостью пользы мутации от того, какие мутации успели закрепиться раньше. Иными словами, важно не только само появление тех или иных мутаций, но и порядок их появления. Возможно, из-за эпистаза эволюция не может найти многие удачные решения, а ее пути становятся до некоторой степени предсказуемыми.
Одним из способов представить себе, как идет эволюция, является картирование ландшафта приспособленности конкретных белков. В схематичном виде ландшафт приспособленности показан на илл. i (см. цветную вклейку). Конечно, в идеале хотелось бы просканировать все «пространство последовательностей» (все возможные аминокислотные последовательности белка), определив для каждой его точки (то есть для каждой последовательности) эффективность выполнения белком интересующей нас функции. Однако такая задача невыполнима, поскольку даже для маленькой белковой молекулы в 100 аминокислот число точек в пространстве последовательностей (то есть число всех возможных белков такого размера) на много порядков превышает число атомов во Вселенной (первое равно 20100 ≈ 10130, второе — в 1050 раз меньше).
Поэтому лучшее, на что мы можем пока рассчитывать, — это картирование очень маленьких, специально подобранных, удобных для изучения участков пространства последовательностей. Даже такая задача невероятно трудоемка. Но все же сегодня, благодаря развитию биотехнологий, она уже выполнима. Об этом свидетельствует статья Анны Подгорной и Майкла Лауба из Массачусетского технологического института (США), опубликованная в 2015 году в журнале Science (Podgornaia, Laub, 2015). Авторы сосредоточили усилия на четырех ключевых аминокислотах, входящих в состав белка PhoQ все той же кишечной палочки (Escherichia coli). Белки, гомологичные PhoQ, есть и у других гамма-протеобактерий, таких как сальмонелла и чумная палочка. PhoQ — это рецептор, располагающийся на внутренней мембране бактерии. Он реагирует на изменения концентрации ионов Mg2+ снаружи от мембраны (в так называемом периплазматическом пространстве, которое у гамма-протеобактерий и других грамотрицательных бактерий находится между внутренней и наружной мембранами) и передает сигнал в цитоплазму посредством активации или инактивации другого белка, называемого PhoP. Белок PhoP, в свою очередь, включает и выключает гены, необходимые для адаптации бактерии к меняющимся условиям среды.
Ключевую роль в работе двухкомпонентной регуляторной системы PhoQ-PhoP играют четыре аминокислоты, входящие в состав PhoQ и образующие так называемый белок-белковый интерфейс. Это значит, что они необходимы для того, чтобы PhoQ мог безошибочно опознать своего партнера PhoP и правильно провзаимодействовать с ним.
В белке PhoQ кишечной палочки это следующие четыре аминокислоты: аланин в позиции 284, валин в позиции 285, серин в позиции 288, треонин в позиции 289 (сокращенно Ala284, Val285, Ser288, Thr289 или еще короче — AVST).
Но AVST — лишь одна из 160 000 (204) возможных комбинаций четырех аминокислот. Ведь чисто теоретически на каждой из этих четырех позиций могла бы стоять любая из 20 аминокислот. Исследователи поставили перед собой амбициозную задачу откартировать все пространство последовательностей для данных четырех аминокислотных позиций. То есть для каждой из 160 000 комбинаций проверить, обеспечивает ли она нормальное взаимодействие PhoQ с PhoP, а значит, и правильную работу всей регуляторной системы.
Для этого были изготовлены плазмиды с геном phoQ, в котором триплеты нуклеотидов, кодирующие аминокислоты белок-белкового интерфейса AVST, были полностью рандомизированы, то есть заменены на случайные тройки нуклеотидов. Затем эти плазмиды вставили в клетки E. coli, из которых их собственный ген phoQ был заблаговременно удален. Кроме того, в геном подопытного штамма вставили ген желтого флуоресцирующего белка под управлением такой регуляторной последовательности, которая обеспечивает активацию этого гена в присутствии активной формы белка PhoP (чтобы клетки, в которых система PhoQ-PhoP сработала, можно было отличить по флуоресценции). В итоге получилась разношерстная популяция кишечных палочек, у каждой из которых в белке PhoQ на месте четырех аминокислот AVST находилась какая-то из 160 000 возможных аминокислотных комбинаций.
Теперь нужно было выбрать из этой популяции те клетки, у которых система PhoQ-PhoP по-прежнему исправно работала. Отбор проводился в два этапа. Сначала микробов выращивали при разных концентрациях ионов магния и отбирали тех, у которых интенсивность желтого свечения соответствовала таковой у контрольных бактерий с последовательностью AVST. Затем отобранных микробов помещали в среду, не содержащую ионов магния. Пережить такое «магниевое голодание» способны только бактерии с исправно работающей системой PhoQ-PhoP.
Геномы бактерий, выдержавших эти испытания, подвергли секвенированию, чтобы получить полный список аминокислотных последовательностей, обеспечивающих нормальную работу системы PhoQ-PhoP. Таких последовательностей оказалось неожиданно много: целых 1659. Ученые выборочно проверили некоторые из мутантных штаммов на способность конкурировать с контрольными кишечными палочками при разных концентрациях ионов магния. Эти эксперименты показали, что приспособленность мутантов осталась на том же уровне, что и у исходного штамма. Таким образом, по крайней мере некоторые (а скорее всего, большинство) из выявленных 1659 последовательностей не имеют серьезных дефектов по сравнению с исходной последовательностью AVST.
Это один из главных результатов работы. Он показывает, что «плато» ландшафта приспособленности, соответствующее функциональному белок-белковому интерфейсу, весьма обширно: оно занимает более 1 % всего пространства последовательностей (1659 точек из 160 000). Это значит, что, подобно генетическому коду, в котором 20 аминокислот и знак «стоп» кодируются 64 триплетами, «белок-белковый» код, обеспечивающий узнавание белками друг друга, тоже обладает высокой избыточностью. Есть много разных вариантов, способных работать одинаково, что, по идее, должно облегчать эволюцию белков. Чем обширнее плато ландшафта приспособленности, соответствующее данной функции, тем больше шансов, что с какой-нибудь его точки удастся перейти (или перепрыгнуть) на другое плато. Иными словами, повышается вероятность смены функции белка в ходе эволюции.