Проблема, как получить искомые двадцать кодирующих триплетов, в действительности не самая трудная. Чуть позже я купил билет на ночной рейс из Штатов в Англию. В ожидании посадки я встретил космолога Фреда Хойла и разговорился с ним. Он спросил меня, чем я занимаюсь, и я объяснил ему идею кода «без запятых». На следующее утро, когда самолет приближался к английскому побережью, Хойл подошел к моему креслу с решением – он обдумал его за ночь.
Естественно, идея «кода без запятых» привела нас с Орджелом и Гриффитом в восторг. Она выглядела так красиво, можно сказать, элегантно. На входе – волшебные числа 4 (количество оснований) и 3 (триплет), на выходе – волшебное число 20, число аминокислот. Без дальнейших хлопот мы записали свои соображения для Галстучного клуба РНК. И все же меня одолевали сомнения. Я понимал, что у нас нет иных свидетельств в пользу кода, кроме эффектного совпадения числа 20. Но если объявится какое-то другое число, то нам придется отбросить эту идею и искать другой вариант кода, который давал бы 20 аминокислот, так что само по себе число 20 не было доказательством.
Несмотря на мои тревоги, новая гипотеза кода привлекла внимание. После того как четверо исследователей поинтересовались, можно ли сослаться на нашу работу (записка для Галстучного клуба РНК не приравнивалась к публикации), мы решили написать статью для «Трудов Национальной академии наук США», где она и вышла в 1957 г. Пересказ ее даже появился в популярной книге «Виток жизни» (The Coil of Life), написанной Рут Мур, хотя эта книга вышла лишь в 1961 г., когда мы уже разочаровались в этой идее.
Так как модель «кода без запятых» отводила на каждую аминокислоту только по одному триплету, то предполагалось, что можно, зная, какой аминокислоте какой триплет соответствует, определить, из каких оснований состоит ДНК – исходя из того, что все они кодируют белки, – опираясь на среднестатистический аминокислотный состав белков. Так как состав белков у всех организмов весьма похож (хотя мы уже знали о существовании небольших различий), это подразумевало, что молекулы ДНК у всех видов по составу близки. По мере накопления данных, в особенности о разнообразных типах бактерий, становилось ясно, что это вовсе не так. Разумеется, количество аденина всегда равнялось количеству тимина (А = Т), поскольку этого требовал закон комплементарности, и по этой же причине гуанина было столько же, сколько цитозина (Г = Ц), но сама по себе структура ДНК не накладывала никаких ограничений на соотношение (А + Т): (Г + Ц), и это соотношение, как оказалось, значительно варьирует от организма к организму. Следовательно, «код без запятых» был ошибочным решением.
Удары, окончательно похоронившие его, пришли с двух сторон. Наши собственные исследования мутаций с фазовыми сдвигами, о которых будет рассказано в гл. 12, поставили его под сомнение, но более решительный удар нанес Маршалл Ниренберг, показавший, что полимер из одного урацила (простейшая форма РНК) кодирует полифенилаланин (см. с. 222) – ведь в рамках «кода без запятых» триплет УУУ должен был быть некодирующим. Итоговая расшифровка генетического кода, подтвержденная неоднократно различными методами, решительно доказала, что вся идея была ошибочной. Правда, можно допустить, что такой принцип мог сыграть некоторую роль на заре возникновения жизни, когда код только начал эволюционировать, – но это чистой воды домыслы.
Идея «кода без запятых» привлекла внимание специалистов по комбинаторике, в особенности Сола Голомба. Нам так и не удалось разрешить проблему исчисления всех возможных вариантов четырехбуквенного кода с перекрывающимися триплетами, хотя мы нашли не одно решение. Решение было разработано Голомбом и Уэлчем с помощью очень простого соображения (до которого нам самим стоило бы додуматься), послужившего ключевым звеном доказательства. Примерно в то же время проблему независимо решил голландский математик Х. Фрейденталь.
В конце концов код (см. приложение Б) был расшифрован экспериментальными, а не теоретическими, методами. Основной вклад внесли команды Маршалла Ниренберга и Гобинда Хораны. Существенную роль сыграла также команда под руководством Северо Очоа, уже нобелевского лауреата на тот момент. По мере выяснения кода делались попытки угадать целое по кусочку, но большей частью неудачные. В некоторых отношениях код воплощает основу молекулярной биологии, как таблица Менделеева воплощает основу химии. Но между ними есть глубокое различие. Периодическая таблица, вероятно, верна для любой точки во Вселенной и тем более работает в тех местах, где температура и давление близки земным. Если же в других мирах есть жизнь и даже если эта жизнь состоит из нуклеиновых кислот и белков (что вовсе не обязательно), ее код, скорее всего, будет значительно отличаться. Даже здесь, на Земле, некоторые организмы демонстрируют мелкие различия. Генетический код, как и сама жизнь, не свойство вечной природы вещей, а – по крайней мере отчасти – продукт случайности.
9. Пептидная дактилоскопия
В предыдущей главе я рассказывал о различных попытках теоретического разрешения проблемы кода. В этой главе я расскажу об экспериментальных подходах. Вопрос оставался по сути тем же: управляют ли гены (ДНК) синтезом белков? И если да, то как?
В наши дни представляется вполне очевидным, что аминокислотная последовательность белка определяется генетически, и в первую очередь последовательностью оснований в цепочке ДНК (или РНК), но это не всегда было очевидно. После открытия двойной спирали эта идея вызывала больше симпатий, так что мы с Джимом стали принимать ее как должное. На следующем этапе требовалось доказать, что ген и белок, который он кодирует, коллинеарны. То есть что последовательность оснований в этом отрезке нуклеиновой кислоты пошагово соответствует последовательностям аминокислот в том белке, который он кодирует, подобно тому как последовательность, записанная азбукой Морзе, коллинеарна соответствующему тексту на английском.
В то время прямое секвенирование как ДНК, так и РНК представлялось безнадежной затеей, но мы полагали, что при благоприятных условиях можно задать набор мутаций в пределах одного гена, используя обычные генетические методы. Поскольку генетические расстояния были, по-видимому, невелики, ожидаемая частота рекомбинаций должна была быть существенно ниже, чем та, с которой обычно имеют дело генетики. Из этого следовала необходимость изучить большое количество потомства, а значит, нужно было использовать какой-то микроорганизм, например, бактерию или вирус.
Рассортировав мутантные последовательности, на следующем этапе можно было бы соотнести изменения в аминокислотах с каждой мутацией. Хотя секвенирование белковой цепочки тогда оставалось еще трудоемким, Фред Сэнгер продемонстрировал, что оно возможно, и мы ожидали, что, если взять белковую молекулу малых размеров, эта задача не окажется непосильной.
Однажды летом 1954 г., сидя на траве в Вудс-хоул, я изложил эти идеи польскому генетику Борису Эфрусси. Борис, работавший тогда в Париже, особенно интересовался генами дрожжей, которые как будто находились вне клеточного ядра. Теперь мы знаем, что такие цитоплазматические гены принадлежат ДНК митохондрий клетки, но в ту пору о них было известно лишь то, что они ведут себя иначе, чем ядерные гены. Борис разозлился. «С чего вы взяли, – осведомился он, – что аминокислотная последовательность кодируется не цитоплазматическим геном? Может быть, единственная функция ядерных генов в том, чтобы задавать нужную укладку белка?»