Книга От атомов к древу. Введение в современную науку о жизни, страница 46. Автор книги Сергей Ястребов

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «От атомов к древу. Введение в современную науку о жизни»

Cтраница 46

Зато к середине XX века биохимики со всей определенностью выяснили, что главным носителем наследственной информации служит ДНК (см. главу 8). Молекула ДНК — это, попросту говоря, длинная цепочка нуклеотидов, которые бывают четырех типов: адениновый (А), тиминовый (Т), гуаниновый (Г) или цитозиновый (Ц). Итак, генетический “алфавит” — четырехбуквенный. В общем-то, ничего особенного. В двоичном коде всего две “буквы”, в наиболее ходовой версии латинского алфавита 26, ну а здесь четыре.

Цепочка ДНК вполне подобна тексту, где записана некая информация четырехбуквенным алфавитом. С той особенностью, что эта цепочка — двойная. Надо, впрочем, заметить, что такая особенность не является абсолютно необходимой для хранения генетической информации: она просто полезна, но не больше. Дублирование молекулы ДНК заметно повышает надежность системы (если одна цепь почему-то разрушится — есть вторая), но ничего не прибавляет к самому содержанию записанных нуклеотидным текстом сообщений.

Однако что же это за сообщения? Как раз к тому времени, когда биологи выяснили генетическую роль ДНК, ответ (полученный другими биологами и оказавшийся правильным) был готов. Крупные устойчивые комплексы нуклеотидов — гены — должны каким-то образом нести информацию о структуре белков, тех самых огромных молекул, которые делают в клетке почти все (см. главу 3). Множество генов (геном) некоторым неизвестным нам пока способом определяет собой множество белков (протеом). Вот именно этот вывод и оформился в сознании биологов к середине 1950-х годов.

Тут надо оговориться, что геном — это вообще-то не только набор генов. В геномах обычно есть и другие участки ДНК, ни в какие гены не входящие (но они нас пока не интересуют). Что касается самих генов, то каждый из них включает тысячи нуклеотидов, а очень часто и десятки тысяч. Целые геномы обычно состоят из миллионов нуклеотидов, а иногда и из миллиардов. И в принципе все эти нуклеотиды можно пересчитать, современные биохимические методы вполне позволяют это сделать.

Как же геном кодирует белки?

Начнем с того, что любой белок — это цепочка аминокислот. Причем всегда линейная, то есть неветвящаяся. Именно здесь это становится очень важно. Порядок аминокислот в цепочке называется первичной структурой белка (см. главу 3). Все остальные уровни структуры — вторичная, третичная и четвертичная — относятся уже к сворачиванию аминокислотной цепи в объеме, в трехмерном пространстве.

И вот тут возникает важнейший факт, который вообще-то относится к физической химии, но — внезапно — оказывается ключевым для понимания такой тонкой материи, как наследственность. Факт этот следующий. Первичная структура белка (то есть аминокислотная последовательность), как правило, однозначно определяет все остальные уровни его структуры, то есть всю укладку молекулы в объеме. Именно поэтому простая линейная последовательность нуклеотидов — иначе говоря, нуклеотидный текст — может полностью определить все свойства любой сколь угодно сложной белковой молекулы. Ведь первичная структура такой молекулы тоже линейна, и ее тоже можно считать текстом. Только вот “буквы” в этих текстах разные.

И перед нами немедленно возникает следующий вопрос: каким образом нуклеотидный “алфавит” переводится в аминокислотный?

Генетический код

Пока большинство биологов считало гены белками, все было относительно просто. Белок, как мы знаем, представляет собой линейную цепочку аминокислот, которые могут чередоваться в любом порядке. Двадцать аминокислот — это количество, вполне сравнимое с количеством букв в каком-нибудь древнем алфавите, вроде греческого или финикийского. Такая система кодирования позволяет хранить любую информацию не хуже, чем в обычной книге. Получается, что “белок является как бы длинным предложением, записанным с помощью двадцати букв” [63].

Правда, надо тут же заметить, что до открытия великой двойной спирали практически никто из биологов в таких понятиях не рассуждал. Перейти с привычного “аналогового” языка традиционной биологии на “цифровой” язык новой биологии, изучающей информационные процессы, им и в дальнейшем было непросто. Многим даже очень крупным ученым, профессионально сложившимся до 1953 года, это вообще так никогда и не удалось. Идея цифровой записи наследственной информации вживалась в биологию с удивительным трудом, несмотря на то что со времен работ Менделя к тому времени прошло уже почти 100 лет. Впору предположить, что эта идея противоречила какой-то фундаментальной особенности склада ума большинства людей, выбиравших биологию своей профессией.

Так или иначе после открытия генетической роли ДНК все заметно усложнилось. Стало понятно, что “базой данных”, хранящей последовательности белков, служит не какой-то особый белок, специально приспособленный для записи информации (как это вполне можно было бы вообразить), а совершенно другой полимер, резко отличающийся от белка химически и к тому же содержащий всего-навсего четыре типа мономеров вместо 20. Так возникла проблема перекодировки, или, в более привычных нам терминах, проблема генетического кода.

Тут обязательно нужно пояснение. В сети и публицистике довольно часто встречается мнение, будто генетический код — примерно то же самое, что и генетическая информация. Так вот, это совершенно неправильно. Код — это не сама информация, а словарь, с помощью которого ее можно прочитать. Или более строго: генетический код — это способ перевода друг в друга текстов, записанных с помощью двух разных алфавитов — нуклеотидного и аминокислотного. Своего рода шифровальный ключ. Последнее — даже не метафора: первые теоретики, писавшие о генетическом коде, сразу предложили использовать для его расшифровки математический аппарат криптографии, благо эта наука после Второй мировой войны была развита отлично.

Итак, чего стоит ожидать от генетического кода? У тех ученых, которые сразу после открытия двойной спирали ДНК первыми занялись этим вопросом, получилось примерно следующее:

* аминокислот в составе белков 20, а разновидностей нуклеотидов в ДНК всего четыре. Значит, каждая аминокислота должна кодироваться не одним нуклеотидом, а неким их сочетанием. Примерно так, например, вводятся с помощью клавиш китайские и японские иероглифы;

* отличающихся друг от друга двоек нуклеотидов (дублетов) может существовать максимум 16. Для кодирования всех аминокислот этого не хватит. Значит, генетический код должен быть как минимум триплетным [64];

* отличающихся друг от друга троек нуклеотидов (триплетов) может существовать максимум 64. То есть их намного больше, чем аминокислот. Значит, каждая аминокислота, скорее всего, кодируется не одним триплетом, а несколькими разными. Таким образом, надо ожидать, что генетический код — избыточный (иногда это называют заимствованным из квантовой физики термином “вырожденный”).

Вход
Поиск по сайту
Ищем:
Календарь
Навигация