Итак, интенсивный мозговой штурм, предпринятый учеными, завершился полным успехом! В историческом масштабе открытие структуры ДНК сопоставимо с открытием структуры атома. Если выяснение строения атома привело к появлению квантовой физики, то открытие структуры ДНК дало начало молекулярной биологии.
Каковыми же оказались главные физические параметры ДНК человека — этой главной его молекулы? Диаметр двойной спирали равен 2 нанометрам (1 нм = 10–9 м); расстояние между соседними парами оснований («ступеньками») составляет 0,34 нм; один поворот спирали состоит из 10 пар оснований. Последовательность пар нуклеотидов в ДНК нерегулярна, но сами пары уложены в молекуле как в кристалле. Это дало основание характеризовать молекулу ДНК как линейный апериодический кристалл. Число отдельных молекул ДНК в клетке равно числу хромосом. Длина такой молекулы в наибольшей по размеру хромосоме 1 человека составляет около 8 см. Подобных гигантских полимеров пока не выявлено ни в природе, ни среди искусственно синтезированных химических соединений. У человека длина всех молекул ДНК, содержащихся во всех хромосомах одной клетке, составляет примерно 2 метра. Следовательно, длина молекул ДНК в миллиард раз больше их толщины. Так как организм взрослого человека состоит примерно из 5х1013 — 1014 клеток, то общая длина всех молекул ДНК в организме равна 1011 км (это почти в тысячу раз больше расстояния от Земли до Солнца). Вот такая она, суммарная ДНК всего лишь одного человека!
Когда говорят о размере генома, то подразумевают общее содержание ДНК в единичном наборе хромосом ядра. Такой набор хромосом называют гаплоидным. Дело в том, что большинство клеток нашего организма содержит двойной (диплоидный) набор совершенно одинаковых хромосом (только у мужчин 2 половые хромосомы отличаются). Измерения размера генома приводятся в дальтонах, парах нуклеотидов (п. н.) или пикограммах (пг). Соотношение между этими единицами измерения следующие: 1 пг = 10–9 мг = 0,6х1012 дальтон = 0,9х109 п. н. (далее мы будем использовать в основном п. н.). В гаплоидном геноме человека содержится около 3,2 млрд. п. н., что равно 3,5 пг ДНК. Таким образом, в ядре одной клетки человека содержится около 7 пг ДНК. Если учесть, что средний вес клетки человека равен примерно 1000 пг, то легко рассчитать, что ДНК составляет менее 1 % от веса клетки. И тем не менее, чтобы воспроизвести самым мелким шрифтом (как в телефонных справочниках) ту огромную информацию, которая содержится в молекулах ДНК одной нашей клетки, понадобилось бы тысяча книг по 1000 страниц в каждой! Вот таков полный размер генома человека — Энциклопедии, написанной четырьмя буквами.
Но не следует думать, что геном человека наибольший из всех существующих в природе. Например, у саламандры и лилии длина молекул ДНК, содержащихся в одной клетке, в тридцать раз больше, чем у человека.
Поскольку молекулы ДНК имеют гигантский размер, их можно выделить и увидеть даже в домашних условиях. Вот как описывается эта простая процедура в рекомендации для кружка «Юный генетик». Во-первых, надо взять любые ткани животных или растительных организмов (например, яблоко или кусок курицы). Затем надо нарезать ткань на кусочки и положить 100 г в обычный миксер. После добавления 1/8 чайной ложки соли и 200 мл холодной воды вся смесь взбивается на миксере в течение 15 секунд. Далее взбитая смесь процеживается через ситечко. В полученную мякоть надо добавить 1/6 от ее количества (это будет примерно 2 столовые ложки) моющего средства (для посуды, например) и хорошо размешать. Через 5–10 минут жидкость разливается по пробиркам или любым другим стеклянным емкостям, чтобы в каждой из них было заполнено не больше трети объема. Затем к ней добавляется по чуть-чуть либо сок, выжатый из ананаса, либо раствор, используемый для хранения контактных линз. Все содержимое встряхивается. Делать это надо весьма осторожно, так как если трясти слишком сильно, то гигантские молекулы ДНК поломаются и после этого ничего нельзя будет увидеть глазами. Далее в пробирку медленно вливается равный объем этилового спирта, чтобы он образовал слой поверх смеси. Если после этого покрутить в пробирке стеклянной палочкой, на нее «намотается» вязкая и почти бесцветная масса, которая и представляет собой препарат ДНК.
Генетическая грамматика
После установления химического строения и пространственной структуры ДНК оставалось еще множество вопросов, основной из которых заключался в том, как же ДНК кодирует белки, то есть, что представляет из себя генетический код этой молекулы, какую «грамматику» она использует? На это в первую очередь и были направлены дальнейшие усилия исследователей.
Итак, установлено, что «буквами» в ДНКовом тексте служат нуклеотиды — элементарные звенья полимерной молекулы ДНК. В ДНК всего 4 нуклеотида (А, Т, Г, Ц). Следовательно, если сравнить каждый из этих нуклеотидов с отдельной буквой, то алфавит ДНКового текста содержит всего 4 «буквы». Как же из этих «букв» формируются «слова» и «предложения»?
Белковые молекулы всех существующих на земле организмов построены всего из 20 аминокислот. Сразу после создания модели ДНК стало ясно, что существует некий код, переводящий четырехбуквенный ДНКовый текст в двадцатибуквенный аминокислотный текст. Элементарные расчеты говорили о том, что число возможных сочетаний, в которых четыре нуклеотида могут быть по-разному расположены в «тексте», достигает астрономических значений. Так, молекула ДНК, состоящая, к примеру, всего из 100 пар нуклеотидов, может теоретически кодировать 4100 различных белковых «текстов». Какова же ситуация на самом деле?
Одним из первых в этом пытался разобраться русский физик Г. Гамов, эмигрировавший в то время в Америку. Наслушавшись многочисленных разговоров о ДНК и узнав, что она содержит — как и карты — всего четыре «масти», Гамов решил «разложить пасьянс» с целью понять устройство генетического кода. Ему сразу стало ясно, что код не может быть «двоичным», то есть одну аминокислоту в белке должна кодировать не двойка нуклеотидов — «букв», а как минимум тройка. Дело в том, что сочетание из 4 по 2 дает всего 16 комбинаций, а этого недостаточно для кодирования всех 20 аминокислот. Следовательно, рассуждал Гамов, код должен быть по крайней мере трехбуквенным, то есть каждую аминокислоту должна кодировать тройка «букв» в любых сочетаниях. На этом он и остановился, поскольку далее возникало множество вопросов. В частности, такой: число сочетаний из 4 по 3 равно 64, а аминокислот всего 20. Зачем же такая избыточность в трехбуквенном коде?
В то время уже существовал хорошо известный путь, который, в частности, был проделан в свое время французом Жаном Шампольоном при дешифровке иероглифов древнего Египта. В качестве основного подспорья для решения стоящей перед ним задачи он использовал базальтовую плиту, которую обнаружили во время военной компании Наполеона в Египет и которая получила название Розеттский камень. На плите одновременно присутствовали две надписи: одна была иероглифическая, а другая — сделанная греческими буквами на греческом языке. К счастью, и язык, и письмо древних греков были в то время уже хорошо известны ученым. В результате сравнение двух текстов Розеттского камня привело к расшифровке египетской иероглифики. Этим путем и двинулись ученые при расшифровке генетического кода. Надо было сравнить два текста: текст, записанный в ДНК, с текстом, записанным в белке. Однако первоначально ученые не умели «читать» ДНК, а одного известного в то время белкового текста было недостаточно. Пришлось искусственно синтезировать разнообразные короткие фрагменты РНК и синтезировать на них в искусственных системах фрагменты белка. Весной 1961 года в Москве на Международном биохимическом конгрессе М. Ниренберг сообщил, что ему удалось «прочесть» первое «слово» в ДНКовом тексте. Это была тройка букв — ААА (в РНК, соответственно, УУУ), то есть три аденина, стоящие друг за другом, — которая кодирует аминокислоту фенилаланин в белке. Так было положено начало расшифровке генетического кода.