Наконец в середине 1970-х годов проблему смогли решить химическим и биохимическим методами. Хотя первое время оба подхода конкурировали на равных, постепенно биохимический метод Сэнгера полностью вытеснил химический метод Максама—Гилберта. Метод Сэнгера оказался очень удобным для совершенствования и роботизации. На его основе были созданы целые роботизированные фабрики по расшифровке геномов, включая геном человека.
Принцип чтения ДНКовых текстов по Сэнгеру состоит в следующем.
Обычно читают последовательность одной из двух цепей ДНК. Чтобы начать, необходимо знать заранее последовательность из примерно 20 нуклеотидов, начиная с которой и будет читаться текст. Такой участок с известной последовательностью, называемый адаптером, всегда можно заранее пришить к фрагменту ДНК, последовательность которого нужно прочесть (подробнее об адаптерах мы поговорим ниже, в последнем разделе этой главы). Синтезируется искусственный кусочек ДНК (олигонуклеотид), комплементарный этому известному участку. Этот олигомер называется праймером, он играет роль затравки для матричного синтеза комплементарной цепи при помощи ДНК-полимеразы. Такой матричный синтез с затравки называют удлинением праймера. Итак, вместе с праймером к ДНК, которую хотят прочесть, добавляют ДНК-полимеразу и все четыре предшественника нуклеотидов, нуклеозидтрифосфаты (дНТФ): дАТФ, дЦТФ, дГТФ и дТТФ, которые необходимы для матричного синтеза комплементарной цепи ДНК. Их химические формулы похожи на формулы нуклеозидмонофосфатов (дНМФ, т. е. нуклеотидов), приведенные на рис. 6, 9, только они имеют длинный хвост из трех фосфатных групп (а не одной, как на рис. 6, 9). Приставка «д» означает «дезокси», т. е. указывает на то, что речь идет о предшественниках ДНК, а не РНК (рис. 9). В ходе каждого шага реакции удлинения праймера дНТФ из раствора узнает комплементарного партнера на матрице ДНК, ДНК-полимераза отщепляет две фосфатные группы и присоединяет оставшийся дНМФ (т. е. нуклеотид) к растущей цепи. Новая цепь всегда растет путем присоединения следующего нуклеотида к той ОН-группе предыдущего, которая соединена с сахарным кольцом (нижняя ОН-группа – на рис. 9).
Способность ДНК-полимеразы удлинять праймер была хорошо известна до Фредерика Сэнгера. То, что придумал Сэнгер и что принесло ему вторую Нобелевскую премию по химии (первую он получил за то, что научился читать аминокислотные последовательности белков; пока что Сэнгер – единственный в истории, кто был дважды удостоен Нобелевской премии по химии), это добавлять в смесь четырех дНТФ небольшую примесь одного из четырех ди-дНТФ, скажем, ддАТФ. У дидезокси отсутствуют оба присоединенных к сахару кислорода (рис. 6, 9), и, хотя они способны сами включаться в растущую цепь, на них рост цепи останавливается. В результате включения, скажем, ддАТФ вместо дАТФ возникают оборванные цепи, причем, поскольку ддАТФ присутствует в малой концентрации на фоне избытка дАТФ, обрывы происходят статистически в каждом месте последовательности, где в растущую цепь включается А. Так что, когда реакция удлинения праймера идет в присутствии малой примеси ддАТФ, наряду с длинными цепями, в которые включение ддАТФ не произошло, появится набор более коротких цепей, оборванных сразу за теми местами, где в последовательности матричной цепи стоит Т.
Аналогичные реакции проводят отдельно в присутствии трех остальных ддНТФ. Затем продукты так проведенных четырех реакций удлинения праймера подвергаются разделению по длине методом гель-электрофореза, наслаивая продукт каждой реакции на отдельную дорожку геля. Здесь следует сказать, что второй конец праймера (тот, который не удлинялся, он называется 5 -концом) был заранее помечен флюорофором: молекулой красителя, которая ярко флюоресцирует, если ее освещать светом лазера с определенной длиной волны. Так что после завершения электрофореза гель сканируют лазером и получают систему полосок, схематически показанную на рис. 16. Для данной буквы положение полосок отвечает порядковым номерам в последовательности, в которых стоит данная буква. Разумеется, в современных секвенаторах (так называют машины, читающие ДНКовые тексты) все делается автоматически, и компьютер выдает готовый текст из четырех букв: А, Т, Г и Ц.
Рис. 16. Метод Сэнгера (схема)
Хотя метод Сэнгера был изобретен более 40 лет назад и с тех пор чего только ни напридумывали, чтобы еще лучше и быстрее читать ДНКовые тексты, до недавнего времени он оставался вне конкуренции. Разумеется, современные монстры-секвенаторы на вид ничем не напоминают примитивный аппарат, состоящий из двух стекол с гелем между ними и из источника постоянного тока высокого напряжения, которым пользовался Сэнгер. Вместо флюорофоров он метил праймеры радиоактивным изотопом фосфора, а полоски в геле проявлял по засвечиванию фотопленки. Но при всех технических усовершенствованиях исходный принцип долго оставался без изменения.
Лишь в самые последние годы начали наконец появляться другие методы секвенирования ДНК, способные успешно конкурировать с методом Сэнгера. Но об этом мы поговорим в последнем разделе этой главы.
Первые неожиданности
В науке, да и не только в науке, часто бывает так, что находят вовсе не то, что ищут. Все ждали от первых последовательностей интересных сведений об устройстве промежутков между генами. Было множество предположений о том, как они должны быть устроены. Однако данные оказались разочаровывающими. Ничего особенного, в общем-то, не нашли – последовательности как последовательности. Ожидали, что, расшифровав последовательности нескольких промоторов, которые узнает одна и та же РНК-полимераза, можно будет сразу догадаться, как она это делает. Ан нет, не тут-то было! Хотя последовательности оказались чем-то похожими друг на друга, но чем именно, было не вполне ясно. Так пока и непонятно, как белки узнают определенные последовательности ДНК, каковы принципы такого узнавания. Это одна из проблем, еще ждущих своего решения.
Чего ожидали меньше всего, так это каких-то неожиданностей в самих генах, т. е. в участках ДНК, кодирующих последовательности аминокислот в белках. Ведь код, казалось, был твердо установлен, было четко известно, что каждому белку отвечает свой определенный участок ДНК, который, собственно, и есть ген. Короче, все опять свято верили в незыблемость центральной догмы молекулярной биологии. От шока, вызванного открытием ревертазы, к середине 1970-х годов уже оправились. И вот расшифровали первую ДНК – из вируса кишечной палочки, известного под кодовым названием ФХ174 (читается «фи-десять-сто-семьдесят-четыре»). И вдруг оказалось, что у него на одном и том же участке ДНК записана информация о двух белках!
Как же это может быть? Представьте себе, к вам в руки попала книга, в которой промежутков между словами нет, а слова разделяются стрелками. Сверху строк стоят одни стрелки, а внизу – другие. Деля текст на слова с помощью верхних стрелок, вы читали бы, допустим, «Анну Каренину», а по нижним – «Архипелаг ГУЛАГ». Скажете, это невозможно? Действительно, такого длинного текста, насколько я знаю, не существует. Но короткий текст такого типа я помню с детства. Вот он: