Дело еще больше усложняется тем, что каждая рибосома состоит не только из обширного комплекса белковых молекул, но и из ряда молекул РНК, две из которых довольно крупные. Эти молекулы РНК не являются матрицами. Они составляют элемент строения рибосомы.
По мере синтеза полипептидной цепи она сворачивается, укладываясь в хитроумную трехмерную структуру, необходимую белку, чтобы выполнять свою крайне специализированную функцию.
Белковые молекулы очень разнообразны по размерам. Типичная может состоять из нескольких сотен аминокислотных остатков. Поэтому ген обычно представляет собой отрезок ДНК в тысячу или более нуклеотидных пар, который кодирует одну полипептидную цепочку. Другие участки ДНК выполняют регуляторную роль, помогая включать и выключать определенные гены.
Рис. А-3. Общая формула аминокислоты. Аминогруппа – это NH3+. Кислотная группа – COO—. Боковая группа, различная у каждой аминокислоты, обозначена R. C – углерод, N – азот, O – кислород, H – водород.
Рис. А-4. Схема, иллюстрирующая «центральную догму». Стрелками показаны разные направления передачи информации о последовательностях. Сплошными стрелками обозначены типичные виды передачи. Пунктирными – более редкие. Обратите внимание, что стрелок, направленных от белков, не существует.
Нуклеиновая кислота мелкого вируса может состоять примерно из 5000 оснований и кодировать лишь несколько белков. Бактериальная клетка, скорее всего, обладает ДНК из нескольких миллионов оснований, обычно собранных в кольцо, и они кодируют несколько тысяч различных белков. Ваша собственная клетка несет около трех миллиардов оснований, доставшихся вам от матери, и столько же – от отца; все они кодируют около ста тысяч белков. В 1970-е гг. обнаружили, что ДНК высших организмов может содержать длинные отрезки (некоторые из них находятся внутри генов и называются интронами) без явного смысла.
Так называемая центральная догма – широкая гипотеза, стремящаяся предсказать, какие способы передачи информации о последовательностях невозможны. Таковые соответствуют местам, где нет стрелок, на рис. А-4. Типичные виды передачи показаны сплошными стрелками, более редкие – пунктирными. Обратите внимание, что по направлению от белков ни одна стрелка не идет.
Обычные виды передачи описывались выше. Из более редких можно привести пример передачи РНК ~> РНК, используемой некоторыми РНК-вирусами, такими как вирус гриппа и полиомиелита. Передача РНК ~> ДНК (обратная транскрипция) встречается у так называемых РНК-ретровирусов. Примером может служить ВИЧ. Вариант ДНК ~> белок встречается лишь как курьез: при особых условиях в пробирке одноцепочечная ДНК может функционировать как матрица, но в природе этого, вероятно, не бывает вообще.
Приложение В
Генетический код
Генетический код – это словарик, дающий перевод с четырехбуквенного языка нуклеиновых кислот (А, Г, Т и Ц для ДНК; РНК вместо Т содержит У) на двадцатибуквенный язык белков. Группа из трех расположенных подряд букв называется кодоном и кодирует аминокислоту. (Всего кодонов 4 × 4 × 4 = 64.) Большинство аминокислот кодируется более чем одним кодоном. Помимо этого, три кодона обозначают конец цепочки.
Генетический код обычно изображают так, как он показан в таблице В-1. На первый взгляд таблица может показаться запутанной, но по сути она очень проста. Точная химическая формула каждой аминокислоты известна. Возьмем, например, аминокислоту валин. Для простоты чтения валин в таблице обозначен сокращенно Val. Аналогичным образом гистидин, другая аминокислота, обозначается His. Для каждой аминокислоты в таблице можно прочесть три основания соответствующего триплета. Первое основание указано слева, второе – сверху, а третье – справа. Так, можно видеть, что валин (Val) кодируется сочетаниями ГУУ, ГУЦ, ГУА и ГУГ, тогда как гистидину (His) соответствуют кодоны ЦАУ и ЦАЦ. Три кодона, отмечающие окончание полипептидной цепочки (STOP), – это УАА, УАГ и УГА. Левый конец цепочки РНК или ДНК в общепринятой записи называется 5’-концом, а правый – 3’-концом (по химическим причинам).
Таблица B-1
Код, по-видимому, совершенно одинаков у всех высших растений и животных, изученных на данный момент. Впрочем, известны небольшие вариации, особенно у ДНК некоторых митохондрий (крошечных органелл, живущих в цитоплазме высших организмов) и, несомненно, у грибов.
Сокращения
У урацил (для ДНК следует читать T [= тимин] на месте У)
Ц цитозин
A аденин
Г гуанин
Ala аланин Lys лизин
Arg аргинин Met метионин
Asn аспарагин Phe фенилаланин
Asp аспарагиновая кислота Pro пролин
Cys цистеин Ser серин
Gln глутамин Thr треонин
Glu глутаминовая кислота Trp триптофан
Gly глицин Tyr тирозин
His гистидин Val валин
Ile изолейцин Leu лейцин
STOP – «конец цепочки»