Протеомика – переводчик языка вашего организма
В медицине давно известно: прекрасно было бы «услышать» все белки, создающие тело. Но такой возможности не было. Технически это гораздо сложнее геномики. В частности, из-за огромного диапазона значений; наиболее частые и наиболее редкие белки могут отличаться на 10–12 порядков. Стоит также помнить, что технология, использованная для изучения белков, рассматривает различия между фрагментами белков с разрешением, равным одному нейтрону, что очень мало. Очень сложно изучать такие сложные данные и не внести ошибки, искажающие результаты.
В отличие от геномики, в этом случае нельзя просто смешать несколько ингредиентов, чтобы получить результаты исследования. Напротив, сбор и упорядочивание таких больших молекул, как белковые, является аналоговым (не цифровым процессом), подобно тому, как организм является аналоговой системой, а не цифровой, о чем сказано выше. Важно и то, сколько в системе каждого белка, и среди сотен активных белков в системе количество конкретного белка, находящегося в конкретном месте, может различаться на несколько порядков.
Ученые многие годы пытались измерить все белки в лабораторных условиях, но это было слишком сложно. Результаты измерений получались с большими погрешностями и редко воспроизводились повторно. Измерение не давало такого же результата в следующий раз, что делало невозможным получение достоверных проверяемых результатов. Это создало протеомике дурную славу – люди перестали пытаться изучать много белков одновременно, считая протеомику бесполезной. Но я верил, что технологии смогут решить эту задачу и протеомика предложит медицине прекрасные возможности, которых отчаянно не хватало. Онкология, например, жаждала научных прорывов.
Одним из препятствий является чувствительность процесса исследования белков тела. Невозможно просто прийти в лабораторию к девяти утра, взять образец крови, что может и пятиклассник, а потом через несколько часов вынуть из машины распечатку анализа. Так сейчас проводят секвенирование ДНК. К сожалению, анализ белков крови состоит из сотни шагов, и пропуск любого шага исказит результаты. Скажем, если один лаборант на одной стадии меняет настройки волны, а другой сотрудник лаборатории держит образец в растворе на 15 секунд дольше, то получатся совершенно другие результаты. С научной точки зрения такое неприемлемо. Если невозможно получить повторяемые результаты, то приходится отложить задачу и сделать перерыв. Именно повторяемые результаты позволяют сделать достоверные выводы.
По настоянию Эла Гора я разрешил Денни Хиллису помочь мне в решении задачи. В основе лежала инженерная проблема, и это означало, что скорее всего ее не сможет решить биолог вроде меня. Мои эксперименты требовали более сложных действий. Нужна была лучше управляемая техника, больше похожая на набор полупроводников, чем на лабораторный стол, и лучше контролируемые процессы для получения воспроизводимых результатов. Однако даже при возможности измерить сотни и тысячи уровней белков осмысление данных составляло серьезную математическую проблему – проблему вычислений. Набор белков одного человека занимал около 40 гигабайт. Помощь Хиллиса требовалась не только на начальных этапах. Не буду загружать вас подробностями того, как изменилась техника, важно, что она задействовала все наши знания. Проблема была решена с помощью роботизации, параллельных вычислений (способ расчетов, когда несколько расчетов выполняются одновременно и «параллельно») и изменение масс-спектрометра для взвешивания белков.
Методика масс-спектрометрии достаточно проста. Для измерения характеристик отдельных молекул масс-спектрометр превращает молекулы в ионы, заряженные частицы, которые можно перемещать с помощью внешних электрических и магнитных полей. Образец ионизируют, ионы сортируют и разделяют по массе и заряду, потом отсортированные ионы взвешивают, а результаты оформляют в таблицу. Белки, крупные молекулы, масс-спектрометр сначала разбивает на аминокислотные фрагменты, которые потом сортирует по массе. Результаты конкретного образца сравнивают с базами данных по известным и предсказанным белкам, чтобы определить исходный белок. Это краткая версия, так как для получения цифровой картины человеческих белков используется гораздо больше техники. С научной точки зрения все понятно, но идеальное выполнение, особенно в случае человеческих белков, – серьезная проблема.
К 2009 году, после примерно шести лет напряженной работы, мы собрали установку. Она делает все эти сотни шагов автоматически – и мы впервые смогли получить точные повторяемые результаты. Можно взять каплю крови и определить более сотни тысяч характеристик этой крови – характеристик, повторяющихся у всех.
Посмотрим на каплю крови, пропущенную через сверхпроводящий магнит, что дало возможность посмотреть на все белки в теле (рис. 5). Появляется система – как целое.
Рис. 5. Снимок белков человеческой крови (Источник: «Прикладная протеомика»)
Увиденное больше похоже на звездное небо, но на самом деле перед нами – изображение человеческого протеома в высоком разрешении, эквивалент 70 тысяч мегапикселей снимка человеческой крови. Другими словами, это «картина» белков, плавающих в человеческой крови, которая включает такие сложные измерения на атомном уровне, что требуется порядка 40 гигабайт для хранения всех данных об образце (а эта картинка представляет собой примерно 1/24 всех данных). Цвета (на иллюстрации не показаны) используются для индикации наличия белка в данном месте в трехмерном пространстве, в котором более распространенные белки изображаются как более близко расположенные. Необязательно знать, что это за характеристики (то есть точки и пятна), но среди них можно выявить тысячи известных белков, и гены, ассоциированные с ними, известны. Обычно мы что-то знаем об их функции – например, есть белок, который управляет метаболизмом кофеина, или о месте синтеза – например в желудке, и т. д. Удачное название по аналогии – «Google Earth на стероидах». Можно приблизиться к каждой точке, определить, что эта точка – белок, характерный для рыбы, живущей в холодной воде, и предположить, что человек на обед ел семгу или палтуса. Конечно, хотелось бы делать более полезные выводы, предположим, является ли конкретный белок признаком отклонения состояния или предсказывает ли определенное сочетание белков развитие болезни. Именно к этому стремятся разработчики метода, это станет возможным, когда знание функции белков (и наша база данных по теме) пополнится.
Представьте, как будет использована эта информация. Появится возможность увидеть отличия между людьми не только в частностях, но и в том, что происходит внутри них. Как уже говорилось, ДНК статично, а протеины динамичны. Они меняются каждую минуту, в зависимости от того, что происходит в теле. В лабораториях Центра прикладной молекулярной медицины при Университете Южной Калифорнии и в «Прикладной протеомике», компании, которую учредили мы с Хиллисом, этим и занимаются – пытаются найти ключи к пониманию всех белков организма и понять, как из них составляется язык организма, который переводится на язык здоровья.