Если не считать неверных результатов исследования, пакистанских исследователей невозможно упрекнуть за то, что они решили, будто нашли причину болезни у своих пациентов. Аланин и серин отличаются по ряду химических свойств, хоть это и не самые различающиеся по свойствам аминокислоты. Выявление одной и той же мутации у 12 разных человек из трех семей, страдающих одним и тем же заболеванием, обычно служит весомым свидетельством причинно-следственной связи.
К 2005 г. группа ученых из Нидерландов уже сообщила, что этот генетический вариант встречается слишком часто и вряд ли может быть причиной редкого глазного заболевания, но, видимо, эта информация прошла мимо тех, кто секвенировал геном Уотсона. Благодаря Дэниелу Мак-Артуру и его команде теперь известно, что данный вариант широко распространен во многих странах мира. Почти у половины людей европейского происхождения, занесенных в базу данных gnomAD, есть одна или две копии этого варианта, причем около 7000 человек из них (всего в базе 140 000 индивидов всех рас и национальностей) обладают двумя его копиями, то есть обе копии данного гена у них несут этот вариант. Просто невозможно, чтобы он был причиной редкого заболевания, и совершенно неудивительно, что его можно обнаружить при секвенировании генома какого-нибудь европейца вроде Уотсона.
За прошедшее десятилетие стала очевидной неутешительная истина: в генетике очень просто ошибиться. Легко критиковать пакистанскую группу за ошибочный результат скрининга (тот вариант оказался столь же распространенным в Южной Азии, как и в Европе, поэтому при корректном тестировании они бы наверняка обнаружили его в своей контрольной выборке у кого-нибудь из 100 человек). Но оказалось, что в литературе по генетике это распространенная проблема. И к сожалению, одних только популяционных данных недостаточно для ее решения, поскольку наряду с широко распространенными безвредными вариациями существуют и безвредные, но редкие вариации.
В области кардиологической генетики проблема генетических вариантов, ошибочно определенных как причины заболеваний, встает особенно остро. В 2012–2013 гг. коллектив датских ученых под руководством Мортена Ольсена
перелопатил медицинскую литературу о наследственных патологиях сердечной мышцы и сердечного ритма, а затем сопоставил генетические варианты, описанные в публикациях как причины заболеваний, с первой открытой базой данных по экзомам — Exome Variant Server. В ней были представлены лишь 6500 экзомов, но когда она только появилась, то стала настоящей информационной сокровищницей. Команда Ольсена обнаружила, что литература по кардиологической генетике изобилует ошибками: многие якобы «патологические» варианты оказались чрезвычайно распространенными среди населения. По их расчетам, если бы все эти варианты действительно вызывали болезни, то каждый четвертый человек страдал бы от поражения сердечной мышцы — гипертрофической кардиомиопатии, у каждого шестого была бы дилатационная кардиомиопатия, а у каждого тридцатого — синдром удлиненного интервала QT, заболевания с высоким риском внезапной сердечной смерти, характеризующееся удлинением интервала QT на электрокардиограмме. Вывод был ясен: многие варианты, прежде описывавшиеся как патологические, на самом деле оказались безвредными.
Возможно, еще более неприятным открытием стало то, что не только ряд вариантов необоснованно считали причинами патологий, но и множество генов связывали с заболеваниями ошибочно. Порой речь идет об одной-единственной публикации, данные которой нигде больше не приводятся. Это (как правило) сравнительно безобидный случай. Но иногда гены попадают в списки патологических и их начинают искать при тестировании на наследственные заболевания, даже если оснований для этого недостаточно. Что еще раз говорит о том, что кардиологическая генетика — проблемная область. Например, гены CACNB2 и KCNQ1 обычно включают в панели генов при тестировании пациентов с гипертрофической кардиомиопатией
, несмотря на то что доказательства связи между этими генами и заболеванием ненадежны. Как следствие, возникает значительный риск того, что пациентам сообщат о наличии мутации в этих генах, якобы вызвавшей их заболевание. А из этого вытекают различные ситуации, когда люди могут быть введены в заблуждение — в первую очередь родственники, у которых нет сердечных заболеваний, но которым после генетического тестирования могут внушить ложный оптимизм или, наоборот, напугать мнимой угрозой.
После того как пришло понимание, что в нашей области знаний часто случаются ошибки, маятник качнулся в обратную сторону и при истолковании генетических данных начали проявлять чрезмерную осторожность. Хотя по большей части осторожность и уместна, однако она несет собственные риски. Ошибки чреваты самыми разнообразными последствиями, и это палка о двух концах: можно нанести вред, ошибочно определив вариант как патологический, а можно — ошибочно определив его как безвредный. Если мы скажем родителям, что у их ребенка имеется заболевание, которого на самом деле у него нет, результатом может стать неправильное лечение. Это может также означать, что они получат неверную информацию о том, какова вероятность заболевания у их следующего ребенка; они могут пройти пренатальную диагностику, по результатам которой может быть прервана нормальная беременность или сохранен плод с нераспознанной вовремя патологией. Напротив, если мы ошибочно проигнорируем вариант, который действительно ведет к заболеванию, пациент может не получить необходимого ему лечения. Может случиться и так, что родитель, который мог бы получить утешительное известие о том, что вероятность рождения второго тяжелобольного ребенка совсем невелика, его не получит. Если подобная перспектива беспокоит вас и влияет на ваши планы завести детей, у нас принято говорить, что вы «потеряли репродуктивную уверенность» — а с ней, возможно, и шансы родить следующего, здорового ребенка.
Поэтому нам, генетикам, приходится придерживаться «принципа Златовласки»
[63], стараясь найти золотую середину при решении вопроса о том, вызывает ли данный вариант заболевание. «Генетическая каша» должна быть не слишком горячей и не слишком холодной, ровно такой, как надо. Однако определить, как надо, порой бывает очень непросто. Хорошо, когда у нас есть популяционные данные, которые говорят нам: «Этот вариант слишком типичен, чтобы быть вредным». Хорошо, когда перед нами нечто такое, что уже наблюдалось десятки раз у больных и никогда — у большинства в популяции. Трудности чаще всего возникают с промежуточными случаями.
Вы, возможно, думаете, что решить эту задачу помогут компьютеры. Что ж, не вы первый. Стало чуть ли не обычным делом — едва встретившись с проблемой, тут же заявить: «У меня идея! Я напишу компьютерную программу, которая сможет определить, где хорошее, а где плохое». Существует ряд различных подходов к этой задаче, в основном опирающихся на сценарий, при котором одна аминокислота замещается другой (если в результате мутации возникает стоп-кодон, последствия обычно вычислить нетрудно). Одни программы нацелены на поиск химических изменений. Другие — на поиск того, что остается неизменным в ходе эволюции. К настоящему времени уже секвенированы геномы МНОГИХ организмов. Если вас интересует, скажем, замена аланина на серин, можно воспользоваться новейшей программой, чтобы посмотреть на соответствующую позицию в аналогичных белках у существ, все более и более далеких от человека, или на ту же самую позицию в одинаковых белках у человека и других животных.