И.Э. ЛАЛАЯНЦ
Геном человека
Немного истории
25 апреля теперь уже далекого 1953 г.
журнал Nature опубликовал небольшое письмо
молодых и никому неизвестных Ф.Крика и Дж.Уотсона
редактору журнала, которое начиналось словами:
«Мы хотели бы предложить свои соображения по
поводу структуры соли ДНК. Эта структура имеет
новые свойства, которые представляют большой
биологический интерес». Статья содержала около
900 слов, но – и это не преувеличение – каждое из
них было на вес золота.
«Ершистая молодежь» посмела выступить
против нобелевского лауреата Лайнуса Полинга,
автора знаменитой альфа-спирали белков. Полинг
буквально накануне опубликовал статью, согласно
которой ДНК представляла собой трехцепочечную
спиральную структуру, наподобие девичьей косы.
Тогда никто не знал, что у Полинга был просто
недостаточно очищенный материал. Но и Полинг
оказался отчасти прав – сейчас трехцепочечность
некоторых участков наших генов хорошо известна.
Это свойство ДНК даже пытались одно время
использовать в борьбе с раком, выключая с помощью
олигонуклеотидов те или иные раковые гены
(онкогены).
Биологии нуклеиновых кислот долго не
везло. Достаточно сказать, что первую
нобелевскую премию за открытие строения
нуклеотидов немец А.Коссель получил еще в 1910 г.
А знаменитая реакция Фельгена для окрашивания
ДНК была предложена накануне Первой мировой
войны и усовершенствована в 1920-е гг. Тогда и
могла бы начаться новая эра биологии, однако...
Однако биологи были уверены, что
«монотонная» ДНК с ее только четырьмя
различающимися основаниями просто не могла
нести генетическую информацию о миллионах самых
разнообразных белков. И хотя уже применялась
азбука Морзе с тремя кодирующими элементами,
менталитет исследователей еще не достиг уровня
информационной эры с ее двоичной системой записи
(«0» и «1») любой информации.
Лишь к началу 1950-х гг. отдельные
ученые стали обращать внимание на ДНК, роль
которой в передаче наследственных признаков у
микроорганизмов установил в 1943 г. Освальд
Эйвери. Результатам Эйвери поверил Сальвадор
Лурия, который вместе с Максом Дельбрюком
организовал неподалеку от Нью-Йорка лабораторию
на биостанции в местечке Колд-Спринг Харбор.
Заметим в скобках, что физик М.Дельбрюк
был учеником Н.В. Тимофеева-Ресовского в
биологии и соавтором их совместной с К.Циммером
знаменитой статьи, посвященной определению
размеров гена. Лурия с Дельбрюком изучали
жизненный цикл бактериофагов – вирусов
микроорганизмов, в результате чего и пришли к
предположениям о биологической роли ДНК. Лурия
послал своего аспиранта Джеймса Уотсона в
Кавендишскую лабораторию в Кембридже, где Морис
Уилкинс и Розалинд Франклин исследовали
строение ДНК с помощью рентгена (англичане
лидировали в рентгеноструктурном анализе
биомолекул).
В лаборатории Уилкинса работал также
еще довольно молодой физик Фрэнсис Крик,
известный в узких лабораторных кругах своим
научным скепсисом: для него просто не
существовало никаких авторитетов, чем он и
заработал себе репутацию скандалиста. Статью
Полинга в лабораторию принес его сын, который
помог, кстати, Уотсону и Крику уяснить роль
попарного комплементарного соединения
азотистых оснований. Статья стала последней
каплей перед озарением, или пониманием... тем, что
оформилось в открытие молодых ученых.
Научное сообщество, однако, не сразу
признало их открытие. Достаточно сказать, что
сначала Нобелевскую премию за работы в области
ДНК «судьи» из Стокгольма присудили в 1959 г.
известным американским биохимикам Северо Очоа и
Артуру Корнбергу. Очоа был первым (1955), кто сумел
синтезировать рибонуклеиновую кислоту (РНК).
Корнберг же получил премию за синтез ДНК в
пробирке (1956).
В 1962 г. настал черед Крика, Уотсона и
Уилкинса. Р.Франклин к тому времени уже умерла от
рака в возрасте 37 лет, иначе это был бы
единственный случай в истории Нобелевских
премий, когда награду вручили бы четверым, хотя
это и не допускается уставом. Вклад Франклин в
развитие рентгеноструктурного анализа ДНК был
просто неоценим.
После открытия Уотсона и Крика
важнейшей проблемой стало выявление
соответствия между первичными структурами ДНК и
белков. Поскольку в составе белков
обнаруживается 20 аминокислот, а нуклеиновых
оснований всего 4, то для записи информации о
последовательности аминокислот в
полинуклеотидах необходимо не менее трех
оснований. На основании таких общих рассуждений
варианты «трехбуквенных» генетических кодов
предложили физик Г.Гамов и биолог А.Нейфах.
Однако их гипотезы были чисто умозрительными и
не вызвали большого отклика среди ученых.
Трехбуквенный генетический код к
1964 г. расшифровал Ф.Крик. Вряд ли он тогда
предполагал, что в обозримом будущем станет
возможной расшифровка генома человека. Эта
задача долгое время казалась неразрешимой.
Однако два открытия позволили сдвинуть проблему
с места.
В 1970 г. не известные широкой научной
общественности Г.Темин и Д.Балтимор опубликовали
в Nature статьи, посвященные обратной
транскриптазе (ОТ) – ферменту РНК-содержащих, в
том числе раковых, вирусов, которые синтезируют
ДНК на матрице РНК, т.е. осуществляют реакцию,
обратную той, которую до тех пор наблюдали в
клетках.
Открытие обратной транскриптазы
позволило выделить первые гены. Но процесс этот
был крайне трудоемким и чрезвычайно дорогим. А
спустя 15 лет некий химик из Калифорнии предложил
на суд коллег уникальную полимеразную цепную
реакцию (ПЦР), сразу же ставшую знаменитой. В этой
реакции фермент, полимераза, «ходит как челнок»
по фрагменту ДНК, поэтому ПЦР позволяет
нарабатывать любые количества этого фрагмента,
необходимые для анализа*.
ПЦР, а также появление новейшей
электронной техники и компьютеров сделали
вполне реальной задачу расшифровки всего генома
человека. Долгие дебаты закончились в конце
сентября 1988 г., когда во главе проекта HUGO –
Организации по расшифровке генома человека –
был поставлен Дж.Уотсон.
Журнал Time назвал в связи с этим
Уотсона «охотником за генами». Сам же ученый
сказал следующее: «Это захватывающая
перспектива. Тридцать лет назад мы не могли и
мечтать о том, чтобы узнать структуру генома даже
мельчайшего вируса. А сегодня мы уже
расшифровали геном вируса СПИДа и почти
полностью прочитали геном кишечной палочки
объемом в 4,5 млн букв ген-кода. Точное знание
детальной структуры генома человека – это
восхитительно!».
И вот геном прочитан
Завершение работ по расшифровке
генома человека консорциумом ученых
планировалось к 2003 г. – 50-летию открытия
структуры ДНК. Однако конкуренция сказала свое
слово и в этой области.
Крейг Вентер основал частную компанию
«Селера», которая продает генные
последовательности за большие деньги.
Включившись в гонку по расшифровке генома, она за
один год сделала то, на что у международного
консорциума ученых из разных стран ушло десять
лет. Это стало возможным благодаря новому методу
чтения генетических последовательностей и
использованию автоматизации процесса чтения.
Итак,
геном прочитан. Казалось бы, надо радоваться, но
ученые пришли в недоумение: уж очень мало генов
оказалось у человека – примерно в три раза
меньше, чем ожидалось. Раньше думали, что генов у
нас около 100 тыс., а на самом деле их оказалось
около 35 тыс. Но даже не это самое главное.
Недоумение ученых понятно: у дрозофилы
13 601 ген, у круглого почвенного червя –
19 тыс., у горчицы – 25 тыс. генов. Столь малое
количество генов у человека не позволяет
выделить его из животного царства и считать
«венцом» творения.
Основную часть ДНК наших хромосом
занимают пустынные участки и так называемые
тандемные повторы. В пустынных участках
просто-напросто не закодировано никаких генов, а
повторы бессмысленны и следуют друг за другом
наподобие велосипедов-тандемов, откуда и
получили название. ДНК повторов называют также
паразитической. Такое презрительное название
она получила за то, что ничего не делает в геноме,
однако сохраняется и увеличивает массу хромосом.
Зато там, где располагаются гены,
активность ДНК и ферментов, синтезирующих ее
копии в виде молекул информационной РНК,
повышается в 200–800 раз! Это – «горячие точки»
генома.
В геноме человека ученые насчитали 223
гена, которые сходны с генами кишечной палочки.
Кишечная палочка возникла примерно 3 млрд лет
назад. Зачем нам такие «древние» гены? Видимо,
современные организмы унаследовали от предков
какие-то фундаментальные структурные свойства
клеток и биохимические реакции, для которых
необходимы соответствующие белки.
Нет поэтому ничего удивительного и в
том, что половина белков млекопитающих имеют
сходство аминокислотных последовательностей с
белками мухи дрозофилы. В конце концов мы дышим
одним и тем же воздухом и потребляем животные и
растительные белки, состоящие из одних и тех же
аминокислот.
Удивительно, что с мышью мы имеем 90%
общих генов, а с шимпанзе – вообще 99%!
В нашем геноме много
последовательностей, доставшихся нам в
«наследство» от ретровирусов. Эти вирусы, к
которым относятся вирусы рака и СПИДа, вместо ДНК
в качестве наследственного материала содержат
РНК. Особенностью ретровирусов является, как уже
говорилось, наличие обратной транскриптазы.
После синтеза ДНК по РНК вируса вирусный геном
встраивается в ДНК хромосом клетки.
Таких ретровирусных
последовательностей у нас много. Время от
времени они «вырываются» на волю, в результате
чего возникает рак (но рак в полном соответствии
с законом Менделя проявляется лишь у рецессивных
гомозигот, т.е. не более чем в 25% случаев). Совсем
недавно было сделано открытие, которое позволяет
понять не только механизм встраивания вирусов,
но и назначение некодирующих
последовательностей ДНК. Оказалось, что для
встраивания вируса необходима специфическая
последовательность из 14 букв генетического кода.
Таким образом, можно надеяться, что вскоре ученые
научатся не только блокировать агрессивные
ретровирусы, но и целенаправленно «внедрять»
нужные гены, и генотерапия из мечты превратится в
реальность.
В организме млекопитающих ретровирусы
играют и еще одну немаловажную роль. В отношении
млекопитающих, у которых плод развивается внутри
организма матери, правомерен вопрос: почему
иммунная система матери позволяет развиваться
организму, который наполовину генетически ей
чужероден, поскольку половина генома плода
отцовская?
Все дело в ретровирусах, которые
блокируют активность иммунных Т-лимфоцитов,
ответственных за отторжение органов и тканей,
содержащих чужеродные белки, например, после
трансплантации органов. Эти ретровирусы
активируются в геноме клеток плаценты, которая
образуется тканями плода.
Недавно был обнаружен вирус, который
блокирует развитие (экспрессию) ретровируса.
Если этим вирусом-блокатором заразить
беременную мышь, то мышата рождаются нормальными
и в срок. Но если его ввести в клетки плаценты, то
происходит выкидыш плода, так как активируются
Т-лимфоциты матери.
Не
стоит забывать, что ретровирусные
последовательности возникают также
непосредственно на концах хромосом – теломерах.
Как известно, теломеры состоят из одноцепочечной
ДНК, которая синтезируется ферментом
теломеразой по матрице РНК. Считается, что
теломеры являются нашими молекулярными часами,
поскольку они укорачиваются с каждым клеточным
делением. Раньше считалось, что в теломерах нет
генов, однако расшифровка генома показала, что
генов там довольно много и они активны в детстве
и молодом возрасте, постепенно «угасая» по мере
старения организма.
Не так уж бездеятельны и тандемные
повторы. В норме они имеют определенное число
повторяющихся троек, пятерок и даже семерок букв.
Но в некоторых случаях в результате мутаций
число повторов начинает нарастать, что ведет к
нестабильности генома. Дело доходит даже до
«поломок» концов хромосом. Фрагментация
концевых участков хромосомы может привести к
перемещениям (транслокации) участков ДНК в
другую хромосому, а также синтезу таких форм
белка, которые вызывают гибель нервных клеток,
как это наблюдается при наследственной хорее
Гентингтона.
К.Вентер говорил, что понимание генома
потребует сотни лет. Ведь мы до сих пор не знаем
функций и роли более чем 25 тыс. генов. И даже не
знаем, как подступиться к решению этой задачи,
поскольку большинство генов просто «молчит» в
геноме, никак себя не проявляя.
Следует учитывать, что в геноме
накопилось множество псевдогенов и
генов-«перевертышей», которые также неактивны.
Похоже, что некодирующие последовательности
являются как бы изолятором активных генов. В то
же время, хотя генов у нас и не слишком много, они
обеспечивают синтез до 1 млн (!) самых разных
белков. Как же это достигается при таком
ограниченном наборе генов.
Как оказалось, в нашем геноме
существует специальный механизм –
альтернативный сплайсинг. Заключается он в
следующеем. На матрице одной и той же ДНК
происходит синтез разных альтернативных и-РНК.
Сплайсинг и означает «расщепление», когда
образуются разные молекулы РНК, которые как бы
«расщепляют» ген на разные варианты. Этот
приводит к невообразимому разнообразию белков
при ограниченном наборе генов.
Функционирование генома человека, как
и всех млекопитающих, регулируется различными
транскрипционными факторами – специальными
белками. Эти белки связываются с регуляторной
частью гена (промотером) и таким образом
регулируют его активность. Одни и те же факторы
могут по-разному проявлять себя в разных тканях.
У человека есть свои собственные, присущие
только ему, транскрипционные факторы. Выявить
эти чисто человеческие особенности генома еще
только предстоит ученым.
СНП
Существует и еще один механизм
генетического разнообразия, который выявился
только в процессе прочтения генома. Это сингулярный
нуклеотидный полиморфизм, или, так называемые
факторы СНП.
Полиморфизмом в генетике называют
ситуацию, когда гены одного и того же признака
существуют в разных вариантах. Примером
полиморфизма, или, другими словами,
множественных аллелей, служат группы крови,
когда в одном хромосомном локусе (участке) могут
находиться варианты генов А, В или О.
Сингулярность по-латыни означает
одиночество, что-то единственное. СНП – это
изменение «буквы» генетического кода без
«последствий для здоровья». Считается, что у
человека СНП встречается с частотой 0,1%, т.е.
каждый человек отличается от других одним
нуклеотидом на каждую тысячу нуклеотидов. У
шимпанзе, представляющей собой более древний
вид, и к тому же гораздо более гетерогенный, число
СНП при сравнении двух разных особей
достигает 0,4%.
Но если различия в СНП не сказываются
на здоровье особей, то чем они интересны и важны?
Во-первых, изучение СНП имеет большое
теоретическое значение. Именно они позволяет
сравнивать возрасты популяций и определять пути
их миграции. Так, например, в мужской половой
хромосоме (Y) выделены 22 фактора СНП, анализ
которых у 1007 европейцев позволил определить, что
80% европейских мужчин имеют сходный
«СНП-паттерн», т.е. «рисунок». Это говорит о том,
что тысячи поколений назад 4/5 европейских мужчин
имели общего предка!
Но и практическое значение СНП велико.
Возможно, не все знают, что сегодня самые
распространенные лекарства эффективны не более
чем для четверти населения. Минимальные
генетические отличия, обусловленные СНП,
определяют эффективность лекарств и их
переносимость в каждом конкретном случае. Так, у
больных диабетом выявили 16 специфических СНП.
Всего при анализе 22-й хромосомы определили
местоположение 2730 СНП. В одном из генов,
кодирующих синтез рецептора адреналина,
выявлено 13 СНП, которые могут комбинироватьcя
друг с другом, давая 8192 различных варианта
(гаплотипа).
Насколько скоро и полно начнет
использоваться полученная информация, пока не
совсем ясно. Пока же приведем еще один конкретный
пример.
Среди астматиков довольно популярно
лекарство албутерол, который взаимодействует с
указанным рецептором адреналина и подавляет
приступ удушья. Однако из-за разнообразия
гаплотипов людей лекарство действует не на всех,
а некоторым больным оно вообще противопоказано.
Это обусловлено СНП: люди с последовательностью
букв в одном из генов ТЦТЦЦ (Т–тимин, Ц–цитозин)
не реагируют на албутерол, если же концевой
цитозин заменен на гуанин (ТЦТЦГ), то реакция
есть, но частичная. Для людей же с тимином вместо
концевого цитозина в этом участке – ТЦТЦТ –
лекарство токсично!
Протеомика
Эта совершенно новая отрасль биологии,
изучающая структуру и функции белков и
взаимосвязи между ними, названа по аналогии с
геномикой, занимавшейся геномом человека. Само
рождение протеомики уже объясняет, зачем нужна
была программа «Геном человека». Поясним на
примере перспективы нового направления.
В далеком 1962 г. вместе с Уотсоном и
Криком в Стокгольм были приглашены из Кембриджа
Джон Кэндрью и Макс Перутц. Они были удостоены
Нобелевской премии по химии за впервые
осуществленную расшифровку трехмерной
структуры белков миоглобина и гемоглобина,
ответственных за перенос кислорода в мышцах и
эритроцитах соответственно.
Напомним, что даже в начале 1990-х гг.
расшифровка структуры каждого нового белка
представляла значительные трудности. Каждый
анализ занимал до десятка лет. И хотя сейчас
вместо рентгеновских лучей используют
ядерно-магнитный резонанс (ЯМР), однако времени и
денег на определение пространственной структуры
каждого белка уходит очень много.
Протеомика позволяет ускорить и
удешевить эти работы. К.Вентер отметил, что он
10 лет потратил на выделение и секвенирование
гена адреналинового рецептора человека, теперь
же его лаборатория тратит на это 15 с. Еще в
середине 90-х гг. нахождение «адреса» гена в
хромосомах занимало 5 лет, в конце 90-х – полгода, а
в 2001 г. – одну неделю! Кстати, ускорению
определения положения гена помогает информация
о СНП, которых сегодня насчитываются уже
миллионы.
Вернемся к протеомике. Знание
аминокислотных последовательностей и
трехмерной структуры определенных белков
позволило разработать программы сопоставления
генетических последовательностей с
аминокислотными, а затем программы
предположительного расположения их в трехмерной
структуре полипептидов. Знание трехмерной
структуры позволяет быстро находить химические
варианты молекул, в которых блокирован, например,
активный центр, или определять положение
активного центра у мутантного фермента.
Известно, что повышение артериального
давления вызывается ферментом АСЕ, сокращенное
название которого переводится с английского как
ангиотензин-конвертирующий фермент.
Образующийся под действием фермента ангиотензин
воздействует на стенки артерии, что и ведет к
гипертонии. Уже относительно давно были найдены
блокаторы фермента АСЕ, которые стали
продаваться в качестве лекарств от повышенного
давления. Однако, эти лекарственные средства
оказались малоэффективными.
Анализ генома позволил выделить ген
АСЕ-2, который кодирует более распространенный и
эффективный вариант фермента. Затем была
определена виртуальная структура белкового
продукта, после чего подобраны химические
вещества, активно связывающиеся с белком АСЕ-2.
Так был найден новый препарат против
артериального давления, причем за вдвое меньшее
время и всего лишь за 200 вместо 500 млн долларов!
Признаемся, что это был пример
«догеномного» периода. Теперь же, после
прочтения генома, на первый план выходит
протеомика, цель которой – быстрее разобраться с
тем миллионом белков, которые потенциально могут
существовать в наших клетках. Протеомика
позволит более тщательно диагностировать
генетические отклонения и блокировать
неблагоприятное действие мутантных белков на
клетку.
А со временем можно будет планировать
и «исправление» генов.
* Одновременно и независимо полимеразная
реакция была исследована и оптимизирована
В.Барановым в Институте белка АН СССР, однако
«в своем отечестве пророка нет», поэтому
публикации на эту тему появились гораздо позже
статей западных коллег.
|