Text
                    ысшее профессиональное образование
А. С. Коничев
Г. А. Севастьянова
МОЛЕКУЛЯРНАЯ
БИОЛОГИЯ
2-е издание
ACADEMA

ВЫСШЕЕ ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ А.С.КОНИЧЕВ, Г. А.СЕВАСТЬЯНОВА МОЛЕКУЛЯРНАЯ БИОЛОГИЯ Допущено Учебно-методическим объединением по специальностям педагогического образования в качестве учебника для студентов высших учебных заведений, обучающихся по специальности 032400 «Биология» 2-е издание, исправленное Москва ACADEMA 2005
УДК 577.2(075.8) ББК 28.007я73 К 64 Рецензенты: чл.-кор. РАН, д-р биол. паук, проф. Л. 11. Рысков'. д-р пед. паук. проф. В. В. Пасечник (зап. кафедрой методики преподавания географии, естествознания и экологии Московского педагогического университета) Коничсв Л. С. К64 Молекулярная биология: Учеб, для студ. пед. вузов / А. С. Коничсв, Г. А. Севастьянова. — 2-е изд., испр. — М.: Из- дательский цен тр «Академия», 2005. — 400 с. ISBN 5-7695-1965-7 В учебнике кратко изложены история и методы молекулярной биоло- гии, подробно рассмотрены основные направления изучения нуклеино- вых кислот и белков: структура геномов про- и эукариот, вирусов и фа- гов, митохондрий и хлоропластов: подвижные генетические элементы; повреждения и репарация структуры ДНК; молекулярные основы гене- тической рекомбинации; структура, процессинг и функции различных видов РНК; механизмы н принципы регуляции основных молекулярно- генетических процессов (репликации, транскрипции, трансляции); струк- тура и фолдинг белков; б’елково-пукленповые взаимодействия; молеку- лярные механизмы регуляции клеточного никла, канцерогенеза и про- граммируемой клеточной смерти. Значительное место отведено методам генетической инженерии, ее достижениям и перспективам. Для студентов высших педагогических учебных заведений. Может быть полезен преподавателям колледжей и средних школ с углубленным изу- чением биологии. УДК 577.2(075.8) ББК 28.007я73 ©Коничсв А.С.. Севастьянова Г.А.. 2003 ISBN 5-7695-1965-7 ©Издательский центр «Академия». 2003
ПРЕДИСЛОВИЕ Настоящая книга представляет собой первый опыт создания учебника по молекулярной биологии для педагогических вузов. Не- обходимость такого издания связана с включением молекулярной биологии как обязательного предмета в Государственный образо- вательный стандарт обучения биологии. В соответствии с приня- тым стандартом авторами была составлена и опубликована Про- грамма по молекулярной биологии для педагогических вузов (2001), па основе которой и написан данный учебник. При подготовке книги авторы использовали свой многолетний опыт чтения курсов лекций по молекулярной биологии в Мос- ковском педагогическом государственном университете. Предла- гаемая книга не велика по объему и, естественно, не охватывает все содержание современной молекулярной биологии. Тем ис ме- нее в пей отражены наиболее фундаментальные достижения этой пауки, имеющей исключительно важное значение для познания живой природы. Освоение содержания книги требует определен- ной подготовки в области органической химии и биохимии, од- нако авторы, сохранив, насколько возможно, фундаментальный научный подход, старались сделать учебник доступным нс только для студентов вузов, по и для учителей и учащихся старших клас- сов специализированных школ, включив в пего, в частности, максимдпьное количество иллюстраций, облегчающих восприя- тие весьма непростых молекулярно-биологических понятий. В конце книги приведен список литературы, рекомендуемой читателям, которые заинтересованы в углубленном изучении отдельных воп- росов молекулярной биологии. Авторы надеются, что учебник поможет студентам получить необходимый минимум знаний по важному разделу современ- ной биологии, и будут искренне благодарны за все отзывы и по- желания.
ВВЕДЕНИЕ Молекулярная биология возникла во второй половине XX в. Название этой науки чаще всего связывают с именем У. Эстбюри, который в 1939 г. назвал себя «молекулярным биологом». Через два года он же получил первую рентгенограмму ДНК и тем са- мым положил начало изучению тонкой структуры «самой глав- ной молекулы», впервые выявленной Ф. Мишером еще в 1869 г. Первое официальное упоминание о молекулярной биологии, ве- роятно, принадлежит У.Уиверу, руководившему отделом естест- венных наук Рокфеллеровского фонда, который в 1938 г. написал: «В тех пограничных областях, где химия и физика пересекаются с биологией, постепенно возникает новый раздел науки — молеку- лярная биология, начинающая приоткрывать завесы над многими тайнами, окутывающими основные элементы живой клетки» (кур- сив наш. — Авторы). Таким образом было постулировано возник- новение нового направления современной биологии, которое ин- тегрировало усилия биологов, химиков и физиков в области изуче- ния объектов живой природы. Разработка тонких физических и химических методов анализа структуры и функций молекул, свойственных всем живым систе- мам и прежде всего клетке как элементарной и универсальной составляющей всех организмов, имела определяющее значение для рождения молекулярной биологии. Мощным стимулом для се раз- вития стали успехи и еще в большей мерс нерешенные проблемы биохимии, цитологии и генетики. Эти сформировавшиеся к сере- дине XX в. биологические пауки создали почву для молекулярной биологии, которая была призвана запяться изучением жизни па молекулярном уровне. Центром молекулярно-биологических исследований стали ра- боты в области изучения материальных основ наследственности, природы генов и механизмов передачи наследственных призна- ков из поколения в поколение. Именно под влиянием генетиков новой формации (Т. Морга- па, Н. К. Кольцова, Н. В. Тимофеева-Ресовского и др.) физики- теоретики и экспериментаторы, эмигрировавшие в копне 30-х годов из Европы в США, организовали там так называемую «фа- говую группу» во главе с М.Дельбрюком, которая нашит исслс- 4
дования в области молекулярного строения и мутагенеза вирусов и бактериофагов. Позднее эти работы были существенно развиты в нашей стране Б.Ф. Поглазовым, Н.А. Киселевым и другими уче- ными. Еще раньше В. А. Энгельгардт совместно с М.Н.Любимо- вой обосновали молекулярные механизмы мышечного сокраще- ния, а А. Н. Белозерский впервые выделил ДНК из растений, что также относится к фундаментальным вехам становления молеку- лярной биологии. Впоследствии именами этих замечательных уче- ных были названы крупнейшие научно-исследовательские цент- ры: Институт молекулярной биологии АН СССР им. В. А. Энгель- гардта и Институт физико-химической биологии им. А. Н. Бело- зерского. К началу 50-х годов XX в. в недрах биохимии были получены фундаментальные данные об элементарном строении белков и нуклеиновых кислот, включая сведения о способах организации гюлипептидных цепей белков, и, что особенно важно, о структу- ре нуклеотидов н закономерностях их количественного содержа- ния в молекулах ДНК и РНК (Э.Чаргафф). Именно указанные работы, а также биофизические исследования структуры ДНК, выполненные в Англин методом рентгеноструктурного анализа Розалиндой Франклин и Морисом Уилкинсом, вплотную подве- ли воспитанника «фаговой группы» Джеймса Уотсона и английс- кого физика Френсиса Крика к раскрытию молекулярной приро- ды генов и механизма их воспроизведения (репликации) в соста- ве ДНК. Создание модели двойной спирали ДНК и открытие принципа комплементарное™ стали важнейшим событием современной био- логии, вскрывшим фундаментальные принципы функциониро- вания живых систем и определившим дальнейшие направления исследований современной биологии. Современное естествозна- ние обязано именно молекулярной биологии тем, что в период с середины 50-х до середины 70-х годов XX в. с невероятной быст- ротой были раскрыты природа и основные пути передачи и реа- лизации генетической информации. Основополагающие открытия молекулярной биологии 1S69 — Ф. Митер (F.Micshcr) впервые выделил ДНК из лейкоцитов и молок лосося. 1935 — А. Н. Белозерский выделил ДНК из растений. 1939 — В.А. Энгельгардт открыл АТРазпую активность миозина. 1940 — У.Эстбюри (W.Astbury) получил первую рентгенограмму ДНК. 1944 — О.Т.Эвсрп (O.T.Avcry) установил, что ДИК (а нс белок, как полагали ранее) является носителем генетической информации. 1951 — Л. Полинг и Р.Корн (L.Pauling, R.Corey) обосновали суще- ствование основных типов укладки аминокислотных остатков в поли- нентидных цепях белков (а-спнраль и складчатый р-слой). 5
1953 — Дж. Уотсон и Ф. Крик (J. Watson, F. Crick) создали модель двой- ной спирали ДНК па основе рентгенограмм, полученных Р. Франклин и М.Уилкинсом (R. Franklin, М. Wilkins). 1953 — Ф.Сангер (F.Sangcr) расшифровал первичную структуру ин- сулина быка. 1956 — А. Корнберг (A. Kornberg) открыл ДНК-полимеразу. 1957 — А. Н. Белозерский и А.С. Спирин предсказали существование мРНК. 1960 — Дж. Ксдрыо (J. Kcndrcw) впервые описал трехмерную струк- туру миоглобина кашалота, а М.Псрутн (М. Pcrutz) — структуру гемо- глобина. 1960 — одновременно в нескольких лабораториях был открыт фер- мент транскрипции — РНК-полимсраза. 1961 — Ф. Жакоб и Дж. Моно (F. Jakob, J. Monod) разработали модель опсропа. 1965— 1967 — Р. Холли (R. Holley) выяснил первичную структуру ала- ниновой тРНК, а А.А.Баев — валиновой тРНК. 1966 — М. Ниренберг, С.Очоа и Х.-Г.Корана (М.Nirenberg, S.Ochoa, H.-G.Khorana) расшифровали генетический код. 1967 —М. Геллерт (М.Gellert) открыл ДНК-лигазу — фермент, спо- собный соединять фрагменты ДНК. 1970 — Г.Темин и Д. Балтимор (Н.Temin, D.Baltimor) открыли об- ратную транскриптазу (РНК-зависимую ДНК-полимеразу) в онкоген- ных вирусах. 1972 — П.Боэр, С. Коэн н П.Берг (Р. Boyer, S. Cohen. Р. Berg) разра- ботали технологию клонирования ДНК. заложили основы генетической инженерии. 1972 — X.-Г.Корана (H.-G.Khorana) осуществил химический синтез гена аланиновой тРНК. 1975— 1977 — Ф.Сангер (F.Sangcr), а также А. Максам и У. Гилберт (A. Maxam, W.Gilbert) разработали методы быстрого определения пер- вичной структуры ДНК. 1976 — Ф.Сангер (F.Sangcr) расшифровал нуклеотидную последова- тельность ДНК фага <рХ174. 1976 — У. Гилберт (W. Gilbert) открыл мозаичное строение генов эука- риот. 1976 — С. Ким, А. Рич и А. Клуг (S.Kim, A. Rich, A. Klug) определили третичную структуру тРНК. В результате выдающихся открытий Дж. Уотсона, Ф. Крика, X. -Г. Кораны, А. Корнберга и других крупнейших молекулярных био- логов, удостоенных нобелевских премий, уже в середине 60-х годов XX в. окончательно утвердился основной постулат молекулярной генетики, формулирующий магистральный путь реализации гене- тической информации в клетке: ДНК—- РНК—- Белок 6
Затем были детально изучены механизмы воспроизведения (реп- ликации) ДНК, транскрипции (биосинтеза РНК) и трансля- ции (биосинтеза белка). Параллельно развивались работы по изу- чению внутриклеточной локализации этих процессов, что при- вело к осознанию функционального значения внутриклеточных компонентов (ядра, митохондрий, рибосом и др.) и дало осно- вание Дж. Уотсону в 1968 г. для определения молекулярной био- логии: «Молекулярная биология изучает связь структуры биоло- гических макромолекул и основных клеточных компонентов с их функцией, а также основные принципы и механизмы саморе- гуляции клеток, которые опосредуют согласованность и един- ство всех протекающих в клетке процессов, составляющих сущ- ность жизни». Впоследствии центральный постулат молекулярной генетики был дополнен представлениями о существовании процесса обрат- ной транскрипции (о биосинтезе ДНК на матрице РНК) и реп- ликации РНК, что позволило придать ему следующий вид: Репликация Репликация /•"* Транскрипция Z"4 Трансляция ( ДНК __________? Г РНК------------ Белок Обратная 'ч— транскрипция Одновременно все более детализировались представления о строении и функциях белков, необходимых для катализа (фер- менты) и регуляции (регуляторные белки, пептидные гормоны) всех важнейших молекулярно-генетических процессов. Открытие и разработка методов целенаправленного использо- вания целого ряда ферментов (обратной транскриптазы, ДНК- рестрнктаз и др.) привели к созданию технологии получения ре- комбинантных ДНК, возникновению генетической инженерии, что стало поистине революционным событием в истории молеку- лярной биологии. В конце 70-х и начале 80-х годов XX в. молекулярная биология вступает в период расцвета. В это время выясняются механизмы сплайсинга (В. Келлер и др.), происходит открытие РНК-фермен- тов (рибозимов) и аутосплайсинга (Т.Чек), активно изучаются механизмы генетической рекомбинации и подвижные генетиче- ские элементы (Д.Хогпесс, Г. П. Георгиев), на новый уровень вы- холят работы в области структуры ферментов и биологических мембран (10. А. Овчинников), начинаются работы по расшифров- ке структуры геномов высших организмов (включая геном чело- века), создаются основы новых (генно-инженерных) биотехно- логий, обнаруживаются и синтезируются каталитически актив- ные антитела (абзи.мы), возникает белковая инженерия. 7
Постепенно молекулярная биология становится в центре наук, составляющих современную физико-химическую биологию: ।---Физико-химическая биология------1 Биофизика Молекулярная биология Биохимия U Биооргаиичсская химия Бурное развитие молекулярной биологии привело в начале 80-х годов XX в. к возникновению новой науки — биоинформатики (вычислительной биологии, компьютерной генетики), возникшей па стыке молекулярной генетики и информатики. Толчком к се возникновению послужило появление быстрых методов опреде- ления нуклеотидных последовательностей ДНК, разработанных в 1975— 1976 гг. Ф. Сангером и А. Коулсоном, а также А. Максимом и У. Гилбертом. В 1982 г. были организованы банки нуклеотидных последовательностей: Gen Bank в США и EMBL в Европе, в кото- рых концентрировалась информация о расшифрованных нуклео- тидных последовательностях ДНК различных организмов. Посте- пенно бионпформатика включилась в разработку ряда важных мо- лекулярно-биологических проблем, включая: статистический ана- лиз нуклеотидных последовательностей ДНК; предсказание фун- кций по первичной структуре биополимеров (ДНК, РНК и бел- ков); анализ (моделирование) пространственной структуры бел- ков и нуклеиновых кислот; теорию молекулярной эволюции и си- стематики. Прогресс в области определения нуклеотидных последователь- ностей (секвенирования) ДНК различных организмов, достигну- тый в конце XX в. (в 1995 г. был секвенирован первый бактериаль- ный геном, в 1997 г. — геном дрожжей, в 1998 г. — геном немато- ды, в 2000 г. — геном дрозофилы и почти полностью — геном человека), привел к возникновению геномики — науки, изучаю- щей наборы всех генов данного организма как единое целое. Од- новременно возникла протеомика — наука, исследующая полные наборы белков, функционирующих на различных этапах развития того или иного организма. В конце XX в. расширяются и становятся все более целенаправ- ленными в научно-практическом отношении задачи молекуляр- ной биологии, среди которых: • расшифровка структуры геномов; • создание банков генов; • геномная дактилоскопия; • изучение молекулярных основ эволюции, дифференциров- ки, биоразнообразия, развития и старения, канцерогенеза, им- мунитета и др.; 8
• создание методов диагностики и лечения генетических болез- ней, вирусных заболеваний; • создание новых биотехнологий производства пищевых про- дуктов и разнообразных биологически активных соединений (гормонов, антигормонов, релизинг-факторов, энергоносителей н др.) Начало нового тысячелетия ознаменовалось выдающимся со- бытием — расшифровкой нуклеотидной последовательности ге- нома человека, с которой связаны надежды на решение многих проблем человечества (коррекция наследственных заболеваний, продление жизни и т.д.). Таким образом, по праву считается, что XXI в. должен стать веком молекулярной биологии и новых биотехнологий, призван- ных освободить человечество от тяжкого груза болезней, пороков н лишений и заложить основы его будущего процветания.
Глава 1. МЕТОДЫ МОЛЕКУЛЯРНОЙ БИОЛОГИИ Молекулярная биология использует широкий арсенал биоло- гических, физических и химических методов, одни из которых достались ей «в наследство» от наук-предшественниц (биохимии, цитологии, генетики и др.), а другие были созданы в процессе ее собственного развития специально для работы с молекулярными объектами. Ниже приведен перечень ряда наиболее широко ис- пользуемых методов и отмечены области их применения. Микроскопия — имеет давнюю историю, начиная с XVII в., когда в 1611 г. Й. Кеплер предложил принцип создания светового микроскопа, а А.Левенгук впервые наблюдал с его помощью од- ноклеточные бактерии (1638). Именно световая микроскопия, име- ющая предел разрешения 0,4 —0,7 мкм, позволила М.Шлейдену и Т. Швану в 1838 г. создать клеточную теорию, согласно кото- рой клетка, содержащая ядро, является структурной и функци- ональной единицей строения всех животных и растений. Затем Р. А. Колликер впервые в 1857 г. описал митохондрии, а В.Флем- минг — поведение хромосом при митозе. В развитии микроскопии существенными вехами стали изобре- тения интерференционного (1930), фазово-контрастного (1932) и, наконец, электронного микроскопов (1939). Электронная микроскопия, позволяющая обычно различать объекты размером около 20 А (2 нм) и имеющая в наиболее со- временных моделях электронных микроскопов предел разреше- ния до 0,1 нм, нашла самое широкое применение для изучения структур вирусов, внутриклеточных органелл, белково-нуклеино- вых комплексов (хроматин, рибосомы, ипформосомы) и отдель- ных белковых молекул. Один из вариантов этого метода — крио- электронная микроскопия — является в настоящее время веду- щим при изучении тонкой структуры рибосом. Наиболее впечатляющие и информативные трехмерные (объем- ные) изображения клеточных структур позволяют получить ска- нирующие электронные микроскопы (рис. 1). Рентгеноструктурный анализ — основан на дифракции рентге- новских лучей (электромагнитного излучения с длиной волны около Ю'10 м); позволяет выявить трехмерное расположение ато- мов в молекулах (разрешение составляет менее 0,1 нм). Метод был 10
5 мкм Рис. I. Примеры изображений, получаемых методом электронной микро- скопии: А — электро!шан микрофотография фаговых частиц (х200000). Слева направо: (|к1Г <рХ 174. имеющий форму икосаэдра, вирус табачной мозаики (палочкообразная частица) и фаг Tq; Б — полученная с помощью сканирующего электронного мик- роскопа фотография полиморфноядерного лейкоцита. поглощающего посредством фагоцитоза дрожжевую клетку разработан в Англии Г. Брэггом и Л. Брэггом, и именно с его по- мощью были получены основополагающие сведения о структуре молекул белков, ДНК и РНК. В наше время этот метод в сочетании с компьютерным анали- зом полученных данных является ведущим для изучения трехмер- ной структуры биополимеров. Радиоактивные изотопы — широко используются для изучения нуклеиновых кислот, белков, углеводов и других молекул в жи- вой клетке. Радиоизотопы нестабильны и подвергаются спонтан- ному распаду, при котором либо высвобождаются заряженные частицы — электроны, либо происходит гамма-излучение. Пери- од полураспада варьирует от короткого, как, например, у изото- па ’2Р (14 сут), до очень протяженного, как у МС (5570 лет). Элек- троны определяют по ионизации газа в сцинцилляционном счет- чике или счетчике Гейгера, либо методом радиоавтографии (по их воздействию на серебро, содержащееся в чувствительном фо- тоэмульсионном слое). Радиоактивные молекулы используются при изучении самых разнообразных внутриклеточных процессов: синтеза молекул из их предшественников, определения внутриклеточной локализа- ции молекул, времени их функционирования в клетке и ее от- дельных компартментах, химических превращениях в отдельных участках макромолекул и т.д. Если, например, инкубироватьклетки с радиоактивным предшественником РНК (3Н-уридином), то II
о II о II О ’О-Р-О-Р-О-Р-О-СН, I I I I О' O’ 0 W НС- он ATPLI4CJ NH, I ’ XL ,С, * С N НС п I 'м^С. >СН о. I* N -СН он О II ’О-Р-О-Р-О-Р-О-СН I О’ I О’ NH, I ‘ xi х-С^. //7 CS6 ,N ИСя„ II, b \’-С? з«СН N N 1 I >- 0 Г\Н не- он АТР[2,8-3Н] °\| V/f —с н I н о II ’О-Р-О-Р-О-Р-О-СН 7 I ~ О’ PI О’ NH, I хг f, С ' N НС И I \,-С. «сн N N Ч I >- о’ с н Н , он о о о о о -fi н АТР|у-12Р| Рис. 2. Три радиоактивные формы АТР. Радиоактивные атомы выделены жирным шрифтом. Приведены обозначения, указывающие расположение и тип радиоактивных атомов можно определить, что РНК синтезируется в ядре, а затем пере- ходит в цитоплазму клеток. Радиоактивную метку можно вводить в изучаемые молекулы с помощью ферментов. Так, с использова- нием фосфотрансфераз и нуклеотидилтрансфераз можно вводить метку в белки, углеводы и нуклеиновые кислоты, используя для этого различные радиоактивные формы АТР (рис. 2). Ультрацентрифугирование (седиментационный анализ) — по- лучило широкое распространение после изобретения в 1926 г. Т. Сведбсргом аналитической ультрацентрифуги, е помощью ко- торой он впервые определил молекулярную массу гемоглобина 12
(68 кДа). В этом методе скорость седиментации (осаждения) опре- деляется размером и формой разделяемых компонентов и выража- ется коэффициентом седиментации 5. Коэффициент седимента- ции измеряется в секундах и определяется по формуле: (dx/dtj/vPx, где х — расстояние от центра вращения (радиус ротора центрифу- ги (см), определяемый от оси вращения до дна центрифужной пробирки); dx/dt — скорость седиментации (см/с); w — угловая скорость вращения ротора (рад/с). Коэффициенты седиментации обычно представляют собой очень малые значения и поэтому вы- ражаются в единицах Свсдберга (S): IS = 1 • 10“13 с. Коэффициент седиментации молекулы гемоглобина составляет 4,5 S, молекулы тРНК — 4S, рибосомы кишечной палочки — 70S, лизосомы — 9400 S. В 40 —50-е годы XX в. А. Клод и Ж. Браше разработали метод дифференциального центрифугирования для разделения органелл клетки, с помощью которого де Дюв (de Duvc) в 1953 г. впервые выделил лизосомы, а затем — пероксисомы. В 1957 г. М.Месель- соп, У.Сталь и Дж. Виноград разработали метод центрифугирова- ния в градиенте плотности хлористого цезия для разделения нук- леиновых кислот, с помощью которого было установлено, что репликация ДНК осуществляется полукопсервативным путем (см. гл. 7). Различные варианты метода ультрацентрифугирования ши- роко используют в молекулярно-биологических исследованиях для выделения внутриклеточных компонентов и макромолекул (нук- леиновых кислот и белков), а также определения их молекуляр- ных масс и коэффициентов седиментации. Для более тонкого фракционирования и очистки разнообраз- ных молекул и прежде всего белков в настоящее время применя- ется большая группа разнообразных физико-химических методов. Рассмотрим только наиболее широко распространенные методы фракционирования белков: хроматографию, электрофорез и изо- элсктрофокусированис. Методы исследования структуры и функ- ций нуклеиновых кислот изложены в последующих главах. Хроматография — метод, впервые изобретенный русским уче- ным М.С. Цветом, который в 1906 г. фракционировал окрашен- ные экстракты листьев растений на колонках с порошком мела. В настоящее время существует большое количество вариантов хроматографии, в которых используют матриксы (носители) раз- ных типов, позволяющие разделить белки по заряду (ионообмен- ная хроматография), размеру молекул (гель-хроматография, чаше называемая гель-фильтрацией) или способности специфически взаимодействовать с определенными химическими группами ве- ществ, предварительно связанных с матриксом (аффинная хро- матография). Из всех вариантов хроматографии наибольшей эф- фективностью обладает аффинная хроматография (хроматография по сродству), в основе которой лежит специфическое взаимодей- 13
отвис (узнавание) молекул взаимодействующих веществ. Напри- мер, предварительно связав с матриксом субстрат фермента, можно добиться избирательного удерживания фермента на колонке, а за- тем после выхода остальных («балластных») белков элюировать его в практически гомогенном состоянии. Матрикс можно оснастить и специфическими антителами и использовать такой носитель для выделения белков, распознаваемых этими антителами. Связав с матриксом фрагменты ДНК, можно выделить белки, специфи- чески связываемые с определенными участками хромосом. Широкое распространение получила также высокоэффектив- ная жидкостная хроматография (HPLC). В этом методе использу- ются специально разработанные кремнийорганическне смолы, способные образовывать гомогенную среду в форме микросфер диаметром 3—10 мкм и позволяющие при высоком давлении осу- ществить быстрое равномерное протекание растворителя через колонку, при котором весь процесс хроматографии занимает счи- танные минуты и обеспечивает тонкое фракционирование смеси анализируемых молекул. Электрофорез — в основе этого метода лежит способность бел- ков, обладающих определенным суммарным положительным или отрицательным зарядом, перемещаться в электрическом поле в соответствии с величиной заряда, размером и формой молекул. Электрофорез можно проводить в водном (буферном) растворе, однако, как правило, его проводят в каком-либо пористом (поли- мерном) носителе: крахмальном, агарозном или полиакриламид- ном геле, на целлюлозных или нитроцеллюлозных пластинах и т.д. Простейший метод электрофореза на пластинах целлюлозы был использован В.Ингрэмом в 1956 г. при фракционировании фраг- ментов протеолитического расщепления гемоглобина человека, полученных в результате обработки этого белка трипсином. С по- мощью данного метода были получены пептидные карты — «фин- герпринты» (отпечатки пальцев), по которым было установлено, что заболевание серповидноклеточной анемией обусловлено за- меной одной-единствепной аминокислоты в р-цепи гемоглобина. Наиболее часто в настоящее время для разделения белков ис- пользуют метод электрофореза в полиакриламидном геле (ПААГ), который представляет собой инертный матрикс с высоким и кон- тролируемым числом поперечных сшивок. Варьируя размеры ге- левых пор, можно фракционировать белки, существенно отлича- ющиеся по молекулярной массе (от нескольких десятков тысяч до сотен тысяч дальтон). Метод был разработан в 1959 г. С. Рэймон- дом, а затем усовершенствован Б.Дэвисом и Л.Орнстейиом. Он позволяет осуществить тонкое фракционирование смесей белков, отличающихся по заряду и молекулярной массе. Дальнейшей мо- дификацией этого метода ста.’! электрофорез в ПААГ с додецилсуль- фатом натрия, предложенный в 1966 г. Дж. Майзелем. Додецил- 14
Белок пз двух полнпептидных цепей, связанных дисульфидным мостиком Белок из одной полипсптид- ной цени Б Обрабо тка ДСН п |3-мсркаптоэтанолом А ВТ Б В О CH.-(CH,),-0-S-0Na' 6‘ Долсшшсульфат натрия (ДСН) HS-CH,-CH,-OH |>-Мсркаптоэтанол А В Пластина ПААГ после электрофореза и окрашивания А Рис. 3. Электрофорез белков с додецил- сульфатом натрия: А — обработка белков ДСН и (3-меркапто- этаполом, приводящая к разрыву ковалент- ных (дисульфидных) связей между отдель- ными пазипептилиыми цепями, вызываю- щая разворачивание белковых глобул и со- общающая нм избыточный отрицательный заряд (при электрофорезе такие денатури- рованные белки перемещаются к аноду со скоростью, обратно пропорциональной раз- меру (массе) их полнпептидных цепей); Б — электрофореграмма, полученная в резуль- тате фракционирования растворимых белков листьев различных видов картофеля мето- дом электрофореза в шьтпакрпламплиом геле с ДСН: 1—9 — различные виды картофеля; М — маркеры молекулярной массы Да о 205 — _ -ai П61НЮ-* - - 97 4011-— 66000- — ” 45 ООО-— " - - - 36 ООО - _ " ~ Z ~ 39 000- — ~ _ ’4 000 :______ ’ОООО- - — 2 ~ 14’00- Z — - М ( 2 3 4 5 6 7 Я 9 © Б сульфат натрия (ДСН, SDS, ДС-Na) представляет собой мощ- ный ионный детергент, который вызывает разворачивание бел- ковых молекул в вытянутые цепи и сообщает им избыточный от- рицательный заряд (рис. 3, А). Потерявшие нативную форму белки в таком (денатурирующем) геле перемещаются к положительно заряженному электроду (аноду) со скоростью, которая детерми- нируется только размером (массой) их полнпептидных цепей. При этом гель, выступая в роли молекулярного сита, легче пропускает некрупные полипептиды и в большей мере тормозит продвиже- 15
ние более крупных молекул, тем самым разделяя белки в соответ- ствии с их молекулярными массами (рис. 3, Б). При электрофоре- зе с SDS обычно используют также обработку белков 0-меркапто- этанолом, разрывающим (восстанавливающим) дисульфидные связи между субъединицами белков, что позволяет определить число и массу субъединиц в белках-мультимерах. После электро- фореза белки выявляют либо красителем Кумасси, либо серебре- нием (минорные белки), что позволяет выявить на электрофоре- граммах ничтожные количества (около 10 нг) белка. В начале 70-х годов XX в. в Швеции был разработан новый ме- тод разделения белков в электрическом поле, получивший назва- ние изоэлектрофокусирования. В отличие от метода электрофоре- за, в процессе которого белки фракционируют при каком-то оп- ределенном значении pH, задаваемом электрофоретическим бу- ферным раствором, при изоэлектрофокусировании белки разде- ляют в градиенте pH, создаваемом с помощью специальных реа- гентов (амфолипов). В процессе изоэлектрофокусирования белки передвигаются в электрическом поле в строгом соответствии только с зарядом молекул и останавливаются (фокусируются) в тех точ- ках градиента pH, которые соответствуют их изоэлектрическим точкам (pl), т.е. там, где молекулы становятся электронейтраль- ными (рис. 4). Изоэлектрофокусирование позволяет нс только ис- ключительно тонко разделить белки по заряду (разделяются бел- ки, отличающиеся по р! всего на 0,005 единиц pH), но и быстро и точно определить их изоэлектрические точки. Разработанное в 1975 г. П.Офареллом сочетание методов изо- электрофокусирования и электрофореза в ПААГ с SDS получило Рис. 4. Разделение белков методом изоэлсктрофокусирования. При низких значениях pH белки заря- жены положительно (+). при высоких значениях pH — отрицательно (-). В элек- трическом поле молекулы белков миг- рируют к противоположно заряженным полюсам и останавливаются в тех точ- ках градиента pH, которые соответству- ют их изоэлектрическим точкам (/>/). Изоэлектрические точки белка I и бел- ка 2 находятся при pH 6,0 и 8.0 соот- ветственно 16
Изоэлектрическое фокусирование Рис. 5. Ралноавтограмма, иллюстрирующая результат разделения белков кишечной палочки с включенными в них иС-аминокислотами методом двумерного элскт рофореза. Па радноавто! раммс. полученной наложением на пластину полиакриламидного геля фотографической пленки, можно рапичпть свыше 1001) пятен. coornei- стнуюпшх отдельным полипентилным цепям белков название двумерного электрофореза. В этой процедуре белки вна- чале обрабатывают 0-меркаптоэтанолом и мочевиной, что приво- дит к их полному растворению, денатурации и диссоциации по- липептидных цепей без изменения заряда. Далее проводят изо- электрофокусирование в ПААГ. разделяя белки по заряду, а за- тем (в перпендикулярном направлении) ведут их электрофорез в блоке ПААГ с SDS. при котором белки разделяются по молеку- лярной массе. Таким образом, сочетая топкое разделение вначале по заряду, а затем по размеру (массе), удается за один раз разде- лить до 2000 полипептидных цепей, т.с. проанализировать боль- шинство всех белков бактериальной клетки (рис. 5). Культура клеток — этот метод берет начало с 1885 г., когда впервые было обнаружено, что клетки куриного эмбриона сохра- няют жизнеспособность в солевом растворе. С 1007 г. стали исполь- зовать культуры фрагментов тканей (эксплантантов). В настоящее время используют диссоциированные культуры клеток, из кото- рых можно получить клетки одного тина. Иногда в культуре кле- ток появляются мутанты, которые могут бесконечно размножать- ст- 17 ся и образовывать клеточную лини^ъ В отличие от раковых кле- ток, также способных к непрерывгийу/^^^и^^Т БИБЛИОТЕКА
ки лучше растут в контакте с какой-то поверхностью. Клеточные линии служат источником большого количества клеток одного типа и к тому же могут храниться при -70 °C неопределенно долго, не теряя способности к пролиферации. Наиболее часто используют- ся клеточные линии фибробластов мышеи и хомячков, а также эпителиальные клетки человека. В 1952 г. была получена перевива- емая до сих пор линия клеток карциномы шейки матки человека, широко известная как линия HeLa. Однородность клеточных линий можно повысить путем клони- рования. Клон — это популяция клеток, происходящая от одной клетки-прсдшествепиицы. С помощью клонирования выделяют мугантныс клеточные линии, у которых мутация затронула опре- деленные гены. Такие клетки бывают нередко дефектны по како- му-то определенному белку, что позволяет проанализировать его функцию в нормальных клетках. Слиянием двух клеток могут быть получены гетерокарионы — клетки с двумя отдельными ядрами. После митотического деле- ния гетерокарион превращается в гибридную клетку, у которой все хромосомы объединяются в одном ядре. Такие гибридные клет- ки дают возможность изучать функции отдельных хромосом, вза- имодействие внутриклеточных компонентов (митохондрий, ядер и др.) различных клеток. Их можно клонировать и получить гиб- ридную клеточную линию. Существенно, что гибридные клетки нестабильны. В частности, гибридные клетки человек-мышь по- степенно утрачивают хромосомы человека, что позволяет судить о функциях отдельных хромосом, осуществляя таким образом их генетическое картирование. Бесклеточные системы — незаменимы для изучения механиз- мов определенных молекулярных процессов, так как исключают различные побочные реакции, протекающие в клетке. В 1954 г. П.Замечппк получил первую бесклеточную систему для изучения биосинтеза белка (трансляции). Возможности этих систем были далее блестяще использованы А. С. Спириным, М. Номурой и дру- гими исследователями для изучения деталей трансляции. При этом из экстрактов клеток выделяли важнейшие компоненты бслок- спнтезирующей системы (мРНК, рибосомы, тРНК и др.), а за- тем последовательно вводили их в систему и уточняли роль каж- дого компонента в биосинтезе белка. С помощью бесклеточных систем был расшифрован генетический код, для чего в качестве мРНК использовали синтетические олиго- и полинуклеотиды из- вестного состава. Бесклеточные системы используются также для изучения деталей других важнейших молекулярно-генетических про- цессов: репликации и транскрипции ДНК, сплайсинга РНК и др. Моноклональные антитела — очень чувствительный инструмент выявления (идентификации), молекул в сложных смесях, и по- этому они цододят очень широкое применение в молекулярной 18
биологии. Антитела в целом представляют собой белки (иммуно- глобулины), вырабатываемые позвоночными животными для за- щиты от чужеродных соединений — антигенов. Клетки позвоноч- ных животных способны синтезировать колоссальное количество (10s) различных форм антител, отличающихся участками узнава- ния антигенов. Именно высокая специфичность антител опреде- ляет их уникальные возможности для выявления различных моле- кул в клетке. Разработанный в 1976 г. метод включает клонирова- ние В-лимфоцитов, секретирующих только определенный вид ан- тител, благодаря чему эти антитела можно получать в больших количествах. Но время жизни В-лимфоцитов в культуре невели- ко, поэтому проводят их слияние с клетками, происходящими от «бессмертной» опухоли, также полученной из В-лимфоцитов. Из образовавшейся смеси клеток отбирают гибриды, способные раз- виваться в культуре и синтезировать антитела определенного вида. Эти гибридные клетки называют гибридомами. Их клонируют по отдельности и получают клоны, каждый из которых является ис- точником моноклональных антител. Моноклональные антитела происходят от одной-единственной клетки и обладают абсолют- ной специфичностью к белкам: они способны узнавать опреде- ленную конфигурацию группы из 5 —6 аминокислотных остатков. Каждый тип антител можно далее использовать в качестве зонда для определения локализации белка в клетке и для очистки бел- ков в аффинной хроматографии. В недалеком будущем монокло- нальные антитела могут стать источником для создания новой группы каталитически активных молекул — абзимов (см. гл. 2). Каталитически активные белки (ферменты) — важнейшие ин- струменты биохимических методов исследования. Они нашли ши- рокое применение в молекулярной биологии, и конкретные при- меры их использования будут приведены в последующих главах.
Глава 2. БЕЛКИ Белки представляют собой биополимеры (полипептиды), состав- ленные из аминокислотных остатков, соединенных пептидными связями. Белки — самый распространенный в живой природе класс био- полимеров, составляющий большую часть сухого вещества жи- вотных (50—80%) и, что самое главное, обладающий наиболь- шим по сравнению со всеми другими веществами органической природы разнообразием структуры и функций. Именно белки оп- ределяют в конечном счете фенотип любого организма, форми- руют облик всех живых систем. И хотя их строение запрограмми- ровано нуклеотидной последовательностью соответствующих ге- нов, в структурном и функциональном отношении белки несрав- ненно более вариабельны, челг кодирующие их полинуклеотиды (ДНК и РНК). Эта особенность белков проистекает из внутренне- го разнообразия составляющих их мономерных звеньев — амино- кислот. Число постоянно встречающихся в живых организмах ами- нокислот (20 так называемых канонических, или белковых, ами- нокислот) в четыре раза больше, чем число канонических нукле- отидов (A, G, Т, С, U), образующих молекулы нуклеиновых кис- лот, и поэтому «язык» белков оказывается намного богаче «язы- ка» нуклеиновых кислот. Белки участвуют во всех без исключения молекулярно-биоло- гических процессах. Обладая прежде всего ярко выраженной ката- литической способностью, они в качестве ферменшов детермини- руют интенсивность всех метаболических процессов в клетке и организме в целом. Разнообразные регуляторные белки контроли- руют своевременность и точность основных молекулярно-генети- ческих процессов (белки-регуляторы репликации, транскрипции и трансляции). Белки являются непременным компонентом всех биологических мембран, составляют основу цитоскелета, входят в состав соедини тельных тканей, волосяного покрова, т. с. обеспе- чивают «строительную» функцию (структурные белки). Они же осуществляют иммунологическую защиту от чужеродных соеди- нений и патогенных микроорганизмов (защитные белки-иммуно- глобулины), обеспечивают снабжение организма кислородом и разнообразными питательными веществами (транспортные бел- 20
ки). Особая группа полипептидов контролирует физиологическую активность тканей и органов (белки-гормоны). Белки формируют ионные каналы и осуществляют восприятие, трансформацию и передачу разнообразных внешних сигналов (белки-рецеппюры). Все виды движения, начиная с движений жгутиков бактерий и кон- чая движениями пальцев пианиста, обеспечиваются работой «бел- ковых моторов» (сократительные белки). Таков далеко не полный перечень функций белков. Уникальные свойства белков заложены в колоссальном разнообразии пространственного строения их молекул. Это разнообразие определяется огромным числом воз- можных сочетаний аминокислотных остатков в длинных, состоя- щих, как правило, из нескольких сотен остатков, полипептидных цепях белков. Далее, по мере рассмотрения уровней структурной организации белков, будут приведены конкретные примеры вза- имосвязи их структуры и функций. АМИНОКИСЛОТНЫЙ СОСТАВ БЕЛКОВ Аминокислоты, участвующие в образовании белков, имеют общую формулу: H?N—CH—СООН, где R — боковая цепь (радикал) R Формулы радикалов 20 канонических аминокислот (1S амино- кислот и двух амилов — аспарагина и глутамина) представлены в табл. 1, где приведены также их обычно используемые трехбук- Таблица I Протеиногспные аминокислоты и амиды Аминокислота Структуры боковой лепи (радикал) Сокращенное обозначение Ал ифатнческпе Глинин -Н Gly, G Алании -сн3 Ala, А Валин —сн^сн’ Vai, V Лейцин -СН- -си-снс^7 С.Г1} Leu, L Изолейцин СН3 —сн-сн2-сн3 He, I 21
Продолжение табл. 1 Аминокислота Структуры боковой цепи (радикал) Сокращенное обозначение Фенилаланин Тирозин Триптофан Ароматические —н2с— —Н;С-н^ У~0Н Н2С1 jO 1 Н Phe, F Туг, Y Тгр, W Лизин Аргинин Гистплип Основн ыс (несущие положительный заряд) -CH2-CH2-CH2-CH2-NH3T -сн-си-ch-nh-c-nh2 II NHf Н2С । 1 HN^NH+ (при pH 6,0) Lys, К Arg, R His, Н Аспарагино- вая кислота Глутаминовая кислота Ди карбоновые (несущие отрицательный заряд) -СН,-СОО" -СН2-СН2-СОО“ Asp, D Glu, E An Аспарагин Глутамин иды ди карбоновых а мп и о кнсл -CH=-C?NH1 -сн.-сн-с^,,, от Asn, N Gin, Q Цистеин Метионин Серосодержащие -CH2-S -CH2-CH2-S-CH3 Cys, C Met, M 22
Окончание табл. 1 Аминокислота Структуры боковой цепи (радикал) Сокращенное обозначение Содержащие гидроксильную группу (аминокисл оты-спирты) Серин -СН,-ОН Ser, S Треонин -СН-СН, 1 ОН Tlir, Т Пролин L J-соон ‘| н (формула приведена полностью) Pro, Р венные и однобуквенные сокращенные обозначения (в дальней- шем будут использоваться более легко запоминающиеся трехбук- венные символы). Все постоянно встречающиеся в белках (протеиногенные) аминокислоты содержат две разные химические группы: аминог- руппу (—NH?) и карбоксильную группу (—СООН), способные реагировать с образованием пептидной связи: H,N-CH-C-OH 4- HjN—СН—СООН I L--------Jl I R HR 5=. FEN—CH—C—N—CH—СООН + H,0 III R H R Пептидная связь в дппептиде В водной среде равновесие такого типа реакций сдвинуто в сто- рону образования свободных аминокислот, и поэтому биосинтез полипептидов в клетках ис сводится к простому отщеплению воды, а протекает по более сложному энергоемкому механизму с уча- стием специфических внутриклеточных частиц (рибосом) и мак- роэргических соединений (см. гл. 11). Единственной протеиногенной аминокислотой, не имеющей свободной аминогруппы, является пролин. Не имеет ее и содер- жащееся в некоторых белках производное пролина — оксипролин. 23
Пролин и оксипролин иногда называют иминокислотами, жест- кая конформация которых вызывает изгибы в полипептидных це- пях белков. Связанные в результате биосинтеза в длинные полипептидпыс цепи аминокислоты присутствуют в белках в виде аминокислот- ных остатков, молекулярная масса которых варьирует от 57 до 186 Да (среднее значение принято 110), и, таким образом, белок с молекулярной массой 44000 Да содержит примерно 400 амино- кислотных остатков. Кроме амино- и карбоксильных групп в ами- нокислотах содержатся также боковые цепи, не участвующие в образовании пептидных связей и называемые радикалами. Хими- ческая природа радикалов весьма разнообразна, что позволяет им вступать в различные (в большинстве случаев нековалснтныс) вза- имодействия по мере синтеза и формирования пространственной структуры белковой молекулы. Именно последовательность рас- положения радикалов определяет особенности пространственной (трехмерной) структуры белков и соответственно их функцио- нальные свойства. Аминокислоты, образующие белки, можно рассматривать как производные карбоновых кислот. Они являются «-аминокислота- ми, так как аминогруппы в них связаны с а-углсродным атомом. Сходные с а-аминокислотами во многих отношениях и также встречающиеся в природе 0-аминокисдоты, тем не менее, обыч- но не входят в состав природных полипептидов, очевидно, в силу того, что полииептидная цепь, содержащая 0-аминокислотные остатки, имела бы ковалентные связи типа Са—Ср, которые до- пускают дополнительную подвижность (вращение), затрудняющую самопроизвольное свертывание цепи в регулярные структуры, свойственные природным белкам (см. ниже). Вероятно, поэтому в ходе эволюции отбор был направлен на преимущественное со- хранение а-аминокислот. Для аминокислот характерна оптическая изомерия, однако в белках присутствуют, как правило, L-аминокислоты, и L-конфп- гурация, по всей видимости, была отобрана случайно. D-формы аминокислот обнаруживаются в составе пептидов достаточно ред- ко. Они выявлены, например, в клеточных стенках бактерий си- бирской язвы (D-Glu), а также в составе пептидов кожи одного из видов южноамериканских лягушек, в которых найден D-Ala. Единственной белковой аминокислотой, не обладающей оп- тической активностью, является глицин, не имеющий хиралыю- го углеродного атома. У глицина в качестве радикала выступает атом водорода, и само понятие радикал в данном случае имеет условный характер. Отсутствие радикала приводит к тому, что G 1у увеличивает подвижность полипептидной цепи в белках и одно- временно (из-за малого размера) способствует ее плотной упа- ковке. Остальные аминокислоты содержат в качестве радикалов 24
разнообразные по химическому строению и свойствам группи- ровки, по которым их обычно и классифицируют. К аминокислотам с алкильными радикалами относятся аланин, валин, лейцин и изолейцин (последний содержит 2 хиральных центра и соответственно имеет 4 оптических изомера). Аланин — самая распространенная в природе аминокислота, содержание которой в белках обычно максимально, вероятно, в силу просто- ты се строения и доступности для синтеза клеточными фермента- ми. Разветвленные объемные и «жесткие» радикалы Vai, Leu и Не, в свою очередь, существенны для гидрофобной стабилизации бел- ковых тел. В группу ароматических аминокислот входят фенилаланин, ти- розин и триптофан. Крупные неполярные остатки Phe и Тгр на- ряду с Vai, Не и Pro располагаются преимущественно внутри бел- ковых молекул. Тирозин содержит функционально активную группу ОН, протон которой легко диссоциирует, что способствует обра- зованию водородных связей. Поэтому тирозин, относящийся к полярным незаряженным аминокислотам (к ним относятся также серии, треонин, глутамин, аспарагин и цистеин), участвует в образовании многочисленных водородных связей между боковы- ми цепями аминокислотных остатков при формировании уникаль- ных пространственных структур белков. По той же причине остат- ки Туг, Ser и Cys часто выступают в виде функционально актив- ных групп при ферментативном катализе. Гидроксильные группы, свойственные серину и треонину, способны образовывать эфиры с фосфорной и рядом органических кислот. Поэтому, в частно- сти, функционально важное фосфорилирование ряда белков осу- ществляется чаще всего но остаткам данных аминокислот. Серии, как и тирозин, присутствует в активных центрах ряда ферментов. По гидроксильным группам Ser и Туг происходит присоедине- ние к белкам углеводных компонентов (гликозилирование), что имеет место при синтезе сложных белков — гликопротеинов. Цистеин и метионин составляют группу серосодержащих ами- нокислот. Характерной особенностью остатков Cys является их способность к самопроизвольному окислению в присутствии кис- лорода с образованием «двойной» аминокислоты — цистина. В бел- ках это ведет к возникновению поперечных ковалентных связей между полипептидными цепями либо внутри одной полипептид- ной цепи. Так возникают дисульфидные мостики'. Cys—СН,—SH HS—СН,—Cys —сн,—s—s—сн,— Содержание Cys особенно высоко в особой группе белков, спо- собных связывать атомы тяжелых металлов — металлотионеинах (см. ниже). 25
Следует помнить, что аминокислоты в водной среде живых клеток представляют собой биполярные ионы (цвиттерионы): . V Р H3N-C-C-0 R Поэтому большинство аминокислот, будучи моноамипомоно- карбоновыми кислотами, не обладают сколько-нибудь выражен- ным зарядом вблизи нейтральных значений pH. К заряженным аминокислотам относят те из них, которые содержат дополни- тельные заряженные группы в боковых цепях (радикалах). Так, к аминокислотам, обладающим кислотными свойствами, относят- ся аспарагиновая и глутаминовая, имеющие при нейтральном значении pH отрицательный заряд благодаря наличию в их ради- калах карбоксильной группы. К. заряженным положительно (ос- новным) аминокислотам относятся лизин, аргинин и гистидин. Заряженные остатки Lys и Arg могут эффективно связывать фос- форные остатки, что лежит в основе взаимодействия положительно заряженных белков хроматина (гистонов) с молекулами ДНК (см. гл. 9). Гистидин содержит гетероциклическую (имидазольную) груп- пу, которая в физиологическом интервале значений pH может выполнять роль акцептора протона. Поэтому His присутствует в активных центрах многих ферментов, где выполняет роль «про- тонной помпы». В настоящее время пока невозможно однозначно объяснить, почему именно рассмотренные аминокислоты были отобраны в ходе эволюции для построения большинства белков. Простые но строению Gly, Ala, Glu, Ser. Asp считаются более древними в эволюции в отличие от сложных аминокислот, таких, как Asn, His. Кроме вышеохарактеризованных 20 канонических аминокис- лот в белках встречаются и другие аминокислоты, одна из кото- рых, селеноцистеин, содержит атом селена: H-.N— CH- СООН I СН, I ' Sc И Селеноцистеин обнаружен у самых разных организмов — от ар- хибактерий до человека — в составе ряда каталитически активных белков (глицин-редуктазы, глутатион-пероксидазы, 5-деиодиназы и др.) п рассматривается в последние годы как 21-я белковая ами- нокислота. Недавно открытые особенности синтеза, кодирования и вклю- чения селеноцистеина в полипептидные цепи белков будут рас- смотрены в гл. 11. 26
ПЕПТИДЫ «-Аминокислоты представляют собой мономерные блоки, из которых строятся белки. Впервые это было доказано Э. Фишером, синтезировавшим в начале XX в. короткие пептиды, состоящие из нескольких аминокислотных остатков. В 50-х годах XX в. Р. Мерри- фильд разработал технологию твердофазного синтеза полипепти- дов для получения полноразмерных белковых молекул, имеющих в своем составе более сотни аминокислотных остатков. Так впер- вые был синтезирован каталитически активный белок — рибо- нуклеаза, состоящая из 124 аминокислотных остатков, а затем и другие функционально активные молекулы белков, что стало аб- солютным доказательством полипсптидной теории их строения. Таким образом, полипептидные цепи белков состоят из ами- нокислотных остатков, связанных пептидными связями. Структу- ра пептидной связи приведена на рис. 6. Ее параметры (межатом- ные расстояния и валентные углы) были определены Л. Полин- гом и Р. Кори на кристаллических структурах молекул, содержа- щих одну или несколько пептидных связей. Оказалось, что рас- стояние между атомами С и N (0,132 нм) меньше обычного, тог- да как связь С—О длиннее, чем в обычных органических соеди- нениях (альдегидах и кетонах). Полинг и его сотрудники объяс- няли это наличием резонанса двух предельных структур пептид- ной связи: Пептидная связь имеет, таким образом, частично двойной ха- рактер и состоит на 60 % из формы (1) и на 40% из формы (2). В белках наиболее распространена w/мнс-пептидная связь, пред- ставленная на рис. 6, вращение вокруг которой заторможено, и шесть атомов (С, О, N, Н, а также С, и С2) находятся в одной плоскости, из чего следует, что полипептид можно рассматривать как цепочку из связанных между собой плоских звеньев. Цис-пеп- тидная связь менее распространена и чаще всего образуется при атоме азота пролина: I -С,- C-N II О Цис-связн обнаружены в ряде природных циклических пептидов. Хотя полипептидная цепь имеет обычно одну свободную амино- 27
Рис. 6. Строение пептидной группы. Указаны межатомные расстояния, а также длина водородной связи, образуемой с соседней пептидной группой. Вее атомы внутри пунктирной рамки лежат при- мерно в одной плоскости группу па одном конце (N-конец) и одну свободную карбоксиль- ную группу на другом конце (С-консц), иногда эти группы свя- зываются одна с другой, что и приводит к образованию цикли- ческого пептида. Циклическое строение имеют, в частности, при- родные пептидные антибиотики грамицидин S н циклоспорин. Эти н некоторые другие циклопептиды синтезируются микроор- ганизмами по особому нсматрнчиому мультиэнзпмпому меха- низму и содержат в своем составе неканонические аминокислоты (N-.метнлированные аминокислотные остатки, D-нзомеры ами- нокислот и др.). D-аланин недавно выявлен и в составе дерморфи- нов — линейных опиоидных пептидов, выделенных из кожи юж- ноамериканских лягушек рода Phyllomedusa, у которых он нахо- дится в последовательности: Tyr-D-Ala-Phe-Gly-Tyr-Pro-Scr-ампд. В составе дерморфинов D-Ala образуется из L-Ala уже после синте- за пептида в результате действия особого фермента «псптпдизомс- разы», который выявлен также в яде воронковых пауков. Этот фер- мент способен катализировать превращение L—► D-Ala в составе пептидов. Многие природные пептиды возникают из более крупных бел- ков-предшественников в результате ограниченного протеолиза под действием ферментов протеиназ, разрушающих пептидные связи между определенными аминокислотными остатками, тем самым высвобождая физиологически активные пептиды. Таким образом, например, из состава белка-предшественника (эндорфина) вы- свобождаются пептиды-анальгетики энкефалины, относящиеся к опиоидным пептидам: 28
Протеиназа -Arg-Arg-Ту r-Cly-G ly- Phe- Leu-Arg- Arg- ЛсЙ-энкефалип Бслок-предшествеииик Карбоксппсптплаза (эпдорфип) Из белка-предшествеипика могут одновременно вырезаться либо несколько молекул одного н того же пептида, либо несколь- ко различных по структуре и обладающих различными физиоло- гическими эффектами пептидов. Например, в составе [3-эндорфи- на обнаружен набор пептидов, получивший название пропномс- ланокорпнн (ПОМК), в состав которого помимо энкефалина вхо- дят вырезаемые соответствующими протеиназами три пептидных юрмона: меланоцитстимулирующий гормон (МСТ), адренокор- тикотропный гормон (АК.ТГ) и липотропин. Таким образом, из одного белка-предшественника образуется целый «пакет» пепти- дов, модифицирующий обмен веществ в организме в стрессовых ситуациях. Как следует из вышесказанного, многие природные пеп- тиды выполняют определенные физиологические функции. Для некоторых из них характерна полимодалыюсть — способность вли- ять на многие процессы в организме. Так, тетрапептил тафцин (Tre-Lys-Pro-Arg) является одновременно и иммуностимулятором, и психостимулятором; трипептнл глутатион (y-Gln-Cys-Gly) под- держивает восстановленную форму железа (Fc2+) в гемоглобине н участвует в переносе аминокислот через мембранные структуры в клетке. Ряд пептидов, вырабатываемых в мозге, способны управ- лять эмоциями и поведением (психотропные пептиды). Изучение структуры природных пептидов помогает создавать пх синтетические аналоги, обладающие мощным физиологиче- ским эффектом. Например, было показано, что биологический эффект адренокортикотропного гормона (гормон пептидной при- роды, содержит 39 аминокислотных остатков, синтезируется в гипофизе, регулирует функцию коры надпочечников) обуслов- лен наличием пептидного фрагмента: -Mct-Glu-His-Phe-Arg-Trp- Gly-. В России недавно был синтезирован пептид, способный сти- мулировать память и, что немаловажно, обладающий повышен- ной по сравнению с природным гормоном устойчивостью к про- теолитическим ферментам благодаря целенаправленному введе- нию в его состав остатков иролина: Met-Glu-His-Phe-Pro-Gly-Pro. Лекарственный препарат данного гептапептида — «семакс» — спо- собствует лечению расстройств памяти после инсультов и череп- номозговых травм, помогает при мигренях и воспалениях трой- ничного и лицевого нервов. Отмеченная выше полимодальность (полифункциональность) пептидов, вероятно, объясняется их способностью связываться с 29
различными рецепторами либо сходством структуры самих рецеп- торов. В этом отношении относительно небольшие, часто своеоб- разные по аминокислотному составу природные пептиды суще- ственно отличаются от своих более крупных «собратьев» — соб- ственно белков, или протеинов (от греч. «протос» — первичный), у которых выражено соответствие между последовательностью рас- положения аминокислотных остатков в полииептидной цепи и определенной пространственной структурой молекулы. Несмотря па то что некоторые пептиды способны принимать определенную конформацию, удобную для взаимодействия с рецепторами, толь- ко белки способны формировать и удерживать сложные простран- ственные структуры, для образования которых необходимы дос- таточно протяженные полипептидные цепи. Нижним предельным размером для белков считается полипептидпая цепь, состоящая из 50 аминокислотных остатков. К таким белкам относятся, в ча- стности, фактор роста эпителия, инсулин и белки оболочки ряда бактериофагов. Чаще всего белки имеют в своем составе 100 — 400 аминокислотных остатков, образующих в пространстве опреде- ленную трехмерную структуру. СТРУКТУРНАЯ ОРГАНИЗАЦИЯ БЕЛКОВ В 1959 г. датский биохимик К.Липдерстрем-Ланг предложил раз- личать четыре уровня структурной организации белков: первичную, вторичную, третичную и четвертичную структуры, которые обо- значают соответственно аминокислотную последовательность, упо- рядоченное строение основной цепи полипептида, трехмерную структуру белка и структуры белковых агрегатов. Эта классифика- ция господствовала до начала 80-х годов XX в., когда Г. Шульц и Агрегат (четвертичная структура) I Глобулярный белок (третичная структура) I Домен I Сверхвторичная структура I Вторичная структура ♦ Аминокислотная последовательность 30
Р. Ширмер с учетом новых данных о структурных особенностях бел- ков предложили дополнить ее еще двумя уровнями организации: сверхвпюричными структурами и доменами. В итоге сложилось пред- ставление о шести уровнях структурной организации белков с оп- ределенной иерархией, выраженной Шульцем и Ширмером в виде схемы (см. с. 30). Как видно из схемы, в основе структурной организации бел- ков лежит определенная генетически детерминированная амино- кислотная последовательность нолипептидной цепи (первичная с । рукгура), которая определяет все последующие более высокие уровни организации. Под первичной структурой белка понимают порядок чередова- ния аминокислотных остатков в полипептидной цепи белка. Эта структура, достаточно жестко запрограммированная в определен- ной нуклеотидной последовательности соответствующих структур- ных генов ДНК, переписывается (транскрибируется) в комп- лементарные нуклеотидные последовательности мРНК, которые служат матрицами для биосинтеза полипептидных цепей в про- цессе декодирования (трансляции) генетической информации в рибосомной системе клетки. Тем не менее первичная структура зрелого функционально активного белка нс всегда соответствует структуре мРНК, что связано с возможностями репрограммиро- вания в ходе трансляции (см. гл. 11), а также с процессами пост- трансляциопной модификации синтезированных па рибосомах по- лппептидных цепей. Внушительные размеры полипептидных цепей белков, кото- рые могут включать несколько тысяч аминокислотных остатков (пень тиреоглобулина состоит из 2750 аминокислотных остатков, а цепи отдельных трансмембранных белков-рецепторов содержат до 5000 аминокислотных остатков), осложняют расшифровку их первичной структуры. Для расшифровки используются специаль- ные методы, с которыми связан прогресс в изучении молекуляр- ной биологии белковых тел. Первой удалось расшифровать амино- кислотную последовательность инсулина (Ф. Сангер, 1953). Она состоит из 51 аминокислотного остатка и организована в виде двух полипептидных цепей (цепь А — 21 остаток и цепь В — 30 остатков), ковалентно связанных между собой двумя дисульфид- ными мостиками (рис. 7). Эта длительная работа, называемая иногда «ручным секвенированием» (от англ, secpieuce — последователь- ность, сочетание), была выполнена динитрофторбензольным ме- тодом Ф. Сангера (ДНФ-метол), с помощью которого позднее были расшифрованы первичные структуры аспартатаминотрансферазы (Ю.А.Овчинников, А. Е. Браунштейп, 1971) и еще нескольких крупных полипептидов. Анализ аминокислотных последователь- ностей белков резко ускорился после внедрения метода П. Эдма- на (см. ниже) и создания автоматических приборов (секвенато- 31
1 Gly 1 Phe I I He Vai Vai g’iu Asn I Gin I I 5 Gin 5 His Thr Ser He S— C^s Ser Leu Gly Sir I His Leu I Vai I GIu I Ala 15 Gin 15 Leu Thr 30 GIu I Asn Leu Lj/s Pro ткг 20 C I Y Phe 25 Asn Gin Arg—Gly le Puc. 7. Первичная структура инсулина. Показана последовательность располо- жения аминокислотных остатков на- чиная с N-KOHiion двух П0Л11ПС11ТИД- пых iiencii. а также расположения ди- сульфидных связей ров), которые позволяют в авто- матическом режиме осуществлять секвенирование фрагментов по- липептидных цепей длиной в не- сколько десятков (до 50) амино- кислотных остатков. Однако даже использование секвенаторов тре- бует значительного времени для определения первичной структу- ры крупных белков, которые не- редко состоят из нескольких по- липептидных цепей. В этом слу- чае вначале требуется установить число цепей, затем разделить эти цепи, расщепить их на относи- тельно короткие фрагменты, пригодные для автоматического секвенирования по методу П. Эд- мана, определить их структуру и только тогда составить представ- ление о целостной аминокислот- ной последовательности белка. Все эти операции требуют спе- циальных методов. Фрагментацию изолирован- ных полипептидных цепей про- водят с использованием фермен- тов: трипсина (избирательно гид- ролизует пептидные связи, обра- зованные карбоксильными груп- пами Arg и Lys), химотрипсина (гидролизует пептидные связи, образованные карбоксильными группами Phe, Туг, Тгр, Leu), термолизипа (расщепляет пеп- тидные связи, образованные аминогруппами Leu, Phe, Туг, Vai и 11с) и ряда специфических эндопротсиназ, распознающих остат- ки определенных аминокислот и расщепляющих пептидные свя- зи, образованные их карбоксильными группами (эпдопротсиназы GIu — С, Lys — С и Arg — С). Из химических методов фрагментации полипептидов чаще всего используют обработку бромцианом, который расщепляет пептид- ные связи, образованные остатками метионина. Разделение пеп- тидов, полученных после фрагментации полипептидных цепей од- ним из вышеперечисленных способов, чаще всего проводят мето- дом высокоэффективной жидкостной хроматографии (HPLC). 32
Метод Эдмана, используемый для автоматического секвени- рования полученных пептидных фрагментов, основан на следую- щих реакциях (упрощенно): C6H5-N=C=S + HN—CH-CO-NH-CH-CO...CH-COOH—* II I I HR R R Фспюизотмошгапат и i\| rvj s II r CFjCOOH —► C6H5— N-C-NH-CH-CO^-NH-CH-CO...CH-COOH — ----------------* H R, R2 R„ Ф<.*111игтпокарбамп.1пеп1п;1 C6H5x ,<S> N-C NH+H.N-CH-CO...CH-COOH ch i R. Фени.тп1оп1дагггоип Hciitili, укороченный пи один аминокислотный остаток Повторение циклов этих реакций позволяет последовательно получать фснилтиогндаптоиновые производные аминокислот на- чиная с N-конца анализируемого пептида. Эти производные за- тем идентифицируют методом тонкослойной хроматографии либо высокоэффективной жидкостной хроматографией. Кроме выше- отмеченных методов для определения первичной структуры бел- ков используют также масс-спектрометрию, лазерную рентгено- скопию и др. Однако именно методом Эдмана определено боль- шинство выясненных первичных структур белков. Даже самые прогрессивные методы белкового (прямого) сек- венирования требуют получения значительных (чаще всего мил- лиграммовых) количеств гомогенных препаратов белков, получе- ние которых, особенно в отношении минорных белков, содержа- щихся в клетках в ничтожно малом количестве, сопряжено с дли- тельными трудоемкими процедурами их выделения и очистки от примеси других белков. Поэтому для определения первичной струк- туры белков все чаще используют анализ нуклеотидной последо- вательности кДНК, применяя соответствующие методы генети- ческой инженерии (см. гл. 14), что занимает значительно меньше времени. Узнав нуклеотидную последовательность кДНК или со- ответствующую последовательность мРНК, можно, учитывая осо- бенности генетического кода (см. гл. 11), определить аминокислот- ную последовательность кодируемого ими белка (не имея препа- рата белка!). Однако этот подход не позволяет выявить посттранс- ляционные модификации белка, и такое (косвенное) секвениро- 2 Копичеп 33
вание нельзя считать исчерпывающим. Поэтому методы прямого секвенирования на основе анализа белковых препаратов не утра- тили своего значения. Интенсивная работа в этом направлении имеет как научное, так и практическое значение. Сопоставление первичных структур нормальных и аномальных белков позволяет раскрыть основы патологических процессов, включая широко распространенные генетически детерминирован- ные заболевания. Именно этот подход выявил причину серповид- но-клеточной анемии — распространенной болезни крови, кото- рая возникает из-за точечной мутации гена, кодирующего после- довательность р-цепн гемоглобина. Замена одного-едпнетвенного остатка Gin в нормальном гемоглобине типа А на остаток Vai при- водит к появлению аномального гемоглобина типа S, не способ- ного в достаточной мерс связывать кислород, что приводит к раз- витию кислородной недостаточности в тканях человека, наблю- даемой при этом заболевании. Выявление структурного подобия (гомологии первичных струк- тур) белков лежит в основе изучения молекулярной эволюции белков, а дендрограммы, построенные на основе первичных струк- тур белков, широко применяются для выявления филогенетиче- ских связей различных групп организмов. Учитывая огромную ин- формацию, накопленную в отношении аминокислотных после- довательностей белков (к концу 1997 г. крупнейшие международ- ные компьютерные банки данных содержали сведения о первич- ной структуре 100 000 белков), такие построения помогают с вы- сокой степенью достоверности судить о процессах молекулярной эволюции, отстоящих от нашего времени на сотни миллионов лет назад. Данные исследования позволили, в частности, установить, что белки эволюционируют с разными скоростями. Очень консер- вативными в эволюции оказываются возникшие на самых ранних ступенях эволюции макромолекул гистоны — белки, обеспечива- ющие компактную укладку ДНК в составе хроматина (см. гл. 9). Они присутствуют в ядрах подавляющего большинства живых орга- низмов и поддерживают стабильность фундаментальных молеку- лярно-генетических механизмов хранения и воспроизведения на- следственной информации. Более изменчивы белки, встречающи- еся у определенных видов (цитохромы, глобины животных и др.). Эти белки наиболее часто используют как модели для изучения молекулярной эволюции. Сходство или различие первичных струк- тур используются для построения молекулярно-филогенетических «деревьев» с привлечением для этого специально разработанных компьютерных программ, что позволяет установить скорость раз- вития белков на отдельных этапах эволюции органического мира. Так, в отношении глобинов установлено, что с максимальной скоростью эти белки эволюционировали 400—500 млн лет назад, в период выхода позвоночных животных на сушу. Особенно силь- 34
но изменялась первичная структура тех участков их полипептид- пых цепей, которые ответственны за образование четвертичной структуры. К наиболее быстро эволюционирующим белкам при- надлежат белки РНК-содержащих вирусов (вирусов гриппа, ви- русов иммунодефицита человека, онкогенных вирусов). Не следу- ет забывать, что в основе эволюции белков лежит изменчивость соответствующих генов, фиксированные нуклеотидные замены (мутации) в кодирующих областях которых и приводят к измене- нию первичной структуры белков. Вместе с тем естественному или индуцированному мутационному процессу в живой клетке по- стоянно противостоит система репарации (исправления повреж- дений нуклеотидов), которая мощно развита в отношении ДНК (см. гл. 12) и малоэффективная в отношении РНК, чем, вероят- но, и объясняется необычно высокая скорость изменчивости бел- ков, кодируемых РНК-содержащими геномами. Анализ первичной структуры существен для выяснения и пред- сказания функциональных свойств белков. Так, например, специ- фическая группа широко распространенных в природе белков — металлотионеинов, способных связывать весьма значительное ко- личество тяжелых металлов (Cd, Си, Fe и др.), обладает обога- щенной остатками цистеина аминокислотной последовательнос- тью регулярной структуры: nh-..-сн-х-сн-х—...-СООН. I I CH, CIT I I S-Mc-S где X — любой аминокислотный остаток. Первый из металлотионеинов, выделенный Марголисом и Вэл- ли из почек лошади, представляет собой небольшой белок, со- стоящий из 61 аминокислотного остатка, 20 из которых — остат- ки Cys, служащие для связывания атомов кадмия. Знание первичной структуры белка необходимо для создания моделей его вторичной структуры и более высоких уровней струк- турной организации. Работы в этой области в настоящее время выполняются с использованием специальных компьютерных про- грамм, в которых учитываются определенные закономерности формирования пространственной структуры белков, напрямую связанные с их аминокислотными последовательностями. Фунда- ментальные представления о закономерностях укладки в прост- ранстве полипептидных цепей были сформулированы в середине XX в. в основополагающих работах Л. Полинга, посвященных изу- чению вторичной структуры белков. Вторичная структура белков — это упорядоченное расположе- ние отдельных участков основной цепи полипептида, без учета расположения боковых цепей (радикалов аминокислотных остат- 35
ков). Исследования вторичной структуры, основанные на данных рентгеноструктурного анализа, показали наличие в белках регу- лярно свернутых и закономерно закрученных участков полнпен- тидной цепи. Л. Полинг и Р. Кори в 1951 г. впервые постулировали спиральное расположение в пространстве полипептидных цепей, а затем сформулировали основные принципы построения моде- лей вторичных структур белков. В соответствии с этими правилами было предложено несколь- ко типов белковых спиралей — а, Зщ, л и др. (рис. 8). Дальнейший анализ структур белков подтвердил существование в природе пре- имущественно а-спнралей, что объясняется их высокой стабиль- ностью. Спирали типа 310 (имеют 3 аминокислотных остатка в од- ном витке и 10 атомов в цикле, образованном водородной свя- зью) встречаются в природе исключительно редко и образуют только короткие участки. Вероятно, это связано с тем, что спи- раль 310 энергетически не выгодна, так как в ней водородные свя- зи не находятся на одной линии. Эти спирали образуют всего 1 — 2 витка и встречаются у единичных белков: в гемоглобине морс- кой миноги, а также в белке паутины, для первичной структуры которого характерно наличие кластеров аминокислотных остат- ков типа Gly-Gly-X, образующих спирали этого типа. Спирали л в белках не обнаружены. Преобладающая в белках а-спираль имеет радиус 0.23 нм, расстояние между витками составляет 0,54 нм, среднее число аминокислотных остатков, приходящееся на один Рис. 8. Различные типы (слева направо: 31П, а и л) спирален в полипеп- тидных цепях белков (Г. Шульц, Р. Ширмер, 1982). Пояснения в тексте 36
оборот, — 3,6, угол подъема витка спирали — 26°. В природных белках существуют только правозакрученные а-спирали, что свя- зано с наличием в них аминокислот L-ряда. Все вторичные структуры стабилизированы водородными свя- ыми между кислородом карбонильной группы и водородом имид- ной группы пептидных связей: С=О...Н—N. Архитектоника рас- положения атомов азота и карбонильных групп в а-спирали тако- ва, что создает возможность для образования максимального ко- личества водородных связей между этими группами, поэтому спи- раль оказывается полностью пронизанной (насыщенной) водо- родными связями. В силу этого она имеет плотно упакованную структуру, не имеющую внутреннего канала и непроницаемую даже лля молекул воды (рис. 9). Протяженность а-спиральных участков в белках различна: в глобулярных белках она обычно не превышает 15 аминокислотных остатков (3—4 оборота спирали), а в фибрил- лярных белках гораздо длиннее, и в ней могут наблюдаться пере- гибы (изломы), чаще всего в местах расположения остатков про- лина, не способных к образованию соответствующих водородных связей. Например, в белке паутины плотно упакованная а-спи- раль, образованная преимущественно остатками Ala и Gin, чере- дуется с менее регулярными (эластичными) участками, где рас- полагаются кластеры аминокислот типа Gly-Pro-Gly. Длинные стер- жневидные полипептидные цепи, состоящие из нескольких а-спи- Рис. 9. Схематическое изображение а-спирали (показано расположение во- дородных связей; боковые группы (радикалы аминокислотных остатков) не показаны) 37
ралей, обнаружены во многих белках, в частности в а-кератине, внутриклеточные волокна которого обеспечивают прочность кожи. Особая спираль выявлена в составе коллагена, наиболее рас- пространенного белка млекопитающих. Эта правозакрученная спи- раль состоит из трех левых спиралей, расположенных параллель- но и образующих суперспираль. Структурной единицей цепей кол- лагена является триплет с общей формулой Gly-X-Y, где X чаще всего представлен остатком пролина, a Y — остатком оксипроли- на. Коллаген содержит 33% глицина, а на долю пролина и окси- пролина в сумме приходится 21 %. ^-Структуры. Эти вторичные структуры, очень широко пред- ставленные в белках, были постулированы Л. Полингом и Р. Кори и названы параллельными «плоскими» и антинараллельными p-склад- чатыми листами. Экспериментальной моделью для их изучения стал p-фиброин шелка, откуда собственно и возникло название Рис. 10. р-Складчатыс листы: А — аптипараллсльная трехцепочечиая p-структура; Б — параллельная трехиспо- чечная p-структура; В— более детальное изображение p-слоя. Водородные связи обозначены пунктирными линиями, направление цепей — стрелками. С„-атомы — точками 38
(l-структур, подобно тому как название а-спираль появилось в связи с работами по изучению структуры а-кератииа. Фиброин шелка состоит в основном из повторяющейся последовательно- сти: -(Gly-Ser-Gly-Ala-Gly-Ala),,-. В отличие от а-спирали в [3-струк- турах водородные связи возникают не внутри цепи, а между парал- лельно или антипараллельно идущими и сближенными участками цепи (рис. 10). Эти структуры не столь насыщены водородными связями, как а-спираль, поэтому в их состав могут входить не- сколько участков полипептидной цени. Большинство складчатых листов содержат не более шести цепей, и их средняя протяжен- ность (-2 нм) соответствует размеру структурного домена (см. ниже). У глобулярных белков p-структуры составляют - 15 %, хотя их число может быть и значительно больше (например, во вторичной струк- туре нейраминидазы — одного из каталитически активных белков Рис. 11. Белки, относящиеся к рампчным структурным группам в зави- симости от представительства элементов вторичной структуры: А — автохром с (группа а): В — ингибитор трипсина из соевых бобов (группа (!); В — рибонуклеаза (группа а + р); Г — адсиилаткипаза (группа а/(5) 39
вируса ipiinna). Радикалы аминокислотных остатков расположены по разные стороны от поверхности p-слоя (см. рис. 10). Они обра- зуют своего рода гребни, в которых нередко сосредоточиваются боковые цепи гидрофобных аминокислот, и такие p-структуры участвуют в образовании гидрофобных ядер глобулярных белков. В белках р-складчатые листы, как правило, не являются абсолют- но плоскими, чаще они имеют левую закрученность. Такое закру- чивание происходит как в фибриллярных (фиброине шелка), так и в глобулярных (карбоангидразе человека) белках. Наличие в белках а-спиралей и p-структур было положено в основу структурной классификации белков (М. Levitt, С. Chotia, 1976), в соответствии с которой различают белки типа а (содер- жат только а-спирали), типа р (обладают только p-структурами), а также белки а + р и а/p. Белки а + Р содержат а-спирали и Р- струкгуры, отчетливо разделенные в пространстве вдоль цепи. Белки а/p имеют более сложное строение с перемежающимися участка- ми а-спиралсй и p-структур (нечто напоминающее слоеный пи- рог или сэндвич). К наиболее известным и летально изученным белкам типа а относятся миоглобин, цитохром с, белок вируса табачной мозаики и инсулин; к белкам типа р — нейраминидаза вируса гриппа, супероксиддисмутаза и коиканавалин А, к белкам типа а + р — рибонуклеаза, лизоцим куриного яйца и карбоангид- раза, к типу а/р — карбоксипептидаза и триозофосфатизомераза. На рис. И представлены схематические изображения трехмерных структур белков с различным представительством вторичных струк- тур. Достаточно причудливое на первый взгляд расположение от- дельных элементов вторичной струк- туры у многих белков, тем не менее, песет в себе определенную функцио- нальную нагрузку. Примером может служить структура зеленого флюорес- цирующего белка, у которого 11 р-сло- ев образуют полый цилиндр (бочо- нок), защищающий расположенную внутри хромофорную группу (рис. 12). Рис. 12. Схематическое изображение трех- мерной структуры зеленого флюорес- цирующего белка, выполненное с ис- пользованием специальной компьютер- ной программы. Одиннадцать р-слосв образуют полый ци- линдр, внутри которого расположена хро- мофорная группа 40
Помимо регулярных вторичных структур в полипептидных це- пях белков содержатся значительные участки нерегулярной струк- туры, образующие различные петли и изгибы. Один из видов та- кого рода структур получил название 0-изгиб. Этот элемент на- блюдается при обратном (на 180°) изменении направления поли- пептпдиой цепи и стабилизируется водородной связью между 1-м и 4-м по ходу цепи аминокислотными остатками. Кроме того, пет- леобразные структуры могут ограничивать функционально важ- ные участки (домены) полипептидных цепей. Несмотря на то что вторичная структура полипептидной цепи белков предопределяется генетически детерминированной после- довательностью аминокислотных остатков, она не всегда оказы- вается однозначно организованной. Это накладывает определенные ограничения на предсказание вторичной структуры. Чаще такие предсказания сбываются в отношении а-спиралей, и значитель- но реже — в отношении 0-структур. Неоднозначность укладки ос- това полипептидной цепи может быть связана с тем, что па ее формирование влияют межрадикальные взаимодействия, возни- кающие при образовании третичной структуры (см. ниже). Поэто- му одни и те же фрагменты полипептидной цепи в принципе мо- гут служить для создания разных элементов вторичной структуры. Гак, последовательность Asn-(Ala)2-Ile-Arg-Ser в фосфофрукто- кппазе имеет конформацию а-спирали, а в термолизине входит в р-складчатый слой. Значительные изменения вторичной структу- ры возможны и в пределах одной и той же полипептидной цепи. Они выявлены во вторичной структуре прионов — белков, вызы- вающих так называемые медленные мозговые инфекции — коро- вье бешенство, вертячку овец и др. Как показали исследования С. Прузепера, нормальный белок-предшественник (проприон) со- держит всего 4% 0-структуры, а его аутокаталитический переход в болезнетворную форму (прион) сопровождается скачкообраз- ным многократным увеличением доли 0-структур. Сверхвторичпыс структуры представляют собой энергетически предпочитаемые ансамбли вторичных структур. В соответствии с принципами кинетики такие образования, вероятно, предпочти- тельны для формирования (свертывания) полипептидной цепи в пространстве по мере синтеза, а также для придания стабильнос- ти уже сформированной пространственной структуре белка. Этот уровень организации свойствен как фибриллярным, так и глобу- лярным белкам. В фибриллярных белках две а-спирали могут быть скручены относительно друг друга, образуя левую суперспираль, период идентичности которой составляет около 14 им. Такие спи- рали найдены в а-кератине, тропомиозине и других белках, что, очевидно, придаст им определенные функциональные свойства: прочность, эластичность, способность к сокращению. В глобуляр- ных белках чаще представлены сверхвторичные структуры, содер- 41
Рис. 13. Примеры сверхвторичных структур: А — рер-зпено: Г> — два последовательно соединенных участка (1сф: В — зигзаг (аптипараллельная трехцепочечиая p-структура) жащие р-складчатые листы, между которыми могут располагать- ся а-спирали (рис. 13). Нередко характерные сверхвторичные струк- туры содержат в своем составе атомы металлов, что, по-видимо- му, обеспечивает их дополнительную стабильность. К числу по- добных образований можно отнести так называемые «цинковые пальцы» (сверхвторичные структуры с включенными в них атома- ми цинка), строение которых замечательным образом способствует взаимодействию отдельных видов белков с ДНК (см. гл. 9). Сверх- вторичные структуры определенного вида воспроизводятся во многих белках, образуя структурные блоки. Их изучение привело к возникновению понятия блочного принципа структурной органи- зации белков, получившего закономерное развитие в учении о бел- ковых доменах. Домены. Анализ электронной плотности показывает наличие в белках четко выраженных глобулярных областей — структурных доменов. Молекулярная масса элементарных структурных доменов составляет около 20 кДа. Домены часто соединяются между собой короткими участками полипептидиой цепи, которые выполняют роль шарниров, обеспечивающих определенную подвижность уча- стков молекул белка относительно друг друга. В пределах одной полипептидиой цепи могут встречаться несколько доменов. Один или несколько структурных доменов могут образовывать функци- ональные домены. Последние идентифицируются по свойствам: по способности осуществлять ферментативную реакцию или при- соединять какое-либо вещество (кофермент — в случае фермен- тов, антиген — в случае иммуноглобулинов и т.л.). «Активный центр» функциональных доменов, как правило, расположен на границе структурных доменов. В качестве примера белка с доско- нально изученной доменной структурой на рис. 14 приведена схе- ма строения иммуноглобулина. Домены ярко выражены у фер- ментов, нуждающихся для осуществления катализа в дополпи- 42
Рис. 14. Доменная структура иммуноглобулина G. Молекула состоит из двух тяжелых (Н) и двух легких (L) цепей, соединенных лисульфнлными мостиками. Домены обозначены в виде кругов; Сц и CL — коп- I шптпые домены тяжелых и легких цепей соответственно; V,, и V, — вариабель- ные домены. Мсждомспныс участки тяжелых цепей обладают определенной под- вижностью: в области двух дисульфидных мостиков, соединяющих тяжелые цепи, расположен так называемый шарнирный участок, сообщающий подвижность участ- кам Fab («лапкам») иммуноглобулина. Вариабельные домены образуют функци- ональный домен, необходимый для связывания антигена. Углеводные компо- ненты молекулы нс показаны тельных веществах небелковой природы (коферментах или про- стетических группах, ионах металлов), присоединение которых осуществляется в соответствующих доменах. Такие коферментсвя- швающие домены выявлены в составе многих ферментов, катали- зирующих окислительно-восстановительные реакции. На рис. 15 изображена пространственная структура альдегидоксидоредукта- зы: коферментсвязывающий домен имеется в каждой из двух иден- тичных полипептидных цепей (субъединиц) этого фермента. Коферментсвязывающие домены оказываются достаточно кон- сервативными в эволюции, и в целом структурные домены одно- го плана строения встречаются у многих функционально различ- ных белков. Это относится, в частности, к структурным доменам иммуноглобулинов, NAD-связывающим доменам дегидрогеназ и других ферментов, например триозофосфатизомеразе и пируват- киназе. Присутствие сходных доменов у разных белков легло в ос- нову представлений о модульном (доменном) принципе органи- зации белков. Позднее стало очевидным, что матрицами для син- теза таких структурно подобных (но не идентичных) белков могут служить особым образом процессированные мРНК, возникающие в результате альтернативного сплайсинга (см. гл. 10). 43
Рис. 15. Схематическое изображение молекулы альдспшоксидорсдуктазы. Молекула этого фермента представляет собой димер, состоящий из двух симмет- рично расположенных идентичных полипептидных испей (гомодимер): А — об- щий план строения молекулы, в каждой из полипептидных цепей (субъединиц) которой имеется несколько доменов, образованных определенными участками сх-еппралей и p-структур. В центре жирной точкой обозначена ось симметрии. Мо- лекулы коферментов изображены в виде черных шаро-стержневых моделей, расположенных вблизи центра каждой субъединицы: Б — одна из субъединиц, состоящая из трех доменов: домен I выделен черным цветом, домен III — серым: а центре (в области домена I) расположены молекулы коферментов Домены выражены не только у ферментов, связывающих доба- вочные (небелковые) группы, но и у простых (однокомпо!бит- ных) ферментов — протеинов. Разнообразием доменов объясня- ется способность ферментов выполнять многие каталитические функции. Примером фермента с двумя различными структурны- ми (и одновременно функциональными) доменами может слу- жить эндонуклеаза PI —Seel из клеток дрожжей Sacharomyces cerevisiae. Она относится к группе ферментов генной конверсии (homing), участвующей в сайт-специфической интеграции генов 44
Рис. 16. Доменная структура эндо- нуклеазы PI-SceI (Венде В. и др. Молекулярная биология. — М., 2000. -Т. 34. - Выгьб. - С. 1054). Домен I отвечает за протеолитическую активность, домен II — за нуклеаз- ную активность. Оба домена участву- ют в связывании ДНК Домен II Домен I в хромосомы. Эндонуклеаза образуется из более крупного белка- нрсдшественника в результате аутокаталитического протеолиза (удаления части полипептидиой цепи из молекулы предшествен- ника). Таким образом, этот фермент обладает двойной каталити- ческой функцией: вносит разрывы в пол и нуклеотидные цепи ДНК, действуя как эндонуклеаза (что необходимо для последующей интеграции генов в хромосомы), и осуществляет ограниченный протеолиз своей полипептидиой цепи. Двойная функция связана с наличием двух доменов, сильно различающихся по структуре: домен I ответствен за протеолиз белка-предшественника, а домен II обладает эндонуклсазной активностью (рис. 16). Структурно-функциональные исследования некоторых фермен- тов позволили выявить еще одну особенность строения доменов — наличие в их составе субдоменов, каждый из которых способен выполнять определенную каталитическую функцию. Такой слож- ной субдоменной структурой обладает синтаза высших жирных кислот позвоночных животных: в каждой из двух ее полипептид- ных цепей содержится по три домена. В составе двух доменов уда- лось идентифицировать несколько субдоменов, каждый из них катализирует определенную реакцию в серии химических превра- щений, приводящих к синтезу молекул пальмитиновой и стеари- новой кислот. Еще более впечатляющим примером полифункцио- 45
апо-ЛФ Рис. 17. Пространственная структура полифупкциопалыюго белка лак- тоферрина, определенная методом рептгсноструктурпого анализа (пояс- нения в тексте) Fc-ЛФ нальности белков с различными функциональными доменами яв- ляется лактоферрин, белок молока млекопитающих из семейства трансферринов — гликопротеинов, переносящих ионы Fe3+. Лак- тоферрин способен взаимодействовать с ДНК, РНК, белками, полисахаридами и в комплексе с ними выполняет самые разные функции: расщепляет РНК как фермент рибонуклеаза, служит фактором транскрипции, ингибирует синтез простагландинов, активирует нсспсцифический иммунный ответ организма и т.л. Молекулярная масса этого белка, состоящего из 673 аминокис- лотных остатков, -80 кДа. В едино» полипептидиоп цепи лакто- феррина методом рентгеноструктурного анализа выявлены два го- мологичных домена (N- и С-доли), содержащие жслсзосвязываю- щие центры. Связывание ионов железа апо-лактоферрином (апо- ЛФ) приводит к формированию Fe-лактоферрина (Fe-ЛФ) — более компактной (закрытой) формы молекулы, у которой N- и С-доли имеют более плотную пространственную структуру (рис. 17). В молекуле этого белка выявлены АТР-связывающий домен, по- лианионсвязывающий домен (служит для взаимодействия с нук- леиновыми кислотами) и РНКаза-подобный сайт, т.с. область, структурно подобная активному центру фермента рибонуклеазы (РНКазы) — благодаря ей лактоферрин способен расщеплять РНК. Таким образом, многочисленные домены придают этому и дру- гим полифункциональным белкам сложную пространственную 46
(третичную) структуру, в которой заложены разнообразные фун- кциональные возможности. Третичная структура белка — это расположение в пространстве всех атомов белковой молекулы. Иными словами, пол третичной понимают трехмерную структуру белков, характеризующуюся оп- ределенной укладкой в пространстве всех звеньев полипептидиой цепи. В самом общем виде по форме укладки в пространстве бел- ковые молекулы давно принято подразделять на фибриллярные и глобулярные. Третичную структуру обычно рассматривают в отно- шении глобулярных белков, имеющих более разнообразную про- странственную организацию и соответственно более разнообраз- ные функциональные возможности. Изучение третичной структу- ры представляет собой очень сложную задачу и выполняется пре- имущественно методом рентгеноструктурного анализа. Трехмер- ная структура миоглобина представлена на рис. 18. Уникальная трех- мерная структура любого из изученных белков столь сложна, что для ее детального описания потребовалось бы слишком много времени. Поэтому мы ограничимся изложением основных прин- ципов организации третичной структуры белков. Для формирования третичной структуры важнейшее значение имеют различные виды связей, возникающие между радикалами определенным образом расположенных аминокислотных остатков в иолипептидной цепи белка. Эти связи реализуются в основном за счет слабых взаимодействий: водородных связей, ионных и гид- рофобных взаимодействий (рис. 19). В ряде случаев зретичная струк- тура дополнительно поддерживается прочными ковалентными (дисульфидными) связями, возникающими между остатками ци- стеина внутри иолипептидной цепи. Следует отметить, что именно порядок расположения амино- кислотных остатков (первичная структура белка) определяет спе- цифику укладки в пространстве всех элементов белковой молеку- лы. В живой клетке на третичную структуру белка огромное влия- ние оказывает взаимодействие полипептидиой цепи с природ- ным растворителем (водой), а также с растворенными в нем мак- ро- и микромолскулами (другими белками, солями металлов и т.д.). При взаимодействии с водным окружением полярные и неполяр- ные радикалы аминокислот ведут себя по-разному. Полярные ра- дикалы (Ser, Тге, Туг, Asp, Lys, GIu и др.) гидрофильны, спо- собны взаимодействовать с диполями воды и поэтому обычно расположены на поверхности белковой глобулы. Неполярные ра- дикалы (Ala, Leu, Не, Phe и др.), напротив, гидрофобии и ока- зываются внутри молекул белка, образуя гидрофобное ядро. Гра- ницы между гидрофобным ядром и наружной поверхностью нс всегда выражены, и часть гидрофобных радикалов может высту- пать на поверхность молекулы, что существенно для контакта между белковыми глобулами при образовании четвертичной структуры 47
Рис. 18. Третичная структура миоглобина, установленная методом рент- гспоструктурпого анализа: А — схематическое изображение молекулы: Б — модель, демонстрирующая рас- положение в пространстве каждого атома молекулы этого белка 48
Рис. 19. Связи, стабилизирующие третичную структуру белков: / — ионные; 2 — водородные; 3 — гидрофобные; 4 — ковалентные белков, а также для взаимодействия с другими внутриклеточны- ми молекулами. Изменение внешнего окружения (pH, ионной силы, темпера- туры и т.д.) способно вызывать денатурацию белков — потерю ими нативной третичной структуры, связанной с нарушением ре- гулярности внутримолекулярных связей, поддерживающих про- странственную структуру. При этом наиболее уязвимыми оказы- ваются силы слабых взаимодействий — водородные и ионные связи. Несмотря на то что денатурация не сопровождается разрушением ковалентных (пептидных и дисульфидных) связей, белок утра- чивает свои функциональные свойства, что подчеркивает важ- ность его пространственной организации. В определенных услови- ях белки могут ренатурировать — вновь приобрести нормальную глобулярную структуру. Первые эксперименты по денатурации — рснатурации белков были выполнены в 60-е годы XX в. К. Анфин- ссном на рибонуклеазе и лизоциме, а позднее и на ряде других белков (трипсиногене, сывороточном альбумине, а-амилазе). В ходе ренатурации сначала восстанавливаются элементы вторичной структуры (а-спирали, p-слои и изгибы), а затем участки поли- пептидной цепи благодаря силам слабых взаимодействий органи- зуются в пространстве с образованием доменов, и белок образует в пространстве так называемую расплавленную глобулу. Уточнение взаимной ориентации доменов завершает становление простран- 49
ственной структуры, в результате чего восстанавливается функ- циональная активность белка. Эксперименты по обратимой денатурации стали мощным сви- детельством способности белков к самоукладке в пространстве — приобретению определенной третичной структуры, детермини- рованной последовательностью расположения аминокислотных остатков в полипептидной цепи. С этим связана теория существо- вания стереохимического кода — закономерностей формирования пространственной структуры изданной первичной структуры. Хотя стереохимический код, определяющий соотношение между пер- вичной и третичной структурами белка, не расшифрован, сдела- ны попытки раскрыть его основные принципы и предсказать на этой основе пространственную структуру белков. Так, согласно теоретическим положениям, сформулированным Л. Б. Меклером, третичная структура белков основана на стереокомнлементарнос- ти аминокислотных остатков. Она проявляется в возможности воз- никновения водородных связей от полярной группы боковой цепи одного аминокислотного остатка (донора водорода) к СО-группе остова полипептидной цепи — компоненту аминокислотного ос- татка партнера (акцептору). В большинстве случаев постулируется такая направленность водородных связей, когда в качестве доно- ра выступает полярный радикал, а в качестве акцептора — СО- группа неполярного аминокислотного остатка: His -> Met, Asp —> Vai, Asp He и т.п. В соответствии с этой теорией трехмерные молекулы полипептидов строятся непосредственно в ходе их син- теза на рибосомах в результате последовательного, шаг за шагом, комплементарного взаимодействия аминокислотных остатков и проходят через стадию расплавленной глобулы к «твердому» (ком- пактному) состоянию. О возможности реального существования комплементарных сочетаний аминокислотных остатков свидетельствует высокая схо- димость результатов, полученных на основе теоретического пред- сказания структуры полипептидов и экспериментальных данных с использованием ядерного магнитного резонанса в отношении двух белков: тахиплезина (пептид, состоящий из 17 аминокислотных остатков, выделенный из организма крабов) и более крупной молекулы белка-репрессора Сто бактериофага X (см. гл. 9). Как и «главный» генетический код, открытый М. Ниренбергом, С.Очоа и Х.-Г. Корана, стереохимический код взаимодействия аминокис- лот, вероятно, имеет не абсолютный характер и частично вырож- ден, что подразумевает определенные отклонения от жесткой за- программированности третичных структур белков. Эти флуктуа- ции структуры вследствие образования различных (альтернатив- ных) комплементарных аминокислотных остатков приводят к су- ществованию «мерцающих» элементов структуры, более подвиж- ных по сравнению с другими участками молекулы. Такие Q-no- 50
добные структуры характерны для белков (например, иммуногло- булинов), функция которых состоит в «узнавании» и связывании чех или иных лигандов (антигенов). Изучение закономерностей формирования третичной структу- ры белков способно в перспективе содействовать решению аль- тернативной задачи: составлению такой первичной структуры, которая могла быть ориентирована на создание определенной тре- тичной структуры, т. е. создание de novo белков, отсутствующих в природе. Пока в такого рода работах удается создать небольшие полипептиды, состоящие из нескольких десятков аминокислот и напоминающие природные белки (миогемэретрин и цитохром с), состоящие из а-спиралей, а также отдельные полипептиды, со- держащие не только а-спирали, но и p-структуры (альбебетин). Синтез этих белков на матрицах синтетических мРНК, а также синтез соответствующих генов (кДНК), их клонирование в клет- ках бактерий (методы генетической инженерии изложены в гл. 14) с последующим выделением и анализом структуры запрограмми- рованных полипептидов дают вполне ожидаемые результаты, что можно расценить как первые шаги истинной белковой инженерии. Одним из наиболее перспективных направлений белковой ин- женерии является создание каталитически активных антител — своеобразной группы белков, получивших название «абзимы». Известно, что общим свойством ферментов и антител (имму- ноглобулинов) является их способность специфически связывать определенные молекулы (лиганды) — субстраты и антигены со- ответственно. Еще в 1948 г. Л. Полинг, сравнивая строение этих двух фундаментальных классов белков, пришел к выводу, что фер- мент не так строго комплементарен субстрату, как антитело — антигену. Известно, что активный центр ферментов формируется благодаря уникальному сочетанию определенных аминокислот- ных остатков (радикалов), нередко достаточно удаленных друг от друга в полипептпдной цепи белка, но сближающихся в простран- стве при формировании третичной структуры белка. При взаимо- действии с субстратом происходят индуцированные им конфор- мационные изменения в структуре фермента, в результате чего достигается точное и относительно прочное (за счет сил слабых взаимодействий) связывание субстрата с активным центром фер- мента. В энзимологии эту стадию каталитического процесса при- нято называть переходным состоянием реакции, в процессе ко- торого формируется фермент-субстратный комплекс и достига- ется оптимальная ориентация реагирующих групп фермента и субстрата. В отличие от ферментов иммуноглобулины имеют стандартный план строения (см. рис. 14). Огромное разнообразие антител в орга- низме объясняется тем, что их вариабельные участки, сосредото- ченные в N-концевых областях тяжелых и легких полипептидных 51
цепей (VH и VL), формируются в клетках иммунной системы (р- лимфоцитах) как продукты экспрессии множества разных генов. Благодаря колоссальному числу возможных сочетаний вариабель- ных и константных участков полипептидных цепей иммуноглобу- линов возникает соответствующее множество антител, способных связывать разные антигены, в качестве которых могут выступать высокомолекулярные соединения, а также небольшие по разме- рам молекулы (гаптены). Специфическое взаимодействие антите- ла со своим лигандом, хотя и подобно взаимодействию фермента с субстратом, однако стерически более однозначно и предполага- ет более прочное связывание лиганда по сравнению со связыва- нием субстрата в активном центре фермента. Развивая идеи Л. По- линга, в 1969 г. У.Дженкс предположил, что если бы удалось вы- работать антитела, комплементарные переходному состоянию ферментативной реакции, то они были бы способны катализиро- вать соответствующие химические реакции. Реальные условия для создания каталитически активных антител возникли после того, как были синтезированы отдельные аналоги переходного состоя- ния и разработаны методы получения моноклональных антител (см. гл. 1). Первые антитела-ферменты были получены в 1986 г. Р.Лейнором и П. Шульцем. Ими стали абзимы с эстеразной ак- тивностью, полученные иммунизацией животных стабильным аналогом переходного состояния с последующим отбором клонов р-лимфоцитов, способных продуцировать соответствующие анти- тела. В случае ферментативного катализа, осуществляемого гидро- литическими ферментами (эстеразами) при гидролизе сложных эфиров, в которых атом углерода связан с тремя другими атома- ми, после присоединения молекулы воды образуется нестабиль- ное переходное состояние. При этом атом углерода находится в тетраэдрическом состоянии (рис. 20). В качестве аналога переход- ного состояния для получения абзима был использован сложный Н Н .cO-'r О=С' ^R, н н ЕИ-О, лхО-R s- (Z ^R, Переходное состояние (\. ,^O-R - (Z' ^R, Стабильный аналог Рис. 20. Реакция гидролиза сложного эфира карболовой кислоты и структу- ра фосфаната — стабильного аналога переходного состояния 52
эфир фосфорной кислоты, в котором атом фосфора имитировал тетраэдрический атом углерода. Использование фосфорных эфи- ров в качестве гаптенов привело к успешному получению анти- тел, обладающих эстеразной активностью. Так, например, были получены антитела к н-питрофенилфосфонилвалериату: О II о-р-сн ,-сн ,-сн-сн-соон ! он л-Иптрофепилфосфовилвалериат Полученные антитела оказались способны гидролизовать с высокой скоростью субстрат эстераз — л-нитрофснилмстилкар- бопат, который стсричсски похож на антиген (гаптен) и при со- единении с антителом сразу образует переходное состояние, рас- падающееся до продуктов реакции: О II о—с—о—сн. /i-Нитрофсвилметил карбонат O,N но-с-о-сн, II О Метилкарбопат получения каталитически ак- л-Нитрофенол Дальнейшие работы в области гпвных антител показали, что абзимы способны ускорять хими- ческие реакции в 106— 107 раз, тогда как природные энзимы — в 109—1012 раз. Получены абзимы, активные не только в реакциях распада, но и в реакциях синтеза (например, в реакциях образо- вания пептидной связи). В природе каталитически активные антитела обнаружены у людей, страдающих аутоиммунными заболеваниями. ДНК-гидро- лнзующис антитела выявлены и в крови больных лейкозом, луче- вой болезнью п СПИДом. Выявлены они и у людей, больных сис- темной красной волчанкой, причем в этом случае фракция секре- торных IgA-антител обладает протеинкиназной активностью. В кро- ви больных ревматическим артритом, а также людей, страдающих раковыми заболеваниями, обнаружены антитела с амилолитиче- ской активностью. Вопрос о существовании каталитически активных антител в крови здоровых людей остается открытым. Не выявлены они и у больных гриппом, пневмонией и некоторыми видами рака. Зна- 53
читальный интерес в связи с этим представляет обнаружение ка- талитических антител в молоке человека. Эти антитела обладают протеннкиназной активностью, фосфорилируя казеин и другие белки молока, часть из них способна гидролизовать ДНК и РНК, другие обладают амилолитической активностью. Полагают, что абзимы молока могут играть определенную роль в защите ново- рожденных от вирусных и бактериальных инфекций. Практическое значение абзимов может быть весьма много- образным. Оно связано прежде всего с тем, что колоссальное при- родное многообразие антител (1 -108) создаст предпосылки для создания биокатализаторов с заданными свойствами, отсутству- ющих в природе. Большое значение может иметь применение аб- зимов в биотехнологии и медицине. В перспективе абзимы могут быть использованы для разделения оптических изомеров как при- родных соединений, так и фармакологических препаратов, что в настоящее время практически недостижимо другими способами. Формирование пространственной структуры белка в живой клет- ке представляет собой непростую систему взаимодействий вновь образующейся в процессе трансляции белковой молекулы с пред- существующнми в клетке белками. Эти белки могут вступать во взаимодействие с синтезируемой полипептидной цепью и затруд- нять формирование ее нативной запрограммированной в амино- кислотной последовательности структуры. Несмотря на ряд нео- споримых свидетельств определяющего значения первичной струк- туры для формирования той или иной трехмерной структуры бел- ка (см. выше), в клетках существует группа особых белков-помощ- ников, непосредственно предназначенных для облегчения фор- мирования пространственной структуры вновь синтезируемых полипептидов. Процесс формирования пространственной струк- туры белка — фолдинг — обозначает образование определенных складок, изгибов в полипептидной цепи, т.е. процесс становле- ния третичной структуры белка, которую иногда представляют как группу фолдов — структур с определенным набором и тополо- гией расположения элементов вторичной структуры. В 1987 г. было предложено называть белки, обслуживающие фолдинг, молеку- лярными шаперонами (molecular chaperones). Термин «шапероны» применяется в настоящее время в отношении трех различных групп белков: нуклсоплазминов (они являются ядерными белками, уча- ствующими в сборке нуклеосом), белков, называемых Hsp 70- Bip (группа белков теплового шока — Heat shock proteins — и их гомологов) и собственно белков-шаперонов, получивших назва- ние шаперонины и имеющих непосредственное отношение к сво- рачиванию полипептидной цепи в нативный белок. Шаперонины представляют собой белковые комплексы, встре- чающиеся в бактериях, цитоплазме эукариотических клеток, мат- риксе митохондрий и хлоропластов (табл. 2). Они способствуют 54
Функции шаперонов Таблица 2 Источник Белки, подвергаю- щиеся фолдингу Шаперон Функция Е. colt Предшественни- ки секреторных белков; Д НК- ре пликанион- пый комплекс GroEL SccB DnaK / DnaJ Задержка свертывания перед транспортом; реорганизация белкового комплекса Фотосинте- зирующие бактерии Рибулозо-1,5- бисфосфаткар- боксилаза GroEL/ GroES Сборка олигомера Хлоро- пласта Рибулозо-1,5- бисфосфаткар- боксилаза RuSBR Сборка олигомера Митохонд- рии Митохондриаль- ные белки- предшествен- ники Белки-пред- шественники в матриксе Hsp70 Hsp60 Завершение транслока- ции; стабилизация нс полностью свернутых структур в матриксе Стабилизация пс пол- । i остыо свср| lyibix струк- тур п свертывание; ре- экспорт предшествен- ников в межмсмбраннос пространство Эндоплаз- матиче- ский рети- кулум Секреторные белки Субъединицы Т-клеточного рецептора Запасные белки растений Bip TRAP, или p28 b70 (Bip) Завершение транслока- ции; стабилизация не полностью свериугых структур в канальцах Сборка рецептора Стабилизация вновь синтезируемых белков Цитозоль Синтезируемые полипептиды Митохондриаль- ные и секретор- ные белки-пред- шественники Бслки-рецспто- ры стероидных гормонов Hsc70 Hsc70 Hsp90 Стабилизация пс пол- ностью свср| 1У1ЫХ структур Разворачивание перед транслокацией Стабилизация неактив- ной формы рецептора 55
Окончание табл. 2 Источник Белки, подвергаю- щиеся фолдингу Шаперон Функция Цитозоль Белки, транс- формирующие ретровирусы Hsp90 Стабилизация неактив- ной формы белка при прохождении через плазматическую мембрану Ядро Гистоны Нуклсоплаз- мин Сборка нуклеосом корректному сворачиванию синтезируемых полипептидных цепей, защищают свернутые в расплавленные глобулы цепи от агрегации. Наиболее исследованы шаперонины Е. coli, называемые GroEL и GroES. GroEL состоит из 14 идентичных субъединиц (протоме- ров) с молекулярной массой 57 кДа каждый. Он представляет со- бой цилиндр, сформированный из двух колец, каждое из которых в свою очередь состоит из семи протомеров. Отдельный протомер шаперонина состоит из 3 доменов: эвкаторналыюго, апикального и промежуточного (рис. 21). Апикальные (вершинные) домены каждого кольца образуют входные отверстия в центральную по- лость цилиндра GroEL. Шаперопин GroES (его также называют кошаперонином) состоит из 7 идентичных протомеров с молеку- лярной массой 10 кДа. Протомеры GroES образуют куполообраз- ную структуру. Образованные частью аминокислотных остатков (Gly 45 —Pro 56) короткие подвижные петли протомеров GroES Рис. 21. Структура шаперонипового комплекса GroEL: /I — вид сбоку цилиндра GroEL. состоящего из двух колец; Б — вид сверху. Тем- ные прямоугольники — участки связывания полипептида 56
формируют крышу купола, в центре которой имеется отверстие диаметром около 0,8 нм. GroEL и GroES обладают способностью связывать АТР (14 и 7 молекул соответственно). Места связывания АТР расположены на внутренней поверхности экваториальных доменов GroEL. Подлежащая сворачиванию полипептидная цепь вновь синтезируемого белка связывается с определенным участ- ком внутренней боковой поверхности апикальных доменов. При гидролизе АТР происходит взаимодействие GroEL и GroES — обра- зуется комплекс GroEL/GroES (рис. 22). В этом комплексе созда- ется закрытое пространство (ширина -7 нм, высота -6,5 нм), внутри которого полипептидная цепь сворачивается в нативный белок. Процесс сворачивания происходит в течение нескольких циклов диссоциации-реассоциации комплекса шаперонинов, в результате чего, вероятно, происходит постепенное, защищен- ное от нежелательных контактов формирование нативной третич- ной структуры белка (рис. 23). Сначала синтезированный поли- пептид связывается с комплексом шаперонинов в кольце, не за- нятом GroES (стадия 1). Затем происходят связывание и гидролиз АТР, в результате чего GroES отходит от комплекса (переход от стадии 2 к стадии 3), а затем вновь в комплексе с очередной пор- GroES Рис. 22. Предполагаемая модель строения GroEL/GroES-комплекса {Ба- шаров М.Л. Ц Биохимия. — М., 1997. — Т. 62. — Вып. 4 — С. 489): Л — для образования комплекса GroES присоединяется к GroEL: Б — устойчи- вый симметричный GroEL/GroES-комплекс. Стрелками обозначены предпола- гаемые участки GroEL, конформационные перестройки которых приводят к «раскрытию» апикальных доменов 57
и + Рис. 23. Модель фолдинга белков с участием GroEL/GroES-комплскса шапсронипов (Й. Мартин, 1998). Комплексы шаперопппов показаны вертикальным разрезом через кольца. Сталин никла, ведущие от псспсриутого белка (U) к нативному белку (N). описаны в тексте иней АТР присоединяется к GroEL (стадия 4). На этой сталии GroES «закрывает» полипептид в полости GroEL, где он сворачи- вается во время гидролиза АТР (стадии 5 и 6). Отдельный цикл фолдинга занимает 15 — 20 с и завершается гидролизом еще 7 мо- лекул АТР, что приводит к освобождению GroES из комплекса с GroEL (переход от стадии 6 к стадии 7) и высвобождению свер- нутого полипептида через отверстие полости цилиндра GroEL. Структура комплекса GroEL/GroES детально изучена методом электронной микроскопии. Установлена его ведущая роль в фор- мировании нативной структуры большой полипептидной цепи одного из ключевых ферментов биосинтеза углеводов — рибуло- зо-1,5-бисфосфаткарбоксилазы (Ru Bis Со). Сходный по структу- ре шаперон выявлен в хлоропластах высших растений — RBP (Ru Bis Со building protein). Как и GroEL, он обладает редким типом 7-лучевой симметрии. 58
Четвертичная структура характерна для белков, построенных из нескольких полипептидных цепей. Она представляет собой спо- соб взаимного расположения в пространстве отдельных полипеп- тпдных цепей в молекуле белка, необходимый для проявления специфических функций. Отдельные полипептидные цепи, вхо- дящие в состав белков, обладающих четвертичной структурой, носят название протомеров, или субъединиц, из которых формиру- ется эпимолекула такого белка-мулыпимера. Четвертичная структура поддерживается исключительно сила- ми слабых взаимодействий, поэтому она представляет собой до- статочно лабильное образование, значительно менее прочное, чем |ретичная и тем более вторичная структура. Мсжсубъсдиничные контакты во многом определяются водородными связями, с по- мощью которых могут, например, контактировать между собой 0- складчатые листы протомеров. Существенную роль выполняют и гидрофобные взаимодействия на контактных площадках субъеди- ниц, осуществляемые между гидрофобными радикалами амино- кислотных остатков. Так, например, состоящая из двух субъеди- ниц эпимолскула фермента алкогольдегидрогеназы млекопитаю- щих образуется благодаря гидрофобному взаимодействию 18 ами- нокислотных остатков и образованию 8 водородных связей между протомерами. Определенное место в формировании четвертичной с труктуры играют и электростатические взаимодействия между не- сущими противоположные заряды радикалами аминокислотных остатков. Белки, обладающие четвертичной структурой, как правило, содержат четное число субъединиц и представляют собой диме- ры, тетрамеры, гсксамеры, октамеры и т.д. Число димеров и тет- рамеров резко преобладает среди изученных белков. Четное число субъединиц, очевидно, отражает общий принцип симметрии, свой- ственный живой природе. Белки с нечетным числом субъединиц представляют собой относительно редкое явление, и часть из них выполняет очень важные и своеобразные функции у многих орга- низмов. Так, тримерами являются некоторые из GTP-связываю- щпх белков (G-белки). Их основная функция состоит в передаче сигналов внутрь клетки или в различных ее компартментах, хотя часть из них выполняют и иные функции (участвуют в биосинтезе белка и других энергоемких процессах). G-белки обладают спо- собностью гидролизовать GTP до GDP и фосфата, переходя из активного состояния (комплекс G-белок — GTP) в неактив- ное состояние (комплекс G-белок — GDP). СТРазная активность G-белков приводит к высвобождению энергии макроэргических свя- зей GTP, которая и используется для передачи сигналов. К G-белкам относится, например, трансдуцин, который уча- ствует в передаче и усилении светового сигнала, выступая в каче- стве компонента комплекса белков (трансдуцин-родопсин-фос- 59
фодиэстсраза циклических нуклеотидов), обеспечивающих воспри- ятие и многократное (5- 10э раз) усиление светового сигнала в сетчатке глаза. Молекула трансдуцина состоит из трех различных субъединиц (Тц, Тр и Ту), из которых ОТРазной активностью обла- дает субъединица Та. Сходное строение имеют белки Gs и G, — компоненты широко распространенной в живых системах адени- латциклазной системы, участвующие, в частности, в передаче гор- мональных сигналов внутрь клеток-мишеней. Эти белки способны воспринимать сигнал от белка-рецептора гормона и передавать его аденилатциклазе — ферменту, осуществляющему синтез сАМР — вторичного мессенджера (посредника), который в свою очередь регулирует активность целого ряда внутриклеточных ферментов и соответствующих биохимических процессов. Белки Gs и G,, как и трансдуцин, представляют собой тримсры, состоящие из различ- ных субъединиц (а, 0, у). Gs и Gj называют соответственно стиму- лирующим и ингибирующим белками, способными альтернатив- но влиять на активность аденилатциклазы. У Отбелка субъедини- ца а способна связывать и гидролизовать GTP, что ведет к измене- Hs Hi Мембрана Цитоплазма АТР с АМР Рис. 24. Схема участия G-белков в передаче гормонального сигнала адс- нилатциклазс. Гормоны (Н, и Н|) передают сигнал соответствующим рецепторам (R, и Rj), с которых он далее поступает па белки G, и Комплексы а-субъедпппц (а, и а;) с GTP либо стимулируют, либо ингибируют активность аденилатциклазы (С). Адеиилатциклаза катализирует образование сАМР из АТР 60
нию конформации G-белка и аденилатциклазы, которая перехо- дит в активное состояние (рис. 24). Комплекс субъединицы a, GDP, субъединиц Р и у представляет собой неактивную форму белка (a-GDP—p-у). Замещение GDP па GTP в этом комплексе резко убыстряется под действием стимулирующего рецептора !<;, рас- положенного в мембране. Присоединение GTP ведет к диссоциа- ции четвертичной структуры на две составляющие: димер субъе- диниц р-у и мономер a-GTP, который и представляет собой ак- тивную форму Gs-6ejiKa. Последняя вступает во взаимодействие с аденилатциклазой и активирует ее, что приводит к многократно- му увеличению концентрации сАМР и соответствующему изме- нению внутриклеточных процессов. Продолжительность действия Gj-белка на аденилатциклазу определяется временем гидролиза GTP под действием а-субъединицы, по истечении которого ком- плекс Gs-a-GDP вновь соединяется с димером р-у-субьединиц, и белок возвращается в неактивное состояние. Пространственная структура гримера Gj-белка представлена на рис. 25. На этом же рисунке приведены структуры двух других G- белков: GTP-связываюшего фактора элонгации трансляции (био- синтеза белка) EF-T,, бактерий (см. гл. 11) и белка Ras, участвую- щего в пролиферации клеток млекопитающих. Последние два белка нс имеют четвертичной структуры, однако обладают выраженной гомологией первичной и третичной структур в области связыва- ния GTP и GDP. Важным родственным элементом структур этих белков является участок, содержащий спираль (switch II) и осу- ществляющий контакт с у-фосфатной группой GTP. Филогенети- ческое родство G-белков, выделенных из разных организмов, проявляется в консервативных аминокислотных последовательно- стях, выявленных в составе этих белков (участки G-l —G-5 белка Ras на рис. 25) у бактерий, одноклеточных, млекопитающих и человека. В составе белков с четным числом субъединиц могут содер- жаться идентичные или различные по структуре протомеры. Так, фермент альдолаза из скелетных мышц кролика состоит из четы- рех одинаковых субъединиц, а гемоглобины млекопитающих (также тетрамеры по структуре) содержат в своем составе две пары раз- личных субъединиц: две субъединицы типа а и две субъединицы типа р. Таким образом, четвертичная структура гемоглобинов от- вечает формуле 2а2р. В обоих вышеотмеченных примерах тетра- мерных белков их протомеры пространственно расположены в вершинах тетраэдра (рис. 26). Наиболее яркие примеры четвертич- ной структуры можно найти среди каталитически активных бел- ков — ферментов, для которых особенно характерна взаимосвязь структуры и функциональных свойств. Димерами, состоящими из субъединиц одного вида (гомоди- мерами), являются альдегидоксидорсдуктаза (см. рис. 15) и эндо- 61
G-2

Рис. 25. Строение G-бслков (Sprang S. R. //Ann. Rev. Biochcm. — 1997. — V. 66. - P. 639): A — гетеротримср белка Gj, связанный с плазматической мембраной (поверхно- сти субъединицы у (слева) и субъединицы а (справа), контактирующие с мемб- раной, выделены темным цветом; SI, SII. SIII — участки а-субъсдппицы; моле- кула GDP связана с а-субъсдипнисй); Б — структура фактора элонгации транс- ляции (EF-Tu) бактерии Thermits aquatints, связывающего комплекс GDP — Mg+2; В. Г — структура белка Ras (/'— комплекс белка Ras с GDP — Mg+2; В — комплекс белка Ras с нсгидролизусмым аналогом GTP (GrrCr); а(—aj — а-спирали; 0,—06 — 0-структуры; G-J —G-5 — гомологичные области, свойствен- ные многим G-белкам) нуклеаза рестрикции (рестриктаза) Ват HI, схема строения ко- торой представлена на рис. 27. Рестриктаза Ват HI, выделенная из Bacillus amyloliquefacions и относящаяся к рестриктазам типа II (под- робнее о рестриктазах см. гл. 14), представляет собой димер и свя- зывается с ДНК, находящейся в В-форме. После связывания с ДНК молекула этого фермента претерпевает ряд конформацион- ных изменений, в результате которых отдельные участки поли- пептидных цепей каждой из субъединиц образуют своеобразные структуры («руки»), которые служат для плотного контакта с ДНК (см. рис. 27, В). «Рука» одной субъединицы входит в малую борозду ДНК, а «рука» другой субъединицы взаимодействует с сахаро- фосфатным остовом на другой стороне двойной спирали ДНК. Узнавание зоны расщепления цепей ДНК происходит в основном в зоне большой борозды (большого желоба) молекулы ДНК. | | а-Субъединицы 0-Субъединицы Рис. 26. Модель четвертичной структуры гемоглобина ] Группы гема 63
Рис. 27. Структура рсстрпктазы Ват HI. взаимодействующей с ДНК: .1 — структура комплекса Ват Н1-ДНК. Две субъединицы фермента (L и R) расположены соответственно слева и справа от обозначенной внизу молекулы ДНК: />' — R-еубъслипниа рсстрпктазы Ват HI (показано расположение а-сни- ралей (а, и,) и p-слоев (|lj—ря): цифрами обозначено расположение отдель- ных аминокислотных остатков начиная с N-конна молекулы, С — карбоксиль- ный копен молекулы); В — взаимодействие отдельных структурных элементов R- и 1.-субъелп1Н1Н рсстрпктазы с молекулой ДНК (спирали и петли вторич- ной структуры субъединицы R выделены темным цветом, соответствующие эле- менты L-субъедипицы — серым) 64
Среди белков, взаимодействующих с ДНК, выявлены молеку- лы, имеющие своеобразную тороидальную (кольцевую) структуру. В целом образование замкнутых структур (колец, трубок или сфе- рических эпимолскул) дополнительно стабилизирует четвертич- ную структуру за счет увеличения общего числа контактов между протомерами. К таким белкам относятся, в частности, «белки скользящего зажима (обруча)». Так, у Е. coli выявлен белок коль- цевой формы, являющийся интегральной частью белкового ком- плекса, обеспечивающего репликацию ДНК (см. гл. 7). Белки, рас- плетающие двойные спирали ДНК в ходе репликации и называе- мые .хеликазами, также имеют кольцевую структуру и представля- ют собой гексамеры. Число субъединиц в мультимерных молеку- лах тороидальных белков варьирует в широких пределах (от 6 — 7 до 12-15). Еще более крупными молекулами представлены в природе белки ферритины, служащие для связывания и депонирования железа у различных видов животных и растений. Так, в эпимолекуле фер- ритина животных, которая представляет собой сферическую мо- лекулу, содержится 24 субъединицы, между ними располагаются полости (каналы) для проникновения оксидов железа. Внутри центральной полости ферритина насекомых могут быть связаны <500 атомов железа на I молекулу такого белка-мультимера. Ана- логичные каналы выявлены и у ферритинов растений (рис. 28). Среди ферментов достаточно часто встречаются белки, содер- жащие различные по структуре и функциям субъединицы. Гетеро- димерной структурой обладают протеинкиназы (ферменты, спо- собные фосфорилировать определенные аминокислотные остатки в различных белках), одна из субъединиц которых является соб- ственно каталитической (субъединица типа С), а другая — регу- ляторной (R). Последняя может связываться с сАМР, что перево- Рис. 28. Компьютерное изображение структуры молекулы апоферритина из семян гороха. Молекула состоит из 4 субъединиц. Гил- рофпльныс остатки His и Arg, принад- лежащие четырем субъединицам, фор- мируют каналы, куда проникают ионы железа. Показаны также остатки Тгр, расположенные на границах раздела субъедипин Комичен 65
дит фермент в активное состояние. Гетеромультимером, состоя- щим из нескольких различных субъединиц, является и РНК-по- лимераза (см. гл. 9). Впечатляющим примером сложной четвертичной структуры может служить молекула аспартаткарбамилзрансферазы К. coli. Формула четвертичной структуры этого фермента может быть за- писана так: (C3)2(R2)3, т.с. в составе данного белка имеются шесть каталитических субъединиц, объединенных в два тримера, и шесть регуляторных субъединиц, образующих три димера. Регуляторные субъединицы могут взаимодействовать с активатором (АТР) или ингибитором (СТР), что влечет за собой изменение конформаци- онного состояния эпимолекулы. В зависимости от того, какой эф- фектор присоединяется к регуляторным субъединицам, молекула фермента может приобретать рыхлую (релаксированную) форму (R-форма), которой свойственна высокая активность, либо более плотную и менее активную форму (Т-форма). В целом наличие различных молекулярных форм у белков, об- ладающих четвертичной структурой, представляет собой доста- точно распространенное явление, обусловленное относительной подвижностью отдельных субъединиц в эпимолекуле. Существо- вание таких множественных форм имеет фундаментальное значе- ние для регуляции их функциональной активности в клетке, от- дельных ее компартментах, а также в тканях и органах высших организмов. От четвертичной структуры следует отличать олигомерное со- стояние белков. Многие белки обладают способностью образовы- вать структуры с изменяющимся в определенной пропорции чис- лом полипептидных цепей, однако это не связано с возникнове- нием или исчезновением специфических функций. Так, сыворо- точный альбумин быка может существовать не только в виде мо- номера (67 кДа), по и в виде димера, тримера и тетрамера, что, однако, не ведет к появлению каких бы то ни было новых функ- ций. Нс обладают, по существу, четвертичными структурами и белковые молекулы, возникающие в результате расщепления (ог- раниченного протеолиза) белков-предшественников и состоящие в связи с этим из нескольких полипептидных цепей. Примерами таких белков могут служить химотрипсин (возникает из белка- предшественника — прохимотринсина — и состоит из трех поли- пептидпых цепей, ковалентно связанных между собой дисульфид- ными мостиками) и инсулин. Молекула инсулина состоит из двух полипептидных цепей — А и В, содержащих соответственно 21 и 30 аминокислотных остатков. Эти цепи образуют единую структу- ру с дисульфидными связями, которая получается после выреза- ния из проинсулина связующего пептида С, в результате чего инсулин приобретает свойственные ему гормональные функции (рис. 29). 66
Проинсулин В SH SH Ин сулил Сближение А- и В-участков молекулы проинсулина и образование дисульфидных мостиков С Протеолитическое вьпцепление пептида С приводит к образованию зрелой молекулы гормона 1’пс. 29. Образование активной формы инсулина из молекулы предше- ственника (проинсулина) путем выщеплепия С-пептида (пояснения в тексте) К четвертичной структуре не следует относить и надмолекуляр- ные белковые и ферментные комплексы — мультиэнзимные (поли- ферментпые) комплексы и метаболоны. Образование таких струк- тур связано с необходимостью поддержания высоких скоростей метаболических превращений в живой клетке. Иными словами, скорость обновления (синтеза) молекул должна преобладать над скоростью их распада. Быстрое обновление принципиально важ- ных для клетки соединений (ключевых метаболитов) зависит от эффективности работы ферментов, катализирующих соответству- ющие реакции, чья скорость в свою очередь лимитируется воз- можностями столкновения ферментов с их субстратами, т.е. эле- ментарным процессом диффузии. С другой стороны, объединение ферментов в достаточно устойчивые комплексы способно суще- ственно упростить (ускорить) протекание серии химических ре- акций за счет адресной передачи метаболитов от одного фермента к другому. Среди такого рода полиферментных комплексов можно различать абсорбционные и интегральные ансамбли ферментов. Ад- сорбционные ансамбли образуются за счет сил слабых (не кова- лентных) взаимодействий между молекулами ферментов на по- верхности мембраны либо какой-то крупной центральной (коро- вой) молекулы. Интегральные комплексы оказываются встроены по внутриклеточные мембраны. К интегральным комплексам от- носятся, например, цепочки окислительно-восстановительных ферментов (цитохромов), встроенные во внутренние мембраны 67
+24 молекулы пируватдекар- боксилазы +12 молекул дигидролипоил- дегидрогеназы 8 тримсров дигидролипоил- трансацетилазы Рис. 30. Строение мультиэнзимного ком- плекса окислительного декарбоксили- рования пировиноградной кислоты. Этот комплекс катализирует превращение пировиноградной кислоты в апстпт-СоЛ митохондрий. Эти ансамбли фермен- тов осуществляют быструю переда- чу электронов с окисляемого суб- страте! на кислород, благодаря чему создаются условия для сопряженно- го с этим процессом синтеза АТР. Интенсивность работы такой систе- мы ферментов столь высока, что по- зволяет одной клетке за 1 — 2 мин полностью возобновлять запасы АТР (107 молекул), а весь организм человека способен синтезировать около I г АТР в минуту. К адсорбционным комплексам можно отнести полифермент- пый комплекс окислительного декарбоксилирования пировиног- радной кислоты (ПВК), состоящий из трех ферментов, каждый из которых в этом комплексе представлен определенным числом молекул (рис. 30). Этот мультиэнзимный комплекс осуществляет быстрое превращение ПВК в другой ключевой метаболит — аце- тил-СоА. Еще более крупные адсорбционные комплексы носят на- звание метаболонов — ансамблей ферментов, катализирующих се- рию реакций, составляющих определенный метаболический путь. В составе известных метаболонов гликолиза и цикла Кребса входит более 10 различных ферментов, между которыми возможна ад- ресная «эстафетная» передача субстратов. Один из видов полиферментных комплексов — протеасомы. Это крупные, имеющие определенный план строения комплексы протеолитических ферментов, расщепляющие различные внутри- клеточные белки. Они обнаружены у самых разных организмов (от архибактерий до человека) и представляют собой существенный компонент ATP-зависимого протеолиза, в ходе которого осуще- ствляется исключительно быстрая деградация прежде всего ано- мальных белков, возникающих либо вследствие мутаций, либо в результате ошибок белоксинтезирующей системы. Протеасомы рас- щепляют белки, как правило, до коротких пептидов, которые затем гидролизуются до отдельных аминокислот цитоплазматическими экзопептидазами. Протеасомы, выделенные из разных объектов, имеют молекулярную массу около 2000 кДа (265-протсасомы) и весьма сходны по структурно-функциональной организации. По 68
Рис. 31. Схема строения протеасомы из Therntoplasma acidophillum (Coldberg A.L. 11 Science. — 1995. —V. 268. — P. 522): . 1 — общий план строения 205-протсасомы; Б — 205-протсасома в разрезе. Два внешних кольца состоят из семи а-субъсдпппц каждое; мол. масса субъедини- цы — 25,9 кДа. Дна внутренних кольца состоят из семи р-субъедпини каждое; мол. масса субъединицы — 22,3 кДа. Кольца образуют центральный канал с тре- мя камерами, входы в которые располагаются в верхней и ппжпеп частях комп- лекса между а-субъеднпицами современным данным, протеасома содержит по крайней мере 28 протомеров (отдельных белковых глобул), собранных в стопку из 4 колец по 7 протомеров в каждом кольце, внутри стопки распо- лагается полость, где и происходит деструкция белков (рис. 31). Два внешних кольца формируются а-субъедипицами, выполняю- щими регуляторную функцию, а два внутренних — р-субъедини- пами, которые обладают протеолитической активностью. Моле- кулярные массы протомеров варьируют от 22 до 35 кДа, причем различные протомеры нс всегда представлены в равной степени. Например, дрожжевые протеасомы содержат 14 различных ти- пов протомеров, протеасомы растений — 12—15, а другие эука- риотические протеасомы могут включать до 25 различных белков. В составе некоторых протсасом выявлены РНК, состоящие при- мерно из 80 нуклеотидных остатков. Протеасомы присутствуют не только в цитоплазме, но и в ядрах клеток, а также в эндоплазматическом ретикулуме, одна- ко их содержание особенно высоко в цитоплазматическом мат- риксе (нс менее 50%). Рентгеноструктурный анализ показал, что 208-протеасома из Thermoplasma acidophillum имеет форму бочон- ка (14,8 11,3 нм) с проникающим центральным каналом и тремя большими внутренними камерами. Доступ в полость осуществля- ется через узкие отверстия в центре каждого кольца. Отверстия внешних колец составляют всего 1,3 нм в диаметре, что чуть боль- ше диаметра а-спиралей и указывает на необходимость развора- 69
сердцевина молекулы Рис. 32. АТР-завнеимый механизм деструкции белка (S) с участием убик- витина н протеасомы (пояснения в тексте): А — схема процесса с участием ферментов (Еь Е2, Е?), осуществляющих полп- убпквптпровапис белка; Б — трехмерная структура убиквитина; Е, — убнквитнп- актниируюшпп фермент; Е, — переносчик убиквитина; Е, — убнкнптиппротс- иплнгаза; Ubi — убиквитин чивания белковых молекул перед их проникновением в протеасо- мы. Отдельные протомеры обладают различной специфичностью в отношении пептидных связей расщепляемых ими белков, что способствует быстрой деструкции последних в полости протеасом. В составе протеасом имеются трипсинподобныс и химотрипсин- подобные протеиназы, а также постглутамилпротеиназы (о спе- цифичности протеиназ см. выше). Механизм расщепления белков протеасомами связан с действием особого внутриклеточного бел- ка — убиквитина, молекулярная масса которого 8500 Да (76 ами- нокислотных остатков) (рис. 32). Этот белок способен с участием АТР и трех специализированных ферментов связываться с подле- жащим расщеплению белком. Образующийся полиубиквитиниро- ванный белок далее вовлекается в протеасому, где и деструктнру- ется до коротких пептидов. Активная 265-протеасома имеет фор- 70
Рис. 33. Электронная микрофото- графия 265-протеасомы (Ann. Rev. Biochem. — 1996. — V. 65. — Р. 802). Этот белконый комплекс имеет форму । пмнастической гири. ин₽-субъеди- ницы 20S-протеасомы. Справа и слева or а-субъелипиц протеасомы распола- гаются белковые комплексы РА 700. выполняющие роль активаторов и име- ющие большие V-образные ппячива- ппя — места входа субстрата му гимнастической гири (рис. 33). В центре се расположено цилин- дрическое образование (205-протсасома), а по бокам — два до- полнительных белковых комплекса (195-комплексы, или шапоч- ки — кэпы), служащие активаторами протеасомы и содержащие места входа субстрата. Присоединение этих активаторов, называе- мых РА 700, влечет за собой изменение конформации централь- ной части протеасомы и практически мгновенно переводит ее в активное состояние. Этот процесс имеет ATP-зависимый харак- тер, и часть протомеров протеасом обладает АТРазной актив- ностью, поставляющей энергию для связывания 205-протеасом с РА 700 и, вероятно, необходимой для разворачивания белковых молекул перед их вхождением в протеасому. Заканчивая рассмотрение структуры белков, отмстим кратко некоторые аспекты их структурно-функциональной эволюции. Принцип усложнения жизненных форм в процессе биологиче- ской эволюции оказывается в целом вполне применим к эволю- ции белков. Большинство современных белков состоит из несколь- ких сотен аминокислотных остатков, и вместе с тем в природе существуют короткие, составленные не более чем из нескольких десятков остатков биологически активные пептиды. Главенству- ющий и, очевидно, сложившийся на самых ранних этапах эво- люции матричный принцип биосинтеза белков позволяет счи тать, что более протяженные полипептиды появились в результате на- ращивания или слияния более коротких генов. Увеличение разме- ров полипептидной цепи открывало возможность для образова- ния серии изгибов (петель) и обособления отдельных фолдов, возникающих в процессе сворачивания (фолдинга) цепей в про- странстве. Это постепенно привело к возникновению вторичной, сверхвторичной и доменной структуры глобулярных белков, т.е. к последовательной (плавной) эволюции их структуры. С другой сто- роны, слияние генов или внедрение чужеродных (вирусных) ге- нов могло приводить к быстрому скачкообразному изменению 71
структуры белков, появлению белковых коныогатов, к которым, вероятно, принадлежат вышеохарактеризованныс полифункцио- нальные белки. Необычные сточки зрения «традиционной» эво- люции белковые структуры могли, видимо, возникать в результа- те внедрения вирусных кДНК в геномы уже достаточно процесси- рованных форм жизни. Возникновение в результате мутаций ал- лельных вариантов генов, их рекомбинация еще более увели- чивали разнообразие белковых структур, не имеющее аналогов среди прочих макромолекул. Молекулярным аспектам кодирова- ния и декодирования белковых тел посвящены последующие гла- вы этой книги.
Глава 3. НУКЛЕИНОВЫЕ КИСЛОТЫ Нуклеиновые кислоты играют основную роль в хранении и реа- лизации генетической информации. Различают два вида нуклеино- вых кислот: дезоксирибонуклеиновые кислоты (ДНК), которые обеспечивают храпение генетической информации, и рибонуклеи- новые кислоты (РНК), принимающие участие в се реализации. Хромосома прокариотической клетки представляет собой одну длин- ную двуцепочечную молекулу ДНК, собранную в компактное обра- зование — нуклеоид. Эукариотические клетки содержат большое число молекул ДНК, которая неравномерно распределена по несколь- ким хромосомам в виде комплексов с многочисленными белками. Вирусы также содержат в качестве генетического материала нукле- иновые кислоты: у одних это ДНК, у других РНК. В реализации генетической информации принимают участие различные виды РНК. ПЕРВИЧНАЯ СТРУКТУРА НУКЛЕИНОВЫХ КИСЛОТ Нуклеиновые кислоты являются биологическими полимерами. Мономерными звеньями ДНК и РНК являются нуклеотиды (рис. 34) — фосфорные эфиры нуклеозидов, которые, в свою очередь, построены из пентозы и гетероциклического основания. В РНК углеводный компонент — D-рибоза, в ДНК — D-2-дезоксири- боза. Связь между углеводным остатком и гетероциклическим ос- нованием в нуклеотиде осуществляется с помощью N-гликозид- ной связи. В качестве гетероциклических оснований ДНК содер- жит два пурина: аденин (А) и гуанин (G) и два пиримидина: тимин (Т) и цитозин (С). В РНК вместо тимина содержится ура- цил (U). Мономерные остатки в нуклеиновых кислотах связаны между собой фосфодиэфирными связями. Как в ДНК, так и в РНК, эта связь осуществляется только за счет З'-ОН одного нуклеотидного остатка и 5'-ОН другого. Такую межнуклеотидную связь называют 3',5’-фосфодиэфирной. Цепи ДНК и РНК обладают определенной полярностью, или направлением, поскольку все межнуклеотид- пые фосфодиэфир! 1ые связи ориентированы вдоль цепи одннако- 73
A H H О II -О-Р-О I -О Фосфат 3-1 I ОН R R - ОН (Аденозин) R = Н (Дезоксиадепозип) Нуклеозид Б Нуклеотид ОН ОН Дезоксиадепозпн-5’- моиофосфат (dAMP) Дезокситпмндип-5'- мопофосфат (dTMP) ОН Дезоксигуанозпи-З'- монофосфат (dGMP) Дезокси ЦИТ11ДИН-5'- мопофосфат (dCMP) 74
Адепози11-5'-мопофосфат (AMP) Уридип-5'-монофосфат Гуапоз>|||-5'-мо11офосфат (GMP) Рис. 34. Структурные формулы нуклеотидов — компонентов нуклеино- вых кислот: I —химическое строение нуклеотида; Б — дезоксирибопуклсотилы, встречаю- щиеся в ДНК; В — рибонуклеотиды, встречающиеся в РНК (UMP) Цнтиди11-5'-монофосфат (CMP) но. Благодаря полярности каждая полинуклеотидная цепь имеет 5'-конец и З'-конец (рис. 35). Из-за наличия 2'-ОН группы у рибо- зы межнуклеотидные связи в РНК значительно мобильнее, чем в ДНК; они легко гидролизуются в присутствии щелочи. После окончания цикла синтеза ДНК некоторые пуриновые и пиримидиновые основания могут подвергаться химической мо- дификации. Модификация пуринов и пиримидинов характерна и для РНК (рис. 36). В ней присутствуют 2'-О-метилнуклеотиды, а также может наблюдаться иной способ связывания между ураци- лом и рибозой (так называемая псевдоуридиловая кислота). Мо- дифицированные нуклеотиды достаточно часто встречаются в тРНК. Как и у ДНК, модификация оснований и рибозных остат- ков в РНК происходит после завершения синтеза РНК, а не на стадии биосинтетических предшественников. 75
5'-копец Н Н . I . V 5'-копец Н Н I W о н н I \ / ~О-Р=о N V Л Н,С5' N'T) Цитозин о О I \ / 'О-Р=о N О “О-Р=О I О З'-КОИСЦ А 'О-Р=О I О I З'-коиец Б А С G Т Рис. 35. Связь между нуклеотидами в полинуклсо- тидной цепи: pApCpGpTp 5---------►З' А — полидезоксирибоиуклсотид; Б — полнрпбопуклсо- тид; В — способы схематаческого изображения нуклеотид- ной последовательности (нуклеотидную последовательность принято изображать слева направо, от 5' к З'-копцу) ACGT 5'-------► 3' В 76
5-Метилцитозин 5- Гндроксиметил- цитозип (НМС) 5'-Гидрокси- мстилурацил сн,он Н Глюкозил-НМС О Псепдоурилпп (у) 5.6-Днпщроуридип (DHU) I Рибоза 5-Метилуриднп- риботпмидин (гТ) Рибоза 4-Тноуридии (4-ihio U) 2М-Метилгуаноз1111 (2mcG) 5-Метилцптид||1| Инозин (I) (5-теС) но—н,с 2’-0-Метил- „ нуклеозид । ’Ы-Метилгуалнловая кислота сн3 'N-Метнладеииловая кислота frl Рис. 36. Структурные формулы минорных пуриновых и пиримидиновых оснований, обнаруженных в составе ДНК (Л) и РНК (Б) 77
Определение нуклеотидной последовательности ДНК и РНК. Ис- ходную молекулу ДНК предварительно фрагментируют с помо- щью рестриктаз, причем осуществляют независимое расщепле- ние двумя и более рестриктазами, в результате чего образуются перекрывающиеся фрагменты. Это позволяет после определения нуклеотидной последовательности соответствующих фрагментов реконструировать первичную структуру всей ДНК. Существуют два принципиально различных подхода к опреде- лению первичной структуры ДНК. В основе одного лежат хими- ческие реакции, в которых используются непосредственно фраг- менты очищенной ДНК, во втором случае используют ДНК-ко- пии очищенных сегментов, полученных ферментативным путем (см. с. 375). Оба метода полностью автоматизированы. При секве- нировании ДНК по Сангеру (второй метод) вводят флуоресцент- ные метки, причем для каждого из четырех анализируемых нук- леотидов используются флуоресцирующие агенты с различными спектральными характеристиками, что позволяет осуществить ска- нирование гелей при разных длинах волн и передавать данные непосредственно в компьютер. Полная нуклеотидная последовательность многих видов РНК (длиной до 250 — 300 нуклеотидов) может быть прямо определена с помощью метода Максама —Гилберта (см. с. 373). Наряду с хи- мическим расщеплением секвенирование РНК можно проводить путем гидролиза ее цепи специфическими РНКазами. В настоящее время для определения нуклеотидной последова- тельности достаточно протяженной полинуклеотидной цепи РНК (например, мРНК) секвенируют ген (т.е. ДНК), в котором эта РНК закодирована. Для этой цели выделяют необходимую РНК и с помощью обратной транскриптазы синтезируют кДНК (см. с. 358), которую и используют в анализ. Компьютерный анализ нуклеотидных последовательностей. На первый взгляд длинные ряды оснований кажутся совершенно за- гадочными и не поддающимися расшифровке (рис. 37). Проблему расшифровки решают с помощью высокоэффективных компью- терных программ, которые пригодны для поиска как структур- ных, так и биологических особенностей этих последовательно- стей. С помощью программ можно вычислить нуклеотидный со- став, выявить участки, богатые пуринами, пиримидинами или определенными сочетаниями оснований, определить частоту встре- чаемости различных динуклеотидов. Так, одной из характеристик первичной структуры ДНК является частота встречаемости в опре- деленном соседстве любых двух оснований. Частота встречаемости 5'-CG-3' и 5'-GC-3' в ДНК прокариот почти одинакова и близка к случайной; то же самое можно сказать и о динуклеотидах 5'-GA-3' и 5'-AG-3'. Однако в ДНК вирусов, животных и растений частоты встречаемости 5'-CG-3' составляют от 1/2 до 1/5 частот 5'-GC-3'. 78
60 pCGGAGTTAGGGGCGGGATGGGCGGAGTTAGGGGCGGGACTATGGTTGCTGACTAATTGAG IIOGCCTCAATCCCCGCCCTACCCGCCTCAATCCCCGCCCTGATACCAACGACTGATTAACTC 120 ATGCATGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGTTGCTGACTAATTGAGATGCA TACGTACGAAACGTATGAAGACGGACGACCCCTCGGACCAACGACTGATTAACTCTACGT • • . • iso TGCTTTGCATACTTCTGCCTGCTGGGGAGCCTGGGGACTTTCCACACCCTAACTGACACA ACGAAACGTATGAAGACGGACGACCCCTCGGACCCCTGAAAGGTGTGGGATTGACTGTGT XD Рис. 37. Первичная структура ДНК вируса SV40. Показана последовательность нуклеотидов с 1-го по 180-н п.п. (всего 5226 н.п.)
Таким образом, последовательность 5'-CG-3' встречается в ДНК высших эукариот довольно редко; это связано со способностью данного динуклсотида служить мишенью при метилировании и с его ролью в регуляции экспрессии генов. Соответствующие про- граммы позволяют выявить специфические субпоследователыгос- ти в пределах определенного сегмента, что часто используется при нахождении сайтов для рестриктирующих эндонуклеаз. Имеющи- еся программы осуществляют также поиск характерных особен- ностей последовательностей, включая прямые и обратные повто- ры. Можно получить данные о гомологии или частичной гомоло- гии различных последовательностей. Это может касаться структу- ры одного и того же гена у двух разных организмов или родствен- ных генов одного организма. Такой сравнительный анализ широ- ко используется при изучении эволюции на молекулярном уров- не. Разработаны программы, позволяющие предсказать стабиль- ную вторичную структуру одноцепочечных РНК или ДНК. С по- мощью компьютерных программ можно перевести информацию с языка нуклеотидов па язык аминокислот в соответствии с пра- вилами генетического кода; обнаружить последовательности со спе- цифическими свойствами (например, промоторы и участки свя- зывания с рибосомами). Созданы международные банки данных о последовательностях нуклеотидов в ДНК разных организмов (такие, как GcnBank, EMBL/DDBJ) и о последовательностях аминокислот в белках (PIR/SwissPot, на основе нуклеотидной последовательности со- ответствующих генов). Можно практически беспрепятственно войти в эти банки данных и воспользоваться собранной там информа- цией. Конформации компонентов нуклеиновых кислот. Все пять гете- роциклических оснований, входящих в состав нуклеиновых кис- лот, имеют плоскую конформацию. В то же время для остатков рибозы и дезоксирибозы плоская конформация (когда атомы уг- лерода СГ, С2', СЗ', С4' и гетероатом кислорода находятся в одной плоскости) энергетически невыгодна. Среди многочис- ленных теоретически возможных конформаций этих остатков в иол и нуклеотидах реализуются только две: либо С2'-эндо-, либо СЗ'-эндокопформации (рис. 38). Нуклеотидная единица с З'-эн- доконформацией углеводного остатка имеет меньшую длину, чем 2'-эндоизомер (рис. 39). Важнейшей характеристикой в определении конформаций нук- леотидного звена является взаимное расположение углеводной и гетероциклической частей, которое определяется углом вращения вокруг N-гликозидной связи. Теоретический анализ конформации нуклеозидов и нуклеотидов и рентгеноструктурные исследования показали, что здесь существуют две области разрешенных конфор- маций, называемых сип- и лл/ии-конформациями (рис. 40). 80
5' 5’ 3’ СЗ'-эндо- 2' С2’-Э1шо- Рис. 38. Две конформации углеводных остатков, встречающиеся в ДНК и РНК. СР. О и С4' расположены в одной плоскости, С2' или СЗ' находятся н эндокон- формации, когда они выведены над этой плоскостью, т.е. в направлении свя- зи С4'-С5' В свободных нуклеозидах и нуклеотидах переход от С2'-эндо- к С’З'-эндо- и между син- и лшгш-конформациями происходит доста- точно легко. Если же нуклеотидный остаток встроен в полинуклео- тид! тую цепь, то его конформация при данных внешних условиях оказывается фиксированной: в обычных формах полинуклеотидов мономерные звенья имеют исключительно лл/ли-конформацию. В полирибонуклеотидах углевод чаще всего находится в З'-эн- доконформации, тогда как в полидезоксирибонуклеотидах он Рис. 39. Возможные конформации нуклеотидных единиц: А — СЗ'-эпдокопформация; Б — С2'-эндоконформация 81
мтии-Цитидип С'КИ-ЦПТИДИП нон,с О он он ««/-Гуанозин оя/,1(/-Гуанозп11 Рис. 40. Анти- и сии-конформацип в нуклеотидах Может быть как в З'-эндо-, так и в 2'-эндоконформации. Это при- водит к тому, что число конформаций, возможных для ДНК, боль- ше, чем для РНК. МАКРОМОЛЕКУЛЯРНАЯ СТРУКТУРА ДНК Двойная спираль ДНК (модель Уотсона —Крика). В 1953 г. Дж. Уотсон и Ф. Крик предложили модель структуры ДНК. При построении модели ученые основывались на четырех группах дан- ных: 1. ДНК представляет собой полимер, состоящий из нуклеоти- дов, соединенных 3'-5'-фосфодиэфирными связями. 2. Состав нуклеотидов ДНК подчиняется правилам Чаргаффа: в любой ДНК содержание пуриновых нуклеотидов (A+G) всегда Равно содержанию пиримидиновых нуклеотидов (Т+С); число остатков А всегда равно числу остатков Т, число остатков G — Числу остатков С. 3. Рентгенограммы волокон ДНК, впервые полученные М. Уил- кинсом и Р. Франклин, указывают на то, что молекула обладает спиральной структурой и содержит более одной полинуклсотид- ной цепи. 82
4. Кислотно-щелочное титрование ДНК показывает, что ее структура стабилизируется водородными связями. Титрование и на- гревание нативной ДНК вызывает заметные изменения ее физи- ческих свойств, в частности вязкости, переводя ее в «денатуриро- панную» форму, причем ковалентные связи при этом не разруша- ются. На основании этих данных Д. Уотсон и Ф. Крик предложили трехмерную модель ДНК, которая объясняла результаты рентге- ноструктурного анализа и характерную для ДНК парность осно- ваний (рис. 41). Согласно их модели молекула ДНК представляет собой правильную правовинтовую спираль, образованную двумя нолинуклеотидными цепями, закрученными друг относительно друга и вокруг общей оси. Две пол и нуклеотидные цепи, располо- женные по периферии молекулы, имеют антипараллельную ори- ентацию (рис. 42). Это означает, что если двигаться вдоль оси спи- рали от одного ее конца к другому в одной цепи, фосфодиэфир- пые связи имеют направление 3'—> 5', а в другой — 5'-> 3', т.е. на каждом из концов линейной молекулы ДНК расположены 5'-ко- нец одной цепи и З'-конец другой цепи. Диаметр спирали посто- янен вдоль всей ее длины и равен 2,0 нм. Гидрофильные пентозофосфатные остовы цепей расположены на внешней стороне двойной спирали. Гидрофобные пуриновые и пиримидиновые основания обеих цепей уложены стопкой с ин- тервалом 0,34 нм и направлены внутрь спирали; плоскости колец гетероциклических оснований перпендикулярны главной оси спи- рали. Длина витка спирали (полный оборот спирали), который соответствует ее периоду идентичности, составляет 3,40 нм. На один виток спирали приходится 10 нуклеотидных остатков в од- ной цепи. Двойная спираль стабилизируется с помощью водородных свя- зей между пуринами одной цепи ДНК и пиримидинами другой, а именно, между А и Т, G и С. Основания, образующие пары, в которых они сочетаются водородными связями, получили назва- ние комплементарных пар. В АТ-паре основания соединены двумя водородными связями: одна — между амино- и кетогруппами, другая — между двумя атомами азота пурина и пиримидина соответственно. В GC-nape имеются три водородные связи: две из них образуются между ами- но- и кетогруппамн соответствующих оснований, а третья — между атомами азота пурина и пиримидина. В связи с этим последова- тельность оснований в одной цепи определяет их последователь- ность в другой. Комплементарность последовательности оснований в двух полинуклеотидных цепях — ключевое свойство ДНК. Позднее было установлено, что модель Д. Уотсона и Ф. Кри- ка описывает структуру одной из нескольких форм двойной спирали, названной В-формой. Это основная форма двуспираль- 83
Рис. 41. В-форма двойной спирали ДНК: Р — фосфат; S — дезоксирибоза 84
5'-Фосфат । группа 5'-Фосфат Дезоксирибозофосфатный остов Рис. 42. Две аитипараллельпые цепи ДНК. Сахарофосфатпый остов расположен снаружи и заряжен отрицательно. Основа- ния повернуты внутрь спирали н располагаются стопкой, друг над другом. Левая цепь сверху вниз имеет направление 5'—>3', а правая — 3'—>5'. Закручивание двух цепей в спираль не показано 85
ной ДНК, в которой большая часть ее молекул существует в клетке. Взаимодействия между гетероциклическими основаниями в нук- леиновых кислотах. Специфическая макромолекулярная структура ДНК определяется двумя типами взаимодействий между гетеро- циклическими основаниями нуклеотидных остатков: взаимодей- ствиями между основаниями в комплементарных парах и верти- кальными межплоскостными взаимодействиями оснований, рас- положенными друг над другом (стэкинг-взаимодействиями, от англ. stacking — укладываться в стопку). Образование комплементарных пар оснований (АТ- и G • С- пар) было впервые постулировано Д. Уотсоном и Ф. Криком при создании модели двойной спирали ДНК. Обе пары близки по форме и имеют одинаковые размеры (см. рис. 42). Кроме уотсон-криков- скнх пар (AT, GC) гетероциклические основания способны образовывать множество связанных водородными связями пар другой структуры. Квантово-механические расчеты показывают, что уотсон-криковские пары (А • Т и G • С, в случае РНК это А • U) энергетически наиболее выгодны. В этих парах центры с повышен- ной и пониженной электронной плотностью оснований располо- жены оптимально друг относительно друга. Такой вид комплсмеп- тарности называют электронной, при этом G • С-пары существен- но более стабильны, чем А Т-пары. Образование пар между дву- мя пуринами, двумя пиримидинами или иекомплсмснтарными основаниями (А С или G-Т) стерически затруднено, что нару- шает геометрию спирали. Модифицированные пурины и пирими- дины, встречающиеся в ДНК, образуют те же водородные связи, что и их немодифицированные аналоги. Гетероциклические основания нуклеиновых кислот достаточ- но гидрофобны, в водном растворе им «выгоднее» расположиться друг над другом, уменьшая тем самым контакт с молекулами воды. При образовании таких стопок во взаимодействие вступают функ- циональные группы одного основания и я-электронные системы соседнего с ним по вертикали основания. «Вертикальные» взаи- модействия (стэкинг-взаимодействия) обусловлены в основном Bai । -дер-ваал ьсовы м и силам и. Стэкинг-взаимодействия оснований в дуплексе (двойной спи- рали ДНК) зависят как от состава комплементарных пар, так и от их последовательности. На существование таких взаимодействий в растворах полинуклеотидов указывают отклонения их физико-хи- мических характеристик от аналогичных характеристик, наблю- даемых для смеси мономерных компонентов, состав которых иден- тичен нуклеотидному составу полинуклеотидов. Так, коэффициент молярной экстинкции (поглощение в УФ-свете) полинуклеоти- дов меньше, чем сумма коэффициентов молярной экстинкции входящих в него мономеров (гипохромный эффект). 86
Полиморфизм двойной спирали Правые спирали образуют два семейства: А-семейство (кон- формация сахара С-З'-эндо-) и В-ссмсйство (конформация сахара С2'-эндо-). Структуры в пределах каждого из семейств в зависи- мости от условий (концентрации соли, температуры) могут иметь разное число пар, приходящихся па виток спирали, разный на- клон пар оснований к оси спирали и т.д. А-семейство ДНК. Еще до открытия двойной спирали Р. Фран- клин получила экспериментальные свидетельства существования весьмё1 упорядоченной структуры в ориентированных вытягива- нием и подсушенных волокнах ДНК. Эта структура получила на- звание A-форма ДНК. Этой форме долго не придавали особого значения, так как она возникала при малой влажности, т.е. не при физиологических условиях. СЗ'-эндокопформация сахара приводит к уменьшению рассто- яния между фосфатными группами и, следовательно, к уменьше- нию расстояния между нуклеотидными парами вдоль оси спирали. Это соответственно ведет к увеличению количества нуклеотидов на виток спирали (I I нуклеотидных остатков). При этом пары ос- нований в A-форме образуют с осью спирали угол около 20° и очень сильно отодвинуты от оси спирали к периферии молекулы: сдвиг достигает 0,4—0,5 нм, т.е. почти половину радиуса (рис. 43). Рис. 43. Пространственная структура соседних звеньев пол и нуклеотидной цепи в А- и В-формах ДНК и двойной спирали ДНК. Вертикальная линия слева — ось спирали; — азотистые основания 87
Вследствие этого А-ДНК при взгляде сверху (вдоль оси спирали) выглядит как труба. В А-ДНК в стэкинге участвуют основания, принадлежащие разным цепям, т.е. имеет место как одно-, так и двуцепочечный стэкинг. Это обусловлено величиной угла наклона плоскостей оснований к оси спирали (положительная величина) и углом поворота оснований вокруг оси спирали. Для сравнения в В-ДНК только одноцепочечный стэкинг. РНК, как правило, представляет собой одну полинуклеотид- ную цепь, но, навиваясь сама на себя, она может образовать ко- роткий участок двойной спирали. Оказалось, что двойная спираль из цепей РНК имеет структуры A-формы при 100 %-й влажности (в этих условиях ДНК всегда существует в В-форме). Это открытие поставило А-конформацию в ряд биологически значимых. Сейчас уже получены подтверждения биологической роли А-ДНК. В неблагоприятных условиях некоторые бактерии превращают- ся в споры и находятся в таком неактивном состоянии сколь угод- но долго, пока не появятся подходящие условия для размноже- ния. Их ДНК окружена споровыми белками и находится в А-фор- ме. Именно в этом состоянии ДНК примерно в 10 раз более устой- чива к действию ультрафиолетового излучения, чем та же ДНК в В-форме в активно размножающихся бактериях. В случае со спо- рами бактерий споровые белки способствуют превращению ДНК бактерий из В-формы в A-форму, чтобы защитить ДНК в небла- гоприятных условиях. В этом же плане большой интерес представляют гибридные спирали ДНК-РНК. Они образуются при транскрипции последо- вательности ДНК в комплементарную ей последовательность РНК, при этом примерно 40 н.п. в области активного центра РНК-по- лпмеразы представляют такой гибрид. Гибридная спираль ДНК- РНК формируется и тогда, когда обратная транскриптаза осуще- ствляет синтез ДНК на РНК-матрице, а также в ходе репликации при образовании коротких молекул РНК-праймеров. Отмечено, что обе цепи полииуклеотидного комплекса — цепь ДНК и цепь РНК — построены из нуклеотидов с З'-эндокопформацпей саха- ра. Структура таких гибридных спиралей (гетеролуплексов) напо- минает А-ДНК (см. рис. 43), при этом В-ДНК должна перейти в A-форму до образования гибрида с РНК. В-семейство ДНК. Для ДНК В-семейства характерно структур- ное разнообразие. ДНК со случайными последовательностями могут находиться в В-, С-, D- и других конформационных состояниях. На структуру ДНК влияют тип и концентрация катионов, а также температура. Характеристика отмеченных конформационных со- стояний представлена в табл.3 Между этими различными формами осуществляются взаимные переходы, что обуславливается степенью обводненности биомо- лекулы и различиями в ионной силе окружающей среды. Счита- 88
Таблица 3 Характеристика некоторых конформационных состояний ДНК Показатель А- форма В- форма С- форма D- форма Z- форма Число пар нуклеотидных остатков на виток 11 10 9,3 8,0 12 Угол наклона плоскостей оснований к оси спирали, град 20 -2 -6 -6 -7 Угол поворота оснований вокруг оси спирали, град 32,7 36 38,6 45,0 -30 Расстояние комплементарных пар от оси спирали, им 0,425 0,063 0,213 0,143 — Расстояние между нуклеотид- ными остатками по высоте спирали, им 0,256 0,338 0,332 0,304 0,340 Угол между плоскостями ком- плементарных оснований, град 8 5 5 — — Конформация дезоксирибозы СЗ'- эпдо- С2'- эпдо- С2'- эндо- С2'- эпдо- С2'- эндо- СЗ'- эпдо- Примечание. A-форма получена из водно-солсвых растворов, содержащих попы щелочных металлов, кроме Li*; рсптгеноструктурпый анализ — при отно- сительной влажности 75 %. В-форма получена из водно-солсвых растворов, со- держащих Li'; рсптгеноструктурпый анализ — при относительной влажности 66 %. С-форма получена в тех же условиях, что В-форма, но в растворах с иным соотношением катионов; рсптгеноструктурпый анализ — при относительной влажности менее 66 %. D-форма выделена из фага Т2: содержит остатки глюко- -шлироваииого окепметплиптозппа; рсптгеноструктурпый анализ — при отпоси- гелыюй влажности 60%. Z-форма — монокристаллы полн-(сЮ—dC) в слабом солевом растворе. ют, что в биологическом плане A-форма ДНК участвует в транс- крипции и передаче информации от ДНК к РНК (см. гибридные молекулы ДНК-РНК); а В-форма ДНК — в репликативных про- цессах, в умножении количества информации. С-форма наиболее подходяща для упаковки ДНК в составе ладмолеклярных струк- тур хроматина, т.е. в хранении информации (рис. 44). Z-форма ДНК. Левая спираль, получившая название Z-формы ДНК, была обнаружена у полинуклеотида с чередующейся по- следовательностью (dG—dC). В растворе с низкой ионной силой этот полинуклеотид образует двойные спирали В-типа. При высо- кой концентрации солей (MgCl2, NaCI) или добавлении спирта эта двойная правая спираль переходит в левую Z-форму. 89
A BCD Рис. 44. A-, B-, С- и D-формы ДНК (вид сбоку и сверху) (В. Зенгер, 1987): Л — скелетная модель; Б — объемная модель 90
Особенность Z-ДНК — чередование конформации нуклеотид- ных остатков: дезоксицитидин имеет стандартную конформацию, г. е. сахар С2'-эндо-, основание — анти-, у дезоксигуапозина са- хар находится в СЗ'-эндоконформации и, что самое удивитель- ное, основание имеет cww-конформацию. Таким образом, геомет- рия левой двойной спирали определяется чередованием сип- и «д/ид-конформаций нуклеотидов. Стэкинг оснований обладает новыми, характерными лишь для этой спирали свойствами: он имеет место между остатками цито- зина противоположных цепей, а остатки гуанина вообще не взаи- модействуют друг с другом, контактируя с атомами соседних де- зоксицитпдинов. Фосфаты в Z-ДНК не эквивалентны друг другу: расстояние фос- фата до оси спирали (фосфатный радиус спирали) у d(CpG) рав- но 0,62 нм и d(GpC) — 0,76 нм, т.е. он меняется, принимая по- переменно два разных значения; соседние сахара «смотрят» в про- тивоположные стороны, отчего линия, последовательно соеди- няющая атомы фосфора в цепи, приобретает зигзагообразный вид. Отсюда и название Z-ДНК (рис. 45). В-форма и Z-форма переходят друг в друга при изменении ионной силы раствора или концент- рации катионов, нейтрализующих отрицательный заряд на фос- фодиэфпрном каркасе. Для осуществления перехода B->Z нс тре- буется расхождения цепей. Он инициируется разрывом водород- ных связей у нескольких пар оснований, после чего гуанин «за- крепляется» в едд-конформации, водородные связи восстанавлива- ются и основания вновь образуют уотсон-криковские пары. Область перехода перемещается вдоль спирали в виде небольшой петли. Наличие в ДНК эукариоз последовательности (dni’C-dG) свя- зывают с регуляцией транскрипции генов. В свою очередь, имен- но полинуклеотид такого состава поли(бС-бт5С) • поли(бО-бт5С) при физиологических значениях образует Z-форму. Z-форма ДНК имеет особое значение для сверхспирализации; переход В->гдаже па небольшом участке молекулы ДНК оказывает очень сильное влияние на топологию сверхспиральной ДНК (увеличивается кру- чение Tw — с. 96), и это используется клеткой в процессе экспрес- сии генов. Z-ДНК с помощью антител к ней обнаружена в междисковых областях политенных хромосом. Нуклеосомные частицы образу- ются только В-формой ДНК. Переход в Z-форму разрушает струк- туру нуклеосомы, а значит, и структуру состоящего из нуклеосом хроматина (см. с. 270). Возможно, Z-форма выполняет какую-то регуляторную роль, тем более что переход B->Z обратим. Регуля- ция экспрессии генома может включать сверхспирализацию, свя- зывание с белками, специфическими к Z-ДНК, связывание с оп- ределенными катионами типа спермидина и метилирование де- зоксицитидина. 91
Б Рис. 45. Z-форма ДНК: А — скелетная модель (вид сбоку и сверху): Б — объемная модель (вид сбоку и сверху); В — зигзагообразная линия, соединяющая фосфатные группы в Z-ДНК. Вертикальная прямая — ось спирали, горизонтальные отрезки — пары основа- нии н сахара. После остатков гуанина зигзагообразная линия идет вертикально, после остатков цитозина — горизонтально Внутри двойной спирали существует конформационная мик- рогетерогенность: в зависимости от последовательности нуклео- тидных пар конформации сахаров в нуклеотидных остатках не- сколько отличаются. Это изменяет межнуклеотидные расстояния вдоль оси спирали, а также угол наклона пар оснований к этой оси. Различия во вторичной структуре ДНК, зависящие от после- довательности нуклеотидов, по-видимому, чрезвычайно важны для ее функционирования. Каждая форма ДНК имеет малый и большой желобки опреде- ленного размера. У Z-ДНК есть только один малый желобок, через который проходит ось спирали; он глубокий и узкий, с двух сторон ограничен фосфатными группами. С различными раз- 92
Рис. 46. Палиндром ДНК в линей- ном (Л) и шпилечном (Б) состо- яниях: • — ось симметрии палнидромиых последовательностей мерами желобков связана спе- цифическая способность форм ДНК к комплексообразованию. В большей степени они доступ- ны молекулам воды и ионам металлов. Стабилизирующее действие молекул воды направ- лено на усиление стэкинг-вза- имодействий; в случае ослаб- ления последних молекулы воды конкурентно взаимодей- -~gcta|gttca| стс |tgaac|aatt~— ^-cgat|caagt|gag|acttg|ttaa^- ствуют с протон-донорными и протон-акцепторными центрами оснований, дестабилизируя двой- ную спираль. Гидратация ДНК играет важную роль в превраще- нии A-формы в В-форму ДНК, и наоборот. Катионы связывают- ся в основном с пентозофосфатным остовом, располагаясь пре- имущественно в малом желобке двойной спирали. Все это под- черкивает динамичность структуры ДНК и возможность конфор- мационных переходов в ней под действием агентов окружающей среды. Биспиральные структуры в молекулах ДНК могут возникать и в пределах одной полидсзоксирибонуклеотидной цепи. Для этого в последовательности ДНК должны присутствовать инвертирован- ные, или «палиндромные», повторяющиеся последовательности дли- ной от нескольких до многих тысяч пар оснований. Палиндром («обратно бегущие» последовательности нуклеотидных звеньев; от грсч. «палии» — обратно, «дроме» — бегу) представляет собой двуцепочечпую последовательность ДНК, которая одинаково читается в обоих цепях, если каждую цепь читать в соответствии с ее ориентацией. „ 5'GGT:ACC3' В качестве примера можно привести последовательность 3'ccA;TGG5'’ Осью симметрии является центральная точка, относительно которой пос- ледовательность остается одинаковой при чтении в противоположных направлениях). Благодаря наличию собственной симметрии второго порядка палиндромы могут образовывать шпилечные структуры простой крестообразной формы (рис. 46). Такие последовательности спо- собствуют специфическим нуклеиново-белковым взаимодействи- ям и, возможно, участвуют в процессах регуляции. 93
РАЗНООБРАЗИЕ ФОРМ ДНК ДНК может находиться в линейной или кольцевой форме (рис. 47). Бактериальные плазмиды, хромосомы некоторых бакте- рий, большинство митохондриальных и хлоропластных ДНК, ге- номы вирусов млекопитающих представлены единственной кова- лентно замкнутой кольцевой дуплексной молекулой ДНК. Не все ДНК in vivo являются двуцепочечными. Геномы некото- рых мелких вирусов бактерий, растений и животных представля- ют собой ковалентно замкнутые кольца, состоящие только из од- ной цепи. Все известные одноцепочечные кольцевые ДНК отно- сительно малы: ДНК фагов <рХ174 и М13 содержат 5300 и 6000 е Сверхспиральное кольцо Рис. 47. Схематическое изображение ДНК — линейной (а), кольцевой двупспочечиой (б) и сверхспиралыюй кольцевой (в); релаксированных кольцевых форм, полученных либо в результате разрыва одной из двух цепей (г), либо в результате локального расхождения двух цепей (ф; катенана (е) и узла (ж) 94
нуклеотидов и имеют длину 1,5 — 2 мкм. Однако для репликации любой из этих вирусных ДНК совершенно необходимо превраще- ние одноцепочечного кольца в соответствующее двуцепочечное, из которого затем образуются одноцепочечные кольцевые ДНК вирусного потомства. Более того, экспрессия генетической ин- формации в таких геномах всегда осуществляется в фазе двуцепо- чечной ДНК, поскольку именно опа является субстратом для транскрипции последовательностей ДНК в РНК. Третичная струк- тура и линейных и кольцевых форм ДНК характеризуется спира- лизацией и супер(сверх)спирализацией. СВЕРХСПИРАЛИЗАЦИЯ ДНК. ТОПОИЗОМЕРАЗЫ В живых организмах молекулы ДНК представляют собой либо очень длинные, либо замкнутые в кольцо двуспиральные молеку- лы, поэтому любой процесс, связанный с передачей наследствен- ной информации, должен наталкиваться на серьезные топологи- ческие проблемы: возникновение положительной (+) или отри- цательной (-) сверхспирализации ДНК, образование катенанов или узлов. К числу таких процессов относится репликация ДНК. Движе- ние репликативной вилки вдоль ДНК сопровождается расхожде- нием вновь образовавшихся цепей. Их длина слишком велика для того, чтобы позволить репликативной вилке вращаться вдоль глав- ной оси ДНК. В результате происходит нагнетание положительной сверхспирализации в родительской ДНК, когда возрастает количе- ство оборотов на отрезке ДНК с одновременным уменьшением количества пар оснований, приходящееся на один оборот (рис. 48). Аналогично обе вновь образованные копни оказываются отрица- тельно сверхспирализованными. Для них характерно уменьшение количества оборотов на отрезке ДНК с одновременным увеличе- нием количества пар оснований на один оборот. К моменту окон- Расхождение цепей Положительная суперспирализация Рис. 48. Разделение цепей дуплексной ДНК посред- ством компенсирующей положительной суперспи- рализации в другой облас- ти (Л) либо путем разреза- ния, вращения и воссоеди- нения (Б) 95
чания репликации, когда репликативные вилки встречаются друг с другом, образуются узлы или (в случае кольцевых молекул) ка- тенаны. Нагнетание сверхспирализации происходит и в процессе транскрипции (здесь она не играет принципиальной роли). «Пе- репутывание» сверхдлинных нитей совершается в процессе кон- денсации и сегрегации хромосом, организации хроматина. Кольцевая ДНК, не содержащая разрывов ни в одной из це- пей, может существовать в раътичных топологических формах. Эти формы характеризуются порядком зацепления Lk — целочислен- ной величиной, обозначающей количество оборотов одной цепи относительно другой, когда ДНК находится в конформации, со- ответствующей плоскому кольцу. Правым виткам соответствуют положительные значения Lk, левым — отрицательные. Каждая то- пологическая форма ДНК (топоизомер) может существовать в бесконечном числе конформаций, которые определяются двумя параметрами — кручением Tw и райзингом И? (от англ, writhe — скручиваться): Tw — число витков двойной спирали в данном кон- формере; IVr— число витков суперспирали, т. е. спирали, образу- ющейся при перекручивании двуспиральной ДНК вокруг себя. Связь этих трех параметров между собой определяется уравнени- ем: Lk = Tw + Wr. Когда ДНК находится в релаксированном состоянии, т.е. без всякого напряжения, она может быть расположена в одной плос- кости, тогда Lk = Tw. Если же увеличить или уменьшить число витков двойной спирали, сохранив ковалентную непрерывность обеих цепей, то такое изменение будет компенсироваться образо- ванием витков сверхспирали (И''/'). W7- может быть как положи- тельной, так и отрицательной величиной. Кольцевые ковалентно замкнутые ДНК, выделенные из кле- ток, всегда имеют отрицательную суперспирализацию. Степень суперсппрализацпп ДНК удобно характеризовать плотностью спи- рализацпи о, которая равна Wr/Tw и не зависит от длины ДНК. Для многих природных сверхспирализоваииых ДНК ст = -0,05. Свсрхспирализованиая ДНК обладает значительным запасом энергии по сравнению с ее релаксированной формой. Следова- тельно, локальное расплетание двойной спирали ДНК с отрица- тельными сверхвптками будет приводить к сбросу напряжения сверхспирализации и поэтому энергетически выгодно. Это отчет- ливо проявляется в том, что отрицательная свсрхспиралнзация заметно стимулирует переход ДНК из правой В-формы в левую Z-форму. Отрицательная сверхспнрализация ДНК облегчает свя- зывание с ней белков, раскручивающих ее двойную спираль. Решение названных топологических проблем обеспечивают ДНК-топоизомеразы — ферменты, изменяющие топологию ДНК (рис. 49). Топоизомеразы релаксируют сверхспирализованпые моле- кулы ДНК, снимая их внутреннее напряжение пугсм внесения одно- 96
и двуцепочечных разрывов с по- следующим их восстановлением (лигированием). По механизму действия различают ДНК-топо- 11 юмеразы двух типов — I и II. ДНК-топоизомеразы I — мо- номерные белки, релаксируют ДНК без затраты энергии путем нпссения одноцепочечных раз- рывов. ДНК-топоизомсразы II функционируют в виде димеров (у эукариот) и тетрамеров (у про- кариот), осуществляя АТР-зави- епмое расщепление обеих цепей ДНК с последующим переносом цепей через разрыв и его лиги- рованием. Для внесения одноцепочеч- ного разрыва в ДНК все ДНК- |огюизомеразы используют ос- таток тирозина, который осуще- ствляет нуклеофильную атаку фосфатной группы ДНК с об- разованием фосфотирозина. В ре- зультате ферменты оказывают- ся ковалентно связанными с 5'- илп З'-копцами ДНК в одноце- почечном разрыве. Топоизомеразы подтипа 1-5' связываются преимущественно с пдпоценочечными участками ДНК, осуществляя ее разрыв с образованием 5'-фосфодиэфирной связи с тирозином активного центра фермента. Через образовавшийся разрыв проходит либо одноцепочечная ДНК (снятие витка), либо двуцепочечная (образование узла или катенана). Ферменты этого типа снимают только отрицательную суперспирализацию. Характер- ны для прокариот. Топоизомеразы подтипа 1-3' связываются с двуцепочечной ДНК, разрывают одну цепь с образованием З’-фосфодиэфирной связи с тирозином активного центра фермента. Через разрыв проходит вто- рая цепь дуплекса, уменьшая плотность суперспирализаиии ДНК; знак суперспирализаиии существенной роли не играет. Характерны дня эукариот. Топоизомеразы типа II связываются с двуцепочечной ДНК и осуществляют разрыв обеих цепей с образованием двух 5'-фосфо- диэфирных связей с тирозинами активного центра. В образовав- Д-Туг-0Н ДНК-топоизомераза разрезает одну из цепей и ковалентно связывает с фосфатной группой Туг-О H Туг-О Дуплекс может вращаться вокруг фосфодиэфирной связи Фосфодиэфирная связь восстанавливается Туг-ОН Рис. 49. Реакции, катализируемые топоизомеразами типа 1 -I Коплчс» 97
I Образование структуры с положительным сверхвитком Надрезание дальнего дуплекса Воссоединение дуплекса спереди Рис. 50. Размыкание двух кольцевых дуплексов, катализируемое топоизо- меразами типа II: а — взаимодействие с ферментом; б — разрыв ДНК; в — протягивание ДНК через разрып; г — воссоединение разор- ванной ДНК; д — освобождение ДНК Рис. 51. Схема образования от- рицательных сверхвитков в двуцепочечпой ДНК поддей- ствисм ДНК-гиразы 98
путем щель проходит вторая двуцепочечная ДНК, и результатом является изменение числа положительных или отрицательных су- первитков на 2 (в отличие от ферментов типа I, изменяющих чис- ло супервитков на единицу за шаг). Этот фермент способен катенировать, декатспировать и развя- плвать узлы интактной ДНК. Для многократного повторения цик- ла требуется АТР (рис. 50). Топоизомераза II Е. coli (ДНК-гираза) относится к ферментам нша II, но нс требует АТР. Она индуцирует образование отрица- 1сльных супервитков в релаксированных кольцевых ДНК. Гираза в лшмодействуст с ДНК таким образом, что последняя наматыва- йся вокруг белка. При этом возникает положительная сверхспи- рализация в тех местах молекулы ДНК, которые связаны с бел- ком. Затем фермент разрывает обе нити ДНК и переносит двой- ную пить с внутренней стороны на внешнюю, после чего скреп- ляет оба разрыва, превращая положительную петлю в отрицатель- ную (рис. 51). Это особенно важно для инициации репликации, а 1лкже необходимо для ее элонгации и терминации. ДНК-топоизомераза II является жизненно важным ферментом любого эукариотического организма. Выяснена роль ДНК-топо- н юмеразы в формировании высших уровней структуры хромати- на, а именно, участии фермента в образовании петель хроматина но время конденсации хромосом. СТРУКТУРА И ФУНКЦИИ РНК Содержание РНК в любых клетках в 5—10 раз превышает со- держание ДНК. Основная роль РНК состоит в трансляции генети- ческой информации с образованием белков, а также в осуществ- 1СПИИ некоторых специализированных эндонуклеазных функций, возможно регулирующих различные этапы экспрессии генов. Ге- номы некоторых вирусов (ретровирусов и множества вирусов жи- вотных, растении и насекомых) представлены одно- и двуцепо- чечной молекулой РНК. Виды РНК. Во всех клетках присутствуют следующие виды РНК: рибосомная (рРНК), транспортная (тРНК) и информационная, пли матричная (мРНК). Большинство клеток содержат много ма- лых цитоплазмичсских РНК (мцРНК), а в клетках эукариот при- сутствуют малые ядерные РНК (мяРНК) (табл. 4). Около 80— 85 % массы клеточных РНК составляют три (прока- риоты) или четыре (эукариоты) вида рРНК, около 10% — почти 100 видов тРНК. На долю нескольких тысяч различных матричных РНК приходится менее 5% клеточной РНК, а на долю малых ядерной и цитоплазматической РНК, число видов которых пока неизвестно, — менее 2% от общего количества РНК. 99
Основные вилы РПК Таблица 4 Вид РНК Приблизитель- ное число разных видов и клетках 11рибтизпгсль- иая длина (число нуклеотидов) Распростра- ненность* Транспортная РНК (тРНК) 80—100 75-90 п, э Рибосомная 5S РНК (рРНК) 1—2 120 П, э Рибосомная 5.8S РНК (рРНК) 1 158 э Рибосомная I6S РНК (рРНК) 1 1600 п Рибосомная 23S РНК (рРНК) 1 3200 п Рибосомная I8S РНК (рРНК) 1 1900 э Рибосомная 28S РНК (рРНК) I 5000 э Матричная РНК (мРНК) Тысячи Варьирует п, э Гетерогенная ядерная РНК (гяРНК) Тысячи Варьирует э Малая цитоплазматическая РНК (миРНК) Десятки 90-330 п, э Малая ядерная РНК (мЛРНК) Десятки 58—220 э * П — прокариоты, Э — эукариоты. Макромолекулярная структура РНК Двутяжевые РНК, построенные из двух комплементарных но- ли! 1уклеотидных цепей, обнаруживаются только в составе неко- торых вирусов. Кроме того, известны однотяжевые РНК (вирои- ды), состоящие, по суги дела, из двух комплементарных нуклео- тидных последовательностей и поэтому существующие в виде дву- спиральных молекул (см. рис. 59, с. 116). В двойной спирали РНК возможна только одна, СЗ'-энло-кон- формация остатка рибозы. Поэтому двуспиральные РНК, а также комплементарные двутяжевые полирибонуклеотидныс комплек- сы [типа поли(А) поли(О)] существуют только в правой А-фор- ме, в основных чертах подобной A-форме ДНК. Общие черты вторичной структуры однотяжевых РНК. Макромо- лекулы большинства природных РНК построены из одной пдлич рибонуклеотидной цепи. Основной элемент их вторичной структу- ры — сравнительно короткие двойные спирали, образованные ком- 100
плементарными участками одной и той же цепи и перемежающие- ся ее однотяжевыми сегментами. Полирибонуклеотидныс цепи в таких двуспиральных структурах (спирализация сама на себя) ан- тнпараллельны, а сами двойные спирали, находящиеся в А-форме, нс идеальны: в них имеются дефекты в виде неспаренных нуклео- тидных остатков или не вписывающихся в двойную спираль одно- тяжсвых петель. Наряду с классическими уотсон-криковскими па- рами (AU и GC) в двутяжевых участках РНК часто встречается пара GU. Таким образом, стабильность двутяжевых районов под- держивается комплементарными и межплоскостными взаимодей- ствиями оснований. В однотяжевых участках наблюдаются сильные стэкинг-взаимодействня оснований, вследствие чего они стремятся принять конформацию однотяжевой спирали. Третичная структура однотяжевых РНК. При исследованиях мак- ромолекулярной организации однотяжсвых РНК было установле- но, что в физиологических условиях они характеризуются ком- пактной и упорядоченной третичной структурой, которая возни- кает за счет взаимодействия элементов их вторичной структуры. 1. Элементы вторичной структуры РНК располагаются друг от- носительно друга так, чтобы обеспечить максимальный стэкинг оснований в макромолекуле в целом. 2. Контакты между отдельными элементами вторичной струк- туры осуществляются за счет нескольких типов так называемых «третичных» внутримолекулярных взаимодействий: • за счет образования дополнительных, зачастую не-уотсон- криковских пар оснований между нуклеотидными остатками уда- ленных друг от друга (в первичной и вторичной структурах) од- нотяжевых участков и триплетов оснований между нуклеотид- ными остатками однотяжевых и двутяжевых элементов. При ана- лизе вторичных структур вирусных и рибосомных РНК было об- Рис. 52. Схема образования «псевдоузла» (Л) при спаривании компле- ментарных участков РНК в вершине шпильки и в другом одпотяжевом участке; пространственная модель «пссвдоузла» (5) 101
Ст -эндо- Рпс. 53. Образование А • U • А- триплета в тРНК Рис. 54. Интеркаляция А, между остатка- ми m7Gq6 и G45 в тРНК. Этот особый вид стэкипг-взанмодсйствпя со- пряжен с расхождением остатков гуанина, при этом конформация рибозы изменяется от Cj-эндо- до С2-эпдо- наружено, что однотяжевыс участки в вершине петель в прин- ципе могут давать двуспиральные комплексы с межпетельными однотяжсвы.ми сегментами с образованием «псевдоузлов» (рис. 52, 53); • за счет дополнительных («третичных») стэкинг-взаимодей- ствий после интеркаляции (внедрения) оснований одного участ- ка между двумя соседними основаниями другого однотяжевого участка (рис. 54); • за счет образования дополнительных водородных связей меж- ду 2'ОН-группами остатков рибозы и основаниями, а также дру- гими группами пентозофосфатного остова. 3. Третичная структура РНК стабилизирована ионами двухва- лентных металлов, которые связываются не только с фосфатны- ми группами, но и с основаниями. Аналогичные принципы лежат в основе организации структу- ры всех однотяжевых РНК. Строить конкретные пространствен- ные структуры однотяжевых РНК крайне затруднительно из-за множества возможных вариантов укладки в них элементов вто- ричной структуры. Транспортные РНК Главной функцией транспортных РНК (тРНК) является ак- цептирование аминокислот и перенос их в белоксинтезирующий 102
пппарат клетки. Они выступают в роли затравки (праймера) в про- цессе обратной транскрипции (см. с. 234). Последовательность тРНК включает 70—90 нуклеотидов и около 10 % минорных компонентов. Она образует вторичную структуру, известную под названием «клеверный лист». Эта структура состо- ит из 4 или 5 двуцепочечных спиральных стеблей и трех петель. Каждый стебель содержит 4 —7 уотсоп-криковских пар, образую- щих двойные спирали. Различают акцепторный, антикодоновый, ТуС-сгебель Акцепторный стебель 3' DU-петля С С 5' А G--C С—G G--C G--U A--U U--A U--A G т2А CUCG он Акцепторный конец Акцепторный стебель DU DU G G Т^С-пстля U ml GAGCm2,2 gc--g Cj-G Атггикодоновый стебель Тч>С- стебсль с G А С А С I I I I I гп5 । ill С U G U G . Яи / т7 л G Вариабельная ° петля Антикодоновая у петля т. Антикодон Т уС-петля 64 56 D-петля Антикодоновый стебель D-стсбель 26 38 Антикодон 20 Вариабельная петля 44 З'-акцепторный конец G А Рис. 55. Структура дрожжевой тРНКР11С: .4 — первичная и вторичная структуры; Б — третичная структура (схематическое изображение). Пептозофосфатный остов изображен в виде непрерывной ленты; пары оснований — в виде длинных полосок; псспарепиыс основания — в виде коротких полосок. Молекула имеет Г-образную форму. Арабскими цифрами ука- заны номера нуклеотидных остатков; В — пространственная модель 103
дигидроуридиловый (D), псевдоуридиловый (Ъ|/С) и добавоч- ный стебли. Акцепторный стебель содержит 3'- и 5'-концы по- линуклеотидной цепи, причем к концевой З'-гидроксильной груп- пе (ССАЗ'ОН) присоединяется специфическая аминокислота, от- вечающая последовательности антикодонового триплета в анти- кодоновой петле (рис. 55). Число нуклеотидов в стеблях и петлях почти постоянно у разных тРНК за исключением вариабельных петель (от 4 до 21 нуклеотида). Транспортные РНК — единствен- ные представители природных полирибонуклсотидов, которые удалось закристаллизовать и изучить методом рентгеноструктур- ного анализа с достаточно высоким разрешением. Наиболее де- тально отработана третичная структура дрожжевой тРНК1’1”-’ (А. Рич). В последовательности тРНК имеются инвариантные основания, т.е. основания, присутствующие во всех тРНК. Они участвуют, главным образом, в «третичных» взаимодействиях, которые воз- никают тогда, когда молекула тРНК сворачивается в нативную Г- образную структуру (см. рис. 55). Г-форма состоит из двух почти перпендикулярных друг другу спиралей А-РНК, длина которых составляет около 7 нм, толщина — 2 нм. Одну спираль образуют уложенные друг за другом антикодоновый и дигидроуридиловый стебли, другую — акцепторный и псевдоуридиловый стебли. Третичные взаимодействия включают стэкинг (у тРНК1>Ьс из 76 оснований в стэкинг-взаимодействиях участвует 71 основа- ние); интеркаляцию и необычное спаривание оснований, при котором образуются не только пары, но и триплеты (см. рис. 55). Большая часть стабилизирующих третичную структуру водород- ных связей образуется между инвариантными и полувариаптпы- ми основаниями. Особым видом стэкинга является интеркаляция (в отдельных местах основание из одной цепи встраивается между двумя осно- ваниями другой цепи) (см. рис. 55). Такое взаимодействие осуще- ствляется там, где встречаются сразу три цепи. Пентозофосфат- ный остов в месте вставки основания перестраивается путем из- менения конформации сахара СЗ'-эндо-—>С2'-эндо-, в результа- те чего увеличивается расстояние между фосфатами (от 0,59 нм до 0,70 нм), и это способствует интеркаляции. Антикодон имеет жесткую архитектуру, которая позволяет ему быстро считывать матричную РНК. Рибосомные РНК Высокомолекулярные рибосомные РНК (рРНК) являются структурной основой для формирования рнбонуклспротсинового тяжа, который, складываясь в пространстве, дает начало 30 — 40S- и 50—605-субчастицам рибосомы; рРН К взаимодействуют с мРНК 104
п аминоацил-тРНК в процессе трансляции. Низкомолекулярная 5SpPHK в комплексе с рибосомными белками формирует комп- лекс, который называют третьей субчастицей рибосомы, где 5SpPHK выступает'в роли посредника между пептидилтрансфс- разным центром и EF-G-связывающими доменами (см. с. 309). Детально изучены первичная, вторичная и третичная струк- туры 5SpPHK. Выяснены первичные структуры 16— 18SpPHK и 23 — 25SpPHK ряда организмов. Вторичная структура рРНК ха- рактеризуется спирализацией самой на себя полирибонуклеотид- пой цепи (рис. 56). Биспиралызые и линейные участки этих моле- кул формируют постоянные и вариабельные домены, которые затем укладываются в более компактные струкзуры высшего по- рядка. Рис. 56. Структуры 16S рРНК Е. coli'. А — вторичная структура, содержащая 4 основных домена: центральный, 3’- гланпый, 5’- н З'-мннорпый (нх границы указаны пунктирными линиями): Z> — Первичная п вторичная структуры 5'-домсна 16S рРНК. В стабилизации дуплекс- ной структуры рРНК участвуют G- U-пары. Несколько оснований образуют пет- лю, если в противоположной цепи отсутствуют комплементарные основания 105
Рис. 56. Продолжение 106
Матричные РНК Матричной (мРНК) считают РНК, которая в последователь- ности нуклеотидных остатков в молекуле несет информацию, обес- печивающую синтез специфического белка непосредственно на ней самой, а также информацию о времени, количестве, месте и условиях синтеза этого белка. Строение мРНК эукариот специфично: в их составе есть ин- формативные, т.е. работающие как матрицы в процессе биосин- теза белка, зоны и неинформативные участки. Отмеченное свое- образие в строении мРНК и расположение функциональных уча- стков в ее молекуле представлены в виде обобщенной структуры (рис. 57). Неинформативные участки содержат кэп, 5'-нстрансли- руемую область (5'-НТО), З'-нстранслирусмую область (З'-НТО), полиадениловый фрагмент. Кэп (от англ, cap — кепка, шапка) — нуклеотидная последова- тельность, содержащая 7-метилгуанозин, присоединенный через трифосфатную группировку к первичному транскрипту. Кэп часто включает 2'-0-метильиые группы, связанные с первым или с двумя Рис. 57. Обобщенная структура мРНК эукариот (Л) и кэп-структура на 5'-конце мРНК эукариот (Б) 107
первыми рибозными остатками последующих нуклеотидов (см. рис. 57). Кэп нужен для защиты мРНК от экзонуклеаз, а также для связывания белковых факторов при взаимодействии с рРНК в рибосоме (играет сигнальную роль в присоединении мРНК к ри- босоме и участвует в трансляции). Длина поли(А)-фрагмептов у разных мРНК колеблется от 50 до 400 н.п. Эти фрагменты отсутствуют в молекулах гистоновых мРНК. Полагают, что полиадениловая часть молекулы мРНК уча- ствует в процессе созревания мРНК, предопределяет время жиз- ни мРНК, способствует переносу мРНК из ядра в цитоплазму и принимает участие в трансляции. Время полужизни мРНК в клетке, как и момент их деграда- ции, запрограммированы специфическими последовательностя- ми часто в их З'-НТО. Их называют элементами нестабильности мРНК. Определенные белки клетки узнают эти последовательно- сти, связываются с ними и стабилизируют мРНК. Кроме этого З'- НТО содержат сигналы цитоплазматического и ядериого поли- аденилирования и сигналы внутриклеточной локализации для этих мРНК. Интересно отметить, что информация об одном и том же свойстве мРНК может содержаться в разных частях молекулы мРНК, иногда отстоящих друг от друга вдоль полннуклсотидпой цепи па значительном расстоянии. Вероятно, эти участки молеку- лы мРНК сближаются при формировании ее пространственной структуры. Предполагают, что вторичная (спирализацпя сама на себя) и третичная структуры менее компактны, чем для тРНК и рРНК. Гетерогенная ядерная РНК Гетерогенная ядерная РНК (гяРНК) — смесь транскриптов мно- гих ядерпых генов; локализована в ядре. Некоторые из них явля- ются первичными транскриптами и имеют такую же длину, как и гены, с которых они скопированы, другие — частично процесси- рованы и утратили ряд интронов. Малые ядерные РНК Все эукариотические клетки содержат множество малых ядср- ных РНК (мяРНК) — коротких стабильных молекул РНК, боль- шинство которых в составе нуклеопротеидных частиц присутству- ют в ядре. Они обнаружены в составе сплайсингосом млекопитаю- щих. Эти РНК называют U-PHK из-за необычайно большого со- держания урацила и его модифицированных форм (табл. 5). Нук- леотидные последовательности всех U-PHK позвоночных совпа- дают на 95 %. 108
U-РНК млекопитающих Таблица 5 U-PHK Длина РНК (число нуклеотидов) Функция U1 164 Сплайсинг про-мРНК U2 (87 Сплайсинг про-мРНК из 217 Процессинг про-рРНК в ядрышке U4 145 Сплайсинг про-мРНК U5 116 Сплайсинг про-мРНК U6 106 Сплайсинг про-мРНК U7 65 Образование З'-копцов гистоновых мРНК ин 131 Полиадснилированнс про-мРНК Малые цитоплазматические РИК Функции малых цитоплазматических РНК (мцРНК), за исклю- чением 7SL-PHK сигпал-распознающих частиц, не установлены. Известно, что большинство этих РНК ассоциированы с крупны- ми семействами последовательностей, содержащими как гены, так и псевдо гены. В переносе новосинтезированпых секретируемых и связанных с мембранами полипептидов через липидный слой эндоплазмати- ческого ретикулума участвуют сигнал распознающие частицы, ос- новным компонентом которых является 7SL-PHK. Нуклеотидные последовательности 7SL-PHK у грызунов и приматов практиче- ски одинаковы, а у дрозофилы эта РНК на 64% гомологична со- ответствующей РНК человека (табл. 6). Табл п ца 6 Малые цитоплазматические РНК РНК Организм Длина РНК (число нуклеотидов) 7SL Позвоночные 300 7S Беспозвоночные 254 7SK Беспозвоночные 330 4,5S Грызуны 90-94 109
КОНЦЕПЦИЯ «МИР РНК» Рассмотренные выше особенности структуры и функций ДНК и РНК побуждают к сопоставлению их роли в живой природе. При этом возникает отчетливое впечатление о значительно более разнообразных функциональных возможностях рибонуклеиновых кислот по сравнению с ДНК, существование которой связано исключительно с необходимостью сохранения и передачи из по- коления в поколение наследственных признаков. Современные знания о структурном и функциональном разнообразии РНК уже не укладываются в те канонические представления об их роли в реализации генетической информации, которые возникли в са- мом начале развития молекулярной биологии. Представление о том, что РНК служит только инструментом трансформации гене- тической программы (генотипа), заложенной в структуре ДНК, в конкретный фенотип, формируемый разнообразием белков (ДНК-> РНК->белок), было в значительной мере разрушено после открытия обратной транскрипции. Оказалось, что РНК. может слу- жить матрицей пе только для воспроизведения своей собственной структуры в РНК-содержащих вирусных геномах, но и для биосин- теза ДН К у высших организмов. Уже одно это открытие формаль- но поставило РНК в центр основного постулата молекулярной генетики, так как показало, что поток генетической информации распространяется от РНК не в одном, а в двух направлениях: не только к белку, но и к ДНК. Все более глубокое проникновение в механизмы основных молекулярно-генетических процессов (реп- ликацию, транскрипцию и трансляцию) способствовало возник- новению понятия о неканонических функциях РНК, осознанию по- лифункциональности рибонуклеиновых кислот (рис. 58). Для того чтобы оценить значение РНК в природе в целом, следует попытаться ответить на вопрос: что могут РНК? • К достаточно давно определенным каноническим функциям РНК относятся: способность выполнять роль мессенджера при пе- редаче наследственной информации о структуре белка от ДНК к белокст(тезирующему аппарату клеток (мРНК), участвовать в формировании структуры рибосом (рРНК), обеспечивать специ- фическое акцептирование и перенос аминокислот к рибосомам (тРНК). Вместе с тем РНК свойственны особые неканонические функ- ции, реализуемые на разных этапах программы жизни тех или иных организмов. В последующих главах неоднократно будут при- ведены примеры своеобразных структур и функций различных ви- дов РНК, сейчас же ограничимся только перечислением функци- ональных возможностей этой весьма полиморфной группы моле- кул, вовлеченных в реализацию большинства фундаментальных биохимических процессов в клетке. 110
Репликация ? РНК-ферменты (рибозимы) мяРНК тРНК мРНК рРНК Репликяттия Рибонуклеотиды Коферменты сАМР (NAD+, FAD+ и др.) РНК-затравки (праймеры) Макроэрги (АТР, GTP) N Транскрипция Процессинг ^„ТТЪГУ Трансляция Xх Созоевяние ДНК л ~ —L -Г______________________*- Белок-------------► Рибонуклео- Обратная транскрипция ^рдис-трансляпия протеины и Рекомбинация) f другие функцио- тмРНК нально активные белки «Антисмысловые» тРНК РНК (РНК I) Вирусные РНК РНК-содержащая теломераза Рис. 58. Роль различных РНК в основных молекулярно-биологических процессах (пояснения в тексте)
• РНК участвуют в репликации ДНК, выступая в роли затравок (праймеров), необходимых для инициации синтеза комплемен- тарных цепей ДНК. Особая «антисмысловая» РНК (РНК I) вы- полняет роль регулятора инициации репликации ДНК в точках начала репликации, обладая возможностью связывать праймеры и тем самым останавливать биосинтез ДНК. • РНК выполняет роль матричной молекулы в процессах об- ратной транскрипции (биосинтезе ДНК на матрице РНК) и своей собственной репликации у РНК-содержащнх вирусов и фа- гов. В процессе обратной транскрипции роль затравки, необходи- мой для синтеза комплементарной цепи ДНК, выполняет тРНК. Матричные свойства РНК реализуются в процессе наращивания теломерных повторов в молекулах ДНК: РНК-матрина является важнейшим компонентом теломераз — ферментов, осуществляю- щих синтез теломерных участков ДНК в хромосомах. • В процессе транскрипции (биосинтезе РНК на матрице ДНК) большое значение имеет способность РНК образовывать разнообраз- ные элементы вторичной структуры (шпильки), которые влияют как на инициацию, так и на терминацию синтеза РНК. РНК актив- но участвует в процессе своего собственного созревания — процес- синге первичных транскриптов (про-РНК). У примитивных одно- клеточных организмов выявлена способность РНК к аутосплайсин- гу — вырезанию некодирующих участков (нитронов) и сшиванию кодирующих фрагментов (экзонов) без участия белков-ферментов. У организмов, утративших способность к аутосплайсннгу, в сплай- сировапии РНК тем не менее принимают участие особые молеку- лы — малые ядерные РНК (мяРНК), необходимые для безошибоч- ного вычленения интронов из молекул РНК-прсдшсствеппиков. • В биосинтезе белка (трансляции) РНК безусловно играет опре- деляющую роль. Различные по структуре рРНК формируют основу субчастиц рибосомы п определяют взаимодействие субчастиц при сборке полной рибосомы. Присоединение мРНК к рибосоме детер- минируется комплементарным взаимодействием определенных уча- стков мРНК и рРНК. Активация аминокислот, их специфическое акцептирование и доставка к рибосомам осуществляется тРН К. Ко- дон-антикодоновое взаимодействие между мРНК и тРНК обеспе- чивает перевод нуклеотидной последовательности информацион- ных макромолекул в аминокислотную последовательность синте- зируемых белков. Сама реакция образования пептидной связи (транс- пептидирование) и продвижение рибосомы по мРНК (транслока- ция) также, по всей видимости, связаны с функционированием рРНК. Пространственная структура мРНК непосредственно влияет на скорость трансляции, а ее способность взаимодействовать с раз- нообразными рстуляторными белками, особенно характерная для высших эукариот, является основой для тонкой регуляции биосин- теза белка. Особый вил РНК (тмРНК), сочетающий в себе свойства 112
тРНК и мРНК одновременно, способен обеспечивать транс-транс- ляцию — биосинтез полипептидной цепи белка с использованием различных матричных последовательностей. • Посгтрансляцйонные модификации синтезированных в ходе трансляции полипептидов, в результате которых образуются фун- кционально активные молекулы, также нередко сопряжены с присоединением к ним значительных по размерам молекул РНК. Таким путем возникают РНК-содержащие ферменты — рибонук- леопротеины (РНКаза Р, теломеразы и др.). • И наконец, нельзя обойти вниманием тот факт, что многие катализаторы белковой природы (ферменты), катализирующие различные биохимические превращения в клетке, функциониру- ют благодаря содержанию в них коферментов рибонуклеотидной природы (NAD, FAD, АТР и др.). • После открытия Т. Чеком с соавторами аутосплайсинга РНК у тстрахи.мсны стало ясно, что сами молекулы РНК могут обла- дать каталитическими свойствами, вполне сопоставимыми со свой- ствами ферментов-протеинов. Именно открытие рибозимов (РНК- ферментов) привело к созданию концепции «мира РНК» — мира, который, вероятно, возник и существовал задолго до оформле- ния ныне существующего «ДНК-белкового мира». Вскоре после открытия рибозимов Т. Чеком в одной из своих работ Ф. Крик писал: «Эти эксперименты (по каталитической РНК) поддержи- вают гипотезу, что биохимия РНК предшествовала традицион- ной биохимии, основанной на нуклеиновых кислотах и белках». Существует несколько аргументов в пользу того, что РНК пред- ставляет собой первичную молекулу — носитель жизни. Известна способность РНК нести генетическую информацию. Это в полной мерс свойственно ныне существующим РНК-содержащим виру- сам. Доказано также, что вирусные РНК способны к рекомбина- ции, в которую могут вовлекаться как вирусные, так и клеточные РНК. Широко известны ставшие уже классическими результаты опытов Г.Урея и С. Миллера, воспроизводящих первичную (аби- отическую) среду Земли. Так, из газообразных веществ (аммиака, углекислого газа, метана и водорода) при воздействии электри- ческого разряда и УФ-облучения можно получить элементарные соединения (формальдегид, синильную кислоту, мочевину, от- дельные аминокислоты и др.), из которых далее образуются пу- риновые основания (А и G) — исходные молекулы, необходимые для образования нуклеотидов. Сами нуклеотиды уже являются убик- вистическими молекулами, способными существовать в виде раз- личных жизненных форм (коферментов, энергоносителей и др.). В результате использования энергии, выделявшейся при нагрева- нии сухих органических остатков или под действием каталитичес- кой активности неорганических полифосфатов, нуклеотиды мог- ли взаимодействовать друг с другом с образованием полимерных ИЗ
молекул. Случайное объединение нуклеотидов в полимерные цепи имело решающее значение, ибо привело к возникновению мат- ричных молекул, пригодных для комплементарного копирования. Дальнейшая эволюция этих молекул могла привести к отбору ка- талитически активных РНК. Таким образом мог возникнуть «мир РНК», где РНК выступает как самодостаточная молекула, соче- тающая в себе генотип и фенотип одновременно и способная к эволюционному развитию благодаря рекомбинации и каталити- ческим способностям. Ключевым ферментом этого мира должен быть фермент РНК-рспликаза, способный осуществлять аутока- талитическую репликацию РНК. Поиски такого фермента в на- стоящее время ведутся среди интронов группы I — участков моле- кул определенных видов РНК, служащих источником для воз- никновения и ныне существующих рибозимов. В ходе дальнейшей биологической эволюции и особенно в свя- зи с возникновением клеточных форм жизни часть функций РНК, вероятно, перешла кДНК, а другая часть — к белкам. Существу- ющие РНК обладают высоким разнообразием жизненных форм (фенотипов), превосходя в этом отношении ДНК, и сохраняют способность к хранению и передаче генетических признаков, чем принципиально отличаются от белковых молекул, многие из ко- торых они «приспособили» для обеспечения своего собственного существования. В последующих главах мы продемонстрируем при- меры межмолекулярных (белково-нуклеиновых взаимодействий), характерных для современного этапа существования главных клас- сов биополимеров.
Глава 4. СТРУКТУРА ГЕНОМА ВИРУСОВ И ФАГОВ Вирусы — это внеклеточная форма жизни, обладающая соб- ственным геномом и способная к воспроизведению только в клет- ках живых организмов. Вирион (или вирусная частица) состоит из одной или несколь- ких молекул ДНК или РНК, заключенных в белковую оболочку (капсид), иногда содержащую также липидные и углеводные ком- поненты. Вирусы размножаются только после инфицирования живых клеток. Различные вирусы проникают в животные и растительные клетки, а также бактерии (вирусы бактерий называются бактерио- фагами). Вирусы являются внутриклеточными паразитами па ге- не гическом уровне и используют для своего размножения белок- синтезируюший аппарат клетки-хозяина. Жизненный цикл вируса начинается с проникновения внутрь клетки. Дчя этого он связывается со специфическими рецептора- ми на се поверхности и либо вводит свою нуклеиновую кислоту внутрь клетки, оставляя белки вириона на ее поверхности, либо проникает целиком в результате эндоцитоза. В последнем случае после проникновения вируса внутрь клетки следует его «раздева- ние» — освобождение геномных нуклеиновых кислот от белков оболочки. В результате этой процедуры вирусный геном становит- ся доступным для ферментных систем клетки, обеспечивающих экспрессию генов вируса. Именно после проникновения вирус- ной геномной нуклеиновой кислоты в клетку заключенная в ней генетическая информация расшифровывается генетическими си- стемами хозяина и используется для синтеза компонентов вирус- ных частиц. По сравнению с геномами других организмов вирус- ный геном относительно мал и кодирует лишь ограниченное число белков, в основном белки капсида и один или несколько белков, участвующих в репликации и экспрессии вирусного генома. Необ- ходимые метаболиты и энергия поставляются хозяйской клеткой. Геном вирусов, заключенный внутри вирионов, может быть представлен ДНК или РНК, последние могут быть одно- и двуце- почечными, кольцевыми и линейными. Значения молекулярных масс ДНК вирусов находятся в пределах I • 10б —200-106; РНК — 1 • 106— 15 • 106 дальтона. 115
Вирус (примерный размер генома в тыс. н.п. или тыс. н.) Вирус гепатита В(3) ДНК-содержащие вирусы Структура генома Паповавирусы (5) Частично одноцепочечная кольцевая ДНК Сверхспиральцая замкнутая кольцевая ДНК Аденовирус (36) Вирус герпеса (200) Линейный дуплекс Вирус осповакиипы (200) Линейный дуплекс с ковалентно сшитыми концами Парвовирус (2) Фаг <рХ174 (5,3) Фаг М13 (6,0) Одноцепочечная линейная ДНК Ретровирус (10) Вирус гриппа (16) Полиовирус (7) ВТМ (7000) Реовирус (30) Одноцепочечное кольцо РПК-содержащие вирусы 10 разных двуцепочечных молекул Рис. 59. Структура генома вирусов Одноцепочечный диплоидный геном 8 разных одноцепочечных молекул Одноцепочечная молекула 116
По сложности строения генома вирусы широко варьируют — от фага Qp (РНК-содержащий вирус бактерий), имеющего 4 гена, ло вируса оспы (ДНК-содержащий вирус), геном которого на- считывает около 2-50 генов. Кроме того, все гены вирусов могут быть заключены в одной молекуле нуклеиновой кислоты или рас- пределены по нескольким молекулам, которые вместе и состав- ляют геном такого вируса. Например, у рсовирусов геном пред- ставлен двуцепочечной РНК и состоит из 10 молекул (или сег- ментов). Геномы вирусов, содержащих одноцепочечную РНК, так- же могут быть либо цельными (ретровирус), либо сегментирован- ными (вирус гриппа). Геном РНК-содержащих вирусов представ- лен только линейными молекулами РНК. Все известные ДНК-содержащие вирусы позвоночных имеют геном, заключенный в одной молекуле ДНК, линейной или коль- цевой, одно- или двуцепочечпой (рис. 59). У некоторых вирусов, например у вируса гепатита В, геном представлен кольцевой молекулой двуцепочечной ДНК, в обеих цепях которой в разных местах обнаружены одноцепочечные уча- стки. ТИПЫ ГЕНЕТИЧЕСКОГО МАТЕРИАЛА И МЕХАНИЗМ ЕГО РЕПЛИКАЦИИ У РАЗЛИЧНЫХ ВИРУСОВ РНК-содержащие вирусы (РНК-> РНК). Геномы почти всех из- вестных РНК-содержащих вирусов — это линейные молекулы, их удобно разделить на 3 группы. Первая группа — это однонитевыс геномы положительной по- лярности, т.е. с нуклеотидной последовательностью, соответству- ющей таковой у мРНК. Такие геномы обозначают как (+) РНК. Однонитевый (+) РНК-геном характерен для фага Qp, вирусов табачной мозаики, полиомиелита, клещевого энцефалита. Вирус- ные (+) РНК-геномы кодируют несколько белков, среди которых РНК-зависимая PH К-полимераза (репликаза), способная синте- зировать молекулы РНК без участия ДНК. С помощью этого фер- мента синтезируются сначала (-) нити РНК фага, а затем при наличии особого белка, называемого «хозяйским фактором», реп- ликаза осуществляет синтез (+) нити РНК. На заключительной стадии из накопившихся вирусных белков и (+) РНК формиру- ются вирионы. Упрошенная схема этого процесса такова: (+) РНК (-) РНК (в рамку заключена та форма нуклеиновой кислоты, которая присут- ствует в вирионе). 117
Вторая группа — это однонитевые геномы с негативной поляр- ностью, т.е. (-) РНК-геномы. К вирусам с негативным РНК-ге- номом относятся вирусы гриппа, кори, бешенства, желтой кар- ликовости картофеля и др. Поскольку (-) РНК не может выпол- нять функции мРНК, для образования «своих» мРНК вирус вне- дряет в клетку не только геном, но и фермент, умеющий снимать с этого генома комплементарные копии по схеме: | (-) РНК | (+) РНК Этот вирусный фермент (РНК-зависимая РНК-полимераза, син- тезированная в предыдущем цикле размножения) упакован в ви- рионе в удобной для доставки в клетку форме. Инфекционный про- цесс начинается с того, что вирусный фермент копирует вирус- ный геном, образуя (+) РНК, которая выступает в качестве матри- цы для синтеза вирусных белков, в том числе РНК-зависимой РНК- нолимеразы, которая входит в состав образующихся вирионов. Третью группу составляют двунитевые геномы, (±) РНК-гено- мы. Известные двунитевые геномы всегда сегментированы (т.с. состоят из нескольких разных молекул). Сюда относятся реовиру- сы. Их размножение проходит по варианту, близкому к предыду- щему. Вместе с вирусной РНК в клетку попадает и вирусная РНК- зависимая РНК-полимераза, которая обеспечивает синтез моле- кул (+) РНК. В свою очередь (+) РНК обеспечивает производство вирусных белков па рибосомах хозяйской клетки и служит матри- цей для синтеза новых (-) РНК-цепочек вирусной РНК-полиме- ра зон: I (±) РНК | (+) РНК Цепочки (+) и (-) РНК, комплекснруясь друг с другом, обра- зуют двунитевый (±) РНК-геном, который упаковывается в бел- ковую оболочку. РНК-содержащие вирусы (РНК -> ДНК РНК). Сюда относят- ся вирусы, у которых цикл репликации генома можно разбить на две главные реакции: синтез РНК на матрице ДНК и синтез ДНК на матрице РНК. При этом в состав вирусной частицы в качестве генома может входить либо РНК (ретровирусы), либо ДНК (рет- роидные вирусы). В эту группу входят вирус иммунодефицита человека (ВИЧ) и некоторые возбудители злокачественных новообразований. Вирус- ная частица содержит две молекулы геномной одноцепочечной 118
(+) РНК. В вирусном геноме закодирован необычный фермент (обратная транскриптаза, или рсвертаза), который обладает свой- ствами как РНК-зависимой, так и ДНК-зависимой ДНК-полиме- разы. Этот фермент попадает в заражаемую клетку вместе с вирус- ной РНК и обеспечивает синтез ее ДНК-копии сначала в одноце- почечной форме [(-) ДНК], а затем в двуцепочечной [(±) ДНК]: Вирусный геном в форме нормального дуплекса ДНК (так на- зываемая провирусная ДНК) встраивается в хромосому клетки хозяина. В результате двуцепочечная ДНК вируса представляет со- бой в сущности дополнительный набор генов клетки, который реплицируется вместе с ДНК хозяина при делении. Для образова- ния новых ретровирусных частиц провирусные гены (гены вируса в хромосомах хозяина) транскрибируются в ядре клетки транс- крипционным аппаратом хозяина в (з) РНК-транскрипты. Одни из них становятся геномом нового «потомства» ретровирусов, а другие подвергаются процессингу в мРНК и используются для трансляции белков, необходимых для сборки вирусных частиц (см. с. 296). К этой же группе относятся онкогенные ретровирусы: вирус саркомы Рауса (птиц), вирус лейкоза мышей и т.д. Разви- тие опухоли определяет один ген резровируса — онкоген. ДИК-содержащие вирусы. Первая группа — вирусы с двуцепо- чечной ДНК, репликация которых осуществляется по схеме: ДНК-> РНК-> ДНК. Они получили название ретроидные вирусы. Представителями этой группы вирусов являются вирус гепатита В и вирус мозаики цветной капусты. Репликация ДНК-генома этих вирусов осуществляется при посредстве промежуточных молекул РНК: Молекулы РНК образуются в результате транскрипции вирус- ных ДНК в клеточном ядре хозяйским ферментом ДНК-зависи- мой РНК-полимеразой. Транскрибируется только одна из нитей вирусной ДНК. Синтез ДНК на РНК-матрице происходит в ре- 119
зультате реакции, катализируемой обратной транскриптазой; сна- чала синтезируется (-) нить ДНК, а затем на вновь синтезиро- ванной (-) нити ДНК тот же фермент строит (+) нить. В целом общая схема репликации генома ретрондных вирусов поразительно похожа на схему репликации генома ретровирусов. По-видимому, данное сходство имеет под собой и эволюцион- ную основу, так как первичная структура обратных транскриптаз этих вирусов выявляет определенное сходство между собой. Вторая группа — вирусы с двуцепочечной ДНК, репликация которых осуществляется по схеме ДНК->ДНК. В зараженной клетке ДНК-зависимая РНК-полимераза транскрибирует с генома этих вирусов молекулы мРНК (т.е. (+) РНК), которые принимают уча- стие в синтезе вирусных белков, а размножение вирусного генома осуществляет фермент ДНК-зависимая ДНК-полимераза: | (±) ДНК|—(+) РНК> В одних случаях производством как мРНК, так и ДНК занима- ются клеточные ферменты; в других случаях вирусы используют собственные ферменты. Бывает, что те и другие ферменты обслу- живают процесс репликации и транскрипции. К этой группе от- носятся вирусы герпеса, оспы и др. Третья группа — вирусы с одноцепочечпой ДНК, либо с нега- тивной, либо с позитивной полярностью. Попав в клетку, вирус- ный геном сначала превращается в двуцепочечную форму, это превращение обеспечивает клеточная ДНК-зависимая ДНК-по- лимераза: (+) ДНК или (-) ДНК (±) ДНК —- (+) РНК Транскрипция и репликация на последующих этапах происходит так же, как и для вирусов, с (±) ДНК-геномом. ТИПЫ ВЗАИМОДЕЙСТВИЯ ВИРУСА С КЛЕТКОЙ-ХОЗЯИНОМ Существуют два типа взаимодействия вируса и клетки, где глав- ное различие — степень автономии вируса от клетки-хозяина. Это детально исследовано на примере бактериофага X. Когда бактериофаг X заражает подходящую клетку кишечной палочки, он немедленно реплицируется и образует несколько со- тен дочерних фаговых частиц, которые выходят наружу в момент 120
лизиса клетки. Лизис клеточной стенки осуществляет кодируе- мый фагом фермент лизоцим. Это так называемый литический путь инфекции — он заканчивается гибелью клетки-хозяина. В данном случае вирус не подчиняется клеточному контролю. Альтернативным является лизогенный путь инфекции, при ко- тором линейные инфицирующие молекулы ДНК фага X замыка- ются в кольцо и включаются (интегрируют) в кольцевую хромо- сому клетки-хозяина. Эта интеграция осуществляется путем сайт- специфнческой генетической рекомбинации, катализируемой осо- бым белком фага X, так называемой интегразой. Клетка, содержа- щая ДНК фага \ в своей хромосоме, называется лизогенной клет- кой, а встроенная ДНК фага X — профагом. Клетки и их хромосо- мы делятся, а вместе с хромосомами в каждую дочернюю клетку попадают и фаговые гены. При определенных обстоятельствах, а именно при воздействии какого-нибудь повреждающего внеш- него фактора (например, ультрафиолетовых лучей, ионизирую- щего излучения, химических реагентов), активируются так на- зываемые «SOSft-функции, предназначенные для устранения на- рушений. В лизогенной клетке это приводит к выщеплению (экс- цнзии) профага из клеточной ДНК и началу обычного, свой- ственного фагу цикла размножения, т. е. отщепившийся профаг вступает в литический цикл репликации. Интегрированный про- фаг, таким образом, не погибает вместе с поврежденной клет- кой-хозяином, а у него есть шанс перейти в соседнюю неповреж- денную клетку кишечной палочки (рис. 60). В животных клетках, как и у бактерий, ДНК-вирусы могут раз- множаться литическим путем, ведущим к гибели клетки. Такие животные клетки называют пермиссивными. Клетки, в которых раз- множение вирусов блокируется, называются непермиссивными; вирусная хромосома в таких случаях либо включается в геном клет- ки-хозяина и затем размножается вместе с ним, либо образует плазмиду — кольцевую молекулу ДНК, репликация которой ре- гулируется н пс ведет к гибели клетки. Иногда это вызывает в пепермиссивных клетках определенное генетическое изменение, в результате которого начинается их неконтролируемый рост, т.е. нормальные клетки превращаются в раковые. Соответствующий ДНК-вирус называют в таких случаях опухолевым ДНК-вирусом; к ним относятся наиболее изученные представители паповавиру- сов — SV40 и вирус полиомы. В ретровирусах (РНК-содержащих вирусах: вирус саркомы Рау- са, вирус СПИДа и т.д.) ревертаза превращает их РНК в форму ДНК, которая встраивается в клеточную хромосому. В результате транскрипции интегрированной вирусной ДНК клеточной ДНК- зависимой РНК-полнмеразой образуется большое количество молекул вирусной РНК, идентичных исходному инфицирующе- му геному. Завершается процесс трансляцией этих молекул РНК 121
Бактериофаг X Бактериальная клетка Хромосома клетки-хозяина Прикрепление к клетке и введение в нее ДНК Образование кольцевой формы ДНК Включение ДНК бактериофага в хромосому клетки Интегрированная вирусная ДНК размножается вместе с хромосомой хозяина; образуются новые копии интегрированной вирусной ДНК ЛИЗОГЕННЫЙ ПУТЬ Синтез вирусных белков, необходимых для образования новых вирусов Быстрая репликация свободной вирусной ДНК и ее упаковка • в вирусные частицы Лизис клетки высвобождает большое ' число свободных вирусных частиц ЛИТИЧЕСКИЙ ПУТЬ Рис. 60. Жизненный цикл бактериофага X с образованием капсидных и мембранных белков, а также обрат- ной транскриптазы; наконец, происходит сборка новых вирусных частиц, включающих вирусный РНК-геном и обратную транскрип- тазу. Вирусные частицы покидают клетку, не убивая ее. Возникает особая форма хронической инфекции, при которой работающий вирусный геном, включенный в состав клеточной хромосомы, передается дочерним клеткам. Такое сосуществование не обходит- ся бесследно для клетки. Свойства се пол влиянием находящихся в ней вирусных белков могут драматически меняться, и в некото- рых случаях зараженная клетка становится раковой. 122
ХАРАКТЕРИСТИКА НЕКОТОРЫХ ВИРУСОВ Фаг X. ДНК фага X упакована в гексагональную головку, обра- зованную несколькими белками (рис. 61, А). К головке прикреп- лен хвостовой отросток, построенный из других белков. Белки го- ловки и хвостового отростка кодируются геномом фага X и синте- зируются в клетках бактерий, инфицированных фагом. Фаг при- крепляется к клеточной стенке и вводит ДНК в бактериальную клетку подобно шприцу. ДНК фага X — линейная двуцепочечная молекула, содержа- щая 48502 н. п. Осуществлено картирование практически каждого из его 61 гена, полностью определена нуклеотидная последова- тельность его генома. Молекула ДНК фага X содержит область начала репликации (ori), гены структурных вирусных белков (головки и хвостового отростка) и ферментов, участвующих в репликации ДНК, лизисе инфицированных клеток и установлении лизогении (рис. 61, В). Приблизительно 1/3 генома, представленная непрерывным внутренним сегментом, находящемся на карте между точками 20 н 38 тыс. и. п., необходима для установления лизогенного состоя- ния. У всех векторов, сконструированных на основе ДНК фага X, многие или даже все гены, требующиеся для установления лизо- генного состояния, удаляются, и в этих случаях инфицирование фагом кишечной палочки сопровождается их лизисом. Во время своего жизненного цикла Х-геном может находиться в разных формах. Внутри фаговой частицы ДНК находится в ли- нейной форме: 5’-консц каждой ее цепи представляет собой од- ноцепочечную последовательность из 12 нуклеотидов. Эти после- довательности называются «липкими концами», так как они вза- имно комплементарны и могут спариваться друг с другом. При попадании в клетки Е. colt геном фага X замыкается в кольцо и сшивается с помощью бактериальной ДНК-лигазы (рис. 61, Б). Места спаривания липких концов получили название coj-сай- тов. Кольцевая форма обязательна для осуществления репликации фаговой ДНК, она также служит предшественником при лизо- генной интеграции ДНК фага в геном хозяина. После интеграции геном фага X снова становится линейным, однако благодаря уда- ленности сайта интеграции па фаговой ДНК (лГ/Р) от cos-сайта, интегрированная линейная ДНК профага оказывается пермути- рованной (измененной с перестановкой) относительно ДНК, находящейся в фаговой частице. На основе фага X сконструировано множество разных Х-векто- ров, которые включают вставки разных размеров; максималь- ный — немногим более 24 тыс. н.п. Фаг срХ174. Геном этого фага представлен кольцевой одно- цепочечной ДНК, содержащей 5386 нуклеотидов. Нуклеотидная 123
ДНК Белки головки Белки хвостового отростка Начало репликации (он) Левый липкий конец 5'pGGGCGGCGACCT CCCGCCGCTGGAp—5' Правый липкий конец attP cos Сайт, образующийся при отжиге и лигировании липких концов attP attP Клеточная ДНК Клеточная ДНК Белки Терми- Белки хвостового наза головки отростка Синтез ДНК | Лизис /О? Q‘ SR* attP Б 2 3 В Рис. 61. Бактериофаг! (М. Сингер, П.Берг, 1998): А — строение; Б — формы генома: / — линейная; 2 — кольцевая; 3 — интегри- рованная; щ/Р-сайт интеграции; В — структура генома: заштрихованы гены, не- обязательные для литической инфекции; светлый опал — область начала реп- ликации; Е— £coRI-сайты последовательность ДНК этого мелкого фага была установлена в 1977 г. Ф. Сангером и его коллегами в Кембридже (Англия). Это достижение знаменовало собой начало новой эры в молекуляр- ной биологии и принесло Сангеру вторую Нобелевскую премию. Важным результатом работы было обнаружение в геноме фага 124
ФXI74 перекрывающихся генов и «генов внутри генов». Этот факт был установлен в результате тща- тельного сравнения нуклеотидной последовательности ДНК с ами- нокислотной п осл ед о вател ы i ос - тыо кодируемых сю белков. ДНК фага ip X174 содержит девять гепов, обозначенных в алфавитном по- рядке А—.1. Белки же, кодируемые этой ДНК, содержат большее ко- личество аминокислотных остат- ков, чем может быть закодирова- но 5386 нуклеотидами, найденны- ми в ДНК. фага (рис. 62). Оказалось, что ген В располо- жен внутри гена А, аналогичным образом ген Е лежит внутри гена D. В пяти случаях стартовый ко- Рпс. 62. Генетическая карта фага <рХ174. Букпамп обозначены тепы. Ген В расположен внутри гена Л, а ген Е внутри гена D. Штриховкой показа- ны участки, которые не транскриби- руются доп одного гена перекрывает тер- минирующий кодон другого, при этом сигналы используют раз- ные рамки считывания. Протяженность перекрывающихся после- довательностей и внутренних генов полностью компенсирует не- хватку нуклеотидов в ДНК этого фага. Было высказано предполо- жение, что перекрывающиеся гены и «гены внутри генов» суще- ствуют только в геномах малых вирусов. Фиксированные размеры вирусного капсида обуславливают экономное использование ог- раниченного количества ДНК, которое кодирует белки, необхо- димые для обеспечения инфекциопности вирусных частиц и под- держания ее способности к репликации. Является ли этот случай курьезом пли он имеет общебиологическое значение? Пока труд- но ответить на этот вопрос, так как одни фаги (например, G4), родственные фагу срХ 174, ведут себя аналогичным образом, дру- гие (как fd) — нет. Подобная картина перекрывания генов была зафиксирована для фага л и для опухолевого вируса SV40, раз- множающегося в клетках эукариот. Вирус SV40. SV40 — это эукариотический ДНК-содержащий онкогенный вирус. Его геном представлен одной замкнутой дву- цепочечной молекулой ДНК. ДНК в составе вирусной частицы находится в комплексе с четырьмя клеточными гистонами и обра- зует кольцевую, содержащую нуклеосомы минихромосому, уло- женную в компактную структуру и окруженную внешней белко- вой оболочкой (капсидом). Природным хозяином SV40 является макака-резус. Расшифрована нуклеотидная последовательность всего генома SV40, состоящая из 5243 н.п., и установлены участки, кодирую- 125
Рис. 63. Геном вируса SV40. С внутренней стороны карты указано число пар основании; Нр, Т, Е, В, Нс — уникальные рестриктазныс сайты. Участ- ки, кодирующие пять вирусных белков, вынесены за пределы карты. Большой Т- аптнген кодируется двумя отдельными группами генов щие пять вирусных белков: малый и большой Т-антигены (от англ. tumour — опухоль), VPI, VP2 и VP3 (рис. 63). Вирус SV40, проникнув в клетку, направляется к ядру. Здесь происходит его «раздева- ние», а затем в строгой времен- ной последовательности — экспрессия генов. Первыми транскри- бируются гены двух белков — малого и большого Т-антигенов в направлении против часовой стрелки. Этот участок в геноме назы- вается «ранней областью». При синтезе мРНКдля Т-антигенов про- исходит вырезание вставочной последовательности из первичного транскрипта с использованием аппарата сплайсинга клеточного ядра. Ранние белки не входят в состав зрелых вирусных частиц, но боль- шой Т-антигсн шрает важную роль в репликации вирусной ДНК, выполняя функцию хеликазы. Репликация начинается в точке ori, идет в обоих направлениях и заканчивается в месте встречи репли- кативных вилок; затем происходит сшивание дочерних двуцепо- чечных молекул ДНК с образованием замкнутых кольцевых струк- тур. Вскоре после инициации репликации ДНК замедляется синтез «ранних» белков и активизируется транскрипция «поздних» генов, которая начинается вблизи ori и протекает по часовой стрелке. Три мРНК, по-видимому, образуются в результате различных реакций сплайсинга и транслируются в соответствующие белки — VPI, VP2 и VP3. Накопление дочерних молекул ДНК, вирионных белков, за- вершается сборкой новых вирусных частиц, их высвобождением из клетки и гибелью последней. Вирус SV40 не реплицируется в клетках грызунов, его геном встраивается в клеточную ДНК, вы- зывая злокачественное перерождение клетки-хозяина. Для поддер- жания трансформированного состояния необходимы оба вирус- ных антигена (экспрессия «ранней» области генома вируса), «позд- няя» область не участвует в этом процессе. Таким образом, ограниченное количество генетической инфор- мации у вируса SV40 используется с максимальным эффектом (перекрывание генов, сплайсинг и т.д.); кроме того, новосинте- 126
шрованная ДНК связывается с гистонами клетки-хозяина и обра- ivct сверхспирализованный комплекс, который затем упаковыва- ется в капсулу с помощью вирусных белков (VPI, VP2 и VP3). На основе вируса- SV40 конструируют различные типы векто- ров: это трансдуцирующие, плазмидные, пассивные трансфор- мирующие SV40 векторы. Фаг М13. Фаг М13 входит в группу нитчатых бактериофагов Е. coli. Его геном представлен одноцепочечной кольцевой молеку- лой ДНК, содержащей 6400 нуклеотидов. Он упакован в напоми- нающий пробирку капсид, построенный из трех разных кодируе- мых фагом белков. Фаг М13 инфицирует клетки Е. coll в том слу- чае, если последние имеют тонкие, напоминающие волоски структуры, называемые F-пилями, которые необходимы для при- крепления фага к клетке. В процессе репликации фага MI3 в клет- ках Е. coli одноцепочечная ДНК превращается в двуцепочечную кольцевую форму, т.е. синтезируется комплементарная инфици- рующей цепи ДНК. Двуцепочечная ДНК детерминирует синтез примерно 300 своих копий, которые затем используются в каче- стве матриц при образовании одноцепочечных фаговых ДНК, упа- ковывающихся в фаговые частицы. Одновременно транскрибиру- ются и транслируются фаговые гены, а на внутренней мембране клетки Е. coli концентрируется основной капсидный белок. Зре- лые одноцепочечные молекулы фаговой ДНК проходят через мем- брану, захватывая при этом капсид- ный белок, в результате чего обра- зуется большое количество зрелых фаговых частиц. Инфицированные клетки при этом не погибают, но рост их замедляется. Большая часть генома М13 со- держит гены, кодирующие белки оболочки, а также белки, участву- ющие в репликации и сборке фа- говой частицы (рис. 64). Область на- чала репликации состоит пример- но из 150 нуклеотидов, находящих- ся внутри некодирующего сегмен- та длиной 507 нуклеотидов. В этот сегмент может быть помещена вставка чужеродной ДНК без нару- шения способности М13 к репли- кации. Двуцепочечную репликативную форму ДНК можно легко выделить из инфицированных клеток и ис- пользовать затем в качестве векто- Рпс. 64. Структура генома фага 'М13. Гены обозначены цифрами: гены 2 и 5 ответственны за репликацию, остальные детерминируют образо- вание капсида и сборку вирусной частицы. СветлыИ овал — область начала репликации: rzzi — пеко- днрующнп участок 127
ра в генно-инженерных работах. Одноцепочечная ДНК, содержа- щаяся в нескольких сотнях фаговых частиц культуральной среды, является удобным объектом для получения одноцепочечных ре- комбинантных молекул и проведения на их основе детального анализа нуклеотидных последовательностей, а также синтеза спе- цифических радиоактивно меченных ДНК-зондов (см. гл. 14). Ретровирусы — это обширная группа вирусов, представители которой различаются как по биологическим свойствам (напри- мер, по способности вызывать злокачественные опухоли), так и по морфологии; имеются и заметные вариации в структуре их ге- номов. Общие черты этих геномов следующие: 1) вирусная РНК — одноцепочечная молекула длиной до де- сяти тысяч нуклеотидов, представляет собой (+) нить, молекулы РНК копированы на 5'-конце и полиаденилированы на З'-конце; 2) в молекулах РНК есть прямой концевой повтор (R.) длиной несколько десятков нуклеотидов (на З'-конце он предшествует поли(А)-тракту); 3) в вирусной РНК записана информация для синтеза по край- ней мере трех групп вирус-специфпческих белков: структурных белков сердцевины вириона (Gag-белков), ферментативных бел- ков, принимающих участие в обратной транскрипции вирусного генома и в интеграции вирус-специфической ДНК в клеточную хромосому (продуктов гена ро!) и белков, входящих в состав на- ружной липопротеиновой оболочки вириона (Env-бслков). У не- которых ретровирусов есть дополнительные гены: 4) вирусная частица содержит две молекулы геномной РНК; таким образом, редкой (если не уникальной) особенностью рет- ровирусов является диплоидность их генома. Фундаментальные исследования ретровирусов, вызывающих опухоли у птиц и млекопитающих, указали путь к решению на- сущных клинических проблем, связанных с раковыми заболева- ниями человека и синдромом приобретенного иммунного дефи- цита — СПИДом. СПИД вызывает один из ретровирусов ВИЧ (вирус иммунодефицита человека), который инфицирует макро- фаги и один из типов Т-лимфоцитов, выводя из строя иммунную систему больного. Другие лимфотропные ретровирусы человека также инфицируют Т-клстки, но вызывают лейкозы. Структура вируса иммунодефицита человека представлена на рис. 65. Вирусная частица имеет сферическую форму, ее диаметр около 100 мм. Оболочка частицы образована двойным слоем ли- пидов, пронизанных гликопротеинами. Липидная мембрана про- исходит из внешней мембраны клетки-хозяина. В каждой глико- протеиновой молекуле имеются две субъединицы: gp41, прони- зывающая мембрану, и gpl 20, находящаяся снаружи. Внутри обо- лочки заключена сердцевина вируса, образованная белками pl7 и р24. В сердцевине вирусной частицы находятся вирусная РНК и 128
молекулы обратной транскриптазы. В настоящее время расшифро- вана структура генома ВИЧ-I. Белки, закодированные в геноме ВИЧ, представлены в табл. 7. Из данных таблицы видно, что геном ВИЧ содержит 9 генов, по процессинг (клеточными и вирусными ферментами) генери- рует 14 белковых продуктов. Ген gag кодирует внутренние белки вириона; они синтезируются в виде полипротеина, из которого Таблица 7 Белки, закодированные в геноме ВИЧ-1 Ген Белок Функция Белки вириона MA (pl 7) Матричный белок; связывание с мембраной, сборка вируса № CA (p24) Белок капсида; сборка вируса NC (p9) Белок нуклеокапсида; РНК-связывание; сборка вируса PR (pl 1) Протеаза; созревание вируса pal RT (p66/p51) Обратная транскриптаза; репликация вируса IN (p32) Интеграза; репликация вируса env SU (gp!20) Вирусный белок оболочки; связывание CD 4-рсцептора, ипфскциоииость вируса TM (gp41) Трансмембранный гликопротеин оболочки; ш |фскцион1 юсп> вируса Вспомогательные белки vpr Vpr Вирусный белок R; перемещение предыптсграциопного комплекса в ядро vif Vi г Фактор вирусной инфскциоипости; прсдынфскционпыс события vptl Vpu Вирусный белок U; созревание вирусной оболочки и выход вируса Регуляторные белки tat Tat Трапсактиватор; стимулирует элонгацию транскрипции fW Rev Регулятор экспрессии поздних генов; стимулирует появление песплайсировапных мРНК в цитоплазме nef Nef Отрицательная регуляция CD4; регулирует сигнальные пути Т-клеток ? Комичен 129
потом протеаза вырезает конкретные белки. Следующий кодиру- ющий участок, pol, детерминирует синтез обратной транскрипта- зы. Фермент полифункиионален: он способен синтезировать ДНК, используя в качестве матрицы либо РНК, либо ДНК; кроме того, он ведет себя подобно РНКазе Н (т.е. разрушает цепь РНК, вхо- дящую в состав РНК/ДНК дуплекса) и обладает эндонуклеазной активностью. Ген pol кодирует и интегразу, осуществляющую вклю- чение ДНК вируса в геном зараженной клетки. Ген env кодирует компоненты вирусной оболочки, которая захватывает часть кле- точной цитоплазматической мембраны. В геноме ВИЧ представле- ны также гены вспомогательных и регуляторных белков. Так, бел- ки Tat и Rev совместно обеспечивают значительное увеличение синтеза вирусных белков при переходе провируса из латентной в активную форму. Репликативный цикл ВИЧ. После взаимодействия вирусной ча- стицы с чувствительной клеткой (Т-лимфоцитом) сердцевина вириона освобождается от липопротеиновой оболочки и оказыва- ется в цитоплазме Т-лимфоцита. Здесь обратная транскриптаза превращает вирусную РНК в линейную двуцепочечную молекулу ДНК. Образовавшаяся молекула вирусной ДНК длиннее молеку- лы вирусной РНК, которая послужила матрицей для ее синтеза. Действительно, к 5'-концу вирусной ДНК добавляется последо- вательность U3, а к З'-концу этой цепи — последовательность U5 (см. рис. 114). В результате на концах молекулы вирус-специфиче- ской ДНК появился длинный концевой повтор (ДКП), имею- щий структуру U3RU5. На следующем этапе линейная молекула ДНК проникает в ядро, где превращается в кольцевую молекулу (рис. 65) за счет взаимодействия между ее «тупыми» концами. При этом одна форма кольцевой ДНК содержит одну копию ДКП, другая — две тандемные копии ДКП. Одна или несколько копий ДНК интегрируют в геном лимфоцита. Интеграция ДНК ВИЧ в геном зараженной клетки является ключевой стадией репликативного цикла этого ретровируса. Она осуществляется вирусным ферментом интегразой, кодируемым ге- ном pol. Интеграза узнает строго определенные нуклеотидные пос- ледовательности, локализованные в U3 и П5 ДКП вирусной ДНК, связывается с ними н катализирует реакцию З'-концевого процес- синга. Эта реакция представляет собой эндопуклеазное расщепле- ние вирусной ДНК, в результате которого с З'-конца каждой цепи удаляется динуклеотид GT (рис. 66). Затем интеграза осуществляет реакцию трансэтерификации, которая включает нуклеофильную атаку З'-гидроксильной группы процессированных цепей ДНК на межнуклеотидный фосфат клеточной ДНК с образованием кова- лентного продукта. Важно отметить, что встраивание вирусной ДНК может осуществляться в любое место клеточной ДНК, т.е. процесс (называемый переносом цепи) не зависит от нуклеотид- 130
Рис. 65. Вирус иммунодефицита человека: А — структура вируса: GP — гликопротеины; Р — белки сердцевины вируса; • — обратная транскриптаза; Б — структура РНК-генома ретровируса (расшифровка генов дана в табл. 7); В и Г — продукты, образующиеся в результате обратной транскрипции РНК вируса: В — линейный дуплекс ДНК с последовательностью U3RUS (длинные концевые повторы — ДКП); Г — два кольцевых дуплекса, про- изводных формы В: I — с одним ДКП, 2 — с двумя ДКП 131
Интеграза ••'y-ACTGGAAGGG'-.-, I -----------1,, I |T, CTCTAGCAGT-3'\ •. З'-TGACCTTCCC U3I lU5l lU3l lU5:. GAGATCGTCA-5' кДНК ВИЧ Интеграза З'-концевой процессинг / У-ACTGGAAGGG ------------------[ЩПй/ CTCTAGCA -З' -. •. 3'- АССТТССС •-^-и-1----------1 LL GAGATCGTCA-5' : кДНК ВИЧ Интеграза Перенос цепи 1 1 1 1 ‘ U3| |U5| Клеточная ДНК |из| , , , , кДНК ВИЧ Клеточная ДНК Репарация |U3| |CJ5| |U3||U5| Клеточная кДНК ВИЧ Клеточная ДНК ДНК Рис. 66. Механизм интеграции ДНК вируса иммунодефицита в клеточ- ную ДНК пой последовательности. Обычно реакции трансэтерификации подвергаются межиуклеотидныс связи, расположенные в различ- ных цепях ДНК на расстоянии 5 н.п. одна от другой. При заверше- нии интеграции происходят процессинг 5'-коннов вирусной ДНК, полимеразная достройка пяти недостающих нуклеотидов и лиги- рование, осуществляемое клеточными белками. Синтез РНК ретровирусов идет тогда, когда геном вируса в виде провнрусной ДНК является интегральной частью клеточной хромосомы, и осуществляется в ядре клеточным транскрипцион- ным аппаратом; в качестве основного фермента используется РНК- полимераза II. Провирус длиннее РНК, поэтому транскрипция начинается и оканчивается внутри последовательностей ДКП: промотор распо- ложен в районе U3, терминатор — между последовательностями R. и U5. Первичные транскрипты провируса подвергаются обычным посттранскрипционным модификациям: кэпированию 5'-конца, 132
полиаденилированию З'-конца (в районе R есть сигнал полиаденилирования) и сплайсингу. Последняя модификация за- трагивает нс все РНК вируса. Молекулы РНК, сохранившие всю последователь- ность нуклеотидов, включаются в вири- он, подвергшиеся сплайсингу РНК ис- пользуются для трансляции белков, необ- ходимых для сборки вирусных частиц, тем самым завершается цикл репликации Рис. 67. Азотимидип транскрипции генома ВИЧ. Для возбудителя СПИДа характерна высокая генетическая из- менчивость: она на порядок выше, чем у вируса гриппа А. В связи с этим трудно создать универсальную вакцину против вируса им- мунодефицита человека. Разрабатывается стратегия терапевтического лечения СПИДа. Препарат азотимидип ингибирует обратную транскриптазу. Для этого он должен превратиться в трифосфат, являющийся анало- гом дТТР. Азотимидип завершает элонгацию цепи ДНК из-за от- сутствия З'-ОН группы (рис. 67). Клеточная ДНК-полимераза тор- мозится этим препаратом в гораздо меньшей степени. Используются различные классы ингибиторов интеграции ДНК ВИЧ, среди которых гидроксилированные ароматические соеди- нения (флавоны, ариламиды, тетрациклины), сульфоны и суль- фонаты, а также модифицированные олигонуклеотиды, осуще- ствляющие экранирование сайтов связывания интегразы в соста- ве ДНК и непосредственное взаимодействие с интегразой, при- водящее к подавлению ее ферментативной активности. ПРОИСХОЖДЕНИЕ ВИРУСОВ И ИХ РОЛЬ в эволюции Известно, что даже самые крупные вирусы нс способны осу- ществлять биосинтетические процессы самостоятельно — они за- висят в этом отношении от клеток-хозяев. Таким образом, клетки должны были появиться в процессе эволюции раньше вирусов. Предшественниками вирусов, вероятно, были небольшие фраг- менты нуклеиновых кислот, которые приобрели способность раз- множаться независимо от хромосом их клеток-хозяев. Такими не- зависимо размножающимися элементами являются плазмиды. Они встречаются в ДНК- и РНК-форме. Плазмиды не имеют белковой оболочки и не могут свободно переходить из клетки в клетку. Возможно, что первые РНК-плазмиды напоминали собой ви- роиды, встречающиеся в некоторых растительных клетках. Эти небольшие кольцевые молекулы РНК (не более 300—400 нуклео- 133
тидов) размножаются, хотя не кодируют никаких белков. Вирои- ды проявляют свойства инфекционных патогенов растений. Они переходят от растения к растению только в том случае, когда и донорная клетка, и клетка-реципиент оказываются поврежден- ными, когда между ними не существует мембранного барьера, который вироид не способен преодолеть. Под давлением естествен- ного отбора такие независимо реплицирующиеся элементы мог- ли, очевидно, включать в себя те нуклеотидные последовательно- сти клетки-хозяина, которые облегчали их самостоятельное раз- множение, в том числе и некоторые последовательности, коди- рующие белки. Первый вирус возник, вероятно, когда у плазмиды появился ген, кодирующий белок капсида. Число генов, которое может за- ключать в себе вирус, лимитируется размерами капсида. Так, мел- кие вирусы (фаг срХ174) обзавелись в ходе эволюции перекрыва- ющимися генами, в которых часть нуклеотидной последователь- ности, кодирующей один какой-нибудь белок, используется для кодирования второго белка. У других вирусов в процессе эволю- ции возникли более крупные капсиды, что могло дать им воз- можность приобретать новые полезные гены. Обладая уникальной способностью к переносу ДНК через ви- довые барьеры, вирусы играли важную роль в эволюции тех орга- низмов, которые они инфицируют. Многие вирусы часто вступа- ют в рекомбинацию как друг с другом, так и с хромосомами кле- ток-хозяев; при этом они захватывают случайные фрагменты хро- мосом и переносят их в другие клетки или другие организмы. Кро- ме того, включившиеся в геном хозяина (интегрированные) ко- пии вирусной ДНК (провирусы) становятся постоянными ком- понентами генома у большого числа организмов. Интегрирован- ная вирусная ДНК часто видоизменяется так, что утрачивает спо- собность образовывать полноценный вирус, но сохраняет способ- ность кодировать белки, часть из которых оказывается полезной для клетки. Таким образом, вирусы, как и половой процесс, со- здают возможности для ускорения эволюции, открывая для нее такой путь, как смешение генофондов различных организмов.
Глава 5. ГЕНОМ ПРОКАРИОТ Основной чертой молекулярной организации прокариот явля- ется отсутствие в их клетках ядра, отгороженного ядерной мемб- раной от цитоплазмы. Отсутствие ядра является лишь внешним проявлением особой организации генома у прокариот. Геном прокариот построен очень компактно. Количество неко- дирующих последовательностей нуклеотидов минимально. Мно- гие механизмы регуляции экспрессии генов, использующиеся у эукариот, никогда не встречаются у прокариот. Простота строе- ния генома прокариот объясняется их упрощенным жизненным циклом. СТРУКТУРА БАКТЕРИАЛЬНОЙ ХРОМОСОМЫ Пятьдесят лет назад все хромосомы прокариот считались ли- нейными. Но в 1956 г. Ф.Жакоб и Е. Бильман предложили кольце- вую модель бактериальной хромосомы. С тех пор эта модель счита- лась общепринятой до появления метода прямого анализа физи- ческой структуры хромосом — электрофореза в пульсирующем поле. В 1989 г. впервые этим методом была идентифицирована ли- нейная бактериальная хромосома у возбудителя клещевого спи- рохетоза Borrelia burgdorferi. Вскоре было обнаружено, что линей- ная и кольцевая хромосомы сосуществуют одновременно у Agrobacteriuni tumefaciens, а у грамположительных бактерий рода Streptomyces, обладающих одним нз самых больших бактериальных геномов (-8000 тыс. н. и.), имеется одна линейная хромосома. Ли- нейные хромосомы у бактерий часто сосуществуют с линейными плазмидами и широко распространены в природе. Состав геномов некоторых бактерий приведен в табл. 8. Размер генома у различных бактерий колеблется от 580 тыс. н. п. у Micoplasma genitalium до 9500 тыс. н. п. у Myxococcus xanthus. Для ки- шечной палочки Е. coliразмер генома составляет4600 тыс. н.п. (мо- лекулярная масса около 3 • 109 Да, длина молекулы около 1,5 мм). В бактериальных клетках хромосома сильно компактизована. Так, кольцевая молекула ДНК Е. coli длиной -1,5 мм заключена в клет- ку, имеющую форму палочки диаметром 1 мкм и длиной 2 мкм. 135
Таблица 8 Состав сложных геномов бактерий Бактерия Геном Agrobacterium lumefaciens C5S 1 линейная хромосома; 1 кольцевая хромосома; 2 плазмиды Bacillus cereus F0836 76 1 кольцевая хромосома; 1 мегаплазмида Brucelia melitensis 2 кольцевые хромосомы Leptospira interrogans 1 кольцевая хромосома; 1 мегаплазмида Rhizobium meliloti 1 кольцевая хромосома; 2 мегаплазмиды Rhodobacter sphaeroides 2 кольцевые хромосомы Rhodococcus facians 1 линейная хромосома; линейная плазмида Streptomyces ambofaciens 1 линейная хромосома В последние годы наблюдается прогресс в исследовании пер- вичной структуры бактериальных хромосом. На конец 2001 г. была определена полная нуклеотидная последовательность -100 прока- риотических геномов. Размеры и характеристики некоторых прокариотических гено- мов с известной нуклеотидной последовательностью приведены в табл. 9. Структуры, связанные с репликацией. Полная нуклеозидная последовательность бактериальной хромосомы позволяет опреде- лить структуры генома, связанные с его фунционированисм, т.е. с процессами репликации, транскрипции, трансляции, регуля- ции и г.д. Репликация бактериальной хромосомы начинается в точке ori С (origine) и продолжается в обоих направлениях до участка терми- нации репликации ter С (tenninus). У большинства бактерий уча- стки ori С и ter С делят кольцевую хромосому на две почти равные реплихоры. Область начала репликации во многих бактериальных геномах имеет консервативную структуру. Подобные структуры най- дены почти во всех ссквепированпых бактериальных геномах. Для линейных хромосом точка ori С определяется ровно посередине ее. Направление транскрипции большинства генов бактерий с вы- сокой скоростью роста совпадает с направлением репликации. Структура области инициации репликации ДНКархебактерий не- известна. Отсутствие асимметрии GC в геноме архей указывает па наличие множественных участков инициации репликации. Открытые рамки считывания и определение функций белка. От- крытая рамка считывания (англ, open reading frame, ORF) состоит из ряда триплетов, кодирующих аминокислоты; нс содержит ка- 136
Таблица 9 Характеристики некоторых бактериальных геномов, определенные по их нуклеотидной последовательности Видовое название Размер генома, тыс. п. п. Кодирующие последователь- ности Количество ORF (нредположитсл ь- нос число генов) Идентифициро- вано генов Характеристика число % Mycoplasma genitalium 580 89,7 479 324 69 Вызывает воспаления мочеполовых путей Mycoplasma pneumoniae 817 88,7 677 333 49 Возбудитель пневмонии Boirelia burgdoferii 1300 93,0 863 499 58 Возбудител ь клещевого спирохстоза (болезнь Лайма) Helicobacter pylory 1700 91,0 1590 907 57 Вызывает язвенную болезнь, гастрит Methanococcus jannaschii 1700 1692 776 46 Анаэроб, метаноген, Тт роста = 85 °C Haemophilus influenzae 1800 1740 1015 58 Вызывает отиты, ОРЗ, менингиты Synechocystis sp. 3600 87,0 3168 1402 48 Фотосинтезирующая цианобактерия Bacillus subtilis 4200 87,0 4000 2320 58 Автотроф Mycobacterium tuberculosis 4400 91,0 3924 -1600 40 Возбудител ь туберкулеза Escherichia coli К-12 4600 88,6 4288 2656 62 Прототрофная энтеробактерия
Рис. 68. Функциональная характеристика генов Е. coli, выявленных по полной нуклеотидной последовательности се генома Летаболизм ДНК/РНК Структурные белки ких-либо терминирующих кодонов; потенциально может транс- лироваться в белок. В установленной нуклеотидной последователь- ности генома прокариоте помощью компьютерных программ вы- явлены открытые рамки считывания. Средний размер их в про- кариотических геномах соответствует примерно 300 аминокислот- ным остаткам. Сопоставление состава ORF по функциям (также с помощью компьютерных программ) позволяет идентифицировать компоненты генома, общие для всех организмов, общие для дан- ной группы видов и уникальные, специфичные только для дан- ного организма. Функциональная классификация генов и генных продуктов является основой для сравнения геномов и выявления сходства и различия их метаболизма. В качестве модельного объек- та использован геном Е. coli. Все белки и кодирующие их гены классифицированы натри функциональные группы: энергообмен, информация, коммуникация (внутри- и внеклеточная). Распреде- ление функций генов Е. coli, выявленных по полной нуклеотид- ной последовательности генома, представлено на рис. 68. Среди 4288 ORF Е. coli не выявлены функции у 40 % ORF. Примерно такая же часть генов с неизвестной функцией отмечена и в других прокариотических геномах. Минимальный размер генома прокариот. На основании анализа первичной структуры прокариотических геномов был составлен перечень генов, абсолютно необходимых для существования сво- бодно живущих клеток. Этот перечень генов получил название минимальный набор генов. Он кодирует 256 белков и включает сле- дующие жизненно важные генетические системы микроорганиз- мов: почти полный набор генов системы репликации; гены руди- ментарной системы репарации и рекомбинации; гены аппарата транскрипции, в которой почти полностью отсутствуют гены ре- гуляции транскрипции; большой набор генов, кодирующих бел- ки, гомологичные шаперонам; гены, контролирующие анаэроб- ный метаболизм, включая гены гликолиза и фосфорилирования 138
Таблица 10 Функции белков, соответствующих минимальному набору из 256 генов ' Функция Число белков Преобразование энергии 28 Транспорт и метаболизм аминокислот И Транспорт и метаболизм нуклеотидов 20 Транспорт и метаболизм углеводов 5 Метаболизм кофакторов 8 Метаболизм липидов 6 Трансляция и биогенез рибосом 94 Репликация, транскрипция, рекомбинация, репарация 35 Структурная функция (белки наружной мембраны) 7 Секреция и адгезия 5 Шапероны 13 Транспорт неорганических ионов 4 Предсказана гипотетическая функция 15 Функция неизвестна 4 субстратов; гены биосинтеза липидов; гены системы транспорта белков; гены, кодирующие ферменты, использующие сложные кофакторы; набор генов, обеспечивающий транспорт метаболи- тов; полный набор генов утилизации нуклеотидов de novo и гены их биосинтеза (табл. 10). Если же из генома прокариотического организма вычесть кон- сервативный минимальный набор генов для микроорганизмов, живущих в сходной среде, то можно получить те гены, которые определяют специфические фенотипические характеристики, со- ставляющие уникальность организма. Экологическая специфичность на уровне генома. Адаптация к определенным условиям обитания проявляется как в изменении общих характеристик генома (ГЦ-состав, суперспирализация ДНК), так и в наличии генов, продукты которых обеспечивают приспособление микроорганизма к тем или иным условиям. По- казателен в этом отношении геном хеликобактерии, обитающей в желудке человека и вызывающей язвенную болезнь. Хеликобакте- рии способны к обитанию в кислой среде, так как устанавливают положительный внутри мембранный потенциал при низких pH и модифицируют микросреду с помощью уреазы. Белки Н. pylori 139
содержат вдвое больше основных аминокислотных остатков арги- нина и лизина, чем белки Е. coli. С паразитизмом связано наличие у Н. pylori не менее пяти различных систем адгезии для прикреп- ления к эпителиальным клеткам желудка. Неожиданным является наличие в геноме Н. pylori 14 генов (более I % генома), относя- щихся к системе рестрикции — модификации типа II. Вероятно, эта система, кроме расщепления чужеродной ДНК, имеет иную, неизвестную пока биологическую функцию. Отсутствие определенных генов также указывает на особенно- сти метаболизма, связанные с условиями жизни микроба. Если организм обеспечен ресурсами за счет их адсорбции, то механиз- мы синтеза (а значит, и гены) могут исчезнуть. СТРУКТУРА ПРОКАРИОТИЧЕСКИХ ГЕНОВ Гец — единица наследственной информации, занимающая опре- деленное положение в геноме или хромосоме и контролирующая выполнение определенной функции в организме. По результатам исследования прокариот, главным образом Е. coli, геи состоит из двух основных элементов: регуляторной части и собственно коди- рующей части. Регуляторная часть гена обеспечивает первые эта- пы реализации генетической информации, заключенной в струк- турной части гена; структурная часть гена содержит информа- цию о структуре кодируемого данным геном полипептида. Коли- чество некодирующих последовательностей в структурной части гена у прокариот минимально. 5'-консц прокариотического гена имеет характерную организацию регуляторных элементов, осо- бенно на расстоянии 50 — 70 н.п. отточки инициации транскрип- ции. Этот участок гена называют промотором. Он важен для транс- крипции гена, но сам в РНК не транскрибируется. Противопо- ложный З'-копец — термипаторная область, необходимая лля тер- минации транскрипции. В РНК он также нс транскрибируется. Транскрипция начинается со стартовой точки (+1). Промотор имеет две консервативные последовательности: одна состоит из 6 или 7 пар оснований и расположена на расстоянии - 10 оснований от стартовой точки; ее обозначают как -10-после- довательность, или бокс Прибнова, — в честь ее первооткрывате- ля. Вторая последовательность, длина которой равна обычно 9 нук- леотидам, расположена на расстоянии ~35 оснований от сайта инициации (рис. 69). Эта 35-последовательность участвует в связы- вании РНК-полимеразы; в боксе Прибнова РНК-полимераза на- чинает локальное раскручивание спирали и создает условия для инициации синтеза РНК. Последовательности ДНК, являющиеся сигналами остановки транскрипции, находятся на З'-конце гена и называются транс- 140
A 5'-TATAAT-3' 3'-ATATTA-5' Бокс Прибнова Стартовая точка 35 Ю транскрипции TTGACA-*------16—19 п.о.-----►ТАТААТ-*------5—9п.о.------►рд~ —С —С Область, богатая * G-C Участок из оснований U :U I I I I I I ииииии-он -U : А- —А : U- -U : А- —G I С- —U А— —G ° U- —G ° U— С Шпилька А-ОН Рис. 69. Структура промотора и терминатора прокариотических генов: А — консенсусные последовательности элементов промотора Е. coir, Б — струк- туры тсрмипаториых шпилек в РНК прокариот крипционными терминаторами. Они содержат последовательно- сти, которые в транскрибируемой РНК формируют структуру шпильки. Последовательность оснований в этом месте способствует образованию стабильных пар G —С за счет водородных связей. Вслед за шпилечной структурой в транскрипте РНК находится несколько остатков U (соответственно в гене последовательность А5_6), дающих слабое связывание РНК с ДНК. Это и облегчает терм ина ци ю тра нскр и п ни и. Участок ДНК между промотором и терминатором называется единицей транскрипции. Последовательности, кодирующие белки, бывают обычно фланкированы петранслируемыми сегментами (их обозначают 5'-НТП и З'-НТП). Гены РНК перемежаются спейсер- ными (от англ, spacer — распорка) последовательностями, кото- рые вырезаются в ходе процессингарРНК и тРНК (рис. 70). Число генов, выявленное в результате расшифровки нуклеотидной по- следовательности геномов некоторых прокариот, см. в табл. 10. Опероппая организация гепомов прокариот. У Е. coli гены, коди- рующие белки одного и того же метаболического пути или опре- деляющие близкородственные функции, часто бывают сцеплены. 141
Единица транскрипции Кодирующая 1 юследовательность Точка терминации транскрипции Регуля- торная область Регуля- торная область Активатор Промотор Нетранслируемая Нетранслируемая Оператор 5'-последовательность З'-последовательность Единица транскрипции Рис. 70. Строение прокариотических генов: А — ген, кодирующий один белок; Б — гены, кодирующие рРНК и тРНК А Они транскрибируются с промотора, находящегося на 5'-конце такой группы генов (кластера), в виде единственной молекулы РНК, называемой полицистронным (или полигенным) транскрип- том. Группа координированно экспрессирующихся генов называ- ется опероном. Три гена, кодирующие ферменты, ответственные за метаболизм галактозы у Е. coli, организованы в опсрон с про- мотором (Р) и примыкающим к нему регуляторным сегментом- оператором (О) на 5'-конце транскрибируемой последовательно- сти (рис. 71). При сравнении геномов Е. coll и В. subtilus, имеющих около 1000 общих генов, отмечено, что 100 из них находятся в составе одних и тех же оперонов, хотя в некоторых случаях порядок генов в оперонах изменен (арабинозный оперон ага ABD у В. subtilisn ага BAD у Е. coli). Гены, кодирующие несколько родственных функций, не все- гда образуют единый оперон. Так, гены, кодирующие рибосом- ные белки, организованы во множественные опероны, в чей со- став иногда входят гены, кодирующие другие белки, участвую- щие в транскрипции и/или трансляции. Как правило, отдельные опероны, кодирующие родственные функции, имеют одинако- вые или сходные регуляторные последовательности и поэтому реагируют на определенный регуляторный сигнал сходным обра- зом. Сохранение генов в составе одного оперона дает определен- ные преимущества: во-первых, обеспечивает координированную экспрессию генов; во-вторых, такое расположение генов важно для их распространения путем горизонтального переноса. Гори- зонтальный перенос генов вносит свой вклад в эволюцию прока- риотических геномов. Показано, что он происходит как между 142
Полицисзронная единица транскрипции Кодирующая Кодирующая Кодирующая I-------------Галактозный оперон--------------1 UDP-глюкоза АТР Рис. 71. Опсроппая организация генов прокариот: А — общая схема опсропа; Б— галактозный оперон Е. coli. Представлены опера- тор (О), промотор (Р) н три гена опсропа — gal Е, gal Т. gal К. Внизу показаны реакции, катализируемые тремя генными продуктами — галактокиназой, ури- дплтрансфсразой и UDP-галактозоэпимеразоп. Все три фермента транслируются единственной полнцистроипой gal мРНК, геи gal R, кодирующий репрессор га- лактозного оперона, не сцеплен с опероном родственными, так и между неродственными бактериями. Гены, появившиеся в данном геноме в результате горизонтального пере- носа, называют ксенологами. Отмечен горизонтальный перенос ге- нов между эукариотами и прокариотами: наибольшее число генов эукариотического типа (около 30) обнаружено в геноме хламидии. БАКТЕРИАЛЬНЫЕ ПЛАЗМИДЫ Кроме хромосомы у большинства бактерий существуют другие способные к автономной репликации структуры — плазмиды. Это двуцепочечные кольцевые ДНК размером от 0,1 до 5% размера хромосомы, несущие гены, необязательные для клетки-хозяина, или гены, необходимые лишь в определенной среде. Именно та- кие внехромосомныс элементы и содержат гены, которые прида- ют клеткам наследуемую устойчивость к одному или нескольким антибиотикам. Они получили название факторов резистентности, или R-факторов. Другие плазмиды определяют болезнстворность патогенных бактерий, например патогенных штаммов Е. coli, воз- 143
будителей чумы и столбняка. Третьи — определяют способность почвенных бактерий использовать необычные источники углеро- да, например углеводороды нефти. Существуют разные виды классификации плазмид, но чаще всего основу классификации составляет наличие в плазмидах опре- деленных модульных сегментов ДНК. Для своей репликации плаз- миды используют репликативный аппарат клетки-хозяина, одна- ко репликация плазмид происходит независимо от хромосомы. Каж- дая плазмида является самостоятельным репликопо.м, сама конт- ролирует собственную репликацию. Для этой цели опа должна иметь по крайней мерс один или несколько репликативных модулей (об- ласть инициации репликации), которые и позволяют ей автоном- но реплицироваться. В одном из классов плазмид (F-плазмид) реп- ликация и сегрегация регулируются согласованно с репликацией бактериального генома, и в каждой клетке содержится одна или две копии плазмиды. О таком типе репликации говорят как о репли- кации со строгим контролем. Второй тип репликационного модуля свободен от такого контроля, что приводит к существованию в клетке многих копий плазмид (10 — 30 копий). Подобный тип реп- ликации получил название репликации с ослабленным контролем. Наличие других модулей, не связанных с репликацией, не яв- ляется обязательным для каждой определенной плазмиды. Поло- вые факторы, т.е. конъюгативиые (или самотрансмиссивиые) плаз- миды, подобно F-фактору имеют модули, содержащие гены и регуляторные области (гены tra), необходимые для переноса плаз- миды из одной клетки в другую. Трансмиссивные плазмиды коди- руют специальные ворсинки, половые пили, которые появляют- ся на поверхности клеток, содержащих плазмиды, и способны специфически связываться с поверхностью бесплазмидных кле- ток. Последующее сокращение пиля притягивает клетки друг к другу, и между ними образуется мостик, через который плазмпд- ная ДНК может передаваться в новую клетку. Способность пере- даваться в новые клетки — полезное для плазмид качество, но лишь большие плазмиды могут кодировать сложную систему по- верхностных изменений клетки, обеспечивающую конъюгацию. Некоиыогативные плазмиды (утратившие модуль конъюгации) не способны к самотрапсмиссивности, но способны к передаче в присутствии трансмиссивных плазмид, используя их аппарат конъ- югации. Такие плазмиды называют мобилизуемыми. Модули другого типа содержат гены, белковые продукты кото- рых (например, р-лактамаза и др.) инактивируют антибиотики. Плазмиды, несущие такие модули, часто называют R-плазмида- ми (от англ, resistance — устойчивость). Одна плазмида обеспечива- ет устойчивость к нескольким антибиотикам, при этом все или несколько генов резистентности разного типа могут быть сгруп- пированы в одном модуле. 144
Имеется еще один тип модулей, встречающийся в плазмидах: Col-модули. Они кодируют один из нескольких белков-колицинов (антибактериальных агентов, продуцируемых бактериями). Коли- цины различаются тю структуре н способу действия. Плазмиды, кодирующие определенный колицин, часто содержат гены, обес- печивающие иммунность к этому колицину, страхуя клетку-про- дуцент от повреждений, вызываемых ее собственным средством защиты. Некоторые плазмиды содержат также модули, кодирую- щие системы рестрикции-модификации. Примером такого модуля является система Есо RI. Типичная плазмида. Модульное строение типичных R-плазмид схематически представлено на рис. 72. Около 50% последователь- ностей из приблизительно 100 тыс. н.п. этих плазмид гомологич- ны одному из участков F-плазмилы. Эта область включает гены, необходимые для конъюгации (Jra) и репликации со строгим контролем. В F-нодобной области находится дополнительный модуль, содержащий гены, контролирующие устойчивость к тет- рациклину. Вторая половина R-плазмиды не родственна F и со- держит модули, ответственные за резистентность к антибиоти- кам (стрептомицину, сульфаниламидам, хлорамфениколу и ка- намицину). Плазмиды, выделенные независимо и даже в различных час- тях света, часто содержат близкородственные модули (одни и те же гены резистентности к антибиотикам). На основании этих данных возникло представление о том, что между геномами про- исходит обмен некоторыми генетическими модулями в виде ин- тактных сегментов ДНК. Быстрое распространение генов резис- тентности к антибиотикам объясняется именно обменом моду- лями между плазмидами. Эти и другие данные, полученные при изучении генетики бактерий, привели к идентификации подвиж- ных элементов, названных инерционными последовательностями (IS) Рис. 72. Структура типичной копъ- югатпвпой R-плазмилы. Светлый овал — область начала реплика- ции (ori). Гены резистентности к антиби- отикам: тетрациклину — tetr, хлорамфе- николу — сатг, канампнину — капг, стрептомицину — stK. ампициллину — amjf. Точками выделены сегменты, необходи- мые для конъюгации (/т), штриховкой — мобильные элементы (см. с. 147) IS1 репликации 145
и транспозонами, которые способны перемещаться не только между плазмидами, но и между плазмидными и клеточными геномами, а также в пределах самого бактериального генома. IS-ЭЛЕМЕНТЫ И ТРАНСПОЗОНЫ БАКТЕРИЙ IS-элементы (от англ, insertion sequences — последовательности- вставки) — это сегменты ДНК, способные как целое переме- щаться из одного участка локализации в другой (рис. 73). lS-эле- мепты содержат лишь те гены, которые необходимы для их соб- ственного перемещения — транспозиции. Кроме того, lS-элемеи- ты имеют особую последовательность на концах, как правило, инвертированные повторы. При встраивании в новую последова- тельность ДНК IS-элсменты вызывают небольшую дупликацию: дуплицированный участок с двух сторон фланкирует встроившийся lS-элсмент. Характеристика типичных IS-элементов Е. coli пред- ставлена в табл. 11. Транспозонами (Tn-элемеитами) называют сегменты ДНК, обладающие теми же свойствами, что и IS-элементы, ио содер- жащие также гены, нс имеющие непосредственного отношения к транспозиции (гены устойчивости к антибиотикам, гены токси- нов или гены дополнительных ферментов клеточного метаболиз- ма). В общем, для транспозонов характерны те же гены, которые имеются в плазмидах. Более того, нередко присутствие в составе плазмиды того или иного гена обусловлено наличием в последо- вательности плазмидной ДНК соответствующего транспозона. Он может быть устроен так же, как IS-элемент, но с дополнитель- ным геном. Однако важно отметить, что часто два IS-элемента, оказавшиеся поблизости друг от друга, способны перемещаться вместе, одновременно перенося заключенный между ними сег- мент ДНК. Таким образом, транспозон могут образовать два рас- Ген (или гены), кодирующий гранен озазу—белок, необходимый для перемещения Y///////////////////A Короткие концевые инвертированные повторы Дупликация ДНК-мишеии, - возникающая при встраи- вании IS-элемепта Рис. 73. IS-элсмспт Е. coli 146
Таблица II Типичные IS-элементы Е. coli JS Суммам тя длина. н.п. Длина кон- цевых ин- вертирован- ных повто- ров, н.п. Длина дуп- лицирован- ной ми- шени, н.п. Обычное местонахождение IS1 768 23 9 Хромосома Е coli, 19 ко- пий; плазмида R6, две копии; Shigella dysenteria, > 40 копий IS2 1327 41 5 Хромосома Е coll, 0—12 копий; R6, одна копия; F-плазмида, одна копия IS4 1426 18 11 Хромосома Е coli, 1—2 копии 1S10 1329 23 9 R-плазмиды положенных рядом IS-элемента. Транспозоны различной структу- ры показаны на конкретных примерах на рис. 74. Транспозоны и IS-элементы ответственны за целый ряд генети- ческих явлений у бактерий. Встраивание мобильного элемента в какой-либо ген может привести к его инактивации. Кроме того, некоторые IS-элементы и транспозоны вызывают генетическую нестабильность поблизости от места своей локализации: в окрест- ностях элемента заметно повышается частота делений и инверсий, причем одна из границ перестройки всегда совпадает с одним из концов IS-элемента, автономного или в составе транспозона. Мо- бильные элементы способны также вызывать транслокации. Механизмы перемещения мобильных элементов бактерий. Су- ществует два типа транспозиций из одного генома в другой. В ходе транспозиции первого типа, называемой коинтеграционной, до- Устойчивость к хлорамфениколу Тп 5 Устойчивость к канамицину Рис. 74. Некоторые бактериальные транспозоны 147
Рис. 75. Типы встраивания мобиль- ного элемента в новый геном норный геном, который несет IS-элсмент или транспозон, сли- вается с реципиентиой молекулой ДНК. Репликация за счет кле- точного репликативного аппарата приводит к удвоению мобиль- ного элемента. Образуется промежуточный коинтеграт с дупли- кацией мобильного элемента. Чтобы произошло разделение коин- теграта на исходные репликоны (один из которых приобрел бы новую копию мобильного элемента), необходимо действие про- дукта гена tnpR, называемого резолвазой (от англ, resolution — разре- шение), которая разрезает коинтеграт на исходные репликаторы (рис. 75). Транспозиция второго типа называется простым встраиванием. Мобильный элемент перемещается в новый геномный локус, при этом никаких других перестроек, кроме дупликации сайта-мише- ни, не происходит. Этот вид транспозиции иногда называют кон- сервативным (или нсрепликативным). Для завершения процесса потребуется лишь ограниченный репаративный синтез ДНК. Генетическая изменчивость бактерий. Мобильные элементы вы- зывают генетическую нестабильность поблизости от участка сво- ей локализации, особенно в процессе репликативного механизма транспозиций. В зависимости от того, как внесены разрывы в ДНК- мишень, получится либо деления, либо инверсия генетического 148
Рис. 76. Механизм образования дуп- ликаций за счет гомологической ре- комбинации по мобильным эле- ментам (неравный кроссинговср) материала между местом распо- ложения транспозона и мише- нью его перемещения. В связи с этим интересно отмстить, что хромосомы родственных видов бактерий отличаются друг от друга многочисленными пере- стройками именно этого типа. По-видимому, мобильные эле- менты сыграли существенную роль в дивергенции и видообра- зовании бактерий. Встраивание 1 S-элементов поблизости от Мобильный элемент Репликация молчащего гена может приводить к его активации за счет транс- крипции с промотора IS-элемепта, т.е. изменяется регуляция бак- териального гена. Очень важно, что мобильные элементы служат подвижными участками гомологии, гомологическая рекомбинация между которыми может приводить к дупликациям генов (рис. 76). Считается, что дупликация — один из основных путей эволюци- онного возникновения новых функций. Действительно, «лишняя» копия гена выходит из-под давления естественного отбора и по- лучает возможность накапливать изменения. Чаще всего это при- ведет к утрате какой бы то ни было функции, но иногда может получиться ген с новыми функциями. Нельзя забывать и тот факт, что клетка может получить селек- тивное преимущество за счет приобретения в составе транспозона гена, который сам по себе способен оказаться выгодным для бак- терии в определенных условиях. Действительно, на транспозонах «путешествуют» гены устойчивости к различным бактериальным ядам, в том числе к тяжелым металлам и антибиотикам, гены дополнительных метаболических путей, позволяющие использо- вать необычный источник углерода, наконец, гены некоторых ток- синов, делающие бактерии патогенными и позволяющие им тем самым существенно изменить образ жизни. Сказанное в равной степени относится и к плазмидам, поскольку большинство по- лезных для клетки-хозяина плазмидных генов находится в составе транспозонов.
Глава 6. СТРУКТУРА ГЕНОМА ЭУКАРИОТ Для клеток эукариот характерно наличие оформленного ядра. Информационном макромолекулой их генома является ДНК, ко- торая неравномерно распределена по нескольким хромосомам в виде комплексов с многочисленными белками. Однако генетиче- скую информацию в клетках содержат не только хромосомы ядра. Жизненно важная генетическая информация заключена и во вне- хромосомных молекулах ДНК. У эукариот — это ДНК хлороплас- тов, митохондрий и других пластид. Под геномом эукариотиче- ского организма в настоящее время понимают суммарную ДНК гаплоидного набора хромосом и каждого из внехромосомных ге- нетических элементов, содержащуюся в отдельной клетке заро- дышевой линии многоклеточного организма. Суммарное количество ДНК в гаплоидном геноме принято обозначать латинским символом С. Оно измеряется в пикограм- мах (пг), может быть выражено в парах нуклеотидов или дальто- нах: I пг = 0,965 109 н. и. = 6,1 10й Да). Размер генома эукариот в среднем на 2 — 3 порядка выше, чем у прокариот (табл. 12). Таблица 12 Средний размер гаплоидного генома у некоторых организмов Организм Средний размер генома, н.п. Мелкие вирусы I.0-104 Микоплазмы 1,6-10" Бактерии 2,0- 10" Грибы 4,7- 107 Насекомые 2,3 - 10s Моллюски 1,6 10’ Костистые рыбы 1,4-10’ Бесхвостые амфибии 2,7-10’ Хвостатые амфибии 3,6 -1010 Рептилии 1,5-10’ Птицы 1,2-10’ Млекопитающие 2,6-10’ 150
Окончание табл. 12 Организм Средний размер генома, н.п. Человек 3.2-10’ Растения: голосеменные покрытосеменные лилия Lilium longtflorum 1,6 Ю‘° 2,7-1010 1,8- 10" Геном эукариот существенно отличается от генома прокариот по ряду признаков, среди которых необходимо отметить его избы- точность. Эукариотическая клетка содержит во много раз больше генов, чем прокариотическая. Повышенное содержание ДНК в геноме эукариот нельзя объяснить лишь увеличением потребно- сти этих организмов в дополнительной генетической информа- ции в связи с усложнением организации, поскольку большая часть их геномной ДНК, как правило, представлена некодирукнцими пос- ледовательностями нуклеотидов. Феномен значительной избыточ- ности генома эукариот в отношении некодирующих последова- тельностей нуклеотидов известен пол названием «парадокса С». Получить суммарную характеристику степени разнообразия последовательностей ДНК, образующих геном, можно, исследуя кинетику реассоциации денатурирован ной ДНК. КИНЕТИКА РЕАССОЦИАЦИИ ДЕНАТУРИРОВАННОЙ ДНК И СЛОЖНОСТЬ ГЕНОМА ЭУКАРИОТ Водородные связи и межплоскостные взаимодействия, стаби- лизирующие двойную спираль, достаточно слабы и при повыше- нии температуры (до 100 ’С) происходит разделение цепей. Такой процесс называют плавлением двойной спирали, или ее денатура- цией. Поскольку для разрушения двух водородных связей АТ-пар требуется меньше энергии, чем для разрыва трех водородных свя- зей GC-nap, значения температуры, при которой происходит де- натурация, зависят от нуклеотидного состава ДНК. Денатурация — процесс обратимый. Последующее восстанов- ление двуцепочечной структуры ДНК может происходить даже при полном расхождении цепей. Процесс воссоединения, назы- ваемый ренатурацией, реассоциацией, или отжигом, происходит при понижении температуры за счет взаимодействия комплемен- тарных оснований. В молекулярной биологии широко используется способность денатурированных ДНК ренатурировать с восстановлением ис- 151
ходной двуспиральной структуры. Она лежит в основе метода мо- лекулярной гибридизации нуклеиновых кислот (см. гл. 14). Неко- торые формальные характеристики эукариотического генома мо- гут быть получены с помощью этого метода. Исследование кине- тики реассоциации однонитевых денатурированных фрагментов ДНК путем определения в каждый данный момент реакции ко- личества ренатурировавшей двуспиралыюй ДНК позволяет по- лучить суммарную валовую характеристику степени разнообра- зия последовательностей ДНК, образующих геном, или слож- ность ДНК. Скорость реассоциации ДНК пропорциональна С()/ (v = где Со — исходная молярная концентрация однопите- вой ДНК; t — время реассоциации, с. Значение когда ре- ассоциирует 50% ДНК, характеризует степень сложности гено- ма. Сложность ДНК определяется общей длиной (в нуклеотид- ных парах) разных последовательностей ДНК, содержащихся в исследуемом образце ДНК. Исследование кинетики процесса реассоциации, разработка математического описания реакции, создание вычислительных программ для обсчета кинетических данных (Бриттен и сотр., 1966—1968) выявили чрезвычайную информативность кинети- ческих параметров реакции реассоциации ДНК для понимания сложности генома, особенно генома эукариот. Для получения ки- нетических параметров реакции реассоциации ДНК последнюю фрагментируют (~ 1000 н.п.), фрагменты денатурируют при 100°C в течение 10—12 мин, затем образец ДНК охлаждают до 65°С (па 20 °C ниже температуры плавления). В этих условиях фрагмен- ты восстанавливают двуспиральную структуру. Разделение од- ноцепочечных и двуцепочечных фрагментов ДНК на колонке с гидроксиапатитом 13Са3(РО4)2-Са(ОН)2] с помощью фосфатного буфера (0,4 М — для элюции двуцепочечных фрагментов и 0,12М для элюции одпоцепочечных фрагментов), определение их кон- центрации позволяют построить кривую реассоциации ДНК. Для ее построения на оси абсцисс откладывают величину С()Г в лога- рифмическом масштабе, на оси ординат — долю реассоцииро- ванной ДНК. Мерой скорости реассоциации является величина С()/1/2, т.е. произведение начальной концентрации одноцепочечной ДНК на время ее полупревращения из одноцепочечной в биспиралыюс состояние. Для ДНК прокариот ход реассоциации ДНК описыва- ется симметричной S-образной кривой с точкой перегиба, соот- ветствующей половине реакции. У эукариот ход реассоциации ДНК растягивается па много порядков значений С()/ (рис. 77). Эти ре- зультаты привели к заключению, что существенная часть генома эукариотических организмов состоит из повторяющихся в разной степени последовательностей ДНК. Различают высокоповторяю- щпеся, умеренно повторяющиеся и уникальные последователь- 152
Рис. 77. Кривые кинетики реассоциации двуцепочечных ДНК разного происхождения: А — ДНК вируса SV40. фага Т4 и Е. coli; Б — ДНК мыши; С/С„ — доля реассоци- ированной ДНК. где С и Со — суммарные концентрации денатурированной ДНК в момент времени / после начала реассоциации и в момент времени 10. Последова- тельности ДНК, реассоциирующие при значениях Со/ от 10’3 до 101, называют высокоповторяюши.мися последовательностями, от 10'1 до 10 — умеренно по- вторяющимися; оставшаяся фракция ДНК — уникальные последопателыюсти пости ДНК эукариот, соответствующие трем выявляемым при ренатурации фракциям. Для ДНК каждого вида величина С(ф/2 пропорциональна величине генома. Сопоставляя значения С0^/2 ДНК разных видов и ДНК вида с известной величиной генома, можно определить размер генома этих видов. ПОСЛЕДОВАТЕЛЬНОСТИ НУКЛЕОТИДОВ ЭУКАРИОТИЧЕСКОГО ГЕНОМА Повторяющиеся иоследователыюсти. В современной классифи- кации повторов принято различать высокоповторяющиеся после- довательности, число которых превышает 105 на гаплоидный геном, и умеренно повторяющиеся, представленные 10—Ю4 копиями. 153
Высокоповторяющиеся последовательности включают функци- онально и структурно обособленную часть генома, представлен- ную сателлитными ДНК {cam ДНК). Сателлитные ДНК состоят из коротких тандемных повторов длиной 1—20 н.п., организован- ных в длинные блоки. Свое название эти ДНК получили на осно- вании того, что при анализе суммарной эукариотической ДНК центрифугированием в градиенте плотности хлорида цезия (CsCl) они сопровождали основной пик оптической плотности в виде плеча (спутника, сателлита) (рис. 78). Именно гомогенный нукле- отидный состав фракции сателлитных ДНК, определяемый нали- чием в ней многочисленных коротких повторов, изменил ее пла- вучую плотность, что легко обнаруживалось при центрифугиро- вании. Для сателлитов характерен ряд свойств, среди которых наибо- лее важны: а) быстрая и точная реассоциация в процессе ренату- рации ДНК; б) множество копий; в) простая первичная структу- ра; г) гомогенный состав (протяженные кластеры одних и тех же повторяющихся блоков последовательностей); д) пурин-пири- мидиновая асимметрия в распределении нуклеотидов по цепям ДНК; е) концентрирование в прицентромерном гетерохромати- не; ж) ограниченная репликация (педорепликация) при политс- низации хромосом; з) нахождение в составе хромосом в виде тан- демно (друг за другом) расположенных кластеров. Содержание са- теллитной ДНК в геноме эукариот может достигать 5 — 50% от суммарного количества ДНК. В составе одного генома можно об- наружить несколько разных сателлитных ДНК. Определение нуклеотидных последовательностей сателлитных ДНК показало наличие в их составе тандемных повторов из не- скольких нуклеотидов. Главная повторяющаяся единица сателлит- ных ДНК (базовая последовательность), например у D. melanogaster, может быть достаточно простой, состоящей из пяти или семи нук- леотидов: (ААТАТ)п, (AATAG)n, (ААТАС)п, (ААТАААС)п и (AATAGAC)n. Встречаются и более сложные повторяющиеся еди- ницы из 359 н.п. Базовая последовательность сателлитной ДНК повторяется многократно на протяжении 10 тыс. н.п. и более. Та- ким образом, сателлитные ДНК образуют протяженные геном- ные блоки. Меченые сателлитные ДНК можно гибридизовать с хромосом- ными препаратами in situ, а после гибридизации выявлять их ло- кализацию. В хромосомах самых разных эукариот (дрозофила, мле- копитающие) сателлитные ДНК преимущественно обнаружива- ются в центромерных и теломерных районах хромосом (см. рис. 78). Это так называемые гетерохроматические районы, в которых ма- териал хромосом сохраняется в процессе клеточного цикла в зна- чительно более компактном состоянии в отличие от основной (эухроматической) части хромосом. 154
Рис. 78. Сателлитные ДНК: .1 — центрифугирование препарата ДНК Drosophila virilis в градиенте CsCI, основная масса ДНК имеет плавучую плотность 1,693; Б — локализация сателлитных ДНК, выяв- ляемая методом гибридизации in situ в хро- мосомах млекопитающих (схема); Ц — центромера Отождествление сателлитной ДНК с гетерохроматином означает, что высокоповторяющаяся ДНК не экспрессируется с образованием по- липептидов или РНК.. Локализация сателлитной ДНК в области цент- ромеры говорит о том, что она вы- полняет некоторую структурную функцию в хромосоме при митозе и мсйозе. Возможно, функция сателлитной ДНК может быть связана с процессами расхождения хромосом. Структура и функции мини- и микросателлитной, а также те- ломерной ДНК представлены на с. 170. К умеренно повторяющимся последовательностям относятся последовательности, представленные в геноме десятками или не- сколькими сотнями копий. Среди них можно выделить структурно и функционально различающиеся геномные фракции. Существу- ют семейства генов, построенные из сгруппированных тандемно повторяющихся копий. Они участвуют в осуществлении жизнен- но важных общеклеточных функций. Это гены гистонов, тРНК и рРНК. Они носят название «гены домашнего хозяйства», в геноме находятся в многочисленных почти или совершенно идентичных копиях. Большую разнородную группу составляют подвижные (мобиль- ные) генетические элементы разной природы (см. с. 177). На их долю приходится значительная часть генома (10 — 20%). В отличие от генов первой группы, отдельные семейства которых сгруппирова- ны в одном или нескольких районах эукариотического генома, подвижные элементы рассеяны по геному. В геноме обнаружива- ются также рассеянные или находящиеся в кластерах гены, коди- рующие гомологичные белки со сходными функциями. Это гены разных видов актина, тубулина, глобина, иммуноглобулина, гены теплового шока и др. Они выполняют как общеклеточпые, так и специализированные функции. Уникальные последовательности. Уникальные (пеповторяющи- еся) последовательности — наиболее сложный компонент генома 155
эукариот. Содержание их варьирует у разных организмов в преде- лах 15 — 98% от всей ДНК. Процентное содержание уникальных последовательностей у низших эукариот заметно больше, чем у высших. Особенно мало уникальной ДНК у растений. Во фракцию уникальных последовательностей попадают мно- гие структурные гены, кодирующие белки. Большая часть уни- кальных последовательностей является некодирующей и обычно нс заключает в себе генетической информации в общепринятом значении этого термина, т.е. не кодирует функционально значи- мые полипептидпые цепи или РНК. Хорошо известным примером таких уникальных последовательностей являются интроны, общий размер которых, как правило, на порядок и более превышает сум- марный размер экзонов содержащих их генов. Сюда следует отнести и последовательности, расположенные между генами. Несмотря на широкую распространенность повторяющихся по- следовательностей в геноме эукариот, биологическое значение этих и других некодирующих элементов генома остается непонятным. Вызывает сомнение правильность активно обсуждаемой в течение двух десятилетий гипотезы об «эгоистичности» избыточной геном- ной ДНК, о ее ненужности. Недавно для объяснения основной функциональной роли «из- быточной» ДНК в геноме эукариот предложена гипотеза «альтру- истической» ДНК (Л. И. Патрушев, 1997). Именно избыточные по- следовательности ДНК оказывают стабилизирующее влияние на генетическую информацию, заключенную в геноме многоклеточ- ных организмов. Они разбавляют кодирующие последовательнос- ти нскодирующими таким образом, что последние выступают в роли ловушек мутагенов любого вида. Это разбавление могло про- изойти в результате эволюционных преобразований генома-пред- шественника путем включения в него некодирующих избыточных последовательностей при участии разных молекулярных механиз- мов. Организмы, у которых жизненно важные гены максимально защищены от действия мутагенов, должны обладать эволюцион- ным преимуществом и в первую очередь сохраняться естествен- ным отбором. Избыточные последовательности ведут себя вполне «альтруистично», принимая удар мутагенов на себя и специфи- чески защищая жизненно важные участки ДНК от мутаций. СТРУКТУРА ЭУКАРИОТИЧЕСКИХ ГЕНОВ Организация генов у эукариот значительно сложнее, чем у про- кариот. Эукариотический ген можно рассматривать как совокуп- ность сегментов ДНК, которые вместе составляют экспрессируе- мую единицу, ответственную за образование специфического функ- ционального продукта — либо молекулы РНК, либо полипептида. 156
Начало РНК Конец Промотор (+0 Интрон I Интрон 2 Интрон 3 мРНК \ / Экзон 1 ^/\Экзон 2/ Экзон 3 ^/Ькзон 4 Левые 5'-ПТП Внутренние 3' 5' З'-НТП Правые регуляторные элементы регуляторные элементы регуляторные элементы Единица транскрипции--------/Л----- Рис. 79. Структура эукариотического гена, кодирующего белок: + 1 — точка инициации транскрипции; 5'-НТП и З'-НТП: 5'- и 3'- — Пе- тра! 1слпруемыс последовател ьностн К сегментам ДНК, составляющим ген, относятся следующие элементы: 1. Единица транскрипции — это участок ДНК, кодирующий первичный транскрипт. Он включает: а) последовательность, ко- торая обнаруживается в зрелых функциональных молекулах РНК; б) интроны (для мРНК); в) промежуточные последовательно- сти — спейсеры (для рРНК). Интроны и спсйсеры удаляются в ходе процессинга первичных транскриптов; г) 5'- и З'-нетрансли- руемыс последовательности (5'-НТП и З'-НТП). 2. Минимальные последовательности, необходимые для начала транскрипции (промотор) и конца транскрипции (терминатор). 3. Последовательности, регулирующие частоту инициации транскрипции; ответственные за индуцибелыюсть и репрессию транскрипции, а также клеточную, тканевую и временную спе- цифичность транскрипции. Они разнообразны по строению, по- ложению и функциям (рис. 79). К их числу относятся энхансеры (от англ, enhance — усиливать) и сайленсеры (от англ, silence — заглушать) — это последовательности ДНК, расположенные в тысячах пар нуклеотидов от промотора эукариотического гена и оказывающие дистанционное влияние на его транскрипцию. В это определение гена нс включены последовательности ДНК, кото- рые влияют на пространственную конфигурацию гена в хромати- не, ни последовательности, которые регулируют его топологию. Гены, кодирующие белки В отличие от прокариотических генов, почти всегда коллине- арных своим РНК, многие гены эукариот имеют мозаичное стро- ение. Под мозаичностью в данном случае подразумевается чередо- вание кодирующих (экзоны) и декодирующих (вставочные после- довательности, или интроны) последовательностей в пределах единицы транскрипции. Интроны чаще всего встречаются в ге- 157
нах, кодирующих белки. За исключением некоторых генов, коди- рующих пять гистонов, а- и p-интерфероны, все гены, кодирую- щие белки позвоночных, содержат интроны. У большей части ге- нов Drosophila интроны отсутствуют. Однако некоторые кластеры генов, регулирующие развитие органов тела насекомого, содер- жат множество интронов. Интроны присутствуют и во многих ге- нах растений. Размеры, число и местоположение интронов у разных генов различны. Тем не менее сходные гены у организмов разных видов часто имеют одинаковое число интронов в одних и тех же позици- ях, хотя длина и нуклеотидная последовательность интронов мо- гут заметно различаться. Обычно число интронов на ген возра- стает пропорционально длине последовательности, кодирующей белок, а размеры экзонов в среднем составляют около 300 н. п. (рис. 80). В целом общая длина последовательностей интронов пре- вышает суммарную длину экзонов обычно от 2 до 10 раз, а иногда еще больше (табл. 13). Интроны располагаются в единицах транскрипции не случай- ным образом. В белок-кодирующих генах они часто находятся между сегментами, которые кодируют отдельные структурные или фун- кциональные домены белка. Эволюционное возникновение мозаичной (интрон-экзонной) структуры генов эукариот, так же как и консервативный характер наследования размеров и взаимного расположения интронов в ге- нах, нс находят в данное время исчерпывающего объяснения из-за кажущегося отсутствия фактора давления естественного отбора на Геи инсулина крысы (ген I) 50 ПО i—i Ген а-глобина мыши 100 ПО I----1 Ген р-глобина мыши 100 ПО I----1 Ген овальбумина курицы 500 ПО I---1 Ген овомукоида курицы 500 ПО I—I Ген кональбумина курицы 500 ПО I-1 Рис. 80. Карты некоторых прерывистых генов. Жирными линиями обозначены экзоны, тонкими — интроны 158
Таблица 13 Прерывистые гены эукариот, кодирующие белки Ген Организм Экзоны Нитроны суммарная длина, п.п. ЧИСЛО суммарная длина, н.п* а-Глобип Мышь 463 2 256 Человек 596 2 265 Инсулин Человек 417 2 964 Курица 540 2 3619 Альбумин Крыса 2000 13 12500 а-Амилаза Крыса 1600 7 7400 Дигидрофо- Мышь 1600 26 40400 латредуктаза Овальбумин Курица 1872 7 5758 Фиброин Тутовый 18000 1 970 шелкопряд Фазсолин Фасоль 1263 5 515 последовательности нуклеотидов без четких биологических функ- ций. Наибольшее распространение получила концепция В. Гилбер- та (1977), согласно которой появление интронов, по-видимому, совпавшее по времени с эволюционным возникновением много- клеточных организмов, обеспечило возможность обмена экзона- ми между неродственными генами. Такой обмен должен сопро- вождаться образованием новых белков мозаичного строения, со- ставленных из готовых полипептидных функционально значимых модулей (доменов), ранее принадлежавшим другим белкам (ги- потеза о перетасовке экзонов в процессе эволюции). Следствием этого, по мнению сторонников данной концепции, были резкое ускорение образования белков и ферментов с новыми функциями, а также глубокие эволюционные преобразования самих организ- мов, реализующих такие молекулярные механизмы. Эта точка зре- ния получила еще название «гипотезы позднего возникновения интронов». В соответствии с другой гипотезой (Дж. Дарнелл и В. Ду- литтл, 1978) современные интроны представляют собой «эволю- ционные реликты». Когда-то интроны были частью гигантских генов. Предполагается, что мозаичная структура генов определяет эво- люционные возможности генома, тогда как прокариоты, утеряв- шие интроны, представляют собой эволюционный тупик. Определение нуклеотидных последовательностей в составе го- мологичных генов (например, генов глобинов) показало, что наи- большим изменениям в эволюции подвергались интроны, а не экзоны. В интронах обнаружены вставки, делении и другие пере- 159
стройки, и то время как последовательности экзонов оказывают- ся значительно более консервативными: в них имеются лишь от- дельные нуклеотидные замены. Эти наблюдения можно истолко- вать в пользу представлений о том, что перекомбннация экзонов осуществлялась по районам интронов, что и сопровождалось из- менением их структуры. Для эукариот характерны моноцистронные единицы транскрип- ции в отличие от прокариот, у которых обычно гены организова- ны в опероны, а их экспрессия опосредуется полицистропными мРНК. В эукариотических клетках образуются мРНК, кодирую- щие только один белок. Даже если ген кодирует нс один вид мРНК, как при альтернативном сплайсинге, каждая зрелая мРНК имеет только одну транслируемую кодирующую последовательность. Регуляторные элементы генов, кодирующих белки У высших эукариот в пределах 100—200 н. п. перед стартом транс- крипции выявлена сложная мозаика промоторных элементов, пред- ставленных короткими нуклеотидными последовательностями («мо- тивами»), На расстоянии 27 — 30 н.п. от сайта инициации транс- крипции расположен ТАТА-мотив, который строго определяет сайт инициации транскрипции, т.е. 5'-конец транскрипта (рис. 81). На расстоянии 80 — 50 н.п. имеются последовательность ССА- АТ, обычно встречающаяся в промоторной зоне разных ткапе- специфических генов (глобинов, тиреоглобулина, актина и др.), и последовательность GGGCGGG, усредненный вариант «GC»- мотива. Последний может встречаться несколько раз по длине про- моторных районов генов, работающих конститутивно и обеспе- чивающих общеклеточные функции: перед генами глюкозо-6-фос- фатдегидрогеназы и фосфоглицераткиназы вкраплены соответ- ственно девять и два таких мотива. Эффективность промотора определяется как эффективностью отдельного элемента («мотива») в составе промотора, числом его элементов, так и ближайшим нуклеотидным окружением вокруг него. Гены, кодирующие адаптивные белки, образование которых резко усиливается под влиянием разных факторов среды (повы- шение температуры, отравление металлами), содержат в составе +1 РНК "GC" Рис. 81. Общая схема строения промоторов генов, кодирующих белки, у эукариот 160
промоторов дополнительные характерные короткие нуклеотидные последовательности. Так, в гене белка теплового шока дрозофилы в промоторном районе имеются повторяющиеся мотивы CTCG и GTTC; в генах белка'металлотионеина выявлены повторяющиеся девяти нуклеотидные «мотивы»: TGCGCTCGG. Если такие моти- вы вставить в промоторы других генов, то их экспрессия начнет зависеть от присутствия металлов. Выявлены участки, ответствен- ные за гормопзависимую регуляцию. Таким образом, область про- мотора эукариотического гена рассматривается как специфиче- ский ДНК-остов, на котором собираются белки транскрипции, узнающие свои сайты связывания и взаимодействующие как друг с другом, так и с РНК-полимеразой. В составе эукариотического гена имеются особые цдс-дсйству- ющие элементы регуляции, получившие название усилителя (эн- хансера), или активатора, транскрипции. Оказалось, что энхансе- ры могут располагаться как на 5'-, так и на З'-конце фрагмента ДНК, включающего ген, а также в составе интронов (рис. S2). Они способны действовать и на больших расстояниях (более 1000 н.п.), и вне зависимости от ориентации по отношению к направлению транскрипции гена. Энхансеры состоят из «нуклеотидных мотивов». Короткие нук- леотидные блоки могут служить центрами связывания снецифи- Рис. S2. Энхансеры эукариотических генов: А — возможные районы локализации энхансера (К\М) с разной ориентацией (->) относительно направления транскрипции; Б — взаимодействие белка с эн- хансером; стрелка — транскрипция гена 6 Комичен 161
ческих ядерных белков. Сила энхансера, вероятно, может зависеть от числа таких блоков. Обсуждаются два основных механизма дей- ствия энхансеров. Считается, что функциональные участки гено- ма, содержащие один или несколько генов, образуют длинные петли, включающие десятки тысяч нуклеотидных пар ДНК. Пет- ли закреплены в матриксе клеточного ядра и сверхспирализованы. В состав матрикса входит топоизомераза П, определяющая топо- логию петли ДНК. Взаимодействие энхансера с белками изменяет конформацию всей петли, включая и удаленный от него участок ДНК, в результате чего в составе петли изменяется локальная структура хроматина и облегчае тся транскрипция гена (см. рис. 82). Болес вероятно, что влияние энхансера, связанного с белком, определяется его непосредственным взаимодействием с РНК-по- лимеразой (см. с. 265). Энхансер в зависимости от белкового фактора может вести себя и как негативно действующий «глушитель» (сайленсер) экспрес- сии гена. Негативное действие сайленссров, как и в случае энхан- серов, нс зависит от положения и ориентации относительно сай- та инициации транскрипции. Таким образом, регуляторные элементы генов обладают рядом общих функциональных характеристик. На физической карте ре- гуляторной области гена они могут располагаться в одном райо- не, создавая сложную мозаику регуляторных сигналов. Отсутствие требований к строгой локализации и ориентации регуляторных последовательностей относительно генов расширяет возможности создания новых регуляторных связей путем перетасовки регуля- торных элементов в процессе эволюции. В таком случае эволюция регуляторных элементов эукариот может быть основана па измен- чивости мозаики ограниченного числа регуляторных нуклеотид- ных мотивов. Рибосомные гены Число генов, кодирующих рРНК (р-гепы, рДНК), колеблется от сотен до нескольких тысяч в зависимости от вида эукариот. Так как транскрипт p-гена дает только одну копию конечного про- дукта (5,8S, 18S и 28S рРНК), спрос на рРНК часто удовлетворя- ется за счет огромного избытка генов. Гены находятся в одной или в нескольких хромосомах (у чело- века около 200 p-генов, расположенных в 13, 14, 15, 21 и 22-й хромосомах) в областях с характерной морфологией, названных ядр ы ш ковы м и орган и затора ми. Гены рРНК практически всех эукариот построены в виде длин- ных повторов типа «голова к хвосту». На электронных микрофо- тографиях фрагмента ДНК ядрышек в момент транскрипции вид- ны несколько кластеров генов рРНК (см. рис. 144). Как правило, 162
кодирующие области генов 18S, 5,8S и 28S рРНК сгруппированы и указанном порядке в одну транскрипционную единицу (кластер). Каждый кластер p-генов длиной от 7 до 14 тыс. н. п. (в зависи- мости от вида) отделен от других кластеров межгенным спейсе- ром (МГС) (рис. 83), длина которого у разных видов сильно раз- личается, но в пределах одного вида относительно постоянна. Единица транскрипции начинается от места соединения меж- генного спейсера и 5'-ВнТС. Она направляется в сторону гена 18S рРНК и закапчивается в разных сайтах межгенного спейсера за последовательностью, кодирующей 28S рРНК. Кодирующие области p-генов у разных видов являются кон- сервативными. Длина и нуклеотидные последовательности меж- гснных спейсеров весьма сильно различаются от вида к виду. Об- Кластср Мсж- рРНК- генный генов спейсер Кластер Меж- рРНК- генный генов спейсер Кластер рРНК- генов Вставки 0,5—6 тыс. н.п. 18S 5’\S 2S 26S X S Drosophila £---£— -I Единица транскрипции, 7—8 тыс. н.п. 5. cerevisiae (дрожжи) Рис. 83. Организация кластеров р-гсиов эукариот: А — каждый кластер р-гспов длиной от 8 до 14 тыс. п.п., отделенный от других кластеров межгеннымн с пейсе рамп (МГС); Б— кластер p-генов (единица транс- крипции) человека, дрозофилы, дрожжей, состоящий из последовательностей, кодирующих 18S, 5,8S и 28S рРНК. а также транскрибируемых спсйсеров: 5- внешнего (1): ^'-внутреннего (3); З'-впутреннего (5); З'-висшиего (7); ген 26S рРНК дрозофилы содержит вставку длиной 0,5—0,6 тыс. н.п. 163
Ген 5S рРНК лягушки 25 Рис. 84. Гены 5S рРНК Промотор располагается внутри гена (25 н.п.) щей особенностью последних является то, что они обычно содер- жат прямые тандемные повторы, сходные с теми, которые окру- жают сайты начала транскрипции, т.е. сигнальные последователь- ности для РНК-полимсразы I. Разное число актов кроссинговера, происходящих между тандемно повторяющимися единицами в межгенном cnei'rccpe, приводит к различиям в числе самих этих единиц, а также в числе полноразмерных р-гсиов. Таким образом, межгеппыс спенсеры эволюционируют как согласованно с р-ге- пом, в который они входят, так и независимо от него. В результате кроссинговера общая длина повторяющейся единицы р-генов ва- рьирует от одного близкородственного вида к другому н даже в пределах одного вида. Единица транскрипции p-генов в ДНК человека имеет раз- мер около 14 тыс. п.п., приближаясь к самой длинной из извест- ных. Примерно половина областей р-генов Drosophila, кодирую- щих 26S рРНК, имеют вставки различных размеров; они не яв- ляются интронами, и кластеры с такими вставками не транс- крибируются. После завершения транскрипции про-рРНК расщепляется под действием эндонуклеазы на три зрелые молекулы рРНК: 5,8S, 18S и 28S. Гены 5S рРНК представлены сотнями и даже тысячами тан- демно повторяющихся копий, разделенных нстраискрибируемы- ми спейсерами. Они собраны в одном или нескольких районах генома и, как правило, сцеплены с генами 18S, 5,8S и 28S рРНК. Ген 5S рРНК, длина которого равна длине 5S рРНК и составляет 120 нуклеотидов, не прерывается никакими интронами (рис. 84). В гаплоидном геноме дрозофилы 160 копий генов 5S рРНК, у человека — 2000 (локализация на 1-й хромосоме). Промотор располагается внутри кодирующей последователь- ности (с 55 по 80 н.п.). Сигналом терминации транскрипции слу- жит последовательность из нескольких следующих друг за другом ти м и д и л ов ых 11 у кл еотидо в. Новообразованная 5S рРНК не подвергается модификации и процессингу. 164
Гены тРНК Гены разных тРНК (в эукариотических клетках насчитывается 40 — 60 основных типов тРНК) также часто сгруппированы в кла- стеры, расположенные в разных хромосомах. У человека на гапло- идным геном приходится 1300 генов тРНК (по 10 — 20 копий для каждой тРНК). Характер организации генов тРНК в составе бло- ков сильно варьирует у разных организмов. Расположение генов тРНК в кластерах не столь регулярно, как в случае рибосомных генов: направление транскрипции близлежащих генов бывает про- тивоположным, а гены могут быть разделены промежутками, вклю- чающими 100—150, а иногда и несколько тысяч нуклеотидных пар. Природа и функции участков ДНК, разделяющих гены тРНК, не выяснены. Промотор гена тРНК располагается внутри кодирующей по- следовательности и имеет два района (А- и В-боксы), необходи- мые лля правильной и эффективной транскрипции. A-бокс лока- лизован в области от + 10 до +20 н.п., а В-бокс — между парами оснований +50 и +65 (рис. 85). Канонические последовательности А- и В-боксов имеют вид: 5'-TGGCNNAGTGG-3' и 5'- GGTCGANNC-3' (N — любой нуклеотид). Боксы А и В такого «расщепленного промотора» совпадают с районами гена, кото- рые соответствуют наиболее консервативным районам молекулы тРНК в дигидроуридиловой и нсевдоуридиловой петлях, содер- жащих наибольшее количество инвариантных нуклеотидов. Для активной транскрипции требуется сохранность расстояния между А- и В-боксами, которое составляет около 50 н.п. В генах тРНК многих организмов имеется один интрон разме- ром от 14 до 60 н.п. (в зависимости от вида тРНК). Он всегда локализуется в одном и том же месте у разных тРНК: через один нуклеотид от З'-конна антикодона. Район генов тРНК, кодирую- щий интрон, выщенляется в результате процессинга. Гистоновые гены Первичная структура гистонов у разных эукариот высококон- сервативна. Это неудивительно, поскольку гистоны играют клю- чевую роль в поддержании структуры хроматина. Частоты повто- В-бокс +50 +65 Рис. 85. Структура гена тРНК. от +70 до +90 £ Промотор располагается внутри гена (А- и Я-боксы). (+1) — сайт инициации транскрипции; С — нетранскрибирусмыс спсОссры 165
Таблица 14 Частоты повторения гистоновых генов у эукариот Организм Число генов па гаплоидный геном Дрожжи 2 Дрозофила НО Морской еж 470 Тритон 700 Курица 10 Мышь 10-20 Человек 40 рения гистоновых генов в геноме различных организмов изменя- лись в ходе эволюции без видимой связи с усложнением организ- мов (табл. 14). Гены разных гистонов сцеплены. Все они транскрибируются по отдельности, часто с противоположных цепей ДНК. В геноме гис- тоновые гены распределены неодинаково. У одних видов они обра- зуют тандемные повторы, у птиц и млекопитающих (рис. 86) рас- сеяны по всему геному. Большинство гистоновых генов лишено интронов, а у мРНК отсутствуют 3'-поли(А)-копцы. Таким образом, большая часть изученных генов у эукариот представлены или множеством сходных копий, или ограничен- ным набором дуплицированных и дивергировавших в разной сте- пени последовательностей. Те и другие носят название «мульти- генные семейства». Повторяемость генов в мультигепных семей- ствах необходима либо для усиления дозы генов, либо для обеспе- чения синтеза различных вариантов родственных полипептидов. Дозовая повторяемость характерна для генов, колирующих РНК рибосом, тРНК, а также гистоновых генов. Именно множествен- ность генов, обслуживающих аппарат трансляции, обеспечивает физиологическую реактивность клетки, так как темп белкового синтеза часто лимитируется количеством рибосом и тРНК. Оче- видна целесообразность множественности и гистоновых генов, так как в определенные моменты жизни клетка должна за короткий Hl Н4 Н2В НЗ Н2А л —--НН—Ш—м— I_____I____I_____I____I I_________I 0 2 4 6 тыс. н.п. Рис. 86. Расположение гистоновых генов в повторяющейся единице морского ежа (а) и дрозофилы (о) (стрелками показано направление транскрипции) 166
интервал времени одновременно с репликацией синтезировать полный комплект гистонов. Вариантная повторяемость свойственна таким генам, как гло- биновые, актиновые, иммуноглобулиновые, хорионные и т.д. Число генов в этих мультигенных семействах, как правило, не- большое, а степень гомологии отдельных его членов варьирует в широких пределах. Члены мультигенных семейств происходят, по- видимому, от одной общей предковой последовательности путем дупликации и последующей дивергенции. Мультигснные семейства отличаются друг от друга по степени сложности организации. Наиболее простые мультигенные семей- ства образуют гены, кодирующие рРНК. Болес сложно устроены гены для гистонов и тРНК. И наиболее сложное строение харак- терно для регулируемых мультигенных семейств, контролирую- щих ключевые стадии развития организмов. ТАНДЕМНЫЕ ПОВТОРЫ Тандемно организованные повторяющиеся последовательности ДНК различных типов широко представлены в эукариотических геномах. Они варьируют подлине кластера и размеру повторяю- щегося звена. В случае генов рРНК или гистоновых генов тандемно повторя- ются группы одинаковых генов. В тандемы организованы такие родственные, но все же различающиеся гены, как члены мульти- генных семей глобиновых и овальбулиновых генов. Тандемные повторы встречаются в кодирующих и некодируюших участках, между генами и в интронах. Тандемные повторы, где бы они ни находились, как правило, связаны с межвидовым полиморфизмом. Спейсеры между генами рРНК и между транскрипционными единицами рРНК обычно содержат множество внутренних тандемных по- второв, которые ответственны за по- лиморфизм длины спейссров. Причи- ной происхождения подобной вариа- бельности может явиться неравный кроссинговер (рис. 87). Если аллели сме- щаются относительно друг друга па не- сколько повторяющихся звеньев, то ре- зультатом кроссинговера будет деления в одном аллеле и увеличение количе- ства повторов в другом. Наиболее час- то изменения числа повторов коротких последовательностей связывают с яв- А в с < м > а Ь с t ' ' ) I АВС < ™------> a b X с с. м—) I а b В С t-- м > < А , . с, Дупликация Нехватка Рис. 87. Неравный кросспп- 167
Рис. 88. Делении и амплификации, возникающие при репликации пли ре- парации: А — «проскальзывание» матричной цепи, вырезание петли или репликация (ми- нуя петлю) с последующей репарацией, приводящие к делении: Б — «проскаль- зывание» синтезируемой цепи и последующая репарация, приводящие к ампли- фикации лением «проскальзывания» нити ДНК в процессе репликации или репарации ДНК (рис. 88). При наличии тандемно повторенных ко- ротких последовательностей могут наблюдаться «выпетливание» нескольких повторяющихся единиц отстающей цепи в вилке реп- ликации и образование дуплекса с матричной нитью со смещени- ем на соответствующее количество тандемных повторов. Наиболее полиморфными среди тандемно организованных по- вторяющихся последовательностей являются минисателлит!:ые и микросатсллитные ДНК, изменчивость которых проявляется, в частности, в аллельных вариациях числа повторяющихся звеньев. 168
МИНИ- И МИКРОСАТЕЛЛИТЫ. ДНК-ФИНГЕРПРИНТИНГ Минисателлиты характеризуются размером повторяющегося мо- номерного звена в интервале 6— 100 н.п. и длиной кластера 0,2— 20 тыс. н.п. Большинство из них относится к GC-типу. по извест- ны АТ-обогашенные варианты. Содержание различных классов и типов минисателлитов широко варьирует, составляя от несколь- ких сотен до нескольких тысяч копий на геном. Для некоторых из них показана прителомерная кластеризация на некоторых хромо- сомах, а другие равномерно распределены по геному. Характерные размеры мономерного звена микросателлитов составляют 2—6 н.п. (СТ, САС, ТСС, GACA и др.), кластеры — 20—60 н.п. (до 1000 н.п. при некоторых наследственных заболева- ниях, когда происходит экспансия триплетных повторов). Неко- торые микросатсллиты насчитывают I04—105 копий, которые рас- пределяются по всему геному равномерно. А.Джеффрис и сотр. (1985), используя минисателлитные про- бы в качестве зонда для детектирования множества гомологичных локусов в ДНК человека, обнаружили специфические для каждо- го индивидуума картины блот-гибридизации, получившие назва- ние ДНК-фингерпринтов (рис. 89). Последовательность процедур, составляющих основу метода ДНК-фингерпринтинга, представ- лена на рис. 90. Метод включает: гидролиз ДНК-ресгриктазой; раз- деление образующихся фрагментов ДНК с помощью электрофо- реза в агарозном геле (при этом их подвижность обратно пропор- Индивидуумы: я 9 10 II 12 13 Рис. 89. Результаты блот-гибридизации зонда (AGAGGTGGGCAGGTGG)29 с ДНК, обработанной рестриктазой HinfL Четыре образна ДИК получены от членов одной семьи: отца (□), матери (О) и их детей — однояйцовых близнецов. Дорож- ки 12 и 13 — неродственные индивидуу- мы мужского пола. Стрелками отмечены «родительские» сателлитные полосы на электрофореграммах ДНК близнецов (Л. Jeffreys н др. //Nature. — 1985. — V. 316. — Р.76) 169
Рис. 90. Схематическое изображение метода ДНК-фингсрпрнптипга циональна длине); перенос фрагментов ДНК из геля на мембран- ный фильтр (блоттинг) с сохранением картины фракционирова- ния рестриктов ДНК; гибридизацию фильтра с меченым зондом, выявляющим лишь тс рестрикционные фрагменты, которые го- мологичны ДНК-зонду. На гибридизационной картине (см. рис. 89) одновременно было выявлено множество локусов, содержащих гипервариабельные ми- нисателлиты. Полиморфизм этих картин был высок. Вероятность их совпадения для двух неродственных индивидуумов при использо- вании одного зонда оказывалась равной L0'11. Эти гибридизуюши- сся последовательности были специфичны для данного индиви- дуума в большей степени, чем капиллярные узоры (10‘6), отчего данный метод называют геномной дактилоскопией, т.е. с его по- мощью можно осуществить идентификацию личности на геном- 170
ном уровне. Если распределение гибридизационных полос у раз- ных индивидуумов различно, то для ДНК из разных тканей одного индивидуума оно остается постоянным. Это указывает на то, что картины гибридизации обладают соматической стабильностью. Соматические различия наблюдаются лишь при использовании разных рестриктаз. Распределение полос наследуется по ядерному типу (по Г.Менделю), т.е. примерно половина гибридизующихся фрагментов у потомков — от матери, а другая половина — от отца. Количества ДНК, содержащегося в нескольких каплях крови, вполне достаточно для проведения блот-гибридизации и опреде- ления кровного родства (чаще всего — отцовства). В 1987 г. бельгийский исследователь Дж. Вассарт, а также рос- сийский ученый А. П. Рысков с сотр. обнаружили, что миниса- тсллиты фага М13 (15-членное звено — GAGGGTGGXGGXTCT (X — любой нуклеотид) образует в геноме фага два кластера, повторяясь в одном участке 10, а в другом 4 раза, и находится в гене белка Ill) широко представлены у разных организмов, вклю- чая человека, беспозвоночных животных, растения, низших эука- риот и бактерий. Использование этой пробы для блот-гибридиза- ционного анализа ДНК неродственных индивидуумов выявило чрезвычайно высокий уровень полиморфизма (20 — 25 полос гиб- ридизации) (рис. 91). Тот факт, что гомологичные минисателлиты обнаруживаются в столь разных организмах (человек и фаг М13), предполагает широкое распространение этих последовательнос- тей в живой природе и возможность использования ДНК-фингер- принтинга с зондом ДНК фага М13 для исследования индивиду- альности, генетического разнообразия и родства любых живых существ. Рис. 91. Гипервариабельпые участ- ки ДНК человека, детектируемые с помощью ДНК фага М13 (Про- сняк М. И. и др. // Генетика. — М., 1990.-Т. 26.-С. 134): А — ДНК фага М13. меченная ИР; Б — ДНК фага М13, безызотопиый вари- ант. Использована ДНК восьми ин- дивидуумов kb 23 1 2 3 4 5 6 7 8 9 10111213141516 171
Оказалось, что некоторые гипервариабельные мини- и микро- сателлитные аллели имеют изменчивость в 100—1000 раз боль- шую, чем обычные локусы генома, вследствие как мутационных, так и рекомбинационных процессов. В связи с этим ДНК-фингер- иринтинг именно с мини- и микросателлитами в качестве зонда явился информативным методом для фундаментальных исследо- ваний в популяционной биологии в плане изучения биоразнообра- зия на генетико-популяционном уровне. ДНК-фингсрпрпнтинг по- зволяет оцепить внутри- и межпопуляционную генетическую из- менчивость в аутбредных, ипбредпых и партеногенетических по- пуляциях. Использование минисателлитпых маркеров эффективно при изучении дифференциации малых и изолированных популяций, а также для реконструкции их филогенетических связей, что пре- красно было продемонстрировано на популяции островных ли- сиц (Urocyon littoralis) и горбатого кита (Megaptera novaeangliae). Метол ДНК-фингерпринтинга позволил охарактеризовать ге- номы инбредных популяций — линии мышей, породы кур и ге- нетически почти гомогенной природной популяции голых земле- копов Heterocephalus glaber. Последнее животное является един- ственным представителем млекопитающих, имеющим такую же социальную организацию, как пчелы и термиты. Применение мп- нисателлитных маркеров обнаружило чрезвычайно высокий уро- вень генетической однородности животных как внутри вида, так и между колониями (внутрипопуляционныс коэффиценты род- ства (г г 0,8) и инбридинга (F х 0,45) оказались наивысшими для диких млекопитающих). Результаты подтверждают межрод- ствеппое скрещивание внутри колонии (колония имеет одну ца- рицу; I —3 самцов и молодняк из предыдущего потомства, обслу- живающий колонию). ДНК-фипгерпрпптипг оказался очень информативным мето- дом в популяционной биологии для решения многочисленных задач в программах, связанных с оценкой, рациональным использова- нием и консервацией генетических ресурсов, особенно для выра- ботки научно обоснованных рекомендаций по сохранению и под- держанию редких и исчезающих видов. Выбор популяционных образцов для консервации (при созда- нии заповедника или криогенных банков клеток и ДНК) опреде- ляется уникальностью их генотипа. При снижении популяцион- ной численности значительное влияние на генетическую структу- ру оказывают дрейф и инбридинг. Все эти параметры определя- ются полиморфными маркерами и в первую очередь гипервариа- бельными мини- и микросателл игами. Здесь следует отметить ра- боты по исследованию исчезающей популяции волка (Canis lupus) в международном биосферном заповеднике на о. Айл-Ройал (Ве- ликие озера, Северная Америка); по восстановлению исчезающе- 172
го пуэрториканского попугая (Amazona vittata')', сибирского журав- ля {Grus leucogerauus) или стерха; асконийской популяции лоша- ди Пржевальского (Equus przewalskii) и др. Исследование методом ДНК-фингерпринтинга геномов кло- нально размножающихся однополых видов позвоночных на при- мере партеногенетических видов кавказских ящериц рода Lacerta позволило вплотную подойти к выяснению природы и механиз- мов генетической изменчивости, а также факторов, ее определя- ющих. Большой интерес метод представляет для медицины в плане ДНК-диагпостики. Обнаружена взаимосвязь между так называе- мыми динамическими мутациями и патогенезом ряда неврологи- ческих наследственных заболеваний (хорея Гентингтона, синдром ломкой Х-хромосомы и др.). Генетическая паспортизация населения методом ДНК-фингер- принтинга широко проводится в развитых странах: генетический паспорт имеют все военнослужащие США и все мужское населе- ние Англии. Для России своевременной явилась бы паспортиза- ция всех детей, особенно воспитанников детских домов и спец- интернатов, нередко склонных к асоциальным поступкам, в том числе к дромомании (бродяжничеству). Именно наличие у таких детей генетического паспорта позволит с уверенностью прово- дить их идентификацию, что несомненно будет иметь положи- тельные социальные последствия. ОНКОГЕНЫ И АНТИОНКОГЕНЫ Некоторые вирусы в определенных условиях способны вызы- вать образование опухолей. Эти вирусы были названы онкогенными. Первым средн описанных онкогенных вирусов был вирус сарко- мы Рауса птиц (ретровирус), вызывающий опухоли мышечной ткани цыплят. Развитие опухоли обусловливал одни ген ретрови- руса — онкоген. Оказалось, что в каждом случае ретровирусный онкоген имеет своего «двойника» в нормальных клетках. Вирус- ный ген обозначают приставкой v (от англ, virus — вирус), а соот- ветствующий клеточный ген приставкой с (от англ, cellular — клепоч- ный). Клеточный ген называется протоонкогеном. Протоопкогены кодируют белки, участвующие в важных регуляторных клеточных механизмах, нарушение которых может привести к неконтроли- руемому делению клеток. Некоторые из них кодируют факторы роста и транскрипции, мембранные рецепторы для факторов роста, белки контроля клеточного цикла (циклипы), белки, участвующие в апоптозе, «белок бессмертия» теломеразу и т.д. В эволюционном плане ретровирусные онкогены могли произойти от резровирусов в результате захвата генов хозяина. Один из путей активации онко- 173
гена — структурная мутация, например замена нуклеотида в ДНК, ведущая к замене аминокислоты в белковой цепи и к изменению функции белка. Другой путь — это усиление активности онкогена, ведущее к усилению синтеза белкового продукта онкогена и его накоплению в клетке. Активация онкогена могла быть результатом увеличения числа копий данного гена в геноме (амплификация) или следствием такой перестройки, когда рядом с потенциальным онкогеном появляется новый регуляторный элемент, обеспечива- ющий его более активную транскрипцию. Число известных онкоге- нов непрерывно растет и, по данным секвенирования ДНК чело- века, па февраль 2001 г. выявлено 130 онкогенов. Вскоре после открытия первых онкогенов появились сообще- ния о существовании генов, утрата или подавление активности которых тоже приводит к развитию опухолей. Иными словами, белковые продукты этих генов препятствуют клетке превратиться в раковую. Эти гены были названы анпиюнкогенами, или генами- супрессорами опухолей (ГСО). Число известных ГСО тоже быстро растет, хотя и уступает числу открытых онкогенов. Многие гены, кодирующие белки передачи сигнала для роста и размножения клеток, являются потенциальными онкогенами. В отлаженной системе нормальной клетки они обеспечивают строго регулируемые рост и размножение, но при повреждении или не- регулируемой активации этих генов клетки превращаются в рако- вые. Поскольку онкогенов и ГСО чрезвычайно много, набор мута- ций в различных опухолях человека весьма разнообразен. В одних опухолях активированы или подавлены одни гены, в других — дру- гие. Каждая опухоль, таким образом, имеет свой генетический портрет, который и характеризует ее свойства. Известно, что апоптоз (клеточная смерть) определяется боль- шим числом белков. Центральное место среди них занимает ген р53, кодирующий белок с мол. массой -53 000 Да. Ген р53 играет важную роль в направлении клеток с поврежденной ДНК но пути апоптоза. Гены, способствующие апоптозу, относят к ГСО, а пре- пятствующие ему гены — к онкогенам. Когда ген р53 выведен из строя, клетки с поврежденной ДНК (мутантные клетки) пере- стают выбраковываться и в них происходит накопление новых мугаций, которые могуг затрагивать ГСО и онкогены. Поэтому по- вреждение р53 резко усиливает аккумуляцию других изменений и дефект р53 наблюдается в опухолях очень часто. Так как опухоль — болезнь генома, она незаразна. С другой стороны, имеются виру- сы — носители онкогенов. ДНК таких вирусов может встраиваться в геном клетки, и в такой клетке появляется активный онкоген. Таким образом, некоторые вирусы привносят в клетки новые онкогены, тем самым повышают вероятность возникновения рака у индивидуума. Конкретные механизмы развития каждой отдель- 174
ной опухоли различны и знание истинной причины клеточной трансформации крайне важно для разработки методов эффектив- ной терапии. ПОДВИЖНЫЕ ГЕНЕТИЧЕСКИЕ ЭЛЕМЕНТЫ ЭУКАРИОТ Существенную часть генома эукариот (10 — 30%) составляют повторяющиеся последовательности, имеющие определенную структурную организацию и способные перемещаться в геноме как в пределах одной хромосомы, так и между хромосомами. Они получили название подвижных генетических элементов. Элементы включают в свой состав от тысячи до десятков тысяч нуклеотид- ных пар. Перемещение подвижных элементов осуществляется либо путем вырезания элемента из одного места и встраивания его в другое, либо путем образования копии подвижного элемента, внедряющейся в новое место, тогда как родительская копия оста- ется на прежнем месте. В последнем случае увеличивается их число в геноме. Открытие подвижных элементов показало, что последо- вательность нуклеотидов ДНК по длине хромосомы изменяется благодаря перемещению этих элементов. Встраиваясь в гены или в соседние с генами области, они либо вызывают мутации, либо повышают уровень активности близлежащих генов. Все это позво- лило взглянуть по-новому на природу мутационных процессов и молекулярных механизмов эволюции генома. Подвижные элементы эукариот представлены отдельными се- мействами, сходными по своей структуре и поведению. Внутри семейства различаются подсемейства идентичных или очень сход- ных подвижных элементов, число которых колеблется от несколь- ких копий до нескольких тысяч копий на геном. Наибольшее ко- личество подвижных элементов обнаружено в геноме растений (до 50 %). Подвижные генетические элементы обычно рассеяны по геному, но могут концентрироваться в отдельных участках хро- мосом. Различают два основных класса подвижных генетических эле- ментов: транспозоны и ретротранспозоны. Такая классификация основана па молекулярных механизмах, с помощью которых пе- ремещаются эти элементы. Транспозоны. Эти элементы ограничены инвертированными повторами (последовательностями, направленными навстречу друг дру1у), как и некоторые транспозоны прокариот (см. с. 146). При- мерами их могут служить P-элемент дрозофилы и Ас-элемент ку- курузы. В геномах этих организмов насчитывается по 30 — 50 копий таких элементов. Полные копии (часть копий дефектна, так как имеет внутренние делеции) содержат открытые рамки считыва- ния, кодирующие транспозазу (рис. 92). 175
P-элемент дрозофилы 1 2 3 4 ' w// 5' 3' Ас-элемент кукурузы Удаление четырех интронов, мРНК транспозазы мРНК транспозазы после сплайсинга в клетках зародышевого пути Рис. 92. Транспозоны эукариот Схема перемещения транспозона показана на рис. 93. Инверти- рованные повторы необходимы для перемещения элемента, ко- торое осуществляется благодаря их сближению друг с другом и узнаванию трапспозазами. Инвертированные повторы сближают- ся и точно отрезаются от соседних участков ДНК хозяина. Выре- занный транспозон внедряется в район вносимого транспозазой разрыва в молекуле-мишени и сшивается с ДНК хозяина в новом месте. Разрыв и зашивание осуществляются транспозазой и вспо- могательными белками. Транспозаза может кодироваться как са- мим подвижным элементом, который будет перемещаться, так и другой копией элемента, локализованной в том же геноме в отда- лении. Р-элсменты обычно встраиваются в определенные сайты, консенсусная последовательность которых такова: 5'-GGCCAGAC. При встраивании P-элемента этот сайт-мишень дуплицируется. Транспозон Illi I> Ге11 трапспозазы< ^САА | | | | Г --------------------------------- \ Инвертированные повторы ДНК хозяина II Illi 111 IIIIггп | ДНК-мишень llllllllll Встраивание Рис. 93. Перемещение транспозона 176
Р-элемент содержится только в некоторых линиях D. nielanogaster. Скрещивание самок без Р-элсмента с самцами, несущими Р-эле- мепты, приводит у гибридов к транспозициям Р-элемепта, кото- рые наблюдаются только в клетках зародышевого пути. Совокуп- ность наблюдаемых эффектов называют гибридным диагенезом. Дис- генные мухи часто оказываются стерильными, а если они фер- тильны, то у их потомков обнаруживается множество мутаций и эти признаки передаются следующим поколениям. Поэтому ли- нии с Р-элемептом и без него выглядят как репродуктивно изо- лированные, по крайней мере частично. Биологическая изоляция играет огромную роль в процессе эволюции. Изоляция линий вы- звана активацией транспозиций P-элемента, присутствующего в одной из них. Причина, почему транспозиции P-элемента огра- ничены зародышевыми клетками, объясняется тем, что только в клетках-предшественниках гамет осуществляется такой тип сплай- синга, который приводит к образованию непрерывной открытой рамки трансляции, кодирующей транспозазу (см. рис. 92). Ограни- чение транспозиции зародышевыми клетками имеет определен- ный смысл, поскольку обеспечивает выживание особей, несущих гаметы, в которых произошли геномные перестройки вследствие транспозиции P-элемента. Подобный «геномный шок», сопровож- дающийся высокой частотой мутагенеза, может обеспечить боль- шую степень геномной изменчивости, которая послужит матери- алом для отбора в процессе эволюции. Перемещения Ас-элемента происходят и в соматических клет- ках кукурузы. За ними можно следить по распределению мутант- ных участков ткани, например лишенных пигмента вследствие инактивации гепа, определяющего пигментацию. Потомство клет- ки, содержащей только инактивированные гены, также будет ли- шено пигмента. Вырезание мобильного элемента приводит к ре- активации гена. В связи с этим был сделан вывод о регуляторной функции перемещающихся элементов и они были названы конт- ролирующими (Б. Мак-Клинток). Брешь в ДНК после вырезания транспозона может заделывать- ся либо с помощью гомологичного отрезка ДНК, либо за счет сшивания разорванных концов (это особенно характерно для транс- позонов растений). В целом подвижные элементы эукариот представляют собой чрезвычайно разнородную популяцию. Существует мнение о том, что они не влияют на фенотип организма и размножаются в ге- номе лишь благодаря особенностям своей структуры, в резуль- тате чего постепенно заселяют геном. Предполагается, что они составляют часть так называемой эгоистичной (см. с. 156) ДНК, размножение которой ограничивается естественным отбором. От- бор устраняет те случаи, когда внедрение эгоистичной ДНК со- провождается вредными последствиями. На определенных ста- 177
Область локализации усилителя (энхансера) 5000- 8000 н.п. 3' дкп З'ДКПгзаш -| 300-400 н.п} Кэп-сайт 2 3 1, 2, 3 — открытые рамки считывания 5' Сигнал полиаденил ировапия РНК 3' поли-А Рис. 94. Структура рстротрапспозопа с длинным концевым повтором днях эволюции эти элементы могут использоваться для целей, которые в дальнейшем обеспечат селективные преимущества орга- низму. Большой класс подвижных элементов представляют ретро- транспозоны, сходные по своей структуре с проретровирусами, которые внедряются в геном, используя механизмы обратной транскрипции (см. с. 233). Эти элементы содержат «тело» размером 5 — 8 тыс. н. п., ограниченное прямыми длинными концевыми по- вторами (ДКП, или LTR — от англ, long terminal repeats), обычно содержащими по 300—400 н. п. (рис. 94). Число копий этих элемен- тов, принадлежащих к одному семейству, достаточно постоянно для вида, но варьирует от нескольких копий до сотен тысяч копий в зависимости от типа ретротранспозона. Ретротранспозоны, отно- сящиеся к разным семействам, не имеют протяженных гомологий нуклеотидных последовательностей пи в ДКП, ни в теле. В составе «тела» элемента обнаруживаются открытые рамки считывания для обратной транскриптазы и нуклеазы (интегразы). Разные копии одного семейства могут иметь вставки и делении как в ДКП, так и в самом элементе. По флангам ДКП находятся короткие прямые повторы. Ретротрапспозоны широко распространены у эукариот. Один из способов перемещения ретротранспозонов предпола- гает его транскрипцию с помощью РНК-полимеразы II. В составе ДКП имеются сайты инициации транскрипции и сигналы поли- аденилирования. ДКП могут служить активными промоторами. Транскрипция начинается в одном ДКП (условно левом, 5'-ДКП), а закапчивается в другом (правом, З'-ДКП). Синтезируемая моле- кула РНК транслируется с образованием ферментов, необходи- мых для синтеза ДНК и внедрения ее в геном. Эта схема полностью повторяет схему образования и интеграции провируса (рис. 95). Остается открытым вопрос: произошли ли ретровирусы из рет- 178
ДНК (стрелки) обеспечивают начало и конец транскрипции, а также репликацию Ц Рстротрапспозон |-»-llpOBHpyc->j I . Транскрипция РНК ~"Х. Трансляция/' РНК Вирусная частица, способная к заражению, или вирусоподобная, дефектная Образование белков вирусной частицы, а также рсвсртазы/интегразы Обратная ДНК РНК транскрипция ДНК-? Встраивание, интеграза Рис. 95. Перемещение ретротраиспозоиа с длинным концевым повтором ротранспозоиов или, напротив, ретротранспозоны возникли из вирусов в результате потери способности к заражению? Подавля- ющая часть ретротранспозонов (при сравнении их с ретровируса- ми) либо потеряла ген оболочки вируса, либо еще не приобрела его. Таким образом, рстротрапспозон ы представляют собой внут- ригсномиыс, нсинфекционные элементы, способные лишь к са- мовоспроизведению и «подзаражению» того же генома. Внедрение ретротранспозона внутрь гена или около гена вы- зывает разные эффекты. Во многих случаях происходит инактива- ция гена (рис. 96). При интеграции в район промотора на 5'-флан- ге гена ретротранспозон может резко активировать экспрессию гена, обеспечивая транскрипцию с собственного промотора. Если в этом случае подвижный элемент оказался около протоонкоге- на, то результатом может быть сверхпродукция белка и злокаче- ственное перерождение клетки. Это же возможно при воздействии энхансеров, привносимых мобильным элементом. Особые возмож- ности для перенесения и приобретения регуляторных сигналов возникают тогда, когда элемент (ретротранспозон) удаляется за счет гомологичной комбинации между ДКП с идентичными по- вторами (см. рис. 96). В результате сохраняется лишь один ДКП на месте внедрения резротранспозона. В свою очередь одинокие ДКП существенно влияют на изменчивость регуляторных систем клет- ки. Именно такой промотор может перепрограммировать характер 179
A Экзон 1 5'1 . Кэп-сайт ДКП ]—Q Интрон 1 ДКП Экзон 2 5’------------------1 Терминация транскрипции Б П ромотор Экзон 1 1 РНК ДКП —>- ДКП содержит промотр РНК 5 ДКП -1 — 1 РНК 5’’------- Инициация аномального транскрипта В Поли-А ДКП содержит энхансер Активация экспрессии гена Рис. 96. Эффекты внедрения рстротраиспозопа внутрь гена или около гена: А — нарушение транскрипции при внедрении в интрон: Б — усиление экспрес- сии гена при внедрении в 5'-paiion гена: И — образование подвижного промотора в процессе гомологической рекомбинации после удаления тела элемента зависимости работы гена как от внешних сигналов, так и от внут- риклеточных регуляторных систем. Представленные случаи внедрения элемента сопровождаются мутациями с самыми разными фенотипическими проявлениями, обусловленными подавлением образования или, наоборот, гипер- продукцией белка. Перемещение элементов по геному способствует распространению регуляторных сигналов (сайтов инициации транс- крипции, сигналов полиаденилирования, или энхансеров), что делает значительной роль мобильных элементов в эволюции си- стем регуляции. Существует другой большой класс ретротранспозонов, кото- рые не несут длинных концевых повторов. Механизм внедрения их несколько иной, хотя он также осуществляется с помощью 180
Ретротранспозоп бел ДКП (узнавание места встраивания и обратная транскрипция сопряжены) Трансляция с образованием белков, включая ревертазу Удаление РНК, достройка двунитевой ДНК, встраивание и.....................in............ Рис. 97. Перемещение рстротрапспозопа без ДКП обратной транскрипции. К ним относятся представители семей- ства L1, населяющие геном человека. Репликация элемента без ДКП сопряжена непосредственно с районом будущего внедрения ретротранспозона (рис. 97). РНК, образовавшаяся при транскрип- ции элемента, перемешается к достаточно случайному месту раз- рыва ДНК-мишени, часто сшивается с одной из нитей ДНК. Сюда устремляются и необходимые для интеграции белки — обратная транскриптаза и интеграза. Другая, комплементарная нить ДНК служит затравкой для копирования РНК-копии элемента с уча- стием обратной транскриптазы. Фермент копирует сначала неболь- шой участок ДНК-мишени, а затем меняет матрицу и копирует РНК, после чего РНК удаляется и образуется вторая комплемен- тарная нить ДНК. Ретротранспозоны без ДКП участвуют в сохра- нении концов хромосом в ряду поколений. Подобную функцию у многих организмов выполняет теломе- раза (см. с. 230). У ряда насекомых, в том числе и у дрозофилы, отсутствует теломеразная активность. Концы ДНК у них удлиня- ются за счет перемещений регротранспозонов и в этом случае выступают как компоненты генома, спасающие хромосому от уко- рачивания. Рстротрапспозоны перемещаются, образуя повторяю- щуюся структуру, в которой элементы соединены друг с другом по типу «голова к хвосту». Сначала на РНК-транскрипте как на 181
матрице с помощью обратной транскрипции строится компле- ментарная нить ДНК, а затем после удаления РНК-матрицы до- страивается другая. Таким образом, геном хозяина приспособил эти элементы для сохранения концевых участков хромосом, для спасения хромосомы от потери генов. В геноме млекопитающих, птиц, амфибий и насекомых обнару- живаются ретропозоны — внедрившиеся в геном ДНК-копии, син- тезированные па разных типах клеточных РНК, как на матрицах. Структура ретропозонов позволяет с уверенностью говорить об уча- стии обратной транскрипции в процессе их образования. Таким образом, наряду с переносом информации от ДНК к РНК осуще- ствляется и обратный процесс — возвращение ее в геном в виде ретропозонов. У млекопитающих ретропозоны составляют более 10% ДНК, следовательно, мощность встречного потока информа- ции от РНК к ДНК может быть существенной, по крайней мере при оценке его во временном эволюционном масштабе. Различают разные типы ретропозонов, среди них псевдогены. Это копии генов, лишенные интронов и обладающие последовательностью поли- дА-поли-дТ на З'-фланге. Матрицей при их копировании послужи- ла «процессированная» полиаденилированная мРНК. Рамки транс- ляции таких «генов» часто «испорчены» стоп-кодонами и деления- ми. Они, как и проретровирусы, ограничены короткими прямыми повторами, представляющими собой дупликацию геномной по- следовательности в области сайта внедрения ДНК-копии, обра- зованной на мРНК. Если ретропозон правильно процессирован, ДНК-коппя содержит открытую рамку считывания и возможна его экспрессия, то такие ретропозоны называют ретрогенами. Большую массу повторяющихся элементов позвоночных пред- ставляют ДНК-копии клеточных РНК, кодирующих белки неиз- вестной природы, а также аномально процессированных клеточ- ных транскриптов тРНК, 7S РНК и UPHK. Они представляют собой длинные и короткие повторы. Семейства повторяющихся последовательностей часто получают свои названия по расщепля- ющим их рестриктазам (например, короткие Alu-повторы или длинные Крп-повторы в геноме человека). Каждый вид млекопитающих обладает собственным главным семейством длинных повторов, отличающих его от других видов. Предполагают, что разные семейства длинных повторов возник- ли сравнительно недавно, уже после эволюционной дивергенции видов млекопитающих. Короткие повторы, например повторы Alu-семейства у чело- века, составляют 3 • 105, что соответствует 5 —6 % массы ДНК клет- ки. Их нуклеотидная последовательность гомологична последова- тельности отдельных участков 7S РНК. Такие повторы рассеяны по геному, их обнаруживают в интронах, на 5'-флангах генов, в составе З'-петранслируемых участков гена. 182
Между особями одного вида иногда наблюдаются различия (полиморфизм) в структуре генов и их ближайшего окружения, обусловленные внедрением коротких или длинных повторов. В ге- номе существует множество неактивных дефектных копий этих элементов, они нс способны кодировать трапспозазу или обрат- ную транскриптазу. С другой стороны, они сохраняют способность к перемещениям, если в случае транспозонов имеются инверти- рованные повторы, узнаваемые транспозазой, а в случае ретро- транспозонов сохранены промотор и возможность транскрипции элемента. Множество таких дефектных копий начнут перемещать- ся, если ферменты, ответственные за перемещение, будут коди- роваться другими полноценными элементами. В геноме человека источником активной обратной транскриптазы является ретро- транспозон LL, число копий которого достигает 100 тыс. Из них активно перемещаются 30—60 тыс., остальные, поврежденные, перемещаться не могут. Мобильные генетические элементы могут принимать участие в перестройках хромосом. Наличие в хромосомах нескольких одина- ковых по нуклеотидной последовательности копий подвижного элемента позволяет в редких случаях осуществить рекомбинацию по районам их локализации. В результате неравного кроссинговера возникают делеции отдельных участков или, наоборот, дуплика- ции (рис. 98). Неравный кроссинговср ио районам локализации Рис. 98. Перестройки хромосом, обусловленные присутствием в них оди- наковых повторяющихся последовательностей, представленных подвиж- ными элементами 183
Облучение / Ц (центромера) / I— О— 1 Рис. 99. Устранение двупите- вого разрыва ДНК с помо- щью ретротранспозона О Расхождение хромосом г'" О= Потеря j концевого фрагмента Фрагмент ретротранспозона (залечивание бреши) транспозона mariner (моряк) у человека приводит к делении уча- стка в коротком плече 17-й хромосомы. Если это событие проис- ходит в зародышевой клетке при созревании гамет, то хромосома сделецией будет передана потомкам. Это приводит к наследствен- ным заболеваниям нервной системы — невропатиям и параличам. Внутрихромосомиая рекомбинация между двумя элементами при- водит к инверсии — повороту' участка хромосомы па 180”. Инвер- сия может быть вредна для организма, а может способствовать эволюции генома, поскольку помогает передать потомству слу- чайно сложившееся благоприятное сочетание генов, препятствуя кроссинговеру. Ретротранспозоны с ДКП участвуют в ликвидации двупптсвых разрывов ДНК. Обычно такой разрыв залечивается с помощью гомологичной молекулы ДНК, например сестринской, только что реплицированной нити. Участие реплицирующейся ДНК ретро- транспозонов с ДКП в процессе заживления двуиитевых разры- вов обнаружено у дрожжей (рис. 99). Брешь влвунитевой спирали, заделанная ретротранспозоном, сохраняет целостность хромосо- мы, по изменяет ее нуклеотидную последовательность. Если рай- он хромосомы, где была брешь, не содержит существенного гена, то клетка остается жизнеспособной. Подвижные элементы не стоит рассматривать только как «эго- истическую» ДНК, паразитирующую на ДНК клетки-хозяина. Они приспособлены и для нужд генома клетки: способствуют сохране- нию структурной целостности хромосомной ДНК; внедряясь в гены, не только инактивируют, вызывая мутации, но и меняют характер их экспрессии. В связи с этим подвижные генетические элементы, будучи важными факторами изменчивости генов и уча- ствуя в перестройках структуры хромосом, имеют огромное зна- чение в процессах эволюции геномов. 184
ПРОГРАММА «ГЕНОМ ЧЕЛОВЕКА» Для всестороннего исследования генома человека в 1990 г. была разработана и в настоящее время воплощается в жизнь специаль- ная международная программа «Геном человека» («Human Genome Project») — это один из самых дерзновенных, дорогостоящих и потенциально важных проектов в истории цивилизации. В ядре каждой соматической клетки человека содержится 23 пары хромосом: на каждую хромосому приходится по одной молекуле ДНК. Длина всех 46 молекул ДНК в одной клетке человека равна почти 2 м, количество нуклеотидных пар составляет 6,4 млрд. Основной задачей программы является построение исчерпы- вающих генетических карт большого разрешения каждой из 24 хро- мосом человека, которое должно завершиться определением пол- ной первичной структуры ДНК всех хромосом. Для решения этой задачи возник Международный консорциум по изучению генома человека, объединивший 20 лабораторий и сотни ученых во всем мире. В случае успешного завершения программы (по плану это дол- жно произойти в 2005 г.) у человечества появятся перспективы понять механизмы функционирования каждого из его генов, прин- ципы развития организма, генетические причины многих наслед- ственных болезней и механизмы старения. Картирование генома человека Решение основной задачи программы «Геном человека» вклю- чает следующие этапы. • На первом этапе необходимо завершить составление детальной генетической карты п отметить гены, отстоящие друг от друга на расстоянии, не превышающем в среднем 2 млн оснований (1 млн оснований равен 1 мегабазс — 1 Мб, от англ, base — основание). • Второй этап предполагает составление физических карт низ- кого разрешения каждой хромосомы (разрешение 0,1 Мб). • На третьем этапе следует получить физическую карту высо- кого разрешения всего генома в виде охарактеризованных по от- дельности клонов (клон содержит 5 Кб). • Четвертый этап посвящен определению полной первичной структуры (секвенированию) всей ДНК генома человека (разре- шение — 1 основание). По плану это должно произойти к 2004 г. • На пятом, заключительном, этапе необходимо в найденных последовательностях нуклеотидов локализовать все гены организ- ма и определить их функциональное значение (к 2005 г.). Прохождение вышеперечисленных этапов требуется для полу- чения исчерпывающих характеристик не только генома человека, но и любого другого генома большого размера. 185
Генетическое картирование Генетические карты сцепления. Генетические карты сцепления определяют хромосомную принадлежность и взаимное располо- жение генетических маркеров относительно друг друга. Картиро- вание в узком смысле — определение положения гена или мута- ции в хромосоме. Позднее этот термин получил более широкое толкование. Он относится не только к гену, но к любому маркеру, под которым подразумевают ген, мутацию, участок ДНК с нео- пределенной функцией, точку расщепления ДНК рсстриктазами. Таким образом, маркер — это любой наследуемый признак, до- ступный идентификации тем или иным способом. Установление локализации какого-либо маркера позволяет использовать его для определения положения другого маркера. Маркеры, выбранные для картирования, должны быть поли- морфными, т.е. должны существовать альтернативные формы при- знака, которые можно было бы легко отличить и описать у членов семьи. В последовательности ДНК варьирует (т.е. полиморфен) в среднем один из 300 — 500 нуклеотидов. Мутации в экзонах могут приводить к видимым изменениям — различию в цвете волос и глаз, группе крови, особенностях строения тела, деятельности физиологических систем, подверженности болезням и т.п. Мута- ции в интронах имеют минимальный эффект или нс имеют его вообще. В то же время эти изменения легко определяются на уров- не ДНК и могут использоваться как маркеры. Среди маркеров та- кого типа — ПДРФ (полиморфизм длин рестрикционных фраг- ментов) — изменение последовательности ДНК в сайтах ре- стрикции; различия в числе тандемных повторов, что приводит к различиям по длине ДНК, которую можно легко определить. Воз- можность построения генетических карт сцепления обусловлена двумя фундаментальными характеристиками генома: линейным характером локализации генов в хромосоме (это определяется линейностью молекулы ДНК) и относительной стабильностью расположения облигатных (обязательных) элементов генома в пределах вида. Термин «сцепление» употребляется в генетике для обозначения вероятности совместной передачи двух признаков от одного из родителей потомству. Генетические признаки, локализованные в разных хромосо- мах, нс сцеплены друг с другом, т.е. передаются от родителей детям независимо. Гены, локализованные в одной хромосоме, рекомбинируют за счет кроссинговера, за счет обмена участками гомологичных хромосом в процессе их спаривания при мейозе. Вероятность кроссинговера между двумя генами зависит от рас- стояния между ними. Чем ближе гены расположены друг к лру1у, т.е. чем больше они сцеплены, тем эта вероятность меньше. На генетических картах сцепления расстояние между маркерами оп- 186
редсляется в санти моргав идах (сМ). Когда частота рекомбинации между двумя маркерами равна 1 %, это значит, что они находятся на расстоянии 1 сМ. Генетическое расстояние в 1 сМ примерно равно физической протяженности в 1 млн н.п. — 1 Мб. Общая длина генома человека в этих единицах составляет около 3300 сМ. Генетические карты сцепления правильно отражают порядок рас- положения генетических маркеров на хромосомах, но значения расстоянии между ними приблизительны и не соответствуют ре- альным физическим расстояниям. Этот факт связывают с тем, что эффективность рекомбинации на отдельных участках хромосом может сильно различаться. Существуют так называемые «горячие» точки рекомбинации и районы генома, где рекомбинация подав- лена (центромерные, теломерные и гетерохроматиновые участки хромосом). Кроме того, частота рекомбинации у мужчин меньше, чем у женщин, так что общая /типа мужского генома, измерен- ная в единицах рекомбинации, составляет лишь 3000 сМ. Таким образом, генетические карты сцепления являются наименее точ- ными и дают весьма ориентировочную информацию о реальном расстоянии, выражаемом в парах нуклеотидов. Тем не менее на практике именно они и только они позволяют локализовать слож- ные генетические маркеры (например, ассоциированные с симп- томами заболевания) на первых этапах исследования и дают воз- можность их дальнейшего изучения. До начала 70-х годов XX в. построение генетических карт че- ловека продвигалось очень медленными темпами. Первый ген че- ловека (геп цветной слепоты) был картирован на Х-хромосоме в 191 1 г., а первый аутосомный ген — только в 1968 г. К 1973 г. на хромосомах человека было картировано 64 гена, а к 1994 г. — 5000 структурных генов и свыше 60000 маркерных Д И К-послсдо- вателыюстей. Столь стремительный прогресс в картировании ге- нов человека связан с появлением новых технологий в цитогенети- ке. в клеточных культурах и особенно в молекулярной генетике. Гибридизация соматических клеток. Одним из наиболее попу- лярных методов отнесения генетического маркера (функционально активного гена) к конкретной группе сцепления является гибри- дизация (слияние друг с другом) соматических клеток разных био- логических видов организмов, один из которых — исследуемый. Гибридные клоны получают путем искусственного слияния клеток человека и различных грызунов: китайского хомячка, мыши, крысы. Культивирование таких соматических гибридов, как оказалось, сопровождается утратой хромосом человека. Потеря хромосом но- сит случайный характер, и образующиеся клоны клеток содержат оставшиеся хромосомы в разных сочетаниях. Так получают панели гибридных клеточных клопов, содержащих всего одну или несколь- ко хромосом человека и полный набор хромосом другого вида. Обнаружение человеческих белков, специфических мРНК или пос- 187
ледовательпостсй ДНК в таких клопах позволяет однозначно оп- ределить хромосомную принадлежность соответствующих генов. Гибридизация in situ. Этот метол дает возможность локализовать определенные последовательности нуклеотидов на хромосомах. Они выступают в качестве зондов. Препараты фиксированных хромо- сом гибридизуют с исследуемыми последовательностями, мечен- ными радиоактивной или флуоресцентной меткой. Меченые мо- лекулы оказываются ассоциированными с участками хромосом, содержащими последовательности, комплементарные меченому зонду. Полученные гибриды анализируют с помощью микроскопа либо непосредственно, либо после радиоавтографии. Этот метод по частоте использования в последнее время прочно выходит на первое место. Наиболее популярной оказалась группа методов, получивших название флуоресцентной гибридизации in situ — метод FISH (от англ, fluorescence in situ hybridization). Полимеразная цепная реакция (ПЦР) позволила быстро и эф- фективно амплифицировать почти любой участок генома челове- ка, а полученные продукты ПЦР использовать в качестве зондов для картирования соответствующих участков на хромосомах путем гибридизации in situ. В этом плане успешно разработана концеп- ция сайтов, привязанных к последовательностям, — STS (от англ. sequence-tagged sites). Все фрагменты ДНК, которые используются для построения генетических и физических карт, можно однознач- но идентифицировать с помощью последовательности нуклеоти- дов длиной в 200 — 500 п.п., которая является уникальной для данного фрагмента. Эти сайты амплифицируют с помощью ПЦР и применяют в качестве зондов. STS позволили создать основу для разработки единого языка, дающего возможность разным лабора- ториям описать свои клоны. Конечным результатом разработки концепции STS является создание исчерпывающей карты STS ге- нома человека. Дчя получения маркеров в настоящее время часто применяют праймеры, соответствующие диспергированным по- вторяющимся последовательностям, среди которых первыми ста- ли использовать Alu-последовательности, так как они характерны именно для генома человека. Поскольку в геноме человека больше 90% умеренно повторяющихся последовательностей представле- ны семействами Ahi и Кри 1 (последние повторяются реже и об- ладают характерной локализацией в хромосомах), они и исполь- зуются для получения соответствующих зондов в ПЦР-реакции. Физические карты низкого разрешения. Физические карты ге- нома отражают реальное расстояние между маркерами, выражае- мое в парах нуклеотидов. Физическую карту низкого разрешения часто называют хромосомной (цитогенетической) картой генома. В начале 70-х годов XX в. появилась реальная возможность точ- ной идентификации не только всех хромосом в кариотипе челове- ка, нод их отдельных сегментов. Это связано с появлением мето- 188
да дифференциального окрашивания препаратов метафазных хро- мосом. Хромосомные препараты окрашивают некоторыми флуо- рохромами после соответствующей протеолитической обработки или нагревания. При этом на хромосомах выявляется характерная поперечная исчерченность — так называемые диски (бэпды), рас- положение которых специфично для каждой хромосомы. Величи- на небольших дисков на прометафазных хромосомах соответству- ет примерно 1 млн н.п. на физических картах. Каждая хромосома после дифференциальной окраски может быть разделена на сег- менты, нумерация которых начинается от центромерного райо- на вверх (короткое плечо р) либо вниз (длинное плечо — q) (рис. 100). Полосы в каждом сегменте также пронумерованы в ана- логичном порядке. Запись положения гена на карте включает но- мер хромосомы, плечо, номер сегмента, бэнда и его субъединицы. 21 Синдром фон Хиппеля—Линдау Резистентность к тиреоидному гормону Мелкоклеточная карцинома легких Псевдосиндром Целльвегера GM 1 -ганглиозидоз Синдром Моркио, тип В Пузырчатый дистрофический эпидермолиз Карцинома клеток печени Недостаточность белка S Гемолитическая анемия в результате недостаточности глутатионпсроксидазы Болезнь Rh-ноль (резус-отрицательность) Оротикацидурия ---- Пропионацидсмня, рссВ-тип Атрансферрииемия [Гипоцерулонлазминемия наследственная] Пигментный рстинит-5 Постанестезнчсская одышка Непереносимость сахарозы Блефарофимоз, обратный эпика! поз и птоз Тромбофилия в результате избытка HRG Недостаточность тиротропинвысвобождающсго гормона Рис. 100. Генетическая карта 3-й хромосомы человека 189
Запись Iql 1.1 означает, что ген локализован в субъединице 1-го бэнда 2-го сегмента длинного плеча хромосомы 7. Подобная за- пись удобна для цитогенетического картирования метода гибри- дизации in situ, позволяющего локализовать ген с точностью до одного бэнда и даже его субъединицы. Хромосомные карты генома человека получают также локали- зацией генетических маркеров, чаще всего методом FISH: для мстафазнььх хромосом разрешающая способность хромосомных карт находится в пределах 2 — 5 млн н.п.; для интерфазных хромосом (генетический материал находится в менее компактной форме) — приближается к 100 тыс. н.п. Для этого уровня картирования ха- рактерны карты кДНК (с. 358). Они отражают положение экспрес- сирующихся участков ДНК (экзонов) относительно известных ци- тогенетических маркеров (бэндов) на метафазных хромосомах. Поскольку такие карты дают представление о локализации транс- крибирующихся участков генома, в том числе и генов с неизве- стными функциями, они могут быть использованы для поиска новых генов. Этот подход полезен при поиске генов, повреждение которых вызывает заболевания человека, в том случае, если при- близительная локализация таких участков хромосом уже проведе- на на генетических картах сцепления (см. рис. 100). Физические карты высокого разрешения. Для построения физи- ческих карт высокого разрешения экспериментально реализуется два альтернативных подхода: картирование сверху вниз и карти- рование снизу вверх (рис. 101). Дня картирования сверху вниз пре- парат ДНК индивидуальной хромосомы человека разрезают круп- нощепящнми рестриктазами (например, Not 1) на длинные фраг- менты, которые после разделения методом электрофореза в пуль- сирующем поле подвергаются дальнейшей обработке другими ре- стриктазами. Методом электрофореза под действием однонаправленного постоян- ного ноля в агарозном или полиакриламидном гелях удастся разделить фрагменты ДНК размером нс более 30 —50 тыс. н.п. Продвижение боль- ших фрагментов ДНК в геле при пульсирующем изменении направле- ния электрического поля происходит за счет конформационных измене- ний, обусловленных скручиванием и раскручиванием молекул ДНК в момент переключения направления поля. В этом случае удается разделить молекулы ДНК размером от 50 тыс. н.п. до 10 млн н.п.). В результате получаютмакрорестрикциониую карту. Метод элек- трофореза был с успехом использован для картирования малых геномов. Для картирования генома человека снизу вверх на основе пре- парата суммарной ДНК генома или индивидуальной хромосомы получают серию случайных клонов протяженных последователь- ностей ДНК (10—1000 тыс. п.п.), часть из которых перекрывает- 190
Хромосома но подетальная) Б Ген или полиморфизм Генетическая | карта "О-------- Карта контиг (подробная, но неполная) Контиг Ген или полиморфизм Фрагменты рестрикации Упорядоченная —______________________— библиотека Последовательность „........„.„„и,,,... оснований Рис. 101. Стратегия физического картирования генома (А) и типы карт генома (Б) ся друг с другом. В качестве вектора для клонирования в этом слу- чае используют искусственные минпхромосомы дрожжей (YAC). Последовательный набор клонов, содержащих частично перекры- вающиеся и дополняющие друг друга фрагменты ДНК из опреде- ленного района генома, получил название скользящего зондирова- ния, или «прогулки по хромосоме». Каждый раз отобранный фраг- мент используется в качестве ДНК-зонда для последующего по- иска. В результате получают набор клонированных фрагментов ДНК, полностью перекрывающих исследуемый участок генома, полу- чивший название «контиг». Эта стратегия впервые была успешно применена для изучения 3-й хромосомы дрозофилы. С се помо- щью редко удается пройти более 200 — 300 тыс. н.п. в одном на- правлении из-за наличия в геноме повторяющихся и трудно кло- нируемых последовательностей ДНК. Для преодоления таких ог- раничений и ускорения процесса поиска генных последователь- ностей Ф. Коллинз, ныне президент Международного консорци- ума, предложил метод «прыжков» по хромосоме, позволяющий изолировать фрагменты ДНК, отстоящие в геноме друг от друга на сотни тысяч пар нуклеотидов (длина прыжка), не выделяя при этом все промежуточные последовательности ДНК. 191
Правильность полученных контигов подтверждают обычно гиб- ридизацией in situ (FISH) с одновременной привязкой к опреде- ленным участкам исследуемых хромосом. Определение нуклеотидной последовательности генома человека. Исчерпывающая физическая карта генома человека должна пред- ставлять собой полную последовательность нуклеотидов ДНК всех его хромосом. К решению такой грандиозной по объему задачи привлечены многие хорошо финансируемые лаборатории в раз- ных странах мира, оснащенные автоматическими высокопроиз- водительными секвенаторами. Секвенирование начинается с субклонировапия небольших рестрикционных фрагментов ДНК, образующихся в результате рестрикции предварительно клонированных более крупных фраг- ментов, и первичная структура коротких фрагментов определяет- ся, как правило, методом полимеразного копирования с исполь- зованием терминирующих аналогов (Ф. Сангером, см. с. 380). Сред- няя скорость секвенирования к концу 1998 г. составляла 90 Мб. Сейчас анализу чаще подвергают продукты ПЦР, а не клониро- ванные фрагменты ДНК. Уже разработаны и внедрены гигантские автоматические фабрики по секвенированию генома — геномо- троны (секвенаторы-роботы), производящие до 10’ полимеразных цепных реакций в час и ссквенирующие несколько миллионов нуклеотидов в неделю. Ожидается, что внедрение технологий тре- тьего поколения, среди которых флуоресцентное детектирование отдельных меченых оснований в проточных цитофотометрах, пря- мое чтение оснований в последовательностях ДНК с использова- нием сканирующих туннельных микроскопов, прямой масс-спек- тромстрический анализ последовательностей ДНК, гибридизация изучаемых высокомолекулярных фрагментов ДНК с панелями (ДНК-чипами) коротких фрагментов ДНК, позволит секвениро- вать по 500 Мб в год. Необходимо иметь в виду, что длина ДНК самой маленькой, Y-хромосомы человека, составляет 50 Мб, са- мой большой (хромосома 1) — 300 Мб. Эти цифры наглядно де- монстрируют масштабы задачи, которую предстоит решить. После определения первичной структуры генома человека нуж- ны будут долгие годы для ее обработки. Одна только запись всей последовательности нуклеотидов генома человека обычным шриф- том потребует около 200 томов книг по 1000 страниц каждая. Хра- нение и анализ такого объема информации влечет за собой необ- ходимость создания уникальных алгоритмов обработки информа- ции с помощью вычислительной техники. Крупнейшей базой данных по структуре генома человека в на- стоящее время является GDB (Genome Data Base), созданная и поддерживаемая в университете Дж. Гопкинса (Балтимор, США). Кроме известных последовательностей нуклеотидов генома чело- века в ней хранится вся полученная информация о генетических 192
маркерах, зондах и контигах, ассоциированных с генетическими заболеваниями. Четыре других базы данных хранят все известные последова- тельности нуклеотидов, включая последовательности нуклеоти- дов генома человека: Gen Bank и Genome Sequence Data Base (GSDB) в США; European Molecular Biology Laboratory (EMBL) Nucleotide Sequence Database в Великобритании; DNA Data Bank of Japan (DDBJ) в Японии. В России Институтом молекулярной биологии им. В. А. Энгельгардта поддерживается аналогичная база данных по геному человека (Hugene). Структура генома человека (по данным секвенирования на 2001 г.) Начиная с 1998 г. работы по секвенированию генома человека проводят параллельно Международный консорциум и частная коммерческая компания Цслера Геномике (Cetera Genomics, пре- зидент Крейг Вентор). В феврале 2001 г. были опубликованы две предварительные версии структуры генома человека*. Описание генома человека пока что не отличается высокой точностью, но уже сейчас можно сделать ряд важных заключений. Большое зна- чение приобретает сравнение генома человека с отсеквенирован- ными геномами четырех других эукариотических организмов — дрожжей, круглого червя, плодовой мушки п растения. На основе компьютерных алгоритмов, построенных на совре- менных представлениях об общей структуре гена и о белковых доменах, было рассчитано количество генов, кодирующих белки в геноме человека. Международный консорциум определил 31 780 белок-кодцрующих генов, а фирма Целера Геномике обнаружила 39 114 таких генов (табл. 15). Эти величины являются предварительными, и они много мень- ше рапсе постулированного числа белок-кодирусмых генов, ко- торое оценивалось в 100 000—140 000. Отмечается более низкая плотность белок-кодирующих генов в геноме человека. Показано, что типичный ген человека состоит примерно из 28 000 н.п. и имеет 8 экзонов, его кодирующая последователь- ность 1340 н.п., этот ген кодирует 447 аминокислот. Самым большим геном, найденным в геноме человека, явля- ется геи мышечного белка дистрофина (2,4 106 и. п.). Фибрилляр- ный белок титип, ответственный за пассивную эластичность ске- летных мышц, состоит из 27 000 аминокислотных остатков. Его * Ventor J.C., Adams M.D., Mvers Е. W. el al. The sequence of ihc human genome // Science. 2001. - V. 291. - № 5507. - P. 1304- 1351. The International Human Genome Sequencing Consortium. The Human Genome: Initial Sequencing and Analysis // Nature. 2001. — V. 409. — P. 806 — 921. 7 KniiH’icn 193
Таблица 15 Количество и плотность генов в пяти отсеквенированных эукариотических геномах Организм Количество отсеквспироваи- Ш11Х основании, тыс. н. п. Степень закончен- ности, % Количество предсказан- ных генов Количество генов па I06 оснований Дрожжи (5. cerevislae) 12 068 93 5885 483 Круглый червь (С. elegans) 97 000 99 19 099 197 Плодовая мушка (D. melanogaster) 116 000 64 13 601 117 Растение (/1. ihaliana) 115 000 92 25 498 221 Человек (//. sapiens) (консорциум) 2 693 000 84 31 780 12 Человек (//. sapiens) (Cetera) 2 654 000 S3 39 114 15 ген содержит 234 экзона. Эго наибольшее количество экзонов, пока найденное в белок-кодирующих генах человека. Структура п орга- низация генов человека много сложнее, чем структура генов дру- гих эукариот. Очень часто они прерываются большими интрона- ми, 35 % генов человека могут считываться с разных рамок, а 40% РНК подвергаются альтернативному сплайсингу. Таким об- разом, одна последовательность ДНК может кодировать более одного вида мРНК. По сравнению с геномами других эукариотических организмов у человека большее распространение получили гены, участвую- щие в обеспечении иммунной зашиты; в развитии нервной систе- мы (нейротрофические факторы, факторы роста нервов), сигналь- ных молекул, миелиновых белков, потенциал-управлясмых ион- ных каналов и синаптических рецепторных белков; в построении цитоскелета и движении везикул, обеспечении внутри- и меж- клеточной! сигнализации, поддержании гомеостаза. У человека зна- чительно большее количество генов участвует в транскрипции и трансляции. Из 2000 таких генов 900 относятся к семейству бел- ков, содержащих «цинковые пальцы». В геноме человека число генов, кодирующих белки, всего в 2 раза больше числа генов в геноме червя, мушки, растения. Это обу- словлено возникновением у человека большого числа новых бел- 194
ков. Существует предположение, что Н. sapiens не «изобрел» но- вые гены, а использовал существующие структурные домены, собирая из них новые белки с новыми функциями. Геном челове- ка кодирует больше паралогов и многодомспных белков с боль- шим разнообразием функций и архитектуры доменов по сравне- нию с геномами других эукариот. В целом на долю генов, кодирующих белки, приходится 2 % генома; на области, кодирующие РНК, — около 20% генома, повторяющиеся последовательности занимают более 50% гено- ма, причем значительная часть этой ДНК возникла за счет обрат- ной транскрипции РНК. Клонирование некоторых повторяющихся областей представля- ет большие трудности, а порой вообще невозможно. Это характер- но для 12 % генома человека. До 10 % генома человека составляют повторяющиеся элементы, по своему строению напоминающие интегрированную форму инфекционных ретровирусов птиц и мле- копитающих. Число обнаруженных семейств эндогенных ретрови- русов в геноме человека достигло 30 и продолжает расти. Пока их биологическая роль в геноме человека неизвестна. Крайне интерес- но, что у обезьян эндогенных вирусов намного меньше или нет вообще. Получается, что по чужеродным элементам генома чело- век и обезьяна различаются гораздо сильнее, чем по самим гено- мам. Это дало основание одному из известных исследователей генома академику Е. Д. Свердлову высказать мысль о том, что виру- сы могли сыграть важную роль в «очеловечивании» обезьяны. В свя- зи с этим такая древняя и постоянно привлекающая внимание проблема происхождения человека получила новое звучание. • Идентифицированы гены практически всех наиболее часто встречающихся (примерно 320) и сравнительно редких (около 170) наследственных заболеваний, 30 рецессивных и более 100 доми- нантных онкогенов. Тем не менее сегодня еще нельзя исключить вероятность того, что дополнительные гены располагаются в не- отсеквенированпых до сих пор областях генома. Международный консорциум 14 апреля 2003 г. сообщил, что расшифровано 99,99 % генома человека. Количество генов, вовлеченных в развитие на- следственных заболеваний, — 1400. Исследование структуры генома ряда прокариот и эукариот, и человека в частности, способствовало созданию науки о геномах — геномики. В нее включают изучение геномов на молекулярном, хро- мосомном, биохимическом и фенотипическом уровнях. На рис. 102 представлена схема, поясняющая взаимоотношения между гено- микой человека и другими научными направлениями в современ- ной биологии. Структурная и сравнительная геномика через био- информатику переходит в новый раздел — функциональную ге- номику, главной задачей которой является выяснение биологи- ческих функций генных продуктов и в первую очередь белков. 195
ГЕНОМИКА бактерий, дрожжей, нематоды, дрозофилы, мыши Геномика растений -•— ГЕНОМИКА ЧЕЛОВЕКА —► Теория эволюции Медицинская генетика I Генодиаптостика Гснопрогностика Популяционная генетика Этнография История человечества Лингвистика Функциональная геномика Клеточная биология Биология развития Генотерапия Гснопрофилактика Рис. 102. Схема, поясняющая взаимоотношения между геномикой чело- века н другими научными направлениями У многих современных исследователей, работающих в области геномики, ист сомнений, что первое десятилетие XXI в. будет эрой функциональной геномики и биоинформатики. В сети Интернет можно найти большое число адресов, содержащих разнообразную информацию, касающуюся генома человека: http://www.nhgri.iHh.gov http://gcnlink.wusil.edu http://www.gcnclettcr.org http://www. h hm i. org http://www.mpimg-berlin-dahlcm.inpg.de/~cytogcn http://ftp.tigr.org http://canccrnct.nci.nih.gov/ord/indcx http://www. wilcy.co.uk/gcnctherapy http://www.gcnom.gov. ГЕНОМЫ ОРГАНЕЛЛ ЭУКАРИОТ: ДНК МИТОХОНДРИЙ И ХЛОРОПЛАСТОВ Существуют два типа цитоплазматических ДНК: одни находят- ся в митохондриях эукариот, другие — в хлоропластах зеленых растений и водорослей. Как и все цитоплазматические элементы, они наследуются по материнской линии, а нс по законам Менделя. Большая часть белков этих органелл, закодированная в ядерной ДНК, синтезируется в цитоплазме и затем переходит в органеллу. Однако некоторые белки митохондрий и хлоропластов и все их РНК кодируются в ДНК самих органелл и в них же синтезируют- ся. Таким образом, органеллы — это результат объединенных уси- 196
Таблица 16 Геном органелл Тип ДПК Размер, тыс. и. п. ДНК митохондрий Простейшие Грибы Высшие растения Животные (включая плоских червей, насекомых и млекопитающих) ДПК хлороиластов Chlaniydomonas (зеленая водоросль) Высшие растения 22-40 17-78 150—2500 16-20 180 120-200 лнй двух геномов и двух трансляционных аппаратов. РНК-компо- ненты рибосом органелл, а также тРНК, использующиеся при трансляции, кодируются геномами митохондрий и хлоропластов. Размеры генома хлоропластов у всех исследованных организ- мов сходны, тогда как митохондриальные геномы у растений на- много больше, чем у животных (табл. 16). Все митохондрии и хлоропласты содержат по несколько копий собственной геномной ДНК. Эти молекулы ДНК обычно распре- делены в виде отдельных групп в матриксе митохондрий и в стро- ме хлоропластов, где они прикреплены к внутренней мембране. Способ упаковки ДНК неизвестен. По структуре геном более схо- ден с бактериальным геномом: например, как и у бактерий, у них нет гистонов. Геномы митохондрии В клетках млекопитающих митохондриальная ДНК составляет меньше 1 % всей клеточной ДНК. В клетках других организмов — в листьях высших растений или в очень крупных яйцах амфибий и др. — доля ДНК энергетических органелл, особенно в последнем случае, может достигать 99 % всей ДНК клетки. Многие митохондриальные геномы представляют собой замк- нутые кольцевые сверхспиральные дуплексные ДНК. Большин- ство из них кодируют сходные функции. Сделать еще какие-то обобщения относительно митохондриальных ДНК пока довольно трудно. Иногда даже близкородственные виды имеют совершенно разные рестриктпыс карты и лишь частично совпадающие нукле- отидные последовательности. Расположение гомологичных генов в кольцевой ДНК также различается. Иногда у отдельного расте- ния присутствуют митохондриальные геномы разных размеров, и 197
представлены они как линейными, так и кольцевыми молекула- ми. Митохондрии некоторых грибов и простейших имеют линей- ные геномы. Все митохондриальные ДНК не метилированы. В очень крупных митохондриальных геномах подавляющую долю избыточной ДНК составляют некодирующие последовательности с неизвестной фун- кцией. Напротив, митохондриальные ДНК млекопитающих орга- низованы рационально, и между генами почти нет промежутков. К настоящему времени ДНК митохондрий секвснирована бо- лее чем у 20 видов простейших, дрожжей, растений маршанции и арабидопсиса, у человека. Обнаружилось, что сходные но после- довательности нуклеотидов участки иногда выполняют различные функции. Первым полностью расшифрованным геномом органелл оказался митохондриальный геном человека. В 1981 г. была опуб- ликована полная последовательность этого генома, состоящая из 16 569 пар нуклеотидов. Геном митохондрий человека представлен одной кольцевой молекулой ДНК, ее можно разделить на две оди- наковые цепи — тяжелую, которая называется Н-цепыо, и легкую L-цепь, различающиеся по своей плавучей плотности (рис. 103). Геном митохондрий человека кодирует 13 белков, 22 (все) транспортные РНК, две рибосомные РНК. Большинство (60%) генов, кодирующих белки, приходятся на 7 субъединиц комплек- са, окисляющего НАДН, остальные гены колируют 2 субъедини- цы АТФ-сиптазы, 3 субъединицы цитохромоксидазы, одну субъ- единицу убихинон-цитохром с-редуктазы (цитохром Ь). Гены всех белков, кроме одного, гены 2 рибосомных и 6 тРНК находятся на более тяжелой цепи ДНК (изображена на рис. 103 снаружи), гены 14 других тРНК и одного белка — на легкой цепи (на рис. 103 изображена внутри). Определены также полные последователь- ности молекул ДНК митохондриальных геномов коровы и мыши, которые содержат те же гены и организованы сходным образом. В геноме митохондрий человека практически каждый нуклеотид входит в состав кодирующей последовательности либо для белка, либо рРНК или тРНК. Поскольку эти кодирующие последова- тельности переходят непосредственно одна в другую, для регуля- торных последовательностей ДНК остается очень мало места. Про- межутки между генами, как правило, не превышают 25 н.н. и в большинстве случаев составляют менее 3 н.п. и иногда перекры- ваются (например, ген тРНК"10, тРНКглу и гены АТФ-сиитазных субъединиц 6 и 8). Митохондриальная ДНК дрожжей и человека содержит примерно равное число генов, но у дрожжей она больше почти в 5 раз — около 80 тыс. н.п. Основная ее часть приходится на долю АТ-бога- тых участков с неизвестной функцией, а также интронов, кото- рые прерывают кодирующие участки и отсутствуют в митохонд- риальных ДНК млекопитающих. Различия в структуре митохонд- 198
ND5 I6S рРНК тРНК' тРНКсТ тРНК™0 ND4 ND4L тРНК3₽г ND3 I2S рРНК тРНК33’1 тРНК1ре тРН1<Поп(Н) тРНКфзн тРНКлсй ND1 4000 16 569 и.п. АТРиав трн|<лиз соп трнК‘ тРНК“''1е тРНКгл" тРНК*-**" ND2 тРНК™ coin тРНКглу ND6 трнк1’1" тРНК"13 тРНКас" ori(L) тРНКш,с тРНК™р СО1 Рис. 103. Митохондриальная ДНК человека. Обозначены гены, кодирующие субъединицы НАДН-дсгидрогеиазного комп- лекса (ND), субъединицы цптохром-е-оксидазы (СО1. СОИ. СОШ), цитохром b (пит. Ь), субъединицы 6 и 8 ATl’-сиитазы (АТРаза 6 и АТРаза 8), кодирующие рРНК (12SpPHK и 16SpPllK): кодирующие тРНК; оп (11) и ori (к)-сайты ини- циации репликации тяжелой и легкой цепей ДНК. Точки внутри круга обознача- ют сайты инициации транскрипции. Маленькие стрелки указывают 5’-»3’-иа- правлепис смысловой цепи в различных генах риальной ДНК у разных штаммов дрожжей определяются в ос- новном изменчивостью некодирующих участков. Количество митохондрий в растительной клетке составляет от 50 до 2000, и каждая митохондрия содержит от 1 до 100 копий генома. Геном митохондрий растений значительно больше генома митохондрий животных. У арабидопсиса (сем. крестоцветных) ми- тохондриальный геном содержит 370 тыс. н.п., т.с. в 20 раз боль- ше, чем геном митохондрий человека. Размер митохондриального генома растений сильно варьирует даже внутри одного семейства иногда в 5 — 10 раз. Так, в семействе тыквенных у арбуза в ДНК митохондрий содержится 330 тыс. н.п., у тыквы — 850 тыс. и.п., а у дыни — 2400 тыс. н. п. 199
В настоящее время полностью секвенирована последователь- ность митохондриального генома печеночника маршанции, за- вершена работа по секвенированию митохондриального генома арабидопсиса. Митохондриальный геном растений кодирует три рибосомные РНК, 16 тРНК, около 10 рибосомальных белков, некоторые белки дыхательной цепи, 3 субъединицы АТФ-синта- зы, четыре белка, участвующих в синтезе цитохрома с. Большая вариабельность размера молекул ДНК, их множественность в ми- тохондриях высших растений связана с рекомбиногенной приро- дой самого генома у этих объектов. Множество молекул ДНК об- разовалось в результате рекомбинаций между повторяющимися последовательностями и их рекомбиногенпыми перестановками. Часть последовательностей имеет ядерное и даже хлоропластное происхождение. Рекомбинации и мутации митохондриальной ДНК ведут к цитоплазматической мужской стерильности, вызывая на- рушения созревания пыльцевых трубок. Репликация митохондриальной ДНК Репликация митохондриальной ДНК не связана с клеточным циклом. Каждая из цепей дуплексной молекулы ДНК митохонд- рий имеет свою точку начала репликации (точка ori на рис. 103). Репликация ДНК в митохондриях человека однопаправленпа и асинхронна, что обусловливается различной локализацией точек инициации репликации. Сначала инициируется репликация Н-цепи ДНК, а синтез L-цспи — только после того, как синтезируется около 67 % Н-цепи. В дрожжевой митохондриальной ДНК имеется семь и более мест начала репликации, рассеянных по всему геному; каждое из таких мест содержит зри коротких GC-богатых сегмента, разделенных дву- мя длинными участками, почти целиком состоящими из АТ-нар. Синтез митохондриальной ДНК осуществляется при участии ДНК-полимеразы у. Сведения о других ферментах и белковых фак- торах, участвующих в репликации митохондриальной ДНК, от- сутствуют. Полиморфизм митохондриальной ДНК и эволюция человека Уникальным свойством митохондриальной ДНК человека, как и других позвоночных, является наследование ее по материн- ской линии, что было продемонстрировано с помощью семейно- го анализа. Возникновение мутаций в одной из молекул митохондриаль- ной ДНК создает внутриклеточную смесь мутантных и нормаль- ных молекул — состояние, известное как гетероплазмия. После- 200
довательиые деления гетероплазмической клетки сдвигают соот- ношение мутантных и нормальных митохондриальных ДНК либо к чисто мутантным, либо к нормальным (гомоплазмия) молеку- лам ДНК. Несмотря на то что гетероплазмия в настоящее время — единственный механизм формирования разнообразия митохонд- риальных геномов, молекулярные основы поддержания состоя- ния гетероплазмии остаются невыясненными. Высокая скорость эволюции митохондриальной ДНК в 10 — 20 раз больше, чем у ядерных генов, и это повышает частоту ее мутаций. Из-за отсут- ствия систем репарации и измененного генетического кода (в боль- шинстве случаев замены оснований в третьем положении кодо- нов не отражаются на аминокислотных последовательностях бел- ков) мутации фиксируются с большей вероятностью. Высокая скорость накопления мутаций в митохондриальной ДНК наряду с отсутствием рекомбинационных процессов является крайне важ- ным свойством, которое позволяет использовать митохондриаль- ную ДНК в эволюционных н популяционно-генетических иссле- дованиях. Вариабельность нуклеотидной последовательности митохонд- риальной ДНК человека наибольшая в районе главной некодиру- ющей области (контрольного региона), где находятся все струк- туры, ответственные за инициацию и регуляцию процессов транс- крипции и репликации, точка ori для тяжелой цепи, промоторы транскрипции обеих цепей митохондриальной ДНК, сайты свя- зывания транскрипционных факторов. Вариабельность этого рай- она обусловлена преимущественно нуклеотидными заменами и короткими делениями или инсерцпями. У человека, как и других млекопитающих, он состоит из трех доменов, различающихся по степени вариабельности и насыщенности функциональными эле- ментами. Наиболее вариабельной частью контрольного региона мтДНК является домен, расположенный между позициями 16 024— 16400 н.п., получивший название гипервариабельного сегмента I митохондриальной ДНК. Из-за высокого уровня изменчивости имен- но этого сегмента контрольного региона митохондриальная ДНК наиболее часто используется в эволюционных исследованиях. К настоящему времени исследования полиморфизма мтДНК выполнены во многих этнических группах человека. Полученные данные о генетической дифференциации современного человече- ства широко используются для установления родства между этно- сами и реконструкции расогенстических процессов. Исследования вариабельности мтДНК продемонстрировали вы- сокий уровень митохондриального генофонда и наличие корреля- ций между типами мтДНК и этногеографическим происхождени- ем индивидуумов. Согласно полученным данным, максимальное разнообразие типов митохондриальной ДНК было зафиксирова- но в популяциях негроидов. С помощью филогенетического ана- 201
лиза было установлено, что все типы этой ДНК человека являют- ся ветвями одного дерева, причем корневые типы его характерны для современных негроидов, что, по сути, является подтвержде- нием гипотезы об африканском происхождении современного человека. ДНК хлоропластов Хлоропластная ДНК (хлДНК) представляет собой замкнутую кольцевую двуспиральную молекулу. Ес размеры варьируют у раз- ных видов растений преимущественно в интервале 130—160 тыс. н.п. В настоящее время полностью расшифрована нуклеотидная последовательность хлДНК ряда видов, в том числе табака и риса. При этом обнаружены общие принципы организации хлоропласт- ной ДНК и ее консервативность (неизменность первичной струк- туры) в ходе эволюции. ХлДНК содержит около 130 генов. В ней представлены по два гена четырех типов (4,5S, 5S, 16S и 23S) рибосомальных РНК (рРНК), гены всех транспортных РНК (око- ло 30 видов), гены рибосомальных белков (около 20). Гены субъе- диниц РНК-полимеразы — фермента, осуществляющего синтез РНК на хлДНК. Хлоропластный геном кодирует около 40 белков тилакоидной мембраны, участвующих в формировании комплек- сов электротранспортной цепи. Это составляет около половины входящих в них белков. Остальные белки тилакоидной мембраны кодируются в ядре. ХлДНК содержит ген большой субъединицы ключевого фермента фотосинтеза рибулозодифосфаткарбоксила- зы (РДФК). Организация генетического аппарата хлоропластов и бактерий имеет много общего. По прокариотическому типу организованы промоторы, регулирующие начало транскрипции и локализован- ные в области 35— 10 н.п. до точки начала транскрипции, и тер- минаторы, определяющие се окончание. Вместе с тем в отличие от прокариот в хлДНК обнаружены интроны, характерные для генов эукариот. Хлоропластные рибосомы относятся к 705-типу, характерному для прокариот. Для каждого вида растений характерно определенное число хлоропластов в клетке, варьирующее у разных видов от несколь- ких единиц до величин, превышающих сотню. Число хлороплас- тов в клетке, а следовательно, их деление контролируется ядром. Так, ДНК-полнмераза, осуществляющая репликацию хлДНК, кодируется в ядре, синтезируется на 80S рибосомах цитоплазмы и затем проникает в хлоропласт, где и обеспечивает синтез ДНК. Формирование ферментативного аппарата темновых реакций фо- тосинтеза, в ходе которых происходит усвоение СО2, также нахо- дится под контролем двух геномов, ядра и хлоропласта. Большая субъединица (54 кДа) ключевого фермента цикла Кальвина — 202
Бенсона рибулозодифосфаткарбоксилазы кодируется и синтези- руется в хлоропласте, а малая (14 кДа) кодируется в ядре и син- тезируется в цитоплазме в виде предшественника, а затем прони- кает в хлоропласт, где оба полипептида образуют структуру функ- ционально активного фермента рибулозодифосфаткарбоксилазы, состоящего из 8 больших и 8 малых субъединиц. Таким образом, формирование всех важнейших структур хлоропласта зависит и от ядра, и цитоплазмы. Это объясняет невыполнимость идеи созда- ния культуры изолированных хлоропластов, где бы они самосто- ятельно размножались на питательной среде. Происхождение ДНК органелл Широко распространено мнение, что митохондрии и хлоро- пласты произошли от прокариотических эндосимбионтов, кото- рые обитали в цитоплазме предшественников эукариот. Как пола- гают, митохондриям дали начало пурпурные бактерии, а хлоро- пластам (позднее) — цианобактерии (сипезелсныс водоросли) или близкие к ним организмы. Симбионты проникли в эукариотические клетки и в ходе эво- люции потеряли свою автономность, передав большое число важ- нейших генов в ядерный геном. В результате независимая бактери- альная клетка превратилась в полуавтономную органеллу, сохра- нившую главную исходную функцию — способность к фотосин- тезу (у хлоропластов) и систему окислительного фосфорилирова- ния (у митохондрий). Хотя многие гены этих древних бактерий все еще используют- ся для синтеза белков органеллы, большая их часть по неясным причинам включилась в ядерный геном, где они кодируют фер- менты, которые сходны с бактериальными и синтезируются на рибосомах в цитоплазме, а затем переходят в органеллу. Существуют экспериментальные данные, свидетельствующие о том, что последовательности ДНК «путешествуют» между орга- неллами и ядром, а также между геномами самих органелл. Под- тверждением первого является тот факт, что две субъединицы рибулозодифосфаткарбоксилазы у простейшего Cyanophoraparadoxa кодируются неядерным геномом, входящим в состав хлороплас- топодобной структуры — цианеллы, типичной для цианобакте- рий. Однако механизмы перемещения и интеграции ДНК орга- нелл в новые геномы пока не установлены.
Глава 7. РЕПЛИКАЦИЯ ДНК Генетическая программа клеточных организмов записана в нук- леотидной последовательности ДНК. Для сохранения уникальных свойств организма необходимо точное воспроизведение этой пос- ледовательности в каждом последующем поколении. Во время де- ления клетки содержание ДНК должно удвоиться, чтобы каждая дочерняя клетка могла получить полный спектр ДНК. Так, ки- шечная палочка при образовании каждого последующего поколе- ния должна дуплицировать практически без ошибок полный ге- ном размером 4- 106 н.п., точно так же должны быть скопирова- ны почти 6 млрд н.п. в любой соматической клетке человека. Процесс удвоения родительских молекул геномной ДНК во время воспроизводства клеток живого организма получил назва- ние репликации, или репликативного синтеза ДНК. Репликация ДНК является примером матричного синтеза био- логических макромолекул. Основу хромосомы составляет одна не- прерывная двуцепочечная молекула ДНК. Во время репликации каждая из цепей родительской ДНК служит матрицей для синтеза комплементарной дочерней цепи. Положение каждого нуклеотида в строящейся цепи ДНК по правилам комплсментарности (G—С и А—Т) однозначно определяется положением соответствующего нуклеотида матрицы. Механизм происходящей при репликации ДНК химической реакции заключается в переносе остатка дсзоксирибонуклеозид- монофосфата от дсзоксирибонуклеозидтрифосфата на концевой нуклеотидный остаток растущей в процессе синтеза нуклеотид- ной цепи (рис. 104). Перенос идет па место атома Н гидроксиль- ной группы, стоящей при 3-м углеродном атоме дезоксирибозы концевого нуклеотида, и сопровождается выделением пирофосфа- та, который затем расщепляется неорганической пирофосфатазой, что делает реакцию полимеризации практически необратимой. Так как формирование нового полинуклеотида идет на поли- нуклеотид! юй матрице при непрерывном замыкании водородных связей между комплементарными пуриновыми и пиримидиновы- ми основаниями матрицы и дезоксирибонуклеозидтрифосфатов, то условием функционирования этого механизма является одно- ценочечная структура матрицы. В связи с этим существенным мо- 204
ментом в биосинтезе является расхождение биспирального поли- дезоксирибонуклеотида па одиночные полидсзоксирибонуклеотид- пые цепи, на которых осуществляется сборка комплементарных им полинуклеотидов. В итоге из одной биспиральной молекулы ДНК образуются две биспиральные молекулы ДНК, совершенно идентичные друг другу и исходной молекуле ДНК. После одного раунда репликации одна цепь в каждой из двух дочерних молекул является родительской, т.е. консервативной, а другая — синтези- рованной заново. Такой способ удвоения молекул ДНК называет- ся полуконсервативным. В 1958 г. М.Мезельсон и Ф. Сталь получили экспериментальное доказательство полуконсервативного способа репликации ДНК. БЕЛКИ И ФЕРМЕНТЫ, УЧАСТВУЮЩИЕ В РЕПЛИКАЦИИ ДНК Процесс репликации ДНК осуществляется с участием множе- ства белков, которые образуют сложный и эффективно работаю- щий репликативный комплекс. ДИК-полимеразы. Комплементарное копирование одноцепочеч- ной матрицы катализируют ДНК-зависимые ДНК-полимеразы или просто ДНК-нолимеразы. Некоторые про- и эукариотические ДНК- полимеразы получены в чистом виде, охарактеризованы их физи- ческие и ферментативные свойства. И хотя эти свойства нс совсем идентичны, механизм их катализа для всех указанных ферментов в общих чертах одинаков. Полимеризация нуклеотидов в процессе репликации происхо- дит только в одном направлении: от 5'-конца к З'-копцу (5' —»3') строящейся цепи, и синтезированная нолипуклеотщщая цепь ДНК анти параллельна по отношению к ДНК-матрице (рис. 104). ДН К-полимеразы безразличны к последовательности нуклео- тидов матрицы. ДНК синтезируется чрезвычайно быстро: скорость ее полимеризации колеблется в пределах от 50 нуклеотидов/с у эукариот до 500 нуклеотидов/с у бактерий. Нормальное размножение клеток требует высокой точности ко- пирования ДНК-матрицы, для чего существуют специальные ме- ханизмы, один из которых — механизм коррекции. ДНК-полимера- зы проверяют комплемснтарность каждого нуклеотида матрицы дважды: один раз — перед включением его в состав растущей цепи и второй раз — перед тем, как включить следующий нуклеотид. Очередная фосфодиэфир! 1ая связь в процессе репликации обра- зуется лишь в том случае, если последний (З'-концсвой) нуклео- тид синтезируемой цепи комплементарен матрице. Если же на предыдущей сталии полимеризации произошла ошибка, то реп- ликация останавливается до тех пор, пока неправильный нуклсо- 205
Матричная цепь 0=Р-0’ Рис. 104. Схема удвоения 206
Матричная цепь Синтезируемая цепь | з> 5' I молекулы ДНК при репликации 207
тид не будет удален. Для этого фермент перемещается в обратном направлении и вырезает последнее добавленное звено. Оказалось, что некоторые ДНК-полимеразы обладают наряду с полимераз- ной также 3'->5'-экзонуклеазиой активностью (см. с. 215), благо- даря которой и происходит отщепление нс спаренного с матри- цей нуклеотида синтезируемой цепи, после чего полимеризация восстанавливается. В результате такого устранения ошибок счи- тывания их уровень сводится к минимуму. Так, частота ошибоч- ных включений нуклеотидов в ДНК у кишечной палочки ие пре- вышает 10 9— 10_|() на нуклеотид за один раунд репликации. ДНК-праймаза. ДНК-полимеразы не способны инициировать синтез новых цепей ДНК, они могут лишь добавлять дезоксири- бонуклсотидные звенья к З'-концу уже имеющейся полипуклео- тндной цепи. Чтобы молекулы ДНК-полимераз могли начать син- тез ДНК, им необходима затравка, или праймер (от англ, primer — затравка), короткий олигодезоксирибонуклсотид или олигорибо- нуклеотид, комплементарный соответствующему участку ДНК- матрицы, у которого па конце имеется свободная З'-ОН-группа. Неспособность молекул ДНК-полимераз самостоятельно, без затравки начинать синтез ДНК принципиально отличает эти фер- менты от других ферментов матричного синтеза — РНК-поли- мераз. На стадии инициации репликации короткую РНК-затравку из рибонуклеозидтрифосфатов синтезирует фермент, называемый ДНК-праймазой. ДНК-праймаза может быть отдельным фермен- том (как у бактерий) или входить в качестве субъединицы в ДНК- полимеразу (как у ДНК-полимеразы а эукариот). В любом случае ираймаза — это фермент, отличный от РНК-полимсраз, которые синтезируют разнообразные клеточные РНК. После того как бу- дет синтезирован РНК-праймер, подключается ДНК-полимсраза п продолжает наращивать цепь. Новосинтезированныс цепи ДНК всегда содержат на 5'-конце несколько рибонуклеотидов: у про- кариот — от двух до пяти нуклеотидов, у эукариот их в два раза больше. В дальнейшем короткие праймеры замещаются сегмента- ми ДНК. Поскольку две цепи в молекуле ДНК антипараллельны, а ДНК- полимеразы способны наращивать полипуклеотидную цепь толь- ко в направлении 5' —>3', один и тот же фермент, ДНК-полиме- раза, не может обеспечить сборку дочерних цепей одновременно в направлениях 5'—>3' и 3'->5' в соответствии с перемещением репликативной вилки при расплетании биспиральной молекулы ДНК. Направление расплетания двойной спирали при реплика- ции совпадает с направлением синтеза ДНК лишь для одной мат- ричной цепи, в то же время оно противоположно направлению синтеза ДНК на комплементарной матрице. Это значит, что лишь на одной матричной цепи, ориентированной в направлении 3' —>5', 208
5' 3' 5' 3' Рис. 105. Синтез цепей ДНК в репликативной вилке. Направленно репликации 5'->3’. Олпа цепь (лидирующая) синтезируется как единое целое, а другая (отстающая) — короткими фрагментами (фрагменты Ока- заки), которые впоследствии соединяются с образованием непрерывной цепи синтез ДНК может проходить непрерывно. На второй матричной цепи, ориентированной в направлении 5' —>3', ДНК синтезирует- ся короткими фрагментами (1000 — 2000 нуклеотидов у прокариот и 100 — 200 нуклеотидов в реплицирующейся ДНК эукариот), на- званными фрагментами Оказаки в честь открывшего их ученого (рис. 105). Вновь образованная цепь, которая синтезируется непрерывно, получила название ведущей, или лидирующей, а другая, собирае- мая из фрагментов Оказаки, ведомой, или отстающей. Синтез каж- дого из этих фрагментов начинается с РНК-затравки. Такой меха- низм репликации называется прерывистым (или полунепрерывным'). Ведущая цепь нуждается только в одном акте инициации, а для синтеза отстающей цепи должно произойти несколько актов ини- циации. Через некоторое время РНК-затравки (праймеры) удаля- ются, бреши «застраиваются» ДНК-полимеразой и фрагменты сшиваются специальным ферментом ДНК-лигазой в одну непре- рывную отстающую цепь. ДНК-лигаза. ДНК-лигазы вирусов, бактерий, млекопитающих соединяют 5'-фосфатную и З'-гидроксильную группы нуклеоти- дов, находящихся на противоположных концах одноцепочечного разрыва в дуплексе ДНК. В результате образуется фосфодиэфир- ная связь, ликвидирующая этот разрыв (рис. 106). ДНК-лигаза Е. coli — это одиночный полипептид (мол. масса 75 000 Да). Для образования фосфодиэфир!юй связи между концами нук- леотидных цепей ДНК-лигазы используют энергию гидролиза АТР либо NAD. Реакция протекает в три стадии: I. Реакция аденилирования ДНК-лигазы. Фермент взаимодейству- ет с АТР (ДНК-лигаза фагов и млекопитающих) или NAD (ДНК- лигаза Е. coli) с образованием фермента — аденилатного произ- 209
Аденилирование (NAD*) У Е— (CH2)4NH2 « Е—(CH2)4N_Р—ОРибА + РР(пли никотинамнд- Q- мононуклеотид) Трапсадепилирование E-(CH2)4N—Р-ОРибА + i f 3’F-OH p-o i-5' i i H O' ° O' ГП б ! Г^Гн. i з’гон p-о i5' i i ‘° 6 Л-0 0 ОРибА E-(CH,).,NH, Лигирование I I З'ГОH p-0 I -v I I к.__________* | О I xp=o 0 ОРибА i i—б—।—r~r • : : II • :• I I 3'HO-P-OI-V I I 0“ I О \ / II -r AMP О-Р-0-РибА о Рис. 106. Механизм действия ДНК-лпгазы: Рпб — рибоза: А — аденин; РР — пирофосфат водного по c-NHi-группе остатка лизина полипептидной цепи с одновременным высвобождением пирофосфата (в случае АТР) или ннкотинамидмононуклеотида (в случае NAD). II. Реакция трансаденилирования. Остаток адениловой кисло ты с аденилатлигазы перебрасывается на свободную фосфатную груп- пу 5'-углеродного атома рибозы концевого нуклеотида. III. Реакция лигирования. Между сближенными активированной аденилатом 5'-фосфатной группой и З'-ОН-группой фрагмента цепи ДНК происходит образование фосфодиэфирной связи с выделением АМР. ДНК-хеликаза. Нативные ДНК биспиральны. Для осуществле- ния комплементарного копирования цепей двуцепочечиая ДНК 210
Рис. 107. ДНК-хеликазы: А — четвертичная структура гсксамериых ДНК-хеликаз: фага Т4 (/), вируса SV40 (2), Dna В Е. eoli (3); Б — схема расплетания двойной спирали ДНК-хеликазой должна постепенно раскручиваться. Раскручивание, или распле- тание, спирали происходит только в локальном участке ДНК. Эту реакцию осуществляет хеликаза — ДНК-зависимая АТРаза, ис- пользующая энергию гидролиза АТР для расплетания двойной спи- рали ДНК. Хеликазы имеют кольцевую (тороидальную) структу- ру, образованную шестью субъединицами. Такие гексамерные хе- ликазы кольцеобразной формы обнаружены у фагов, вирусов, бак- терий, архей, эукариот (рис. 107). Наружный диаметр хеликазного кольца варьируют от 12 до 14 нм. внутренний диаметр — от 2 до 4 нм. достаточный для взаимодействия как с одноцепочечной, так и с двуцепочечной ДНК. Хеликаза, движимая гидролизом АТР, однонаправленно пере- мещается по одной из цепей ДНК (вероятно, за счет ее конфор- мационных изменений), расплетая перед собой двойную спираль, в результате чего возникает «вилка» (Y) из двуцепочечного участ- ка ДНК и двух одноцепочечных ветвей (см. рис. 107). Хеликазы часто функционируют в составе комплекса, осуще- ствляющего перемещение репликативной вилки и репликацию расплетенных цепей. Белки, связывающиеся с одпоцепочечной ДНК, или SSB-белки (Single Strand Binding Proteins), обладают большим сродством с одноцепочечной ДНК вне зависимости от последовательности 211
оснований и взаимодействуют с ней по всей длине разделивших- ся нитей. SSB-бслок Е. coliпредставляет собой тетрамер (мол. мас- са 88 000 Да), характеризуется высокой степенью асимметрии мо- лекулы, преобладанием дикарбоновых аминокислот над диами- нокислотами. Белок кооперативно связывается с одноцепочечной ДНК, сохраняя ее в растянутом состоянии. Суть кооперативного способа связывания состоит в том, что связывание одной молеку- лы белка облегчает связывание другой, пока вся одноцепочечная ДНК нс будет покрыта белком SSB. Если хеликазы вызывают ло- кальное раскручивание двойной спирали, то SSB-бслки стабили- зируют одноцепочечную ДНК, обеспечивая условия для компле- ментарного спаривания. SSB-белки удаляют возможные элементы вторичной структуры ДНК; связывание одноцепочечной ДНК с SSB-бслками стимулирует ДНК-полимеразу и повышает точность се работы. У эукариот таковым белком является ядерный реплика- тивный белок A (RPA), представляющий гетеротример с субъе- диницами 70, 32 —34 и 11 — 14 кДа. Топологические проблемы репликации ДНК рассмотрены в гл. 3 (с. 95) Начало репликации. Молекула ДНК, способная к автономной репликации, получила названиерепликона. Репликон содержит все необходимые гены и регуляторные последовательности, которые обеспечивают регулируемое удвоение его ДНК. Участок реплико- на, в котором начинается репликация, называется репликатором, или областью начала репликации (англ, replication origin), у Е. coli — ori С. При инициации репликации инициатор, кодируемый репли- коном (у Е. coli — белок Dna А), взаимодействуете репликатором. Целая хромосома Е. со//является репликоном; у эукариот репли- коном называют отрезок ДНК, репликация которого протекает под контролем единственной точки начала репликации. Точка начала репликации имеет специфическую последовательность ос- нований, богатую парами А—Т, что, вероятно, облегчает разде- ление цепей. В результате инициации раунда репликации в точке ori образу- ется одна или две репликативные вилки. При однонаправленной репликации возникает одна репликативная вилка (плазмида ColFI), и синтез заканчивается в точке ori (рис. 108). При двунаправленной репликации (хромосома Е. coli) иници- ируются две репликативные вилки, перемещающиеся в противо- положных направлениях до тех пор, пока они не встретятся на противоположной стороне кольца. Для геномов эукариотических клеток обычно характерно на- личие множественных точек начала репликации, разбросанных по хромосоме на расстоянии 20 тыс. н.п., т.е. эукариотические хромосомы имеют полирепликонную организацию. После пници- 212
Начало Движение --------- Родительская ---------ДНК Начало репликации \--------Ранняя 1 стадия репликации Поздняя стадия репликации Дочерние дуплексы Рис. 108. Направленно репликации: А — oaiioiianpaivieiuian репликация в кольцевой молекуле ДНК: Z> — двунаправ- ленная репликация п кольцевой молекуле ДНК: Д — множественная двунаправ- ленная репликация в эукарптической хромосоме (полирепликоп) ации репликация продолжается в двух направлениях от каждой точки до тех нор, пока репликативные вилки двух соседних точек начала репликации не сольются. Полноразмерные ДНК каждой дочерней хромосомы получаются путем соединения более корот- ких, независимо инициированных новосинтезированных цепей. РЕПЛИКАЦИЯ ХРОМОСОМЫ Е. coli Репликация лучше всего изучена у кишечной палочки. Белки и ферменты, участвующие в репликации. Основные белки и ферменты, входящие в состав репликативного комплекса Е. coli, а также их функции указаны в табл. 17. У Е. coli есть три ДНК- полнмеразы — I, II и III (названия даны в порядке их открытия). ДНК-полимераза I — была выделена А. Корнбергом и сотр. в 1958 г. Это одиночный полипептид (мол. масса 109 000 Да) с муль- тифункциональными активностями, хорошо связывается с одно- цепочечной ДНК или с зонами разрыва фосфодиэфирных связей в биспиралыюй ДНК. Она обладает ДНК-полимеразной активно- 213
Таблица 17 Белки, входящие в состав репликативного комплекса Е. coli Белки Энзиматическая а юн ви осп* Биологическая функция Dna А Узнавание области начала ре- пликации и привлечение к месту сборки остальных белко- вых компонентов рсплисомы Dna В ДНК-хеликаза Раскручивание двойной спи- рали ДНК в репликативной вилке Dna С Обеспечение взаимодействия хеликазы и пранмазы с ДНК, находящейся в комплексе с SSB-белком Dna G SSB Праймаза Синтез РНК-затравок Взаимодействие с одпоцепо- чечпой ДНК; активация ДНК- полимеразы и стабилизация расплетенного дуплекса ДНК-полимсраза I ДНК-полимсраза 3'—5'-экзонуклсаза 5’—3'-экзонуклеаза Созревание реплицирующейся ДНК (застраивание брешей) Коррекция ошибок Удаление РНК-затравки (праймера) ДНК-полимсраза 111: (И0£) — КОр- фермепт р-белок ДНК-полимсраза Синтез лидирующей и отста- ющей цепей ДНК Активация ДНК-полимеразы и ДНК-зависимой АТРазы; осу- ществление функции «сколь- зящего зажима», обеспечиваю- щего процсссншюсть репликации у-Комплекс (у, 6. 5'. х. у) ДНК-зависимая АТРаза Связывание затравки с матри- цей; активация ДН К-полнмсразы т-Белок Сборка и димеризация холо- фермента ДНК-полимеразы Лигаза Лигаза Лигирование фрагментов ДНК Топоизомераза I Топоизомераза Рслаксировапнс отрицатель- ной супсрспирализации Топоизомераза II (ДНК-гираза) Топоизомераза Индуцирование образования отрицательных сверхвитков, разделение катенанов 214
3' -> 5'-экзонуклсаза + 5'-мопопуклсотилы + ^'-мононуклеотиды 5' -> З'-экзонуклеаза Нс расщепляет -| 5’-мононуклсотиды Рис. 109. Экзонуклеазные реакции ДНК-полимеразы 1 стыо (см. рис. 104), а также осуществляет гидролиз фосфоди эфир- ных связей как в одной цепи ДНК, так и на нсспаренном конце дуплексной ДНК, причем за один акт удаляется один нуклеотид, начиная с З'-конца цепи (3'->5'-экзонуклеаза) (рис. 109). Вторая реакция также состоит в отщеплении нуклеотидов, но гидролиз начинается с 5'-конца дуплексной ДНК в направлении к З'-копцу (5'—> З'-экзонуклеаза). Эти различные активности при- сущи разным сайтам полипептидной цепи ДНК-полимсразы I. При обработке фермента трипсином полипептидная цепь расщепляет- ся на большой и малый фрагменты. Большой, С-концевой фраг- мент («фрагмент Кленова») сохраняет ДНК-полпмеразпую и 3'-> 5'-экзонуклеазную активности; малый, N-концевой фрагмент об- ладает только 5' -> З'-экзонуклеазной активностью. ДНК-полимераза I и присущие ей экзонуклеазные активности играют большую роль в репликации и репарации хромосомной ДНК Е. coli. Экзонуклеазная активность 3'-> 5' обеспечивает кон- троль за присоединением каждого нуклеотида и удаление оши- бочных нуклеотидов с растущего конца цепи. Если эта активность подавлена в результате каких-то мутаций в гене, кодирующем ДНК-полимеразу I, то при репликации генома часто происходят мутации — замены оснований. Экзонуклеазная активность 5' -> 3' осуществляет разрушение праймера, необходимого для синтеза фрагментов Оказаки (см. с. 209) В клетке Е. coli имеется несколько сотен молекул ДНК-поли- меразы I. В целом ДНК-полимераза 1 имеет большее отношение к созреванию реплицирующейся ДНК, чем непосредственно к по- лимеразным процессам в репликативной вилке. ДНК-полимераза II (мол. масса 90 кДа) — представлена одной полипептидной цепью, обладающей полимеразной и 3' -> 5'-эк- 215
зонуклеазной активностями. Она плохо соединяется с одноцепо- чечными ДНК, но лучше работает с биспиральной ДНК, имею- щей одноцепочечные бреши длиной в несколько десятков нукле- отидов, обладает лишь 10 %-й ДНК-полимеразной активностью но сравнению с ДНК-полимеразой I. Предполагают, что основ- ной функцией ДНК-полимеразы И является достраивание повреж- денных участков в молекуле ДНК, т.е. репарация ДНК. ДНК-полимераза III (мол. масса 103 кДа) — играет главную роль в репликации ДНК у Е. coli. В каждой клетке содержится только 10—20 копий фермента, приблизительно столько же, сколько реп- ликативных вилок. ДНК-полимераза III является основным ком- понентом мультифермент!юго комплекса, инициирующего фор- мирование репликативных вилок в точках начала репликации, участвующего в элонгации лидирующей цени в вилке и удлиняю- щего РНК-праймеры с образованием фрагментов Оказаки. ДНК-полимераза III состоит из десяти типов субъединиц (а, 0, у, 5, 8', с, 0, т, х, \|/). Репликацию проводит полная форма фер- мента — холофермент, содержащий все субъединицы. Холофер- мент не обладает 5'->3'-экзонуклсазной активностью, в связи с чем для репликации отстающей цепи необходимо участие ДНК- полимеразы I. Полимеразную реакцию осуществляет каталитиче- ский кор из а-,с-, 0-субъединиц, в котором а-субъсдиница обла- дает полимеразной активностью, е-субъединица — 3'->5'-экзонук- леазпой активностью, функция 0-субъсдиницы пока неясна. По- мимо субъединиц, составляющих полимеразный кор, ДНК-по- лимераза HI-холофермент содержит еще семь субъединиц (т, у, 0, 8, 8', у, \|/)- Эти полипептиды существуют во множестве копий, являются регуляторными и усиливают действие каталитического ядра (кора) ДНК-полимеразы III. Отличительная черта холофермента ДНК-полимеразы III — ис- ключительно высокая процессивность. Мерой процессивности является длина фрагмента вновь синтезированной макромолеку- лы, которую комплекс (или индивидуальные ферменты) спосо- бен образовывать в одном цикле, не диссоциируя от матрицы. Установлено, что холофермент ДНК-полимеразы 111 синтезирует ведущую цепь ДНК длиной в 50000 нуклеотидов со скоростью более 500 нуклеотидов в секунду в одном цикле, ни разу не дис- социируя от ДНК-матрицы. Инициация репликации (рис. НО). Хромосома Е. coli содержит единственную область начала репликации (oriC), размер которой составляет 258 н.п. В oriC имеется пять консенсусных дсвятинуклс- отидпых сайтов связывания инициаторного белка Dna А, назван- ных Dna A-боксами. В левой части oriC наряду с Dna А-боксамн находятся АТ-богатые 13-нуклеотидные повторы. Белок Dna А рас- познает область начала репликации и привлекает к oriC остальные белковые компоненты, участвующие в инициации репликации. 216
ДНК Е. coli ОпС АТР, Dna А Образование комплекса | Началыгый комплекс | АТР, вспомогательные белки Расплетание АТ-повторов | Открытый комплекс | Взаимодействие DnaB/DnaC, SSB-белков с АТ-повторами [ (Dna В—DnaC—АТР)6 Препраймосома I ~~| Позиционирование DnaB (хеликазы) в точке начала синтеза ДНК 6DnaC Ч'->- АДР + Рн Препраймосома II | DnaG (праймаза) Праймосома | ДНК-гираза +ДНК-полимераза III Ре плисома Рис. 110. Схема инициации репликации хромосомы Е. coli Сначала белок Dna А в комплексе с АТР взаимодействует с Dna A-боксами. С помощью электронной микроскопии исходный комплекс обнаруживается в виде компактной эллипсоидной струк- туры. содержащей -20 мономеров Dna А, которая закрывает oriC. В этом комплексе частично расплетаются АТ-богатые повторы и формируется открытый комплекс. В этом процессе участвуют не- которые вспомогательные белки, которые помогают инициатору Dna А раскручивать и изгибать ДНК (ранее они обозначались п, п', n", i, а. В последнее время их обозначают IME, FIS-факторы и т.д.). Белок Dna В (хеликаза) в виде гексамеров (см. рис. 107) в ком- плексе с шестью мономерами белка Dna С, каждый из которых связывает одну молекулу АТР, а именно (Dna В —Dna С —АТР)6, взаимодействуете одноцепочечными участками частично распле- тенной ДНК. В этом комплексе хеликазная активность Dna В бло- кирована. Транслокация Dna В (хеликазы) от места ее первона- чального вхождения в комплекс к месту старта репликативной вилки, которая ассоциируется с ATP-зависимым освобождением 217
из комплекса белка Dna С, вызывает активацию хеликазы. Далее хеликаза взаимодействует с белком Dna G (праймазой), и этот комплекс играет ключевую роль в инициации репликации на oriC. Оба фермента обеспечивают сопряженное функционирование двух репликативных вилок, движущихся в противоположные стороны: хеликаза начинает расплетать дуплекс ДНК, праймаза синтезиру- ет первые затравки. В сформированном праймирующем комплексе присутствие белка Dna А не требуется, и он после освобождения из комплекса может быть повторно использован для репликации па другом oriC. Сложный комплекс белков, осуществляющий инициацию реп- ликации, получил название нраймосомы. У Е. coli мол. масса прай- мосомы равна 106Да. Праймосома в свою очередь является компо- нентом еще более сложного комплекса — реплисомы, осуществля- ющей процесс полной репликации. Схема инициации реплика- ции хромосомы Е. coli и образование реплисомы представлена на рис. 110. При образовании реплисомы происходит АТР-зависимое формирование димерного комплекса холофермента ДНК-поли- меразы III, связанного с З'-концами праймеров. Элонгация репликации. Модель полуконсервативной прерыви- стой репликации ДНК в репликативной вилке представлен на рис. III. Дуплекс родительской молекулы ДНК расплетает АТР- завненмая хеликаза. Образующиеся одноцепочечные участки коо- перативно покрывает SSB-бслок. ДНК-полимераза Ш движется но одной из матричных цепей в направлении раскрывания вилки и синтезирует ведущую цепь ДНК. Подругой, матричной цепи в том же направлении движется праймосома. Время от времени, входящая в состав праймосомы праймаза (белок Dna G), синтези- рует РНК-затравки для отстающей цепи. Вторая молекула холо- фермента ДНК-полимеразы HI удлиняет эти затравки до тех пор, пока не достигнет предыдущей затравки, т.е. она синтезирует фрагменты Оказаки длиной от 1000 до 2000 нуклеотидов. Удале- ние сегментов РНК с 5'-конца каждого фрагмента Оказаки осу- ществляет ДНК-полимераза I, используя свою 5'-^'-экзонукле- азную активность. Заполнение пробелов (брешей) между фраг- ментами Оказаки катализируется той же ДНК-полимеразой I. Она низкопроцсссивна, непрочно удерживается на матричной цепи и довольно быстро отделяется от нее после удаления РНК. После полимеразного действия указанного фермента между двумя со- седними фрагментами Оказаки остается только одноцепочечный разрыв, который зашивает ДНК-лигаза. Таким образом, из серии фрагментов Оказаки образуется непрерывная новая цепь. Холофермент ДНК-полимеразы III может образовывать димер при участии т-белка, в связи с чем ведущая и отстающая цепи реплицируются одновременно. Преодоление антипараллсльности цепей при репликации в этом случае осуществляется за счет воз- 218
никиовения «петли» (модель А. Корнберга), где чередование фос- фодиэфир! 1ых связей на ее восходящем отрезке изменяется на обра- тное н не препятствует ДНК-нолимсразе III вести синтез фраг- ментов Оказаки на отстающей цепи родительской ДНК в том же направлении, что и на ведущей цепи (рис. 112). Необычность ситуации во время синтеза ДНК в репликатив- ной вилке заключается в том, что один и тот же белковый комп- лекс осуществляет как высокопроцессивный непрерывный син- тез ведущей цепи ДНК, так и прерывистый синтез фрагментов Оказаки отстающей цепи, претерпевая во втором случае перио- дическую диссоциацию от матрицы для инициации синтеза ДНК с каждого нового праймера. Известно, что холофермент ДНК- 219
Рис. 112. Преодоление антипарал- лслыюсти цепей при репликации за счет возникновения петли (мо- дель А. Корнберга) полимеразы III включает кор-фермепт, подвижно связывающий р-белок и белки у-комплекса (см. табл. 17). Роль у-комплекса заключается в распознавании РНК-затравок на матричной ДНК. Он связывается с единственным праймером ведущей пени ДНК или с каждым из праймеров фрагментов Оказа- ки отстающей цепи, что делает возможным присоединение к про- маркированным таким образом праймерам кор-фермента и [3-белка. Две молекулы р-белка входят в состав репликативного комп- лекса вслед за белками у-комплекса, связываясь с ДНК позади белков у-комплекса и оставляя З'-копец праймера доступным для ДНК-полимеразы. Димер р-белка образует кольцо вокруг молеку- лы ДНК и стимулирует АТРазиую активность белков у-комплекса. Оба вида белка, будучи связанными с дуплексом праймер-матри- ца. обеспечивают присоединение к этому комплексу кор-фермента ДНК-полимеразы III. Затем ДНК-полимераза III при наличии че- тырех дсзоксирибонуклсозидтрифосфатов, используя праймер, с высокой эффективностью синтезирует ведущую цепь ДНК. Те же самые белки участвуют и в синтезе отстающей цепи ДНК. Но только в этом случае синтез ДНК многократно инициируется на боль- шом количестве праймеров. Оказалось, что при встрече реплика- тивного белкового комплекса с дуплексом, образованным мат- ричной ДНК и РНК-затравкой, [3-белок остается связанным с 3'- концом вновь синтезированной цепи ДНК, а у отделившихся кор- фермеита и белков у-комплекса появляется возможность вступить 220
в новый цикл синтеза фрагментов Оказаки путем взаимодействия с очередным дуплексом РНК-затравка — матрица. При этом вхож- дение кор-фермснта в новый репликативный комплекс облегча- ется наличием в нем р-белка и белков у-комплекса, ассоцииро- ванных с очередным РНК-праймером. Таким образом, ДНК-по- лимераза III обладает способностью распознавать молекулярное окружение, создаваемое матричной ДНК, осуществлять термина- цию синтеза ДНК при наличии сигнала в виде дуплекса ДНК- затравка и реинициировать синтез ДНК па следующем праймере. Кроме того, репликативный комплекс может распознавать по- вреждения ДНК, маркированные специфическими белками, и прекращать репликацию соответствующего участка, останавлива- ясь или диссоциируя от матрицы. Репликация таких участков ДНК возобновляется после ликвидации повреждений ферментами ре- парации. Для диссоциировавшей ДНК-полимеразы это становит- ся возможным благодаря тому, что З'-консц вновь синтезирован- ной цепи ДНК в месте остановки репликации остается связан- ным с [3-белком, облегчающим повторное вхождение ДНК-поли- меразы в репликативный комплекс. Термипация репликации происходит тогда, когда встречаются две репликативные вилки при удвоении кольцевых молекул ДНК. Непрерывный рост лидирующей и отстающей цепей вдоль коль- цевой матрицы неизбежно приводит к совмещению З'-гидрокси- и 5'-фосфорилы1ОГО концов одной цепи, либо в точке начала репли- кации (однонаправленная репликация), либо — при двунаправленной репликации — в середине кольца (см. рис. 108). Кольца в этих ме- стах встречи соединяются ДНК-лигазой, при этом обычно они оказываются попарно сцепленными, т.е. образуют катенан. ДНК- гираза может расцепить зацепленные кольца, используя свою воз- можность вносить временный двуцепочечпый разрыв (см. рис. 50). Регуляция репликации. При каждом клеточном делении каждая молекула ДНК должна удваиваться, т.е. па каждом oriC должен происходить в точности один акт инициации репликации. В против- ном случае постепенно происходила бы утеря рсплнкона или его бесконтрольное накопление. Таким образом, к регуляции реплика- ции предъявляются довольно жесткие требования: регуляторная система должна чувствовать отклонения в обе стороны от средне- го числа копий данного рспликона и соответствующим образом менять частоту инициации па oriC. Очевидно, что частота иници- ации должна быть согласована также со скоростью роста клеток. Существуют тонкие механизмы регуляции репликации на уровне инициации новых раундов. Позитивным регулятором этого про- цесса является белок Dna А. Среди моделей, объясняющих меха- низм регуляторного действия белка Dna А, наибольшее распро- странение получила модель титрования Dna А: весь вновь синтези- руемый белок Dna А связывается (титруется) Dna A-боксами oriC 221
хромосомы. Как только количество молекул инициатора превы- шает число внутриклеточных Dna A-боксов (все Dna A-боксы за- няты белком), инициируется синтез ДНК. После запуска инициа- ции па одном oriC освобождаются молекулы Dna А, резко повы- шаются его внутриклеточная концентрация и синхронная иници- ация синтеза ДНК на других доступных областях начала реплика- ции. При этом ассоциация с мембранами первой опС защищает се от использования в реинициации. Отмечена активация репликации транскрипцией, при которой перед транскрибирующей РНК-полимеразой имеет место локаль- ная положительная сверхспирализации ДНК, а вслед за ней — отрицательная. Это облегчает образование открытых комплексов при инициации синтеза ДНК. Сегрегация бактериальных репликоиов по дочерним клеткам при делении. Стабильное поддержание любого рспликона требует нс только согласования его репликации с клеточным делением, но и упорядоченного распределения молекул ДНК по дочерним клет- кам. Считается, что правильная сегрегация достигается у бакте- рий за счет прикрепления ДНК к мембране, причем простран- ственная организация участков прикрепления, зоны роста мемб- раны и клеточной стенки обеспечивает автоматическое «растас- кивание» двух копий прореплицировавшсйся молекулы ДНК по разным дочерним клеткам. РЕПЛИКАЦИЯ ХРОМОСОМ У ЭУКАРИОТ Механизмы репликации ДНК у эукариот мопсе изучены из-за их большей сложности. Основные результаты получены на модель- ной системе с ДНК вируса SV40, в которой процесс репликации исследовали в зараженных клетках человека, культивируемых in vitro. В этой системе вирусный белок, называемый Т-антигсном, выполняет многие функции, необходимые для репликации ви- русной ДНК. Он является белком-инициатором, обладает ДНК- хсликазпой активностью и необходим для правильного взаимо- действия с ДНК ферментного комплекса, синтезирующего прай- меры. В то же время вирус SV40 использует для репликации своей небольшой хромосомы и многие белки клетки-хозяина, что по- зволяет исследовать функционирование репликативного комплекса клеток человека в такой относительно простой системе. ДНК-полимеразы эукариот. В клетках эукариот имеются по мень- шей мере шесть различных ДНК-зависимых ДНК-полимераз: а, Р, 6, е, у, С Четыре из них — а, р, 8, е — непосредственно уча- ствуют в репликации хромосомной ДНК (табл. 18). ДНК-полимераза а — первая ДНК-полимераза, обнаруженная в клетках эукариот. Она представлена в клетке в виде прочного ком- 222
Таблица 18 Белкл, входящие в состав репликативного комплекса эукариотических организмов Белок Молекуляр- ная масса субъединиц, кДа Энзиматическая активность Биологическая функция ДНК-полимераза: а (альфа) 160-185* ДНК-полимераза Синтез праймеров па р(бета) 67-70 54 — 58 46-50* 39-40* Праймаза ДНК-полимераза обеих цепях ДНК Транспорт ДНК-по- лимсразы в клеточ- ное ядро Связывание пурино- вого нуклеотида, присоединение праймазы к ДНК- пол имеразе Заполнение брешей у (гамма) 125-140* ДНК-полимераза при эксцизионной репарации ДНК, участие в рекомби- нации, процессинг фрагментов Оказаки Репликация и 8 (дельта) 35-40 125-130* 3'-> 5'-экзону- клеаза ДНК-полимераза репарация митохондриальной ДНК Синтез лидирующей е (эпсилон) 48-55 230-261* 3'-^'-экзону- клеаза ДНК-полимераза цепи геномной ДНК в репликативной вилке Связь с фактором прецессивности PCNA Синтез отстающей £ (дзета) 55 173* 3'->5’-экзону- клеаза ДН К-полимсраза цепи геномной ДНК в репликативной вилке Синтез ДНК па 29 3'->5'-экзопу- клеаза поврежденной мат- рице при SOS-otbctc 223
Окончание табл. 18 Белок Молекуляр- ная масса субъединиц, кДа Энзиматическая активность Биологическая функция Т-аптигсп RPA (реплика- тивный белок А) ДНК-хеликаза Раскручивание двойной спирали ДНК в реплика- тивной вилке Белок, связываю- щийся с одноцепоч- ной ДНК, обеспе- чивает оптимальную для синтеза ДНК конформацию матриц RFC (реплика- ДНК-зависимая Обеспечение свя- тивпый фактор С) PCNA (ядерпый антиген проли- ферирующих клеток) АТРаза зывания затравки с матрицей;стимули- рование ДНК-поли- меразы Фактор процесснвпости репликации; выпол- няет функции «сколь- зящего зажима» Лигаза 1 Лигаза Лигирование фраг- ментов ДНК FENI или MFI (фактор созревания) Экзонуклеаза Удаление РНК- затравки РНКаза Н1 Эндонуклеаза Удаление РНК- затравки Топоизомераза I Топоизомераза Релаксация как положительных, так п отрицательных свсрхвнткои ДНК Топоизомераза II Топоизомераза Релаксация поло- жительных сверх- витков * Католическая субъединица. 224
нлекса с ДНК-праймазой — ферментом, осуществляющим син- тез РНК-затравок. Комплекс ДНК-полимераза а-праймаза явля- ется единственным у эукариот ферментативным ансамблем, спо- собным инициировать синтез ДНК de novo. На богатых пирими- дином участках матрицы праймаза комплекса синтезирует РНК- затравки длиной примерно 10 нуклеотидов, которые затем элон- гнруются ДНК-полимеразой без диссоциации комплекса от мат- рицы. В ходе репликации в клеточных ядрах ДНК-полимераза а- праймаза синтезирует затравку лидирующей нити в участке ori и затравки фрагментов Оказаки запаздывающей нити. Как правило, ДНК-полимераза а не обладает корректорской 3'->5'-экзонуклсазной активностью. По-видимому, в ходе эволю- ции экзонуклеазный центр в данном ферменте редуцировался. ДНК-полимераза р является наименьшей по размеру и самой простой по строению ДНК-полимеразой в клетках эукариот. Ос- новная функция ДНК-полимеразы р в клетке связана с эксцизи- онной репарацией ядерной ДНК. Существуют экспериментальные указания на возможность участия этого фермента в рекомбинаци- онных событиях и в репликации ДНК, в частности в процессинге фрагментов Оказаки. Так, ДНК-полимераза р способна заменить ДНК-полимеразу I в клетках Е. coli, мутантных по гену ДНК- полимеразы I, инициируя репликацию с З'-конпа РНК/ДНК гиб- рида в районе ori. ДНК-полимераза 8 — гетеродимср, состоящий из каталитиче- ской субъединицы (125—130 кДа) и субъединицы 48 — 55 кДа, необходимой для преодоления ферментом структурных барьеров в природных одноннтевых матрицах и для связи с фактором иро- цесспвности PCNA. Обе ферментативные активности — ДНК-по- лимсразная и 3'->5'-экзонуклеазная — связаны с высокомолеку- лярным полипептидом. Кроме фактора, в присутствии которого процессивпость этого фермента увеличивается на два порядка, холофермент включает в себя факторы RFC и RPA. Три молекулы PCNA образуют кольцевой тример с отверстием для двуиитевоп ДНК в центральной части, который представляет собой переме- щающуюся по ДНК подвижную платформу или «скользящую скрепку» в форме тора (бублика), удерживающую ДНК-полимс- разу 8 в холе полимеризации на матрице и обеспечивающую вы- сокопроцессивный синтез ДНК. Хотя PCNA и прокариотиче- ский фактор процессивности субъединица р ДНК-полимеразы III Е. coli имеют низкую гомологию на уровне первичной структуры, оба белка формируют близкие по пространственной геометрии структуры «скользящей скрепки». ДНК-полимераза с, выделенная из клеток HeLa, содержит два полипептида — каталитический 261 кДа и полипептид 55 кДа. Ка- талитический полипептид обладает ДНК-полимеразпой и 3'->5'- экзонуклеазной активностями. Особенностью холофермента ДНК- 8 Кожнев 225
полимеразы с по сравнению с ДНК-полимеразой 5 является его меньшая зависимость от вспомогательных факторов (PCNA, RFC и RPA), а также низкая (почти на порядок) скорость синтеза ДНК. Эго различие, возможно, связано с разной функцией ДНК-по- лимсраз в репликативной вилке. Один холофермент, ДНК-поли- мсраза 8 осуществляет быстрый и процессивпый синтез лидирую- щей нити, используя для элонгации единственную затравку, син- тезируемую ДНК-полимеразой а-праймазой в районе ori, и дис- социирует только по достижении копна репликона, тогда как не- сколько холоферментов ДНК-полимеразы с могут одновременно синтезировать фрагмены Оказаки в «зоне Оказаки», удлиняя за- гранки, синтезируемые ДНК-полимеразой а-праймазой в начале каждого фрагмента. Следует отметить, что у высших эукариот участие ДНК-поли- меразы е в синтезе запаздывающей цепи не является строго дока- занным. Так, при репликации ДНК вируса SV40 в бесклеточной системе обе нити на этапе элонгации синтезирует ДНК-полиме- раза 8. ДНК-полимераза у локализована в митохондриях, ее функция связана с репликацией и репарацией митохондриальной ДНК, она кодируется ядерным геномом. ДНК-нолпмераза у способна направлять высокопроцсссивную полимеризацию на одноннтевых ДНК-матрицах в отсутствие вспомогательных факторов. Охарактеризованы также другие ДНК-полимеразы эукариот: q, О, 1, REV1. Все эти ферменты участвуют в репарации ДНК. В последние годы наряду с углубленным изучением строения и свойств отдельных ДНК-полимераз эукариот большое внимание уделяется взаимодействию этих ферментов со вспомогательными факторами и механизму функционирования их в составе много- компонентных репликативных и репаративных комплексов. Спи- сок белков, взаимодействующих с ДНК-нолимеразами, постоян- но растет и включает не только известные факторы PCNA, RFC и RPA, но и ключевые факторы регуляции клеточного метаболиз- ма, такие, как белки группы MCM (minichromosome maintenance factors), факторы узнавания участков ori репликации ORC (origin recognition complex) и др. Принципиальное значение имеет установление того факта, что функционирование репликативных ДНК-полимераз а, 8, е в ходе клеточного цикла регулируется с помощью специфических пост- трансляционных модификации, в частности фосфорилирования. Так, негативная регуляция ДНК-полимеразы а-праймазы в холе клеточного цикла осуществляется с помощью фосфорилирования субъединиц с молекулярной массой 180 кДа и 68 — 70 кДа по ос- таткам серина. Одной из характеристик некоторых опухолевых кле- ток является нарушение фосфорилирования субъединицы 180 кДа в клеточном цикле. 226
В клетках эукариот синтез ДНК происходит в основном в спе- цифических плотных структурах («репликативных фабриках»), присоединенных к диффузному ядерному матриксу. В составе «реп- ликативных фабрик», связанных с ядерным матриксом, обнару- жен мультибелковый 21S комплекс («синтесома»), состоящий не менее чем из 30 белков (см. табл. 18). Инициация репликации у эукариот. Скорость синтеза ДНК у эука- риот существенно ниже, чем у прокариот (~50 нуклеотидов в 1 с у человека). Видимо, по этой причине инициация синтеза ДНК эукариот происходит во многих точках хромосомы, т.е. эукарио- тические хромосомы имеют полирепликонную организацию. Инициация репликации у эукариот происходит на специфи- ческих множественных последовательностях нуклеотидов — реп- ликаторах, пли ориджинах репликации. Наиболее изучены репли- каторы дрожжей, впервые идентифицированные как автономно реплицирующие последовательности (AR.S — autonomously replicating sequences). У дрожжей на участке ДНК длиной 5 тыс. н. п. находится три отдельных репликатора (AR.S). У млекопитающих области начала репликации располагаются на расстоянии ~ 100 тыс. п. п. друг от друга. Установлено, что синтез ДНК в отдельных реп- ликонах происходит по двум направлениям, причем перемеще- ние репликативной вилки осуществляется предпочтительно в од- ном направлении, которое может изменяться в зависимости от стадии развития организма. Частота использования отдельных реп- ликаторов изменяется в онтогенезе, уменьшаясь в клетках взрос- лого организма. Репликаторы эукариот различны между собой по последовательности, но имеют несколько участков гомологии: ДНК-расплстающпе элементы, участки прикрепления к ядерно- му матриксу, пиримидиновые тракты, канонические последова- тельности, взаимодействующие с белками репликативного комп- лекса, АТ-богатые последовательности, участки изгибов ДНК и другие, в большинстве своем служащие, вероятно, местами узна- вания ответственных за инициацию репликации ядсриых белков. Инициация репликации строго регулируется. Полирепликонная организация требует, чтобы в каждом цикле клеточного деления каждый репликатор «сработал» только один раз, в противном слу- чае на хромосоме образуются разветвленные структуры. Для дрож- жевых ARS-последовательностей инициация происходит один раз в каждой S-фазе клеточного цикла. У высших эукариот достаточно протяженные участки хромосом, содержащие несколько сосед- них репликонов, начинают синтез ДНК в S-фазе приблизительно одновременно, но каждый такой участок имеет характерное для него время инициации репликации: одни активируются в начале S-фазы, другие — позже, а третьи — в конце. Таким образом, существует запрет на повторную инициацию репликации в том же цикле клеточного деления, хотя одновременно может проис- 227
ходить инициация на других, не сработавших ранее репликаторах. Некоторые данные указывают на то, что подобный запрет снима- ется в ходе митоза, когда ядерная оболочка распадается. Наруше- ние запрета на повторную инициацию приводит к амплификации (появлению множественных копий) того или иного участка хро- мосомы, где произошла «лишняя» инициация репликации. Элонгация репликации. Четырехсубъединичная ДНК-полимс- раза а образует функциональные комплексы с рядом ферментов и вспомогательных белков. В комплексе, осуществляющем реплика- цию лидирующей цепи, ДНК-полимераза а связана с ДНК-полн- мсразой 6, а в комплексе, синтезирующем отстающую цепь, — с ДНК-полимеразой с. У эукариот оба комплекса связаны, вероят- но, друг с другом в репликативной вилке подобно тому, как свя- заны холоферменты синтеза лидирующей и отстающей цепей у прокариот. Эукариотическая ДНК-праймаза в отличие от аналогичного белка прокариот образует постоянный комплекс с ДНК-полиме- разой а, роль которого ограничивается синтезом праймеров при репликации обеих цепей ДНК. Белок PCNA и фактор репликации С (RFC) также образуют стабильный комплекс с ДНК-полимеразой 3, а в определенных условиях стимулируют и активность ДНК-полп.мсразы с. Во мно- гих отношениях PCNA и RFC являются функциональными ана- логами соответственно [1-белка и белков у-комплекса Е. coli. Меха- низмы репликации ДНК про- и эукариот существенно различа- ются в том отношении, что во втором случае синтез лидирующей и отстающей цепей ДНК осуществляют разные ДНК-полимеразы (о н с соответственно), тогда как у Е. coli обе цепи ДНК синтези- руются димером ДНК-полимеразы III. Созревание фрагментов Оказаки у эукариот требует удаления РНК-затравок с помощью 5'—>3'-экзонуклеазы (белковые факторы FENI пли MFI) и РНКа- зы HI. ДНК-полимераза [1 заполняет бреши, равные вырезанным праймерам, а ДНК-лигаза I соединяет фрагменты отстающей цепи. Терминация репликации. Продвижение репликативной вилки прекращается только при столкновении с другой вилкой, движу- щейся в противоположном направлении, или по достижении конца хромосомы. После сборки на молекуле ДНК хромосомных белков каждая пара хромосом в процессе митоза упорядоченно разделя- ется по дочерним клеткам. Репликация происходит в S-фазу кле- точного цикла. Известно, что в регуляции клеточного цикла уча- ствуют белки циклины (А, В, D, Е). Они активируют циклинзави- епмые протеинкиназы, и те могут фосфорилировать специфиче- ские белки, участвующие в подготовке клетки к делению. Так, циклим D регулирует переход клетки из Gj-фазы в S-фазу; цик- лимы А и Е — активируют синтез ДНК на начальной стадии S- фазы; циклим В регулирует переход клетки из С2-фазы в М-фазу. 228
Репликация теломерных участков эукариотических хромосом. На концах хромосом эукариот находятся специализированные повто- ряющиеся последовательности ДНК, получившие название те- ломерной ДНК, а содержащие ее концы хромосом — теломерами. В клетках животных количество хромосом, а следовательно, и те- ломерных участков невелико — они составляют лишь небольшую часть от всех остальных последовательностей. Использование в качестве объекта исследования теломерной ДНК ресничной инфузории Tetrahymena thermophila, в клетках которой находятся десятки тысяч мелких хромосом, а следова- тельно, и множество теломер, показало, что теломеры построе- ны из коротких (содержат по 6 — 8 нуклеотидных остатков) мно- гократно повторяющихся последовательностей (блоков). При этом одна цепь ДНК обогащена остатками гуаниловой кислоты (G-бо- гатая цепь, у тетрахимеиы — это блок TTGGGG), а комплемен- тарная ее цепь обогащена остатками цитидиловой кислоты (С- богатая цепь). Теломерная ДНК человека построена из TTAGGG- блоков, т.е. отличается от простейших всего лишь одним нуклео- тидом в повторе. Из TTAGGG-блоков построены теломерные ДНК (их богатые G-цспи) всех млекопитающих, рептилий, амфибий, птиц и рыб. Универсален и теломерный повтор (14 I AGGG) у всех растений. Характеристикой теломерных ДНК является их длина. В клетках жгутиковых размер теломер составляет -50 н.п. У человека она колеблется от 2 до 20 тыс. н. п., а у некоторых видов мышей дости- гает сотни тысяч пар нуклеотидов. Отмечена значительная гетеро- генность в разных клетках и тканях даже одного организма: длина ДНК в теломерах хромосом человека клеток зародышевой линии составляет 10— 15 тыс. н.п., а в лейкоцитах периферической кро- ви 5— 12тыс. и.и. Теломеры играют важную роль в создании специфической ар- хитектуры и внутренней упорядоченности клеточного ядра. Они предотвращают деградацию и слияние хромосом, а также ответ- ственны за их прикрепление к специальной внутриклеточной структуре (своеобразному скелету клеточного ядра). Механизмы репликации теломерных участков эукариотических хромосом и центральных областей ДНК принципиально различа- ются. Все известные ДНК-полимеразы, являющиеся ферментами сложного репликативного комплекса эукариот, неспособны пол- ностью реплицировать концы линейных молекул ДНК. Известно, что ДНК-полимеразы, синтезируя дочернюю нить ДНК, прочи- тывают родительскую нить в направлении от ее З'-конца к 5'- концу. Соответственно дочерняя цепь синтезируется в направле- нии 5'—>3'. Кроме того, ДНК-полимераза начинает синтез только со специального РНК-праймера, комплементарного ДНК. После окончания синтеза ДНК РНК-праймеры удаляются, а пропуски в 229
Б У______ У-------- ДНК-поли-1 мсраза " 3' у______ у—: Лидирующая цепь Запаздывающая цепь Связывание теломеры _ _ Теломеразная Хромосома-------ТСССТ?£ГГ. ,1|г РНК 3 ^«—"AUCCCAAUC [ dGTP Элонгация 3' I dAl Р — GGOTTAGGGTTAG 5' ^AUCCCAAUC У г—, / Пропуск I Удаление праймера 3' /* “ I Синтез G-цепи 5' * Теломераза —— / 3' I ДНК-полимераза 5. т Синтез С-цепи Транслокация 3' — GGGTTAGGGTTAG -----5' AUCCCAAUC У 3' Рис. 113. Репликация теломерных участков эукариотических хромосом: А — возникновение недореплнипровапня 5’-копца линейной хромосомы и син- тез на этом концевом участке теломерной ДНК с помощью теломеразы; /> — основные этапы синтеза теломерного повтора теломеразой одной из дочерних ценой ДНК (отстающей) заполняются ДНК- полимсразой р. Однако на З'-концевых участках ДНК такой про- пуск заполнен быть не может, и поэтому они остаются однотя- жевыми, а их 5'-концевые участки — недореплицировапными (рис. 113). Отсюда ясно, что при каждом раунде репликации хро- мосомы будут укорачиваться на 10 — 20 нуклеотидов (у разных ви- дов размер РНК-затравок различен), и в первую очередь сокра- щать длину теломерной ДНК. Возникла проблема «концевой нс- дорспликации ДНК». В случае репликации кольцевых бактериаль- ных ДНК этой проблемы не существует, так как первые по вре- мени образования РНК-праймеры удаляются ферментом, кото- рый одновременно заполняет образующуюся брешь путем нара- щивания З'-ОН-конца растущей цепи ДНК, направленной в «хвост» удаляемому праймеру. Проблема недорепликации З'-кон- цов линейных молекул решается эукариотическими клетками с помощью специального фермента — теломеразы. Этот фермент был обнаружен впервые в 1985 г. у инфузории Tetrahymena thermophila, а впоследствии — в дрожжах, растениях и у животных, в том числе в яичниках человека и иммортализованных (бессмертных) лини- ях раковых клеток HeLa. Теломераза является ДНК-полимеразой, достраивающей 3'- копцы линейных молекул ДНК хромосом короткими (6—8 нук- леотидов) повторяющимися последовательностями (у позвоноч- ных TTAGGG). Согласно номенклатуре, этот фермент называют ДНК-нуклеотидилэкзотрансферазой, или теломерной терминаль- 230
пой трансферазой (мол. масса 103—133 кДа). Помимо белковой части теломераза содержит РНК, выполняющую роль матрицы для наращивания ДНК повторами. Длина теломерной РНК колеблется от 150 нуклеотидов — у про- стейших до 1400 нуклеотидов — у дрожжей, у человека — 450 нук- леотидов. Наличие в молекуле теломеразы РНК-последоватсль- ности, по которой идет матричный синтез фрагмента ДНК, поз- воляет отнести теломеразу к своеобразной обратной транскрипта- зе, т.е. ферменту, способному вести синтез ДНК по матрице РНК. Основное назначение теломеразы — синтезировать тандемно по- вторяющиеся блоки ДНК, из которых состоит G-цепь тело- мерной ДНК. Матричный участок представлен в теломеразной РНК только один раз. Его длина нс превышает длину двух повторов в теломерной ДНК. Схему механизма синтеза теломерных повто- ров, катализируемого теломеразой, см. иа рис. 113. На первой ста- дии (связывание теломеры) происходит комплементарное взаи- модействие части матричного участка теломеразной РНК с 3'- концевым выступающим одноцепочечным сегментом ДНК хро- мосом. При этом З'-концевой фрагмент ДНК служит затравкой для удлинения этой ДНК на РНК-матрице. На стадии элонгации выступающая цепь ДНК удлиняется до конца матрицы. Эта реак- ция осуществляется РНК-зависимой ДНК-полимеразной актив- ностью теломеразы. После удлинения выступающей цепи ДНК до конца матрицы происходит транслокация, т.е. перемещение матрицы и белковых субъединиц фермента на заново синтезированный конец теломе- разной ДНК, и весь цикл повторяется вновь. После завершения удлинения одноцепочечной З'-концевой теломерной последова- тельности вторая цепь ДНК (С-цснь) достраивается с помощью обычной ДНК-полимеразы. Таким образом происходит решение проблемы концевой репликации ДНК у эукариот. Предполагают, что в составе теломеразы кроме двух отмечен- ных компонентов — обратной транскриптазы и теломеразной РНК — должны быть субъединицы, отвечающие за поиск и свя- зывание З'-конца хромосомы, за транслокацию, за связывание продукта реакции (однотяжевой ДНК), а также субъединица с нуклеазной активностью, которая отщепляет от З'-конца тело- мерной ДНК один за другим нуклеотиды до тех пор, пока па этом конце не окажется последовательность, комплементарная нуж- ному участку матричного сегмента теломеразной РНК. Наличие у животных ткансспецифичности в распределении теломер по размерам, а также изменение размеров этих последо- вательностей в онтогенезе предполагают существование механиз- мов, регулирующих данный процесс. Недавние исследования об- наружили резкое повышение активности теломераз, характерное для опухолевых клеток, что служит в настоящее время чувстви- 231
тельным физиологическим маркером их злокачественного пере- рождения. В связи с этим сегодня в качестве одного из подходов к терапии опухолей рассматривают подавление активности теломе- раз, функционирование которых необходимо для иммортализа- ции клеток и роста опухолей. Существование теломер у эукариот имеет глубокий смысл. Те- ломераза обнаружена в эмбриональных клетках, которые посто- янно и быстро делятся, и непрерывное удлинение хромосом не- обходимо для компенсации их постоянного укорочения. В сомати- ческих клетках, которые делятся не часто, теломераза нс обнару- жена. Можно предположить, что соматические клетки получают свою «порцию» теломерной ДНК, необходимую на время жизни клетки и ее потомства. Теломеры в большинстве клеток укорачи- ваются с возрастом, и это может являться важным фактором, опре- деляющим продолжительность жизни особи. Таким образом, изу- чение механизма работы теломеразы и регуляции ее экспрессии в клетке помогут понять молекулярные основы процесса старения и злокачественной трансформации живой клетки. Репликативный комплекс белков — реплисома — изучен до- статочно хорошо у Е. coli. Постоянно накапливающиеся данные о компонентах рсплисомы эукариот показывают, что многие чер- ты ее строения и функционирования у про- и эукариот общие. Инициация репликации и прерывистый синтез ДНК на отстаю- щей цепи осуществляются по РНК-праймерному механизму и являются универсальным свойством репликации ДНК у про- и эукариот. Основные компоненты системы репликации в филоге- незе функционально консервативны, и любой белковый компо- нент системы прокариот имеет свой прототип в системе реплика- ции ДНК млекопитающих. Общей чертой является функциониро- вание в репликативной вилке ДНК-топоизомераз, хеликаз, бел- ков, связывающих и стабилизирующих односпиральную ДНК, вы- сокополимерных ДНК-полимераз, праймаз, 3'->5'-экзонуклеаз, лигаз. Более удивительным представляется то, что у белков раз- ных организмов, выполняющих одинаковые функции в репли- кации, в большинстве случаев отсутствует гомология в амино- кислотных последовательностях. Так, не обнаружено сходства у белка SSB Е. coli и белка RPA репликативной системы человека. То же самое характерно и для р-субъединицы ДНК-полимеразы III Е. coli (р-белок) и белка PCNA человека. Это указывает на воз- можность выполнения одних и тех же функций полипептидными пенями с разными аминокислотными последовательностями, а также на вероятное конвергентное эволюционное происхождение таких белков и их функций из разных неродственных белков-пред- шественников. Репликация ДНК у прокариот и эукариот суще- ственно различается. Для высших организмов характерны: более сложная организация инициации репликации (множественность 232
реплнконов у эукариот и однорепликонная организация у бакте- рий), строгий временной порядок включения репликонов, вре- менная согласованность последующих актов лигирования ДНК по фланкирующим рейликоны концам, сложная связь реплисом с матриксом ядра и, наконец, своеобразный механизм репликации теломерных участков эукариотических хромосом. БИОСИНТЕЗ ДНК НА РНК-МАТРИЦЕ (обратная транскрипция) Биосинтез ДНК на РНК-матрице получил название обратной транскрипции, а фермент, катализирующий комплементарное копирование РНК с образованием ДНК, — обратной транскрип- тазой, ревертазой или РНК-зависимой ДНК-полимеразой. В про- и эукариотических клетках могут встречаться различные по про- исхождению РНК-зависимые ДНК-полимеразы, выполняющие разные биологические функции. Эти обратные транскриптазы объе- диняют в две группы: I) гомогенную, представленную экзоген- ными ретровирусными энзимами, появляющимися в инфициро- ванных эукариотических клетках; 2) гетерогенную, в состав кото- рой входят энзимы, кодируемые ядерным (клеточные гены и мо- бильные генетические элементы) или митохондриальным (ин- троны) геномами клеток, митохондриальными плазмидами, эн- догенными провирусами, интегрированными в ядерный геном. РНК-зависимые ДНК-полимеразы были впервые идентифи- цированы в 1970 г. независимо друг от друга Д. Балтимором — в составе вируса Раушера лейкемии мышей и Г.Теминым и С.Ми- зутани — в составе вируса саркомы Рауса. Эти ретровирусные эн- зимы, появляющиеся в эукариотических клетках при репродук- ции ретровирусных частиц, широко исследованы в фундаменталь- ном и прикладном аспектах. Очищенный фермент вируса сарко- мы Рауса (RSV), колируемый геном pol, является мультифункци- опальным энзимом, с которым ассоциировано несколько энзи- матических активностей: РНК-зависимая ДНК-полимераза, ДНК- зависимая ДНК-полимераза, РНКаза Н, эндонуклеаза (интегра- за), полипуклеотид-расплетающая активность. Функция энзимати- ческих активностей, кодируемых геном pol, связана с репликаци- ей вирусов и интефацией их ДНК-копий в геном клетки-хозяина. Каждый вирион ретровирусов содержит две идентичные цепи РНК размером от 8000 до 10 000 нуклеотидов. Области 5'- и 3'- концов обеих цепей модифицированы, каку всех эукариотических мРНК (5'-кэпы, З'-полиадениловые хвосты). Вирусные РНК име- ют 5 структурных элементов: 1) прямые повторы на 5'- и З'-концах РНК (R); 2) последовательность из 80—120 нуклеотидов, нахо- дящуюся около 5'-концевого повтора (U5); 3) последовательность 233
из 170—1200 нуклеотидов — около З'-концевого повтора (U3); 4) последовательность из 15 — 20 нуклеотидов (Р), в пределах кото- рой клеточная тРНК комплементарно взаимодействует с ретро- вирусной РНК, что создает праймер для синтеза первой цепи ДНК; 5) сегмент Ри, находящийся непосредственно перед повтором U3 и являющийся сайтом для праймирования второй цепи ДНК — такой сегмент одинаков у РНК всех ретровирусов определенного типа. Этапы обратной транскрипции представлены на рис. 114. Этап 1. Наращивание тРНК-нраймсра на матрицах U5 и R в направлении 3' —>5'. Роль РНК-праймера выполняет одна из кле- точных тРНК (например, триптофановая, пролиновая и т.д.). На расстоянии примерно 100—200 нуклеотидов от 5'-конца РНК (для каждого вируса — это величина постоянная) имеется участок, комплементарный З'-копнсвой последовательности молекулы тРНК, который используется в качестве затравки. Этот участок обычно обозначают как pbs (от англ, primer binding site — участок связывания затравки). Обратная транскриптаза синтезирует сег- мент ДНК, комплементарный 5'-кониевой последовательности вирусной РНК. Этот сегмент принято называть (-) «strong—stop» ДНК, поскольку синтез ДНК после завершения копирования 5'- конца матрицы временно останавливается. (-) «strong—stop» ДНК содержит последовательности, комплементарные концевому рай- ону R и району U5. На первый взгляд может показаться стран- ным. что синтез ДНК начинается недалеко от 5'-копца матрицы и образуется короткий продукт. Но этот короткий продукт (-) «strong —stop» имеет последовательность, комплементарную так- же и З'-копцу вирусной РНК, а как известно, для снятия ДНК- копии с З'-коица матрицы всегда требуется праймер. У ретровиру- сов комплемент З'-конца матрицы производится в «удобном» ме- сте, а затем переносится на «свое» место. Это происходит следую- щим образом: 5'-конец вирусной РНК, образующий дуплекс с (-) «strong —stop» ДНК, разрушается под влиянием присущей обрат- ной транскриптазе активности РНКазы Н. Этап 2. РНКаза Н, специфичная к РНК в составе гибридно- го PHК-ДНК-дуплекса, расщепляет сегмент РНК этого дуплекса. В результате (-) «strong —stop» (RU5) оказывается в однопитевой форме и может взаимодействовать с З'-концом (с участком R) той же самой или другой молекулы вирусной РНК, поскольку на З'-конце РНК имеется повтор R. Этап 3. Новосинтсзированная короткая цепь ДНК вместе с праймером «перепрыгивает» на З'-конец матрицы и взаимодей- ствует там с комплементарным ей участком R. Этап 4. Цепь ДНК удлиняется, в качестве матрицы использу- ется остальная часть вирусной РНК. На этой стадии в качестве затравки выступает уже (-) «strong—stop» ДНК; элонгация за- травки приводит к синтезу (-) цепи ДНК, в которой отсутствует 234
Геномная РНК 5 (В Наращивание ^5 тРНК с обра- ДНКЗ зованием ДНК- 5 ( копии 5'-конца геномной РНК (4) Наращивание цепи ДНК (7) Удаление оставшейся части РНК и тРНК (8) Второй прыжок 5' (9) Синтез обеих цепей завершен тРНК 3' U5 U5 U5 з- (6) Синтез З'-конца второй цепи ДНК (5) Большая часть гибридизовавшейся РНК удаляется РНКазой Н (3) Первый прыжок: ДНК гибридизируется с R-последовательностью на другом конце мРНК (2) РНКаза Н удаляет гибрндизовавшуюся РНК из из из из из из У*7///Л U5 U3 U5 |U3 1)51 I.TR U5 5' ё~~03' U5 из U5 U3 U5 ь мш/д. 3' U5 U3 U5 ~ 5' 3' I___________I LTR [еЖЯЖИйй Рис. 114. Схема обратной транскрипции ретровирусной РНК с образова- нием линейной лвуцепочечпой ДНК (Darnell J., et. al. // Molecular Cell Biology. — N.Y.: Scientific Атсг. Books, 1986. — P. 1052) 235
комплемент района RU5, поскольку соответствующий участок (+) матрицы был разрушен РНКазой Н. Этап 5. К моменту завершения синтеза первой цепи ДНК боль- шая часть вирусной РНК разрушается РНКазой Н. Этап б. Синтез З'-конца второй цепи ДНК. Этап 7. Удаление тРНК и оставшегося участка вирусной (+) РНК РНКазой И. Этап 8. Второй прыжок, в результате которого новосинтезиро- вапная вторая цепь ДНК комплементарно взаимодействует с тРНК- связывающсй последовательностью первой цепи. Этап 9. Удлинение З'-концов каждой цепи, образование дуп- лекса ДНК. Вся предс тавленная последовательность реакций протекает без явного участия ферментов репликации клетки-хозяина (топоизо- меразы, хеликазы, праймазы, ДНК-связывающего белка, лигазы и т.д.). При этом следует отмстить, что молекулы вирусных ДНК длиннее молекул вирусных РНК, которые послужили матрицей для обратной транскрипции. Действительно, к 5'-концу (+) цепи вирусной ДНК добавилась последовательность U3, а к З'-концу этой цени — последовательность U5. В результате на концах моле- кулы вирус-спецпфичсской ДНК появился длинный (несколько сотен нуклеотидов) концевой повтор (ДКП или LTR), имеющий структуру U3U5. События, происходящие с двуцепочечной фор- мой ретровирусной ДНК, описаны па с. 128. Гетерогенная группа обратных транскриптаз малопзучсна и представляет огромный интерес в области исследования струк- турной организации генома, эволюции организмов и регуляции экспрессии генов. Наиболее исследованной обратной транскрип- тазой из этой группы является теломераза. РНК включена в струк- туру самого фермента (см. с. 231). С помощью обратных транскрип- таз гетерогенной группы синтезируются неактивные копии кле- точных генов — нссвдогены, LINE- п Alu-последоватсльности, ретропозоны с ДКП (см. с. 182, 183) и др. Обратные транскриптазы in vivo индуцируются в определен- ные периоды жизни клетки и всего организма и их функциониро- вание может быть резко ограничено во времени и/или некоторы- ми тканями/клетками многоклеточного организма. Разная субкле- точная локализация последовательностей ДНК, кодирующих об- ратные транскриптазы и различные свойства этих ферментов, позволяют предполагать, что они могут контролировать различ- ные локальные функции в клетке. Синтез ДНК на РНК-матрице in vitro используется в генети- ческой инженерии для синтеза генов и их фрагментов, а также синтеза кДНКдля физического картирования геномов и расшиф- ровки первичной структуры РНК и белков (см. с. 358).
Глава 8. ГЕНЕТИЧЕСКАЯ РЕКОМБИНАЦИЯ Под генетической рекомбинацией понимают процессы, приво- дящие к перераспределению нуклеотидных последовательностей в геномах. Эти процессы лежат в основе генетической изменчиво- сти, позволяющей организмам приспосабливаться к окружающей среде и обеспечивать длительное существование видов. На возможность генетической рекомбинации как обмена участ- ками гомологичных хромосом впервые указал в 1903 г. Т. Бовери. Доказательства обмена генами между хромосомами были впервые получены Т. X. Морганом в 1919 г. В настоящее время генетиче- скую рекомбинацию подразделяют на два больших класса: общую рекомбинацию и сайт-специфическую («незаконную») рекомби- нацию. Общая рекомбинация. В ходе общей рекомбинации обмен гене- тическим материалом происходит между гомологичными нуклео- тидными последовательностями ДНК, чаще всего между двумя копиями одной и той же хромосомы. Самый известный пример такого рода рекомбинации — это обмен участками гомологичных хромосом в процессе мейоза. В профазе 1 мейоза происходит крос- сииговер (перекрест), когда хромосомы обмениваются участками. Кросспнговер способен таким образом «перетасовывать» гены любой хромосомы". У прокариот, не обладающих мейозом, тем нс менее также наблюдается общая рекомбинация, приуроченная к м итоти чес кому дел е н и ю. В процессе рекомбинации у Е. coli принимают участие несколько белков, обеспечивающих поиск и рекомбинацию гомологичных последовательностей ДНК. Так, белок RecBCD присоединяется к двойной спирали ДНК и движется вдоль молекулы, осуществляя се расплетание в поиске сайта рекомбинации (рис. 115). Этот бе- лок действует как хеликаза, расплетая двойную спираль ДНК, и перемещается вдоль нес со скоростью 300 нуклеотидов в секунду пока не обнаружит консенсусную восьминуклеотидную последо- вательность в сайте рекомбинации. Затем белок RecBCD, действуя как нуклеаза, осуществляет разрыв в одной из цепей ДНК, в ре- зультате чего высвобождается небольшой одноцепочечный учас- ток ДНК, который может провзаимодействовать с комплемен- тарным участком другой молекулы ДНК. Для обеспечения комп- 237
Рис. 115. Начальные этапы общей рекомбинации между двумя гомоло- гичными двойными спиралями ДНК: /I — белок RecBCD движется вдоль молекулы ДНК, осуществляя ее расплета- ние. а затем разрыв одной из испей ДНК; Б — после разрыва одной из цепей ДНК образовавшийся «ус* внедряется во вторую спираль, образуя короткий спа- ренный участок. Белок RccA удерживает вместе одиночную цепь и двойную спи- раль ДНК. Белок RecA и SSB-белок присоединяются к ДНК в виде групп молекул лсментарного взаимодействия высвободившийся участок одной из цепей ДНК, называемый «ус», поддерживается в вытянутом (ли- нейном) состоянии с помощью SSB-белка. Этот белок участвует как в репликации бактериальных ДНК (см. гл. 7), так и в их реком- бинации, кооперативно взаимодействуя с сахарофосфатным ос- товом всех одноцепочечных участков ДНК и создавая таким обра- зом условия для комплементарного взаимодействия азотистых оснований. В холе рекомбинации SSB-белок действует в комплек- се с белком RccA, который удерживает вместе одиночную цепь и двойную спираль ДНК (см. рис. 115). Небольшой ио размеру белок RecA (мол. масса 38 кДа) имеет два различных участка для связы- вания взаимодействующих (спаривающихся) в ходе рекомбина- ции цепей ДНК. Белки RecBCD и RecA также обладают ДНК- зависимой АТРазной активностью, и интенсивный гидролиз АТР до ADP наблюдается в процессе присоединения этих белков к ДНК. Так же как SSB-белок, белок RecA присоединяется к взаи- модействующим цепям ДНК в виде групп молекул (кластеров), и совокупное действие этих двух белков создает условие для эффек- тивной рекомбинации. В точке рекомбинации возникает гетеро- дуплексное (ступенчатое) соединение молекул ДНК (рис. Нб), которое может включать взаимодействие нескольких тысяч пар 238
Рис. I [6. Общая схема генетической рекомби- нации с перекрещиванием цепей: 1 — обмен без кроссинговера; II — обмен с крос- еннговером, при котором происходит вращение элементов крестообразной структуры относитель- но двух указанных осей. Этот вариант приводит к более масштабным перестройкам между гомологич- ными молекулами ДПК (детали не указаны). Остальные пояснения см. в тексте | 1-й разрыв Сшивание Генетический обмен без кроссинговера Генетический обмен с кроссинговсром 239
оснований. Затем происходит разрыв в другой цепи ДНК, создаю- щий предпосылки для рекомбинации с перекрещиванием цепей. При этом возникает характерная крестообразная структура, предложен- ная Р.Холлидеем в 1964 г., разрыв и сшивание которой завершает общую рекомбинацию в отсутствие кроссииговера. Точности раз- рыва н воссоединения оказываются столь высоки, что ни один нук- леотид не утрачивается и не добавляется, и вместе с тем молеку- лы ДНК обмениваются значительными по размерам участками, а содержащие их клетки обновляют свой генетический потенциал. При кросспнговере в крестообразной структуре могут проис- ходить вращения составляющих се элементов относительно друг друга (см. рис. 116). Эти вращения, сопровождающиеся изомериза- цией цепей, создают условия для более крупномасштабного об- мена участками между молекулами ДНК. Таким образом, у эука- риот в результате генетической рекомбинации с кроссинговером осуществляется перемещение из хромосомы в хромосому боль- ших гомологичных последовательностей, однако общая последо- вательность расположения генов в хромосоме не нарушается. Со- вершенно иные последствия может вызвать сайт-специфическая рекомби нация. Сайт-специфическая рекомбинация не требует гомологии ДНК. В этом случае в обмен вступают короткие специфические нуклео- тидные последовательности ДНК. При этом изменяется распреде- ление нуклеотидных последовательностей в геноме. Существует особый фермент рекомбинации, который «узнает» специфические последовательности в одной или двух рекомбинирующих молеку- лах ДНК, а комплементарного спаривания протяженных участков нс происходит. Первая исследованная система такой рекомбинации — это вклю- чение бактериофага л в ДНК Е. coli. Фермент, осуществляющий этот процесс, называют лямбда-интегразой. Данный фермент свя- зывает между собой ДНК бактериофага и определенный участок ДНК бактерии, разрывая цепи обеих молекул, а после взаимо- действия фаговой и бактериальной ДНК сшивает их (рис. 117). Таким образом ДНК фага оказывается интегрированной в геном клетки-хозяина. Интеграза кодируется геномом бактериофага и может осуществ- лять обратный выход его ДНК из ДНК бактерии (см. схему па с. 60). Лямбда-интеграза представляет собой «обратимую нуклеазу»', этот фермент способен как нуклеаза разрывать фосфодиэфир! 1ые свя- зи в молекулах ДНК, а затем снова сшивать их, действуя как ли- газа. Таким образом, лямбда-интеграза действует аналогии но ДНК- топоизомеразе (гиразе') бактерий, которая, как описано в гл. 3, вносит обратимые разрывы в цепи ДНК в процессе репликации. Сайт-специфическая рекомбинация лежит в основе перемеще- ния генов в пределах одной молекулы ДНК и объясняет, таким 240
Рис. 117. Сайт-специфическая рекомби- нация, посредством которой кольце- вая молекула ДНК фага к внедряется в хромосому клетки бактерии (П-епс- цифическис последовательности, оп- ределяющие место внедрения фаговой ДНК) образом, феномен «прыгающих» генов (подвижных генетических элементов), свойственных как про-, так и эукариотам. Подвиж- ные элементы (IS-элементы и транспозоны) прокариот и мобиль- ные диспергированные гены (ретротранспозоны) эукариот также представляют собой мощный элемент рекомбинации. Она ие только создает условия для сохранения видов, но и является (по крайней мере, для эукариот) мощным фактором эволюции. Массовые пе- рестройки в геноме могут, вероятно, приводить к «эволюцион- ным взрывам» — скачкообразному возникновению новых видов и/или гибели ранее существующих организмов. Особенности структуры, механизмы перемещения подвижных генетических элементов и молекулярные последствия этих процессов рассмот- рены в гл. 7. В связи с тем что рекомбинация может затрагивать как кодиру- ющие, так и регуляторные последовательности геномов, она мо- жет выступать как один из способов регуляции экспрессии генов. Данные перестройки наблюдаются, в частности, в повторяющих- ся последовательностях геномов многих организмов, которые мо- гут находиться по отношению друг к дру1у либо в прямой, либо в обратной ориентации, и носят название обращенных повторов (см. гл. 5). Такого рода сайт-специфнчсские инверсии участков хромо- сом наблюдаются у бактерий (£. coll, Salmonella typhimurium и др.) и бактериофагов (Pl, Р7). Они состоят в поворотах на 180° опреде- ленных сегментов хромосом, происходящих при участии особых ферментов — инвертаз, изменяют ориентацию генов относитель- но их промоторов и тем самым альтернативно влияют на их транс- крипцию. Существуют определенные свидетельства того, что та- кие перестройки, несмотря на их случайный характер, имеют при- способительное значение для бактерий. Перестройки в геномах могут носить запрограммированный характер на определенных стадиях дифференцировки клеток, что выявлено, в частности, при дифференцировке гетероцист у циа- 241
нобактсрий. В этом случае наблюдается удаление вставочных ДНК- элементов, которые встроены в кодирующие последовательности определенных генов. Эти элементы, несущие на концах короткие прямые повторы, удаляются на определенной стадии развития клеток специфическими ферментами — рекомбиназами, способ- ными далее осуществлять объединение разделенных частей генов путем рекомбинации между их повторами. К запрограммированным перестройкам относится и форми- рование генов иммуноглобулинов в клетках-предшественниках В-лимфоцитов позвоночных животных. Сборка этих генов осуще- ствляется пнем рекомбинации и совмещения разобщенных фраг- ментов, а затем (после объединения со специальным промото- ром) происходят транскрипция и биосинтез разнообразных мо- лекул иммуноглобулинов в В-лимфоцитах. Сходные процессы имеют место и при дифференцировке Т-лимфоцитов. Во всех дру- гих соматических клетках животных фрагменты генов иммуногло- булинов остаются разобщенными и биосинтез иммуноглобулинов не происходит. В заключение отметим, что генетическая рекомбинация вклю- чает в себя возможность рекомбинации РНК-геномов, свойствен- ных многим вирусам. Механизмы рекомбинации РНК еще недо- статочно изучены. У ряда вирусов, например вирусов гриппа, ре- комбинация осуществляется как обмен целыми молекулами РНК, что обеспечивает высокую изменчивость вирусов и соответствен- но затрудняет борьбу с ними. PHК-содсржащис бактериофаги (фаг QP и родственные ему) также способны к рекомбинации, приво- дящей к образованию новых молекул РНК, причем партнерами в такой рекомбинации могут выступать как природные, так и полу- ченные искусственным путем (синтетические) молекулы РНК. Последнее обстоятельство используется при синтезе антисмысло- вых РНК и рибозимов с целью создания специфических препара- тов для борьбы с вирусными инфекциями. Важные перспективы имеют исследования в области получения рекомбинантных РНК и дня разработки систем внеклеточного синтеза белков (см. гл. 14).
Глава 9. ТРАНСКРИПЦИЯ Транскрипцией называют биосинтез РНК на матрице ДНК. Это первая стадия реализации генетической информации, в процессе которой определенные участки нуклеотидной последовательно- сти ДНК «переписываются» в комплементарные одноцепочечные молекулы РНК. В результате транскрипции образуются мРНК, ко- дирующие аминокислотные последовательности белков, а также тРНК, рРНК и другие виды РНК, выполняющие структурные, регуляторные и каталитические функции. В основе транскрипции лежит фундаментальный принцип комплементарности азотистых оснований полинуклеотидных цепей ДНК и РНК, а сам процесс осуществляется с участием соответствующих ферментов — РНК- полимераз, и большой группы белков — регуляторов транскрип- ции. Относительно детально изучены этапы и механизмы регуля- ции транскрипции прокариотических геномов, тогда как детали транскрипции у эукариот известны пока далеко не в полной мере. Вместе с тем в общей системе контроля реализации генетической информации контроль на уровне транскрипции представляет со- бой, несомненно, наиболее важный этап, ответственный за диф- ференциальную активность генов в онтогенезе любого организ- ма, и сложность организации этого кон троля, прогрессивно уве- личивающаяся в эволюции, лишний раз подтверждает фундамен- тальное значение транскрипции в реализации программы жизни. Поскольку ДНК у подавляющего большинства организмов пред- ставляет собой двуцепочечные молекулы, составленные из комп- лементарных (но не идентичных) цепей, транскрипции подвер- гается обычно одна из них, носящая название матричной цепи (матрицы): rrtriz 5'-ATGATTGGGGCTCTA-3' смысловая цепь 3'-TACTAACCCCGAGAT-5' матричная цепь | Транскрипция РНК AUGAUUGGGGCUCUA Различные РНК обычно транскрибируются с одной из цепей дуплексного генома, однако у некоторых геномов (как у бактерио- фага ТД матрицей могут служить разные цепи ДНК. В случае пе- 243
рекрыБающихся генов матрицами для молекул РНК, транскри- бируемых в противоположных направлениях, служат обе цепи ДНК в одной и той же области ее молекулы, как это имеет место у бактериофага к: РНК 3'----------5' Транскрипция 5’i----------------13' ДНК----------— — — Транскрипция 5'--------*-3' РНК Синтез РНК на матрице ДНК недуг РНК-полимеразы (ДНК- завнеимые), которые, как и ДНК-полимеразы, относятся к ipyn- пе нуклеотидилтрансфераз, использующих в качестве субстратов пуклеозид-5'-трпфосфаты. Так же как ДНК-полимеразы, РНК- полимеразы активны только в присутствии ионов Mg2", для свя- зывания которых в их молекуле существует консенсусная амино- кислотная последовательность из 10 аминокислотных остатков. РНК-полимеразы в отличие от ДНК-полимераз не нуждаются в праймере и используют рибонуклеозид-5'-трифосфаты (АТР, GTP, СТР, UTP). Рост цепи РНК происходит путем последовательного присоединения рпбонуклеозид-5'-.монофосфатов к З'-гидроксиль- ной группе рибозы предшествующего нуклеотида (т. е. в направле- нии 5'—>3')- Последовательность нуклеотидов в синтезируемом РНК-транскрипте определяется комплементарными взаимодей- ствиями азотистых оснований, используемых для синтеза рибо- нуклеотидов, с азотистыми основаниями матричной цепи ДНК (рис. 118). Разные виды РНК у эукариот синтезируются различны- ми РНК-полимсразами, тогда как у бактерий один фермент син- тезирует все виды РНК. У всех без исключения организмов процессу транскрипции под- вергается единовременно нс вся молекула ДНК, а только опреде- ленные ее участки — транскриптоны. Они ограничены двумя по- следовательностями, которые называются промотором (зона нача- ла транскрипции) и терминатором (зона остановки транскрипции). Трапскриптоны бактерий (их структура рассмотрена ниже) назы- вают оперонами. Оперопы обычно включают в себя нуклеотидные последовательности, кодирующие структуру нескольких белков, называемые цистронами, пли структурными генами. Поэтому син- тезируемая на опсронах бактерий мРНК является полицистроновой и может быть использована для синтеза нескольких белков, в отли- чие от моноцистроновых мРНК высших организмов, служащих мат- рицами для синтеза одного определенного белка. На интенсивность транскрипции существенное влияние ока- зывает пространственная структура ДНК, в которой нередко на- 244
Матричная цепь ДНК. Рис. 118. Синтез РНК па матричной цепи ДНК. Последовательность нуклеотидов в синтезируемой молекуле РНК определяется нуклеотидной последовательностью матричной цепи ДНК. В основе процесса лежит принцип комплемснтарпости. Субстратами для синтеза служат рибопуклеозид- трпфосфаты. К З'-коииу растущей цепи РНК присоединяется пуклсозндмоно- фосфат. а высвободившийся пирофосфат быстро гидролизуется до двух молекул неорганического фосфата, что делает реакцию энергетически выгодной н не- обратимой 245
блюдаются изгибы, петли (домены), а также сверхспирализован- ные участки. Все эти мотивы структуры ДНК нередко способству- ют усилению транскрипции, поскольку создают дополнительные возможности для присоединения к ДНК разнообразных белков- регуляторов транскрипции. Эти белки способны связываться с определенными нуклеотидными последовательностями ДНК, рас- положенными как в самих транскриптонах, так и в других, не- редко достаточно удаленных от зоны транскрипции областях, но- сящих название энхансеров (усилителей) и адаптерных элементов. В последнем случае воздействие регуляторных элементов генома может опосредоваться особыми белками, способствующими уси- лению или ослаблению интенсивности транскрипции. Сами белки-регуляторы транскрипции приобретают или утра- чивают функциональную активность в результате модификаций, вызываемых либо каталитически активными белками-фермента- ми, либо возникающих при соединении с веществами небелко- вой природы, модулирующими их регуляторные свойства. У при- митивных форм жизни в регуляции транскрипции непосредственно участвуют различные клеточные метаболиты (углеводы, амино- кислоты, нуклеотиды и др.). У эукариот транскрипция непосред- ственно связана с изменением структуры хроматина — белково- нуклеинового комплекса, в котором постоянно пребывают их ДНК. Переход этого комплекса в активную (транскрибируемую) форму представляет собой дополнительный элемент регуляции транскрип- ции у высших организмов. ТРАНСКРИПЦИЯ У ПРОКАРИОТ Бактериальные РНК-полимеразы — сложные белки, состоя- щие из нескольких субъединиц. Наиболее изученный из них фер- мент Е. coli содержит пять постоянно присутствующих протоме- ров: две субъединицы а и по одной [3, р' и со (конститутивные субъединицы, составляющие основу фермента, называемую ка- рам). После присоединения к кору еще одной субъединицы — ст- фактора — образуется холофермент РНК-полимераза, способная узнавать промоторную область в оперонах бактерий и иницииро- вать процесс транскрипции. Молекулярные массы а-, р-, Р'- и со- субъсдиниц составляют соответственно 36,5; 150; 155 и 70—80 кДа, а холофермента — 487 кДа. По нуклеотидной последовательности генов реконструирована полная аминокислотная последователь- ность каждой субъединицы РНК-полимеразы Е. coli. Методом фут- принтинга установлено, что при взаимодействии с ДНК фермент «закрывает» 60 пар нуклеотидов. р-Субъединица участвует в свя- зывании рибоиуклеозидтрифосфатов и построении полинуклсо- тидной цепи РНК, Р'-субъсдиница осуществляет связывание ДНК, 246
а комплекс а- п Р'-субъединиц (a2p') служит для специфического взаимодействия с промоторами — нуклеотидными последователь- ностями ДНК, детерминирующими инициацию транскрипции. Функции ы-субъсдиницы не установлены. Узнавание промоторов происходит только после присоединения к кор-ферменту ст-фак- тора. После инициации синтеза РНК ст-субъединица отделяется от холофермента и дальнейшая транскрипция (элонгация цепи РНК) осуществляется кор-ферментом. Здесь следует заметить, что столь сложное структурно-функциональное устройство РНК-по- лнмераз бактерий (и еще более сложная организация РНК-поли- мераз эукариот, в составе которых, по разным оценкам, содер- жится от 12 до 18 различных субъединиц) пока нс имеет отчетли- вого объяснения, поскольку известно, что PHК-полимеразы не- которых бактериофагов вполне компетентны в синтезе РНК, не- смотря на то что состоят всего-навсего из одной полипептидной цепи с молекулярной массой не более 100 кДа. Синтез РНК требует локального расплетания двуцепочечной молекулы ДНК с тем, чтобы PH К-полимераза получила доступ к азотистым основаниям матрицы. Имеющиеся данные говорят о том, что PHК-полимераза расплетает (раскручивает) двуцепочечную молекулу ДНК с помощью особого ДНК-раскручиваютцего сайта, вступая во взаимодейс твие с матрицей благодаря наличию в се струк- туре «цинковых пальцев» (см. рис. 129). Перемещаясь вдоль двой- ной спирали ДНК, PH К-пол и мераза непрерывно раскручивает спираль впереди того участка, где происходит синтез РНК и где на короткое время образуется так называемый открытый комп- лекс, внутри которого возникает РНК-ДНК-спираль длиной около ’20 нуклеотидов. Затем фермент (вероятно, с помощью специально- го сайта) вновь закручивает ДНК позади участка полимеризации РНК, и готовая часть РНК-транскрипта выводится из комплекса через особый каши, свойственный РНК-полимеразе (рис. 119). Скорость синтеза РНК у бактерий составляет -30 нуклеотидов в 1 с, однако она нс постоянна и может несколько снижаться. Такие периоды носят название пауз транскрипции, их причины не вполне ясны. Для эффективного продолжения (элонгации) транскрипции изначально присоединившийся к РНК-полимеразе ст-фактор дол- жен быть замещен фактором элонгации (одним из этих факторов является белок NusA Е. coli). Инициация транскрипции происходит в зоне промотора — осо- бой нуклеотидной последовательности ДНК, которая содержит сигнал начала транскрипции (старт-сигнал). В области старт-сиг- пала располагаются две консенсусные последовательности, выяв- ленные у многих сильных промоторов Е. coli'. последовательность 5'-ТАТАТТ-3' (расположена на расстоянии 10 нуклеотидов от точки начала транскрипции), последовательность 5'-TTGACA-3' (уда- 247
Рис. 119. Схема транскрипции, катализируемо ft РНК-полиме- разой Е. coli'. / — осуществление РНК-полпме- разой после присоединения ст-фак- тора (фактор инициации) поиска промотора; 2 — образование за- крытого промоторного комплекса: РНК-полимераза связывается с зоной промотора ДНК: 3 — обра- зование открытого комплекса: РНК-полимераза раскручивает двойную спираль ДНК. получает доступ к азотистым основаниям матричной цепи и начинает син- тез РНК (сталия ипинпапии); 4 — отсоединение ст-фактора н присо- единение фактора элонгации соз- дают условия для элонгации транс- крипции: РНК-полимераза быст- ро продвигается по ДНК. раскру- чивая се двойную спираль, синте- зирует РНК и вновь закручивает спираль ДНК позади места синте- за РНК; 5 — завершение (терми- нация) синтеза РНК: РНК-полп- мераза достигает зоны терминато- ра, где синтез РНК прекращается (см. рис. 120); 6— высвобождение готовой РНК-транскрипта в виде копии матричной цепи ДНК 248
лена от точки начала транскрипции на 35 нуклеотидов). Обе эти последовательности выведены на основе анализа нескольких де- сятков различных промоторов и их принято обозначать на немат- ричной (смысловой цепи) ДНК. Последнее обстоятельство имеет важ- ное значение в связи с тем, что для транскрипции существенна ориентация промотора: именно она определяет ту цепь ДНК, ко- торая служит матрицей для синтеза РНК. На консенсусные после- довательности (боксы), очевидно, и ориентируется холофермент РНК-полимераза, осуществляя поиск точки начала транскрип- ции. Последовательность 5'-ТАТАТТ-3' называется также ТАТА- боксом, или Прибнов-боксом — в честь ее открывателя. В области ТАТА-бокса, очевидно, происходит открытие промотора (локаль- ное плавление относительно непрочно связанных между собой двумя водородными связями комплементарных пар А : Т в дуплексе ДНК), что и приводит к образованию открытого комплекса (см. рис. 119) и инициации транскрипции. Терминация транскрипции также определяется особой нуклео- тидной последовательностью в ДНК, расположенной в зоне тер- минатора бактериальных оперонов и называемой стоп-сигналом. В стоп-сигнале имеется GC-богатый участок, обладающий цент- ральной симметрией и представляющий собой самокомплемен- тарную нуклеотидную последовательность. За этим участком на матричной цепи расположена одиго(А)-последоватсльность (4 — 8 адениловых нуклеотида подряд). Транскрипция в области GC-бо- гатого сайта приводит к тому, что в образовавшемся РНК-транс- крипте быстро образуется устойчивый элемент вторичной струк- туры — шпилька (спирализоваипая область, содержащая компле- ментарные GC-пары), которая нарушает прочность гибридиза- ции ДНК : РНК в открытом комплексе и вытесняет РНК-поли- меразу из комплекса (рис. 120). Кроме этого транскрипция олн- го(А)-последовательности в матричной цепи ведет к образованию участка РНК:ДНК дуплекса, составленного из непрочных (лег- коплавких) A:U-nap, что также способствует разрушению кон- такта между транскрибируемой цепью ДНК и молекулой РНК. Таким образом, сразу после образования шпильки происходит вы- свобождение синтезированной РНК, отсоединение РНК-полиме- разы и восстановление двуспиралыюй структуры ДНК, причем решающим моментом в этом процессе является образование тер- минирующей шпильки в составе РНК. Часть терминаторов узнается РНК-полимеразой только с по- мощью белкового фактора терминации — р(ро)-фактора. Этот бе- лок с молекулярной массой 46 кДа образует гексамер (6 -46 кДа), способный связываться с областью терминатора. Установлено, что он присоединяется к РНК-продукту непосредственно перед тер- минатором. Фактор р обладает МТРазной активностью, и катали- зируемая им реакция гидролиза нуклеозидтрифосфатов (NTP) 249
Промотор /1 -35 -10 +1 I I A 5'-TAGTGATTGACATGATAGAAGCACTCTACTATATTCTCAATAGGTCCACG-3' 3'-ATCACTAACTGTACTATCTTCGTGAGATGATATAAGAGTTATCCAGGTGC-5' ДНК-№1рииа ▼ i I Транскрипция Начало цепи РНК 5'--------► 3’ AGGUCCACG Терминатор 5'— С С С A C A G С C G С C A G T T С C G С T G G C G G С A T T T T А А С T T T С T T T A A T G A — 3' 3’—G G GT GT С G G С G GT С A A G G С G А С С G С С G Т АЛ А А Т Т G A A A G А А А Т Т А С Т —5' ДНК-м:пр>иш I I Транскрипция 5’- C CCA C A GC CG С C A G UU C CG CUGGCGG C A UUUU- ОН 3’ РНК-транскршгт I I Быстрая укладка цепи РНК С U С U G G-C A-U C-G C-G G-C C-G C-G Образовавшаяся «шпилька» способствует пре- кращению синтеза А А 5'—СССАС UUUU-OH 3' Рис. 120. Последовательности промотора (Я) и терминатора (5), узнаваемые РНК-поли- мсразой Е. coli (по Б.Албертсу и лр., 1994). Присоединение PH К-полимеразы детерминиру- ется наличием в промоторе двух консенсусных последовательностей (выделены жирно), отсто- ящих на 10 п 35 нуклеотидов отточки (+1) нача- ла синтеза РНК. Остановка синтеза связана с образованием характерного элемента вторичной структуры («шпильки») в синтезируемом РНК- транскрипте. Синтезированный РНК-трапскрппт отделяется от ДНК-матрицы после разрыва не- прочно связанных между собой o.uiro(U)- и олиго (А)-последовательностей в гибриде РНК:ДНК
ведет к высвобождению энергии, которая влияет на его конфор- мацию. Изменение конформации р-фактора, вероятно, способ- ствует вытеснению РНК или РНК-полимеразы из транскрипци- онного комплекса. . РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ Вопрос о регуляции транскрипции имеет важное значение для понимания механизмов дифференциальной активности (экспрессии) генов в онтогенезе любого про- или эукариотического организма. Путем регуляции генной экспрессии клетки приспосабливают свой фенотип к изменяющимся условиям внешней и внутренней сре- ды. Фенотип клеток в свою очередь определяется количеством и Д РНК-полимераза Транскрипция Рибосома мРНК -Белок 5' Трансляция ДНК Б Ядро УР дн^”ПЦИЯ Кэпированис у^ |®=^^АААД Полиаденилировапие =3' „ Кэп 5'® — мРНК Сплайсинг 3' Транспорт Цитоплазма АААА Рис. 121. Различия в транскрипции и трансляции у прокариот (/1) и эука- риот (Б). Транскрипция и трансляция у эукариот разделены во времени и пространстве: транскрипция происходит в ядре, а трансляция (биосинтез белка) — в цито- плазме. Между транскрипцией ДНК и трансляцией РНК происходит процессинг и транспорт РНК. Транскрипция и трансляция у прокариот совершаются одновременно 251
свойствами продуцируемых ими структурных, каталитических, регуляторных или других классов белков. Иными словами, должна существовать эффективная система контроля реализации генети- ческой информации в клетке, позволяющая в каждый момент ее существования синтезировать и поддерживать в функционально активном состоянии необходимое и достаточное количество раз- ных белков. У бактерий набор белков регулируется в основном наличием мРНК, пригодных для биосинтеза белка (трансляции), регуляцией самого процесса трансляции в рибосомальном аппа- рате клетки, а также регуляцией процессов деградации (протео- лиза) белков. У эукариот белковый пул в клетке может дополни- тельно контролироваться с помощью процессов созревания (про- цессинга) первичных транскриптов и транспорта зрелых РНК из ядра в цитоплазму. Дополнительные возможности контроля клет- ки эукариот приобрели в результате разобщения в пространстве и времени процессов транскрипции (происходит в ядрах) и транс- ляции (происходит в цитоплазме). У прокариот транскрипция и трансляция происходят практически единовременно в едином неструктурированном клеточном содержимом: синтез РНК на ДНК-матрице еще продолжается, а уже начинается трансляция содержащейся в ней генетической информации в структуру бел- ков с участием рибосом, тРНК и белковых факторов трансляции (рис. 121). В любом случае первым и главным элементом контроля реали- зации потока генетической информации на пути от ДНК к белку у всех организмов является контроль на уровне транскрипции. РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ У ПРОКАРИОТ Транскрипция у прокариот регулируется преимущественно на стадии инициации и связана с деятельностью регуляторных бел- ков — активаторов и репрессоров транскрипции. В ходе элонгации транскрипции важное значение приобретает вторичная структура синтезированной РНК: от нее во многом зависит, будут ли синте- зированы полноразмерные молекулы, либо процесс остановится па синтезе коротких функционально непригодных транскриптов. Регуляция транскрипции у бактерии обычно охватывает группу (кластер) генов, кодирующих функционально родственные бел- ки, участвующие в осуществлении тесно связанных между собой химических превращений в клетке. Такими белками обычно явля- ются ферменты, занятые осуществлением серии реакций (мета- болическим путем), ведущих к распаду или синтезу тех или иных соединений. Группа согласованно регулируемых генов, кодиру- ющих эти ферменты, называется опероном. К наиболее хорошо изученным оперонам бактерий относятся лактозный (1ас)-оперон, 252
галактозный (gal)-onepoH и триптофановый (trp)-onepon Е. coli. В состав каждого из этих оперонов входят несколько структурных генов, кодирующих ферменты, а также регуляторные области — промотор (место присоединения РНК-полимеразы) и оператор — участок оперона, к которому присоединяются белки-репрессоры н/или активаторы транскрипции. Зоны промотора и оператора часто перекрываются, и эго объясняет, как белки-регуляторы влияют на инициацию транскрипции. Различают негативную и позитив- ную регуляцию транскрипции оперонов, которые включают не только действие соответствующих регуляторных белков, но и ряда внутриклеточных метаболитов небелковой природы, рассматри- ваемых как корепрессоры или коактиваторы транскрипции. Одной из первых стала известна структура и механизм экс- прессии lac-оперона Е. coli. В его состав входят структурные гены Z, Y и А, кодирующие ферменты, участвующие в метаболизме лактозы — главного пи- тательного дисахарида, на котором растут клетки бактерий. Ген lac Z кодирует фермен т 0-галактозидазу, расщепляющий 0-галак- тозиды, в частности лактозу, с образованием легко метаболизи- руемого моносахарида — глюкозы. Ген lac У кодирует 0-галакто- зндтрансфсразу (пермеазу) — фермент, необходимый для про- никновения 0-галактозидов через клеточную мембрану. Ген lac А кодирует фермент 0-галактозпдтрапсацстилазу, функциональная роль которого до конца нс выяснена. Все эти гены являются инду- цибельными. Их транскрипция и образование соответствующих бел- ков происходит в клетке только тогда, когда в ней накапливается избыток лактозы и ощущается недостаток глюкозы. Помимо структурных генов в состав опсропа входят промотор (40 п.п.) и оператор (27 н.п.). Последний представляет собой ту область, с которой взаимодействует белок-репрессор. Сам lac- pci ipeccop является продуктом экспрессии соответствующего гена (i-гена) и содержится у Е. coli в количестве не более 10 молекул на 1 клетку. Молекулярная масса 1ас-репрессора состамяет 37 кДа, а его активная форма представляет собой гомотстрамер, который связывается с зоной оператора и блокирует действие РНК-поли- мсразы (рис. 122). Такая негативная регуляция транскрипции на- блюдается при достаточной концентрации глюкозы в клетке и в отсутствие избытка лактозы. При избытке р-галактозида (лактозы) его молекулы связыва- ются с субъединицами репрессора с образованием репрессор- индукторного комплекса,, в котором индуктор (0-галактоз ид) выступает в роли аллостерического регулятора, изменяющего кон- формацию белка-репрессора, что ведет к инактивации после- днего. У инактивированного репрессора резко снижается сродство к зоне оператора, в результате чего репрессор отсоединяется от промотора, открывая «вход» для РНК-полимеразы. Вслед за этим 253
Транскрипция Структурные гены нс идет —- X i Р-0 Z Y А Активный репрессор Рис. 122. Схема регуляции лак- тозного оперопа Е. coii: А — лактозный оперон репресси- рован присоединением белка- репрессора к зоне оператора (транскрипция не идет); i — ген белка-репрессора; Р — промотор; О — оператор; Б — дсрепрссспя оперопа путем инактивации бел- ка-репрессора. Происходит транс- крипция структурных генов п синтезируется полнцистроповая lac-мРНК Б Транскрипция Активный репрессор Неактивный репрессор начинается транскрипция оперопа, а затем и синтез ферментов, метабол изи рующи х лактозу. Позитивная регуляция оперопа состоит в индукции транскрип- ции, достигаемой посредством присоединения к промотору ком- плекса, состоящего из САР-белка (белок-активатор катаболити- ческих оперонов) и сАМР — универсального внутриклеточного регулятора многих метаболических процессов. Комплекс САР-сАМР связывается с ДНК в самом начале промотора непосредственно перед сайтом связывания РНК-полимеразы и способен многократ- но (почти в 50 раз) усиливать транскрипцию оперона (рис. 123). Несколько более сложная и своеобразная система регуляции транскрипции свойствена триптофановому (trp-) оперону. Он со- держит пять генов, кодирующих ферменты синтеза триптофана. 254
A I Промотор Область связывания Место присоединения САР-сАМР РНК-поли.мсразы Оператор GTGAGITAGCTCAC С 1еС«ЛСССПТЛСАГТТТАТОСТТСетССТСОТАТСТтаТОТССААТГатаАОССОЛТААСЛЛТТ CACTCAATCGAGTG ul-lCG<nui“AAATaTGAAATACaAAGaCuJAGCATACAAL К 1ССПЛЛС СТСОССТАТТС1ТЛЛ Участок, занимаемый САР-сАМР Участок, — занимаемый— репрессором Участок, занимаемый РНК-подимеразой---- Рис. 123. Регуляторные области 1ас-опсропа Е. coli (М.Сингер, П.Берг, 1998): Л — нуклеотидные последовательности, задействованные в регуляции экспрессии опсрона; Б — схема взаимодействия комплекса САР-бслок — сАМР с а-фактором и кор-ферментом PH К-полимеразы. Цифры обозначают число нуклеотидных пар, расположенных перед (-) началом и после (+) начала транскрипции 1ас-оперона Репрессия этого опсропа, как и 1ас-оперопа, осуществляется с помощью белка-репрессора с молекулярной массой 58 кДа, ко- лируемого геном trp R, расположенным па значительном рассто- янии от trp-опсрона. Белок-репрессор блокирует область операто- ра в комплексе с самим триптофаном только при высокой кон- центрации этой аминокислоты в клетке, когда пет необходимос- ти в экспрессии trp-опсрона. Нуклеотидные последовательности промотора и оператора в trp-опероне перекрываются, поэтому при- соединение комплекса trp-белок-репрессор автоматически препят- ствует связыванию РНК-полимеразы с промотором. Дополнительные возможности репрессии trp-оперона связаны с наличием в его структуре особой аттешоаторной последова- тельности, располагающейся между зоной промотора и областью структурных генов (рис. 124). Эта последовательность входит в со- став так называемой лидерной области, кодирующей лидерный пептид в составе первого фермента, синтезируемого на полицис- троновой мРНК, транскрибируемой сданного оперона. Аттснюа- торная последовательность способна вызывать преждевременную терминацию транскрипции с этого и ряда других оперонов бакте- рий, влияя на вторичную структуру синтезируемой РНК. Такие аттенюаторы («ослабители»), которые называют также регулируе- 255
мРНК trp-оперона S'i ~l 3' Лидерная мРНК Р А Е D С гт> । । °* Начало Терминация транскрипции транскрипции В А ]ДНК Терминация транскрипции Рис. 124. Схема триптофанового опсропа Е. coli'. Р — промотор; О — оператор; А — аттенюатор; L — лидерная последовательность; Е. D. С, В. А — цнетроны. кодирующие структуру ферментов, участвующих в биосинтезе триптофана. Показаны укороченная (лидерная) мРНК. возникаю- щая и результате терминации транскрипции в зоне аттенюатора, а также пол- норазмерная полицистроповая мРНК trp-onepoira мыми терминаторами, содержатся не только в опсронах Е. coli, по и у бактерий рода Salmonella. Атгенюаторная последователь- ность в trp-опероне Е. coli содержит две области с обращенными повторами. Транскрипция этой последовательности приводит к образованию в мРНК шпилечных структур, которые могут оста- навливать дальнейший ход транскрипции. В результате образуется функционально не значимая (не пригодная для транскрипции) лидерная РНК длиной 140 нуклеотидов, что происходит при дос- таточно высокой концентрации триптофана в клетке. При сниже- нии концентрации триптофана РНК-полимераза преодолевает зону аттенюатора и транскрипция приводит к синтезу полноразмер- ной мРНК. Как оказалось, такой альтернативный ход транскрип- ции связан с альтернативным характером вторичной структуры лидерной области РНК-трапскрипта, на формирование которой ivinncT аппарат трансляции, и, как было отмечено выше, трансля- ция происходит у бактерий практически одновременно с синтезом мРНК. Так как в зоне аттенюатора оперона расположены области обращенных повторов, в PH К-транскрипте также образуются со- ответствующие комплементарные повторы, которые могут обра- зовывать шпильки во вторичной структуре РНК (рис. 125). Одна из этих шпилек является терминаторной, за которой следует после- довательность олиго(С1), и при ее возникновении наступает тер- минация транскрипции в соответствии с вышерассмотренным ме- ханизмом (см. рис. 120). Терминаторная шпилька образуется в том случае, если осуществляется быстрое и «плавное» движение ри- босомы, начиная с 5'-конца мРНК в условиях достаточного ко- личества всех аминокислот, включая триптофан. В этом случае в холе трансляции рибосома закрывает два из четырех обращенных 256
А Лидсрный^асток trp-оперона 5' 1 PPP । 5,°H£ 12 3 4 Области обращенных повторов Б 1 5' рррс= Терминаторная шпилька PPP I __ Транскрипция luuuu * останавливается Рибосома ________Транскрипция ииии 1 продолжается Антитерминаторная шпилька 5' 3 рррс= Транскрипция останавливается х В Рис. 125. Схема регуляции транскрипции мРНК trp-оперона с участием рибосомы: А — лплерный участок .мРНК 1гр-опсрона, содержащий четыре области обра- щенных повторов, способных образовывать шпилечные структуры. Стрелками показано расположение двух рядом расположенных кодонов, детерминирующих включение аминокислотных остатков триптофана (Тгр) в синтезируемый поли- пептид; Б — упрощенная схема трех вариантов формирования структуры лидер- ного участка мРНК trp-опсропа, один из которых приводит к продолжению транс- крипции (в центре), а два других — к остановке транскрипции (1 — достаточное количество всех аминокислот, включая Тгр; 2— недостаток Тгр; .? — нарушение системы трансляции); В — структура термипаторной шпильки мРНК trp-oncpoiia 9 Коничсп 257
повторов, а два другие взаимодействуют с образованием терми- наториой шпильки. Напротив, при недостатке триптофана (и со- ответственно тРНКТп’) рибосома останавливается в том участке лидерной последовательности мРНК, где находятся подряд два триплета (кодона), кодирующих данную аминокислоту в составе синтезируемого лидерного пептида. При этом рибосома закрывает первую из четырех областей обращенных повторов, что ведет к возникновению другой антитерминаторной шпильки, термина- торная шпилька не образуется, и транскрипция продолжается в область структурных генов. Терминация транскрипции в аттснюа- торной зоне trp-оперона происходит и тогда, когда по какой-то причине нарушается система трансляции в целом. В этом случае вторичная структура мРНК формируется независимо от рибосо- мы, что также ведет к образованию терминаторной шпильки и остановке транскрипции (см. рис. 125). РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ У БАКТЕРИОФАГА к Регуляция транскрипции у бактериофага X представляет собой пример того, как отдельные ключевые регуляторные белки способ- ны фундаментально изменить направление транскрипции генома и тем самым изменить весь модус существования вируса в клетке. Фаг X, как известно (см. рис. 60), располагает двумя способами существования в зараженной клетке: пассивным (лизогенным) и активным (литическим). Молекулярной основой переключения спо- собов существования фага 7. являются события, происходящие в аппарате транскрипции. Регуляция транскрипции данного фага осуществляется двумя белками: Сго-бслком и ^-репрессором. Они могут взаимно репрессировать синтез друг друга таким образом, ч то связывание ^.-репрессора с соответствующей областью опера- тора блокирует транскрипцию мРНК Сго-бслка и определяет ли- зогенный путь существования фага, и напротив, Сго-белок может выступать в роли репрессора, что ведет к транскрипции генов лизиса, синтезу фаговых белков и литическому пути развития фага. Х-Рспрсссор, кодируемый геном с/, представляет собой белок, состоящий из 236 аминокислотных остатков, организованных в два глобулярных домена, связанных между собой мостиком из серии аминокислотных остатков. Он функционирует в виде диме- ра, в котором контактируют С- и N-концевые домены. Белок Сго также является гомодимером, отдельные протомеры которого пред- ставляют собой глобулярные частицы, содержащие 66 аминокис- лотных остатков (рис. 126). /.-Репрессор и Сго-белок связываются с ДНК в области большой борозды в зоне оператора, где проис- ходит тонкое н точное взаимодействие структурных элементов (а- спиралсй) белков с азотистыми основаниями в узнаваемой бел- 258
Рис. 126. Димерные молеку- лы белка Сго(Л) и репрес- сора фага X (£). и-Спирали показаны в -виде цилиндров, р-слон — в виде стрелок. Точкой обозначена ось симметрии. Спирали а, и а3 К- репрсссора участвуют во взаи- модействии с ДПК (см. рис. 127) А Б ’ Ось симмет- » рии I 2-го порядка Рис. 127. Взаимодействие с ДНК белков, содержащих структурный эле- мент «спираль—петля—спираль» (к ним относятся, в частности, белок Сго и Х-рспрессор) (М. Сингер, П. Берг, 1998). Большие круги — домены, связывающиеся с ДНК: а3 — спираль. входящая в большой желоб ДНК; а, — фиксирующая (запирающая) спираль Элемент «спираль— I петля— спираль» ДНК-связыва- ющие домены 259
ками нуклеотидной последовательности ДНК (рис. 127). У обоих белков имеется характерный структурный элемент «спираль—пет- ля—спираль», благодаря которому они контактируют с ДНК. Одна из этих спиралей входит в зону большого желоба ДНК, а другая (запирающая спираль) фиксирует первую в этом положении. У фага X идентифицированы два промотора: сильный (PR), с которого открывается транскрипция гена белка Сго и генов лизи- са, и слабый (PRM), присоединение к которому РНК-полимеразы детерминирует синтез ?^-репрсссора. Оба промотора перекрывают- ся с зоной оператора, в которой выделяют три участка: OR1, OR,, OR3 (рис. 128). Участок OR| перекрывается с сильным (правым) промотором (PR); участок ORl перекрывается со слабым (левым) Оператор Рис. 128. Схема взаимодействия молекул Х-рспрсссора и Сго-бслка с зоной оператора ДНК фага X: А — /.-репрессор определяет лизогенный путь существования фага; Б — белок Rec Л. под действием УФ-облучения приобретающий протеолитическую актив- ность п расщепляющий молекулу Х-репрсссора; В — Сго-бслок. определяющий активный (литический) пуп. существования фага; Рим — левый (слабый) про- мотор; PR — правый (сильный) промотор; OR|, OR,. OR. — участки оператора; cl — ген. кодирующий Х-репрессор 260
промотором (PRM); участок Or, перекрывается с обоими промо- торами. Разные операторные участки имеют разное сродство к бел- кам-регуляторам, а эффективность связывания этих белков зави- сит от их концентрации в клетке. Так, Х-репрессор при невысокой концентрации связывается только с участком OR|, а при высокой может связаться с участками OR„ OR, и тем самым закрыть вход для РНК-полимеразы, что блокирует транскрипцию тепа cl (т.е. блокирует транскрипцию своей мРНК). Когда Х-рспрессор связы- вается с ОИ1 он закрывает сильный (правый) промотор и блоки- рует транскрипцию гена Cro-белка и генов лизиса. Одновременно еще один димер Х-рспрессора взаимодействует с OR, и способ- ствует связыванию РНК-полимеразы со слабым (левым) промо- тором, что ведет к транскрипции гена с! и поддерживает пассив- ное (лизогенное) состояние фага. При УФ-облучении Х-ренрессор разрушается. В этом процессе участвует белок Rec А, который в норме является белком рекомби- нации (см. гл. 8), но пол действием ультрафиолета приобретает про- теолитическую активность. Белок Rec А расщепляет Х-рснрсссор в области мостика (см. рис. 128) и инактивирует его. Инактивируе- мый Х-рспрсссор покидает зону ОИр после чего РНК-полимераза связывается с сильным промотором и начинается транскрипция генов белка Сго и генов лизиса, а бактериофаг вступает на актив- ный (литический) путь развития. По мере увеличения концентра- ции Cro-белка он прежде всего (в силу выраженного сродства) свя- зывается с OR, и блокирует синтез Х-рспрсссора. Когда концент- рация Сго-бслка становится очень большой, он запирает также ОИ| и OR, и останавливает транскрипцию своего собственного гена. Пример бактериофага X показывает, что достаточно сложная система регуляции активности генов может сформироваться в ре- зультате взаимодействия всего нескольких регуляторных белков. Если учесть, что у эукариот число регуляторных белков неизме- римо больше, то становится ясно, как велики у них возможности контроля экспрессии генов. ТРАНСКРИПЦИЯ У ЭУКАРИОТ РНК-полимеразы эукариот изучены значительно слабее, чем соответствующие ферменты бактерий. Синтез РНК у эукариот осу- ществляют три различные фермента: РНК-полимеразы I, II и III, структура которых изучена далеко не полностью. Отсутствуют од- нозначные сведения о числе и функциях составляющих их поли- пептидпых цепей, число которых, вероятно, более 10 в эпимоле- кулс. Изначально эукариотические РНК-полимеразы были иден- тифицированы на основании их чувствительности к амапнтину — высокотоксичному антибиотику, содержащемуся в бледной по- 261
ганке. Позднее было установлено, что РНК-полимераза I (не чув- ствительная к аманитину) синтезирует большие (28S и 18S) ри- босомальные РНК, РНК-полимераза П (наиболее чувствительная к аманитину) транскрибирует гены, кодирующие белки, а также гены малых ядерных РНК, а РНК-полимераза III отвечает за син- тез 5S рРНК и тРНК. РНК-полимеразы I, II и III дрожжей имеют три идентичные по молекулярной массе субъединицы (27, 23 и 14,5 кДа). Дрожже- вые РНК-полимеразы I и II содержат также две другие одинако- вые по массе субъединицы (14 и 40 кДа). Остальные известные субъединицы у всех трех РНК-полимераз дрожжей существенно различаются по молекулярной массе: 135 и 190 кДа — у РНК- полимеразы 1; 146, 150, 220 и 445 кДа — у РНК-полимеразы II; 82, 128 и 160 кДа — у РНК-полимеразы III. Ни одна из РНК-полимераз эукариот не способна самостоя- тельно связываться с промоторами транскрибируемых ими генов. Для присоединения к транскриптонам эукариот служат специ- фичные для каждой РНК-полимеразы белковые факторы транс- крипции {TF-факторы): РНК-полимеразы I, II и III требуют участия факторов транскрипции, называемых TFI, TFII и TFIII соответ- ственно. Большая латинская буква, которая обычно следует за рим- ской цифрой, обозначает, каким по счету был обнаружен данный фактор. Так, например, первым был выделен фактор транскрип- ции гена 5S рРНК, транскрибируемого РНК-полимсразой III — TFI11A. Различные факторы транскрипции присоединяются к ДНК в различных местах относительно точки начала транскрипции. Так, факторы TFID и TFIID связываются с ДНК и образуют комплек- сы с РНК-полимеразами перед сайтом начала транскрипции, а фактор TFIIC — сразу после соответствующего сайта. Фактор TFIID, существенный для многих промоторов РНК-полимеразы II, назы- вают еще ТАТА-фактором, поскольку он связывается с ТАТА-бок- сом, расположенным за 25 н.п. до сайта начала транскрипции. Несмотря на то что изучение белковых факторов транскрип- ции эукариот еще только начинается, выявлены некоторые осо- бенности структуры этих белков, способные обеспечивать специ- фическое взаимодействие их аминокислотных последовательно- стей с азотистыми основаниями ДНК. В этих белках обычно име- ются два домена, один из которых отвечает за связывание ДНК, а другой — за регуляцию транскрипции. Например, у белка GAL 4, регулирующего транскрипцию в дрожжевых клетках, функцию связывания ДНК и активацию транскрипции выполняют разные домены. Этот белок-активатор включает транскрипцию любых ге- нов, участвующих в метаболизме галактозы. Белок GAL 4 сое- диняется с определенной последовательностью в ДНК длиной в 17 и. п. одним доменом своей молекулы, в котором сосредоточены 262
73 аминокислотных остатка, тогда как другая часть молекулы (ее общая длина составляет 900 аминокислотных остатков) не уча- ствует в присоединении кДНК. В доменах связывания ДНК най- дены характерные структурные элементы: спираль—петля—спи- раль, впервые детально охарактеризованные у Сго-бслка и Vpe- прессора бактериофага ). (см. выше). У различных видов эукариот выявлена специфическая после- довательность в ДНК длиной 180 н.п. в тех генах, которые уча- ствуют в регуляции дифференцировки и развития. Эта последова- тельность получила название гомеобокс, так как впервые была выявлена в гомеотических генах дрозофилы. Гомеотические гены определяют план морфологического строения тела насекомого, т.е. участвуют в дифференцировке зародыша. При некоторых му- тациях этих генов па голове у мушек вместо антенн начинают развиваться ноги. Соответствующий ген дрозофилы получил на- звание антеннапедиа (antennapedia). Гомеобокссодержащие гены выявлены также у нематод, морских ежей, лягушек, кур, мышей и человека. В составе кодируемых этими генами белков имеются гомеодомены, состоящие из 60 аминокислотных остатков, способ- ные связываться с ДНК благодаря наличию структурного элемен- та спираль-петля-спираль, а также благодаря высокому содержа- нию (до 30 %) положительно заряженных аминокислотных остат- ков (Arg и Lys). Для связывания с ДНК белковые факторы транскрипции не- редко используют «цинковые пальцы» (рис. 129). Эти элементы структуры выявлены у фактора TFIIIA, в белке GAL 4 дрожжей, факторе SPI млекопитающих и в рецепторах стероидных гормо- нов (см. ниже). Известно несколько типов цинковых пальцев, от- личающихся числом и локализацией остатков цистеина и гисти- дина, координационно связанных с атомом цинка, а в целом этот Рис. 129. «Цинковые пальцы» — элементы сверхвторичной струк- туры в ДНК-связывающих бел- ках, участвующих в регуляции транскрипции: А — упрошенная схема строения ДНК-связывающсго домена, со- держащего остатки Сух и His, обра- зующих связи с атомами цинка; Б — схема взаимодействия четы- рех «цинковых пальцев* с больши- ми желобами молекулы Д11 К. Каж- дый «палец» узнает определенную последовательность из пяти нукле- отидных пар 263
элемент является отличительным признаком белков, способных связываться с ДНК. Многие факторы транскрипции содержат особый, состоящий из двух частей структурный элемент — «лейциновую молнию». Этот элемент включает протяженные а-спирали, обогащенные остат- ками лейцина, расположенными по одну сторону спирали, а так- же домен, богатый положительно заряженными аминокислотны- ми остатками. Белковые факторы транскрипции, содержащие «лейциновые молнии», взаимодействуют с ДНК в виде димеров (рис. 130). Непосредственный контакт с ДНК в этих димерах осу- ществляют домены, богатые положительно заряженными амино- кислотными остатками, а богатые лейцином участки служат для стабилизации структуры димера за счет взаимодействия с гидро- фобными остатками соответствующих а-спиралей. Разнообразие белковых факторов транскрипции у эукариот свя- зано с разнообразием регуляторных последовательностей, свой- ственных генам высших организмов. К их числу помимо ТАТА- боксов относятся энхансеры (усилители), сайленсоры (глушители), а также адапторные элементы. Эти элементы могут быть удалены на значительные расстояния от точки начала транскрипции, и их воздействие па транскрипцию осуществляется через соответству- ющие регуляторные белки. Вероятно, влияние этих элементов на транскрипцию связано с изменением топологии цепей ДНК, в частности с образованием Рис. 130. Схема взаимодействия димерной молекулы фактора транскрип- ции, содержащей «лейциновые молнии», с молекулой ДНК (М. Син- гер. П. Берг, 1998). Димерная структура фактора транскрипции стабилизируется за счет гидрофобных взаимодействий богатых лейцином участков двух полипептидных цепей. Основные домены белкового димера фактора транскрипции связываются с соответствующим отрицательно заряженным сайтом в молекуле ДНК 264
петель, что приближает регулятор- ные последовательности к промо- торам, с которыми они взаимо- действуют посредством белковых факторов (рис. 131). Действие энхансеров, вероятно, имеет неспецифический характер, поскольку они способны усиливать транскрипцию с любых доступных промоторов. Возможно тем не ме- нее, что энхансеры обладают тка- неспецифичностью. Так, энхансе- ры панкреатических ферментов в генно-инженерных конструкциях усиливают транскрипцию чуже- родных генов в клетках поджелу- дочной железы мыши (у трансген- ных животных). Сайленсоры обна- ружены у дрожжей 5. cerevisae. Они Энхансер Рис. 131. Изменение топологии цепей ДНК, способствующее воздействию регуляторного эле- мента (энхансера) на РНК-поли- мсразу через белковые фак- торы транскрипции каким-то образом блокируют транскрипцию генов, обладающих всеми необходимыми для транскрипции регуляторными элемен- тами. Действие сайленсоров опосредуется белками групп SIR (silent information regulator), которые, по-видимому, способны оккупи- ровать большие области ДНК и тем самым закрывать доступ бел- кам, способным инициировать транскрипцию. При этом репрес- сируются все гены, расположенные на расстоянии нескольких тысяч нуклеотидных пар от сайленсора. Адапторные элементы генома эукариот проявляют избиратель- ную чувствительность по отношению к стероидным гормонам, сАМР, глюкокортикоидам. Они специфически регулируют кле- точный ответ па тепловой шок, действие металлов (Cd2’, Zn2') и некоторых химических соединений (например, диоксинов). Адапторные элементы обладают специфическими нуклеотид- ными последовательностями, узнаваемыми белками. Так, напри- мер, фактор транскрипции белков теплового шока узнает в ДНК последовательность CNNGAANNTTCNNG (где N-любой нукле- отид), а глюкокортикоидный белок-рецептор связывается с ДНК в области последовательности TGTTCT. В области промоторов многих эукариотических транскрипто- нов выявлен СААТ-бокс — элемент, регулирующий частоту ини- циации транскрипции. Результаты изучения энхансеров, удаленных порой на значи- тельные расстояния (до 20 000 н.п.) от промоторов, а также регу- ляторных участков вблизи промоторов, позволили сделать неко- торые существенные обобщения. Во-первых, регуляторные по- следовательности в ДНК имеют модульное строение и состоят из 265
Элемент, регулирующий частоту инициации транскрипции Рис. 132. Модульное строение регуляторных последовательностей и ДНК эукариот. Стрелки указывают па возможность рахчпчпои ориентации регуляторных после- довательностей (пояснения в тексте) серин определенных нуклеотидных последовательностей (рис. 132). Каждая такая последовательность содержит 8—15 нуклеотидов и соединяется в процессе регуляции транскрипции с серией бел- ков-регуляторов. Некоторые из этих белков присутствуют в от- дельных типах клеток, а другие — во всех клетках. Энхансеры дей- ствуют в двух ориентациях: нормальной и инвертированной. Во-вторых, существуют белки-регуляторы, которые активиру- ют транскрипцию, а другие ее подавляют. Так, например, у позво- ночных животных сильной активирующей способностью облада- ют белки API, АР2 и Егу F1, а также САССС-фактор и белок SP1. Негативно влияет на транскрипцию фактор NFI. Воздействие регу- ляторного элемента зависит от комбинации регуляторных белков и может меняться по мере развития клеток. Таким образом, эн- хансер может не только активировать, но и подавлять транскрип- цию, т.е. название этих элементов не точно отражает их функцию. В зависимости от того, какие белки связываются с регуляторными элементами, каждый из них оказывает сильное или слабое поло- жительное пли отрицательное действие на транскрипцию. В-третьих, энхансеры и элементы, расположенные перед про- моторами, связывают много одинаковых белков. Примером в этом отношении может служить ген р-глобина курицы. Энхансер этого гена, расположенный после кодирующей белок области, связы- вает группу белков, которые могут присоединяться и к регулятор- ному элементу, расположенному непосредственно перед промо- тором (рис. 133). Белки-регуляторы транскрипции в свою очередь могут акти- вироваться или инактивироваться посредством различных меха- низмов. Их активация может происходить путем присоединения низкомолекулярных лигандов, дополнительной субъединицы, фосфорилирования определенных аминокислотных остатков и др. Примером активации регуляторных белков могут служить собы- тия, происходящие при участии белков-рецепторов стероидных гор- монов (рис. 134). Эти белки обеспечивают реакцию клеток на воз- 266
Контролирующий элемент, расположенный Сайт Рис. 133. Присоединение белков, усиливающих (+) и ослабляющих (-) транскрипцию, к регуляторным элементам тепа р-глобипа курицы (по- яснения в тексте) (по Б. Албертсу и др., 1994) Рис. 134. Воздействие стероидных гормонов на транскрипцию (по В. А. Гвоздеву, 1996): F — белковые факторы транскрипции (пояснения в тексте) 267
действие различных гормонов, активируя или подавляя экс- прессию определенных генов. В составе этих белков имеется ДНК- связываюший домен. Он расположен на N-конце молекулы, со- держащей 100 аминокислотных остатков, образующих серию «цинковых пальцев». Другой (гормон-связывающий) домен этих белков расположен на С-копце их полипептидных цепей. После проникновения в клетку стероидный гормон связывается с бел- ком-рецептором (который представляет собой фактор транскрип- ции), изменяет его конформацию и способствует освобождению рецептора от маскирующих его белков. Далее гормон-рецсптор- ный комплекс проникает в ядро и связывается с определенны- ми регуляторными последовательностями в ДНК. Связывание гор- мои-рсцспторного комплекса может способствовать удалению бел- ка — сайлеисора и таким образом снимать запрет на транскрип- цию генов. Долгое время считали, что у эукариот, как и у прокариот, бел- ки-активаторы и репрессоры транскрипции действуют напрямую, контактируя с ДНК. Однако затем было обнаружено существова- ние медиаторов (посредников) между этими белками и транс- криптонами у дрожжей и высших эукариот. Олни из этих регуля- торов действуют на хроматин, другие взаимодействуют с РНК- полимсразой и связанными с ней белками. Первая группа регуля- торов включает белковые комплексы, модифицирующие структу- ру хроматина: гнстонацетилтрансферазные комплексы и гистон- деацетилазные комплексы (см. ниже). Вторая группа представлена медиаторным комплексом дрожжей и несколькими подобными комплексами в клетках млекопитающих. Вероятно, эти две груп- пы медиаторов функционируют на разных стадиях: изменения в хроматине предшествуют стимуляции РНК-полимеразной актив- ности. На уровне медиатора определяется в конечном итоге, будет ли инициироваться транскрипция, и если да, то с какой частотой. В состав медиатора входят белки, способные инициировать или подавлять транскрипцию. Медиатор и РНК-полимераза II эукари- от проявляют свою активность в виде полимеразного холофер- мента. Медиатор, очевидно, интегрирует и передает положитель- ные и отрицательные стимулы от энхансеров к промоторам, дей- ствуя непосредственно через РНК-полимеразу в промотор-зави- симой транскрипции. Впервые медиатор был обнаружен при изучении транскрипции, осуществляемой РНК-полимеразой II у дрожжей. В этих опытах было установлено, что в системе, содержащей РНК-полимеразу, транс- крипционный фактор TFIIB, ТАТА-связывающий белок (ТВР) и другие, ранее известные белки-регуляторы, транскрипция осу- ществлялась только в присутствии молекулы адаптера между бел- ком-активатором и другими вышеперечисленными компонента- ми транскрипции. Этот адаптер и был назван медиатором. Затем 268
медиатор дрожжей был получен в гомогенном состоянии. Он пред- ставляет собой комплекс, состоящий из 20 субъединиц, четыре из которых (Srb2, Srb4, Srb5 и Srb6) являются продуктами четырех доминантных генов-супрессоров. Еще девять субъединиц медиа- тора также представляют собой продукты экспрессии рапсе иден- тифицированных у дрожжей генов, а остальные семь субъединиц кодируются ранее неизвестными генами, получившими название Med. Установлено, что субъединицы типа Srb взаимодействуют с С-концевым доменом (CTD) РНК-полимеразы П. Предполага- ют, что в клетках дрожжей медиатор связывается с РНК-полпмс- разой II. Затем образовавшийся холофермент входит в состав ком- плекса преинициации транскрипции, после чего происходит фос- форилирование С-концевого домена РНК-полимеразы. Медиатор высвобождается, а активная РНК-полимераза связывается с но- вым комплексом белков — элонгатором, участвующим в регуля- ции элонгации транскрипции. Кроме 20-субъединичного медиа- тора у дрожжей были найдены дополнительные белки-посред- ники (Srb8, Srb9, SrblO и Srbll), которые участвуют в отрица- тельной регуляции транскрипции. У млекопитающих первым очи- щенным до гомогенного состояния медиатором стал TRAP-ko- активапюрный комплекс ядерного рецептора тироидных гормонов. У человека и мышей выделено семь медиаторных комплексов, что позволяет считать медиаторы основными посредниками при передаче информации от энхансеров к промоторам высших эука- риот (рис. 135). Сопоставление структур медиаторов, выделенных из разных объектов, показало, что они имеют модульное строение, и одни из Транскрипция Рис. 135. Комплексы белков, участвующих в регуляции транскрипции у эукариот (упрощенно): R — белки-регуляторы, передающие сипгал от энхансера; А, В, D, Е, F. Н — факторы транскрипции (TF): Srb, Gal II, Med — белки субмедпаторного комп- лекса: SWI/SNF — комплекс белков, модифицирующий структуру хроматина; ТВР—ТАТА-связывающпй белок; CTD — С-копцсвой домен РНК-полпме- разы II с присоединенными к нему фосфорными остатками — (Р) 269
модулей обычно представлен Srb-подобными белками, которые, вероятно, совершенно необходимы для инициации транскрип- ции всех генов, транскрибируемых РНК-полимеразой И. ХРОМАТИН И ОБЩАЯ (ТОТАЛЬНАЯ) РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ У ЭУКАРИОТ На регуляцию транскрипции у эукариот большое влияние ока- зывает упаковка ДНК в составе хроматина — бслково-нуклеино- вого комплекса, в составе которого постоянно пребывает ДНК высших организмов. Изменения в упаковке ДНК непосредствен- но влияют на экспрессию генов. Хроматин представляет собой ком- плекс ДНК с белками (гистонами и негистоновыми белками), который обеспечивает компактную упаковку гигантских, достига- ющих длины несколько метров, молекул ДНК эукариот в ядрах их клеток. Линейный четырехбуквенпый генетический код, «сло- вами» в котором являются тройки нуклеотидов (кодоны), позво- ляет хранить огромную информацию в малом объеме. Вся генети- ческая информация, содержащаяся в гаплоидном геноме челове- ка, закодированная в 3 • 109 н.п., теоретически может быть упако- вана в кубик с ребром —1,5 мкм. В составе хроматина присутствуют пять белков-гистонов, называемых Н1, Н2А, Н2В, НЗ и Н4. Гис- тоны представляют собой небольшие белки с молекулярной мас- сой от 11,3 кДа (Н4) до 23 кДа (Н1) с высоким содержанием основных аминокислот (Lys и Arg), благодаря чему они электро- статически взаимодействуют с отрицательно заряженными фос- фатными группами ДНК. Так, в гистоне Н1 кролика, состоящем из 213 аминокислотных остатков, 65 составляют остатки Lys и Arg, а в гистоне НЗ быка из 135 аминокислотных остатков на долю основных аминокислот приходится 32 остатка. По первичной струк- туре гистоны весьма консервативны. Соотношение гистонов Н2А, Н2В, НЗ и Н4 в хроматине низших эукариот (дрожжи, плесневые грибы) такое же, как в хроматине млекопитающих. Исключение составляет гистон Н1, который достаточно вариабелен по пер- вичной структуре и в эритроцитах курицы замещен на другой ги- стон (Н5). В хроматине дрожжей гистон Н1 вообще отсутствует. В изображениях, полученных методом электронной микроско- пии, хроматин напоминает нитку бус, в которой каждая бусинка представляет собой октамер гистонов (включает по две молекулы гистонов Н2А, Н2В, НЗ и Н4), называемый нуклеосомным кором. Таким образом, гистоны помогают ДНК организоваться в струк- турные единицы, которые называются нуклеосомами. Вокруг окта- мера коровых гистонов обвивается участок спирали ДНК. длиной 145 н. п., совершая 13/д оборота и образуя сверхспираль (рис. 136). Молекулы гистона Н1 не входят в состав нуклеосомного кора; 270
Рис. 136. Взаимодействие ДНК и гистонов в составе хроматина (Kornberg R., Klug Л. // Sei. Amer. - 1981. — V. 244. - N 2. - P. 52): A — модель пуклсосомпого кора: участок ДНКдлнпой 145 н.п. обвивает окта.мср коровых гистонов, совершая Рд оборота; Б — схема строения 11н.м-фибрпллы («нитка бус*) они соединяют между собой отдельные октамеры, контактируя с линкерной ДНК, расположенной между нуклеосомными корами. Центральная глобулярная часть гистона Н1 присоединяется к по- верхности нуклеосомного кора, a N- и С- концевые участки об- разуют вытянутые области («плечи»), которые взаимодействуют с линкерной ДНК и с соседней нуклеосомой. Субнуклеосомные ча- стицы, содержащие нуклсосомный кор, гистон Н1 и 168 н.п. ДНК, получили название хроматосомы. Цепочка нуклеосом («нитка бус»), имеющая диаметр -11 нм, может конденсироваться с образованием фибриллы толщиной 30 нм (рис. 137), в которой наблюдаются промежутки, содержащие 271
700 нм 1400 нм Рис. 137. Компактизация молекулы ДНК в составе хроматина (по Б. Ал- бертсу и др., 1984) неплотно упакованную ДНК. В этих местах, вероятно, к ДНК при- соединяются негистоновые белки хроматина, которые в последнее время относят к группе сайт-спеиифических ДНК-связывающих белков, узнающих особые последовательности в ДНК. Среди не- гистоновых белков выделяют так называемые белки высокоподвиж- ной (при электрофорезе) группы (HMG-белки). Известно, что не- которые из них (HMG-14 и HMG-17) присоединяются к ДНК в тех участках, где идет активная транскрипция генов. По-видимо- му, присоединение этих белков предшествует и способствует свя- зыванию гормон-рецепторных комплексов с ДНК, что приводит к активации транскрипции (рис. 138). 272
А Эухроматиц Гетерохроматин | -40 нуклеосом | Гетерохроматин /.. | I Транскрипция I _ _—_ гттк HMG R Pol ДНК t Гистоновый октамер Неплотная упаковка Плотная упаковка Рис..138. Дскопдспсация хроматина и зоне активной транскрипции: Л — белки, связанные с ДНК в области эухроматнпа; Б — изменение степени (прочности) связывания гистонов с ДНК по АТР-завпспмому механизму; R — рецептор стероидного гормона; Н — стероидный гормон; Pol — РНК-полпмсраз- ный комплекс; SWI/SNF — белковый комплекс, фос(|юрилиру1ощий гнегопы Вслед за 30 нм-фибриллами в хроматине наблюдаются более высокие уровни конденсации: петельные домены, гигантские пет- ли суперспирализоваииой ДНК {конденсированный хроматин) и наконец метафазные хромосомы (см. рис. 137). В целом компактизация ДНК у эукариот представляет собой один из способов контроля активности генов, так как характер уклад- ки ДНК влияет на транскрипционную активность генома. Разли- чают плотно организованный (конденсированный) хроматин — гетерохроматин, и менее компактный эухроматин, с большей ак- тивностью транскрипции. Таким образом, у эукариот наследствен- ная передача информации о функциональном статусе генов может осуществляться в виде структурной организации хроматина. Эта особенность четко выражена в инактивации Л'-хромосом у млеко- питающих: известно, что женский тип у них определяется нали- чием двух Л'-хромосом, одна из которых инактивируется (т.е. со- держащаяся в ней ДНК не транскрибируется). У мышей инакти- вация происходит на 5 —6-й день эмбрионального развития, при этом Х-хромосома является полностью конденсированной. Неак- тивная структура одной из Л'-хромосом устойчиво наследуется. В составе хроматина гены эукариот включены в петельные до- мены различного размера (длиной от 20 до 200 тыс. н. п.). Эти пст- 273
ли представляют собой функционально независимые домены, содержащие один или несколько генов. Петли отделены друг от друга особыми последовательностями — инсуляторами (от англ. insulate — изолировать), с которыми взаимодействуют особые узна- ющие их белки. Инсуляторы препятствуют влиянию регуляторных последовательностей одной петли на экпрсссию генов другой петли (домена) и способствуют целенаправленному воздействию энхан- серов на транскрипцию генов определенного домена. Некоторые подвижные генетические элементы (элемент gypsy дрозофилы) содержат в себе нуклеотидные последовательности инсуляторов, и их внедрение в определенные участки хроматина влияет иа эк- спрессию генов. Перемещение таких подвижных элементов может изменять границы доменов, экспрессия которых контролируется определенным энхансером, а внедрение между промотором и оператором может вообще блокировать транскрипцию. На экспрессию генетического материала могут оказывать воз- действие и крупномасштабные изменения в геномах, к которым относится диминуция хроматина. Это явление обнаружено у мно- гих видов нематод, паразитирующих в кишечнике млекопитаю- щих и человека. Оно состоит в элиминации значительной части хроматина на ранних стадиях деления оплодотворенной яйцеклетки. В результате этого процесса разные типы клеток приобретают раз- ные по структуре хромосомы и соответственно разные возможно- сти экспрессии генетического материала. У аскариды Parascaris univalens диминуция приводит к утрате до 80% хроматина, пред- ставленного в основном сателлитной ДНК. Однако наряду с этим удаляются и некоторые уникальные гены (в частности, ген одно- го из рибосомных белков) и, таким образом, диминуция пред- ставляет собой своеобразный механизм выключения генов путем их удаления из геномов соматических клеток. Илиминация части хроматина обнаружена в онтогенезе различных видов насекомых. При активации эукариотических генов происходит избиратель- ная дсконденсация хроматина. Это продемонстрировано в экспе- риментах с ДНКазой I — ферментом, способным атаковать ДНК вне суперспирализованных участков. Обработка ДНКазой I вызы- вает деградацию только тех участков ДНК, которые составляют транскрибируемую часть генома эукариот (-10 %). В гене лизоци- ма курицы выявлено семь гиперчувствительных к ДНКазе 1 учас- тков в области активного эухроматина протяженностью 20000 и. и. Полностью механизм активации хроматина еще нс выяснен, од- нако постепенно накапливаются определенные представления об этом процессе. Установлено, например, что при декомпактиза- ции хроматина ослабевает прежде всего связь гистона Н1 с ДНК. Свободные от гистона Н1 области подвергаются интенсивной транскрипции, так как возрастает число доступных участков для связывания РНК-полимеразы. 274
Если ранее полагали, что коровые гистоны только способству- ют регулярной упаковке ДНК в составе нуклеосом, то в настоя- щее время считают, что они участвуют в регуляции инициации транскрипции. Установлено, что избирательное включение ТАТА- боксов в нуклеосомы блокирует работу РНК-полимеразы, одна- ко если образование нуклеосом происходит в кодирующей облас- ти генов, то транскрипция не блокируется, хотя интенсивность ее все же снижается. Предполагают, что гистоны предотвращают связывание основных белковых факторов транскрипции (так на- зываемых базальных факторов} с ДНК. Так, нуклеосомы блокиру- ют присоединение фактора TFIID и ТВР к ДНК. В то же время известно, что рецепторы глюкокортикоидов способны присоеди- няться как к свободной, так и организованной в нуклеосомы ДНК. Белки-активаторы транскрипции конкурируют с гистонами за связь с ДНК. Ослабление связи гистонов с ДНК происходит ско- рее всего в результате взаимодействия между белком-активатором и одним из доменов гистона Н4. Этот домен, видимо, не участву- ет в сборке нуклеосом, имеет нитевидную (неспирализованную) форму и способен к взаимодействию с окружающими молекула- ми. Ацетилирование этого (N-концевого) домена гистона Н4 ве- дет к снижению его положительного заряда, изменению его кон- формации и, как следствие, — к временному отсоединению от гистонов Н2А и Н2В. Далее происходит раскручивание ДНК вок- руг оставшихся гистонов и ДНК становится доступной для ба- зальных факторов транскрипции. Нитевидные хвосты гистонов Н4 и НЗ могут участвовать и в репрессии транскрипции, что показа- но, в частности, для генов, кодирующих типы спаривания у дрож- жей. N-концевые участки («хвосты») гистонов НЗ и Н4 наиболее консервативны в эволюционном плане и представляют собой объекты ряда ковалентных модификаций, которые могут приво- дить к изменению взаимодействия этих гистонов с другими ком- понентами нуклеосом, а также с самой ДНК и ДНК-связываю- щими белковыми факторами транскрипции. Среди ковалентных модификаций ацетилирование гистонов, по всей видимости, наиболее важно для тотальной регуляции транс- крипции генов эукариот. Этот процесс катализируется гистонаце- тилтрансферазой (НАТЗ)-ферментом, способным переносить аце- тильные остатки с молекулы ацстил-коэнзима А на остатки лизи- на в молекулах гистонов и тем самым снижать их положительный заряд (рис. 139). Установлена тесная взаимосвязь между ацетилированием гис- тонов, их взаимодействием с ДНК и транскрипцией. Один из ком- понентов белкового комплекса TFIID у человека содержит белок TAFII250, обладающий ацетилтрансферазной активностью, что указывает на необходимость ацетилирования для начала транс- крипции. Ацетилирование гистонов имеет обратимый характер: 275
...HN-CH-CO... (CH2)„ zz° NH3+ CH-C ~ SKoA ->J HS-KoA ...HN-CH-CO... (CH,)4 NH l c=o I CH3 A ...HN-CH-CO... I ATP ADP ...HN-CH-CO... I CH, I - о O=p-OH O- Б Pnc. 139. Ковалентные модификации гистонов, ослабляющие их связь с ДНК: А — ацетилирование, снимающее положительный заряд с остатков лизина; 1> — фосфорилирование радикалов серина с образованием отрицательно заряжен- ного остатка фосфосерппа для их деацетилирования, вероятно, необходим особый белковый комплекс деацетилирования. Само ацетилирование также стиму- лируется особым белковым комплексом (НАТ-комплскс), связы- вающимся с линкерной ДНК вблизи сайта присоединения РНК- полимеразы. Фосфорилирование гистонов представляет собой еще один путь активации транскрипции. Этот ATP-зависимый механизм, в ос- нове которого, очевидно, лежит фосфорилирование радикалов серина коровых гистонов (см. рис. 139). В фосфорилировании гистонов принимает участие специфи- ческий белковый комплекс, итог работы которого состоит в осла- блении связи гистонов с ДНК. Менсе плотная упаковка ДНК в составе нуклеосом после фосфорилирования гистонов создает усло- вия для успешной инициации и элонгации транскрипции. В ходе РНК-пол имераза ДНК Гетерохроматин ’' Разворачивание ОНО нуклеосомы ВосстановлеииеХ структуры \ Перенос нуклеосомы \ октамера Рис. 140. Гипотетическая модель, иллюстрирующая изменения в нуклео- сом! юй организации хроматина в период транскрипции (пояснения в тексте) 276
элонгации транскрипции, осуществляемой РНК-полимеразой II, нуклеосомы располагаются перед и после работающей полимера- зы, что указывает на возможность перемещения нуклеосом либо их разрушение (разворачивание) и реконструкцию после прохож- дения фермента (рис. 140). Белковый комплекс SW1/SNF, задей- ствованный в фосфорилировании гистонов (см. рис. 138), участву- ет в преодолении РНК-полимеразой нуклеосомного барьера (т.е. в элонгации транскрипции).
Глава 10. ПРОЦЕССИНГ РНК Образующиеся в результате транскрипции первичные РНК- транскрипты поначалу далеко не всегда представляют собой функ- ционально активные молекулы РНК. Прежде чем стать таковы- ми, они, как правило, должны претерпеть ряд модификаций, которые и превращают их в зрелые РНК, пригодные к выполне- нию соответствующих функций. Этот процесс посттранскрипци- онной модификации первичных транскриптов (РНК-предшс- ственников) называется процессингом и носит достаточно специ- фический характер в отношении разных видов РНК у про- и эукариот. В связи с известными вышеотмеченными различиями в этапах реализации генетической информации у прокариот и эукариот процессинг у прокариот имеет весьма ограниченный характер, тогда как у эукариот он представляет собой достаточно тонко орга- низованный процесс, непосредственно влияющий на регуляцию экспрессии генетического материала в дифференцированных клет- ках высших организмов. Наиболее детально изучен процессинг мРНК эукариот, который включает три главных момента: сплай- синг, копирование 5'-конца и полиаденилирование З'-конпа пер- вичных транскриптов. Сплайсинг (от англ, splice — соединять концы) состоит в выре- зании из пре-мРНК некодирующих областей — интронов — и сши- вании кодирующих структуру белка участков — экзонов. Различа- ют несколько различных механизмов сплайсинга (см. ниже). Копи- рование представляет собой образование на 5'-концс мРНК осо- бой структуры — кэпа (шапочки) (см. гл. 3). Копирование проис- ходит вскоре после начала синтеза мРНК и осуществляется с уча- стием GTP, из состава которого GMP переносится на 5'-дифос- фат первого нуклеотида мРНК. Полиаденилирование осуществляет- ся ферментом поли(А)-полимеразой и приводит к образованию на З'-конце олиго(А)-фрагмента, содержащего 100 — 200 остатков адениловой кислоты подряд и называемого также «поли(А)-хвос- том». Поли(А)-хвост определяет стабильность мРНК и время ее жизни в клетке. Кроме того, у эукариот поли(А)-хвост возможно способствует выходу мРНК из ядра в цитоплазму, а также суще- ствен для регуляции трансляции мРНК (см. гл. 11). 278
ПРОЦЕССИНГ У ПРОКАРИОТ Процессинг у прокариот в основном затрагивает предшествен- ники рРНК и тРНК, тогда как полицистроновые мРНК исполь- зуются для трансляции (биосинтеза белка) сразу после их синтеза на соответствующих опероиах бактерий и даже еще до окончания транскрипции, так что биосинтез белка оказывается непосред- ственно сопряжен с транскрипцией (см. рис. 121). Ранее считали, что полиаденилирование свойственно только мРНК эукариот. Однако в настоящее время установлено, что поли(А)-хвосты есть и у мРНК прокариот, ио они короче, чем у мРНК эукариот (со- держат от 14 до 60 остатков адениловой кислоты) и встречаются не у всех молекул мРНК. В отличие от эукариот полиаденилирова- ние дестабилизирует структуру ряда мРНК бактерий. Процессинг у бактерий необходим для образования зрелых мо- лекул рРНК и тРНК. Первичный транскрипт, содержащий пос- ледовательности этих РНК., образуется па опероиах, включающих гены 16S рРНК, 23S рРНК, 5S рРНК и тРНК (рис. 141). Первич- ные транскрипты таких оперонов имеют длину -5000 нуклеоти- дов и помимо последовательностей рРНК содержат вставочные последовательности (спенсеры), существенные для процессинга. Вычленение индивидуальных рРНК происходит с участием эндо- нуклеаз, разрезающих первичные транскрипты в областях спейсс- ров. Так, РНКаза III узнает и расщепляет двунитевыс участки (дуп- лексы), образующиеся за счет спенсеров и составляющие стебли петель (шпилек) в структуре предшественников. В петлях этих шпилек содержатся последовательности зрелых молекул 16S рРНК (-1600 нуклеотидов) и 23S рРНК (-2900 нуклеотидов). Другой фермент — РНКаза М5, идентифицированный у Baccillus subtilus, отщепляет от первичного транскрипта 5S рРНК.. Образующиеся после первичного эпдонуклеотичсского расщепления пре-тРНК подвергаются дальнейшему процессингу при участии двух фер- ментов: эндонуклеазы Р и экзонуклеазы D (рис. 142). При этом пре-тРНК, содержащая более 100 нуклеотидных остатков, укора- чивается с обоих концов до стандартного размера (70 — 90 нук- леотидов). С 5'-конца на пре-тРНК действует эндонуклеаза Р, а с З'-конца — экзонуклеаза D. Интересно, что молекула эндонукле- азы Р (РНКазы Р) сама содержит в своем составе РНК длиной до 400 нуклеотидов, которая обладает основной каталитической ак- тивностью, а белковая часть этой нуклеазы (мол. масса 17 000) только усиливает РНКазную активность. Ферменты этого типа выявлены как у бактерий, так и у эукариот. У Е. coli длина РНК в составе РНКазы Р достигает 377 нуклеотидов, у дрожжей — 250 нуклеотидов, а у человека — 100 нуклеотидов. Методами генетической инженерии получен вполне актив- ный в процессинге тРНК гибридный фермент, содержащий РНК- 279
Рис. 141. Процессинг рРНК у прокариот (М.Сингер, П. Берг, 1998): А — схема типичных единиц транскрипции рРНК Е. coli. Между кодирующими участками для 16S, 23S и 5S рРНК п тРНК расположены спсйссриыс последова- тельности; Б — спсйссриыс последовательности, расположенные в предшествен- нике рРНК. образуют черешки (стебли), которые растопляются РНКазой III; Л — РНКаза М5 отщепляет от первичного транскрипта 5S РНК 280
5' лидерную последовательность Jj длиной 41 нуклеотид С с образованием 5'-конца тРНК G А°Н Три остатка, с отщепляемые U РНКазой D Д 85 З'-конец тРНК С С А С С 80 А С С С Рис. 142. Процессинг тРНК (пояснения в тексте): Л — происссниг тРНК из молскулы-предшествеппика тРНК7уг Е. coli (М.Сингер, П. Берг, 1998): Б — удаление интрона из прсдшестпепника тРНК у эукариот; Е — полифункциопальный фермент, обладающий киназной, лигазной и фосфодп- эстеразной активностью компонент РНКазы Р, выделенный из Е. coli, и белковую часть — из соответствующего фермента человека. Эндонуклеазное дей- ствие РНКазы Р заключается в отщеплении 41 нуклеотида от 5’- концевой (лидерной) последовательности предшественника и сразу приводит к формированию 5'-конца тРНК, представлен- ного фосфорилированным гуанозином (5'-pG). Экзонуклеаза D, со своей стороны, отщепляет последовательно несколько нуклео- тидов с З'-конца молекулы-предшественника, останавливаясь на аденозине, соседствующем с двумя цитидиловыми нуклеоти- дами, и таким образом формируется З'-конец (акцептирующий стебель) тРНК, содержащий стандартную последовательность CCA-ОН. Одновременно с процессингом рРНК и тРНК осуще- ствляется модифицирование ряда азотистых оснований, приводя- щее, в частности, к образованию характерных для тРНК дигид- 281
роурацила (UH2), псевдоуридина (Т) и тимина (Т). Ферменты, осуществляющие эти модификации, до сих пор не охарактеризо- ваны. ПРОЦЕССИНГ тРНК И рРНК У ЭУКАРИОТ Процессинг у эукариот затрагивает все виды первичных транс- криптов эукариотических генов. Продукты транскрипции, возни- кающие при участии РНК-полимеразы III (пре-тРНК), содержат вставку (интрон) вблизи антикодона. Вырезание этого интрона и лигирование (сшивание) остальной части молекулы-предшествен- ника приводит к образованию зрелой тРНК (рис. 142). Необходи- мые для этого процесса нуклеазная (фосфодиэстсразная), лигаз- ная и киназная реакции осуществляются, как полагают, одним полифупкциональным ферментом. Процессинг рРНК высших организмов совершается в ядрах клеток на базе молекул-предшественников, транскрибируемых с многочисленных генов, содержащихся в ДНК в виде тандемно повторяющихся копий (кластеров). Водном первичном транскрип- те, имеющем у млекопитающих коэффициент седиментации 45S (-13 000 нуклеотидов), содержатся нуклеотидные последователь- ности 18S (-2000 нуклеотидов), 28S (-5000 нуклеотидов) и 5,8S (~ 160 нуклеотидов) рРНК, которые разделяются спейсерпыми последовательностями. Эндонуклеаз!юе расщепление этого пред- шественника ведет к выщепленню зрелых рРНК (рис. 143) и про- исходит при участии малых ядериых РНК (см. ниже). 5S рРНК человека, имеющая длину 120 нуклеотидов, кодиру- ется и транскрибируется отдельно от других РНК с соответствую- щих генов, число которых в геноме достигает 2000. Синтез всех рРНК (кроме 5S рРНК) происходит в ядрышках с очень высокой скоростью. Тандемно повторяющиеся гены рРНК транскрибиру- ются синхронно, п их транскрипты под электронным микроско- пом имеют вид характерных структур типа «елочек» (рис. 144). Одновременная транскрипция генов рРНК и процессинг общего транскрипта приводят к синхронному образованию пропорцио- нальных количеств всех рРНК, необходимых для сборки рибосом. У ряда видов примитивных эукариот (Tetrahymena thermophila, Physarum polycephalum и др.) гены рРНК содержат особые интро- ны (интроны группы 1), для которых характерен уникальный ме- ханизм сплайсинга. Такие интроны встречаются также в генах рРНК митохондрий, хлоропластов, дрожжей и грибов, однако они не выявлены в генах позвоночных животных. Изучение процессинга 26S рРНК тетрахимены (аналог 28S рРНК высших эукариот), вы- полненное Т.Чеком и сотрудниками, привело к открытию особо- го вида сплайсинга, осуществляемого без участия каких-либо бел- ков и получившего название аутосплайсинг (сплайсинг типа I). 282
А 5' 455-предшественник рРНК РРР[ 3' J-OH Процессинг РНК 13 000 нуклеотидов--------------1 s______ Деградирующие участки нуклеотидной последовательности 18S рРНК 5' У Включение в малую рибосомную субчастицу 5,8S рРНК 28S рРНК □ I I 5' У 5' У ___Молекулы 5S рРНК .—. * синтезируются I—I в другом месте 5' 3' Включение в большую рибосомную субчастицу Рис. 143. Процессинг рРНК у эукариот: А — процессинг 455-прелшестненника рРНК (спсйсерпыс последовательности па рисунке темные): Б — взаимодействие различных U-PHK с пограничными участками спсйссрных последовательностей в молекуле-предшественнике рРНК у лягушек Xenopus laevis Оказалось, что содержащаяся внутри 26S рРНК тетрахимены .вставка (интрон) длиной 400 нуклеотидов способна сама осуще- ствлять вырезание этого интрона и сшивание экзонов в присут- ствии Mg2, и свободного гуанозина (либо его фосфорилирован- ных производных). Таким образом была открыта аутокаталити- 1 мкм Рис. 144. Электронная микрофотография РНК-трапскриптов, синтезиро- ванных на тандемно расположенных в ДНК генах рРНК (Б.Албсртс и др., 1994) На 5'-концах прогрессивно удлиняющихся молекул РНК видны частицы, ко- торые, вероятно, отражают процесс начала сборки рибосом 283
5' пре-рРНК t Эндонуклеазное расщепление Аутосплайсинг I7S 26S 3' Экзон 1 Экзон 2 Интрон Интрон Рибозим L -19 IVS Рис. 145. Схема аутосплайсинга 26S рРНК у тстрахимспы и процесс обра- зования рибозима. В верхней части рисунка представлена структура пред- шественника рРНК. В последовательности 26S рРНК имеется вставка (нитрон): / — гуанозин атакует 5’-конси нитрона, и результате чего происходят разрыв межиуклеотидпоп связи и высвобождение 5'-копна интрона: 2— гидроксильная группа З’-конца экзона 1 атакует фосфодпэфприую связь па З'-копцс нитрона, что ведет к вычленению интрона; 3— замыкание фосфоднэфирпой связи между ОН-группой З'-коппа экзона 1 и 5’-фоефатпой группой экзона 2 приводит к сшиванию экзонов и образованию зрелой 26S рРНК; 4 — в результате двухэтап- пого аутокаталитическо