Генетический код как способ записи наследственной информации. Генетический код: описание, характеристики, история исследования

Ген - структурная и функциональная единица наследственности, контролирующая развитие определенного признака или свойства. Совокупность генов родители передают потомкам во время размножения.Большой вклад в изучение гена внесли российские учёные: Симашкевич Е.А.,Гаврилова Ю.А.,Богомазова О.В.(2011 год)

В настоящее время, в молекулярной биологии установлено, что гены - это участки ДНК, несущие какую-либо целостную информацию - о строении одной молекулы белка или одной молекулы РНК. Эти и другие функциональные молекулы определяют развитие, рост и функционирование организма.

В то же время, каждый ген характеризуется рядом специфических регуляторных последовательностей ДНК, таких как промоторы, которые принимают непосредственное участие в регулировании проявления гена. Регуляторные последовательности могут находиться как в непосредственной близости от открытой рамки считывания, кодирующей белок, или начала последовательности РНК, как в случае с промоторами (так называемые cis cis-regulatory elements ), так и на расстоянии многих миллионов пар оснований (нуклеотидов), как в случае с энхансерами, инсуляторами и супрессорами (иногда классифицируемые как trans -регуляторные элементы, англ. trans-regulatory elements ). Таким образом, понятие гена не ограничено только кодирующим участком ДНК, а представляет собой более широкую концепцию, включающую в себя и регуляторные последовательности.

Изначально термин ген появился как теоретическая единица передачи дискретной наследственной информации. История биологии помнит споры о том, какие молекулы могут являться носителями наследственной информации. Большинство исследователей считали, что такими носителями могут быть только белки, так как их строение (20 аминокислот) позволяет создать больше вариантов, чем строение ДНК, которое составлено всего из четырёх видов нуклеотидов. Позже было экспериментально доказано, что именно ДНК включает в себя наследственную информацию, что было выражено в виде центральной догмы молекулярной биологии.

Гены могут подвергаться мутациям - случайным или целенаправленным изменениям последовательности нуклеотидов в цепи ДНК. Мутации могут приводить к изменению последовательности, а следовательно изменению биологических характеристик белка или РНК, которые, в свою очередь, могут иметь результатом общее или локальное изменённое или анормальное функционирование организма. Такие мутации в ряде случаев являются патогенными, так как их результатом является заболевание, или летальными на эмбриональном уровне. Однако, далеко не все изменения последовательности нуклеотидов приводят к изменению структуры белка (благодаря эффекту вырожденности генетического кода) или к существенному изменению последовательности и не являются патогенными. В частности, геном человека характеризуется однонуклеотидными полиморфизмами и вариациями числа копий (англ. copy number variations ), такими как делеции и дупликации, которые составляют около 1 % всей нуклеотидной последовательности человека. Однонуклеотидные полиморфизмы, в частности, определяют различные аллели одного гена.

Мономеры, составляющие каждую из цепей ДНК, представляют собой сложные органические соединения, включающие в себя азотистые основания: аденин(А) или тимин(Т) или цитозин(Ц) или гуанин(Г), пятиатомный сахар-пентозу-дезоксирибозу,по имени которой и получила название сама ДНК, а так же остаток фосфорной кислоты.Эти соединения носят название нуклеотидов.

Свойства гена

  1. дискретность - несмешиваемость генов;
  2. стабильность - способность сохранять структуру;
  3. лабильность - способность многократно мутировать;
  4. множественный аллелизм - многие гены существуют в популяции во множестве молекулярных форм;
  5. аллельность - в генотипе диплоидных организмов только две формы гена;
  6. специфичность - каждый ген кодирует свой признак;
  7. плейотропия - множественный эффект гена;
  8. экспрессивность - степень выраженности гена в признаке;
  9. пенетрантность - частота проявления гена в фенотипе;
  10. амплификация - увеличение количества копий гена.

Классификация

  1. Структурные гены - уникальные компоненты генома, представляющие единственную последовательность, кодирующую определенный белок или некоторые виды РНК. (См. также статью гены домашнего хозяйства).
  2. Функциональные гены - регулируют работу структурных генов.

Генети́ческий код - свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов.

В ДНК используется четыре нуклеотида - аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменён похожим нуклеотидом - урацилом, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Для построения белков в природе используется 20 различных аминокислот. Каждый белок представляет собой цепочку или несколько цепочек аминокислот в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства. Набор аминокислот также универсален почти для всех живых организмов.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке.

Свойства

  1. Триплетность - значащей единицей кода является сочетание трёх нуклеотидов (триплет, или кодон).
  2. Непрерывность - между триплетами нет знаков препинания, то есть информация считывается непрерывно.
  3. Неперекрываемость - один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов (не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки).
  4. Однозначность (специфичность) - определённый кодон соответствует только одной аминокислоте (однако, кодон UGA у Euplotes crassus кодирует две аминокислоты - цистеин и селеноцистеин)
  5. Вырожденность (избыточность) - одной и той же аминокислоте может соответствовать несколько кодонов.
  6. Универсальность - генетический код работает одинаково в организмах разного уровня сложности - от вирусов до человека (на этом основаны методы генной инженерии; есть ряд исключений, показанный в таблице раздела «Вариации стандартного генетического кода» ниже).
  7. Помехоустойчивость - мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными ; мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными .

Биосинтез белка и его этапы

Биосинтез белка - сложный многостадийный процесс синтеза полипептидной цепи из аминокислотных остатков, происходящий на рибосомах клеток живых организмов с участием молекул мРНК и тРНК.

Биосинтез белка можно разделить на стадии транскрипции, процессинга и трансляции. Во время транскрипции происходит считывание генетической информации, зашифрованной в молекулах ДНК, и запись этой информации в молекулы мРНК. В ходе ряда последовательных стадий процессинга из мРНК удаляются некоторые фрагменты, ненужные в последующих стадиях, и происходит редактирование нуклеотидных последовательностей. После транспортировки кода из ядра к рибосомам происходит собственно синтез белковых молекул, путём присоединения отдельных аминокислотных остатков к растущей полипептидной цепи.

Между транскрипцией и трансляцией молекула мРНК претерпевает ряд последовательных изменений, которые обеспечивают созревание функционирующей матрицы для синтеза полипептидной цепочки. К 5΄-концу присоединяется кэп, а к 3΄-концу поли-А хвост, который увеличивает длительность жизни мРНК. С появлением процессинга в эукариотической клетке стало возможно комбинирование экзонов гена для получения большего разнообразия белков, кодируемым единой последовательностью нуклеотидов ДНК, - альтернативный сплайсинг.

Трансляция заключается в синтезе полипептидной цепи в соответствии с информацией, закодированной в матричной РНК. Аминокислотная последовательность выстраивается при помощи транспортных РНК (тРНК), которые образуют с аминокислотами комплексы - аминоацил-тРНК. Каждой аминокислоте соответствует своя тРНК, имеющая соответствующий антикодон, «подходящий» к кодону мРНК. Во время трансляции рибосома движется вдоль мРНК, по мере этого наращивается полипептидная цепь. Энергией биосинтез белка обеспечивается за счёт АТФ.

Готовая белковая молекула затем отщепляется от рибосомы и транспортируется в нужное место клетки. Для достижения своего активного состояния некоторые белки требуют дополнительной посттрансляционной модификации.

Генетический код – это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.

Свойства генетического кода.

Генетический код имеет несколько свойств.

    Триплетность.

    Вырожденность или избыточность.

    Однозначность.

    Полярность.

    Неперекрываемость.

    Компактность.

    Универсальность.

Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.

а. Триплетность. Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет – наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон – наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет – это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон – характеризует элементарную смысловую единицу генома – три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.

Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 4 3 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).

Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую либо аминокислоту, их называют смысловые кодоны . Три триплета не кодируют

аминокислот а являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три – УАА, УАГ, УГА , их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называютнонсенс-мутация . Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться – синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» — Средиземное море, где эта болезнь впервые обнаружена).

Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.

Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции .

б. Вырожденность или избыточность.

61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.

Его предпочтение очевидно. Если бы из 64 варианта триплетов в кодировании аминокислот участвовало только 20, то 44 триплета (из 64) оставались бы не кодирующими, т.е. бессмысленными (нонсенс-кодонами). Ранее мы указывали, насколько опасно для жизнедеятельности клетки превращение кодирующего триплета в результате мутации в нонсенс-кодон — это существенно нарушает нормальную работу РНК-полимеразы, приводя в конечном итоге к развитию заболеваний. В настоящее время в нашем геноме три кодона являются бессмысленными, а теперь представьте, что было бы если число нонсенс-кодонов увеличится в примерно в 15 раз. Понятно, что в такой ситуации переход нормальных кодонов в нонсенс-кодоны будет неизмеримо выше.

Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами - УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин - двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит названиевырожденность.

Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках.

И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.

Необходимо отметить, что термин вырожденность используется в молекулярной генетики и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют “вырожденностью третьего основания”. Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент - гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части – глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит гем, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона , который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид – первый, второй или третий. Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше “вырожденность третьего основания”, когда замена третьего нуклеотида в триплете кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.

Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка - глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные -цепи и две -цепи. Молекула -цепи содержит 141 аминокислотных остатков, -цепочка - 146, — и -цепи различаются по многим аминокислотным остаткам. Аминокислотная последовательность каждой глобиновой цепи кодируется своим собственным геном. Ген, кодирующий -цепь располагается в коротком плече 16 хромосомы, -ген - в коротком плече 11 хромосомы. Замена в гене, кодирующем -цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” - приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту - тирозин Фенотипически это проявится в тяжёлом заболевании.. Аналогичная замена в 63 положении -цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении -цепи является причиной тяжелейшего заболевания - серповидно-клеточной анемии. Не будем продолжать печальный список. Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в -цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам - они обе гидрофильны. Валин - гидрофобная аминокислота. Поэтому, замена гидрофильной глютаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глютаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина - у больных возникает легкая форма малокровия. В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту – гистидин.

В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.

в. Однозначность.

Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон – аминокислота генетический код однозначен, в направлении аминокислота – кодон – неоднозначен (вырожденный).

Однозначен

Кодон аминокислота

Вырожденный

И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген – несколько поипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.

г. Полярность

Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).

Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.

д. Неперекрываемость.

Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.

Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) (рис.33,А) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) (рис. 33, Б) или пять (если общими являются два нуклеотида) (см. рис. 33, В). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.

Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся.

Поясним это на рисунке 34. Жирными линиями показаны триплеты кодирующие аминокислоты в случае не перекрывающегося и перекрывающегося кода. Эксперименты однозначно показали, что генетический код является не перекрывающимся. Не вдаваясь в детали эксперимента отметим, что если заменить в последовательности нуклеотидов (см. рис.34) третий нуклеотид У (отмечен звёздочкой) на какой-либо другой то:

1. При неперекрывающемся коде контролируемый этой последовательностью белок имел бы замену одной (первой) аминокислоте (отмечена звёздочками).

2. При перекрывающемся коде в варианте А произошла бы замена в двух (первой и второй) аминокислотах (отмечены звёздочками). При варианте Б замена коснулась бы трёх аминокислот (отмечены звёздочками).

Однако многочисленные опыты показали, что при нарушении одного нуклеотида в ДНК, нарушения в белке всегда касаются только одной аминокислоты, что характерно для неперекрывающегося кода.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

ГЦУ ГЦУ ГЦУ УГЦ ЦУГ ГЦУ ЦУГ УГЦ ГЦУ ЦУГ

*** *** *** *** *** ***

Аланин – Аланин Ала – Цис – Лей Ала – Лей – Лей – Ала – Лей

А Б В

Не перекрывающийся код Перекрывающийся код

Рис. 34. Схема, объясняющая наличие в геноме не перекрывающегося кода (объяснение в тексте).

Неперекрываемость генетического кода связана с ещё одним свойством – считывание информации начинается с определённой точки – сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ.

Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.

е. Компактность.

Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.

ж. Универсальность.

Код един для всех организмов живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.

Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.

Кодовая система ДНК.

Генетический код днк состоит из 64 триплетов нуклеотидов. Эти триплеты называют кодонами. Каждый кодон кодирует одну из 20 аминокислот, используемых в синтезе белков. Это дает некоторую избыточность в коде: большинство аминокислот кодируется более чем одним кодоном.
Один кодон выполняет две взаимосвязанные функции: сигнализирует о начале перевода и кодирует включения аминокислоты метионина (Met) в растущую полипептидную цепь. Кодовая система днк устроена так, что генетический код может быть выражен либо как РНК-кодонами, либо кодонамиДНК. РНК-кодоны встречаются в РНК (мРНК) и эти кодоны способны читать информацию в процессе синтеза полипептидов (процесс, называемый переводом). Но каждая молекула мРНК приобретает последовательность нуклеотидов в транскрипции с соответствующего гена.

Все, кроме двух аминокислот (Met и Trp) могут быть закодированы посредством от 2 до 6 различных кодонов. Тем не менее, геном большинства организмов показывает, что определенные кодоны предпочтительны по сравнению с другими. У человека, например, аланин кодируется GCC четыре раза чаще, чем в GCG. Это, вероятно, свидетельствует о большей эффективности перевода аппарата трансляции (например, рибосомы) для некоторых кодонов.

Генетический код является почти универсальным. Те же кодоны назначены на тот же участок аминокислот и тем же сигналы пуска и остановки в подавляющем большинстве совпадают у животных, растений и микроорганизмов. Тем не менее, некоторые исключения были найдены. Большинство из них включают назначение одного или двух из трех стоп-кодонов к аминокислоте.

Генетический код разных организмов обладает некоторыми общими свойствами:
1) Триплетность. Для записи любой, в том числе и наследственной информации используется определенный шифр, элементом которого является буква, или символ. Совокупность таких символов составляет алфавит. Отдельные сообщения записываются комбинацией символов, которые называются кодовыми группами, или кодонами. Известен алфавит, состоящий всего из двух символов, - это азбука Морзе. В ДНК 4 буквы – первые буквы названий азотистых оснований (А, Г, Т, Ц), значит, генетический алфавит состоит всего из 4 символов. Что же является кодовой группой, или, словом генетического кода? Известно 20 основных аминокислот, содержание которых должно быть записано генетическим кодом, т. е. 4 буквы должны дать 20 кодовых слов. Допустим, слово состоит из одного символа, тогда мы получим только 4 кодовые группы. Если же слово состоит из двух символов, то таких групп будет только 16, а этого явно мало, чтобы закодировать 20 аминокислот. Следовательно, в кодовом слове должно быть минимум 3 нуклеотида, что даст 64 (43) сочетания. Такого количества триплетных сочетаний вполне достаточно для кодирования всех аминокислот. Таким образом, кодон генетического кода – это триплет нуклеотидов.
2) Вырожденность (избыточность) – свойство генетического кода состоящее с одной стороны, в том, что он содержит избыточные триплеты, т. е. синонимы, а с другой – «бессмысленные» триплеты. Поскольку код включает 64 сочетания, а кодируются только 20 аминокислот, то некоторые аминокислоты кодируются несколькими триплетами (аргинин, серин, лейцин – шестью; валин, пролин, аланин, глицин, треонин – четырьмя; изолейцин – тремя; фенилаланин, тирозин, гистидин, лизин, аспарагин, глутамин, цистеин, аспарагиновая и глутаминовая кислоты – двумя; метионин и триптофан – одним триплетом). Некоторые кодовые группы (УАА, УАГ, УГА) вообще не несут смысловой нагрузки, т. е. являются «бессмысленными» триплетами. «Бессмысленные», или nonsense, кодоны выполняют функцию терминаторов цепей – знаков препинания в генетическом тексте – служат сигналом окончания синтеза белковой цепи. Такая избыточность кода имеет большое значение для повышения надежности передачи генетической информации.
3) Неперекрываемость. Кодовые триплеты никогда не перекрываются, т. е. всегда транслируются вместе. При считывании информации с молекулы ДНК невозможно использование азотистого основания одного триплета в комбинации с основаниями другого триплета.
4) Однозначность. Нет случаев, когда один и тот же триплет соответствовал бы более чем одной кислоте.
5) Отсутствие разделительных знаков внутри гена. Генетический код считывается с определенного места без запятых.
6) Универсальность. У различных видов живых организмов (вирусов, бактерий, растений, грибов и животных) одинаковые триплеты кодируют одни и те же аминокислоты.
7) Видовая специфичность. Количество и последовательность азотистых оснований в цепи ДНК у разных организмов различные.

Сегодня ни для кого не секрет, что программа жизнедеятельности всех живых организмов записана на молекуле ДНК. Проще всего представить молекулу ДНК в виде длинной лестницы. Вертикальные стойки этой лестницы состоят из молекул сахара, кислорода и фосфора. Вся важная рабочая информация в молекуле записана на перекладинах лестницы — они состоят из двух молекул, каждая из которых крепится к одной из вертикальных стоек. Эти молекулы — азотистые основания — называются аденин, гуанин, тимин и цитозин, но обычно их обозначают просто буквами А, Г, Т и Ц. Форма этих молекул позволяет им образовывать связи — законченные ступеньки — лишь определенного типа. Это связи между основаниями А и Т и между основаниями Г и Ц (образованную таким образом пару называют «парой оснований» ). Других типов связи в молекуле ДНК быть не может.

Спускаясь по ступенькам вдоль одной цепи молекулы ДНК, вы получите последовательность оснований. Именно это сообщение в виде последовательности оснований и определяет поток химических реакций в клетке и, следовательно, особенности организма, обладающего данной ДНК. Согласно центральной догме молекулярной биологии , на молекуле ДНК закодирована информация о белках , которые, в свою очередь, выступая в роли ферментов (см. Катализаторы и ферменты), регулируют все химические реакции в живых организмах.

Строгое соответствие между последовательностью пар оснований в молекуле ДНК и последовательностью аминокислот, составляющих белковые ферменты, называется генетическим кодом. Генетический код был расшифрован вскоре после открытия двуспиральной структуры ДНК. Было известно, что недавно открытая молекула информационной , или матричной РНК (иРНК, или мРНК), несет информацию, записанную на ДНК. Биохимики Маршалл Уоррен Ниренберг (Marshall W. Nirenberg) и Дж. Генрих Маттеи (J. Heinrich Matthaei) из Национального института здравоохранения в городке Бетезда под Вашингтоном, округ Колумбия, поставили первые эксперименты, которые привели к разгадке генетического кода.

Они начали с того, что синтезировали искусственные молекулы иРНК, состоявшие только из повторяющегося азотистого основания урацила (который является аналогом тимина, «Т», и образует связи только с аденином, «А», из молекулы ДНК). Они добавляли эти иРНК в тестовые пробирки со смесью аминокислот, причем в каждой пробирке лишь одна из аминокислот была помечена радиоактивной меткой. Исследователи обнаружили, что искусственно синтезированная ими иРНК инициировала образование белка лишь в одной пробирке, где находилась меченая аминокислота фенилаланин. Так они установили, что последовательность «—У—У—У—» на молекуле иРНК (и, следовательно, эквивалентную ей последовательность «—А—А—А—» на молекуле ДНК) кодирует белок, состоящий только из аминокислоты фенилаланина. Это было первым шагом к расшифровке генетического кода.

Сегодня известно, что три пары оснований молекулы ДНК (такой триплет получил название кодон ) кодируют одну аминокислоту в белке. Выполняя эксперименты, аналогичные описанному выше, генетики в конце концов расшифровали весь генетический код, в котором каждому из 64 возможных кодонов соответствует определенная аминокислота.

Каждый живой организм обладает особым набором белков. Определенные соединения нуклеотидов и их последовательность в молекуле ДНК образуют генетический код. Он передает информацию о строении белка. В генетике была принята определенная концепция. Согласно ей, одному гену соответствовал один фермент (полипептид). Следует сказать, что исследования о нуклеиновых кислотах и белках проводились в течение достаточно продолжительного периода. Далее в статье подробнее рассмотрим генетический код и его свойства. Будет также приведена краткая хронология исследований.

Терминология

Генетический код - это способ зашифровки последовательности белков аминокислот с участием нуклеотидной последовательности. Этот метод формирования сведений характерен для всех живых организмов. Белки - природные органические вещества с высокой молекулярностью. Эти соединения также присутствуют в живых организмах. Они состоят из 20 видов аминокислот, которые называются каноническими. Аминокислоты выстроены в цепочку и соединены в строго установленной последовательности. Она определяет структуру белка и его биологические свойства. Встречается также несколько цепочек аминокислот в белке.

ДНК и РНК

Дезоксирибонуклеиновая кислота - это макромолекула. Она отвечает за передачу, хранение и реализацию наследственной информации. ДНК использует четыре азотистых основания. К ним относятся аденин, гуанин, цитозин, тимин. РНК состоит из тех же нуклеотидов, кроме того из них, в составе которого находится тимин. Вместо него присутствует нуклеотид, содержащий урацил (U). Молекулы РНК и ДНК представляют собой нуклеотидные цепочки. Благодаря такой структуре образовываются последовательности - "генетический алфавит".

Реализация информации

Синтез белка, который кодируется геном, реализовывается при помощи объединения мРНК на матрице ДНК (транскрипции). Также происходит передача генетического кода в последовательность аминокислот. То есть имеет место синтез полипептидной цепи на мРНК. Для зашифровки всех аминокислот и сигнала окончания белковой последовательности достаточно 3-х нуклеотидов. Эта цепь называется триплетом.

История исследования

Изучение белка и нуклеиновых кислот проводилось длительное время. В середине 20 века, наконец, появились первые идеи о том, какую природу имеет генетический код. В 1953 году выяснили, что некоторые белки состоят из последовательностей аминокислот. Правда, тогда еще не могли определить их точное количество, и по этому поводу велись многочисленные споры. В 1953 году авторами Уотсоном и Криком было опубликовано две работы. Первая заявляла о вторичной структуре ДНК, вторая говорила о ее допустимом копировании при помощи матричного синтеза. Кроме того, был сделан акцент на то, что конкретная последовательность оснований - это код, несущий наследственную информацию. Американский и советский физик Георгий Гамов допустил гипотезу кодирования и нашел метод ее проверки. В 1954 году была опубликована его работа, в ходе которой он выдвинул предложение установить соответствия между боковыми аминокислотными цепями и "дырами", имеющими ромбообразную форму, и использовать это как механизм кодирования. Потом его назвали ромбическим. Разъясняя свою работу, Гамов допустил, что генетический код может являться триплетным. Труд физика стал одним из первых среди тех, которые считались близкими к истине.

Классификация

По истечении нескольких лет предлагались различные модели генетических кодов, представляющие собой два вида: перекрывающиеся и неперекрывающиеся. В основе первой было вхождение одного нуклеотида в состав нескольких кодонов. К ней принадлежит треугольный, последовательный и мажорно-минорный генетический код. Вторая модель предполагает два вида. К неперекрывающимся относятся комбинационный и "код без запятых". В основе первого варианта лежит кодировка аминокислоты триплетами нуклеотидов, и главным является его состав. Согласно "коду без запятых", определенные триплеты соответствуют аминокислотам, а остальные нет. В этом случае считалось, что при расположении любых значащих триплетов последовательно другие, находящиеся в иной рамке считывания, получатся ненужными. Ученые полагали, что существует возможность подбора нуклеотидной последовательности, которая будет удовлетворять этим требованиям, и что триплетов ровно 20.

Хотя Гамов с соавторами ставили под сомнение такую модель, она считалась наиболее правильной на протяжении следующих пяти лет. В начале второй половины 20-го века появились новые данные, которые позволили обнаружить некоторые недочеты в "коде без запятых". Было выявлено, что кодоны способны провоцировать синтез белка в пробирке. Ближе к 1965 году осмыслили принцип всех 64 триплетов. В результате обнаружили избыточность некоторых кодонов. Другими словами, последовательность аминокислот кодируется несколькими триплетами.

Отличительные особенности

К свойствам генетического кода относятся:

Вариации

Впервые отклонение генетического кода от стандартного было обнаружено в 1979 году во время изучения генов митохондрий в организме человека. Далее выявили еще подобные варианты, в том числе множество альтернативных митохондриальных кодов. К ним относятся расшифровка стоп-кодона УГА, используемого в качестве определения триптофана у микоплазм. ГУГ и УУГ у архей и бактерий нередко применяются в роли стартовых вариантов. Иногда гены кодируют белок со старт-кодона, отличающийся от стандартно используемого этим видом. Кроме того, в некоторых белках селеноцистеин и пирролизин, которые являются нестандартными аминокислотами, вставляются рибосомой. Она прочитывает стоп-кодон. Это зависит от последовательностей, находящихся в мРНК. В настоящее время селеноцистеин считается 21-ой, пирролизан - 22-ой аминокислотой, присутствующей в составе белков.

Общие черты генетического кода

Однако все исключения являются редкостью. У живых организмов в основном генетический код имеет ряд общих признаков. К ним относятся состав кодона, в который входят три нуклеотида (два первых принадлежат к определяющим), передача кодонов тРНК и рибосомами в аминокислотную последовательность.