Секвенирование ДНК - определение последовательности четырех химических структурных блоков - так называемых «азотистых оснований» - которые составляют молекулу ДНК

Процесс, используемый для секвенирования ДНК, известен как метод обрыва цепи или метод Сэнгера. Он основан на модифицированной форме полимеразной цепной реакции.

Метод обрыва цепи (секвенирование по Сэнгеру)

Наряду с нуклеотидами и полимеразой, используемой в стандартном процессе ПЦР, подготовленная для реакции обрыва цепи среда содержит кроме четырех обычных нуклеотидов ДНК также и варианты каждого из них, так называемые дидезоксинуклеотиды.

Дидезоксинуклеотиды и секвенирование по Сэнгеру

Эти дидезоксинуклеотиды похожи на правильные нуклеотиды ДНК, но не содержат 3'-гидроксильной группы.

После того как дидезоксинуклеотид присоединен к растущей цепочке ДНК, ДНК-полимераза не может добавлять никаких других нуклеотидов. Таким образом, процесс репликации прекращается и полученный фрагмент ДНК прерывается.

Репликационная среда содержит только небольшое количество дидезоксинуклеотидных вариантов каждого из четырех нуклеотидов ДНК.

Во время прохождения полимеразной цепной реакции существует высокая вероятность того, что фермент полимеразы добавит немодифицированный нуклеотид к растущей цепи и что процесс репликации будет продолжаться. Но иногда полимераза связывает дидезоксинуклеотид с цепью и реакция прекращается.

В суспензии, содержащей миллиарды фрагментов ДНК, конечным результатом является серия фрагментов, заканчивающихся одним из четырех дидезоксинуклеотидов.

Все вместе эти фрагменты представляют собой все возможные расположения нуклеотидов A, C, G и T на синтезируемой нити.

Каждый из четырех вариантов дидезоксинуклеотида возможно пометить разными маркерами (например, красителем, который испускает свет с определенной длиной волны в ультрафиолетовом свете) для того, чтобы сделать различные нуклеотиды легко идентифицируемыми.

Поскольку фрагменты разделяются по длине и массе во время гель-электрофореза, маркеры указывают каким нуклеотидом заканчивается каждый фрагмент. Затем гель можно считывать снизу вверх для идентификации нуклеотидной последовательности.

Этот этап обычно включает в себя использование автоматического секвенатора ДНК, который ускоряет процесс считывания.

Метод обрыва цепи (секвенирование по Сэнгеру)

Метод секвенирования по Сэнгеру может быть использован для того, чтобы определить за одну реакцию последовательность ДНК образца, содержащего до одной тысячи пар оснований.

Этапы секвенирования больших геномов

Секвенирование большого генома включает в себя следующие три основных этапа:

1. Картирование генома.

Весь геном сначала случайно разбивается на более мелкие последовательности ДНК - приблизительно от 100 000 до 300 000 пар оснований.

Эти участки затем клонируют в бактериальном векторе, называемом бактериальной искусственной хромосомой или ВАС.

Повторяя этот цикл несколько раз, исследователи получают серию перекрывающихся ВАС.

Затем эти ВАС пропускают через гель-электрофорез, чтобы определить их индивидуальные фингерпринты ДНК. Изучив структуру этих паттернов, исследователи могут определить исходный порядок ВАС в геноме.

2. Секвенирование ДНК.

После того как исходный порядок ВАС был картирован, каждый ВАС разбивается рестрикционными эндонуклеазами на гораздо более мелкие фрагменты, которые могут быть секвенированы с использованием реакции обрыва цепи.

Этот этап секвенирования иногда называют BAC-BAC секвенирование.

3. Анализ результатов.

Паттерн перекрывающихся последовательностей ДНК используется для определения порядка фрагментов в каждом ВАС.

В этой процедуре используется несколько различных компьютерных программ, которые могут анализировать последовательности ДНК.

Секвенирование целого генома (метод дробовика, шотган-секвенирование, shotgun sequencing)

шотган секвенирование (метод дробовика)

Этот метод полностью пропускает стадию картирования генома.

Вместо этого весь геном разбивается на случайные фрагменты сначала около 2000, а затем около 1000 пар оснований.

(Наличие фрагментов различной длины помогает сделать сборку нуклеотидных последовательностей более точной.)

Эти фрагменты, которые насчитывают миллионы, затем секвенируются и анализируются, после чего определяются нуклеотидные последовательности, соответствующие каждой из хромосомам.

Все это делается с помощью мощных компьютеров и сложных программ.

Секвенирование следующего поколения (высокопроизводительное секвенирование) (Next-generation sequencing, high-throughput sequencing)

Секвенирование следующего поколения (NGS) - это термин, используемый для описания ряда различных современных технологий секвенирования которые включают:

  1. Illumina (Solexa) sequencing
  2. Roche 454 sequencing
  3. Ion torrent: Proton / PGM sequencing
  4. SOLiD sequencing

Секвенирование следующего поколения (этапы высокопроизводительного секвенирования)

Платформы NGS выполняют массовое параллельное секвенирование, в ходе которого миллионы фрагментов ДНК из одного образца секвенируются одновременно.

Технология массового параллельного секвенирования обеспечивает высокопроизводительное секвенирование, что позволяет секвенировать весь геном менее чем за один день.

В последнее десятилетие были разработаны несколько платформ NGS, которые обеспечивают недорогое и высокопроизводительное секвенирование.

Проект генома человека

Полный сиквенс человеческого генома был впервые опубликован в феврале 2001 года. Этот сиквенс был первым геномом млекопитающих, у которого была определена последовательность нуклеотидов в каждой хромосоме.

В результате проекта генома человека (HGP) была определена последовательность трех миллиардов пар оснований, которые составляют геном человека.

Среди непосредственных результатов проекта было открытие, что ДНК всех людей (Homo sapiens) более чем на 99,9% идентичны.

Другими словами, это означает, что все различия между людьми во всем мире являются результатом изменений менее чем одного нуклеотида на каждую 1000 в геноме каждого человека.