Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Достижения и перспективы секвенирования



Хотя первая версия инструмента от компании 454 Life Sciences легко могла заменить более 50 капиллярных секвенаторов Applied Biosystem 3730XL по цене в шесть раз меньшей, реакция научного сообщества была на удивление прохладной. Вместо того чтобы принять новую технологию и начать использовать её неисчерпаемый потенциал, многие учёные, привыкшие к использованию метода Сэнгера, заговорили о таких проблемах, как точность расшифровки, длина отдельных прочтений, стоимость инфраструктуры... А кто-то просто восставал против необходимости работать с большими массивами информации, производимыми с использованием новой технологии.

Большинство критиков, однако, не заметили, что множество препятствий, стоящих на пути метода секвенирования следующего поколения, преграждали на первых порах путь и методу Сэнгера. Тогда длина прочтений составляла всего 25 пар оснований, и достигла 80 только после появления терминирующих дидезокси-нуклеотидов Фреда Сэнгера. Технология «секвенирования синтезом», основанная на выделении пирофосфата, изначально позволяла прочитывать отрезки длиной не более 100 нуклеотидов. Спустя 16 месяцев на биотехнологическом рынке, этот показатель был улучшен до 250 пар оснований. Последние разработки позволяют считывать уже около 500 пар оснований, приближая новый метод к методу Сэнгера с его ≈1000 нуклеотидами.

Другим важным фактором, помимо длины отдельных прочтений, является число прочтений, производимое в результате одного «прогона» секвенатора, нормированное на стоимость такого «прогона». Этот вопрос хорошо решается конкурентами 454 Life Sciences, системы которых производят в десять раз больше прочтений, платя за это укорочением их длины, составляющей всего 35 (или меньше) нуклеотидов. Сегодня на рынке существует три коммерческих системы нового поколения для секвенирования ДНК:

- Roche (454) GS FLX Genome Analyzer, распространяемый Roche Applied Sciences. (Компания 454 LIfe Sciences выкуплена гигантом Roche Diagnostics в марте 2007 г. за 154,9 млн. долларов, но продолжает оставаться независимым подразделением);

- секвенатор Illumina Solexa 1G и

- наиболее свежая система SOLiD от Applied Biosystems.

Другие системы для расшифровки ДНК, которые уже появились на рынке, относятся к «третьему поколению» и основываются на анализе одиночных молекул. Они разрабатывались компаниями VisiGen и Helicos.

И хотя прочтение бактериального генома за раз было впечатляющим достижением, поначалу не было ясно, какие биологические задачи, недоступные старому доброму методу Сэнгера, можно будет решать, взяв на вооружение новый метод пиросеквенирования. И действительно, первые проекты с участием инструмента Roche 454 GS20 заключались лишь в «перечитывании» уже расшифрованных бактериальных геномов и подкреплении дополнительными данными уже идущих больших «Сэнгеровских проектов». В то же время исследования в области метагеномики, помимо работы с огромными массивами данных, порою бóльшими, чем геном человека, страдали от искажений, вносимых на стадиях конструирования библиотек и клонирования фрагментов для секвенирования.

В этом смысле технология 454, сочетающая эПЦР и пиросеквенирование, обладает неоспоримым преимуществом перед методом Сэнгера. Эмульсионная ПЦР позволяет амплифицировать без всяких предпочтений единичные молекулы ДНК, заключая их в капельку эмульсии и устраняя конкуренцию со стороны других ДНК-матриц за ограниченное число ДНК-полимераз. Пиросеквенирование, в свою очередь, осуществляет параллельное прочтение этих матриц со световым сигналом на выходе, который может считываться компьютером. Первые подобные исследования, опубликованные в 2006 году, показали необыкновенную гибкость метода нового поколения, использованного при изучении микробного многообразия подземных экосистем глубокой шахты, глубоководных морских экосистем, морских вирусных «сообществ» («виромов») в нескольких океанах.

Интересное исследование, сочетающее в себе метагеномный анализ и «ДНК-палеонтологию», было проведено в конце 2005 г. Одного запуска инструмента Roche (454) GS20 было достаточно для анализа 13 млн. пар оснований последовательности генома 28 000-летнего мамонта. Эта работа проложила дорогу для технически более трудного проекта расшифровки генома неандертальца. Трудность такого проекта состоит в том, что количество выделяемой из образцов костей древней ДНК неандертальца составляет всего лишь 5% от количества, получаемого из «свежего материала». Следовательно, секвенировать приходится в 20 раз дольше, чем это необходимо для генома современного человека. Кроме того, вклад разрушения ДНК в образцах, сохраняемых при умеренных температурах, в сочетании с ошибками, присущими новому методу пиросеквенирования, часто превосходит уровень различия, установленный для геномов неандертальца и современного человека. Поэтому утверждать, что полученная последовательность действительно древняя, а не случайно попавшая в препарат современная ДНК, значительно легче в случае с мамонтом — современные слоны, в отличие от людей, не часто встречаются в лабораториях. Для того чтобы получить настоящую последовательность древнего генома млекопитающего, необходимо провести множество раундов прочтения каждого участка генома, а также удостовериться в происхождении прочитанных участков.

Вместе с прорывом в области секвенирования сложных смесей ДНК, такие проекты сделают возможным изучение любой экосистемы на планете на уровне последовательностей ДНК. Это откроет доступ к флоре и фауне 100-тысячелетней давности — возможности, превосходящие самые смелые ожидания совсем недалекого прошлого.

На клеточном уровне секвенирование нового поколения (здесь и далее речь идёт не только о пиросеквенировании, но и о других новых методах секвенирования синтезом) впервые позволяет учёным идентифицировать мутации в любом организме для всего генома. Так были найдены аллели, отвечающие за устойчивость к антибиотику у Mycobacterium tuberculosis, а также идентифицированы все мутации в геноме размером в 9 млн пар оснований у штамма бактерии, эволюционировавшей на протяжении 1000 поколений. Эти ранние попытки не только продемонстрировали способность новой технологии обнаруживать мутации и ошибки в опубликованных научных статьях, но и связанные с её использованием трудности, такие как ошибки прочтения гомополимерных последовательностей при пиросеквенировании (454) или быстрое уменьшение качества прочтения ближе к 3’-концу последовательности в системах с короткой длиной индивидуальных прочтений (Solexa или SOLiD от Applied Biosystem).

Раньше для преодоления этих трудностей данные, полученные пиросеквенированием, дополняли информацией, полученной классическим сэнгеровским путём. Но поскольку стоимость и затраты, требуемые сэнгеровской составляющей эксперимента, остаются отталкивающе высокими, многие лаборатории сегодня полагаются только на методы нового поколения, обычно сочетая относительно длинные прочтения пиросеквенирования с короткими, но дешевыми (а значит, и многочисленными) прочтениями, осуществляемыми системами Solexa и SOLiD. Такое сочетание различных платформ позволяет производить независимую оценку качества их работы, а также проверять эталонные последовательности, хранящиеся в общественных базах данных.

Получение большого количества последовательностей ДНК из различных близкородственных организмов движет вперед и развивает подход, названный повторным секвенированием (resequencing), в котором работа с последовательностями ведётся иначе, чем при сборке свежесеквенированного генома. При повторном секвенировании сборка направляется уже имеющейся под рукой эталонной последовательностью, и поэтому требует значительно меньшего покрытия (8–12-ти кратного), чем при сборке генома de novo (25–70-ти кратного). Этот подход был применён в работе по расшифровке 10 митохондриальных геномов млекопитающих, которая сделала возможными исследования в области генетики популяций, основанные не на коротких отрезках последовательности, а на полных геномах митохондрий. В настоящий момент многочисленные проекты по расшифровке микробных геномов ведутся не только для расширения списка доступных геномов, но и для проведения будущих сравнительных исследований, сопоставляющих генотип и фенотип организма на геномном уровне.

Далеко может продвинуться также и работа по изучению организмов, которые не стоят в планах по геномному секвенированию — благодаря возможностям новых методов секвенирования напрямую расшифровывать последовательности транскриптов (точнее, кДНК — ДНК-копий матричных РНК) в клетке. Изучение транскриптов посредством прямого секвенирования обладает рядом преимуществ перед методом гибридизации на ДНК-микрочипах. Главное здесь то, что секвенирование не требует никаких знаний о геномной последовательности организма a priori, поскольку последовательность транскрипта может быть немедленно сравнена с эталонной последовательностью близкородственного вида из базы данных, используя стандартные алгоритмы биоинформатики. Знание последовательностей транскриптов может в корне изменить исследования организмов, геномы которых сегодня не стоят в очереди на расшифровку, а в некоторых случаях никогда там и не окажутся. Первые работы в этой области показали, что существует возможность сопоставлять последовательности (кДНК и геномные, соответственно) двух таких далёких друг от друга видов, как бобовое Meticago truncatula и растение-эталон Arabidopsis thaliana. Также было обнаружено множество не описанных ранее транскриптов кукурузы Zea mays.

Прямой анализ транскриптов поможет обойти проблему, которую ставят перед учёными организмы с непомерно большими геномами. Несмотря на успешно проведённые проекты по расшифровке вирусных, бактериальных и больших геномов млекопитающих, метод Сэнгера оставил задачу по расшифровке геномов полиплоидных растений своим преемникам. Эти гигантские геномы, частенько принадлежащие важным хозяйственным растениям (например, геном пшеницы составляет 16 млрд пар оснований), делали все предыдущие попытки по расшифровке бесплодными. Однако перспектива дешёвого секвенирования экспрессируемых участков генома (то есть транскриптов) позволяет надеяться на успешное изучение геномов таких растений хотя бы на функциональном уровне.

И наконец, новые методы секвенирования имеют практическое применение и в медицине. Например, в генетике раковых заболеваний, специфические раковые аллели могут быть отслежены в тканях посредством высокопроизводительного секвенирования геномной ДНК в тех случаях, когда метод Сэнгера терпит поражение. И здесь большим преимуществом нового метода оборачивается многократное прочтение последовательности.

Несмотря на то, что новые методы секвенирования ДНК уже стимулировали большое количество всевозможных исследований, осуществление которых было невозможно ещё в недалёком прошлом, учёным и инженерам, занимающимися разработкой этих технологий — а равно как и компаниям, продвигающим эти технологии на рынке, — предстоит многое сделать для её улучшения. Прежде всего, снизить стоимость. Уменьшение цены на один-два порядка необходимо для осуществления надежд на персональнуюгеномику, цель которой — повторное секвенирование индивидуальных геномов по цене, не превышающей 1000 долларов. В дополнение к этому, снижение процента ошибок будет также горячо приветствоваться — не только для методов следующего поколения, но и для метода Сэнгера, который будет продолжать вносить вклад и в обозримом будущем. Возможно, появятся искусственно изменённые специализированные ДНК - полимеразы, предоставляющие информацию о последовательности ДНК в виде испускаемого светового сигнала. По мере того, как стоимость технологий будет снижаться, количество накапливаемой информации будет расти лавинообразно, что может создать «узкое место» в исследованиях. Поэтому часть усилий по разработке новых технологий секвенирования необходимо направить на развитие
биоинформатики.





Дата публикования: 2015-10-09; Прочитано: 738 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...