Вы находитесь на странице: 1из 73

Технологии геномного анализа

Illumina на основе биочиповых тест-


систем и секвенирования NGS:
Возможности,
Успехи,
Достижения!

Илья Дёмин
Специалист по
продвижению продукции

Moscow, 2011

Welcome to illumina!
Миссия компании
Инновационные разработки будущего в области генетического анализа

От исследования генома человека…

до валидации новых мишеней…

Задача компании illumina состоит в достижении лидирующих позиций при


разработке комплексных решений в области генетики и здравоохранения
illumina в мире
Illumina BV Illumina Китай
(Нидерланды) (Пекин)

Illumina
Кембридж Россия

Illumina Хейвард Корея


(Хейвард, Калифорния) Турция
Illumina Восток Джинан Illumina KK (Токио)
(Валингфорд, Израиль
Главное управление Ченгду Шанхай
Illumina Коннектикут)
Персидский залив Индия Тайвань
(Сан Диего,
Тайланд Вьетнам
Калифорния)
Illumina Малайзия
Сингапур

Южная Африка

Австралия Новая Зеландия

Компания основана в 1998 году, штаб-кватрира –



San-Diego, США
Коммерческий
Производство/исследования и разработки Дважды становилась №1 в рейтинге Forbes как
наиболее быстро развивающаяся технологическая
Партнеры компания - 2007 и 2009; в 2008 попала в рейтинг
NASDAQ-100
Сейчас – более 2500 сотрудников

3
Сегодня компания illumina предлагает:
Анализ генной Молекулярную
Секвенирование Генотипирование
экспрессии диагностику

• Ресеквенирование • Комплексное • Профиль • Применение НИР


• Секвенирование de novo изучение генома экспрессии
• Продукты домашнего
человека и животных • Поиск биомаркеров
• Выявление редких приготовления
вариантов • Исследование и их валидация (Homebrew)
биомаркеров и их • Выявление
• Цифровое изображение • Диагностика
валидация ассоциированных
картин экспрессии генов сопутствующих
• Определение • Эпигенетические заболеваний
заболеваний
транскриптов исследования • Проведение
• Проведение клинических • Стандартный скрининг
• Секвенирование
продуктов CHiP клинических экспериментов • Выявление
экспериментов инфекционных
• Mетиллирование
• Потребительские заболеваний
• Метиллирование de novo
услуги

Персонализированная медицина
HiSeq 1000/2000 HiScanSQ BeadXpress iScan
MiSeq Genome Analyser
Анализатор
Настольный
биочипов Анализатор Анализатор
ДНК- ДНК- ДНК-
+ биочипов биочипов
секвенатор секвенатор секвенатор
Сиквенсовый
модуль

Анализ
Секвенирование микроматриц
Секвенирование сегодня:
Новые горизонты
ВОЗМОЖНОСТЬ ГЛУБОКОГО АНАЛИЗА МНОЖЕСТВА КРУПНЫХ,
КОМПЛЕКСНЫХ ГЕНОМОВ И ТРАНСКРИПТОМОВ

СОСТАВЛЯЕТ ОСНОВУ КРУПНЕЙШИХ ИССЛЕДОВАНИЙ В ОБЛАСТИ


КАНЦЕРОГЕНЕЗА И ИЗУЧЕНИЯ ГЕНЕТИЧЕСКИХ ЗАБОЛЕВАНИЙ

ЛЕЖИТ В ОСНОВЕ ТРАНСЛЯЦИОННОЙ МЕДИЦИНЫ

ПОЗВОЛЯЕТ ОСУЩЕСТВЛЯТЬ DE NOVO СЕКВЕНИРОВАНИЕ:


Человека
Растений
Животных
Объектов потребительской геномики
Общие технологические шаги NGS
• Подготовка библиотек (матриц), оценка их качества
– Выделение ДНК или РНК с ОТ - кДНК,
– Разрушение ДНК на короткие участки (УЗ,
ферменты)
– Достройка ДНК под требования платформы
секвенирования – лигирование адаптеров и
индексов
– Оценка качества библиотеки
– Предамплификация – формирование кластеров
• Секвенирование
– Секвенирование путём синтеза (Illumina),
• Анализ данных - биоинформатика
– Сборка ридов – превращение данных от прибора в
данные последовательности нуклеотидов,
построение метрик качества
– Сборка контигов – выравнивание ридов так, чтобы
они сформировали разумную последовательность
или ее варианты
Шаг 1: Пробоподготовка

Active Chromatin Genomic DNA


(1-5 ug)

Small RNA
mRNA
10 ug total RNA
10 ug total RNA

10 ng ChIP-Sequencing Other Apps


Фрагменты ДНК

Затупление концов

Фосфорилирование

Аденилирование

Лигирование адаптеров
Epicentre Nextera
Технология подготовки библиотек для NGS
2 часа, одна пробирка, 50 нг ДНК
Разнообразие наборов для пробоподготовки

Sample Prep Kits

• Спецификация по
типу исследования
Геномная • Возможность Полногеномная
ДНК мультиплексного экспрессия
анализа

Экзомное РНК и
обогащение микроРНК

Mate Pair
ChiP-Seq секвенирование
(фрагменты 2-5 kb)
Flow Cell

Поверхность
flow cell
покрыта
газонов
парных олигов
Генерация кластеров:
Гибридизация и комплиментарный синтез

Сиквенсовый
адаптер

3’ удлинение
Генерация кластеров:
Денатурация 2-цепочечной ДНК
• Двуцепочечная
молекула
денатурирует Новая цепь
• Первичная цепь Первичная
вымывается цепь
• Новая цепь
закреплена на сброс
поверхности
проточной ячейки
Генерация кластеров:
Ковалентно-связанные одиночные молекулы разделены пространственно

Единичные
молекулы
рандомно
расположены на
внутренней
поверхности
проточной
ячейки
Генерация кластеров:
Амплификация по типу мостов
• Одноцепочечные
молекулы становятся
«мостиком» и
гибридизуются на
смежных олигах
• Затем происходит синтез
новой цепи
Генерация кластеров:
Амплификация по типу мостов

• Образуется двуцепочечный мостик


Генерация кластеров:
Амплификация по типу мостов

• Цикл повторяется, пока не


образуются структуры из
множества мостов
Генерация кластеров:
• Структура моста
денатурирует
• Результат: 2 копии
ковалентно-связанных
одноцепочечных
молекул
Генерация кластеров:

• «Отстающая
цепь»
вымывается,
остаётся только
«лидирующая»
Генерация кластеров:
Генерация кластеров:
• Свободные
3’ концы
блокируются
• Сиквенсовый
праймер
гибридизуется Сиквенсовый
на праймер
сиквенсовый
адаптер
Амплификация кластеров

100um
~1000 молекул на ~ 1 um кластер
~7 миллиардов кластеров «Звёздное небо» из молекулярных кластеров ДНК
Sequencing Process
1 Library prep (~ 6 hrs) Fragment DNA

Repair ends / Add A overhang

Ligate adapters

Select ligated DNA

2 Automated Cluster Generation (~ 5 hrs)


Hybridize to flow cell

1-8 samples Extend hybridized oligos

Perform bridge amplification

3 Непосредственно секвенирование Анализ последовательности DNA


(~1,5-11 дней)
Первичная обработка данных
Секвенирование путем синтеза (SBS)
3’ 5’

Цикл 1: Добавить реагенты для секвенирования


Первое основание включено
Удалить невключившиеся основания

A
Детектировать сигнал
T
G Разблокировать и снять флуоресцентную метку
C C
G Основание Флюоресценция
T T PPP
A
C C
A G
T
A
G T
A Цикл 2: Добавить реагенты для секвенирования
A
T
C и повторить
C

G
C
G
• Все 4 нуклеотида добавляются в одной реакции
C
A
T
• Высокая точность
C • Секвенирование от основания к основанию
G
A • Не возникает проблем с гомополимерными
T
повторами
5’
Технология Clonal Single Molecule Array (Клональная
амплификация на чипе )

>7 миллионов кластеров


на проточную кювету MiSeq
И >3 млрд кластеров на
проточную кювету HiSeq

20 микрон

100 микрон 27
Новая разработка illumina
Персональный NGS
Встречайте! MiSeq

52.3 cm
12 cm
Эволюция приборов NGS на
примере платформы illumina

Все технологические этапы работы с пробами объединены в одном приборе


Генерация кластеров
Флюидика для парно—концевых чтений
Первичный и вторичный компьютерный анализ
По цене обычного секвенатора по Сенгеру
MiSeq – Подготовка, Запуск, Анализ

Ампликоны Биоинформатическая
Клональная обработка данных
Подготовка
амплификация и
бибилотеки
Образец Сиквенс 2 часа 08:00:00
1,5 часа полностью
4,5 часа
автоматизированно)
gDNA

MiSeq – единственная система, дающая результат


от образца до собранной последовательности за 8 часов
MiSeq: NGS это просто
Next-Gen Made Simple: Load & Go
Интуитивно понятный интерфейс
Катридж с реагентами (одноразовый)
Генерация кластеров (клональная амплификация)
и блок флюидики для парноконцевых чтений
встроены в прибор
Радиометка (RFID) на реагентах и
проточной ячейке
Автоматическая настройка и регулировка
Автоматизация «включил и ушел»

Load
Go
Анализ данных
MiSeq
Характеристики и производительность

Производительность оптимальна для работы с небольшими геномами


(может сделать полный сиквенс нескольких бактериальных
геномов de novo, достаточен для метогеномных исследований)
Самый простой из существующих на рынке методов пробоподготовки
для систем полногеномного секвенирования
Наиболее проверенная по качеству и надежности данных технология на
данный момент
Недорогой прибор и недорогой запуск – ~50 долларов за бактериальный
геном.
«Все в одной коробке», включая биоинформатику
Сравнительная характеристика секвенирующих платформ illumina

HiSeq2000 HiSeq1000 HiScanSQ Genome Analyzer MiSeq


Количество
генерируемых > 600 > 300 > 150 95 >1
данных, Гб
Количество
проточных 2/16 1/8 1/8 1/8 1/1
ячеек/каналов
Возможность
мультиплекса, 192 96 96 96 48
образцы

Одноконцевое
2,5-3 млрд 1,3-1,5 млрд 600-750 млн 320 млн 3,4 млн
чтение

Чтение с двух
5-6 млрд 2,5-3 млрд 1,2-1,5 млрд 640 млн 6,8 млн
концов

Длина чтения, п.н. 2*100 2*100 2*100 2*150 2*150

Ампликоны, малые
Геномика, Геномика, Геномика, Геномика, геномы и
Применение в транскриптомы,
транскриптомика, транскриптомика, транскриптомика, транскриптомика,
исследованиях проверка результатов
эпигенетика эпигенетика эпигенетика эпигенетика клонирования и
генной модификации
Сколько стоит NGS?
Изменение цены сиквенса полного генома человека как
универсального ценового индикатора
$10,000,000

500-кратное
$1,000,000 уменьшение
стоимости за 3
года!
$100,000

$10,000

$1,000
2007 1G 2007 GA 2008 GAII 2009 GAIIx 2010 HiSeq 2011 HiSeq 2011 MiSeq
MiSeq
Удобное решение для любой лаборатории

ВСЕ МЕТОДИКИ NGS В ОДНОМ ИНСТРУМЕНТЕ

УДОБНОЕ, ДЕШЕВОЕ И ПРОИЗВОДИТЕЛЛЬНОЕ


СЕКВЕНИРОВАНИЕ АМПЛИКОНОВ

СЕКВЕНИРОВАНИЕ ГЕНОМОВ МИКРООРГАНИЗМОВ И


МЕТАГЕНОМОВ

БЫСТРЫЙ И КАЧЕСТВЕННЫЙ СКРИНИНГ


Инфекционных болезней
Качества лекарственных препаратов
Контроля лечения
Проверка клонов
Целевое секвенирование участков генома
Тканевое типирование

КОНТРОЛЬ ЭКСПРЕССИИ И ГЕННОЙ РЕГУЛЯЦИИ


Спектр задач, решаемых полногеномными
• Геномика секвенаторами
– Секвенирование геномов de novo
– Полное повторное секвенирование геномов (поиск SNP, структурных перестроек и
вариаций, полногеномное генотипирование).
– Копийность генов, структурные вариации ДНК
• Транскриптомика
– Анализ РНК (RNA-Seq)
– Изучение малых РНК (miRNA, siRNA, piRNA, esiRNA).
– Измерение уровней мРНК, анализ изоформ мРНК, изучение некодирующих РНК,
детекция новых транскриптов.
– Анализ экспрессии генов, в том числе, в отдельной клетке, по чувствительности
сравнимый с ПЦР.
• Эпигенетика
– Иммунопреципитация хроматина с последующим секвенированием (ChIP-Seq).
• Факторы транскрипции, Модификации гистонов
– Анализ статуса метилирования ДНК в полногеномном масштабе (MeDIP-Seq).
• Исследование бактериома (метагеномика)
– Прямое полногеномое типирование микроорганизмов и вирусов
– Определение микробиологического состава популяций (экология, экосистемы, почвы)
– Таксономия
Объединение технологий NGS и
микрочипов высокой плотности
Платформа iScan –биочипы высокой плотности

• Технология биочипов высокой


плотности
• 2 вида чипов:
– Infinum – плотность 6К-240К-
5М маркеров /чип
– GoldenGate – плотность 96-6К
маркеров/чип
• Производительность – 2-12
образцов на чип

Технологическая платформа используется для высокопроизводительного


анализа SNP; экспрессии генов; CNV (вариацию числа копий); генетических
полиморфизмов MHC, ассоциированных с заболеваниями; метилирования;

Есть панели на человека, мышь, овцу, лошадь, Custom-панели


Технология BeadChip
Приготовление микролунок с BeadChip

Кремниевое покрытие

Фото-
устойчивый
слой

Микролунки
2um

2um

3.7um
G G C T A A
Однонуклеотидное удлинение dintrophenol-labeled ddNTPs
A T

biotin-labeled ddNTPs
C G

GC CG CG AT AT TA
Окрашивание
streptavidin-
green

anti-DNP-
red

C C G A T T

anti-streptavidin-
biotin

anti-Ab-
DNP
Усиление сигнала и визуализация

C C G A T T

INTENSITY
INTENSITY
INTENSITY
Анализ данных. Genome Studio
Анализ данных. Genome Studio:
Наглядное и простое представление цитогенетических данных
KaryoStudio Screenshot Data display

Known regions
Zooming, editing, track
reporting functions

Known regions Gene Information


Found regions database
table

Samples table Chromosome


with QC score information
Семейство биочипов Illumina.
Цель: изучение человека
Семейство биочипов Illumina.
Цель: изучение генома животных
iScan with Autoloader2
Платформа BeadXpress –
Суспензионные биочипы
• Биочиповая технология для больших потоков образцов – 96-луночные плашки, 8-
луночные стрипы
• Мультиплексность – до ~384 образцов одновременно (технология штрих-кодирования
микрочастиц)
• Возможность работы с ДНК, РНК и белками
• Готовые наборы VeraCode, и возможность создавать собственные наборы на основе
этой технологии
• 2 флюорисцентные краски для 2 типов зондов
Технология VeraCode
КАПИЛЛЯРЫ ГОНЯТ ЧИПЫ К
АНАЛИТИЧЕСКОЙ ПЛАСТИНЕ

АНАЛИТИЧЕСКАЯ ПЛАСТИНА
С СЕКЦИЯМИ ДЛЯ ЧИПОВ

ЧИПЫ
ПОПАДАЮТ В
СЕКЦИИ
ПЛАСТИНКИ

ЧИПЫ РАСПОЛАГАЮТСЯ В ПОЗИЦИЯХ


ОПТИМАЛЬНЫХ ДЛЯ СКАНИРОВАНИЯ
Анализ чипов CCD
ВОСПРИНИМАЮЩИЙ
ЭЛЕМЕНТ
ЧИП

СЧИТЫВАЮЩИЙ
ЛУЧ

220
440
200
240
160
290
390
340
180
220
200
390
180
340
160
140
290
200
240
180
340
160
290
140
180
160
120
240

ADC Output
290
140
160
190
240
120
140
240
120
140
100
190
120
190
100
120
140
190
100
100
140
80
100
140
80
140
80
80
80
90
60
90
90
60
90
60
60
40
0
20
40
60
80
100
120
140
160
180
200
220
240
Pixel
BeadXpress Reader
НАБОРЫ ПЛАНШЕТ ДЛЯ
ЖИДКИХ ОБРАЗЦОВ
ЧИПОВ

РЕЗУЛЬТАТ
ЗА
СЧИТАННЫЕ
ПАНЕЛЬ МИНУТЫ
МУТАЦИЙ

INSTRUMENT SPECIFICATIONS

ПРОСТОЙ ФОРМАТ ИССЛЕДОВАНИЙ Стандартный 96-луночный планшет, или стрипы

МУЛЬТИПЛЕКС НА ОДНУ ЛУНКУ 1 to 384

120 образцов/час при 10-плексном исследовании


ПРОИЗВОДИТЕЛЬНОСТЬ
80 образцов/час при 96-плексном исследовании

ДЕТЕКЦИЯ 2 лазера, 2 цвета + штрих-код

Совместим со стандартным лабораторным оборудованием


АВТОМАТИЗАЦИЯ
Совместим с любой ЛИС
Платформа BeadXpress
Решаемые задачи и реагентное обеспечение
Технология – суспензионный (жидкостный)
биочип
Преимущества:
•дешевизна точки за счет мультиплекса
•большая производительность по образцам

•SNP генотипирование с выской производительностью (по образцам)


•Фармакогенетика (ADME панели – основные SNP, ассоциированные с
метаболизмом лекарств)
•Метиллирование
•Анализ экспрессии генов
•(Пользователь выбирает до 384 целевых генов и из них делается набор под
стандартную 96 луночную плашку)
•Наборы для пришивки белков и антител
•Наборы для создания собственных гибирдизационных тест-систем
Совмещая технологии…
HiScanSQ

Scan & Seq = Единственная в своём роде система, совмещающая


высокопроизводительный анализ биочипов и
HiScanSQ секвенирование нового поколения
Возможности сканера

– Загрузка и сканирование 4-х биочипов в


HiScanSQ
реальном времени
– Высокоточная оптическая система
– 2 CCD камеры
Разрешение сканера 0,5 микрон

Возможности секвенирования

Производительность данных
– До 150 Gb за 1 запуск
– Более 17,5 Gb в день
Время 1 запуска
– 1.5 дня при 1*36 bp SR
– 8 дней при 2*100 bp PE
Плотность кластеров
– Более 1,5 миллиардов кластеров,
прошедших фильтр и пригодных для анализа
Динамика числа публикаций
(только по данным, полученным на платформе Illumina)
1000

900

800

700

600

500

400

300

200

100

0
Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3 Q4 Q1 Q2 Q3

2007 2008 2009 2010


Применение
технологий
illumina в мире
Русский учёный Евгений Рогаев
и его группа путём глубокого
секвенирования ДНК семьи
Николая II с помощью
технологий Illumina определили
состав генетического кода
членов семьи, характерные
мутации в геноме, отделили
членов царской семьи от
прислуги и доказали, что
найденные отдельно останки
соответствуют геномам
царевича Алексея и княжны
Анастасии
СЕКВЕНИРОВАНИЕ ГЕНОМА РАКОВЫХ ОПУХОЛЕЙ

Nature 2008. 456:66-72

Секвенирование генома лейкемии в сравнении с образцами нормальной ткани у того


же пациента
Возможность отделить геном раковой опухоли от генома здоровых клеток в одной
пробе даже при небольшом количестве материала

“Большинство из
исследованных генов на период
начала работы даже не
рассматривались, как
кандидаты на раковую
предрасположенность”
Greninger et al,
PLOS 2010
Результат:

• Удалось идентифицировать
вирус H1N1 даже при сверх
низких титрах

• Собрать геном вируса de novo


на основе полученных данных

• Идентифицировать SNP в
последовательностях H1N1

• Получить данные о вирусном


и микробиологическом
составе образцов

• Характере и степени
иммунного ответа
«Глубокий» сиквенс
региона V6 16s rRNA

Идентификация не
культивируемых видов

Высокая
чувствительность

Мультиплексирование
(сотня разных образцов
за один запуск)
Исследование пренатальной анеуплоидии путём сиквенса с
низким покрытием в неинвазивной пренатальной диагностике

–“Sequencing is the clear way to do


non-invasive prenatal testing. … DNA
existing noninvasive Down syndrome
tests are not very informative and Sequence
provide variable results depending on
the ethnicity of those taking the test.”
Miller Syndrome
Tumor Profiling Cytogenetics
Selected
Publications
Algorithms Cytogenetics

WGAS/Algo WGAS

www.illumina.com/publications
Illumina Epigenomics
Глубокое и быстрое изучение всех областей в полном геноме,
транскриптоме и генной регуляции
DNA Sequencing
Targeted Resequencing
Genotyping arrays
ChIP-Seq GG geno on Veracode

Bisulfite Seq
Infinium methylation
GG meth on Veracode

ChI
P- mRNA-Seq
smRNA-seq
Expression arrays

Se
q

Transcriptome Epigenome Genome