Вы находитесь на странице: 1из 9

16S rRNA seqüenciamento de genes de simulação de impacto

populations- microbiana do método de extração de DNA, escolha


primer e plataforma de sequenciamento

Abstrato
Antecedentes: plataformas de sequenciamento de próxima geração têm revolucionou a
nossa capacidade de investigar a composição da microbiota de ambientes complexos,
muitas vezes através de 16S rRNA sequenciação genética do componente bacteriano da
comunidade. Numerosos fatores, incluindo método de extração de DNA, sequências
iniciadoras e plataforma de sequenciamento de empregada, pode afetar a precisão dos
resultados alcançados. O objetivo deste estudo foi determinar o impacto destes três
fatores em 16S rRNA resultados de sequenciamento de genes, utilizando comunidades
mock e DNA comunidade simulada.
Resultados: O uso de diferentes seqüências de primers (V4-V5, V1-V2 e iniciadores
degenerados V1-V2) resultou em diferenças de géneros e espécies detectadas. Os
primers V4-V5 deu os resultados mais comparáveis entre plataformas. Os três Ion PGM
conjuntos de primers detectou mais de 20 espécies da comunidade simulacro do que os
conjuntos equivalentes de primers MiSeq. Os dados gerados a partir de DNA extraído
usando os métodos de extracção 2 foram muito semelhantes.
Conclusões: dados relativos à composição da microbiota diferente dependendo dos
iniciadores e uma plataforma de sequenciamento de que foram usados. Os resultados
demonstram os riscos em comparação de dados gerados por diferentes abordagens de
sequenciamento e destacar os méritos de escolher uma abordagem padronizada para a
sequenciação em situações em que é executado é necessária uma comparação entre a
sequenciação múltipla.
Palavras-chave: sequenciamento de próxima geração, comunidades Mock, 16S rRNA,
MiSeq, Ion PGM, Gut microbiota, Bias, extração de DNA

O lançamento do primeiro da próxima geração cer sequen- comercial em 2004, a Roche


454 pirossequenciador, resultou em um aumento exponencial em estudos que investigam
a ition compos- da microbiota em ambientes diversos e complexos. Embora Roche 454
plataformas foram empregados em estudos numer- ous importantes e esclarecedoras
humanos microbioma [1-4], a Illumina MiSeq [5] e Life Technologies Ion PGM [6]
plataformas são agora mais comumente utilizado para investigações baseadas em genes
16S rRNA de composição da microbiota [7-11]. A decisão sobre qual plataforma de
sequenciamento de utilizar para um determinado estudo com frequência depende
mentos e recursos requisitos, que variam de acordo com a tecnologia utilizada, o custo /
run, saída de dados, o tamanho amplicon tolerado, capacidades de armazenamento de
dados e taxas de erro.
A fim de alcançar resultados de sequenciamento precisos, muitos fatores devem ser
considerados ao projetar um estudo cing sequen-. Numerosos estudos têm investigado os
fects EF- de diferentes fatores sobre 16S rRNA dados microbiota gene, incluindo, no caso
de estudos da flora intestinal, tipo de amostra [12] (por exemplo fecal vs. cecal), o
armazenamento da amostra antes da extração do DNA [13], procedimento de extração
de DNA [14, 15], primers (sequências e 16S rRNA gene regiões) [16-18] e da plataforma
de sequenciamento utilizado [19]. Este estudo tem como objetivo analisar os efeitos de
uma combinação de 3 factores sobre os resultados de sequenciamento, ou seja, 3
diferentes 16S rRNA conjuntos de primers gene, uso da Illumina MiSeq e Life
Technologies Ion PGM sequenciadores e comparação de 2 procedimentos de extração
comumente utilizados ( QIAamp DNA Stool Mini kit comparação com o método de
repetição talão batendo (RBB) [20] com elementos da Qiagen kit de extracção fecal). As
regiões do gene de ARNr 16S bacteriano são mais comumente quando sequenciados
usando sequenciação próxima geração para estudar a composição bacteriana de um meio
ambiente. Esta abordagem é extremamente útil, como até mesmo de má qualidade ou
baixas concentrações de DNA pode ser amplificada com sucesso por degenerados comeu
iniciadores e PCR para facilitar o sequenciamento de uma região ou regiões do gene 16S
rRNA, permitindo a sequenciação de diversas populações, sem selecção prévia para
micróbios de interesse (como no caso de métodos baseados em cultura). No entanto, a
região variável específica orientada e pri- par mer usado pode ter impacto sobre os
resultados alcançados [21] e a capacidade dos pesquisadores para comparar os dados
gerados a partir de diferentes estudos de sequenciamento. Estudos recentes
demonstraram a região do gene de ARNr 16S que é extinta se- terá um impacto sobre os
resultados alcançados [22].
No que diz respeito à escolha da plataforma de sequenciação, as duas sequenciadores
em questão utilizam tecnologias diferentes, que podem afectar os resultados da
sequenciação obtidos. Resumidamente, MiSeq de Ilumina é uma versão de bancada da
plataforma HiSeq, fabricado pela mesma empresa [23]. Esta plataforma permite "-end
emparelhado 'sequenciamento, é rentável e pode atingir 2 × 300 pb emparelhado ler
comprimentos. Em contraste, o sequenciador Ion PGM utiliza tecnologia de
semicondutores através da detecção em tempo real ção de concentração de iões de
hidrogénio [6]. Actualmente, o Ion PGM produz ler comprimentos de aproximadamente
400 pb de comprimento. Como a pesquisa usando alto throughput se- Quencing continua,
há uma necessidade de estudos para optimizar a precisão mise, minimizando e, se
possível eliminar, o viés de sequenciamento. Enquanto os estudos individuais têm
comparado primers diferentes [17, 21], procedimentos de extração [14] e
sequenciamento plataformas [19], aqui o nosso objectivo é investigar as individuais e
cumulativos fects EF- estes 3 fatores sobre 16S rRNA in- baseada em gene Investigações
de composição bacteriana. Mais especificamente, usando uma amostra de DNA
comunidade simulada e as células da comunidade simulada para a extração de DNA,
ambos com uma composição pré-determinados, nosso objetivo é identificar quais fatores
(s) têm os maiores efeitos sobre os resultados de sequenciamento alcançados. Assim,
nosso objetivo foi determinar qual a extração procedimento, região do gene e da
plataforma de sequenciação resultados de rendimento 16S rRNA que refletem com mais
precisão as proporções conhecidas de bactérias DNA / bacteriana nas comunidades
simulados. A escolha dos V4-V5 e V1-V2 regiões alvo com os nossos iniciadores baseou-se
na frequência com que são actualmente utilizados em tal pesquisa, portanto, há uma
necessidade de determinar qual, se EI- Ther fornece os resultados mais precisos. Os
resultados revelaram que os 3 primers Ion detectado mais das comunidades simuladas
perado ex do que foi o caso quando os iniciadores MiSeq correspondentes foram
empregados. Ultim- diatamente, a escolha de iniciadores de PCR e sequenciação de
plata- forma tinha um impacto mais notável sobre os resultados do que qualquer um dos
métodos de extracção de ADN. Estes resultados será de valor para os pesquisadores
quando planear 16S análises futuras rRNA microbiota baseada no gene.

Resultados
A análise da qualidade dos dados Sequencing
DNA comunidade Mock (HM-782D) e DNA extraído de células da comunidade simulada
(HM-280/1) foi sequenciado nas plataformas MiSeq e Ion PGM. Detalhes sobre o número
de sequenciamento lê, ler comprimentos e percentagem de leituras retidas após
filtragem de qualidade e remoção quimera são fornecidos na Tabela 1. A percentagem
dos lucros lê foi semelhante em todas as plataformas e conjuntos de iniciadores, com a
notável exceção do V4-V5 primers em o Ion PGM, onde 80-90% foram mantidas após a
remoção quimera, em comparação a uma média de 99% retido para os outros iniciadores
em ambas as plataformas. rarefeitos curvas (Fig. 1) demonstram que a maioria das
curvas de começar a planalto, assim sequenciação adicional é improvável para se
obterem novos dados na maioria dos casos.

Efeitos de primers e uma plataforma de sequenciamento de DNA resultados


simulados
Prevê-se que a sequenciação do DNA simulada (HM-782D) iria revelar a presença de 20
espécies, com base em dados de composição do fornecedor (recursos BEI). Os 3
conjuntos de iniciadores diferem no número de espécies detectadas em relação ao
número de espécies previ- síveis presentes nesta amostra de ADN. A combinação V4 V5-
PGM era a única combinação que detectou o ADN modelo a partir de todas as 20 espécies
comunidade simulados (Tabela 2). Em geral, os 3 conjuntos de iniciadores platinóides Ion
detectado mais de 20 espécies comunidade simulacro do que os conjuntos de iniciadores
MiSeq equivalentes. Há também um número de instâncias de identificação mis isto é,
onde taxa não representados na comunidade simulada DNA foram detectados. Os mis-
espécies identificadas foram, na maioria dos casos, intimamente relacionado com
espécies conhecidas de estar presente nas amostras de simulação (por exemplo, E.
faecium detectadas, mas E. faecalis DNA está presente na amostra de ADN simulada. Os
Spingo classificador espécies destaca que essas espécies compartilham 96,4%
alinhamento espécie). Figura 2 mais especifica- camente destaca as diferenças nos
dados gerados. Como pode ser visto na Fig. 2, todos os iniciadores deu resultados que
diferem daqueles esperados para a comunidade DNA simulada. Os primers V4-V5 deu os
resultados mais comparáveis em todas as plataformas, enquanto o conjunto degenerado
primário V1-V2 utilizado na plataforma Ion PGM deu resultados que mais estreitamente
alinhados aos esperados de uma distribuição da comunidade, mesmo simulada de 20
espécies.
Outras análises foram realizadas para destacar o impacto da seleção primer e
plataforma de sequenciamento sobre o resultado dos estudos. Um mapa de calor de
abundância taxa (Fig. 3) foi gerado utilizando correlações de Spearman e Ward
Clustering. Os resultados evidenciaram que as amostras separadas com base na
plataforma de sequenciamento usado, com MiSeq (azul) para a esquerda e Ion PGM
(verde) para a direita. Isto é, com a excepção de o iniciador MiSeq V4-V5 que agrupa
com os iniciadores V4 V5-Ion PGM. Por conseguinte, a utilização deste par de iniciadores
é menos influenciada pela escolha da plataforma.

Efeitos do processo de extracção sobre os resultados de sequenciamento alcançado


Tendo demonstrado os efeitos tanto da escolha de primer gene 16S rRNA e plataforma de
sequenciamento em resultados, o próximo objetivo de determinar os efeitos de
procedimentos de extração de DNA sobre os resultados de sequenciamento alcançados.
Como mostrado na Fig. 4 e adicionais de arquivo 1, as danças abun- relativas de espécies
detectadas era mais dependente dos primers e uma plataforma de utilizados, ao invés
de sobre a escolha do procedimento de extração. diferenças notáveis ocorreu com base
no agente de armazenamento (isto é, entre glicerol ± PBS), ou seja, células do glicerol
abastecido tinha uma maior abundância relativa de Streptococcus, Clostridium e a
Listeria em comparação com as células de glicerol PBS +. Isto era verdade para a
sequenciação resultados de ambas as plataformas e todos os iniciadores exceto usando
primers V4-V5 na Ion PGM, onde foram vistos níveis semelhantes dessas bactérias entre
todas as extensões ex. Além disso, V4-V5 MiSeq RBB extraído células PBS eram muito
diferentes, quer ao glicerol V4-V5 Qiagen obtidos de forma e células de glicerol RBB.
Além disso, o Qiagen PBS extraído ADN não foi amplificada com os iniciadores MiSeq V4-
V5, enquanto outros primários amplificado deste ADN. Assim, talvez, os inibidores desta
amostra inter actuado mais fortemente com estes iniciadores que impedem a
amplificação por PCR. Estes resultados sugerem diferenças sutis ocorrem em dados de
seqüenciamento como resultado de agente de armazenamento de amostras e protocolo
de extração de DNA utilizado.
Como foi visto pela DNA simulada, os diferentes conjuntos mer pri- impacto sobre as
espécies detectadas nas células simulados. Houve uma forte impacto da escolha do
iniciador sobre os resultados, com amostras amplificadas com os mesmos iniciadores de
ser mais semelhantes do que os amplificados com iniciadores diferentes. Método de
Extracção teve um efeito menor sobre a composição global, com amostras extraídas
utilizando o RBB ou o método Qiagen e amplificados com o mesmo iniciador, obtendo-se
resultados semelhantes. Add-itionally, como mostrado na Fig. 5, as amostras não
mostram agrupamento com base no método de extracção, com amostras extraídas
utilizando diferentes procedimentos de extracção, mas amplificado com os mesmos
iniciadores que produzem resultados semelhantes.
Nós antecipado que 22 espécies seriam detectados a partir do ADN extraído das células
comunidade Mock, no entanto, a análise bioinformática novamente indicou a presença
de espécies que se sabe não estar dentro da comunidade simulada. Nenhum dos
conjuntos de iniciadores, quando utilizados na plataforma MiSeq (independentemente do
método de extracção ou o agente de armazenamento), detectou todas as 22 espécies
esperado (Tabela 2). Na verdade, a melhor cartilha realizando apenas conjuntos
detectado 77% das espécies esperados (V4-V5 Qiagen glicerol e V1-V2 RBB tratos glicerol
ex-). Todos os pares de primers utilizados com a forma do Ion PGM plataforma detectada
uma maior percentagem de espécies esperados (77-100%) em comparação com os
iniciadores correspondentes utilizados na MiSeq (55-77%). Os V1-V2 iniciadores
degenerados utilizados Ion PGM sobre as células RBB Gli- Cerol extraídos detectado 100%
das espécies esperados.
O mapa de calor para as células simuladas deu resultados semelhantes como para a
comunidade simulada DNA (Fig. 5). As amostras amplificadas V4 V5-se agrupam
independentemente do procedimento de extracção ou plataforma de sequenciação
utilizada, com a excepção de a amostra de RBB-PBS V4 V5 MiSeq que agrupado com as
amostras V1-V2 amplificados. Observando a linha colorida indicando o método de
extracção, é evidente que existe agrupamento por conjunto de iniciadores usados e não
pelo método de extracção. O mapa de calor também mostra como abundância das
espécies diferem em toda amostras com primer
escolha, em vez do que o método de extracção, que aparece para causar diferenças de
espécies detectadas entre as amostras.

Discussão
Com o rápido aumento em estudos que investigam a microbiota de diversos ambientes
usando high-throughput abordagens Quencing se-, é fundamental que o impacto de
vários fatores sobre os resultados de sequenciamento ser determinado. Este estudo
analisou os efeitos de procedimentos de extração de DNA, desenho de primers gene 16S
rRNA e a escolha da plataforma de sequenciação nos resultados usando células
comunitárias mock e DNA. A grande maioria dos estudos de sequenciação têm contado
com a sequenciação do gene 16S rRNA para determinar a térios bac- presentes num
ambiente [1, 3]. Estudos anteriores também examinaram os efeitos de iniciadores sobre
os resultados de sequenciação por meio da amplificação do V1-V3, V3-V5 e V6-V9 regiões
do gene de ARNr 16S a partir das mesmas células da comunidade simulados, utilizada
neste estudo (HM 280/1) e sequenciamento Sanger usando e plataformas 454-
pyrosequencing [16]. Eles também observou o efeito da região do gene 16S rRNA alvo em
dados de sequenciação. Nosso estudo utilizou iniciadores visando as V4-V5 e V1-V2
regiões e empregou as plataformas Illumina MiSeq e Ion PGM. Apesar de ambos os
estudos, utilizando as mesmas células comunidade trocistas (HM 280/1), ocorreram
diferenças en- tre os nossos conjuntos de dados, provavelmente devido a uma
combinação de efeitos mer e sequenciador pri-. Semelhante ao estudo de Haas et al.,
Nosso estudo também observou danças abun- relativos não uniformes nas comunidades
simulados. Os resultados demonstraram que os primers V4-V5 deu os resultados mais
comparáveis em todas as plataformas, o que poderia ser um benefício para os
investigadores que se desloquem entre plataformas de sequenciamento mais recentes.
No entanto, este resultado também deve ser considerada à luz do facto de que os
mesmos conjuntos de iniciadores deram abundâncias enviesados. Assim, enquanto este
conjunto de primers deu os resultados mais comparáveis entre plataformas sugerindo
que é menos afetado dos primers conjuntos de plataforma de utilizados, os resultados
ainda mostram discrepâncias entre os resultados esperados e alcançados com este
conjunto de primers. Os resultados a partir dos iniciadores degenerados V1-V2 e V1-V2
eram distintos a partir dos iniciadores V4-V5 e diferem na sua detecção de espécies.
diferenças consideráveis ocorreu com base no qual primer e plataforma foi utilizada.
Apenas duas combinações, ou seja, os iniciadores V4 V5-Ion PGM utilizados no ADN
simulada e os V1-V2 iniciadores degenerados Ion PGM usados nas células de glicerol RBB,
detectou 100% das espécies esperados. Vale a pena notar que os mesmos iniciadores
utilizados em outras placas DNA turas extraído ou simulados não detectou 100% das
espécies esperadas, assim, novamente destacando que os resultados são devido a uma
combinação de fatores, incluindo a extração de DNA procedimento, primer escolha e
plataforma de sequenciamento. Além disso, nenhum conjunto de primers detectou a
espécie esperados exclusivamente e todos deram falsos acertos (% de leituras
conseguido que não se esperava em relação ao total de leituras alcançado) (variando de
6% para a amostra Ion PGM V1-V2 Qiagen PBS a 69% para o Ion PGM V1-V2 degenerada
amostra Qiagen PBS). Estes estavam presentes em baixas abundâncias relativas e
estavam intimamente relacionadas com as espécies tuais dades presentes nas
comunidades de simulação, portanto, sugerimos que eles foram mis-atribuído ao nível de
espécie, devido às semelhanças na sua sequência de gene 16S rRNA por exemplo E.
faecalis presentes na comunidade simulada, mas E. faecium também atribuído ao nível
de espécie. Com base nestes resultados, parece que os primers consistentemente melhor
desempenho na plataforma Ion PGM, com percentagens mais elevadas de espécies
perado ex detectadas e baixos falsos acessos em comparação com a plataforma MiSeq.
Um estudo recente também tomou uma abordagem semelhante à nossa e compararam os
resultados de uma comunidade simulada sequenciados utilizando iniciadores de
segmentação região V1-V2 e sequenciadas nas plataformas MiSeq e Ion PGM [19]. O
estudo encontrou a abundância relativa de ser geralmente de acordo com a composição
comunidade esperado e que os resultados sejam semelhantes em todas as plataformas.
Embora nosso estudo não analisou repetições (devido a limitações no material de
partida), Salipante et al. não encontraram diferenças significativas entre repetições, o
que é consistente com os resultados anteriores também [24]. Estes resultados são
semelhantes aos de Tremblay et al. [22] que também mostraram diferenças nos
resultados de sequenciamento no 454-pirossequenciador eo MiSeq quando diferentes
regiões do gene 16S rRNA foram alvo, utilizando uma comunidade microbiana simulada.
Neste caso, os autores compararam as regiões V4, V6-V8 e V7-V8 e descobriu que os
primers V4 deu os resultados menos tendenciosos. Encontramos também o iniciador V4-
V5 definido para produzir os resultados capazes mais comparáveis entre plataformas. Os
autores também destacam que, actualmente, não há consenso sobre qual conjunto de
primers produz o melhor resultado; portanto, eles sugerem o potencial de usar
metagenomics espingarda para interrogar o seu conjunto de dados e comparar os
resultados com o de seus diferentes conjuntos mer pri- sob investigação. No entanto,
devido ao custo esta ainda não é uma abordagem viável para a maioria dos estudos, mas
poderia ser utilizado, talvez, para seleccionar entre conjuntos de iniciadores anteriores
para com- mencing uma série de estudos baseados na sequenciação.
Este estudo também realizou uma comparação direta das plataformas MiSeq e Ion PGM,
os quais estão sendo usados cada vez mais para 16S rRNA estudos amplicon de
sequenciamento. Os resultados indicaram que não apenas a profundidade de
sequenciação obtida difere por plataforma, mas também a percentagem de sequências
retidos seguinte ING filtro- qualidade e remoção quimera. Nós encontramos o menor
percentual de leituras foi retido a partir das sequências de iniciadores V4-V5 do Ion PGM
(80-90% retidos acompanhamento remoção ing quimera em comparação com uma média
de 99% retido para os outros iniciadores em ambas as plataformas). Isto pode ser devido
ao facto de que estas foram as mais longas lê alcançado na Ion PGM em 380-400 pb.
Atualmente 400 bp é o comprimento de leitura mais longo suportado por esta forma de
plataforma e, embora nós conseguimos mais ler comprimentos com este conjunto de
primers, a qualidade destes lê foi consideravel- mente inferior ao menor lê com os
conjuntos de primers V1-V2 (335- 355 pb), o que resulta em um aumento do número de
leituras a ser removido durante a filtragem e remoção qualidade quimera. Este estudo
demonstrou claramente o impacto da plataforma Quencing se- sobre os resultados
alcançados, achado também observado em estudo anterior [22], que mostraram que as
amostras agrupados por plataforma de sequenciamento usado. Um estudo recente
também comparou as plataformas MiSeq e Ion PGM para sequenciar uma comunidade
microbiana simulada usando primers V1- V2 16S rRNA [19]. Nossos resultados estão de
acordo com este estudo anterior que ambas as plataformas oferecem boa profundidade
Quencing se- e são uma boa alternativa para plataformas mais antigas. No entanto, eles
notaram que eram necessários mais estudos com vista a diferentes regiões do gene 16S
rRNA para compreender plenamente o impacto desses fatores sobre os resultados
Quencing se-. Este estudo anterior também destacou o potencial de minimizar artefatos
de sequenciação utilizando sequenciamento ectional bidir- e também por meio da
otimização do fluxo
ordem na plataforma Ion PGM. Mais uma vez este estudo não concluir sobre qual
combinação de plataforma / primer deu os melhores resultados. Assim, conclui-se que
com base na nossa e dados anteriores, o iniciador e plataforma mais adequada a ser
usada para estudos de sequenciação permanece obscura. Talvez a inclusão de
comunidades simulada ou a comparação dos ARNr 16S de dados para espingarda de dados
metagenomic pode permitem uma abordagem otimizada com base a ser concebido no
início de um grande ensaio baseado em sequenciação e não após o uso desta abordagem
optimizado iria limitar a variação entre os resultados dentro deste julgamento. Assim,
compartilhar as conclusões do Tremblay et al. [22] que, com base em todos os
conhecimentos atuais, consistência protocolo continua a ser mais pertinente para o
resultado do estudo de primário ou sequenciamento escolha da plataforma.
procedimento de extração de DNA tem um impacto significativo nos resultados de
sequenciamento [25, 26]. Vários estudos têm mostrado previamente os efeitos do uso de
diferentes kits comerciais para extração de DNA a partir de amostras fecais no
sequenciamento saída vem [14, 15, 17]. A nossa abordagem foi a de se concentrar
especificamente em apenas dois métodos de extração comumente utilizados em estudos
microbiota para estabelecer se a abordagem de extração de DNA Qiagen amplamente
utilizado foi tão bem sucedida como a abordagem RBB ou se as etapas talão batendo
adicionais produziram resultados mais precisos. Ambos os procedimentos de extração
produziu DNA que deu resultados comparáveis com respeito a filogenia. Isto pode ser
devido à semelhança com estas abordagens, enquanto o uso de um kit de extracção de
DNA comercial diferente poderia produzir resultados significativamente diferentes. Além
disso, este estudo utilizou células comunidade de simulação para investigar os efeitos do
procedimento de extração de DNA. Este é um relativamente simples relativa
comunidade microbiota para, por exemplo, fecal tragem ples. Assim, os resultados
sugerem que o método de extracção tem efeitos mínimos sobre a microbiota dados de
sequenciação podiam na verdade ser devido à facilidade de extracção de ADN a partir
das células da comunidade simulados. Embora tenhamos mostrado procedimentos ção
tanto DNA extração para produzir resultados de sequenciamento semelhantes neste
exemplo, é a nossa recomendação que a selecção e utilização de apenas um método de
extração de DNA para estudos longitudinais é vital para garantir a diferenças nos dados
que podem ser observados são não ocorrendo devido à extração viés.

Conclusões
Este estudo fornece uma comparação direta dos sequenciadores Illumina MiSeq e Ion
PGM e tem mostrado que os sequenciadores MiSeq e Ion PGM oferecer boa profundidade
sequenciamento e fornece informações em nível de espécie, não at- volvimento usando
plataformas mais antigas. Dadas as diferenças demonstradas na composição da
microbiota devido à escolha primer e plataforma de sequenciamento usados, a
necessidade do uso
dos controles internos sobre sequenciamento corridas é evidente. No geral, nossos
resultados são importantes, pois realçar considerações importantes para a concepção e
interpretação de estudos de sequenciamento. Assim, à medida que entramos numa era
de sequenciamento rápido de- senvolvimento, o avanço e melhoria, é de extrema
importância para considerar cuidadosamente, avaliar e rever continuamente as melhores
práticas relativas a concepção, realização e interpretação de estudos de
sequenciamento microbiota.

Métodos
iniciadores de PCR para seqüenciamento do gene 16S rRNA
Os iniciadores de PCR para sequenciação do gene 16S rRNA usando a plataforma de
sequenciação Ilumina MiSeq foram concebidos para consistir de uma sequência de
adaptador Illumina, uma sequência de 12 índice de NT (código de barras), uma região do
iniciador almofada de 10 nt, uma região ligante de 2 nt e o gene da sequência de
iniciador específico (Tabela 3). Três conjuntos de iniciadores, uma segmentação do gião
V4 V5-re [23] e dois pares de iniciadores de segmentação região V1-V2 do gene [4] 16S
rRNA, com conjunto de iniciadores 2, utilizando um iniciador para a frente de- gerar [17]
eram utilizado para sequenciação para determinar o efeito do desenho do iniciador e a
região do gene de ARNr 16S que é orientada, sobre os resultados de sequenciação. Um
conjunto correspondente de 3 pares de iniciadores foram gerados para uso na
plataforma Ion PGM e foram dese- nhado para conter a sequência de iões PGM ligante,
uma sequência de código de barras único 10 nt de Golay, uma sequência espaçadora 2 nt
e a sequência específica do gene (Tabela 4 ).

DNA comunidade Mock


Para determinar os efeitos de diferentes conjuntos de primers e procedimentos de
extração de DNA diferentes sobre os resultados de sequenciamento, o DNA genômico de
Microbial Mock Comunidade B (Even, baixa concentração), v5.1L, para 16S rRNA Gene
Sequen- ciamento (HM-782D) obtiveram-se, e as células de microbiana Mock comunitário
C em tampão fosfato salino (PBS) (HM-280) e em PBS e 40% de glicerol (HM-281)
através do BEI Resources, NIAID, NIH, como parte do homem Hu- Microbiome Projeto
(Manassas, VA). DNA comunidade Mock foi usado como ADN molde para a sequenciação
usando 3 conjuntos de iniciadores, por plataforma, como descrito abaixo.
A extração do DNA metagenômica para reações de PCR
células comunidade Mock (HM-280/1) foram usadas para ve- tain os efeitos do
procedimento de extracção sobre os resultados alcançados sequen- ciamento, assim, o
DNA foi extraído a partir destas células, utilizando 2 procedimentos de extracção de ADN
e o ADN foi subsequentemente amplificado utilizando 3 Ilumina MiSeq e 3 Ion PGM
primers sets. ADN também foi extraído a partir de células da comunidade simulados em
PBS (HM-280) e aqueles em PBS + glicerol (HM-281), determinando assim se o agente de
armazenamento das células antes da sua extracção tem qualquer efeito sobre os
resultados obtidos. O DNA foi extraído a partir de células da comunidade de simulação,
utilizando métodos anteriormente descritos [2, 27]. Resumidamente, o ADN foi extraído
a partir de células da comunidade simulados (HM-280/1) utilizando um DNA QIAamp
Fezes Mini Kit (Qiagen, Sussex, Reino Unido), com a adição de um passo inicial do
grânulo de bater. DNA também foi extraído utilizando uma abordagem RBB e uma ure
procedi- extracção de ADN Qiagen modificado [13, 20]. Em resumo, 1 mL de tampão de
lise (500 mM de NaCl, 50 mM Tris-HCl pH 8,0, EDTA 50 mM e 4% de sulfato de dodecilo de
sódio) foi adicionado aos tubos contendo o talão de batimento amostra de células
comunidade simulada. As amostras foram homogeneizadas durante 3 minutos em
velocidade máxima, usando o batedor Mini Bead. As amostras foram incubadas a 70 ° C
durante 15 min. Após a centrifugação o sobrenadante foi removido e os passos repetidos
de batimento do grânulo. Seguindo o agrupamento do sobrenadante, as amostras foram
tratadas com 10 M de acetato de amónio (Sigma Aldrich, Irlanda), o DNA foi sedimentado
e lavado com etanol a 70%. o
ADN foi então ARNase e proteinase K tratada. Finalmente o DNA foi lavada utilizando
tampões e AW1 AW2 (QIAmp rápida de DNA Mini Kit de fezes) e eluiu-se em 200 ul de
tampão de ATE (QIAmp rápida de DNA Mini Kit de fezes).

PCR e preparação para 16S rRNA próxima geração seqüenciamento de genes


As reações de PCR continha 25 ul Biomix Red (MyBio, Kilkenny, Irlanda), 1 ul iniciador
directo (Sigma Aldrich, Dublin, Irlanda) (10pmol), 1 ul iniciador inverso (Sigma Aldrich)
(10pmol), DNA molde (64 ng) e A água de grau de PCR (MyBio). As condições de PCR
foram como se segue: V4-V5 conjunto de iniciadores: tampa aquecida 110 ° C, 94 ° C ×
3min, seguido por 35 ciclos de 94 ° C × 45 s, 67 ° C x 1 min, 72 ° C x 1 min, seguido por
72 ° C x 2 min e mantida a 4 ° C. Para V1-V2 conjunto de iniciadores 1: tampa aquecida
110 ° C, 94 ° C x 2 min, seguido de 25 ciclos de 94 ° C x 1 min, 67 ° C × 45 s, 72 ° C x 1
min, seguido de 72 ° C × 2 min e mantida a 4 ° C. Vinte e cinco ciclos foi escolhido,
como números de ciclo mais elevados deu bandas não específicas. Para V1-V2
degenerada conjunto de iniciadores 2: tampa aquecida 110 ° C, 94 ° C x 2 min, seguido
de 35 ciclos de 94 ° C x 1 min, 64 ° C × 45 s, 72 ° C x 1 min, seguido de 72 ° C x 2 min e
mantida a 4 ° C. Todas as reacções de PCR foram realizadas em triplicado. Os controlos
negativos, nos quais DNA foi substituída por água de grau de PCR, foram executados para
cada conjunto de iniciadores, sem amplificação ocorra. produtos de PCR triplicado
foram reunidas e limpo utilizando AMPure sistema de purificação baseado em esférulas
magnéticas (Beckman Coulter, Reino Unido). ples SAM- limpas foram quantificados
utilizando Picogreen Quant-iT a quantificação ea Nanodrop 3300 (Fisher Scientific,
Dublin, Irlanda). Para confirmar a pureza e a especificidade do iniciador de reacções de
PCR, as amostras foram analisadas usando o Agilent Bioanalyzer. As amostras foram
subsequentemente agrupados em uma concentração equimolar e preparado para
sequenciação utilizando protocolos padrão. Para MiSeq sequenciação, as bibliotecas
foram misturados com Ilumina geradas bibliotecas de controle phix (20% de solução de
12:05) e foi desnaturado utilizando NaOH recentemente preparada. As amostras foram
carregadas em seis horas e sequenciado utilizando um kit de ciclo V3 600 e nossos
primers específicos de sequenciamento do gene 16S rRNA. Para PGM sequenciamento,
braries li- foram reunidos e carregados em 40pM e foram se- extinta de acordo com
protocolos Ion PGM usando o chip Ion 318 v2 eo kit Ion PGM Sequencing 400.
concentrações ING Load para as respectivas bibliotecas eram de acordo com as
recomendações do fabricante.

análise bioinformática
Lê para os MiSeq foram fundidas usando o QIIME (ver- são 1.8) join_paired_ends.py
roteiro eo método fastq-se juntar [28], no entanto, isso não foi necessário para PGM lê
como eram single-ended. t_libraries.py o script QIIME spli- foi usada para demultiplex
tanto MiSeq e PGM lê com parâmetros padrão, no entanto, só lê combinando a
distribuição do comprimento principal; primers V1-V2 (305-325 pb), V4-V5 de primers
(365-385 pb) e PGM:: MiSeq primers V1-V2 (335-355 pb), e V4-V5 de primers (380-400 pb)
e lê com um índice de qualidade média mínima de Q25 foram retidos. sequências
quiméricas foram removidos através USEARCH versão 7.0.1090 utilizando o script
me_ref.py uchi- e a base de dados OURO ChimeraSlayer [29]. A implementação Mothur
do classificador Ribossômico Database Project (RDP) foi usado para atribuir taxonomia
do filo ao gênero [30] com uma inicialização cut-off de 50%. Quaisquer sequências fora
desse corte foram designados como não classificada nessa posição particular.
classificação das espécies, juntamente com a classificação Clostridium Cluster foi obtido
através da utilização de espécies fier classificadas Spingo versão 1.2 com parâmetros
padrão [31]. A sequência qualidade filtrada lê para cada tecnologia e conjunto de
primers foram introduzidos em Spingo e os resultados foram resumidos utilizando o
script spingo_summar- y.py incluído com o software. mapas de calor foram gerados R
versão 3.1.3. O heatmap.2 função foi realizada na célula simulada e DNA simulada
tragem ples com apenas as espécies esperadas incluídas. agrupamento ical Hierarch- foi
realizado utilizando hclust.