Вы находитесь на странице: 1из 17

La ubicacin y la translocacin de genes ndh de origen cloroplasto en la

familia Orchidaceae
Choun - Mar Lin , Jeremy JW Chen , [ ... ] , y Ming- Che Shih
Informacin adicional del artculo
Abstracto
El NAD ( P) H complejo deshidrogenasa es codificada por 11 genes ndh
en cloroplasto de la planta (Cp) genomas. Sin embargo , los genes ndh
se truncan o se eliminan en algunos Epidendroideae genomas cp
orqudea auttrofos . Para determinar el momento evolutivo de las
supresiones de genes y los lugares del genoma de los diferentes genes
ndh en orqudeas , los genomas cp de Vanilla planifolia , Paphiopedilum
armeniacum , Niveum Paphiopedilum, Cypripedium formosanum,
Habenaria longidenticulata, Goodyera fumata y Masdevallia picturata
fueron secuenciados; estos genomas representan vanilloideae,
Cypripedioideae, Orchidoideae y Epidendroideae subfamilias. Se
encontraron cuatro secuencias del genoma cp orqudeas para contener
un conjunto completo de genes ndh. En otros genomas, supresiones ndh
no se correlacionaron con las relaciones taxonmicas o evolutivos
conocidos y eliminaciones se produjeron de forma independiente
despus de la familia de las orqudeas se dividi en diferentes
subfamilias. En orqudeas carecen cp codificada genes ndh, se
identificaron cp localizada secuencias no ndh. En Erycina pusilla, se
encontraron al menos 10 fragmentos de genes ndh truncados
transferido al mitocondrial (tm) del genoma. El fenmeno de la
transferencia ndh orqudea con el genoma metros exista en orqudeas
NDH-borrado y tambin en las especies que contienen ndh.
Las clulas eucariotas surgieron a travs de la inmersin de
endosimbiontes bacterianos y la conversin gradual subsiguiente de
esas bacterias en orgnulos (mitocondrias y cloroplastos) 1,2. Durante
este proceso, se produjo una transferencia masiva de genes de los
genomas endosymbiont en el genoma nuclear de el cell3 anfitrin. Sin
embargo, los cloroplastos de plantas (cp) poseen sus propios genomas,
que contienen genes que estn implicados en la fotosntesis, la
transcripcin y translation4. Los nmeros y las funciones de estos genes
cp estn muy conservadas entre las plantas superiores. Una familia de
genes que est implicado en la fotosntesis es la familia ndh, de los
cuales 11 miembros codifican subunidades de NADH deshidrogenasa.
Estos genes son homlogos de los que codifican subunidades
mitocondrial NADH deshidrogenasa, que estn implicadas en
transport5,6 de electrones respiratoria. En los cloroplastos de
angiospermas, estas protenas se asocian con NDH subunidades
codificadas en el ncleo para formar el complejo-deshidrogenasa como
NADH. Esta protena asociados complejas con el fotosistema I para

convertirse en un super-complejo que media transport7 cclico de


electrones, produce ATP de equilibrar la relacin ATP / NADPH, y facilita
chlororespiration cuando el transporte cclico de electrones pausa
overnight8.
Plantas hetertrofos, que no la fotosntesis, carecen genes9 ndh
funcional. Curiosamente, algunas plantas auttrofos, como pinos,
Gnetales, Erodium, Melianthus y orqudeas tambin carecen de los
genes ndh funcionales en su cp genomes10,11,12,13,14,15,16,17,18.
Hay cinco subfamilias en Orchidaceae: Apostasioideae, vanilloideae,
Cypripedioideae, Orchidoideae y Epidendroideae19,20,21. El genoma del
cloroplasto de las cuatro auttrofos gneros de orqudeas
Epidendroideae, Phalaenopsis, Oncidium, Erycina y Cymbidium, se han
secuenciado y son available11,14,16,17 pblicamente. A partir de estos
genomas cp orqudea, solamente ndhB de Oncidium 'Gower Ramsey y
ndhE, J y C del Cymbidium se han predicho para codificar proteins14,17
ndh funcional. Todos los otros fragmentos de genes ndh contienen
mutaciones sin sentido o se truncan o ausente de la
plastome11,14,16,17. Por ejemplo, el genoma de E. cp pusilla contiene
versiones truncadas de ndhJ, C, D, B, G, y H y carece de secuencias para
ndhK, F, E, A, y I16. Estos resultados indican que la supresin y
truncamiento de fragmentos de gen NDH son comunes a los genomas cp
orqudea. Sin embargo, los genes en el genoma ndh cp de Apostasia
wallichii (Apostasioideae) se transcriben y se predice para codificar
proteins22 funcional. Estos hallazgos indican que el ancestro comn de
orqudeas contena un conjunto funcional entera de genes ndh. Hasta
ahora, slo Epidendroideae secuencias del genoma cp han
published11,14,16,17. Por Consiguiente comprensin que subfamilias
orqudeas carecen de genes ndh en sus genomas cp tiene el potencial
de aumentar considerablemente la comprensin de la evolucin de
fotosntesis en las orqudeas.
Estudios previos han demostrado que la planta de cpDNA se ha
transferido a tanto el mitocondrial (metros) 23,24 y genomes1,25,26,27
nuclear Basndose en los resultados de la PCR, Chang et al11
propusieron que en Phalaenopsis, los genes ndh ancestrales han sido
transferido al genoma del ncleo u otro orgnulo. Recientemente
publicados el genoma mitocondrial de diferentes especies de plantas de
semillas contienen 1 a 10% cpDNA procedentes de diversas regiones del
plastome28,29,30. Debido al tamao y la complejidad de los genomas
de orqudeas, es difcil obtener estas secuencias por secuenciacin
directa o walking31 genoma. Para resolver este problema, se emple
previamente una estrategia bien establecida, utilizando PCR simple para
identificar clones BAC que contienen codiciado genes en ambos E. y O.
pusilla 'Gower Ramsey'16,31. Tambin utilizamos esta estrategia para
identificar y bibliotecas secuencia de BAC que contenan fragmentos

genmicos cp, lo que result en el secuenciacin completa del E. cp


pusilla genome16 . Este mtodo objetivo era ms econmico y de
tiempo efectivo que la secuenciacin del genoma .
En este informe , los tiempos evolutivos de supresiones ndh de genomas
cp orqudeas se investig. Se secuenciaron los genomas cp de Vanilla
planifolia ( vanilloideae ), armeniacum Paphiopedilum , Paphiopedilum
niveum , Cypripedium Formosanum ( Cypripedioideae ) , Habenaria
longidenticulata , Goodyera fumata ( Orchidoideae ) y Masdevallia
picturata ( Epidendroideae ) . Adems, las ubicaciones de los genes
mitocondriales de NDH se investigaron en E. pusilla , un modelo de la
orqudea Epidendroideae , por clones BAC secuenciacin que contenan
los genes ndh que faltaban en el genoma cp .
resultados
genes ndh entre las subfamilias de orqudeas
Hay 11 genes ndh en mayores genoma del cloroplasto de la planta. Para
entender la expresin diferencial de estos genes entre las subfamilias de
orqudeas, se identificaron las transcripciones NDH en 16 especies de
cinco subfamilias Orchidaceae (Tabla S1 y S2). Neuwiedia malipoensis
(Apostasioideae), Cypripedium singchii (Cypripedioideae), Habenaria
delavayi, pubescens Goodyera (Orchidoideae), Masdevallia yuangensis y
Cymbidium sinense (Epidendroideae) tuvieron los 11 genes ndh. Sin
embargo, shenzhenica Vainilla, V. planifolia, Galeola faberi (vanilloideae),
Drakaea elastica (Orchidoideae), y E. pusilla (Epidendroideae), slo tena
menos 5 secuencias de genes ndh (Tabla S1 complementario). El nmero
de secuencias de genes ndh en cada transcriptoma no se correlacion
con las relaciones evolutivas de orqudeas conocidas (Tabla S1). El
menor nmero de transcripciones ndh se encontraron en vanilloideae.
Estudios previos han informado supresiones ndh en especies
Epidendroideae, pero un anlisis de la base de datos del transcriptoma
de M. yuangensis revel secuencias altamente conservadas (79,4%)
para todos los genes ndh. El mismo fenmeno tambin ocurri en C.
sinense (Tabla S1 complementario). Estos resultados indican que la
prdida de genes ndh de las especies de orqudeas se produjo de forma
independiente dentro de las subfamilias.
Los genomas cp de siete orqudeas en cuatro subfamilias se
determinaron (Figura 1 y and2,2, Figura complementario S1, cuadros
suplementarios S3 y S4). La cobertura de lectura de las siete genomas
del cloroplasto reunidos se muestra en el cuadro complementario S5.
Cuando los 11 ADNs ndh en el genoma cp estaban en marco y codifican
el gen ndh de larga duracin, los genomas se clasifican como ndh
completa tipo cp genoma. Si cualquiera de los 11 genes ndh tenan
mutaciones sin sentido, deleciones, o estaba ausente, los genomas se
clasifican como ndh-borrado tipo cp genoma. Haba dos tipos-ndh

COMPLETE- y NDH-borrado en Cypripedioideae [Paphiopedilum


armeniacum (suprimido ndh-), Paphiopedilum niveum (NDH-suprimido),
y C. formosanum (NDH-completa)] y en Epidendroideae [E. pusilla (NDHsuprimido) y M. picturata (ndh completa)]. Entre la nica especie
vanilloideae investigados, V. planifolia, era un tipo ndh-eliminado, pero
este resultado no puede excluir la posibilidad de que las especies de ndh
completa en otras especies vanilloideae. Los dos genomas secuenciados
cp en Orchidoideae, H. longidenticulata y G. fumata, son a la vez ndhcompleto. Basndose en los resultados del transcriptoma, D. elastica,
una orqudea australiana nativa en peligro de extincin tiene pocas
transcripciones ndh (Tabla S1 complementario ) . Esta especie puede ser
un ejemplo de ndh - borrado Orchidoideae .

Adems de los perfiles de genes ndh , se encontraron otras diferencias


entre estos genomas cp de siete orqudea (Figura 3 ) . Notablemente, la
regin de ATPA a PETG se invierte en el genoma C. formosanum cp .
Estos resultados indican que los genomas cp de estos siete orqudeas
proporcionan informacin til sobre la diversidad ndh en la familia.
Identificacin de genes ndh no cp en orqudeas
Una comparacin de la genmica cp y transcriptomic datos mostr que
slo ndhB fue encontrado en el genoma cp V. planifolia , mientras que se
identificaron ndhK , J y C transcripciones en el V. planifolia transcriptoma
de clulas enteras . Asimismo, en el P. cp armeniacum genoma, slo la
secuencia ndhD fue codificada en la regin ndhF - DEGIAH del genoma
cp . Sin embargo, las transcripciones ndhA y ndhH estaban presentes en
la P. Armeniacum transcriptoma de clulas enteras , lo que indica que

ndhA y el gen ndhH fueron codificados , ya sea en el MT o nucleares


genomas en P. armeniacum (Tabla S6 complementario ) . Estos
resultados , por lo tanto , indican que existen genes ndh no cp y pueden
ser transcritas . Por lo tanto, intent identificar estos genes en el
genoma nuclear mt o secuencias.
Muchos fragmentos de genes ndh no cp fueron identificados en las
orqudeas secuencias genmicas completas. Adems de las especies de
NDH-eliminado, las especies-ndh completa (C. formosanum, H.
longidenticulata, G. fumata, y M. picturata) tambin contenan
fragmentos de genes ndh no CP (cuadros suplementarios S3 y S4). Dado
que los genes ndh en los genomas cp de todas las especies vegetales se
agrupan como ndhJ-KC, ndhF-DEGIAH y ndhB, los resultados de abajo se
presentan en este orden.
Aunque flanquean secuencias de ADN puede proporcionar informacin
para identificar el orgnulo de las que se derivaron, algunas de las
secuencias eran demasiado similares a las secuencias del genoma cp o
eran demasiado corto para identificar (Tabla S4, Paph_niveum_ndhB1 a
Mas_ndhJK). Por lo tanto, sera importante para extender la longitud de
la secuencia en futuros estudios. En estudios recientes, E. pusilla se ha
establecido como un modelo para research16 genoma orqudea. El uso
de secuencias que contiene NDH-, que fueron derivados de las
secuencias genmicas NGS, cebadores especficos fueron diseados
para detectar el E. BAC pusilla library16. Los clones BAC fueron
identificados y secuenciados para confirmar la presencia de fragmentos
de gen NDH-como y para determinar el orgnulo de origen. Seis clones
BAC que contenan se identificaron fragmentos de genes ndh putativo:
Ep-mt-ndhJC, Ep-mt-ndhC, Ep-mt-ndhDEGIAH, Ep-mt-ndhDF, Ep-mt-ndhD
y Ep-mt-ndhB (Figura 4 ). Un anlisis de las secuencias flanqueantes
dentro de la BAC revel que todos los seis de los contigs se obtuvieron a
partir del genoma mt. Segn los datos de secuenciacin del genoma,
nueve genes ndh fueron transferidos al genoma MT en M. picturata,
ocho en P. niveum y G. fumata, seis en P. armeniacum, y cuatro en V.
planifolia (Tabla S3, complementario de las figuras S2 , S3, y S4). En
total, E. pusilla tuvo el mayor nmero de fragmentos del gen NDH
transferidos al genoma MT (10 genes en seis fragmentos, la Figura 4,
Tabla S3). Adems, hubo ocho genes ndh en G. fumata y nueve en M.
picturata, cuyos genomas cp contenida un perfil ndh completa (Tabla S3
suplementario). Estos resultados mostraron que el nmero de
fragmentos de genes ndh transferidos no se correlacion con deleciones
ndh en el genoma cp.
Para entender las diferencias estructurales entre las regiones-mt ndh y
la regin cp original, secuencia metros genoma de E. pusilla se aline
con el correspondiente C. formosanum (ndh completa) y E. regiones del

genoma cp pusilla. Esta alineacin mostr una prdida masiva del ADN
en las copias ndh que fueron transferidos a la pusilla metros E. genoma
(Figura 4, las lneas roja y puntos). Tambin est claro que todo el mtndh
fragmentos fueron truncados o contenan grandes deleciones.
Curiosamente, algunas de las transferencias NDH puede haber ocurrido
despus de una eliminacin ndh en el genoma cp (por ejemplo, el
documento EP-mt-ndhJC, Figura 4).
Por otra parte, la regin completa ndhJ-KC puede haber sido primero
transferido al genoma metros y supresiones luego sometido. Las
relaciones entre las deleciones-cp ndh y genes ndh que eran transferido
al genoma mt. Una instantnea de la evolucin de ndh la transferencia
de genes entre los genomas cp y mt fue tomada por el la comparacin
de los genomas mt publicados y el cp disponibles genomas. Todos los
Tracheophyta (plantas vasculares) genomas mt contenidas fragmentos
del genoma cp parciales (Figura 5, nombres de las especies en negro y
verde). Veintids publicados genomas mt Tracheophyta contenida
alguna porcin de ADN ndh. La longitud de la mt-ndh gnica regiones
reflejan las relaciones taxonmicas (Cuadro S3). Para Oryza, la presencia
de secuencias de ndh en el genoma MT correlacionada a nivel de gnero
(Tabla S3 suplementario). Basado en una
anlisis filogentico de sus genomas cp, oldhamii Bambusa y Oryza
sativa fueron ms estrechamente relacionados entre s que la otra
Especies de Poaceae. Tienen un dibujo de transferencia ndh similares, y
el presencia de ndhJ, ndhK y ndhC en ambos genomas theirmt. Sin
embargo, la aparicin de secuencias ndh metros del genoma a nivel de
especie era diferente en el gnero Zea (Figura 5) 32; fragmentos ndh
transferidos eran
se encuentra dentro de Zea, excepto Zea luxurians. Un patrn similar se
observ en
mt-ndhD en P. armeniacum y P. niveum (Figura
S3). Estos resultados indican que los genomas mt entre los miembros de
la misma familia o gneros pueden mostrar diferentes contenidos ndh.
Esta
fenmeno se debe probablemente a rearrangements28 ADNmt. Uno
posible alternativa es que los genomas mt de P. armeniacum y P.
niveum no estn completos. Como se secuencian ms genomas mt y
completado, la relacin taxonmica entre las regiones y NDH
las secuencias del genoma cp se pueden estudiar ms.
De todos estos genes metros ndh, solamente mt-ndhD en Vitis vinifera,
mtndhJ
en Phoenix dactylifera, B. oldhamii y Oryza y mt-ndhB en
Triticum aestivum y Zea son de larga duracin (Cuadro
S3) 32. Aunque algunos fragmentos de gen MT-ndh estn en marco y su
transcripciones se han identificado en estas especies, que no pueden
complementar ndh funcin en orqudeas NDH-eliminado.

Una gran parte del genoma cp se encuentra en el genoma mt. los


mt genomas de numerosas especies tambin contienen otras secuencias
cp en
Adems de los fragmentos de genes ndh. Algunos contigs-cp como
estaban
identificados entre los E. pusilla secuencias genmicas y encontrado
similar a otras secuencias metros planta del genoma a travs de
BLASTN. Usando
Seleccin de la biblioteca BAC, se identificaron estos clones de ADN mtcp como
en E. pusilla (Figura 6, Tabla S4). Basado en el secuencias de estos
clones BAC, se estima que ms de 130 kb
de ADN genmico cp (ms que 76% del genoma cp) era
transferido en el genoma de E. MT pusilla (Figura 6). El ms largo
insercin cp en el genoma metros fue de 12 kb (no la adhesin.
KJ501994,
que contiene la regin IR cp).
Hubo 60 genes que codifican protenas-cp similar en el pusilla metros E.
genoma clones BAC, con notables excepciones siendo el matK, ATPA,
atpF, ycf3, rps4, genes Psai, peta, y PSBJ (Cuadro S8).
De acuerdo con los resultados del transcriptoma detallado
anteriormente, el ADN ndh
regiones en el genoma metros orqudea no codifican protenas
funcionales.
Curiosamente, nueve genes mt-cp como (PSBI, RPS2, PETN, atpE, PSAJ,
psbH, rpl36, rpl22, y CAPP, Mesa S8 complementaria) contena
intactas las secuencias de genes con arranque y parada codones pero
puede no tener
secuencias reguladoras requeridas.
Para determinar cul de los fragmentos de genes mt-cp como podra ser
transcrita, BLASTN se utiliz para buscar el pusilla transcriptoma E..
Hubo 28-cp como transcripciones de genes tm (cuadro complementario
S8),
incluyendo tres genes intactos: PSAJ, rpl36, y rpl22. El mt-PSBI
secuencia compartida 100% de identidad con la secuencia del genoma
cp; Por Consiguiente,
no pudimos concluir la derivacin de la transcripcin. El cplike
transcripciones mt podran dividirse en dos tipos: los que contienen
fragmentos de genes solamente cp-como y aquellos que contienen
genes mt
(KJ501986 y KJ501987). Estos resultados indican que estos gen
fragmentos pueden ser transcritas pero la traduccin requiere
adicionalmente
investigacin.
Discusin

De acuerdo con nuestros resultados, una base de datos transcriptoma


de clulas enteras puede
proporcionar informacin til para la investigacin de los genes ndh de
orqudeas
genomas. Sin embargo, transcriptome datos deben interpretarse con
cautela por varias razones. En primer lugar, es difcil determinar la
fuente
genoma (es decir, nuclear o organellar) a partir de datos del
transcriptoma. Segundo,
las transcripciones identificados no puede ser de larga duracin, pueden
contener
partes sin traducir, o no pueden correlacionarse con la genmica cp
secuencias. Perfiles Tercero, transcriptoma diferan entre las especies
dentro de una subfamilia. Por ejemplo, en el Cypripedioideae, todo 11
genes ndh fueron identificados en Cypripedium pero slo 7 fueron
identificados
en Paphiopedilum. En cuarto lugar, los materiales de origen (races, las
diferentes etapas de
hojas, etc.) tambin influyen en un perfil de la transcripcin. Aunque
algunos de
los datos transcriptoma no mostraron genes ndh de larga duracin, esto
hace
no significa necesariamente que estos genes se perdieron o fueron
truncados por
estas especies. Debido a estos caprichos, los resultados deducidos de
transcriptomes
necesitan ser confirmados por secuenciacin selectiva de genmica
DNA.
Comparacin de la transcriptomes y cp genomas produjeron algunos
informacin; sin embargo, las secuencias del genoma de la orqudea
adicional cp
Se requerir especies a travs de las cinco subfamilias de comprender
mejor
las estructuras de genes ndh entre subfamilias de orqudeas. Nuestros
datos
tambin indican que las especies dentro de la misma subfamilia pueden
tener diferente
perfiles de genes ndh.
De acuerdo con los datos del genoma cp orqudea, elimina ndh-cp y
ndhcomplete
existen especies en la familia Orchidaceae. Martin y Sabater
hiptesis de que la funcin de los genes ndh estn relacionados con
terrestre
adaptaciones de photosynthesis33. Sin embargo, no hay diferencias
significativas
se observaron entre las orqudeas NDH-borrado y ndh completa cp

en nuestro estudio, en trminos de biogeografa o condiciones de


crecimiento
(incluidos los requisitos de luz y agua). Leitch et al.34 inform que
el tamao del genoma de la orqudea est relacionada con la taxonoma.
Sin embargo, orqudeas terrestres
tener tamaos del genoma ms grande que las orqudeas epfitas y no
significativa
No se observaron diferencias en nuestro estudio entre el borrado ndhy orqudeas-ndh completa en trminos de size34 genoma.
Codificar cianobacterias Contemporneo varios miles de genes, pero
solamente 20 a 200 de estos genes se han conservado en plstidos
moderna
genomes1. Un enorme nmero de genes del cloroplasto originarios,
incluidos los de la fotosntesis, se transfirieron al ncleo
despus de la endosimbiosis del ancestor1,35 cianobacterias. Conforme
nuestros resultados, existen fragmentos de genes ndh cp en el genoma
tm de cp
orqudeas que no se traducen a protenas funcionales ndh borrado.
Una posible razn de este fenmeno podra ser que estos ndh cp
genes fueron transferidos al ncleo. Este fenmeno ha sido
observado en otros casos de delecin del gen cp. Los genes rpl22 cp
tienen ha perdido en alguna species36 rosid; Sin embargo, el gen rpl22
nuclear de
Estas especies rosid sigue siendo funcional. Este gen puede ser
transcrito
y traducido a una protena que se dirige al cloroplasto, donde
funciona en synthesis36 protena. Tres vas distintas para la prdida de
genes cp han realizado estudios hasta ahora: a) la transferencia al
ncleo (INFA,
rpl22, rpl32, rpoA), b) sustitucin de un mitocondrial codificada nuclear
gen diana (rps16) y c) sustitucin de un gen nuclear para una
gen plstido (ACCD, rpl23) 36. Por lo tanto, hemos investigado estos
diferentes posibilidades y transferencia de genes ndh al mitocondrial
genoma.
Otra posibilidad es que no hay genes ndh en algunas especies
de la orqudea. No hay transcripciones completas y funcionales han sido
NDH
identificado en la orqudea transcriptomes21,37,38 ndh-borrado. A pesar
de que
NDH protenas juegan un papel importante en el transporte cclico de
electrones en
tabaco y M. polymorpha, no hay diferencias significativas de crecimiento
entre el tipo silvestre y transformants6,39-41 ndh-borrado.
Esto es porque no es el transporte cclico de electrones alternativa PSI
va: la regulacin gradiente de protones 5 (PGR5) / fotosinttica PGR5
similar

fenotipo 1 (PGRL1) -dependiente antimicina A-sensible


pathway7,42,43. Esta va es en parte redundante con la complejidad
NDH
pathway6 dependiente. Por lo tanto, los transformantes NDH-borrado
puede ser capaz de utilizar esta va para el transporte cclico de
electrones.
No todos los genes ndh se encontraron en el transcriptoma,
probablemente
debido a que estos genes se expresan en niveles bajos y / o slo durante
especfica etapas de desarrollo o en condiciones de crecimiento
especficas.
Secuencias del genoma pueden ser ms tiles debido a que representan
completa
complementos genticos. Se realiz la secuenciacin NGS del E.
genoma pusilla y obtuvo 15 Gb de datos de secuencias, lo que
corresponde
a aproximadamente 10 veces la cobertura del genoma. No ndh nuclear
gen podra ser identificado en los datos NGS reunidos. Sin embargo,
porque no hemos completado el montaje de un proyecto de alta calidad
genoma, es difcil concluir si ningn gen ndh funcionales
existir en el genoma nuclear. Una conclusin concreta slo puede
hacerse
Cuando todo el genoma secuencias estn disponibles para E. pusilla.
De acuerdo con nuestro resultado, la mayora de los genes transferidos
al MT
genoma son altamente similares a los dentro del genoma cp, lo que
indica
que estas secuencias de ADN fueron transferidos al genoma ms MT
recientemente que las secuencias que contenan ms inserciones /
deleciones
y mutaciones. Los nueve protenas (PSBI, RPS2, PETN, atpE, PSAJ, psbH,
rpl36, rpl22, y CAPP, Mesa S8 Complementario) que estn codificadas
por
estos genes son ms pequeas que son las otras protenas codificadas
por el genoma cp
(29-236 A.A., promedio de 5 88 A.A.); por lo tanto, su composicin
gentica
integridad puede ser ms fcil de mantener. En la mayora
Tracheophyta, pequea
fragmentos del genoma cp han sido identificados en los genomas mt. En
arroz,
hay 16 segmentos del genoma cp en el genoma mt con tamaos que
van de 32 pb, hasta el 6,8 kb44. En el maz, muchos segmentos cortos
cp (17 a
187 pb) se han trasladado a la genome24 mt. En Palma, hay
son ms de 100 fragmentos de origen cloroplasto que varan en tamao

de 50 pb, hasta el 6 kb45. Esta gran cantidad de synteny es una de las


razones por las que los pseudogenes-ndh como pudieron ser
identificados. La transferencia
cp de ADN al ADN mt generalizada en plants45-53 semilla. Residencia en
Actualmente publican genomas mt, mt genoma Amborella tiene la
mayor cantidad de ADN cp de todos los genes ndh (138 kb) 48. Dos
Cucurbitaceae genomas mt contienen largas transferencias genoma cp:
C.
pepo (0,113 kb, cinco genes ndh) 49 y C. sativus (71 kb, cuatro ndh
genes) 46. En la palma P. dactylifera metros genoma, hay 74 kb de
cp ADN genmico, que abarca de seis pseudogenes45 ndh.
Ms de 130 kb de ADN genmico cp se ha transferido
el genoma tm en E. pusilla. Estudio aprevious indic que mayor tm
genomas contienen ms DNA46 cp. Proponemos que el tamao y la
estructura de la E. pusilla MT genoma puede ser grande y complicada.
Una secuencia completa del genoma de E. pusilla metros aumentar
nuestra
comprensin de este fenmeno. En un futuro cercano, la secuenciacin
NGS
de la biblioteca BAC seguir para facilitar las investigaciones de la
complejidad genmica en E. pusilla.
La mayora de los genes mt-cp como no pueden traducir protenas
funcionales. en el
Amborella metros genoma, que contiene 197 extranjeros que codifica la
protena
genes, slo el 50 (25%) son de larga duracin y contienen lectura
abierta
frames48. Estos 50 genes son predominantemente de corto, lo que
sugiere que
muchos permanecen intactos por casualidad. La funcin del ADN metros
cp-como
secuencias incluyen genes50,51 ARNt-codifican, el promotor de la
NADH deshidrogenasa subunidad 9 (nad9) 52 y la nueva mitocondrial
quimrico
genes que se generaron por recombination53. Es todava
fragmentos de ADN cp por qu las grandes desconocidas (0,1 kb) se
transfieren a
MT ADN o por qu este fenmeno es frecuente en las orqudeas. A pesar
de que
algunos de los genes de ARNt transferidos son funcionales en
mitochondria50,51,
destino de los genes de codificacin de protenas requieren ms
investigaciones.
Estudios anteriores han indicado que los auttrofos Epidendroideae
genomas cp orqudea ya no codifican todos los genes ndh. Usando

bases de datos transcriptoma de orqudeas y cp secuencias genmicas


actual,
hemos demostrado que todava existe el conjunto completo fragmento
del gen ndh
en algunos miembros de la familia de la orqudea. Durante la evolucin,
varias orqudeas
experimentaron ndh supresiones de genes, pero estas supresiones no
estn correlacionados
con la taxonoma de orqudeas. Basndose en las secuencias y
estructuras de genes de
los genes ndh y fragmentos de genes que permanecen en los genomas
cp, nos
concluyen que estos eventos de delecin fueron independientes. Debido
cclica
va de transporte de electrones es redundante con la complexdependent
NDH
va, no hay presin evolutiva para mantener
copias funcionales de genes ndh en otros genomas en agudo contraste
con
genes esenciales necesarios para la sntesis de protenas del cloroplasto
que estaban
transferido de cloroplasto con el genoma nuclear. En todas las
genomas secuenciados de orqudeas, los fragmentos de gen NDH se
transfirieron
a los genomas mitocondriales. Estas transferencias no eran
directamente
vinculado a las deleciones ndh en el genoma cp. Los genes que NDH
fueron transferidos al genoma metros se han mutado y truncada
y no complementar la funcin del gen ndh. Adems, la E.
pusilla metros orqudea genoma contiene el mayor nmero de genoma
cp
secuencias entre los genomas publicados. Este resultado sugiere que en
E. pusilla, las transferencias-cp-a metros de fragmentos de genes son
ms frecuentes.
En conjunto, estos hallazgos indican que los genomas mt de orqudeas
(o por lo menos, de E. pusilla) son nicos y justificar ms
investigaciones.
Mtodos
Identificacin de las transcripciones NDH 16 de orqudeas de
transcriptoma orqudea pblica
bases de datos. Para entender los genes ndh en el transcriptoma actual
orqudea pblica
base de datos, una especie bien estudiados monocotiledneas, pltano
(Musa acuminata), se utiliz para
secuencias diana explosin. Secuencias de aminocidos Once NDH se
utilizaron como plantillas para

TBLASTN bsquedas (no la adhesin. HF677508) 54. Estas secuencias


de aminocidos eran
utilizado para identificar los supuestos ndh transcripciones de genes del
transcriptoma pblica
databases21,37,38. Las secuencias de ADNc que fueron identificados en
este estudio fueron el blanco
a partir de bsquedas BLAST. La secuencia ID aparece en el cuadro
complementario S2.
Planta y preparacin de ADN BAC. V. planifolia, H. longidenticulata, G.
fumata, P.
armeniacum, P. niveum, C. formosanum, se utilizaron M. picturata y E.
hojas pusilla
como material para la extraccin de ADN a travs de la bromuro de
cetiltrimetilamonio
method55. Se aislaron los plsmidos BAC para la secuenciacin de
Illumina utilizando el
NucleoBond BAC 100 Kit (NucleoSpin Sangre, Macherey-Nagel, Dren,
Alemania).
Secuenciacin de alto rendimiento. Los fragmentos de ADN genmico de
la orqudea arriba y BAC
fueron secuenciados por una plataforma de secuenciacin de alto
rendimiento Illumina (Illumina, San
Diego, CA, EE.UU.). Las bibliotecas de secuenciacin de gama
emparejado se construyeron por un Nextera
Kit de Preparacin de ADN de la muestra XT de acuerdo con el manual
de instrucciones (Illumina).
Brevemente, 10 mg de ADN purificado se fragmentados utilizando el
amplicn Aumentar Mix
(Illumina). Reacciones de fragmentacin se lograron mediante
incubacin a 55uC durante 5 min,
seguido de neutralizacin en tampn a temperatura ambiente durante 5
min. El neutralizado
Fragmentos de ADN fueron amplificados a travs de un programa de
PCR-ciclo limitada participacin de 12 ciclos
de desnaturalizacin a 95uC durante 10 s, hibridacin del cebador a
55uC durante 30 s, y extensin a
72uC durante 30 s, durante el cual los cebadores de ndice que se
requeran para el conglomerado
Tambin se aadieron formacin. Los amplifiedDNAwas purific usando
perlas de AMPure XP
(Beckman Coulter, Indianapolis, IN, EE.UU.). Los tamaos de los
fragmentos y las concentraciones de
las bibliotecas se determinaron por un 2,100 Bioanalyzer con un ADN de
alta sensibilidad

Kit de ensayo (Agilent Technologies, Santa Clara, CA, EE.UU.) y la PCR


cuantitativa
(Applied Biosystems, Carlsbad, CA, EE.UU.). Posteriormente, las
bibliotecas con inserto
tamaos de 500 a 600 pb se desnaturalizaron con NaOH y se
secuenciaron en las longitudes de lectura de
250 bases de ambos extremos utilizando un secuenciador MiSeq
Personal (Illumina).
Debido a que el tamao medio de insercin de cada biblioteca fue de
aproximadamente 500 a 600 pb, la
extremos de muchas lecturas (250 pb * 2) se superponen debido a la
variabilidad en el tamao de inserto.
Por lo tanto, el limpiado lecturas fueron clasificados en dos grupos: la
superposicin de gama emparejado
lee y de extremo emparejado no se solapan lee. La superposicin de
gama emparejado lee fuera
ms fusionado en lee largo (400 a 500 pb) por FLASH (versin 1.2.7)
antes
assembly56. La gama emparejado restante lee se utiliza para vincular
los contigs en andamios.
Newbler (versin 2.9) se utiliz para ensamblar el largo lee junto con la
nonoverlapping
extremo emparejado lee en contigs y andamios. Informacin detallada
sobre el
secuenciacin de alto rendimiento se proporciona en el cuadro
complementario S5. La Asamblea
secuencias de la DNA genmico de siete orqudeas se definen como todo
el genoma
secuencias de siete orqudeas para el anlisis posterior.
El genoma del cloroplasto completas de siete orqudeas. El contigs ADN
cp eran
identificados utilizando la secuencia del genoma cp pusilla E. a la
pantalla todo el genoma
secuencias de siete orqudeas por BLASTN19. Esos contigs con una alta
cobertura eran
utilizado como el esqueleto de los genomas cp. Los espacios entre los
contigs fueron ocupados por
secuencias que se derivan de PCR. El genoma cp fue anotado utilizando
el Dual
Organellar genoma anotador (DOGMA) 57. Para los genes con una
identidad bajo de secuencia,
anotacin manual se realiz despus de la identificacin de las
posiciones de inicio y paro
codones, as como la secuencia de aminocidos traducida utilizando el
cloroplasto / bacteriana

codigo genetico. Las secuencias del genoma anotado se presentaron al


NCBI. los
nmeros de acceso para los genomas del cloroplasto reunidos se
enumeran en
Tabla S4 Complementario.
Identificacin de genes ndh no cp orqudeas. Debido a que ningn
genoma nuclear conjunto
secuencia de una orqudea ha sido publicado, regiones que contienen
secuencias de codificacin de NDH- en los genomas del ncleo y otros
orgnulos (genes ndh no cp) no han sido identificado. Para identificar los
genes ndh no cp, 11 de pltano (M. acuminata) amino ndh secuencias
de cidos se utilizaron como plantillas para TBLASTN bsquedas de la
genmica de orqudeas secuencias (adhesin no. HF677508) 54. Los
contigs identificados fueron analizados por BLASTN bsquedas con las
secuencias de sus genomas cp correspondientes para confirmar que
estas secuencias no fueron cp secuencias genmicas. Las secuencias de
ADN fueron tm determinada por la comparacin de las regiones que
flanquean los fragmentos de genes ndh con el secuencias del genoma
mt en la base de datos NCBI utilizando BLASTN. Adems, la lectura en
bruto contar fue utilizado para distinguir el origen del ADN utilizando la
correlacin entre el nmero de secuenciacin de alto rendimiento lee por
secuencia y la fuente (varias copias de orgnulos vs. solo genoma, Tabla
S5 suplementario) de la
ADN cuando se utiliz el ADN total para excluir la sequence58 genoma
cp. El restante
contigs candidatos fueron confirmados por NCBI BLASTN para asegurar
Las secuencias fueron MT DNA.
Las secuencias ndh no cp que derivan de la secuenciacin genmica en
E. pusilla se utilizaron para disear los cebadores especficos. Estos
cebadores se utilizaron para defender la tasa de alcoholemia biblioteca.
Usando esta estrategia, no hubo necesidad de aislar los ncleos o las
mitocondrias o para purificar el ADN genmico sin contaminacin
genoma cp. Las secuencias se anotado por BLASTX usando la base de
datos de protenas de Arabidopsis. Las cifras de la 446 anotadas y las
posiciones de ADN alineadas se extrajeron utilizando PowerPoint
(Microsoft, 14447 Redmond, WA). El diagrama de flujo se muestra en la
Figura complementario S5.
El anlisis filogentico. Para investigar las relaciones entre las orqudeas
en este informe, el cloroplasto rbcL combinado, matK, PAAS y PSAB
secuencias de nucletidos se utilizaron para el anlisis filogentico. Las
secuencias de consenso fueron alineadas utilizando
ClustalW2 (http://www.clustal.org/) y concatenados. Posteriormente, el
maximumlikelihood filogenia se estim utilizando una versin web de
PhyML 3.0 (http: // www.atgc-montpellier.fr/phyml/) utilizando la
secuencia de alignments59 mltiple. El general Tiempo modelo

reversible fue utilizado como un modelo de sustitucin de la


construccin de la filogentica rbol. Los valores de arranque se
obtuvieron a partir de 1000 repeticiones de arranque y son presentado
en forma de porcentajes. Por ltimo, el rbol filogentico se represent
por TreeVector
(http://supfam.cs.bris.ac.uk/TreeVector/).
La identificacin de los genes y el ADN ndh-cp como de la planta de
metros publicada genomas. Para identificar los genes ndh en los
publicados genomas mt planta, el 43 genomas mt completos y los
genomas cp de estas especies o especies afines en la mismo gnero
fueron descargados de la base de datos NCBI. Las especies y la adhesin
nos. se enumeran en la Tabla S9 Complementario. Los genomas cp y mt
se compararon utilizando BLASTN para identificar el ADN cp en los
genomas mt.
Identificacin de los clones BAC que contienen los genes y el ADN ndh
cp-como en su ADN mitocondrial. Los primers especficos fueron
diseadas para identificar el BAC clones que llevan el ndh regiones
gnicas y ADN-cp como (Cuadro S10).
Los clones BAC que contienen las regiones ndh y ADN-cp como de
inters fueron obtenido por la seleccin por PCR de la piscina estupenda,
placa, fila y spot31. estos cebadores
Tambin se utilizaron para detectar la biblioteca BAC O. 'Gower Ramsey'
para identificar clones ndh.

Вам также может понравиться