You are on page 1of 14

Etiquetas de secuencia

expresadas (ESTs)
Instituto Tecnolgico de Roque.
Ing. Innovacin Agrcola Sustentable.
5U
Mara Fernanda Kolbeckc Del Bosque.

Biologa Molecular.
Dr. J. Gabriel Ramrez Pimentel.

Qu son?
Es una secuencia proveniente de un transcrito (mRNA) obtenida
al azar.

Es

una secuencia corta, no editada ni corregida, obtenida


mediante una reaccin nica de secuenciacin.

Son tpicamente del rango de 200 a 400 nucletidos de longitud.

Como se obtiene?
A partir de una biblioteca de cDNA, por secuenciacin de uno
o ambos extremos (5 o 3) de clonas seleccionadas al azar.

Existen varias bibliotecas de clones de ADNc que se preparan mediante


la transcripcin inversa de poblaciones aisladas de ARNm utilizando
diferentes tcnicas.
Para generar datos de EST, se seleccionan al azar clones de las
bibliotecas de ADNc.
Los datos de EST son capaces de proporcionar una estimacin
aproximada de los genes que se expresan de forma activa en un
genoma bajo una condicin fisiolgica en particular.

Esto es debido a que las frecuencias de EST particulares


reflejan la abundancia del ARNm correspondiente en una
clula, que a su vez corresponde a los niveles de expresin
gnica bajo la condicin dada.

Proyectos de
secuenciacin de ESTs
Descubrimiento de genes nuevos.

Identificacin

de genes expresados en diversos organismos,


genotipos, tejidos y condiciones de cultivo.

Estimacin de perfiles de expresin (abundancia relativa de los


diferentes transcritos).

Estrategias de los proyectos


de
secuenciacin de ESTs
Construccin de bibliotecas de cDNA.
Secuenciacin de las bibliotecas.
Procesamiento de las secuencias obtenidas

(curado, BLAST

clusterizacin).

Data

mining
resultados).

(ordenamiento

aprovechamiento

de

los

Qu informacin provee
un EST?
En primer lugar:
Secuencia de un producto de expresin (gen)

En forma adicional:
Informacin de expresin:
- Sitio de expresin (estadio del ciclo de vida / rgano / tejido)
-Condiciones de expresin (condiciones experimentales)

Proceso
Uno de los objetivos de las bases de datos de EST es organizar
y consolidar un gran nmero redundante de datos para mejorar
la calidad de la informacin.

Este proceso incluye el pre-procesamiento de los datos el cual


remueve vectores contaminantes y enmascara repeticiones.

Despus

sigue un proceso de agrupamiento o clustering que


agrupa secuencias EST asociadas a genes nicos

El siguiente paso es obtener el consenso mediante la fusin de


secuencia redundantes, superposicin de EST y errores de
lectura.

Una vez que la secuencia de codificacin es identificada puede


ser anotada traducindola a una secuencia de protenas para
bsqueda de similitudes en base de datos.

El

compilado de EST puede ser utilizado para alinearlo con la


secuencia del genoma y as poder identificar la localizacin del
gen expresado y as como tambin obtener los lmites entre
exones e intrones.

El proceso de agrupamiento que reduce la redundancia de EST


y produce una coleccin de secuencias EST de genes no
redundantes se conoce como construccin de ndices de genes.

Desventajas
Baja calidad, debido a que se generan de forma automatizada,
sin verificacin (conlleva a altos ndices de error).

Errores de lectura.
Contaminacin comn por vectores de secuencia, intrones (de
ARN no empalmado), ARN ribosomal, ARN mitocondrial entre
otros.

Bibliografa
http://www.genoma-cyted.org/download_curso/a_herrera03.pdf
http://www.tamps.cinvestav.mx/~ertello/bioinfo/sesion16.pdf
http://www.vet.unicen.edu.ar/html/Areas/Mejora_genetica/Docum
entos/2012/MARCADORES%20GENETICOS%20Y%20APLICA
CIONES.pdf