Вы находитесь на странице: 1из 60

Marcadores moleculares

Una definicin
El genoma no solamente contiene genes, sino
tambin secuencias no codificantes que sin una
funcin especfica definida, pueden ser utilizados
como puntos de marca o de anclaje (marcadores)
cuando stas se encuentran unidas o cercanas a
las secuencias propias de los genes.

Un marcador es una entidad gentica que


manifiesta polimorfismo y se hereda de
manera mendeliana, o es lo mismo decir, un
locus
con
una
variacin
detectable
demostrada experimentalmente.

Marcadores Genticos
Fenotpicos: los polimorfismos de los genes se detectan a
travs de sus productos
- Morfolgicos: por ejemplo, color de flor
- Bioqumicos: bsicamente perfiles electroforticos de
isoenzimas y de protenas de reserva
Genotpicos o moleculares: Los polimorfismos de genes u
otras secuencias no codificantes se detectan a nivel del DNA

Marcadores morfolgicos
Los primeros en usarse (1960).
Son caractersticas fenotpicas de fcil
identificacin visual tales como forma, color,
tamao o altura. Ejem. Hay alrededor de 50
caracteres de plntula, tallo, hoja, espiga,
espiguilla y cariopside, que se utilizan para
inscribir e identificar variedades de trigo en
Mxico.
Los marcadores morfolgicos presentan
algunas limitaciones (estado fisiolgico,
condiciones ambientales, interacciones, etc.)
no obstante permanecen como caracteres
tiles en la identificacin de materiales
evaluados con mtodos sencillos y a bajo
costo.

Isoenzimas
Despus se paso a los marcadores isoenzimticos o marcadores de protenas.
Ciertos cambios en la secuencia de DNA (mutaciones) que codifica para estas
enzimas pueden resultar en cambios en la composicin de aminocidos.
Si estos cambios se producen, las protenas podran tener la misma actividad
biolgica, pero como su composicin de aminocidos vara, podran tener diferente
carga neta y por tanto diferentes velocidades de migracin en un campo elctrico
(electroforesis).
Deshidrogenasas (alcohol deshidrogenasa ADH,
glutamato dehidrogenasa GDH),
Oxidasas (peroxidasas PRX), hidrolasas
(fosfatasas cidas ACP, esterasas EST),
Isomerasas
(fosfoglucoisomerasa
PGI),
transferasas (fosfoglucomutasas PGM).

Las isoenzimas usadas en estudios de poblaciones vegetales para determinar


variabilidad y estructura gentica, sistemtica y biologa evolutiva as como en
descripcin de germoplasma e identificacin de variedades.

Protenas de reserva
El endospermo de los cereales es el principal
componente de la semilla, ya que representa
aproximadamente el 80-90% de su peso seco,
adems que el almidn y protenas son las dos
macromolculas ms importantes.
La clasificacin segn la protenas del endospermo
se basa en la solubilidad relativa en diferentes
solventes: albminas solubles en agua, globulinas
en solucin salina, prolaminas en alcohol y
glutelinas en cidos o lcalis.
El uso de protenas de almacenamiento en estudios
de diversidad gentica sistemtica, se basa en el
hecho que las protenas de diferentes individuos,
poblaciones y especies son homlogas, y que al
separarse en un gel producirn bandas similares o
diferentes.

Marcadores moleculares
Los marcadores moleculares permiten evidenciar variaciones (polimorfismos) en
la secuencia del DNA entre dos individuos, modifiquen estas o no su fenotipo. Esto
se debe a que los marcadores moleculares sealan tanto regiones codificantes
como no-codificantes del genoma.
Para que una porcin de DNA ligada al carcter de inters sea considerado un
marcador gentico debe mostrar una variacin experimentalmente detectable entre
los individuos de la poblacin, y una herencia predecible segn las leyes de Mendel
Marcadores morfolgicos
Influencia del ambiente
Bajo nmero
Baja cobertura del genoma
Bajo nivel de polimorfismo
Menos informativos (dominantes o recesivos)
Caracteres de madurez
Entrenamiento y subjetividad

Marcadores moleculares
Sin influencia ambiental y neutros
Cantidad ilimitada
Amplia cobertura del genoma
Alto nivel de polimorfismo
Ms informativos (en general codominantes)
Anlisis en fases tempranas
Sencillos, rpidos y objetivos

Polimorfismo de DNA
Diversos sucesos pueden causar variantes, ms o menos
complejas, en la secuencia de nucletidos del DNA. Tales
variantes se describen, generalmente como polimorfismos.
El polimorfismo se manifiesta en diferencias del genotipo - lo que
se demuestra en los diversos perfiles de bandas que se detectan
con un procedimiento apropiado - y quizs del fenotipo.
Varios sucesos pueden producir polimorfismos:
Mutaciones puntuales
Inserciones o deleciones
Rearreglos

Polimorfismo de DNA es resultado de la acumulacin de mutaciones

Marcadores moleculares de DNA


Un marcador de DNA es simplemente un punto de referencia en un
cromosoma, que puede o no corresponder a un gen.
Existen diversas tcnicas de biologa molecular disponibles para
detectar variabilidad en la secuencia de DNA. La reaccin en cadena
de la polimerasa (PCR), las enzimas de restriccin, la separacin
electrofortica de los fragmentos de DNA, las sondas marcadas y las
hibridizaciones.
Estas tcnicas permiten obtener un nmero virtualmente ilimitado de
marcadores moleculares, para cubrir la totalidad del genoma de un
organismo.

Clasificacion: de acuerdo al tipo de tcnica I

De acuerdo al tipo de tcnica II


Mtodos sin el uso de PCR
RFLP

Polimorfismos de longitud de fragmentos de restriccin/ Restriction


Fragment Length Polymorphism

VNTR

Variable Number Tandem Repeat /minisatelites

Mtodos con el uso de PCR


PCR con primers arbitrarios
RAPD, AP-PCR, DAF, MAAP
AFLP
ISSR

PCR primers sitio-especfico


CAPS, SCAR
SSRs (microsatlites)
TGGE, SSCP, DGGE

De acuerdo al nmero de copias de la secuencia blanco


Secuencia de pocas copias - codificante
RFLP
Secuencia con copias repetidas
VNTR
SSRs (microssatlites)
ISSR (Inter Simple Sequence Repeats)
Secuencia con numero de copias indefinido
RAPD, AP-PCR, DAF, MAAP
AFLP
CAPS, SCAR

1,5%

8,5%

altamente
repetido

45%
moderadamente
repetido

45%

Segun la fuente de DNA


DNA nuclear (nDNA)
En eucariontes, la mayor parte de la informacin gentica se
encuentra contenida en el ncleo de la clula.
El nDNA contiene regiones nicas de una sola copia y no
nicas duplicadas o regiones repetitivas. Se considera que
los organismos diploides tienen dos copias de cada regin
gentica (locus) en los pares homlogos de los
cromosomas, llamadas alelos, sin tener en cuenta si
contienen regiones codificantes (exones) o no codificantes
(intrones o regiones intergnicas).

DNA de cloroplasto (clDNA)


En los organismos fotosintticos con cloroplastos existe un
DNA tpicamente bacteriano circular, de 120 a 200 kb (Brown
et al. 1979), con intrones y exones, muy conservado, ya que
se trata fundamentalmente del mismo genoma desde las
hepticas hasta las plantas superiores.
Cada cloroplasto contiene varias regiones nucleotdicas, cada
una con 8 a 10 molculas de DNA.
Un organismo unicelular como Euglena puede contener de 40
a 50 cloroplastos, por lo que la celula entera puede contener
ms de 500 copias del genoma del cloroplasto (Stansfield,
1992).

DNA mitocondrial (mtDNA)


El genoma mitocondrial (mtDNA) tiene un tamao de 15 a 17 kb (Brown et al.
1979) y su longitud vara considerablemente entre especies: 20 micrmetros
en Neurospora; 25 micrmetros en levaduras; 30 micrmetros en plantas
superiores; 5 micrmetros en algunos animales metazoarios (multicelulares).
Se considera que la mayora del mtDNA de hongos y plantas no codifica, ya
que el mtRNA contiene intrones. El mtRNA de animales carece de intrones y
se transcribe como RNA policistrnico y se parte en RNA monocistronico
antes de la traduccin (Stansfield, 1992).
Los polimorfismos del DNA mitocondrial (mtDNA) se han utilizado
ampliamente en anlisis filogenticos y de diversidad gentica. Son
especialmente importantes para trazar historias filogeogrficas y de
estructura poblacional gentica estrechamente relacionada al linaje. Tambin
nos permiten inferir cambios demogrficos y de dispersin entre especies
(Dirienzo y Wilson, 1991).

DNA ribosomal (rDNA)


El rDNA puede encontrarse en mitocondrias, cloroplasto y ncleo. Contiene la informacin
para el RNA que conforma los ribosomas, por lo que es informacin que se transcribe pero
no se traduce. tiles para relaciones filogenias.
El rDNA se presenta en repeticiones tndem y est formado por tres subunidades altamente
conservadas (18 rDNA, 5.8 rDNA y 28 rDNA), separadas por dos espaciadores con elevadas
tasas de sustitucin (ITS1 e ITS2, marcadores moleculares).

Estas repeticiones en tandm


se encuentran conservadas a
lo largo de todo un genoma y
evolucionan concertadamente,
lo que se atribuye a eventos
recombinatorios
como
entrecruzamiento desigual y
conversin gnica.

Descripcin de los marcadores moleculares

Maheswaran M (Aug. 2004) Advanced Biotech

Importancia
relativa de los
marcadores

Marcadores basados en DNA


RFLP (Restriction fragment length polymorphism o Polimorfismo en la
longitud de fragmentos de restriccin)
AFLP (Amplified fragment length polymorphism o Polimorfismos en la
longitud de fragmentos amplificados)
RAPD (Random amplification of polymorphic DNA o polimorfismos de
DNA amplificados al azar)
MINISATELITES
VNTR (Variable number tandem repeat o Nmero variable de repeticiones en tndem)
SSR - MICROSATELITES
SSR (Short Sequence repeats)
STR (Short Tandem repeats)
SNP (Single nucleotide polymorphism o polimorfismo de un solo nucletido)

Restriction Fragment Length Polymorphisms (RFLPs)


Compara el nmero y tamao de fragmentos de DNA
producidos por digestin DNA con varias enzimas de
restriccin
Cebadores unidos a varias posiciones del DNA.
La ubicacin de los sitios de unin es aleatoria.
Se utiliza el DNA celular total
Requiere el DNA puro de alto peso molecular

Metodologia
1 . Digestion DNA en fragmentos pequeos
2. Separacion de los fragmentos en gel de
eletroforesis
3. Transferencia de fragmentos de DNA para
filtro Nylon o nitrocelulosa.

4. Visualizacion de los fragmentos de DNA


sondas marcadas (32P) o quimioluminiscencia

5. Anlisis de los resultados


bandas analizadas para alelos en/o
presencia/ausencia
Diferencias en el patron de bandas refleja la
diferencias genticas.
La eleccion de la sonda y enzima de restriccion es crucial

(RFLP)

Interpretacion de resultados
1
1

2
3
4

Sitio objetivo de la sonda


Sitio de restriccion
Insercion

RFLP en Caa de Azcar

Sorgo

Caa

Random Amplified Polymorphic DNA (RAPDs)


Cebadores son cortos (10 bp) con una secuencia generada
aleatoriamente. Ademas puede contener >50% G+C.
Cebadores unidos a varias posiciones del DNA.
La ubicacin de los sitios de unin es aleatoria.
Algunos fragmentos generados son parecidos y otros diferentes de
un individuo a otro.
Desventaja: Alta variabilidad, dificultad de reconstruir historias
evolucionarias

(RAPD)

RAPD
AA

AA Aa aa

Aa

aa

Heterocigoto/
Homocigoto

Interpretacion

Marcadores RAPD son anonimos


Son datos binarios (presencia x ausencia)
RAPD son dominantes (AA = Aa)
Problemas de co-migracion
misma banda, mismo fragmento?
una banda, un fragmento?
Cuestionamiento para filogenia
banda homlogas?

Amplified Fragment Length Polymorphism - AFLP

Combinacion de RFLP y PCR


Resulta en patrones bastante informativos
Marcador dominante
Mtodo cada vez mas usado

DNA genomico

Digestion con dos enzimas

MseI
EcoRI
adaptadores

ligacion
pre-amplificacion
Amplificacion selectiva

MseI
EcoRI

DNA

digestion

ligacion
preamplificacion
primer +1

GAATTCCN
CTTAAGCN

EcoRI

NTTAA
NAATT

ATTCCN
GCN
ATTCCN
TAA GCN

NT
NAAT
NT TA
N AT

A
ATTCCN
TAAGCN

NTTA
NAAT
C

AAC

Amplificacion
primer +3

ATTCCA
TAAGCT

GTTA
CAAT
AAC

MseI

AFLP de frijol gel desnaturalizante


coloreado con plata

AFLP de caa con 33P

El anlisis AFLP combina la digestin


con enzimas
de restriccin con el PCR.
1) Digestin del DNA con dos ERs,
una de las cuales corta secuencias
precisas y la otra corta ms
frecuentemente.
2) Se agregan adaptadores para que se
peguen en los
bordes de los fragmentos recin
formados y poder amplificar mediante
PCR.

DNA Repetitivo
Microsatlites o Secuencias Simples Repetidas
(Simple Sequence Repeats, SSRs)
- Mono-, di-, tri-, y tetra-nucletidos
Minisatlites o Short Tandem Repeats (STRs)
- 5-10 bp
Variable Number of Tandem Repeats
- 14-100 bp

Microsatlites
Secuencias cortas (1 a 6 bases) repetidas en tandem.
Presentes en procariotos y eucariotos.
Presentes en regiones codificantes y no codificantes.
Mayoria de las repeticiones son dinucleotideos
(AC) n (AG) n (AT)n
Los segmentos cortos DNA tienen secuencias repetidas como
CACACACA, y se presentan en el DNA no codificante.
La unidad repetida CA puede ocurrir 4 veces, o tambin 7 o 2 o 3.

Microsatlites (SSR)
ACTTCATTAA TGTCTTAGGT GGCAGAATAC TTTGATGCAA CAATTTCAAG GGGTGCTGAC ATTAAGTTGG CTGCCAATTG
GATAATGGGT GATATTGCTG CCTATATGAA AAATGAAAAG CTTTCTATTA ATGAGATCAA ACTTATGCCA GAAGAGCTAG
TAGAGCTGAT AGCTTCCATT AAAGGTGGGA CTATCAGTGG AAAGATTGGA AAGGAGGTAA GCATTTGCTT CTTTNACTGA
TGCCACTTTC ATGTTCAAAC ATTTGTTAGT AATCCTGTCT ATTTATTTTC ATGGAAGAAT TTTACTAGCT ATTATTCTCC
ACTGTGTAGA TGTGATTTTA TAGTTTGTTT GGATATATAA TTATTGTTCG TGTTTTTTTT TTTAATCCAA ACTTTATAAT
CTTTCCAAGT GCTTTTCTCC TCCCTGTCTT TTTCCTCTAC CACACACACA CACACACACA CACACTCATA CAGAAAAAGG
AAAAAGGAAA GAAAGAGAAC AGGAGATATA AAAACCTTTT TTCTTTATCA ATTAGATAAT TAGTTATAAA AGTTTTTCTC
CTGCTTCTTA TCCCTCCGCT AAATGCCTGA TTAACTTTCT GCTGGTAAAG ATTTAAAATA ACTTGTTAAT TTTGGACATG

Primer FOR
NNNNNNNNNNNNNNNNNNNNN CACACACACACACACACAC NNNNNNNNN NNNNN
NNNNNNNNNNNNNNNNNNNNN GTGTGTGTGTGTGTGTGTG NNNNNNNNNNNNNN

Repeticion CA

Primer REV

Obtencion de secuencias:
a partir del banco de datos de genoma se
busca un cDNA
Hibridacion con biblioteca genomica,
identificacion de clones y secuenciamiento
Construccion de biblioteca enriquecida
por afinidad con secuencia de la matriz

Digestion

DNA genmico total


Secuencia microsatlite

Ligacion
Adaptadores

Nicotiana tabacum

Adaptadores
Amplificacion

ssDNA
Sonda biotinilada

ssDNA
Bolilla magnticaestratividina

Enriquecimento y
Seleccion

Columna
Amplificacion
despues del
enriquecimiento

Enriquecimiento y seleccion
95C / 15 min

Sonda biotinilada
ssDNA

Biotina IIIII(CT)8
o
Biotina IIIII(GT)8

Temperatura ambiente / 20 min

Coluna
Magntica

gua

Deteccion del polimorfismo


Geles de agarosa
Geles de acrilamida (detecta diferencias
hasta de 2pb)
Coloracion direta: nitrato de plata (barato)
Coloracion indireta: marcacion radioativa o
fluorescente

Dna Total

Nicotiana ripanda
N. sylvestris
N. tabacum Coker 176
N. tabacum Ky 14 RMI

Digestion
con RsaI

Ligacion con
adaptadores

Amplificacion

Amplificacion despues
del enriquecimento

Todas las placas son evaluadas

N. tabacum Coker 176

N. sylvestris

Problemas
Costo y trabajo involucrados en el
desarrollo de los cebadores

Construccion de bibliotecas genomicas


Secuenciamiento
Seleccion de los mejores cebadores

Posibilidad de utilizar secuencias


depositadas en la base de datos
EST SSR funcional x SSR genomico

Una nueva generacin: 2006 - 2012

Single Nucleotide Polymorphism: SNPs

Pueden representar hasta 90% de la variacin gentica humana


1.5 millones de posiciones presentan variabilidad
Puede ser la base de susceptibilidad a enfermedades comunes (cncer, diabetes, etc)

Farmacogentica:
busca
identificar
la
posible
respuesta a las terapias con
drogas.
Metodos para identificar
depende si es un SNP
desconocido o conocido

The Next Generation of Molecular Markers From Massively Parallel


Sequencing of Pooled DNA Samples

1. Amplificar DNA por


PCR y sintetizar el
primer upstream de un
SNP conocido
2. Alinear primer a la
secuencia blanco
3. Primer
marcado
extendido y terminado
ddNTP
4. Separar fragmentos por
una plataforma
5. Analizar resultados

Insertion Site Based Polymorphism


Desarrollo de varios marcadores moleculares basados en elementos transponibles, tales como
S-SAP, IRAP, REMAP y RBIP.

trigo

Marcadores No Polimrficos

STSs (Sitio de secuencia especifica o


Sequence Tagged Sites)
Secuencia corta de DNA (200 500 bp) con
una ubicacin cromosmica conocida que
ocurre una vez en el genoma. Se puede
amplificar por PCR y utilizar para construccion
de mapas fsicos y genticos.

ESTs (Marcador de Secuencia Expresada o


Expressed Sequence Tags)
Los EST son producidos por secuenciacin
sobre un mRNA clonado de una biblioteca de
cDNA).
La secuencia resultante es un fragmento de
baja calidad, generalmente de 500 a 800
nucleotidos,
que
es
la
longitud
de
secuenciacin
de
los
secuenciadores
automticos.
Como esos clones consisten en DNA que es
complementario
al
mRNA,
los
ESTs
representan porciones de genes expresados.

Un marcador ideal debe ser: a) altamente polimrfico o variable dentro y entre


especies; b) con herencia mendeliana no episttica (sin interaccin entre genes); c)
insensible a los efectos ambientales; d) de rpida identificacin y simple anlisis.

Cdigo de Barras de la Vida


Cdigo de barras es una metodologa estandarizada para
identificar plantas y animales mediante un nmero mnimo de
secuencias de DNA, llamado cdigo de barras de ADN (cdigo
de barras de la vida).

Cdigo de barras de la vida se define como una secuencia corta de DNA de una regin
estndar del genoma, usada en la identificacin de especies (plantas y animales).

Por qu determinar el cdigo de barras de la vida


de las especies?
Diversidad conocida
Aprox. 1.7 millones de especies

1 cuadro = 10,000 especies

Diversidad estimada
10 millones de especies

La regin gnica en animales, es 648 bp del gen mitocondrial COI.


Este gen ha demostrado ser altamente efectivo en la identificacin de
aves, mariposas, peces, mosquitos y otros.
Mayor nmero de diferencias entre especies.
Nmero de copias.
En la mayora de los casos, existen relativamente
pocas diferencias entre especies.
Intrones, los cuales son regiones no-codificantes,
estn ausentes en el ADN mitocondrial.

En plantas, 04 regiones de genes


codificantes de cloroplasto (rbcL; matK;
rpoB y rpoC1) y 03 espaciadores no
codificantes (atpF-atpH; trnH-psbA y
psbK-psbI).

La regin del espaciador interno transcrito (ITS) tiene la mayor probabilidad


de identificacin exitosa barcode para la ms amplia variedad de hongos.

Tipificacin de secuencia multilocus ribosomal (rMLST, por sus siglas en ingles):


Aprox. 53 genes codifican las subunidades
de proteinas ribosomales bacterianas
(genes rps). Los genes de la familia RPS,
dan las diferentes proteinas que son los
componentes de las estructuras celulares
llamadas ribosomas.

Las comparaciones muestran que entre humanos existen diferencias


de 1 a 2 nucletidos de los 648 evaluados (COI), mientras que somos
diferentes de los chimpacs en 60 nucletidos y de los gorilas en 70
posiciones.