Вы находитесь на странице: 1из 18

7/3/14

1
!"#$%&'(") +#',"(-.%$)
Una filogena es una hiptesis acerca
del pasado evolutivo
en ella que se establecen relaciones
de parentesco (topologa del rbol)
as como distancias (longitudes de
las ramas)
La reconsLruccln o lnferencla
logeneuca es el proceso por el
que, medlanLe la observacln de
unos daLos y la apllcacln de una
serle de meLodologlas, obLenemos
una hlpLesls sobre las relaclones
genealglcas o evoluuvas de los
organlsmos anallzados.
La represenLacln grca de dlcha
hlpLesls se llama rbol
logeneuco
La obLencln del rbol verdadero es muy dlncll por eso hablamos de lnferencla
7/3/14
2
/01'# +#',"(-.%'
Ls la represenLacln grca de las
relaclones evoluuvas enLre varlas
especles.
LsL compuesLo por ('2')
conecLados por 0$3$).
4(5"0"(%&$) +#',"(-.%$)
lnferlr una logenla es un procedlmlenLo que lmpllca un clculo aproxlmado.
Lsumamos una hlsLorla evoluuva basndonos en la lnformacln lncompleLa
conLenlda en los daLos.
odemos posLular escenarlos evoluuvos en los que cualquler logenla
escoglda pudo haber orlglnado los daLos observados
1enemos que Lener alguna base para selecclonar el o los me[ores rboles
enLre Lodos los poslbles.
4(5"0"(%&$) +#',"(-.%$)
7/3/14
3
uebemos decldlr
! 1lpo de daLos
- Las secuenclas de genes parlogos (de una mlsma especle)
- Las secuenclas de genes orLlogos (uno por especle)
- Secuenclas de genomas compleLos de bacLerlas
! MeLodo
! Modelo evoluuvo
! Lvaluacln de los rboles
4(5"0"(%&$) +#',"(-.%$)
4(5"0"(%&$) +#',"(-.%$)
Los meLodos de lnferencla logeneuca buscan selecclonar los me[ores arboles
de dos maneras:
1.- denlendo una secuencla especlca de evenLos (un algorlLmo) que nos
conduce a deLermlnar un rbol.
MeLodos de agrupamlenLo como uCMA y nelghbor !olnlng
2.- denlendo un crlLerlo opumo (opumallLy crlLerla) para comparar
logenlas alLernauvas y decldlr cual es me[or.
MeLodos como parslmonla y los probablllsucos como mxlma veroslmlllLud y
la lnferencla bayeslana
4(5"0"(%&$) +#',"(-.%$)
! MeLodo
Aglomeran conjuntos por pares basados en la distancia gentica
7/3/14
4
6-7'2') 8$0$ %'()709&0 +#',"(&$)
" MeLodos de dlsLancla:
uCMA (:nwelghLed ;alr <roup 6eLhod uslng ArlLhmeuc =verages)
nelghbor !olnlng (n!) esLe ulumo el ms uullzado.
" Mxlma parslmonla (M)
" MeLodos basados en probabllldades
Mxlma veroslmlllLud (ML)
lnferencla 8ayeslana (8A?)
Elegir depende el tipo de secuencias del nmero de estas y de la
capacidad de nuestro ordenador
4(5"0"(%&$) +#',"(-.%$)
4(5"0"(%&$) +#',"(-.%$)
7/3/14
5
4(5"0"(%&$) +#',"(-.%$)
Un rbol filogentico es una hiptesis propuesta en base a un modelo
evolutivo particular para explicar las relaciones observadas entre los genes
en estudio
7/3/14
6
! Modelo evoluuvo
4(5"0"(%&$) +#',"(-.%$)
>#",&0 9( 3'2"#' "?'#9.?'
4(5"0"(%&$) +#',"(-.%$)
7/3/14
7
>#",&0 9( 3'2"#' "?'#9.?'
4(5"0"(%&$) +#',"(-.%$)
General Time Reversible (GTR, nst=6): variable base frequencies, symmetrical
substitution matrix (Lanave et al. 1984, Tavare 1986, Rodriguez et. al. 1990)
In addition to models describing the rates of change from one nucleotide to
another, there are models to describe rate variation among sites in a sequence.
The following are the two most commonly used models.
G, gamma distribution: gamma distributed rate variation among sites
I proportion of invariable sites: extent of static, unchanging sites in a dataset
! Modelo evoluuvo
4(5"0"(%&$) +#',"(-.%$)
7/3/14
8
A parur de la maLrlz de dlsLanclas por pares se consLruye el rbol
6-7'2') 2" 2&)7$(%&$)
4(5"0"(%&$) +#',"(-.%$)
;@A#',"(".% 70"" 1A B&)7$(%" 3"7@'2) CD#9)7"0&(,E
rbol filogentico
Scores
Matriz de distancias
5!5
Alineamiento mltiple
1
2
3
4
5
Similarity criterion
4(5"0"(%&$) +#',"(-.%$)
7/3/14
9
Human -KITVVGVGAVGMACAISILMKDLADELALVDVIEDKLKGEMMDLQHGSLFLRTPKIVSGKDYNVTANSKLVIITAGARQ
Chicken -KISVVGVGAVGMACAISILMKDLADELTLVDVVEDKLKGEMMDLQHGSLFLKTPKITSGKDYSVTAHSKLVIVTAGARQ
Dogfish KITVVGVGAVGMACAISILMKDLADEVALVDVMEDKLKGEMMDLQHGSLFLHTAKIVSGKDYSVSAGSKLVVITAGARQ
Lamprey SKVTIVGVGQVGMAAAISVLLRDLADELALVDVVEDRLKGEMMDLLHGSLFLKTAKIVADKDYSVTAGSRLVVVTAGARQ
Barley TKISVIGAGNVGMAIAQTILTQNLADEIALVDALPDKLRGEALDLQHAAAFLPRVRI-SGTDAAVTKNSDLVIVTAGARQ
Maizey casei -KVILVGDGAVGSSYAYAMVLQGIAQEIGIVDIFKDKTKGDAIDLSNALPFTSPKKIYSA-EYSDAKDADLVVITAGAPQ
Bacillus TKVSVIGAGNVGMAIAQTILTRDLADEIALVDAVPDKLRGEMLDLQHAAAFLPRTRLVSGTDMSVTRGSDLVIVTAGARQ
Lacto__ste -RVVVIGAGFVGASYVFALMNQGIADEIVLIDANESKAIGDAMDFNHGKVFAPKPVDIWHGDYDDCRDADLVVICAGANQ
Lacto_plant QKVVLVGDGAVGSSYAFAMAQQGIAEEFVIVDVVKDRTKGDALDLEDAQAFTAPKKIYSG-EYSDCKDADLVVITAGAPQ
Therma_mari MKIGIVGLGRVGSSTAFALLMKGFAREMVLIDVDKKRAEGDALDLIHGTPFTRRANIYAG-DYADLKGSDVVIVAAGVPQ
Bifido -KLAVIGAGAVGSTLAFAAAQRGIAREIVLEDIAKERVEAEVLDMQHGSSFYPTVSIDGSDDPEICRDADMVVITAGPRQ
Thermus_aqua MKVGIVGSGFVGSATAYALVLQGVAREVVLVDLDRKLAQAHAEDILHATPFAHPVWVRSGW-YEDLEGARVVIVAAGVAQ
Mycoplasma -KIALIGAGNVGNSFLYAAMNQGLASEYGIIDINPDFADGNAFDFEDASASLPFPISVSRYEYKDLKDADFIVITAGRPQ
LacLaLe dehydrogenase muluple allgnmenL
ulsLance MaLrlx
1 2 3 4 5 6 7 8 9 10 11 12 13
1 Human 0.000 0.112 0.128 0.202 0.378 0.346 0.530 0.551 0.512 0.524 0.528 0.635 0.637
2 Chicken 0.112 0.000 0.155 0.214 0.382 0.348 0.538 0.569 0.516 0.524 0.524 0.631 0.651
3 Dogfish 0.128 0.155 0.000 0.196 0.389 0.337 0.522 0.567 0.516 0.512 0.524 0.600 0.655
4 Lamprey 0.202 0.214 0.196 0.000 0.426 0.356 0.553 0.589 0.544 0.503 0.544 0.616 0.669
5 Barley 0.378 0.382 0.389 0.426 0.000 0.171 0.536 0.565 0.526 0.547 0.516 0.629 0.575
6 Maizey 0.346 0.348 0.337 0.356 0.171 0.000 0.557 0.563 0.538 0.555 0.518 0.643 0.587
7 Lacto_casei 0.530 0.538 0.522 0.553 0.536 0.557 0.000 0.518 0.208 0.445 0.561 0.526 0.501
8 Bacillus_stea 0.551 0.569 0.567 0.589 0.565 0.563 0.518 0.000 0.477 0.536 0.536 0.598 0.495
9 Lacto_plant 0.512 0.516 0.516 0.544 0.526 0.538 0.208 0.477 0.000 0.433 0.489 0.563 0.485
10 Therma_mari 0.524 0.524 0.512 0.503 0.547 0.555 0.445 0.536 0.433 0.000 0.532 0.405 0.598
11 Bifido 0.528 0.524 0.524 0.544 0.516 0.518 0.561 0.536 0.489 0.532 0.000 0.604 0.614
12 Thermus_aqua 0.635 0.631 0.600 0.616 0.629 0.643 0.526 0.598 0.563 0.405 0.604 0.000 0.641
13 Mycoplasma 0.637 0.651 0.655 0.669 0.575 0.587 0.501 0.495 0.485 0.598 0.614 0.641 0.000
4(5"0"(%&$) +#',"(-.%$)
:;<6= !"#$%&'($) +,%-./-012 3$('0) #%(' 4-%('5$67 5$,"8 (agrupamlenLo
pareado no ponderado uullzando medla arlLmeuca)
Ls el meLodo mas senclllo para reconsLrulr una logenla.
Asume que las Lasas de evolucln son consLanLes (relo[ molecular consLanLe)
d
Crea rboles enralzados ulLrameLrlcos, en los que la dlsLancla de la ralz a
cada una de las ho[as es la mlsma
4(5"0"(%&$) +#',"(-.%$)
7/3/14
10
UPGMA
Normalmente no existe un reloj molecular constante:
a) En unas especies el ritmo de cambio es diferente
b) Dentro de una misma protena hay regiones que evolucionan
ms rpido que otras.
4(5"0"(%&$) +#',"(-.%$)
FG :(&H( 2" ?"%&(') 80HI&3') "nelghbor [olnlng"
" ldenuca los pares ms cercanos y posLerlormenLe los une en el rbol
" Las Lasas de evolucln pueden ser dlferenLes
" Peurlsuco
" CrlLerlo de $90:17%;" 5<"%5,= el me[or rbol es que mlnlmlza la longlLud
de las ramas
" La longlLud de las ramas es adluva
" roduce un rbol sln ralz
4(5"0"(%&$) +#',"(-.%$)
7/3/14
11
FG
4(5"0"(%&$) +#',"(-.%$)
6-7'2') 1$)$2') "( %$0$%7"0")
Se ellgen aquellos rboles pumos para un crlLerlo
4(5"0"(%&$) +#',"(-.%$)
6-7'2') 1$)$2') "( 2&)7$(%&$)
venLa[as: MeLodos rpldos
lnconvenlenLes: uesperdlclan mucha lnformacln del allneamlenLo muluple
7/3/14
12
6JI&3$ 8$0)&3'(&$
Se mlnlmlza el numero de camblos
Se asume que es ms probable que duranLe la evolucln se produzcan un
numero de camblos pequeno
Sluos lnformauvos:
Aquellos que dleren en ms de dos bases en ms de dos secuenclas
Se generan Lodas las Lopologlas poslbles y se buscan los rboles ms
parslmonlosos
4(5"0"(%&$) +#',"(-.%$)
ueden dar resulLados erroneos sl hay homoplasla
4(5"0"(%&$) +#',"(-.%$)
7/3/14
13
6JI&3$ ?"0')&3&#&792 6K
" 8usca el rbol que para un modelo evoluuvo maxlmlza la probabllldad de
obLener los resulLados observados
" Se permlLe al usuarlo eleglr el modelo evoluuvo
" Ls ms lenLo que parslmonla y n! y normalmenLe excede la capacldad de los
ordenadores de mesa
ue acuerdo con un modelo evoluuvo, y los daLos, se busca el rbol ms
probable.
4(5"0"(%&$) +#',"(-.%$)
1.- Lleglr un modelo evoluuvo (Model1esL)
2.- ara cada sluo, genera Lodos los rboles poslbles
3.- 8asado en el Modelo Lvoluuvo, calcula la probabllldad de esLos rboles
4.- Lllge el rbol mas veroslmll
6JI&3$ ?"0')&3&#&792
4(5"0"(%&$) +#',"(-.%$)
7/3/14
14
4(5"0"(%&$ L$A")&$($
4(5"0"(%&$) +#',"(-.%$)
ML: CbLenemos el rbol que con mayor probabllldad ha
generado los daLos
M8: ara cada rbol conocemos la probabllldad de que sea el
que ha generado los daLos.
Se lnere la probabllldad de que una hlpLesls (un rbol) sea clerLa
4(5"0"(%&$) +#',"(-.%$)
7/3/14
15
4(5"0"(%&$ 1$A")&$($
8usca el rbol que maxlmlce la probabllldad de observar los daLos.
1eorema de 8ayes
4(5"0"(%&$) +#',"(-.%$)
la distribucin posterior en la que se basa la inferencia
bayesiana es directamente proporcional al producto de la
distribucin anterior y la probabilidad
4(5"0"(%&$) +#',"(-.%$)
7/3/14
16
4(5"0"(%&$ 1$A")&$($
- Consldera las probabllldades a posLerlorl.
- Se genera un rbol consenso.
- ua probabllldad a posLerlorl para los dlsunLos clados.
8usca el rbol/es que maxlmlce la probabllldad de observar el rbol (y el
modelo) con los daLos observados.
Las probabllldades a posLerlorl se onuenen uullzando una Lecnlca de
muesLreo llamada Cadenas de Markov MonLe Carlo (MCMC)
4(5"0"(%&$) +#',"(-.%$)
MCMC
(Monte carlo Markov Chains)
Una manera de estimar la probabilidad posterior
1.- Dada una solucin aleatoria N1 (un rbol al azar)
2.- Se elige otra solucin aleatoria N2 un cambio aleatorio
3.- Si la posterior (N1<N2), entonces reemplazar N1 por N2
4.- Guardar dicha solucin
5.- Repetir el paso 2
4(5"0"(%&$) +#',"(-.%$)
7/3/14
17
4(5"0"(%&$) +#',"(-.%$)
" Lvaluacln del soporLe esLadlsuco de las dlferenLes ramas del rbol.
" Se generan secuenclas de lgual longlLud que las orlglnales Lomando
columnas al azar de enLre la secuencla (con poslbles repeuclones).
" Se consLruye el rbol asoclado.
" Se replLe el proceso (aprox. 1000 veces)
" Se obuene un lndlcador de la abllldad de las blfurcaclones
! >?$#9$%&H(M 3-7'2' 2" N1''7)70$8O
4(5"0"(%&$) +#',"(-.%$)
7/3/14
18
Programas
PAUP PAUP* 4.0
Mr. BayesMrBayes: Home
PHYLIP (PHYlogeny Inference Package PHYLIP Home Page)
Visualizador de rboles
TreeViev TreeView
Modelos evolutivos
ModeltestModeltest home page
AllneamlenLo muluple

Вам также может понравиться