Академический Документы
Профессиональный Документы
Культура Документы
Bioinformtica Clsica
Tema 4: Alineamiento Mltiple y Filogenias (3)
Seccin 3: Filogenias
Dr. Oswaldo Trelles
Universidad de Mlaga
Protena CitocromoOxidasa-3
ALINEAMIENTO DE SECUENCIAS
Humano CCCCTAACAGGGGCCCTCTCAGCCCTCCTAATGACCTCCGGCCTAGCCATGTGATTTCAC
Orangutn CCCCTAACAGGAGCTCTCTCAGCCCTCCTAACAACATCTGGCCTAACCATGTGATTCCAC
Tiburn CCATTAACAGGAGCTGTTGCTGCTTTACTAATAACATCAGGCCTAGCCGTCTGATTCCAT
Gusano GCATATAATTTATTTTTTGCCTCAGCCGGAATGTTAAGATCTTTAGTAATATTTTTTAAA
Levadura CCATTTTTCTTATCTGTAGTATTATTCTTTAACTGTTTAGCAGCTACATTATATTTACAT
* * * * * ** *
H O T G L
Humano -
Orangutn -
Tiburn -
Gusano -
Levadura -
Humano CCCCTAACAGGGGCCCTCTCAGCCCTCCTAATGACCTCCGGCCTAGCCATGTGATTTCAC
Orangutn CCCCTAACAGGAGCTCTCTCAGCCCTCCTAACAACATCTGGCCTAACCATGTGATTCCAC
Tiburn CCATTAACAGGAGCTGTTGCTGCTTTACTAATAACATCAGGCCTAGCCGTCTGATTCCAT
Gusano GCATATAATTTATTTTTTGCCTCAGCCGGAATGTTAAGATCTTTAGTAATATTTTTTAAA
Levadura CCATTTTTCTTATCTGTAGTATTATTCTTTAACTGTTTAGCAGCTACATTATATTTACAT
* * * * * ** *
ALINEAMIENTO DE SECUENCIAS
Humano CCCCTAACAGGGGCCCTCTCAGCCCTCCTAATGACCTCCGGCCTAGCCATGTGATTTCAC
Orangutn CCCCTAACAGGAGCTCTCTCAGCCCTCCTAACAACATCTGGCCTAACCATGTGATTCCAC
Tiburn CCATTAACAGGAGCTGTTGCTGCTTTACTAATAACATCAGGCCTAGCCGTCTGATTCCAT
Gusano GCATATAATTTATTTTTTGCCTCAGCCGGAATGTTAAGATCTTTAGTAATATTTTTTAAA
Levadura CCATTTTTCTTATCTGTAGTATTATTCTTTAACTGTTTAGCAGCTACATTATATTTACAT
* * * * * ** *
H O T G L
Humano
En el ejemplo se ha empezado a comparar Humano
-
Orangutn 8 - con Orangutn y luego con Tiburn mostrndose las
Tiburn 18 - diferencias (8 entre Humano y Orangutn y 18 con
Gusano - Tiburn)
Levadura -
Actividad: Complete la matriz de distancias del ejemplo
Humano ----MTHQSHAYHMVKPSPWPLTGALSALLMTSGLAMWFH--FHSMTLLMLGLLTNTLTM
Orangutn ----MAHQSHAYHMVKPSPWPLTGALSALLTTSGLTMWFH--FHSTTLLLTGLLTNALTM
Tiburn ----MAHQAHAYHMVDPSPWPLTGAVAALLMTSGLAVWFH--FHSMYLLYLGLTLLLLTM
Gusano -------MFHNFHILSLSSYAYNLFFASAGMLSSLVMFFK--FGLYELFIFTLFSVLFIS
Levadura MNLSTKFQGHPYHIVSASPWPFFLSVVLFFNCLAATLYLHGYKHSSVFFGISFLGLLATM
. * :*:. *::. : ..: ::.: ... .. . ..
Filogenias moleculares
Las secuencias moleculares permiten:
Elaborar filogenias de genes y genomas
Cuantificar grados de parentesco con gran precisin.
Analizar procesos evolutivos: mutaciones, seleccin,
Identificar y predecir estructuras y funciones de protenas
Seguir especiaciones rpidas (virus)
Especie A
Especie Especie B
ancestral
Especie C
mutaciones en el curso del tiempo
Es importante tener en cuenta que la Seleccin Natural evita que muchas de esas
mutaciones sean transmitidas a las siguientes generaciones de individuos.
Tipos de rboles
rboles
Topolog as
Topologas
A A E A
B B B
E E
raz H H raz H
D D
G D G
rbol enraizado C rbol desenraizado G C
(cladograma triangular) F (Topologa radial) F
C rbol enraizado
(Cladograma rectangular)
F
Nmero posible de
Nmero rboles para n
rboles n OTUs
B
A A C
B C B A
C B A
C
Nr = 1*3*5**(2n-3) = Ns = 1*3*5**(2n-5) =
(2n-3)! (2n-5)!
= =
2 n-2 (n-2)! 2 n-3 (n-3)!
El nmero de posibles rboles guarda una relacin exponencial con el nmero de OTUs,
por ello no es posible realizar un anlisis exhaustivo de todas las posibles combinaciones
Alineamiento Mltiple y Filogenia Campus Virtual Andaluz, 2007
Bioinformtica Clsica
M todos filogen
Mtodos ticos
filogenticos
Basados en la medida de distancias evolutivas entre OTUs:
UPGMA (Unweighted Pair-Group Method with Arithmetic mean)
Unin del vecino ms prximo (Neighbor Joining o NJ)
rboles Aditivos
rboles Ultramtricos- las ramas ms recientes son ms cortas
RATON
RATON Distancia entre OTUs
RATA
RATA UPGMA: Unweighted Pair-Group Method
HUMANO with Arithmetic mean (o Simple Average
HUMANO Linkage)
TIBURON
TIBURON WPGMA: Weighted Average Linkage
DROSOFILA
DROSOFILA UPGMC: Centroid Method
MAIZ
MAIZ WPGMC: Median Method
LEVADURA Single Linkage (Nearest Neighbor)
LEVADURA Complete Linkage (Farthest Neighbor)
BACILO
BACILO Ward's Method
Mtodos de Parsimonia
Se basa en la descripcin de sitios informativos y relaciones entre OTUs
1 2 3 4
Humano M-TPIRKINPLIKLINHSFIDLPTPSNISANFGSLLGACLILQITTGLFLAMHYSPDAST
Rata M-TNIRKSHPLFKIINHSFIDLPAPSNISSNFGSLLGVCLIVQILTGLFLAIHYTSDTIT
Canguro M-TNLRKTHPLIKIINHSFTVLPAPSNISANFGSLLGACLIIQILTGLFLAIHYTADTLT
Rana MAPTIRKSHPLLKIINGSFIDLPSPANLSANFGSLLGVCLVAQIVTGLFLAIHYTADTSL
Tiburn MAINIRKTHPLLKIINHALVDLPAPSNISLNFGSHLGLCLIIQILTGLFLAIHYTADISI
* :** :**:*:** :: **:*:*:* **** ** **: ** ******:**:.*
Se observan solo las diferencias observadas entre las secuencias que favorecen la
eleccin de un rbol respecto de otros.
G
G
S
S
En el ejemplo, usando un primer sitio informativo se producen tres rboles posibles. Sin embargo
un segundo sitio (GGSS) se refuerza el primer rbol
Alineamiento Mltiple y Filogenia Campus Virtual Andaluz, 2007
Bioinformtica Clsica
M todo de PARSIMONIA
Mtodo
Para ms de 18 OTUs, puede originar demasiados rboles alternativos, por lo que se necesitan otros
criterios (i.e. asumir uno de los rboles encontrados), aunque ello incrementa el tiempo exponencialmente
El nmero de sitios es la longitud del rbol. En este caso se han usado L=5 sitios
Alineamiento Mltiple y Filogenia Campus Virtual Andaluz, 2007
Bioinformtica Clsica
M todo de PARSIMONIA: ejercicio
Mtodo
Humano ------------ATGACCCACCAATCACATGCCTATCATATAGTAAAACCCAGCCCATGA
Orangutn ------------ATGGCCCATCAATCACACGCCTACCACATAGTAAAACCTAGCCCATGA
Tiburn ------------ATGGCTCACCAAGCACATGCATATCATATAGTTGACCCCAGCCCGTGA
Gusano ---------------------ATGTTTCATAATTTTCATATTTTAAGACTTTCAAGGTAT
Levadura ATGAATCTTTCTACTAAATTTCAAGGACATCCTTATCATATTGTAAGTGCGTCACCTTGG
Humano CCCCTAACAGGGGCCCTCTCAGCCCTCCTAATGACCTCCGGCCTAGCCATGTGATTTCAC
Orangutn CCCCTAACAGGAGCTCTCTCAGCCCTCCTAACAACATCTGGCCTAACCATGTGATTCCAC
Tiburn CCATTAACAGGAGCTGTTGCTGCTTTACTAATAACATCAGGCCTAGCCGTCTGATTCCAT
Gusano GCATATAATTTATTTTTTGCCTCAGCCGGAATGTTAAGATCTTTAGTAATATTTTTTAAA
Levadura CCATTTTTCTTATCTGTAGTATTATTCTTTAACTGTTTAGCAGCTACATTATATTTACAT
Humano ------TTCCACTCCATAACGCTCCTCATACTAGGCCTACTAACCAACACACTAACCATA
Orangutn ------TTCCACTCCACAACCCTACTATTAACAGGCCTACTAACCAATGCACTAACCATA
Tiburn ------TTCCACTCCATATACCTTCTTTACTTAGGATTGACTCTACTATTACTAACTATA
Gusano ------TTTGGACTATACGAATTATTTATTTTTACACTATTTTCTGTGTTATTTATTTCT
Levadura GGATACAAACATTCATCAGTATTCTTTGGAATCAGTTTCTTAGGTTTATTAGCAACTATG
Obtenci n de un
Obtencin rbol escalado.
rbol escalado. Ejercicio
Estimar la longitud de las ramas del siguiente rbol:
Resumen