Вы находитесь на странице: 1из 7

- Inferir una filogenia es un proceso de estimacin.

Se hace la mejor estimacin de una historia evolutiva con base en la informacin parcial o incompleta que representan los datos disponibles

MAXIMA PARSIMONIA
EN LA INFERENCIA FILOGENTICA DE SECUENCIAS DE ADN

- Debido a que se pueden postular diferentes escenarios evolutivos con los datos evaluados, es necesario contar con un criterio definido para seleccionar uno o ms rboles preferidos de entre las mltiples hiptesis que se pueden producir
Tree 1 A C A Tree 2 B A Tree 3 B

Francisco X. Gonzlez-Czatl CEAMISH - UAEM

-El definir un criterio ptimo al comparar filogenias alternativas, permite decidir cul es la mejor (o si varias de ellas son igualmente buenas)

@2007Gonzlez-Czatl

Mxima Parsimonia

@2007Gonzlez-Czatl

Mxima Parsimonia

- En un contexto general, el criterio de Parsimonia significa simplicidad o economa - Metodolgicamente, este principio postula la eleccin de la hiptesis ms sencilla entre varias hiptesis concurrentes - Aplicado a la Sistemtica Filogentica el criterio de parsimonia conduce a la eleccin del cladograma o rbol filogentico que explica la filogenia de un grupo con el menor nmero de cambios evolutivos - La primera mencin de la aplicacin del criterio de Parsimonia en filogenia fue realizada por Edwards y Cavalli-Sforza en 1963; el rbol evolutivo preferido debe ser aquel que involucre la cantidad mnima neta de evolucin

- A diferencia de los mtodos de distancias, bajo el criterio de parsimonia (y ML BI) los datos a evaluar corresponden a cada posicin o sitio en la secuencia de nucletidos o aminocidos = DATOS DISCRETOS (vs. datos continuos)
MP, ML, BI Distancias

@2007Gonzlez-Czatl

Mxima Parsimonia

@2007Gonzlez-Czatl

Mxima Parsimonia

- Aunque en muchas ocasiones, el criterio de distancias genera resultados iguales a los de MP, este ltimo mtodo permite identificar que sitios (caracteres) estn contribuyendo a la topologa de la filogenia y a la longitud de las ramas

- La premisa bsica en Parsimonia es que los taxa que comparten una caracterstica (similitud), lo hacen porque heredaron esa caracterstica de un ancestro comn = HOMOLOGA

- Cuando este supuesto no se cumple, esta similitud se explican por eventos como reversin, convergencia o paralelismo, que en conjunto se agrupan bajo el trmino = HOMOPLASIA

@2007Gonzlez-Czatl

Mxima Parsimonia

@2007Gonzlez-Czatl

Mxima Parsimonia

- Para cada sitio, se busca reconstruir la evolucin del mismo en un rbol, con la condicionante de recurrir al menor nmero de cambios 1 2 3 4
Site 1

-Este proceso se repite para otros posibles rboles 1 2 3 4 A A G G T T C C A C A C T G G G T T T T

A A G G

T T C C

A C A C

T G G G

T T T T

Tree 1 1 3 1

Tree 2 2 1

Tree 3 2

@2007Gonzlez-Czatl

Mxima Parsimonia

@2007Gonzlez-Czatl

Mxima Parsimonia

-Como se observa, los sitios 4 y 5 tienen el mismo nmero de pasos para los tres rboles y por los tanto no discriminan entre estas tres alternativas. 1 2 3 4 A A G G T T C C A C A C T G G G T T T T
Tree 1 1 3 1 Tree 2 2 1 Tree 3 2

- Entonces, bajo el criterio de parsimonia se pueden reconocer sitios o caracteres que SI contribuyen a decidir cual sera el rbol ptimo (de menor nmero de pasos), mientras que otros NO son tiles para este fin - Evidentemente, aquellos sitios que no son variables (constantes), como el 5, no son informativos en parsimonia y no se incluyen en un anlisis - De los caracteres variables, aquellos en los que solo una secuencia o taxn es diferente (4), tampoco son informativos porque la variacin en ese sitio siempre puede ser explicada con el mismo nmero de pasos en cualquier rbol - Solo los sitios en donde ms de dos secuencias tienen en mismo estado (1, 2, 3) son considerados filogenticamente informativos 1 2 3 4 1 A A G G 2 T T C C 3 A C A C 4 T G G G 5 T T T T
Mxima Parsimonia 10

@2007Gonzlez-Czatl

Mxima Parsimonia

@2007Gonzlez-Czatl

- Aunque existen distintas variantes de mtodos en Parsimonia, en general pueden ser divididas en dos grupos: -Parsimonia no pesada o sin pesos (unweighted MP) -Se asume que sustituciones de nucletidos o aminocidos ocurren en todas direcciones con la misma (o casi la misma) probabilidad -Parsimonia pesada (weighted MP) -Se asume que algunas sustituciones (e.g. transiciones) ocurren ms frecuentemente que otras (e.g. transversiones), y en consecuencia, resulta razonable asignar diferente peso a los distintos tipos o eventos de sustituciones
@2007Gonzlez-Czatl Mxima Parsimonia 11

- Parsimonia no pesada o sin pesos (unweighted MP) - Dentro de este grupo, el mtodo o algoritmo ms comn es el de Fitch (1971) que asume un paso al cambio entre cualquier estado

- Este algoritmo permite contabilizar el nmero de cambios en un rbol bifurcado o binario con datos de secuencias, en las cuales cualquiera de las cuatro bases (A, C, G, T) puede cambiar hacia cualquier otra

@2007Gonzlez-Czatl

Mxima Parsimonia

12

-Algoritmo de Fitch - Se inicia considerando que cada uno los estados en los nodos terminales corresponde a los nucletidos observados en la secuencia, con una longitud acumulada de cero
W X Y Z G A C C G T G G A T A G C C T C

-Algoritmo de Fitch -En cada nodo interno, los estados ancestrales correspondern a la interseccin de los estados de los nodos descendientes. La longitud acumulada ser la suma de los nodos descendientes -Si la interseccin de los estados de los nodos descendientes esta vaca, entonces el estado del nodo ancestral es la unin de dichos estados. La longitud acumulada ser la suma de los nodos descendientes ms uno (+ 1)

- Para calcular los estados de los nodos internos (1,2,3) se siguen dos reglas simples:

@2007Gonzlez-Czatl

Mxima Parsimonia

13

@2007Gonzlez-Czatl

Mxima Parsimonia

14

-Parsimonia pesada (weighted MP) -Considerando que algunos tipos de sustituciones son ms frecuentes que otros, o que algunos sitios evolucionan ms rpidamente que otros, la asignacin del mismo costo a todos los cambios podra resultar en rboles poco confiables -Por lo tanto, resulta razonable asignar un peso diferencial a los diferentes sitios de la secuencia (carcter) o distintos tipos de sustitucin (estado del carcter) en funcin de su posible aportacin en la inferencia filogentica -En cualquier caso, el objetivo es dar un mayor peso a los cambios que son raros, los cuales son menos probables que sean homoplsicos (particularmente cuando las tazas de cambio son altas) y por lo tanto, ms probables que reflejen la historia filogentica

-Parsimonia pesada (weighted MP) -Pesando el carcter - En genes que codifican para una protena, los nucletidos de los cada una de las posiciones del codn evolucionan a distintas tasas de cambio:

2A
LENTA

1A
TASA EVOLUCIN

3A
RPIDA

2A
MENOR

1A
PESO

3A
MAYOR

@2007Gonzlez-Czatl

Mxima Parsimonia

15

@2007Gonzlez-Czatl

Mxima Parsimonia

16

-Parsimonia pesada (weighted MP) -Pesando el estado del carcter - Considerando que los transiciones por lo general ocurren ms frecuentemente que las trasversiones, resulta conveniente darle mayor peso a estas ltimas - Esto se puede implementar construyendo una matriz de costos de pasos

-Parsimonia pesada (weighted MP) -Pesando el estado del carcter - Los esquemas de pesos pueden implementarse de manera emprica, probando distintas opciones en funcin del modelo evolutivo que mejor se ajuste a los datos de secuencias - Un caso extremo de parsimonia pesada representa la Parsimonia de transversin en donde las transiciones no son consideradas en el anlisis
Pars. Transv. A C G T A 0 1 0 1 C 1 0 1 0 G 0 1 0 1 T 1 0 1 0 A C G T 5:1 A 0 5 1 5 C 5 0 5 1 G 1 5 0 5 T 5 1 5 0 A C G T 10 : 1 A C G T 0 10 1 10 10 0 10 1 1 10 0 10 10 1 10 0
18

@2007Gonzlez-Czatl

Mxima Parsimonia

17

@2007Gonzlez-Czatl

Mxima Parsimonia

-Parsimonia pesada (weighted MP) - En cualquier caso, la estrategia de pesos que se implemente deber estar en funcin del grado de divergencia entre las secuencias que se estn analizando - Cuando los niveles de divergencia son bajos, es posible que, incluso, los mtodos de parsimonia sin pesos funcionen adecuadamente y se pueda obtener la filogenia correcta -Exclusin de informacin como 3as. posiciones o transiciones puede tener implicaciones en la prdida de informacin para recuperar relaciones entre secuencias poco divergentes

-Mtodos de bsqueda de rboles ptimos - Aunque el criterio de Mxima Parsimonia nos permite aceptar como la mejor hiptesis el rbol con el menor nmero de cambios evolutivos, en la prctica, el reto es encontrar ese rbol entre los mltiples rboles posibles que se pueden generar con los datos -Incluso con solo pocas secuencias o taxa, se puede producir un nmero importante de rboles -El nmero de posibles rboles se incrementa de manera factorial con cada nueva secuencia o taxon

@2007Gonzlez-Czatl

Mxima Parsimonia

19

@2007Gonzlez-Czatl

Mxima Parsimonia

20

-Mtodos de bsqueda de rboles ptimos

-Mtodos de bsqueda de rboles ptimos -Nmero de posibles rboles binarios sin raz (Nu) Nu = A (2i-5)
T i =3

(23-5) (24-5) (25-5)... (2T-5) -Nmero de posibles rboles binarios con raz (Nr) Nr = A (2i-3)
T i =2

(22-3) (23-3) (24-3)... (2T-3)

@2007Gonzlez-Czatl

Mxima Parsimonia

21

@2007Gonzlez-Czatl

Mxima Parsimonia

22

-Mtodos de bsqueda de rboles ptimos -Algoritmos exactos -Se garantiza que se encontrar el rbol rboles ptimos, pero puede requerirse una gran cantidad de tiempo de cmputo - Bsqueda exhaustiva - Bsqueda branch and bound -Mtodos heursticos (aproximados) -Se intenta encontrar soluciones ptimas, pero no hay garanta de hallarlas (en este caso el rbol ptimo). No obstante, se reduce el tiempo de anlisis cuando se evalan datos con un gran nmero de taxa - Adicin secuencial (Stepwise addition) - Permutacin de ramas (Branch swapping) - Descomposicin de estrella (Star decomposition)
@2007Gonzlez-Czatl Mxima Parsimonia 23

-Mtodos de bsqueda de rboles ptimos -Bsqueda Exahustiva - Cuando el nmero de secuencias o taxa no es muy grande ( 10), es posible calcular la longitud de todos los posible rboles y determinar cul es el ms parsimonioso - El procedimiento para generar todos los rboles posible sin raz es el siguiente

@2007Gonzlez-Czatl

Mxima Parsimonia

24

-Mtodos de bsqueda de rboles ptimos

-Mtodos de bsqueda de rboles ptimos -Bsqueda Branch and Bound - Este algoritmo opera al evaluar implcitamente todos los rboles posibles, pero evitando rutas, en la bsqueda de rboles, en donde se determina que no conducirn a rboles ptimos - En la prctica solo se evalan aquellos rboles que no exceden un determinado valor, que es establecido como lmite superior - Este lmite superior representa el valor de longitud o probabilidad de cualquiera de los posibles rboles que se pueden generar con las secuencias o taxa analizados -til para evaluar hasta 25 secuencias o taxa

-Bsqueda Exahustiva

@2007Gonzlez-Czatl

Mxima Parsimonia

25

@2007Gonzlez-Czatl

Mxima Parsimonia

26

-Mtodos de bsqueda de rboles ptimos -Bsqueda Branch and Bound - Este mtodo genera los rboles de forma similar a la bsqueda exhaustiva, pero cada vez que se adiciona una nueva secuencia o taxn en una de las ramas del rbol en construccin se calcula el valor del mismo (longitud o probabilidad) - Si este valor no excede el lmite superior establecido, se continua adicionando nuevas secuencias o taxa - Cuando el valor de un rbol incompleto (no incluye todas las secuencias) supera el lmite superior se detiene la bsqueda en esa ruta - Si el valor de un rbol completo es mejor que lmite superior, se convierte en el nuevo lmite de referencia
@2007Gonzlez-Czatl Mxima Parsimonia 27

-Mtodos de bsqueda de rboles ptimos

-Bsqueda Branch and Bound

@2007Gonzlez-Czatl

Mxima Parsimonia

28

-Mtodos de bsqueda de rboles ptimos -Bsquedas aproximadas - En funcin de que cada uno de los mtodos heursticos por si mismos no garantizan encontrar la solucin ptima, varios programas (PAUP y otros) utilizan un sistema de dos fases para realizar bsquedas aproximadas - En una primera etapa, un rbol inicial es generado usando un algoritmo que construye este de adicionando secuencias o taxa de forma secuencial (Stepwise addition) -En una segunda fase, el rbol obtenido es sometido a una serie de rearreglos o permutaciones de ramas (Branch swapping) con los que se intenta mejorar su valor. El proceso continua hasta que ya no es posible encontrar una mejor solucin
@2007Gonzlez-Czatl Mxima Parsimonia 29

-Mtodos de bsqueda de rboles ptimos -Bsquedas aproximadas - En general los bsquedas heursticas son referidas como un proceso de escalada o ascenso a la cima (Hill-climbing). -Dependiendo del sitio en donde se inicie el ascenso se podr llegar o no a la cima ms alta en una zona montaosa - En filogenia, la cima ms alta corresponde al rbol ptimo, es decir el ms parsimonioso el ms probable

@2007Gonzlez-Czatl

Mxima Parsimonia

30

-Mtodos de bsqueda de rboles ptimos -Adicin secuencial (stepwise addition) - Este algoritmo funciona de forma similar al proceso seguido en las bsquedas Exahustiva y de Branch and Bound, pero difiere en que cada vez que se adiciona una nueva secuencia o taxn se calcula el valor de los rboles generados y nicamente se continua con el rbol que en esa fase o paso parece ser la mejor solucin -El inconveniente es que esa ruta que se sigue no necesariamente conduce a la solucin ptima y se puede quedar entrampado en un solucin subptima -El proceso termina cuando se han incorporado todas las secuencias o taxa
@2007Gonzlez-Czatl Mxima Parsimonia 31

-Mtodos de bsqueda de rboles ptimos

- Adicin secuencial

@2007Gonzlez-Czatl

Mxima Parsimonia

32

-Mtodos de bsqueda de rboles ptimos - Adicin secuencial - Con el propsito de encontrar la mejor solucin con este algoritmo, se recomienda repetir el proceso varias veces (rplicas) y que la adicin de secuencias sea al azar - Con esto se trata de iniciar la bsqueda desde distintos puntos en el espacio de rboles posibles, esperando que al menos una de esta rutas conduzca al rbol ptimo

-Mtodos de bsqueda de rboles ptimos - Permutacin de ramas (brach swapping) - Una vez que se ha generado un rbol inicial (mediante la adicin secuencial), se pueden implementar los mtodos de intercambio de ramas, los cuales involucran el corte del rbol en uno o varios segmentos y un reensamble posterior de estos elementos de tal forma que se obtenga un rbol distinto al original - Al realizar estos rearreglos se intenta mejorar el valor del rbol inicial. Si el valor del nuevo rbol no mejora, este se rechaza y se regresa al rbol previo. Si el valor mejora, se guarda el nuevo rbol y se intentan nuevos rearreglos -El proceso se detiene cuando rearreglos adicionales no mejoran el valor del mejor rbol guardado

@2007Gonzlez-Czatl

Mxima Parsimonia

33

@2007Gonzlez-Czatl

Mxima Parsimonia

34

-Mtodos de bsqueda de rboles ptimos - Rearreglos

- Justificaciones y objeciones para Parsimonia - En general los mtodos de parsimonia pueden ser muy eficaces bajo diferentes escenarios evolutivos, sin embargo, se ha demostrado que resultan ms efectivos cuando las tasas de evolucin de los taxa analizados son lentas - No obstante, se ha sealado que bajo ciertos escenarios parsimonia puede ser potencialmente inconsistente, es decir, que puede conducir a una solucin equivocada (filogenia incorrecta) incluso cuando se adicionan ms datos al anlisis - El escenario clsico donde esto podra pasar, se conoce como el fenmeno de atraccin de ramas largas

- Mtodos de permutacin de ramas

+ Rearreglos
@2007Gonzlez-Czatl Mxima Parsimonia 35 @2007Gonzlez-Czatl Mxima Parsimonia 36

- Justificaciones y objeciones para Parsimonia -El fenmeno de atraccin de ramas largas se refiere a situaciones en las que linajes o secuencias con una tasa de cambio muy acelerada aparentemente muestran una relacin muy estrecha, a pesar de que esta no sea necesariamente cierta

- Justificaciones y objeciones para Parsimonia - Para que parsimonia recupere el rbol correcto ((1,2),(3,4)) deben existir ms sitios apoyando la relacin (1,2) / (3,4) que la topologa alternativa (1,4) / (2,3) - Si la rama interna es relativamente ms corta que las ramas terminales, es muy posible entonces que por casualidad (azar) 1 y 4 hallan adquirido el mismo nucletido independientemente - Estas convergencias podran sobrepasar el nmero de sitios que cambian en la rama interna y as favorecer, bajo el enfoque de parsimonia, el rbol incorrecto

@2007Gonzlez-Czatl

Mxima Parsimonia

37

@2007Gonzlez-Czatl

Mxima Parsimonia

38

- Justificaciones y objeciones para Parsimonia - El potencial problema de la ramas largas no es en si la longitud de las ramas, sino que sustituciones idnticas (homoplasias) hayan ocurrido a lo largo de las dos ramas - La probabilidad de encontrar sitios que covarian tiende a reducirse cuando ramas largas se encuentran distantes evolutivamente

- Justificaciones y objeciones para Parsimonia - Una estrategia para reducir el posible efecto de atraccin de ramas largas consiste en la adicin de secuencias que pudieran unirse a estas ramas largas con el fin de romperlas y reducir su longitud

@2007Gonzlez-Czatl

Mxima Parsimonia

39

@2007Gonzlez-Czatl

Mxima Parsimonia

40

Вам также может понравиться