Вы находитесь на странице: 1из 17

Tema 1: Conceptos bsicos de evolucin

molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 1
Biologa Genmica y Evolucin IV -
Inferencia Filogentica y Evoluci n Molecular
Pablo Vinuesa (vinuesa@ccg.unam.mx)
Progama de Ingeniera Genmica, CCG-UNAM, Mxico
http://www.ccg.unam.mx/~vinuesa/index.html
Profesor Asistente: Agustn Avila : aavila@lcg.unam.mx
Tema I: Conceptos b sicos de evolucin molecular y filogentica
1. Breve introduccin histrica del desarrollo de la biologa evolutiva y de
su impacto en la sociedad occidental y en nuestra percepcin del mundo
2. Porqu estudiar filogentica y evolucin molecular?
3.- Tipos de datos usados en filogentica y evoluci n molecular
4.- Protocolo bsico para el anlisis filogentico de secuencias moleculares
5.- Tasas de evolucin y selecci n de marcadores
6.- Qu es un rbol filogentico y tipos de rboles : una visn del bosque
7.- Definici n de homologa y tipos de homolog a
8.- Presentacin de los tipos de mtodos de reconstruccin filogentica
1. Antes de Darwin
Tema I: Breve historia de la biologa evolutiva y filogentica
La filosof a y visin occidental del mundo estubierondominadas durante muchos siglos
por las ideas del gran fil sofo griego Platn (428-348 AC) y su discpulo Aristteles
(348-322 AC).
Uno de los pilares de la filosofa platnica es el concepto de la eidos, la forma o la
idea, una forma transcendenteideal imitada de manera imperfecta por sus encarnaciones
terrenales. En el contexto de esta filosofa esencialistal a variaci n o diversidad
biolgica se interpretaba como imperfeccin accidental. Aristteles desarroll el
concepto platnico de inmutabilidad de las esencias proponiendo el concepto de que las
especies tienen propiedades fijas.
Platn (izda.) y Aristteles (dcha.)
1. Antes de Darwin
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
El jardn del Edn, por Jan Breughel (1568-1625).
Ms tarde los cristianos interpretaron
literalmente el Gnesis, concluyendo que cada
especie fue creada individualmente a imagen
y semejanza del Creador, en la forma en la
que las conocemos hoy. A esta creencia se la
conoce como creacin especial .
En la creencia y filosofa cristiana se asume
que el orden es un estadosuperior al
desorden y que por lo tanto las creaciones
divinas siguen un plan: una gradacin que va
desdeobjetos inanimados y formas
mnimamenteanimadas, progresandoa
traves de plantas e invertebrados hacia
formas cada vez ms elevadas de vida.
Esta scala naturae culmina con el humano, la nica criatura con naturalezadual: fsica
y espiritual.
El cristianismo asume que la escalanatural es permanentee inmutable, ya que la posibilidad
de cambio implicara la existencia de imperfeccin en la creacin original.
Los naturalistas han tratado de detectar , describir y explicar la diversidad biolgica
desdemuchos siglos atrs. Este es el objetivo de la sistemtica.
En 1758 Carl von Linne(Carolus Linnaeus)
formaliz un sistema jer rquico de nomen-
clatura para clasificar a los organismos
(sistema binomial) en su Systema Nat urae
(1735). Esta jerarqua fue concebida indepen-
dientementede la teora evolutiva y preten-
da revelar el orden natural o patrn impl cito
en el plan del Creador.
Tema I: Breve historia de la biologa evolutiva y filogentica
De hecho hasta el S. XVIII el papel d e
las ciencias naturales era catalogar y hacer
manifiesto el plan del Creador para que
pudiramos apreciar su sabidur a infinita.
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 2
Tema I: Breve historia de la biologa evolutiva y filogentica
La interpretacin bblica literal comenz a ser cuestionada y reemplazada
cuando en el S. XVII comenzaron a surgir visines ms materialistas del
mundo natural, notablemente con los Principia Mathematica de Isaac Newton
(1643-1727) que describen las leyes de la gravitacin universal y las leyes del
movimiento, sentandolas bases de la mecnica clsica. Fue el primero en
demostrar que estas leyes del movimientoy gravitaci n aplican igual a la
Tierra como al resto del universo. El poder unificador y predictivo de sus leyes
fuerondecisivas para permitir la culminacin de la Revolucin Cient ficainiciada
en 1543 por Nicolaus Copernicus con su De revolutionibus orbiumcoelestium,
sentando as pilares fundamentales de la ciencia moderna.
Fueron los descubrimientos en astronoma y geologa hechos en los siglos XVIII
y XIX los que sentaron las bases decisivas para el nacimiento de las ideas
evolutivas. Particularmente importante fue el trabajo del gelogo escocs
Charles Lyell (1797-1875), quien expuso el principio del uniformitarismo.
Este se basa en reconocer que los mismos procesos geol gicos reconocidos en
el presente operaban en el pasado, y que por lo tanto las formaciones geolgicas
se pueden explicar por causas observadas en el presente.
Lyell tuvo una gran influencia en el pensamientode Charles Darwin, quien
adopt el uniformitarismo en su pensamiento evolutivo.
En el S. XVIII varios naturalistas y fil sofos franceses sugirieron que las
especies biolgicas haban surgido por causas naturales.
Evolucionistas tempranos como George Louis Buffon(1753) ya se oponan al
sistema linneano y al esencialismoaristotlico en el que se basaba el orden
natural lineano.
Tema I: Breve historia de la biologa evolutiva y filogentica
La hiptesis evolutiva pre-darwiniana ms significativa fue sin duda
la formulada por Chevalier de Lamarck en su Philosophie Zoologique
(1809).
La teora lamarckiana propona que cada especiese originaba por
medio de la generacin espontnea a partir de materia inanimada,
comenzandoas en la base de la cadena del ser. El supona que
dentro de cada especie actuaba un fluidonervioso que la hac a
progresar ascendiendo la cadena.
Asuma que las alteraciones corporales adquiridas durante el lapso de
vida de un individuo se heredaban, sentando las bases del principio
conocido como herencia de caracteres adquiridos.
Charles Darwin, 1854
Charles Robert Darwin (1809-1882) fue un naturalista ingls que
comenz a estudiar medicina y luego la carrera de cl rigo en la Univ.
de Cambridge (UK) antes de embarcarse en un viaje alrededor del
mundo a bordode la H.S.M. Beagle(1831-36), que la marina britnica
enviaba para cartografiar las costas de Sudamrica. El fue invitado
como naturalista y acompaante del Capitn Fitz Roy. Este viaje no
slo cambiara la vida de Darwin, sino que revolucion radicalmente el
pensamiento occidental al presentar evidencia contundentede que las
especies biolgicas han evolucionado a partir de ancestros comunes.
Darwin se convenci de ellodurante el viaje del Beagle. Consciente de
la importancia y repercusiones de su descrubrimiento, pas 20 aos
recopilandoevidencias antes de hacer pblicas sus ideas.
El 1 de Julio de 1858 Charles Darwin propuso su teor a de la
evolucin por medio de la selecci n natural en una reunin de la
Sociedad Lineana de Londres. Su tratado monumental EL origen de
las especies fue publicado un ao despus. El da de su publicaci n
el libro qued agotado.
Su libro no sl o revolucion el pensamiento biolgico, sino tambin
la poltica, sociologa y la filosofa moral de occidente.
Tema I: Breve historia de la biologa evolutiva y filogentica
El punto ms dbil en la teora Darwiniana era su
incapacidad de explicar cmo surgan y cmo se transfer an
los caracteres hereditarios de generaci n en generacin
Darwin escribi una serie de ensayos privados en 1844 y en
1856 comenz un libro que quera titular Natural Selection.
Nuncalo termin ya que en 1858 Darwin (dcha.) recibi un
manuscrito de un joven naturalista, Alfred Russel Wallace
(1823-1913) en el que quedaba claro que haba descubierto
de manera independiente el principio de la selecci n natural.
Esta carta fue la que lo motiv a presentar su famosa
pltica ante la Soc. Linneanade Londres en 1858, basada en
partes de sus ensayos y en la carta enviada por Wallace.
Seguidamentepas a escribir un resumen o abstract de
490 pginas de su manuscrito Natural Selection, el cual fue
publicado en 1859 en Londres bajo el t tulo de:
On the Origin of Species by Means of Natural Selection,
or the Preservation of Favoured Races in the Struggle
for Life
Tema I: Breve historia de la biologa evolutiva y filogentica
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 3
Siete aos despus de la publicaci n del Origen de las Especies (1866), el
monjeagustino austriaco Gregor Mendel describe sus trabajos con cruzas
de arvejas titulado Versucheber Pflanzenhybride, en el que establece la
existencia de caracteres elementales de la herencia y describe leyes
estadsticas que gobiernan su transmisi n de generacin en generaci n.
El no sab a si estos caracteres elementales tenan una base material o
meramenterepresentabaninteracciones vitales
En 1869, Johann Friedrich Miescher, un qumico suizo, descubre una sustan-
cia cida rica en P en clulas espermticas, a la que llam nucle na. Lleg a
especular sobre su posible relacin con la herencia, pero pronto abandon
esta idea absurda.
Darwin, Mendel y Miescher no podan imaginar lo conectados que sus
respectivos descubrimientos estar an 100 aos despus ...
En 1944 Oswald Averydemuestra que el DNA es el material hereditario
(y no las protenas como se pensaba). Incluso llega a especular que los
genes estn hechos de DNA.
http://profiles.nlm.nih.gov/CC/Views/Exhibit/narrative/biographical.html
Avery, Oswald T., Colin M. MacLeod, and Maclyn McCarty.
Studies on the Chemical Nature of the Substance Inducing
Transformation of Pneumococcal Types. J. Exp. Med. 79, 2 ( February 1, 1944): 137-158.
Tema I: Breve historia de la biologa evolutiva y filogentica
Entre1930 y 1950 T. Dobzhansky, G. Simpson, E. Mayr y G. Stebbins fusionan las teoras
propias de las disciplinas de gentica, paleontolog a, zoologa y botnica bajo la luz de la
teora evolutiva en lo que se vino a conocer como la nueva sntesis.
Theodosius
Dobzhansky
George Simpson Ernst Mayr
G. Ledyard
Stebbins
Tema I: Breve historia de la biologa evolutiva y filogentica
En las dcadas de 1930-40 Ronald A. Fisher, JBS Haldane y Sewall
Wright sientanlas bases de la teora de gentica de poblaciones,
desarrollando adems muchos de los ndices estadsticos usados
para estimar la intensidad de fuerzas evolutivas como la deriva,
seleccin, mutacin y migraci n. Nace la S ntesis Evolutiva
o Sntesis Moderna. En esencia clarifica que la mutaci n y selec-
cin natural actan conjuntamente para causar evoluci n adaptativa.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
Algunos creacionistas afirman que el
diluvio universal fue el responsablede la
aparicin de todos los fsiles y formaciones
geol gicas sobre la tierra. Afirman que la
tierra se form en exactamente6 d as
(un 23 de Octubre del 4004 adC, segn
estim el obispo James Ussher, SXVII).
Los gelogos abandonaron esta visin hace
ms de 300 aos. Se trata de cristianos
fundamentalistas que hacen una lectura
literal del Gnesis para explicar la historia
de la vida en el planeta Tierra.
Desafortunadamente, muy poco de estos
avances fundamentales en el desarrollo
modernode la teora evolutiva sali a la luz
pblica en USA entrelos 1940-60 por la
presin que ejercan los creacionistas en
sobrelos editores de libros de texto,
obligndolos a evitar cualquier menci n de
evolucin en libros de biologa. Por miedo a
perder negocio, las editoriales cedieron a
estas presiones.
No fue hasta los 60s que se revirti el
problema. En parte debido al xito de la ciencia
sovitica por el lanzamientodel primer satlite
Sputnik en 1957. Ello cre una oleada de
pnico a travs de sectores de la ciencia
americana, includa la biologa evolutiva. En
1967, la legislaturadel estadode Tennessee
vuelva a permitir la mencin de evolucin.
La cronologa de la creacin y otros eventos importantes
recopilados en la historia bblica de la Tierra,
segn el Arzobispo anglicano de Armagh ( Irlanda), James Ussher
J. Ussher, The Annals of t he World iv (1658)
Fuentes: http://en.wikipedia.org/wiki/Ussher_chronology
http://www.lhup.edu/~dsimanek/ussher.htm
Ussher's history of the Earth:
4004 BC - Creation (23 de Octubre, Domingo)
4004 BC Adamand Eve weredriven from Paradise on Monday 10 November 4004 BC
2348 BC - Noah's Flood ; the ark touched down on Mt Ararat on 5 May 2348 BC (Wed)
1921 BC - God's call to Abraham
1491 BC - The Exodus from Egypt
1012 BC - The foundingof the Temple in Jerusalem
586 BC - Thedestructionof Jerusalemby Babylon
and the beginning of the Babylonian Captivity
4 BC - Thebirth of Jesus
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 4
En 1953 Francis Crick y James Watson publican en Nature su
modelode la estructua en doble hlice del DNA.
Se abre con ello la va para el nacimiento de la evolucin molecular.
Emile Zuckerkandl fue junto con Linus Pauling uno de los pioneros de la disciplina
de la evolucin molecular, al descubrir que las mol culas de DNA y las protenas
que codifican son documentos de la historia evolutiva dada la relativa constancia
con la que acumulan variaciones ( mutaciones). Ambos publican un paper histrico
en 1965 proponiendo formalmentela existencia de un reloj molecular
A finales de los 60s el genetista matemtico Motoo Kimuracombina los
principios tericos de la gentica de poblaciones con los nuevos conoci-
mientos de biologa molecular para desarrollar la teor a neutral de
evolucin molecular (1968), en la que la deriva gentica es la principal
fuerza evolutiva que afecta al cambio en las frecuencias al licas.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
Filogeniay clasificaci n
de la vida tal y como la
propusoErnst von Haeckel
en 1866
Los primeros intentos de reconstrur
la historia filogentica estaban basados
en pocos o ningn criterio objetivo.
Reflejabanlas ideas o hiptesis plausibles
generadas por expertos de grupos
taxonmicos particulares.
La mayor parte de la 1a. mitad
del SXX los sistemticos estaban
ms preocupados por el problema
de definir a las especies biolgicas,
descubrir mecanismos de especiacin
y la variacin geogrfica de las espe-
cies, que en entender su filogenia.
No fue hasta los 40s y 50s que los
esfuerzos de individuos como Walter
Zimmermann y Willi Henning
comenzaron a definir mtodos
objetivos para reconstruir filogenias en
base a caracteres compartidos entre
organismos fsiles y contemporneos.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
En la dcada de los 60s estos mtodos objetivos para estimar filogenias
se refinan y se desarrollancriterios expl citos como el de la taxonoma
numrica (Peter Sneath y Robert R. Sokal, 1963). Desarrollan mtodos
de agrupamiento basados en matrices de distancias como el UPGMA
Robert R. Sokal
Luca Cavalli-Sforza (parado) y Anthony Edwards colaboraron en la dcada
de los 60s en la Universidad de Pavia, Italia, para fundar la disciplina
de filogentica numrica, concibi ndola como un problema de inferencia
estadstica. Introdujeron los mtodos de parsimonia, verosimilitud y de
matrices de distancias para inferir filogenias.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
A la par que se acumulaban nuevas secuencias de protenas y se desarrollaban mtodos es-
tadsticos para inferir filogenias y patrones de evolucin molecular, la biologa molecular
desarrola mtodos cada vez ms eficientes de secuenciacin de protenas y cidos nucl icos
Frederick Sanger desarrolla tcnicas muy eficientes de secuenciacin
de protenas (1955) y DNA (dideoxy chain termination, 1975).
Recibedos premios nobel en qumica.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 5
En los 60s se contaba con unas reducida base de datos de secuencias
de protenas globulares. Margaret Dayhoff fue la primera en comenzar
a construir una base de datos de secuencias y de inferir propiedades
estadsticas del proceso de sustitucin. Describen las matrices PAM.
Adems introduce mtodos computacionales de parsiminoa para calcular
rboles de secuencias de prote nas.
En 1967 Walter Fitch y Emanuel
Margoliash publican una filogenia
de protenas de citocromoC
basada en un mtodo de matrices
de distancias y un algoritmo para
su representaci n en forma de
un rbol filogentico usando
el mtodos de los mnimos cuadrados.
Walter Fitch
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
En 1993 Kary B. Mullis gana el premio Nobel de bioqumica por su
mtodo de amplificaci n enzimtica de DNA ( PCR).
Science, 1985 Dec 20, 230(4732):1350-4.
Los protocolos de PCR disparan la
generaci n de secuencias
y el desarrolo de nuevas metodolo-
gas, tales como la generacin
de fingerprintes genmicos de
diversos tipos, tales como
AFLPs, PCR-RFLPs, RAPDs ...
Nuevos mtodos de secuenciacin
se basan en tecnologa de PCR.
Tema I: Breve historia del desarrollo de la biologa evolutiva y filogentica
Qu estudian la sistemtica y evolucin molecular? : conceptos bsicos
- La sistemtica y evolucin molecular engloban a un conjunto muy amplio de herramientas y
modelos bio-estadsticos que nos permiten estudiar la arqueologa molecular de los
organismos, es decir, el registro evolutivo escrito en el material hereditario (DNA) y en sus
productos (protenas y RNAs estructurales, anatoma etc.), con el fin de poder hacer
inferencias sobre:
1. Las relaciones ancestro-decensdiente(filogenticas) de dominios de prot., genes y organismos.
Las hiptesis filogenticas resultantes son la base para hacer predicciones (inferencias) sobre
propiedades biolgicas de los grupos revelados por la filogenia medianteel mapeo de caracteres
sobrela topologa (hiptesis evolutiva).
2. Estimar la intensidad y papel de las fuerzas evolutivas (seleccin, deriva, migracin,
recombinacin) en el modelaje de la estructura de dominios proticos, genes, poblaciones y
genomas (evolucin molecular).
La sistemtica molecular usa marcadores genticos para hacer inferencias sobre
procesos que acontecen en las poblaciones y para reconstruir su filogenia. As se generan
grandes bases de datos de secuencias de genes especficos para una gran cantidad de
especies y organismos.
Los estudios de evoluci n molecular usan estos sets de datos para evaluar tasas, procesos y
constriccioes en el cambio molecular a lo largo del tiempo. Los resultados de estos estudios
de evolucin molecular a su vez proveen de nuevos criterios para la selecci n ms informada
de marcadores moleculares para estudios filogenticos y de gentica de poblaciones.
- Buena parte de la bioinformtica y genmica es esencialmentebiologa comparada:
predicciones basadas en comparaci n de motivos, secuencias, genomas y estructuras
moleculares
- Los organismos y sus componentes estructurales tienen una historia evolutiva
=> la filogentica yace en el corazn de la biologa comparada
- Comparaciones basadas en filogenias moleculares pueden proporcionar importantes
descubrimientos difciles de hacer mediante otras aproximaciones:
- elucidaci n del rbol (red?) universal
- distincin entre ortlogos, parlogos y xenlogos y descubrimiento de funcionali-
dades diferenciadas entreellos; clasificacin y anotacin de familias (multi)gnicas
- gua de alineamientos mltiples de nt y aa;
- gua para modelajes estructurales de RNAs y protenas
-
Porqu estudiar filogentica y evolucin molecular? : conceptos bsicos
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 6
La relacin entre filogentica y evolucin molecular:
La filogentica tiene por objetivo el trazar l a relacin ancestro descendiente de los
organismos (rbol filogentico) a diferentes niveles taxonmicos, incluyendo el rbol
universal, haciendo una reconstrucci n de esta relacin en base a diversos caracteres
homlogos (adquiridos por descendencia directa), tanto morfol gicos como moleculares
Gracias a la cantidad masiva de secuencias disponibles en las bases de datos (inclu-
yendo centenas de genomas completos !) y la disponibilidad de sofisticados modelos de
evolucin de secuencias y de su implementaci n en programas de cmputo muy eficientes,
las filogenias moleculares son indispensables para examinar todo tipo de cuestiones
evolutivas.
El desarrollo de mtodos de simulaci n de secuencias y rigurosos marcos de filogentica
estadstica, tanto frecuentistas y Bayesianos, permitenhacer contrastes de hiptesis en
un contexto evolutivo!
La evolucin molecular estudia los mecanismos y procesos que han llevado a la formacin
de dichos caracteres, desde el nivel de posiciones de un codn hasta la organizacin y
estructuragenmica y anatmica de un organismo, en un marco de biolog a comparada
en contextos tanto de poblaciones (microevoluci n) como de linajes. Para ellorequire de
la hiptesis evolutiva de relaciones entre entidades revelada por una filogenia
Refs:
Huelsenbeck, J.P., Rannala, B., 1997. Phylogenetic methods come of age: testing hypotheses in an evolutionary context.
Science 276, 227-232.
Huelsenbeck, J.P., Ronquist, F., Nielsen, R., Bollback, J.P., 2001. Bayesian inference of phylogeny and its impact on
evolutionary biology. Science 294, 2310-2314
Porqu estudiar filogentica y evolucin molecular?
Corolario I:
Nothing in biology makes sense except in the light of evolution
- Theodosius Dobzhanski, 1973
(The American Biology Teacher 35:125)
Corolario II:
Nothing in evolutionary biology makes sense except in the light of a phylogeny
- Jeff Palmer, Douglas Soltis, Mark Chase, 2004
( American J. Botany 91: 1437-1445)
El concepto de filogenia y homologa: definiciones bsicas
The streamof heredity makes phylogeny; in a sense, it is phylogeny.
Complete genetic analysis would provide the most priceless data for the
mapping of this stream. G.G. Simpson (1945)
filogenia
macro-escala
micro-escala
Filogenia: historia evolutiva del flujo hereditarioa distintos niveles evolutivos/temporales,
desdela geneaolog a de genes en poblaciones (micro-escala; dominio de la gentica
de poblaciones) hasta el rbol universal (macro-escala)
e
s
p
e
c
i
e
1
e
s
p
e
c
i
e
2
e
s
p
e
c
i
e
3
e
s
p
e
c
i
e
4
e
s
p
e
c
i
e
4
El concepto de filogenia y homologa: definiciones bsicas
El proceso evolutivocon sus eventos de especiacin ha involucradola sucesiva ramificaci n
y algunas anastomosis de los linajes hereditarios. Los organismos actuales son el producto
de esta historia y repesetan la puntas o nodos terminales del rbol de la vida.
El entendimiento completo de una filogenia requieredel conocimiento del patrn u rden
de ramificacin (cladognesis) y longitudes de cada rama (cambios anagenticos dentro
de los linajes a lo largo del tiempo).
Eventos de transferencia horizontal de DNA entre ramas del rbol ( evolucin reticulada)
son el resultado de hibridaciones interespecficas mediadas por diversos mecanismos.
El producto de la hibridacin puederesultar en genomas 100% hbridos (eucariontes) o
slo afectar a determinados loci (mosaicos genmicos de los procariontes).
BGA1
FN13r1RC
BC-P14f1
Blup MR1f1
USDA6T AF169582
USDA110 Kazusa
USDA122
BC.C1
BTA1
BC.P5
BC-C2R1
BC.MAM1
LMG18230T
BC.WK1
BC-MK6f1
TAL760ctg1
B071T
LTMR28cns1
Rhodo palustris
M. huakuii Kazusa
100
88
99
99
70
97
99
89
84
89
62
86
0.02
16
8
2y6
5
28
20y32y33y2755
9
25
3
13
7y10
1
11y27y31
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 7
Homolog a: es la relaci n entre dos caracteres que han descendido, generalmente con
modificaci n, de un ancestro comn. Estrictamente se refierea ancestra
comn inferida.
Analog a: es la relaci n existente entredos caracteres cuando stos, an siendo similares,
han descendido convergentemente a partir de caracteres ancestrales no
relacionados en t rminos geneal gicos.
Cenancestro: del ingl s ( cenancestor), es el ancestro comn ms recientede los taxa bajo
consideraci n.
El concepto de filogenia y homologa: definiciones bsicas El concepto de homologa: definiciones bsicas
Dado que filogenia es el flujo de la herencia, slo los caracteres genticos o heredables
son informativos desde una perspectiva genealgica.
Caracteres y estados de caracter. Los evolucionistas distinguen entrecaracteres, como
por ejemplolos amino cidos, y sus estados de caracter, como pueden ser gly o trp.
La homologa reside en los caracteres, no en sus estados !!!
El reconocimiento de la condicin de homologa entre caracteres. La homolog a no es una
cualidad cuantitativa. Slo hay dos condiciones posibles: ser o no homlogo. No se es ms o
menos homlogo. Es como el embarazo. Se est o no se est en dicho estado.
Por tanto, para cuantificar el parecido entreun par de secuencias homlogas
se dice que presentan globalmente un 70% y 95% de identidad y similitud, respectivamente.
(no existe algo como 95% de homologa).
El concepto de homologa es simplemente una abstraccin sobre la relacin entre
caracteres, sobre su ascendencia comn, relacin que es indispensable determinar
para poder hacer reconstrucciones filogenticas que reflejen la historia del
flujode la herencia.
El concepto de homologa: definiciones bsicas
Subtipos de homologa: ortologa, paraloga y xenologa
Evento de especiacin #1
Evento de duplicaci n #1
ortologa: relacin entresecuencias en la que la divergencia acontece tras un eventode
especiacin. El ancestro comn es el cenancestro. La filogenia recuperada de
estas secuencias refleja la filogenia de las especies.
paraloga: condicin evolutiva en la que la divergencia observada acontece tras un evento de
duplicacin gnica. La mezcla de ortlogos y parlogos en un mismo anlisis
filogentico recupera la filogenia correcta de los genes pero no necesariamente
la de los organismos o taxa.
xenolog a: relaci n entre secuencias dada por un evento de transferencia horizontal entre
linajes. Distorsiona fuertementela filogenia de las especies.

f
l
u
j
o
h
e
r
e
d
i
t
a
r
i
o

a

l
o

l
a
r
g
o

d
e
l

t
i
e
m
p
o
cenancestro
Subtipos de homologa: ortologa, paraloga y xenologa
Evento de especiacin #1
Evento de duplicaci n #1

f
l
u
j
o
h
e
r
e
d
i
t
a
r
i
o

a

l
o

l
a
r
g
o

d
e
l

t
i
e
m
p
o
cenancestro
La naturalezadel subtipo de relacin de homologa entre nodos terminales depende sl o de si
la secuencia cenancestral est localizada en un punto que correspondea un evento de espe-
ciaci n ( Y invertida) o de duplicacin (l nea horizontal).
Cuandosea posible, hay que usar estos subtipos para definir la relacin de homologa
A, B y C corresponden a tres poblaciones ( especies). Existen 2 eventos de especiacin (Sp) y
dos de duplicaci n (Dp). Dos genes cuya sec. cenancestral est en un nodo correspondiente a
una Y invertida son ortlogas. Si dicha sec. correspondea un evento de duplicaci n, son par-
logas. As C2 y C3 son parlogas entre ellas pero orlogas con respecto a B2. Ambas son
parlogas respecto a B1, pero ortlogas respecto a A1.
La flecha roja denota un evento de transferencia horizontal entrelas especies A y B.
El gen AB es xenlogo con respecto a los otros 6 genes.
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 8
Marcadores moleculares usados en filogentica y evoluci n molecular
Polimorfimos de DNA y protenas
I) Marcadores dominantes ( ? secuencias)
- RFLPs
- Fingerprints genmicos (AFLPs, RAPDs, Rep-PCR, SINEs
SSCPs, NSNPs ...)
- Anlisis multilocus de isoenzimas
- etc ...
Los datos moleculares revelan informacin gentica. Slo caracteres con una base gentica
son de inter s en filogentica y evolucin. De ah que los marcadores moleculares son gene-
ralmente los favorecidos para hacer inferencias filogenticas y evolutivas a distintos niveles
taxonmicos.
Los caracteres fenotpicos muchas veces tienen una base gentica menos clara y estn
gobernados por las interacciones de muchos genes con el ambiente. Muchos fenotipos
presentan gran plasticidad, es decir, que un mismo genotipo puede presentar una gradacin
de fenotipos. Esta variaci n fenotpica puede confundir las verdaderas relaciones filo-
genticas y determinacin de parentescos.
El uso de protocolos de PCR permite acceder a todo el mundo biolgico para escrutinios
genticos, incluyendoa las comunidades de microorganismos no cultivables
Los mtodos moleculares permiten una fcil y robusta distincin entrehomologa y analoga
y permiten hacer comparaciones de divergencia evolutiva usando mtricos universales
II) Secuencias moleculares DNA/protena
Secuencias de DNA representan el nivel anatmico ms fino de un organismo
La premisa fundamental en evol. molec. es que en las secuencias de DNA y de sus
productos se encuentra escrita una buena parte de su historia evolutiva.
Objeticos importantes del curso son:
1.- mostrar qu informacin evolutiva es la que se encuentra escrita en las secuencias
de DNA y prot.
2.- proporcionar una base t erica y prctica sobre los mtodos para recuperarla
Marcadores moleculares usados en filogentica y evoluci n molecular
Buena parte de la biologa moderna tiene por objetivo revelar la informacin contenida en
secuencias moleculares.
Protocolo bsico para un anlisis filogentico de
secuencias moleculares
Interpretacin evolutiva y aplicacin de las filogenias
Coleccin de secuencias homlogas
BLAST y FASTA
Alineamiento mltiple de secuencias
Clustal, T-Coffee ...
Estima filogentica
NJ, ME, MP, ML, Bayes ...
Anlisis evolutivo del alineamiento y seleccin del modelo de sustitucin ms ajustado
homogeneidad composiconal, saturac.
seleccin de modelos, ...
Pruebas de confiabilidad de la topologa inferida
proporciones de bootstrap
probabilidad posterior ...
Seleccin de marcadores adecuados para hacer inferencias evolutivas
a distintos niveles de profundidad filogentica
Restricciones funcionales vs. tasas de sustitucin:
Existe gran variabilidad en la tasa de sustitucin entre genes y dominios gnicos:
- intrones vs. exones
- regiones codificadoras vs. regiones intergnicas o pseudogenes
- residuos catalticos vs. no catalticos, dominios estructurales vs. no estructurales
- 3as. posiciones vs. 1as y 2as en codones de secuencias codificadoras,
- asas vs. orquillas en rRNAs y tRNAs ...
Tasas de evolucin y la teora neutral de evolucin molecular:
el reloj molecular, calibracin y dataci n de eventos de especiaci n/extincin de linajes y
de pandemias ...
Existen genes de evolucin muy rpida o muy lenta:
-fibrinopptidos evolucionan una tasa x900 > a la de ubiquitina y x20 > citocromo C
-genes de HIV evolucionan a x10
6
veces la tasa de un gen humano promedio!
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 9
Distintas protenas presenta diferentes tasas de sustitucin. As los fibrinopptidos presen-
tan relativamentepocas constricciones, presentando una elevadatasa de sustitucin neutral.
Citocromo C, en cambio, presenta mayores constricciones evolutivas y presenta una tasa de
sustitucin menor. La hiptesis del reloj molecular dice que esta tasa, para ciertas protenas,
es constante en dis tintos linajes.
(de Hartl y Clark, 1997. Principles of Population Genetics, Sinauer)
tasas de evolucin de tres protenas
en sustituciones/sitio/MY
Mira retrospectiva en el tiempo
fibrinopptidos: 50- 200 MY
hemoglobinas: 200- 800 MY
citocromo C: 400-1300 MY
1as rocas
Sedimentarias
enriquecidas en
1 2
C
Issua (Groenlandia)
3.8 Byr (5 am)
1os microf siles
Warrawoona,
Australia
3.4 Myr (7 am)
1os estromatolitos
Cianobacterias
Fotosntesis oxignica
Warrawoona,
Australia
2.8-3 Byr (9 am)
1os eucariontes
Formaciones de
Fe bandeado
Guntflint , Ontario
Canada
2. 0. Byr (2 pm)
Ediacara,
Explosin cmbrica
Fsiles de varios
Phyla animales
0.75. Byr (8 pm)
Extinci n
dinosaurios
65 Myr
(20 min)
4.6 4.0 3.0 2.0 1.0 0.0 1x10
9
aos
(Byr)
atmsfera reductora
atmsfera oxidante
Hadsico Arqueozico Proterozico Fanerozico
Historia de la tierra y de la vida
Evolucin precelular
(agragados supramacromoleculares)
20 %
0%
(% O
2
atmosfrico)
Evolucin orgnica en tiempo evolutivo
- La dimensi n temporal
Vida exclusivamente procaritica por al menos 1.5 Byr!
Homo erectus
(Kenya)
1.6 Myr (29.5 seg)
H. sapiens
(Dali Fosil, China)
209 kya; 3.9 segundos
h
t
t
p
:
/
/
e
n
.w
i
k
i
p
e
d
i
a
.o
r
g
/
w
ik
i
/
L
i
s
t
_
o
f
_
h
u
m
a
n
_
e
v
o
l
u
t
i
o
n
_
f
o
s
s
i
l
s
0
0
0
Precmbrico (reduccin progresiva de temperatura, de 70 20C)
Biologa
clsica
- Elucidacin del rbol universal, sistemtica bacteriana y la identificacin/clasificacin
de microorganismos ambientales (cultivables y NO CULTIVABLES > 90-99%)
rrs: un marcador lento
Bacteria: peptidoglicano; lpidos de membrana son steres de glicerol ;
RNA pol . 4 subunidades; formilmetionina como aa de inicio ...
Archaea: pseudo peptidoglicano; lpidos de membrana son teres de glicerol ;
RNA pol . =8 subunidades; metionina como aa de inicio ...
Procariontes: carecen de ncleo y org nulos
Eucariontes: clulas ncleadas y con orgnulos
Aplicaciones y predicciones filogenticas (I)
Actinobacteria
Cyanobacteria
Caenoharbditis
Drosophila
Danio
Gallus
Homo
Ratus
Firmicutes
Proteobacteria

Genomic Tree of life


(ML JTT+G, 100 boot)
based on 31 orthologs
from 191 species
with sequenced
genomes
Ciccarelli et al. 2006 Science311:1283-87 Toward automatic reconstructionof a
highly resolved tree of life
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 10
64.8
73.3
54.6
55.7
39.1
39.1
El estudio de Gaucher et al. se basa en la
resurreccin de protenas EF-Tu de nodos
sucesivamente ms profundos en la filogenia
universal, hasta llegar a LUCA
EF-Tu es el factor de elongacin no-termo-
estable, de distribucin universal, y que pre-
senta una correlacin muy fuerte (0.91) entre
su temp. de desnat. y la temp. Ambiental a la
que viven los organismos de los que se han ais-
lado
Las protenas resurrectas de los nodos ms
profundos presentan temps. de desnat. muy
superiores a los de nodos ms recientes.
Esta evidencia molecular correlaciona muy bien con la evidencia geoqumica derivada del
anlisis de relaciones de is topos de
18
O y
30
Si de rocas sedimentarias del Precmbrico
(3,800-542 millones de aos atrs) que sugieren un enfriamiento progresivo de unos 70C
hace 3,5 Billones de aos a tan s lo 20C hace 800 Millones de aos.
Scans de Dicrosmo circular representativos de
Protenas EF-Tu actuales y ancestrales, correspondientes
a protenas mesfilas (a,c) e hipertermfilas (b,d).
a) E. coli; b) Thermus; c,d) protenas ancestrales tempranas y derivadas
Eric Gaucher et al. 2008
Filogenia universal
basada en secuencias rrs
(Woese et al., 1991)
La TGH y la filogenia universal
problemas y limitaciones evidenciadas desde la perspectiva genmica
Problemas e incgnitas de las filogenias profundas:
Cuantos ortlogos son realmente universales?
Distincin entre ortlogos, parlogos y xenlogos
Cuanta seal filogentica queda en las secuencias?
Alineamientos confiables?
Mtodos de reconstruccin y artefactos
Congruencia de seales filogenticas provinientes
de distintos genes
Existi realment un slo ancestro?
... una larga lista
Filogenia genmica rbol o red?
Doolittle, 1999
m
itocond
rias
cloroplastos
Doolittle, 1999
El origen evolutivo de los organelos:
un caso clsico de TGH
Se comparan las estructuras genmicas de
tres cepas de Escherichia coli
E. coli uropathognica CFT073
E. coli enterohemorrgica EDL933
E. coli comensal K12
TGH y demarcaci n de especies bacterianas
- una perspectiva de genmica comparada
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 11
Slo el 39.2% del set
no redundante de protenas
de las tres cepas es compartido
entre ellas !!!
tomadode Welch et al. 2002
Islands and evidences for their horizontal transfer
-85% (52 out of 61) of island codons have a significantly different codon usage vs. backbone
-EDL andCFTshare onl y 10% of island genes,
but >98% identity among backbone encoded proteins in the 3-strain comparison
-CFT and EDL strains conatin 60 and 57 islands >4 kb, most of them at thesame relative
positions withrespec to backbone markers, althoughisland contents are unrelated
- 12 CFT073 and 10 EDL933 islands are closely associated to t RNAgenes
tomadode Welch et al. 2002
Corolario:
A la luz de estos resultados queda evidenciado que ha de ejercerse un gran
cuidado a la hora de seleccionar genes para la reconstruccin de filogenias de
especies bacterias.
Loci sintnicos
ortlogos:
filogenia de especies
gentica de poblaciones
Loci accesorios:
especializaci n ecolgica
frecuentemente cepa-espec ficos
0. 1
B. canariense BC-C2(CanaryIs.)
B. canariense BRE-4 (Canary Is.)
B. canariense BC-MAM1 (Morocco)
B. canariense BC-MAM5 (Morocco), ISLU16 (Spain)
B. canariense BC-MAM2, BC-MAM6 (Morocco)
1.00/100
B. canariense BC-MAM9 (Morocco)
B. canariense BC- MAM12 (Morocco)
1.00/97
B. canariense BC-P22 (Canary Is.)
0.99/100
1.00/78
B. canariense BC- MAM8 (Morocco)
B. canariense BES-1 (Canary Is.)
B. canariense BES-2 (Canary Is.), BC-MAM11 (Morocco) 1.00/100
1.00/100
B. japonicum X6-9 (China)
B. japonicum DSMZ30131
T
(Japan)
1.00/100
B. japonicum FN13 (Mexico)
B. japonicum BGA-1 (Canary Is.)
B. japonicum BC-P14 (Canary Is.)
B. japonicum X3-1 (China)
B. japonicum Blup-MR1 (Germany)
1.00/95
B. japonicum USDA110 (USA)
B. japonicum USDA122 (USA), Nep1 (Nepal) 1.00/99
1.00/98
0.99/78
Bradyrhizobium genosp . a BC-C1 (Canary Is.)

Bradyrhizobium genosp . a CIAT3101 (Colombia)

0.99/94
1.00/84
B. liaoningense Spr3-7 (China)
B. liaoningense LMG18230
T
(China)
1.00
/100
0.98
Bradyrhizobium genosp . BC-P6 (Canary Is.)
Bradyrhizobium genosp . BRE-1 (Canary Is.)
0.93/86
Bradyrhizobium genosp . BC-MK6 (Morocco)
1.00/100
B. yuanmingense B070
T
(China)
B. yuanmingense LMTR28 (Peru)
1.00/93
B. yuanmingense TAL760 (Mexico)
1.00
/100
1.00/100
B. elkanii USDA46 (USA)
B. elkanii USDA76
T
(USA)
1.00/100
B. elkanii USDA94 (USA)
1.00/100
0.99/91
Bradyrhizobium sp. BTAi1 (USA)
Bradyrhizobium sp. IRBG231 (Philippines)

Bradyrhizobium sp. IRBG127 (Philippines)

1.00/100
1.00/100
S. meliloti 1021

Rho. palustris Pal-1

*
*
substitutionsper site
II
III,
IV
V,
VI (B. yuanmingense)
VII (B. elkanii)
VIII (photosynthetic)
I
A. Filogenia Bayesiana de especies de
Bradyrhizobium basada en ortlogos
glnII+recAcongruentes
B
.

j
a
p
o
n
i
c
u
m
B
.

c
a
n
a
r
i
e
n
s
e
Inferencias basadas en xenlogos tampoco
recuperan la filogenia de especies
V
in
u
e
s
a
e
t

a
l
.
(
2
0
0
5
)
.
M
o
l
.
P
h
y
lo
g
e
n
e
t
.

E
v
o
l
.
3
4
:
2
9
-
5
4
B. nodC ML phylogeny (GTR+G)
Al comparar figs. A y B se comprueba
que el locus simbitico nodC ha
sufrido TGH
b
v
.

g
e
n
i
s
t
e
a
r
u
m
B. japonicum USDA142
B. japonicum USDA136
B. japonicum USDA122
B. japonicum USDA110
B. japonicum DSMZ30131
B. japonicum USDA6T
B. elkanii USDA61 D28964.1
B. elkanii USDA94 D28965.1
B. elkanii USDA46 D28963.1
B. canariense BTA1T AJ560653.1
B. canariense BCO 1 AJ560656.1
B. japonicum WM9 AF222753
B. japonicum ISLU256 AJ560651.1
B. japonicum ISLU207 AJ560652.1
B. canariense BLUH1 AJ560655.1
S. meliloti 1021 E006469
R. leguminosarum bv. viciae USDA2478 D28960.1
R. leguminosarum bv. trifolii USDA2161 D28959.1
R. leguminosarum bv. trifolii AF217271.1
0.1 substitutions/site
100
100
97
99
100 100
100
100
100
79
b
v
.

g
l
y
c
i
n
e
a
r
u
m
B. j aponicum
Vinuesa et al. (2005).
IJSEM 55:569-575
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 12
El pangenoma microbiano: pangenomas abiertos y cerrados
Estima de tamaos del genoma
ncleo (core) y pangenoma de
Rhizobiaceae simbiticos
(Vinuesa y Contreras-Moreira,
2007, unpubl.)
Aplicaciones y predicciones filogenticas (II):
Evidencia molecular de transmisi n de HIV-1 en un caso criminal usandogenes de evol. r pida
Un gastroenterlogo fue acusadodel intento
de asesinato en 2 gradode su novia mediante
inyeccin de sangrecontaminada con HIV-1.
Este estudio representa el primer caso en el que
reconstrucciones filogenticas de secuencias
(paciente P, vctima V y controles LA de
portadores en la poblacin) fueron admitidas en
una corte criminal en EUA.
Las filogenias de RT y de env mostraron que las
secuencias de la V compartan ancestra directa en
forma de paraloga con las de una P del
gastroenterlogo.
Anlisis de posiciones de codones de la RT
de la V revelaron genotipos consistentes con
mutaciones que confieren AZTR, similares a
las presentadas en la P.
El establecimiento a priori de la P y V como
posiblepar de transmisin del HIV-1
represent una clara hiptesis para ser
evaluada en marcos de estadstica
filogentica.
Filogenias del gen RT basadas en secuencias de
la V, la P y LA, obtenidas por dos labs. independientes.
a) Baylor College of Medicine, Houston, TX (BMC)
b) Dpt. Ecology and Evol. Biol., Univ. Michigan (MIC)
Ref: Metzker et al. 2002.
PNAS 99:14292-142976
Arboles filogenticos: una introduccin al bosque
(I) terminologa y conceptos bsicos: anatoma de un rbol
Definicin: Un rbol filogentico es una estructura matemtica usada para representar la historia
evolutiva (relaciones de ancestro-descendiente) entreun grupo de secuencias o organismos.
Dichopatrn de relaciones histricas es la estima hecha de la filogenia o rbol evolutivo.
reconstruccin de caracteres ancestrales
longitud de ramas
soportede, o confianza en biparticiones
Humano
Chimpanc
Gorila
Orangutan
rbol no enraizado, sin direccionalidad
A B C D E
split ( biparticin)
(ABC|DE = ***--)
nodo terminal,
hoja u OTU, grado 1
nodo interno,
vrtice, grado 3
nodo raz,
grado 2
rama
Anatoma bsica de un rbol
rbol enraizado, con direccionalidad, que
indica relaciones ancestro-descendiente
(((humano, chimp),gorila), orang)
t
i
e
m
p
o
Arboles filogenticos: una introduccin al bosque
(II) enraizamiento de rboles
La mayora de los m todos de reconstruccin estiman
rboles no enraizados, por lo que no disciernen entre
las 5 posibles topologas enraizadas generables a partir
de 4 OTUs.
Para enraizar un rbol (decidir cual topologa es la
que refleja el proceso evolutivo), necesitamos infor-
macin biolgica adicional
Tres mtodos usados para el enraizado de
rboles:
a) grupo externo - (invertebado) a grupo
interno (vertebrados)
b) punto medio se pone la raz en el punto
intermedio del camino ms largo del rbol
c) duplicacin gnica enraizamos en el nodo
que separa a las copias parlogas
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 13
Arboles filogenticos: una introduccin al bosque
(III) terminologa y conceptos bsicos
A
B
C
D
E
Los rboles son como mviles: las ramas pueden rotarse sobre s mismas sin afectar
a las relaciones entre los OTUs; ((((A,B),C),D),E) se puederepresentar como:
C
A
B
D
E
=
E
C
A
B
D
=
Los rboles presentan distintos grados de resoluci n ( rboles consenso)
politom as
topologa estrella topologa parcialmente
resuelta
topologa totalmente
resuelta
Arboles filogenticos: una introduccin al bosque
(IV) terminologa y conceptos bsicos: tipos de politomas
Existen distintos tipos de politomas
politom a dura
divergenciasimultnea
politom a blanda
(incertidumbre)
?

...
Arboles filogenticos: una introduccin al bosque
(V) terminologa y conceptos bsicos: tipos de rboles
Un cladograma: slo indica las relaciones
de ancestr a enter OTUs
R. galegae
R. huautlense
S. meliloti
M. plurifarium
B. japonicum
s
i
n

s
i
g
n
i
f
i
c
a
d
o
sin significado
Una topologa aditiva contiene la informa-
ci n sobre longitudes de ramas, que refleja
l a distancia gentica entre OTUs. As entre
R. galegae y R. huautlensela distancia esti-
mada es de: 0.05 + 0.06 = 0.11
R. galegae
R. huautlense
S. meliloti
M. plurifarium
B. japonicum
0.05
0.06
0.07
0.09
0.10
0.02
0.01
0.02
0.02 Sust./ sitio s
i
n

s
i
g
n
i
f
i
c
a
d
o
divergenciagentica
Una topologa ultramtrica, dendrograma o
rbol linearizado, representa un tipo espe-
cial de rbol aditivo en el que los nodos ter-
minales son todos equidistantes de la raz.
Este tipo de rbol se emplea para represen-
tar el tiempo evolutivo, expresadobien como
aos o cantidad de divergencia medida por
un reloj molecular
R. galegae
R. huautlense
S. meliloti
M. plurifarium
B. japonicum
0.00 0.02 0.04 0.06 0.08 0.10
0 100 200 300 400 My
Sust./
sitio/My
s
i
n

s
i
g
n
i
f
i
c
a
d
o
tiempo
plesiomorf a: caract. ancestral; estado plesiomrfico o ancestral
apomorf a : caracter derivado; estado apomrfico
Arboles filogenticos: una introduccin al bosque
(VI) terminologa y conceptos bsicos
Terminologa relacionada con la reconstruccin de la historia de cambios en
estados de caracter
autapomorf a
sinapomorf a
carcer derivado
nico (aut)
carcer derivado
compartido(syn)
homoplasia
carcer compartido no
homlogo, es decir, no
heredadodirectamente
del ancestro
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 14
evolucin
paralela
Arboles filogenticos: una introduccin al bosque
(VII) terminologa y conceptos bsicos
Tipos de homoplasia
Evolucin independientedel
mismo estado de caracter a
partir de la misma condicin
ancestral
evolucin
convergente
Evolucin independientedel
mismo estado de caracter a
partir de una condicin
ancestral diferente
prdida
secundaria
Reversin a la condicin
ancestral
Arboles filogenticos: una introduccin al bosque
(VIII) terminologa y conceptos bsicos
Filogenia y clasificacin de organismos: monofilia, parafilia y polifilia
grupos monofil ticos
o clados
grupos no
monofil ticos
a
v
e
s
c
o
c
o
d
r
ilo
s
la
g
a
r
t
o
s
t
o
r
t
u
g
a
s
Parafilia
reptiles
Grupos parafilticos agrupan
a organismos que comparten
caracteres primitivos (plesio-
mrficos), excluyendo a otros
del mismo linajeque presentan
caracteres derivados ( autapo-
mrficos)
b
u
it
r
e
s
n
u
e
v
o
m
u
n
d
o
c
ig

a
s
a
v
e
s
d
e

p
r
e
s
a
b
u
it
r
e
s
v
ie
j
o
m
u
n
d
o
Polifilia
buitres
Grupos polifilticos agrupan
a organismos que comparten
caracteres convergentes
(homoplsicos) pertenecientes
a distintos linajes
Arboles de genes vs. rboles de especies -
el problema de la definici n de relaciones de homolog a
Relaciones de homologa entre genes:
Xenologa la homologa se debe a un evento de transferencia lateral desde otro
linaje
Ortologa genes presentes en distintos taxa que comparten un ancestro comn no duplicado,
y que han sido heredados verticalmente
Paraloga genes presentes en distintos taxa o en un mismo genoma resultantes de al menos
una duplicacin gnica y no de un proceso de especiacin
La filogenia de especies puede ser inferida
errneamente cuando se reconstruye en base
a secuencias parlogas y no se muestrean todas
las copias (p. ej. si muestreamos slo las copias
1, 3 y 5) eq ((fugu,human), mouse) !!!
Ms compleja an es la estima de la filogenia de
especies si ha habido prdida diferencial de
parlogos en los dintos linajes a comparar
Por tanto la inferencia de una filogenia de especies
se realizar preferentemente usando genes de copia
nica, lo que hace ms probable la condicin de
ortologa
Homolog a entre genes: la evolucin de lisozimas, un ejemplo cl sico de evolucin paralela
Todas las lisozimas son homlogas al tener un ancestro comn
Las copias en el langur y la vaca son ortlogas al descender
de la misma copia (alelo) ancestral de lisozima
La historia evolutiva (filogenia) de las lisozimas convencio-
nales y las que ligan Ca
2+
se remonta a distintas copias de la
lisozima ancestral, y por tanto son familias parlogas
La funcionalidad de las lisozimas que ligan Ca
2+
del caballo y
de la paloma es homloga dado que la funcionalidad ancestral
de estas protenas era ligar Ca
2+
Dado que las funciones digestiva de lisozimas en rumiantes
vs. el ave hoatzin han surgido independientemente en cada
uno de estos grupos, esta funcionalidad no es homloga,
tratndose de un evento de evolucin paralela convergente
Al hablar de homologa debemos distinguir adems entre homologa entre genes,
secuencias y funciones
Arboles de genes vs. rboles de especies -
el problema de la definici n de relaciones de homolog a
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 15
Inferencia Filogentica
introducci n
La inferencia de relaciones filogenticas a partir de secs. moleculares requiere de la
seleccin de uno de los muchos mtodos disponibles
Objetivos fundamentales de este curso son:
1. desarrollar un marco conceptual para entender los fundamentos tericos que
distinguena los distintos mtodos de inferencia (clasificacin de mtodos)
2. presentar el uso de modelos y suposiciones en filogentica
3. manejo emprico de diversos paquetes de software para inferencia filogentica bajo
diversos criterios
Con frecuencia la inferencia filogentica es considerada como una caja negra en la que
entran las secuencias y salen los rboles
R. galegae
R. huautlense
S. meliloti
M. plurifarium
B. japonicum
0.05
0.06
0.07
0.09
0.10
0.02
0.01
0.02
0.02 Sust./ sitio
?
Mtodos de reconstrucci n filogentica
introducci n
La inferencia de una filogenia es un proceso de estimacin; se trata de obtener la mejor
estima posible de una historia evolutiva basada en la informaci n incompleta y con frecuen-
cia ruidosa contenida en los datos. Estos, por lo general, son molculas y especies contem-
porneas
Los mtodos de inferencia filogentica estn diseados para este fin siguiendo una de dos
estrategias computacionales:
1. mediante la definici n de un algoritmo que determina los pasos a seguir para l a
reconstruccin de la topolog a
2. mediante la definicin de un criterio de optimizacin mediante el cual poder
decidir cual(es) topologa(s) son las mejores (o igualmentefavorecidas)
En principio, ser a posiblepostular escenarios evolutivos ad hoc mediante los cuales
cualquier filogenia tomada al azar podra haber producido los datos observados;
es esencial por ello contar con un criterio estadsticamente y biolgicamenteriguroso
para la seleccin de una o ms topologas de entretodas las posibles
Los mtodos algortmicos tratan a los datos de diferente manera que los basados en
criterios de optimizaci n: anlisis de distancias vs. caracteres discretos
Mtodos de reconstrucci n filogentica:
algoritmos vs. criterios de optimizaci n
Los mtodos algortmicos combinan la inferencia del rbol y la definicin del mejor rbol
en una misma operacin. Son por ello muy rpidos
Aquellos basados en criterios de optimizaci n (CO) tienen en cambio dos pasos lgicos.
1. definir el criterio de optimizaci n (descrito formalmenteen una funcin objetiva)
para evaluar cada posibletopolog a, asignndole una puntuacin con la que poder
comparar cuantitativamenteel mrito de cada rbol en base al criterio de opti-
mizacin
2. en un segundo paso se usan algoritmos de bsqueda especficos para calcular el
valor de la funcin de objetividad y para encontrar el/los rbol(es) con la mejor
puntuacin acordea estecriterio (un valor mximo o mnimo, segn el caso)
Los mtodos basados en CO desacoplan por lo tanto los supuestos evolutivos hechos en el
primer paso de las t cnicas computacionales del segundo. El precio de esta claridad lgica
es que estos mtodos son muchsimo ms lentos que los algortmicos, debido a que tienen
que hacer bsquedas en el inmenso espaciode topologas para encontrar la(s) mejor(es)
topolog as
Inferencia filogentica molecular
clasificacn de mtodos
Podemos clasificar a los mtodos de reconstruccin filogentica en base al tipo d e
datos que emplean(caracteres discretos vs. distancias) y si usan un mtodo algortmico
o un mtodo de bsqueda basado en un criterio de optimizacin para encontrar
la topologa ptima bajo el criterio seleccionado
UPGMA
y
Neighbor
joining
Mnimos
cuadrados
y
Evolucin
mnima
Mxima
parsimonia
y
Mxima
verosimilitud
Tipo de datos
distancias
caracteres
discretos
M

t
o
d
o
d
e

r
e
c
o
n
s
t
r
u
c
c
i

n
c
r
i
t
e
r
i
o
d
e

o
p
t
i
m
i
z
a
c
i

n
a
l
g
o
r
i
t
m
o
d
e
a
g
r
u
p
a
m
i
e
n
t
o
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 16
Mtodos de reconstruccin filogentica una clasificaci n
I.- Tipos de datos: distancias vs. caracteres discretos
Los mtodos de distanciaprimero convierten los alineamientos de secuencias en una
matriz de distancias genticas en base al modelo evolutivo seleccionado, la cual es usada
por el mtodo algortmico de reconstruccin para recuperar el rbol (UPGMA y NJ)
Los mtodos discretos (MP, ML, Bayesianos) consideran cada sitio del alineamiento
(o una funcin probabilstica para cada sitio) directamente
Un set de 4 secs. y la matriz de distancias
correspondiente
Un rbol de parsimonia y uno de distancias
para este set de datos produce topolo-
gas y longitudes de ramas idnticas
La diferencia radica en que el rbol de
parsimoniaidentifica qu sitio del alinea-
miento contribuye cada paso mutacional en
la longitud de cada rama
Mtodos de reconstruccin filogentica una clasificaci n
II. Mtodos algortmicos vs. criterios de optimizacin
Los mtodos algortmicos o de agrupamiento (clustering) siguen una serie dada de pasos
o reglas computacionales previamentedefinidas ( algoritmo) para reconstruir el rbol.
Los mtodos ms usados son el UPGMA y NJ, basados todos en una matriz de distancias
Estos mtodos son muy rpidos, pero sensibles a parmetros tales como el orden en que se
van aadiendo OTUs al rbol creciente
Al no seguir un criterio de optimizacin, no se puede evaluar la bondad relativa de ajuste
de topologas alternas a un set de datos particular
Mtodos de reconstruccin filogentica una clasificaci n
II. Mtodos algortmicos vs. criterios de optimizacin
Los mtodos de reconstrucci n de MP y ML utilizan diferentes criterios de optimizacin
para seleccionar el/los rbol(es) entre las topologas que han de evaluar
A cada topologa se le asigna una puntuacin (score) que es funci n del ajuste existente
entre la topologa y los datos
Los mtodos de optimizacin tienen la gran ventaja de requerir una funcin probabilstica
explcita que relaciona los datos con la topologa (p. ej. un modelo de sustituci n). Ello
permite evaluar la calidad de cualquier rbol (topologa), permitiendo el uso de distintas
tcnicas estadsticas para evaluar la significancia con la que las distintas hiptesis
evolutivas (topolog as) en competici n se ajustan a los datos!!!
La gran limitacin de los mtodos de optimizacin radica en que son computacionalmente
muy costosos, requiriendo por lo general implementaciones heursticas del algoritmo
Criterios de optimizacin: reglas para decidir entre pares de topologas cual es mejor
(dados los datos)
Ejemplos de mtodos de bsqueda de rboles por criterio de optimizacin son:
SCORE
- MP: mxima parsimonia(menor es mejor)
- ML: mxima verosimilitud (mayor es mejor)
- ME: evolucin mnima (menor es mejor)
- LS: cuadrados mnimos (menor es mejor)
III.- Criterios de optimizacin y el problema del nmero astronmico de topologas
El nmero de topologas posibles incrementa exponencialmente con cada nuevo taxon
o secuencia (S ) que se aade al anlisis
No. de rboles no enraizados
= (2s-5)!/2
s-3
(s-3)
No. de rboles enraizados
= (2s-3)!/2
s-2
(s-2)
Taxa rboles no enraiz. rb. Enraiz.
4 3 15
8 10,395 135,135
10 2,027,025 34,459,425
22 3x10
23
...
50 3x10
74
* ...
* Esto son aprox. 10,000 x el no. de tomos en el universo!!!
Mtodos de inferencia filogentica: en busca de la topologa ptima
Por tanto se requieren de estrategias heursticas de bsqueda rboles cuando n > ~12
para poder implementar mtodos basados en criterios de optimizacin
Tema 1: Conceptos bsicos de evolucin
molecular y filogentica
Genmica Evolutiva I, Licenciatura de Ciencias
Genmicas - UNAM, Mxico. Semestre 2009-1
Pablo Vinuesa 2008, vinuesa@ccg.unam.mx;
http://www.ccg.unam.mx/~vinuesa/index.html 17
El mtodo de parsimonia (Pars) considera cada sitio filogenticamente informativo
(Pi) el alineamiento (al menos 2 pares de secuencias que compartan un polimorfismo).
Los sitios constantes (C) y los singletones (S) no son considerados.
IV. Parsimonia: dados dos rboles, se prefiere el que requiere menos
cambios en estados de caracter
reconstrucciones
para el sitio 2
Pi C S
Pi= Pars. inform.
C= Constant
S= Singleton
Clases de sitios:
2
k
L = S l
i
i=1
El supuesto terico (modelo de evolucin) impl cito al mtodo es que el rbol ms verosmil
es aquel que requiere el mnimo nmero de sustituciones para explicar los datos (alinea-
Miento). El criterio de optimizaci n de la Pars es el de cambio o evoluci n m nima.
Para cada sitio del alineamiento el objetivo es reconstruir su evolucin bajo la constriccin
de invocar el nmero mnimo de pasos evolutivos. El nmero total de cambios evolutivos
sobre un rbol (longitud en pasos evolutivos del rbol) es simplemente la suma de cambios de
estados de caracter (p. ej. sustituciones) en cada sitio Pi de la matriz o alineamiento
Criterios de optimizaci n
El mtodo de mxima verosimilitud (ML) considera cada sitio variable del alineamiento
(includos singletones). Bajo el criterio de ML se busca la topologa que hace ms verosmil
el patrn de sustituciones de un alineamiento dado un modelo evolutivo explcito!
As, para un set de datos D y una hiptesis evolutiva (topologa) H, la verosimilitud de dichos
datos viene dado por la expresin:
L
D
=Pr(D|H) que es la probabilidad de obtener D dada H (una probabilidad condicional) !
Por tanto la topologa que hace nuestros datos el resultado evolutivo ms probable corresponde
a la estima de mxima verosimilitud de la filogenia (likelihood score valor de verosimilitud).
Criterios de optimizaci n
V. Mxima verosimilitud: dadas dos topolog as, la que hace los datos observados
ms probables ( menos sorprendentes ) es la preferida
la probabilidad est relacionada con la
sorpresividad de los datos
Estaramos sorprendidos de obtener esteresultado, dada
su bajsima probabilidad (1/6)
20
1 en 3,656,158, 440,062,976!
Pero la probabilidad dependedel modelo probabilstico asumido
En filogentica, las distintas topologas representan a los
distintos modelos, y se selecciona aquel modelo que nos hace
sorprendernos menos de los datos que hemos coleccionado
Aproximaciones tradicionales (matrices de distancia, ME, ML, MP)
- la bsqueda tiene por objetivo encontrar la topologa ptima (estima puntual)
- no pueden establecer el soporte
relativo de las biparticiones a
partir de una nica bsqueda
MLE
L
H
= Pr(D|H) = Pr(D|)
L
D
tree space (
i
)
Aproximacin Bayesiana
- no busca una solo topologa ptima sino una poblacin de rboles muestreados
en funcin de su probabilidad posterior (algoritmos MCMC)
- la muestra de rboles obtenidos en una sola
sesin de bsqueda es usada para valorar
el soporte de cada split en trminos de
propabilidad posterior
95%
credibility
interval
pP
tree space (
i
)
Criterios de optimizaci n: la alteranativa Bayesiana

Вам также может понравиться