Вы находитесь на странице: 1из 11

(a) El motor del código de barras: ¿distancias o caracteres?

Un problema importante que debe resolverse es cómo leer el código de barras del organismo una
vez que se ha generado. Los enfoques más recientes sobre el código de barras de ADN han utilizado
medidas de distancia para hacer la inferencia sobre la designación de especies (Hebert et al., 2003a,
b, 2004a, b). Las distancias se usan en dos enfoques principales; el primero es un enfoque simple de
BLAST (Altschul et al., 1990) en el que se utiliza un puntaje de similitud sin procesar para determinar
el vecino más cercano a la secuencia de consulta. El segundo enfoque utiliza distancias en la
construcción de árboles (Hebert et al., 2003a, b). Señalamos las siguientes deficiencias con estos
enfoques y sugerimos además que los enfoques basados en caracteres son más apropiados para los
códigos de barras de ADN tanto por razones teóricas como prácticas.

Un defecto importante del uso de distancias en códigos de barras de ADN es que todos los estudios
clásicos y esquemas taxonómicos que logran lo mismo que los códigos de barras deben cumplir
están basados en caracteres, haciendo que la unión de códigos de barras clásicos y de ADN sea un
proceso difícil si se continúa el uso de distancias. en los estudios de códigos de barras (ver a
continuación). Esta deficiencia también está relacionada con la necesidad de caracteres de
diagnóstico que los estudios clásicos utilicen para validar la existencia de una especie. Una segunda
deficiencia es que los puntajes de similitud a menudo no le dan al vecino más cercano como el
pariente más cercano (Koski y Golding 2001). Sin embargo, los puntajes de similitud siempre le darán
al vecino más cercano. Los métodos basados en caracteres tienen la ventaja lógica de que, cuando
faltan datos de carácter de diagnóstico, no se pueden diagnosticar, lo que permite un grado de
comprobación de hipótesis no disponible cuando se utilizan distancias. Una tercera deficiencia
implica la falta de un conjunto objetivo de criterios para delinear taxones cuando se usan distancias.
Por ejemplo, un corte de similitud universal para determinar el estado de la especie simplemente
no existirá, debido a la amplia superposición de distancias inter e intraespecíficas (Goldstein et al.,
2000). Los investigadores tendrán que revisar constantemente sus límites de similitud de un grupo
a otro. Sospechamos que los criterios basados en la distancia para diferentes grupos de especies
dentro de los géneros a menudo tendrán diferentes parámetros, lo que hace que la delineación de
especies utilizando distancias sea bastante subjetiva. Sugerimos que un enfoque alternativo que
incluya el análisis filogenético basado en caracteres sea más apropiado para establecer o 'imprimir'
códigos de barras. El enfoque basado en caracteres es compatible con los enfoques clásicos que
permiten la combinación de información morfológica y conductual clásica. Los enfoques basados
en caracteres eluden los problemas de distancias de los vecinos más cercanos porque pueden
reconstruir relaciones jerárquicas donde se infiere ancestral común cuando dos entidades
comparten caracteres derivados. Ni BLAST (Altschul et al. 1990) ni los vecinos que se unen (NJ;
Saitou y Nei 1987) planteamientos de construcción de árboles permiten el diagnóstico de carácter
por carácter en las ramas de los árboles. Cualquier diagnóstico de este tipo debería basarse en
Parsimony o Maximum Likelihood. Además, el diagnóstico de dos entidades separadas en la
naturaleza puede lograrse mediante la existencia de un único carácter compartido por un grupo de
organismos con exclusión de otros, ya sea un carácter de ADN o un carácter morfológico

(b) El motor del código de barras: a árbol o no a árbol, esa es la pregunta

Dado que la información basada en caracteres es una alternativa viable a los enfoques basados en
distancia ya implementados en los estudios de códigos de barras, surge la pregunta de qué enfoque
para el análisis de caracteres es más apropiado para los códigos de barras: el enfoque de análisis de
agregación de poblaciones no basadas en árboles (PAA; Davis & Nixon 1992) o un enfoque basado
en árbol. Hay varios inconvenientes en el uso de enfoques de construcción de árboles para la
identificación de especies. El primero se refiere al uso de distancias (descrito anteriormente) para
construir árboles. Pero los problemas con la construcción de árboles no se limitan a los árboles
construidos con datos de distancia. Por el contrario, el segundo inconveniente es el uso de árboles
de un solo gen como evidencia de relaciones filogenéticas. Varios estudios han demostrado
teóricamente (Kluge 1989) y empíricamente (Rokas et al., 2003; Gatesy et al., 2004) que los análisis
combinados de múltiples particiones de datos producen mejores representaciones de la historia
evolutiva que los árboles de un solo gen.

El enfoque de análisis combinado tiene la ventaja adicional de que permite la exploración de la


contribución de caracteres de las particiones de datos al árbol combinado y puede revelar el soporte
de caracteres para el árbol combinado que no fue evidente en análisis separados de particiones
génicas individuales (Baker y DeSalle 1997, Baker et al., 1998; Gatesy et al., 1999, 2002, 2003). A
partir de estas ventajas, podría argumentarse que un árbol de evidencia total corroborado podría
usarse como árbol de guía para identificar las afinidades filogenéticas de la secuencia de un
individuo desconocido, suponiendo que la secuencia de consulta es una de las regiones génicas
utilizadas para construir el árbol de evidencia total. Existen herramientas bioinformáticas para
ayudar en la colocación de una secuencia de consulta basada en la presencia de caracteres
compartidos que son diagnósticos para los nodos en el árbol (Sarkar et al., 2002). Sin embargo, hay
un tercer inconveniente en el uso de un enfoque de construcción de árboles para la identificación
de especies. Esto se relaciona con el uso de métodos jerárquicos (construcción de árboles) y
terminología (monofilia como criterio para la delimitación de especies) cuando el sistema
subyacente (de individuos y poblaciones) no es un sistema jerárquico de relaciones ancestro-
descendientes, redefiniciones de monofilia como monofilia recíproca (Avise y otros 1987; Avise
1989; Avise & Ball 1990) o exclusividad (Baum 1992; Baum y Donoghue 1995; Baum y Shaw 1995) a
pesar de ello (revisado en Goldstein & DeSalle 2000). Una alternativa más práctica es la exploración
de diagnósticos de caracteres en las secuencias mismas sin referencia a los árboles.

Esto refleja el procedimiento de dos pasos de los estudios taxonómicos tradicionales en el que las
relaciones entre especies se evalúan solo después de que las terminales en el análisis (en este caso,
las especies) se identifican primero por caracteres de diagnóstico. En este enfoque formulado por
Davis y Nixon (1992), las secuencias se examinan usando PAA (Davis y Nixon 1992). Los diagnósticos
son aceptados si son fijos y diferentes del agregado al agregado de organismos; tales diagnósticos
se denominan "puros" (Sarkar et al., 2002). Este enfoque y su relevancia para la delimitación de
especies se ha discutido extensamente (Davis y Nixon 1992, Goldstein y DeSalle 2000, Goldstein y
DeSalle 2003, Goldstein y otros 2000, Nixon y Wheeler 1990) y su relevancia para el diagnóstico de
entidades en la naturaleza ha sido discutido tanto desde el punto de vista técnico como teórico
(Cracraft 1983, 1989; Frost & Kluge 1994; McKitrick y Zink 1988). Algunos métodos basados en
árboles intentan agregar terminales en función de la distribución de caracteres (Brower

1999) o en la topología de árboles (Wiens y Penkrot 2002) y son una mejora sobre los métodos
arbóreos a distancia; sin embargo, para el código de barras de ADN con múltiples individuos dentro
de una especie, creemos que es inapropiado utilizar un enfoque basado en árboles (Davis & Nixon
1992, Goldstein & DeSalle 2000).
((c) La base de datos del código de barras: ¿es suficiente cox1?

Un aspecto controvertido de la iniciativa de códigos de barras de ADN ha sido qué herramienta


molecular usar para generar los códigos de barras de ADN (Prendini 2005). Los esfuerzos publicados
hasta ahora en los sistemas animales han utilizado el gen I de la subunidad I de la citocromo c
oxidasa (cox1) de la mitocondria animal. Una de las principales críticas de este enfoque es que una
sola sonda molecular como cox1 no proporcionará necesariamente información suficiente para
ofrecer la resolución necesaria para diagnosticar la gran cantidad de especies a las que se dirige la
iniciativa. Al argumentar a favor de la suficiencia de cox1 (o cualquier otro marcador molecular
único), Hebert et al. (2003b) señalaron que solo 15 sitios variables en el gen cox1 ofrecen mil
millones de combinaciones diferentes de bases que dan "patrones" de código de barras posibles
más que suficientes a nivel de ADN. Desaparecido de esa afirmación es un reconocimiento de que
relativamente pocas de esas combinaciones podrían dar como resultado una proteína traducida
viable observable en una especie existente. Con base en un estudio de aves (Hebert et al., 2004b),
se sugirió que cox1 podría tener una utilidad más amplia en el reino animal y que un corte de
distancia universal de 10 veces la distancia dentro de las especies podría usarse para distinguir entre
especies. Sin embargo, incluso entre las aves encuestadas para cox1, hubo taxones anómalos que
mostraron mayores de lo esperado dentro de las divergencias de especies. Además, los estudios de
copépodos (Edmands 2001; Goetze 2003) han encontrado altos niveles de variación de cox1 (hasta
20%) incluso entre conespecíficos. Tener que dejar de lado estos valores atípicos argumenta en
contra de la suficiencia o la universalidad de la región del gen. Si bien el hecho de que estos taxones
mostraron una gran divergencia en la distancia genética sugiere que puede haber diversidad
taxonómica no reconocida, para probar que la hipótesis requeriría más de una línea de evidencia.

Así que examinamos aquí el enfoque basado en caracteres para el diagnóstico y el poder de los
enfoques basados en caracteres. Sarkar et al. (2002) reconocieron que las combinaciones de
atributos que no son diagnósticos "puros" podrían utilizarse para desarrollar diagnósticos
compuestos "puros". El diagnóstico compuesto más simple es cuando dos atributos que son
'privados' para los agregados (se encuentran solo en un agregado pero no son fijos, por ejemplo, si
el agregado 1 se fija para todos los individuos en la posición 1 de una secuencia con G y el agregado
2 tiene 5 individuos con una G en posición 1 y 5 individuos con una A en la posición 1, la A en el
agregado 2 es un diagnóstico privado para el agregado 2) se combinan para producir un "puro"
diagnóstico. Incluso se pueden encontrar combinaciones más complejas si se definen dos o más
agregados. Por ejemplo, la figura 1 muestra cuatro posiciones en una secuencia hipotética que son
polimórficas (es decir, ni fijas ni privadas para los estados de caracteres alternativos), que cuando
se combinan crean un diagnóstico puro. Este enfoque se ha utilizado para evaluar el diagnóstico de
caracteres en especies de esturión. El sistema examinado se generó a partir de comparaciones de
más de 150 individuos Acipenseridae en dos especies, Acipenser gueldenstaedti y A. baerii (Doukakis
et al., 1999). Si bien la sonda molecular utilizada fue de 700 pares de bases (pb) del gen del citocromo
B (cittB) de la mitocondria, este ejemplo será suficiente para demostrar el poder de encontrar
diagnósticos utilizando este enfoque. Entre estas dos especies para la región de ctB de 700 pb,
observamos 36 sitios variables, de los cuales tres fueron diagnósticos "puros" para las dos especies.
Casi la mitad de los sitios eran 'privados' para una especie y más de 1000 combinaciones de dos
sitios produjeron sitios 'privados' compuestos (es decir, los dos sitios juntos eran 'privados' para una
de las especies. Más interesante aún, había siete combinaciones de estos 15 sitios individuales
"privados" y los 1000 compuestos de dos posiciones que produjeron diagnósticos "puros". La
respuesta a '¿Es suficiente cox1?' Es entonces sí y no. Cox1 ciertamente no es suficiente para
delinear las relaciones filogenéticas de los organismos. Sin embargo, puede ser suficiente generar
conjuntos de caracteres que puedan y puedan diagnosticar agregados de organismos como
entidades en la naturaleza.

(d) La base de datos del código de barras: ¿Cuántas personas son suficientes?

Otro aspecto controvertido de la iniciativa de códigos de barras de ADN se relaciona con la cantidad
de individuos de cada especie putativa para incluir en el análisis. Los esfuerzos taxonómicos clásicos
investigan a numerosos individuos de múltiples localidades en el rango de una especie determinada
para distinguir la variación dentro de una especie de la variación entre especies con el fin de
identificar aquellos caracteres que se comparten de manera única entre todos los miembros de una
especie. Uno o solo unos pocos individuos pueden no ser representativos de la especie como un
todo, especialmente para los taxones con distribuciones generalizadas (Davis y Nixon 1992,
Goldstein et al., 2000, Walsh 2000). La necesidad de un número adecuado de individuos se aplica a
los métodos basados en la distancia y el carácter y no es probable que haya un tamaño de muestra
universal que sea apropiado para todas las especies. Tampoco es probable que una distancia
geográfica universal proporcione un proxy razonable para determinar la estrategia de muestreo
adecuada. Al igual que con la elección de la región genética, el muestreo de un número suficiente
de individuos para capturar la variación representativa dentro de la especie requerirá estudios
piloto y el uso de información de antecedentes sobre el ciclo de vida, la capacidad de dispersión y
los patrones de apareamiento, entre otra información.

2. UN BARCODER BASADO EN EL CARÁCTER PROPUESTO

Trabajos recientes y comentarios sobre la iniciativa de códigos de barras en la literatura han


estimulado la preocupación y la emoción tanto de los taxonomistas como de aquellos que se basan
en enfoques moleculares. Las preocupaciones van desde lo filosófico a lo técnico. Estos comentarios
podrían ser separados en la perspectiva de la taxonomía (Agosti 2003, Dunn 2003, Lipscomb y otros
2003, Proudlove & Wood 2003, Seberg y otros 2003), la perspectiva molecular (Baker et al., 2003;
Blaxter y Floyd 2003; Ronquist & Gardenfors 2003; Tautz et al., 2003) y comentarios que simpatizan
con ambos (Mallet y Willmott 2003, Wilson 2003). Los comentarios a favor de la taxonomía se burlan
de la falta de consideración del contenido intelectual de la taxonomía clásica y se pueden resumir
como en la siguiente cita de Lipscomb et al. (2003) p. 65: "los partidarios de la taxonomía del ADN
parecen no comprender el contenido intelectual incomparable de la taxonomía sobre la base de
toda la información disponible, o la base del trabajo revisionista moderno basado en la hipótesis.

Para nosotros es claro que la información genómica debe ser un componente activo de la taxonomía
moderna, pero el ADN no debe ser la única fuente de recuperación de información. "Los métodos
modernos de codificación de barras del ADN son un gran avance para la identificación, pero no
suplantarán la necesidad de formular y probar rigurosamente las hipótesis de las especies" (Wheeler
et al., 2004, p 285). Un código de barras debe incorporar caracteres de diagnóstico tanto desde el
enfoque morfológico clásico como desde los enfoques moleculares más nuevos; uno sin el otro
pierde la sinergia que una taxonomía integrada es capaz de alcanzar (Godfray 2002). Vemos una
fortaleza importante en un enfoque integrado en el sentido de que la taxonomía descriptiva y la
taxonomía filogenética producen en conjunto una sinergia de resolución que ninguno puede
alcanzar en la actual "torre de babel" fragmentada (Mallet y Willmott 2003). También debería
quedar claro que la integración de los enfoques moleculares "de moda" con el enfoque taxonómico
clásico es un componente crítico para conciliar ambos campos y avanzar hacia el uso de códigos de
barras en la biología moderna. En consecuencia, presentamos un enfoque operativo e integrador
de la taxonomía que intenta conciliar la información molecular con otras fuentes de caracteres.

(a) El círculo taxonómico; rompiendo

Ofrecemos la figura 2 como heurística de cómo se puede ver la taxonomía moderna. Si bien
cualquier diagrama que describa el funcionamiento de la taxonomía sufriría una simplificación
excesiva del proceso intelectual que utilizan los taxonomistas para ejercer su oficio, creemos que la
figura 2 captura muchos elementos de la taxonomía moderna: prueba de hipótesis, corroboración,
iluminación recíproca y revisión. El principal problema que debe abordarse en cualquier intento de
determinar el límite de una especie y, por tanto, elevar la entidad al estado de la especie es evitar
el razonamiento circular o tautológico. Romper el círculo de inferencia (figura 2, diagrama central)
en el trabajo de delineación de especies es una forma descriptiva de describir el trabajo del
taxonomista y, por lo tanto, el papel de la información de secuencia de ADN (y códigos de barras)
en la taxonomía. La Figura 2 muestra una versión altamente simplificada de varios problemas
taxonómicos que han enfrentado sistemáticos y códigos de barras de ADN. El proceso clásico de uso
de la morfología en la taxonomía se muestra primero (figura 2, panel A). En este diagrama, los
puntos de datos sobre el círculo de "taxonomía" consisten en información geográfica, morfológica,
ecológica, reproductiva y de comportamiento. En la mayoría de los estudios taxonómicos
morfológicos se hace una hipótesis inicial basada en la geografía. El taxonomista luego cruza el
interior del círculo con caracteres ecológicos o caracteres morfológicos para probar la hipótesis
geográfica. Si la información morfológica, conductual, reproductiva o ecológica relevante para la
hipótesis geográfica ayuda a rechazar la hipótesis nula de que no hay diferenciación de las dos
entidades geográficas, entonces el taxonomista puede "salir" del círculo. Las especies crípticas
detectadas por los enfoques de ADN se muestran a continuación (figura 2, panel B). En este caso,
agregamos información de secuencia de ADN al círculo. Inicialmente se formula una hipótesis
geográfica, una hipótesis nula establecida y probada con las herramientas clásicas del taxonomista.
En este caso, ninguna de las herramientas clásicas -biología reproductiva, caracteres morfológicos,
conductuales o ecológicos- puede rechazar la hipótesis nula. El taxonomista puede recurrir a las
secuencias de ADN donde se rechaza la hipótesis nula basada en la geografía debido a diferencias
de ADN fijadas entre los agregados hipotéticos por geografía. En esencia, los agregados contienen
especies morfológicamente crípticas que solo se detectan a nivel de la secuencia de ADN, lo que
permite que el taxonomista salga del círculo. El tercer panel en la figura 2 (panel C) muestra el caso
de falta de habilidad por todos los métodos para conducir al rechazo de una hipótesis geográfica
nula. En este caso, las entidades de especies putativas sugeridas por la geografía no se pueden
corroborar y, por lo tanto, el taxonomista se ve obligado a permanecer en el círculo. La conclusión
del taxonomista debería ser que existe una única entidad taxonómica. El cuarto panel (figura 2,
panel D) representa el poder de integrar nuevos métodos en este esquema operativo. En este caso,
varios individuos dentro de un área geográfica única muestran diferencias morfológicas. Debido a
que se considera que estos individuos residen en la misma región geográfica, no se puede hacer una
hipótesis geográfica. Pero en este caso las entidades morfológicamente diferentes pueden
agregarse y probarse para detectar diferencias fijas con otras fuentes de datos. En el caso del
diagrama, implicamos que se puede usar la información de la secuencia de ADN y si las diferencias
de ADN fijas corroboran la hipótesis morfológica luego, la conclusión del análisis es que dos especies
existen en simpatría y pueden ser delineadas por diferencias morfológicas. La situación inversa
también es posible: un investigador podría examinar una "población" de organismos con morfología
y no ver diferencias morfológicas. Cuando se examinan los genomas del organismo, el investigador
podría descubrir un polimorfismo de secuencia de ADN que separa claramente a la población
individual en individuos con un haplotipo e individuos con un segundo haplotipo distinto. La única
forma de salir del círculo aquí sería volver a examinar la morfología o pasar a otra fuente de
información. Si no se puede encontrar una corroboración de la agregación molecular, la conclusión
debería ser que existe una única población con dos haplotipos claramente distintos. Si se logra la
corroboración, se debería concluir que existen dos entidades distintas.

3. EL BARCODER BASADO EN EL CARÁCTER (INCUMPLIMIENTO) IMPLEMENTADO

Creemos que un método formalizado para la inclusión de información molecular en la taxonomía


aclarará el contenido intelectual de la taxonomía desde una perspectiva molecular, pero también
aclarará cómo la información de secuencia de ADN puede ser utilizada de manera más eficiente en
la iniciativa de códigos de barras de ADN. La siguiente sección utiliza un estudio de caso de
mamíferos (el género Muntiacus o ciervo ladrador), un estudio de caso de peces (Acipenseridae o
esturiones, la fuente de caviar) y ejemplos de invertebrados (sanguijuelas), que tienen un número
manejable de taxones y problemas taxonómicos únicos para examinar la incorporación de datos
moleculares en cuestiones taxonómicas. Específicamente, primero examinamos el uso de
especímenes tipo en el código de barras de muntjac y el impacto que dichos especímenes tipo
tendrán en futuros esfuerzos taxonómicos de ADN. En segundo lugar, examinamos el uso del código
de barras de ADN en el género de sanguijuelas Hirudo para demostrar la importancia del muestreo
a gran escala de grupos en las encuestas taxonómicas. Hirudo también sirve como un fuerte ejemplo
del efecto de la hibridación sobre cómo se realiza la taxonomía. Finalmente, utilizamos la familia de
peces comercialmente importante Acipenseridae para examinar un problema críptico de especies.
Cada uno de estos ejemplos demostrará que, si bien el ADN es un factor importante en los tres, la
interacción de los datos de secuencia de ADN con otros tipos de caracteres produce un marco
taxonómico más preciso.

(a) Código de barras de Muntjac: Ejemplo de Muntiacus rooseveltorum

El estudio de muntjac (Amato et al., 1999) utilizó el código de barras de ADN para el descubrimiento
de especies en un marco que es compatible con la taxonomía clásica. El estudio resalta algunos de
los problemas relacionados con el código de barras, como el uso de comprobantes identificados
independientemente, el tamaño de la muestra y la elección de la región del gen. Comenzó con
informes de campo de lo que pudieron haber sido representantes de una nueva especie de muntjac
en Laos para la cual el único material disponible en ese momento consistía en muestras de tejido
seco. Con el fin de idear un método para explorar la cuestión del estado de la especie de estos
muntjac utilizando ADN, el estudio observó las prácticas establecidas en taxonomía para las
directrices. El tamaño de la muestra y la elección de la región del gen son factores que pueden
afectar la capacidad de discernir datos de diagnóstico reales. Para que los datos de ADN tengan el
potencial de ser utilizados en un proceso de descubrimiento de especies, todas las especies del
grupo deben incluirse en el análisis. Además, el número de individuos muestreados para cada
especie debe ser lo suficientemente grande como para ser representativo de la variación en una
región genética dada para la especie como un todo y la región del gen debe ser lo suficientemente
variable para detectar las verdaderas diferencias entre las especies. Dado un tamaño de muestra
suficientemente grande y representativo, se puede minimizar el problema de una región de gen
demasiado variable que conduzca a rechazar incorrectamente el nulo.

El número de muestras disponibles para la nueva especie putativa fue bajo (nZ10). Dado el bajo
número de individuos, se llevó a cabo un estudio piloto que exploró varias regiones génicas para
representantes de cada especie en el grupo y eligió una región genética (en este caso 16S mt rDNA)
para equilibrar el potencial de dos tipos de errores: (1 ) confundir la variación individual para la
variación del nivel de especie mediante el uso de muy pocos individuos y una región de genes muy
variable; o (2) al no identificar las verdaderas diferencias de especies, mediante el uso de una región
conservada del gen secuenciada para muy pocos individuos para recuperar suficiente variación

Se construyó una matriz de diagnóstico de 114 individuos que representaban todas las especies del
género más taxones externos. Para las especies más extendidas, esto incluyó tamaños de muestra
más grandes de varias localidades en todo el rango de esas especies, como en el caso de Muntiacus
muntjak (nZ49). Además, para poder asociar el material recién recolectado con los nombres de las
especies, para cada especie, la secuencia de ADN se obtuvo a partir de muestras nombradas,
examinadas morfológicamente, de colecciones de museos e incluidas en la matriz de diagnóstico.
Las secuencias de la nueva especie putativa en comparación con otras especies en el grupo fueron
únicas. Sin embargo, la inclusión de datos de secuencia de especímenes de museo resultó
fundamental para una evaluación precisa del estado de la especie. En la literatura había una
descripción de una especie (M. rooseveltorum Osgood 1932) basada en un solo individuo
recolectado en Laos hace 70 años y nunca más recogido. Se demostró que el ADN del espécimen
tipo de M. rooseveltorum comparte sitios de diagnóstico con todos los especímenes recién
recolectados de la nueva especie putativa (figura 3). Esto llevó a la conclusión de que los
especímenes recién recolectados representaban un redescubrimiento de M. rooseveltorum. El uso
de ADN solo, sin la inclusión de todas las especies en el grupo (y el tipo de espécimen en este caso),
habría llevado a la conclusión incorrecta de que los especímenes de M. rooseveltorum
representaban una nueva especie. Esto resalta la importancia del muestreo taxonómico completo,
la revisión de la literatura y la corroboración con una segunda línea de evidencia. También destaca
la necesidad de obtener muestras de cupones que proporcionarían no solo ADN, sino que también
proporcionarían los medios para examinar una segunda línea de evidencia, como la morfología.

b) Código de barras Leech

Por una variedad de razones, las sanguijuelas proporcionan un marco único para el examen de la
utilidad de los métodos de código de barras de ADN. El grupo (Hirudinida) está bien circunscrito con
aproximadamente 750 especies conocidas. Sin embargo, hay una diversidad de preferencias de
hábitat y estrategias de historia de vida representadas en todo el clado, incluyendo algunos cuidados
extremos parentales, varios modos tróficos que van desde la alimentación con sangre hasta la
depredación y la vida en ambientes marinos, de agua dulce o terrestres. Además, las sanguijuelas
ya están bien caracterizadas para el locus cox1 (por ejemplo, Siddall &

Burreson 1998; Siddall et al. 2001; Borda y Siddall 2004) que normalmente se recomienda para los
estudios de códigos de barras (Hebert et al., 2003a, b, 2004a, b). Sin embargo, el uso de cox1 solo
para la diversidad de sanguijuelas de códigos de barras puede requerir cierta precaución ya que este
locus tiene una composición de base altamente sesgada. Entre las sanguijuelas medicinales del
Nuevo Mundo, por ejemplo, la adenosina y la timidina representan hasta el 72% de la composición
de nucleótidos en cox1 (y hasta el 96% en las posiciones de terceros, Siddall y Burreson 1998). Como
resultado, aproximadamente el 24% de los sitios variables en cox1 se vuelven binarios entre las
sanguijuelas en lugar de tener los cuatro nucleótidos disponibles.

(i) Ejemplo de Glossiphoniidae

Una de las familias de sanguijuelas mejor representadas en ambientes de agua dulce es


Glossiphoniidae. El clado comprende taxones que son especies de agua dulce dorsoventralmente
aplanadas que se encuentran normalmente alimentándose de anuros o huéspedes quelónicos,
aunque algunos son parásitos de peces y uno (Placobdelloides jaegerskioeldi) es incluso específico
de los tejidos rectales de los hipopótamos (Hippopotamus amphibius). Sin embargo, muchas
especies de la familia, en particular las de los géneros no relacionados Glossiphonia y Helobdella,
han abandonado el sanquivorio a favor de un estilo de vida depredador en moluscos y ligoquetos,
respectivamente. Las especies del género Helobdella tienen su mayor diversidad en América del Sur
y menos en América del Norte. Desde que Linnaeus lo describió, Helobdella stagnalis fue la única
especie conocida en Europa, y no se conocía ninguna en África ni en Australia. Como tal, las
descripciones recientes de nuevas especies como Helobdella europaea de un estanque urbano en
Berlín (Kutschera 1985, 1987) y Helobdella papillornata de arroyos en Australia (Govedich y Davies
1998) fueron completamente inesperadas, como fue el descubrimiento subrepticio de
representantes no identificados de Helobdella en cada una de Sudáfrica, Hawai y Nueva Zelanda,
todo en un lapso de tres años. Siddall y Budinoff (2005) emplearon el código de barras del ADN para
evaluar esta distribución de sanguijuelas, que al principio presentaba un enigma biogeográfico
histórico. Sus resultados (reproducidos aquí en la figura 4) aclararon el hecho de que en cada caso
las sanguijuelas eran genéticamente indistinguibles en los loci mitocondriales cox1 y ND1 y
representaban una sola especie de Helobdella anidada en un Sudamericano. grupo conocido como
complejo triserial (Ringuelet 1943). Las introducciones accidentales a cada localidad podrían haber
coincidido fácilmente con la introducción de especies de plantas invasoras acuáticas comunes como
Pistia stratiotes y Salvinia molesta, que se sabe que han sucedido en Alemania, Australia, Nueva
Zelanda y Hawai. La determinación genética sola, sin embargo, no se realizó aisladamente de
consideraciones taxonómicas. Por el contrario, a través de las disecciones y la comparación con los
taxones descritos, Siddall y Budinoff (2005) afirmaron que esta especie de sanguijuela corresponde
exactamente a Helobdella triserialis var lineata de Ringuelet (1943); un desafortunado resultado ya
que Verrill (1872), la norteamericana Helobdella lineata, se preocupó por ese epíteto específico
apropiado. La especie de sanguijuela globalmente invasiva, por lo tanto, ahora se conoce como
Helobdella europaea notwith de pie su presunto origen sudamericano. Significativo para el exitoso
resultado del código de barras en lo anterior fue una amplia cobertura geográfica de la especie de
Helobdella del rango conocido del género. Sin esa cobertura global y, por ejemplo, solo centrar las
colecciones en un área geográfica restringida en la que se encontró la sanguijuela sospechosa (por
ejemplo, Hebert et al., 2004a) probablemente habría abrogado el descubrimiento de su verdadera
identidad y origen último.

(ii) Ejemplo de Hirudo


La sanguijuela medicinal europea sigue siendo una herramienta valiosa disponible para las ciencias
biomédicas a pesar de que históricamente se ha utilizado con fines bastante dudosos, como el
tratamiento de la obesidad y los accidentes cerebrovasculares fatales de Stalin. De hecho, este año
pasado, la Administración de Alimentos y Medicamentos de EE. UU. Aprobó formalmente la
sanguijuela medicinal europea (Hirudo medicinalis) como un "dispositivo médico" y varias
compañías como LeechesUSA, BioPharm y Ricarimpex se especializan en la distribución global de
sanguijuelas para su uso en microcirugía y procedimientos relacionados. . Uno podría pensar que
una especie de anélido que se usa tan ampliamente en medicina, neurobiología, biología del
desarrollo y genómica, y para la cual se están desarrollando varias bibliotecas genómicas, se habría
caracterizado mejor en términos de los límites de sus especies. Los primeros análisis filogenéticos
para incorporar la sanguijuela medicinal europea como un taxón usando cox1 fueron Black et al.
(1997) y Siddall & Burreson (1998), aunque ninguno de esos análisis consideró múltiples
representantes de la especie.

Más recientemente, Trontelj y Utevsky (2005) demostraron varios hallazgos inusuales sobre la base
de cox1: específicamente, que las llamadas sanguijuelas medicinales europeas se agrupan en cuatro
linajes distintos y que lo que Black et al. (1997) y Siddall & Burreson (1998) cada secuencia guarda
poca similitud con el gen cox1 que se encuentra en las poblaciones de sanguijuelas medicinales
europeas capturadas en la naturaleza. Revisando su análisis aquí, hemos vuelto a analizar los datos
disponibles con algún material capturado en la naturaleza y comercialmente disponible en un
alcance taxonómico más amplio para los Hirudinidae (figura 5).

En particular, los resultados corroboran los hallazgos de Trontelj y Utevsky (2005) en el sentido de
que el complejo europeo de especies de sanguijuelas parece incluir al menos cuatro especies, tres
de las cuales habían sido sinonimizadas previamente con Hirudo medicinalis. Si los resultados del
código de barras del ADN son aceptados tal como están, entonces tendríamos que resucitar cada
uno de Hirudo verbana Carena 1820, Hirudo troctina Johnson 1816, y establecer una nueva especie
para la sanguijuela persa medicinal denominada "Hirudo sp." En la figura 5. Convenientemente,
cada de estas especies puede no ser tan "críptico" como previamente (Sawyer 1986) pensaban en
la medida en que parecen ser fácilmente distinguibles sobre la base de patrones de color externos.
Sin embargo, lo más alarmante es el estado de las sanguijuelas que anteriormente se llamaban
'Hirudo medicinalis'.

Por ejemplo, una sanguijuela obtenida de Ward's Biological para este estudio y enviada bajo el
nombre de 'Hirudo medicinalis' inequívocamente agrupa con Hirudo verbana (figura 5). Además,
tanto Black et al. (1997) y Siddall & Burreson (1998) obtuvieron sus representantes de Hirudo
medicinalis de Carolina Biological supply, y ambas secuencias se agrupan con la Hirudinaria
manillensis asiática a pesar del hecho de que el espécimen utilizado por Siddall & Burreson (1998)
es morfológicamente indistinguible de H. verbana. Este último sugiere una notable capacidad de
introgresión que aún no se entiende bien para estas sanguijuelas, y que sin embargo debería causar
cierta preocupación por la utilidad general de los métodos de código de barras de ADN basados en
un único locus.

(c) Código de barras de Sturgeon

Hay tres especies de peces en la familia Acipenseridae-Husu huso, Acipenser gueldenstadtii y A.


stellatus, todos ellos clasificados como en peligro de extinción por CITES, que son la fuente de la
gran mayoría del comercio mundial de caviar comercial. Una de estas especies, A. gueldenstadtii,
ha sido un enigma con respecto a la vigilancia del caviar importado ya que se introdujeron métodos
de secuencia de ADN para controlar la importación de caviar de los tres peces altamente
amenazados (DeSalle & Birstein 1996; Birstein et al., 2000) . Uno de los principales problemas con
el diagnóstico del caviar A. gueldenstadti ha sido la aparición con alta frecuencia de caviar
supuestamente de A. baerii (un pariente cercano de A. gueldenstadti), o del esturión siberiano
(Birstein et al., 2000).

Un examen más detallado del problema utilizando un mayor número de individuos de los clados de
esturión A. gueldenstadti y A. baerii indica ahora la presencia de una especie críptica idéntica a A.
gueldenstadti en morfología, pero también similar (pero no idéntica a) A . baerii. De hecho, existen
varios cambios en la secuencia de ADN que diagnostican este agregado de peces que son
morfológicamente idénticos a A. gueldenstadti, a diferencia de A. baerii. En este caso, el diagnóstico
de ADN indica

que esta segunda forma confusa de A. gueldenstadti es una entidad separada (Birstein et al., 2005).
Este caso es un excelente ejemplo de especies crípticas y cómo la información de la secuencia de
ADN puede revelar el críptico. Más importante aún, este caso ejemplifica dos aspectos técnicos
importantes del código de barras de ADN. En primer lugar, en este ejemplo se resalta la necesidad
de tamaños de muestra grandes y una revisión continua con tamaños de muestra más grandes.
Cuando se usan tamaños de muestra pequeños, la segunda especie críptica similar a A.
gueldenstadti se diagnostica incorrectamente como A. baerii. En segundo lugar, el caso enfatiza la
importancia de la precisión en la delimitación de especies en la aplicación práctica de cualquier
sistema de códigos de barras de ADN. Dado que el análisis forense de animales es un resultado
positivo importante del código de barras de ADN, este ejemplo refuerza la noción de que se deben
incorporar grandes tamaños de muestra y bases de datos integrales junto con técnicas clásicas
(como en este caso meristics) para implementar el enfoque de códigos de barras.

4. CONCLUSIONES

Concluimos por los siguientes motivos que los enfoques no basados en árboles son más apropiados
para la construcción de un lector de código de barras. En primer lugar, los enfoques basados en
árboles producirán filogenias basadas en una única molécula elegida deficientemente (para
filogenia). Mientras que los árboles muchas veces tienen sentido, el apoyo para las hipótesis de tales
árboles es casi siempre bajo, lo que limita la solidez de cualquier hipótesis filogenética de dichos
árboles. Relacionado con este tema está el conocido enfoque ampliamente aceptado en filogenia
que utiliza matrices de datos concatenados para producir filogenias (Kluge

1989; Gatesy et al. 2003; Rokaset al. 2003). Para basar cualquier inferencia de relación de especies
en un árbol filogenético generado a partir de un solo marcador molecular sería en conflicto con los
enfoques actuales de la sistemática moderna. En segundo lugar, los enfoques taxonómicos actuales
utilizan diagnósticos de descubrimiento independientes de los árboles para establecer sistemas
taxonómicos. El uso de caracteres de ADN en un contexto de diagnóstico sería totalmente
compatible con el proceso de investigación taxonómica actual. En tercer lugar, nuestro marco
propuesto, que requiere corroboración de más de una línea de evidencia, también es consistente
con las prácticas taxonómicas actuales, serviría como un puente entre los enfoques morfológicos y
moleculares y proporcionaría rigor suficiente para la identificación y descubrimiento de especies.
Admitimos fácilmente que ciertos problemas de códigos de barras, como especies microbianas
ambientales la identificación será problemática debido a la falta de información geográfica y
morfológica para la corroboración. Sin embargo, sugerimos que en estos casos problemáticos, las
regiones génicas adicionales y la información ecológica también podrían utilizarse para apoyar o
refutar las hipótesis de cohesión de especies. Finalmente, al pensar en los posibles formatos para
un campo de barras de ADN utilizable en el campo real, tener un sistema de diagnóstico sería lo más
apropiado para un dispositivo pequeño. La codificación de los diagnósticos se puede incluir en el
diseño de un formato de microarrays o en un formato de detección de polimorfismo de un solo
nucleótido rápido. Estos enfoques moleculares altamente técnicos utilizan métodos de detección
basados en caracteres y llevarían el desarrollo de un pequeño código de barras de ADN utilizable
más cerca de la realidad.

Вам также может понравиться