Compi Lación Sobre Teorías y Ejemplos PDF

UNIVERSIDAD JUÁREZ DEL ESTADO DE DURANGO
FACULTAD DE CIENCIAS BIOLÓGICAS

Laboratorio de Sistemas de Información Geográfica
Compilación sobre teorías y ejemplos

de modelos de nicho ecológico y áreas
de distribución delas especies
Compilado y editado por
Dr. Ulises Romero Méndez

Dra. María Cristina García de la Peña
Laboratorio de Sistemas de Información Geográfica (GISLAB)
Gómez Palacio, Durango, México Diciembre de 2014

Prólogo
En el año 2007, la Dra. Claudia Ballesteros Barrera nos brindó un par de cursos sobre
modelos con Maxent y Garp. Fue ahí que incursionamos en el área del modelado de
nicho y áreas potenciales de distribución geográfica, y desde entonces hemos estado
buscando algún documento con las definiciones de los conceptos que tanto se
manejan en este campo. Claro que encontré algunos conceptos, pero esparcidos en
varios documentos y lo que se quería era tener todas las definiciones de los conceptos
y teorías reunidos en un solo manuscrito.
CONABIO elaboró una serie de páginas que contienen la teoría, conceptos e

interpretación de los mapas de salida, tanto de Maxent, Garp y Bioclim, entre otros.
Otra de las cosas interesantes es que presenta unos consejos y aseveraciones muy
certeros sobre los errores que se pueden cometer al modelar el área de distribución
de una especie… el primero es confundir modelo de nicho potencial (MDP) con
modelo de distribución geográfica potencial de las especies (MDS).
La presente compilación de páginas, trabajos y ejercicios, fue realizada con la

intención de tener un documento realizado por expertos, con un lenguaje estándar
sobre el tema de nichos y áreas potenciales. En esta área tan novedosa, es muy común
caer en errores semánticos, es por eso que tener un documento donde se definieran y
explicaran los procesos de los tres principales programas del modelado de nicho era
de vital importancia para nuestra Institución.
Se agradece de antemano a la CONABIO y a los autores de ésta página WEB, de donde

se compiló la mayor parte de este documento. La compilación se hizo con la sana
intención de difundir el conocimiento sobre el modelado de nicho y áreas potenciales
en esta Facultad. Es claro que utilizar definiciones correctas y estandarizadas por
expertos en la materia, es de vital importancia para realizar un buen trabajo. Nos
despedimos esperando que la realización de este trabajo cumpla su misión de ser una
herramienta orientadora, gratuita y accesible.
Ulises Romero Méndez

 Propósito y Guía del Usuario
Esta Ud. Leyendo una guía dedicada a los conceptos y métodos de "Ecological Niche
Modeling (ENM)" y su pariente cercano "Species Distribution Modeling (SDM)". Lo más
probable es que su interés sea el de modelar distribuciones de especies, intentando obtener
un mapa que represente algo como la distribución histórica, que llamaremos siempre el área
ocupada (simbolo: Go), previa a los cambios intensos que se han dado en los últimos siglos
por la presencia humana.
*Nota. En esta guía presentamos recomendaciones prácticas sobre el uso de

algunos algoritmos principales, así como los elementos teóricos necesarios para
interpretar los resultados.
Las tres preguntas conceptuales clave en SDM y ENM son:
1) ¿Qué objeto (área potencial, área invadible, área ocupada), o sus

corresponidentes ambientes (nicho fundamental, nicho
fundamental existente, nicho realizado) se desea estimar?
2) ¿Con qué clase de datos se cuenta (únicamente presencias, presencias

y ausencias estrictas, presencias y pseudo-ausencias, o presencias y datos de
fondo (background data)? y, finalmente…
3) ¿Cuál es el contexto ecológico y biogeográfico del problema, o

configuracion BAM (especies en una isla, especies en un continente, especies
expandiendo su rango...)?
Las respuestas a estas preguntas determinan, primero, qué

método (Maxent, GARP, BIOCLIM, Métodos de Regresión...) es más adecuado al
problema, y segundo, cuál es la interpretación adecuada para los resultados del
ejercicio de modelación.
Además, existen varias preguntas prácticas muy importantes:
1) Respecto a la cantidad y tipo de datos ¿Hay un número mínimo de datos de

presencias que se puede usar? ¿Es mejor usar cuántos más puntos sea posible? Si
tengo pseudoausencias, ¿cuantas se deben usar? Si se va a usar un método que genera
ausencias de trasfondo ( backcground absences) ¿cuántas son adecuadas?
2) Respecto a las variables predictoras, ¿Conviene usar muchas o pocas? ¿Crudas,

estandarizadas, transformadas, por ejemplo, usando PCA? ¿Categóricas o solamente
numéricas?
3) Respecto a la verificación. ¿Cómo se verifica un resultado? ¿Existe algún método

universalmente aceptado?
4) Respecto a la extensión del área de entrenamiento (el rango de valores de
variables ambientales), y lo mismo para la "proyección". ¿Qué tan amplio debe ser el
rango de variables usado para entrenar, y que tanto es confiable salirse de dicho rango
al transferir? ¿Es seguro extrapolar?
*Nota: Los conceptos e ideas presentados aquí, han sido casi enteramente publicados en
revistas arbitradas o en el libro Ecological Niches and Areas of Distribution.
Los consejos prácticos son el resultado de más de 15 años de

experiencia que los autores tienen modelando áreas de distribución y
nichos, con un acumulado de varios cientos de publicaciones en el tema. En
la sección de Bibliografía se encuentran referencias y ligas a algunos de
los artículos considerados clave.
El área Go de Rhynchopsitta terrisi

(Área en ausencia de efectos antropogénicos),
según Navarro y Peterson.
El diagrama BAM, ilustrando las tres áreas que se modelan
en SDM/ENM: A, GI y Go y las regiones auxiliares G y M. Los círculos
cerrados representan datos de presencias y los abiertos diferentes clases
de ausencias.
 Los Problemas Conceptuales
La modelación de nichos ecológicos (ENM) y su pariente cercano, la modelación
de áreas de distribución (SDM), constituyen un campo nuevo de investigación con un
crecimiento verdaderamente explosivo en los últimos 15 años, como se ve en esta
gráfica, tomada de Lobo et al. 2010.
Este explosivo crecimiento se debe en buena medida a:
 los avances técnicos constituidos por los sistemas de información geográfica y

los algoritmos que permiten estimar y proyectar los llamados
"nichos ecológicos", y
 a las inversiones, generalmente gubernamentales, que han apoyado a
investigadores e instituciones para digitalizar datos de observaciones de
museos y herbarios.
Los métodos ENM y SDM son a un tiempo de muy grande importancia teórica y
fundamental, y de gran valor práctico. Sin embargo aún están en desarrollo, y
subsisten muchas dudas sobre qué método es "mejor", sobre la miríada de detalles
sobre su calibración y verificación, y finalmente sobre la interpretación de los
resultados.
Así, el objetivo de esta sección es presentar los elementos teóricos y conceptuales que
permiten escoger un algoritmo adecuado al problema e interpretar correctamente los
resultados. Los principales problemas se refieren a: Entender la naturaleza de los
espacios E y G y su relación. 2) Contar con una hipótesis sobre los factores que
determinan las áreas potenciales y ocupadas. 3) Entender las relaciones entre
los métodos de SDM/ENM y los factores causales que explican las distribuciones. En
las secciones siguientes se presentan algunos resultados sobre estos temas, aún
en investigación activa.
 SDM y ENM
En la literatura existe un debate, hasta cierto grado semántico (Elith & Leathwick,
2009; Franklin, 2009), sobre el nombre correcto para la actividad de
modelar áreas de distribución. Se usan los términos environmental niche
modeling (ENM), species distribution modeling (SDM), habitat preference modeling, y
varios otros. El punto importante a recordar no es tanto el nombre (aunque un mal
nombre confunde y un nombre acertado clarifica las cosas), sino el concepto de que
se trata. Cuando se intenta modelar el área ocupada GO, lo natural es hablar de SDM. Si
se intenta modelar las áreas potenciales GI o A, lo cual esencialmente implica localizar
en la geografía las regiones favorables a la especie (o sea, contenidas en su nicho
fundamental existente, o aquellas en el nicho realizado, pero que ocurren en otras
regiones no ocupadas) entonces lo lógico sería usar el término ENM. En la mayor
parte de la literatura estas distinciones no se hacen y los términos ENM y SDM se
consideran sinónimos.
Dejando a un lado los problemas semánticos, el interesado en estudiar nichos
o áreas debe tener claras tres cosas: 1) Existen al menos tres clases de nichos
Grinnelianos (el fundamental, el fundamental existente y el realizado) 2) Existen al
menos tres áreas de interés (la ocupada, la potencial y la invadible), y 3) Modelar
nichos no es igual a modelar áreas, al menos por la obvia razón de que los nichos son
subconjuntos de E y las áreas son subconjuntos de G.
ENMs or SDMs?
El concepto “Modelo de Nicho Ecológico” engloba dimensiones que no podemos
considerar (ni medir!) en las metodologías actuales. Un término que no tiene esta
restricción es “Modelo de Distribución de Especies” (en adelante, MDE).
Esto solo es semántica! pero los revisores de artículos la tienen muy en cuenta!
La Dualidad de Hutchinson
La idea fundamental tanto en la modelación de áreas (SDM) como en la modelación

de nichos (ENM) es que existen dos espacios, el geográfico convencional, denotado
por G, un ejemplo del cual es el mapa de arriba, y un espacio abstracto, denotado
por E, que se ejemplifica en dos variables climáticas en la nube de puntos de la
figura. E y G se relacionan directamente, ya que en un tiempo dado, a cada punto
geográfico de G corresponde una combinación de valores ambientales en E. Esta
combinación puede o no ser única, dependiendo de la resolución de la información
ambiental, del número de variables usadas, y de su precisión. La experiencia indica
que cuando se utilizan variables ambientales de tipo bioclimático, con tres o cuatro
cifras significativas, incluso para grandes extensiones la correspondencia es uno a uno
(a cada punto en E se asocia un solo punto en G y viceversa). Esta idea implica, que en
general, hay tantos elementos en el espacio G como en el E: |E|=|G|
El espacio E está compuesto por variables no interactivas, que Hutchinson, en un muy
poco citado capitulo (Hutchinson, 1978) llamo variables scenopoéticas, o sea variables
que establecen las condiciones (el escenario) en el que una especie puede
simplemente existir.
La utilización de programas llamados Sistemas de Información Geográfica (SIGs) es

casi obligada cuando se trabaja en SDM/ENM, ya que esto permite navegar entre el
espacio-E y el espacio-G de manera fluida y sencilla. No podemos exagerar la
importancia de que un usuario se familiarice con la estructura de ambos de sus
espacios.
Arriba se muestra una parte del continente americano, superpuesta con

una retícula de un grado de resolución, que es una resolución gruesa, simplemente
para que sea fácilmente visualizable. Ese sería un espacio G, que mide 3,578 celdillas.
Si el mapa estuviera proyectado, se podría calcular el área de cada celdilla.
Abajo se muestra el correspondiente espacio E, para la misma región, usando tres

variables medioambientales, a la misma resolución. En otras palabras, para cada
celdilla de la retícula en G se obtuvo el promedio de climas (a resolución de 1.5 km),
sacados de la página de WorldClim. La precipitación está en mm y las temperaturas
promedio (Temp) y Mínima del Mes más Frio (MinMesFrio) en centígrados x 10. El
número de puntos (3,578) en la figura de abajo es idéntico al número de celdas en
la retícula, porque se usan tres variables y una precisión de tres cifras
significativas. Nótese cuán irregular es la forma del espacio E.
Se puede decir de una manera coloquial que los nichos "viven" en E y
las áreas de distribución en G, y la manera no coloquial de decir esto que, para
los propósitos de toda esta guía, un nicho es un subconjunto de E, y
un área de distribución es un subconjunto de G, definidos ambos en términos de
propiedades biológicas y ecológicas de una especie, tal y como se describe en
la sección de Ecología de Poblaciones y el BAM.
La importancia fundamental de definir nichos y áreas en términos de subconjuntos

de E y G es doble. En primer lugar, existen literalmente Terabytes de datos sobre estos
dos espacios. En segundo lugar, están bien definidos y se puede operar con ellos. Se les
puede medir, se les puede visualizar, se pueden calcular sus propiedades, se pueden
deducir sus propiedades matemáticas. Los nichos definidos a partir de propiedades
del espacio E se llaman Grinnelianos y la explosión en su utilización se explica
principalmente por el hecho de que, a diferencia de los llamados nichos Eltonianos
(clásicamente tratados en la literatura de la Ecología Teórica), las operaciones con
ellos están bien definidas y se cuenta con gran cantidad de datos al respecto.
 Diagrama BAM
La literatura ecológica ha establecido desde hace muchas décadas (Grinnell, 1917;
Good, 1931; Udvardy, 1969) que el área de distribución de una especie, en un tiempo
dado, es el resultado de una combinación de factores, tres de los cuales son de
particular importancia y se ilustran en el diagrama de abajo, llamado el diagrama BAM
(Soberón y Peterson, 2005), y que es una representación abstracta
del espacio geográfico G:
1. La región del mundo donde se encuentran las condiciones ambientales que

permiten la sobrevivencia y reproducción de la especie (este conjunto de
condiciones se llama el Nicho Fundamental de la especie). Se denota con la
letra A en el diagrama de la derecha, y se mide usando variables scenopoéticas.
2. La región del mundo que contiene el ambiente biótico adecuado para la
especie. Esto es, los sitios donde no hay competidores capaces de excluir a la
especie, ni depredadores o enfermedades capaces de extirpar todas las
poblaciones, y existen los mutualistas (polinizadores, dispersores de
semillas...) necesarios. Se mediría, si existieran datos, usando las densidades
de población de las principales especies interactuantes. Se denota con la
letra B.
3. El conjunto de sitios que la especie ha tenido tiempo de visitar, o "explorar"
desde una fecha dada (origen, la última glaciación, su introducción a un nuevo
continente...). Se denota con la letra M.
Heurísticamente, estos conceptos permiten definir dos importantes regiones: el área

ocupada Go y el área invadible, GI.
En otras palabras, el área ocupada Go es la parte del mundo que cuenta con
condiciones ambientales y bióticas favorables y que ha estado accesible a la especie.
El área invadible GI es una zona con condiciones ambientales y bióticas favorables,
pero no accesible a la especie (existencia de barreras, falta de tiempo para
expandirse...).
Las definiciones heurísticas del área ocupada e invadible se pueden formalizar desde
al menos dos perspectivas: una probabilística, enfocada a su estimación, y
otra ecológica, orientada a definir A, B y M en términos de procesos poblacionales
fundamentales. Estas dos perspectivas son complementarias y entenderlas ayuda a
interpretar bien los resultados.
Punto práctico. Es muy común, en ENM/SDM, confundir las tres áreas Go, GI y A, ya
que es asunto aún debatido si la salida de un algoritmo de modelación de nicho se
aproxima a una u a otra. En el extremo, cuando se usan datos de presencias y
ausencias verdaderas y algoritmos de regresión, uno está aproximando Go. Sin datos
de ausencias verdaderas, diferentes algoritmos y configuraciones BAM, un algoritmo
puede producir estimaciones más aproximadas a A (Jimenez-Valverde et al., 2008;
Soberon & Nakamura, 2009).
Definición por operaciones de conjuntos del
área ocupada y del área invadible.
El diagrama BAM
Definición por operaciones de conjuntos del
área ocupada y del área invadible.
 Casos extremos del BAM

Existen algunos casos principales del diagrama BAM que deben ser comprendidos
porque conducen a interpretaciones radicalmente distintas de los resultados de los
modelos. Los llamamos el mundo Clásico, el mundo de Hutchinson, y el mundo de
Wallace. En estos tres casos extremos, nótese que se está despreciando el componente
biótico. Las razones son tres: i) es muy poco frecuente contar con mapas que
representen los efectos de las interacciones bióticas. ii) Se ha hipotetizado que estas
variables son, en general, mas importantes a escalas locales, de muy alta resolución.
iii) Sus efectos tienden a ser dinámicos y heterogéneos espacialmente.
Mundo Clásico. El caso más frecuente. Existen zonas del mundo inaccesibles pero
adecuadas, y zonas accesibles pero inadecuadas. La mayor parte de las especies que
probablemente se trate de modelar son ejemplos de este caso.
 Las ausencias se deben a razones radicalmente diferentes, dependiendo de la

zona.
 Las presencias están determinadas por una combinación de factores de tal
forma que se pueden cometer errores de comisión por dos causas distintas.
 En este escenario Go y A son distintas y los métodos basados en presencias
solas tienden a estimar una área intermedia entre Go y A (Jimenez-Valverde et
al., 2008).
Es importante contar con información sobre M (por

ejemplo, hipótesis biogeográficas) para poder post-procesar los resultados,
"recortando" el área predicha por el algoritmo y aproximar mejor Go (Soberon, 2010).
Mundo de Hutchinson. Llamado de esta manera porque se supone que

la dispersión no es una limitante al área ocupada, que era una hipótesis implícita en el
artículo de Hutchinson (1957). Especies con amplia capacidad dispersiva, o de
distribuciones continentales pueden ser buenos ejemplos.
 Todas las ausencias tienen una sola causa (medio ambiente inadecuado).
 Las presencias se deben a un único factor, por lo que todos los errores
de comisión se deberían a una pobre estimación de un factor para el cual
existen datos (variables ambientales).
 En este escenario Go = A y los métodos basados en presencias solas harán un
buen o mal trabajo de estimar ambas zonas por igual.
Un post-proceso utilizando hipótesis biogeográficas para recortar el área estimada

puede ser innecesario.
Mundo de Wallace. Llamado así porque el factor limitante para establecer

el área ocupada Go es la capacidad de dispersión. Especies limitadas a ambientes muy
particulares (cuevas, pequeños cuerpos de agua, etc.) pueden ser ejemplos de este
escenario.
 Todas las ausencias tienen una sola causa (la incapacidad de dispersarse).
 Las presencias se deben a un único factor, por lo que todos los errores
de comisión se deberían a una pobre estimación de un factor para el cual no
existe información (la dispersión).
 En este escenario A contiene a Go y los métodos basados en presencia solas, en
el mejor de los casos, proveerán de una estimación más o menos completa
de A.
 Los problemas de Mundo de Wallace representan un reto MUY DIFICIL para
cualquier algoritmo de ENM.
 Probabilidades y el BAM
Basado en Soberon y Nakamura, Elith & Phillips, Phillips Y Dudik
La cantidad fundamental en la que esta uno interesado es la probabilidad de que la

especie este presente (Y=1) dado que:
1) Se está en el pixel x, o bien
2) Se está en el ambiente z.
Esta es una probabilidad indisolublemente asociada a los métodos de observación,

pero no entraremos en este problema. Nótese que está definida para un pixel (x) o
para los ambientes tipo z. O sea, para cada pixel (o clase de ambientes), el valor puede
ser de 0 a 1.
El conjunto de pixeles para los cuales p(Y=1|x) > u donde u es un cierto valor umbral,
es Go. Vemos entonces que p(Y=1|x) viene siendo el Santo Grial de la persona
interesada en modelar el Área de Distribución.
Cuando se cuenta solamente con datos de presencias, estimar p(Y=1|x) es muy difícil.
De hecho es imposible sin recurrir a hipótesis y/o datos auxiliares. Aplicando el
teorema de Bayes se llega a una ecuación que es fundamental en la teoría de SDM, que
es la Ecuación (1):
La probabilidad p[z(x)|Y=1] es la probabilidad de estar en el ambiente z dado que se

sabe que la especie ha sido observada. Es, en otras palabras, la densidad de
probabilidad de ambientes en los sitios en lo que existe un dato de observación. La
probabilidad p[z(x)] es la densidad de los ambientes existentes en el área de
referencia. Finalmente, la probabilidad p(Y=1),llamada la "prevalencia", es la
probabilidad de observar a la especie en la totalidad del área de referencia G. Sin
datos de ausencias estrictas, la prevalencia es "indiscernible" (Dudik & Phillips, 2009).
Como se discute en la sección sobre Maxent, el "raw output" de Maxent es un
estimado, basado en minimizar la entropía relativa de la razón de las dos densidades
en el lado izquierdo de la ecuación (1). En cambio el "logistic output" de Maxent
intenta ser una estimación, bajo ciertos supuestos, del primer miembro de la ecuación
(1), que es la probabilidad de presencia en un ambiente dado.
Hasta este momento, la cantidad p(Y=1|x) es una cantidad de tipo estadístico. No se le

ha dado ninguna estructura biológica. Sin embargo, el diagrama BAM sugiere que este
número deberá de ser alto en caso de que se cumplan los supuestos del BAM, y muy
bajo o cero de no ser así. Esto sugiere una hipótesis: la probabilidad de estar presente,
dado que se está en el pixel x, con ambiente z(x), debe ser igual a la probabilidad de
que el ambiente pertenezca al nicho fundamental, y que el pixel x sea accesible. Esta es
la ecuación (2) a la derecha, que relaciona argumentos puramente estadísticos con
una formulación más mecanística (Peterson et al., 2011).
 Ecología de Poblaciones y el BAM

Esta sección está basada en el artículo de Soberon (2010). La idea clave que se usa
para relacionar el diagrama BAM con los conceptos fundamentales de ecología de
poblaciones es la siguiente: Se definen subdivisiones de espacio geográfico basadas en
las propiedades demográficas de las poblaciones; esto es, las subdivisiones
de G están basadas en las tasas de crecimiento poblacional de las poblaciones de la
especie. Por ejemplo: el área ocupada (Go) se expresa como el conjunto de celdas en
la retícula donde hay poblaciones fuente, esto es, donde la tasa de crecimiento
poblacional en ausencia de migrantes es positiva.
Entonces, en una retícula de extensión geográfica y resolución arbitraria, se usa como

criterio para decidir si una celda pertenece a Go o a GI o a A las propiedades
demográficas de la especie. Estas propiedades se pueden hacer corresponder,
heurísticamente, con las distintas partes del diagrama BAM. Si se denota con el
símbolo xi,g(t) la densidad de la especie i en la celda g al tiempo t, la tasa de
crecimiento poblacional se puede describir con la ecuación que aparece abajo. Hay
tres términos en esa ecuación:
1. Un término denso-independiente, ri,g, que representa la tasa intrínseca de

crecimiento. Este término solamente depende de las condiciones ambientales y
no está afectado por depredadores, competidores o mutualistas. Este término
se relaciona con el circulo A del diagrama BAM, está definido únicamente por
variables scenopoéticas y se relaciona directamente con
la expresión geográfica del nicho Grineliano.
2. Un segundo término i,g que representa los cambios denso-dependientes y
relacionados con la presencia de los interactores. Este término se relaciona con
el círculo B del BAM, y se relaciona con el nicho Eltoniano.
3. Finalmente, un tercer término, que representa cambios en la tasa de
crecimiento debidos a la inmigración a la celda g y emigración de ella. Este
término define implícitamente el circulo M, ya que mediante una matriz de
adyacencia M se pueden representar todas las celdas accesibles a cualquiera
otra celda.
Resolver las ecuaciones de abajo es muy difícil, salvo para

situaciones ridículamente simplificadas (Soberon, 2010). Sin embargo tienen la
ventaja de que sirven para definir rigurosamente las regiones del BAM, sobre la base
de procesos poblacionales que en principio se pueden estudiar experimentalmente:
1. La region A es la zona donde la tasa de crecimiento intrínseca es positiva.

2. La región Go es la zona donde la tasa instantánea es positiva, y se han recibido
migrantes en algún momento del pasado.
3. La región GP es la zona donde la tasa instantánea de crecimiento es positiva,
con o sin migrantes (esto implica que solamente se puede establecer por
experimentos)
Una de las consecuencias de analizar el diagrama BAM sobre la base de ecuaciones de

crecimiento poblacional es que se puede mostrar que si la estructura espacial de los
factores Grinelianos es de grano grueso, y la de los factores Eltonianos es de grano
fino, el efecto Grineliano domina al estudiar el área de distribución, lo cual provee de
una explicación sobre la razón por la cual los métodos de ENM muchas veces
funcionan bien en ausencia de datos biológicos (Soberon, 2010).
Las dos formas de la cantidad fundamental a estimar: la probabilidad de que la
especie este presente.
Descomposicion de la probabilidad fundamental en tres componentes, usando el
teorema de Bayes.
Mundo Clásico
Mundo de Hutchinson
Mundo de Wallace
 Definiciones
Definiciones relacionadas con el espacio G, e ilustradas en la figura de abajo.
A: La región del planeta donde se encuentran las condiciones scenopoéticas

favorables a una especie. Por ejemplo, todos los sitios con un clima parecido al de los
Bosques Mesófilos de Montaña de México posiblemente tuvieran
condiciones scenopoéticas favorables para el quetzal Pharamachros mocinno.
Área Ocupada (símbolo GO): La región del planeta donde la probabilidad de

encontrar a una especie (históricamente, suponiendo efectos antropogénicos
despreciables) seria alta. Es también, por hipótesis, la región donde coinciden los
factores A, B y M del diagrama BAM. Por ejemplo, los Bosques Mesófilos de Montaña
de los estados de Oaxaca y Chiapas eran la GO histórica del quetzal P. mocinno).
Área Invadible (símbolo GI): La región del planeta en donde, además de condiciones
scenopoéticas favorables, existe un ambiente biótico adecuado para la especie.
G-espacio: Una región del planeta, expresada como una retícula en un sistema
de información geográfica. Un espacio G tiene una extensión (México,
Norte América el Hemisferio Occidental...) y una resolución (tamaño de las celdas en
la retícula. Por ejemplo, en grados, 1 grado, 1/2 grado, 1/4 de grado... o en km de lado,
1 km, 10 km...).
Proyección. La operación de hacer corresponder a cada punto en la superficie del

esferoide de la tierra, otro punto en una área plana. Hay varios tipos de proyecciones
(Mercator....). Sin proyectar, no se puede, estrictamente, tomar medidas de distancia ni
de área en un mapa.
Región de Accesibilidad (símbolo M). Una región del planeta que la especie ha
podido "muestrear", en el sentido de haber sido accesible a propágalos, dispersores,
individuos migrantes, durante un cierto periodo de tiempo.
 Definiciones relacionadas con GIS
 Definiciones relacionadas con los datos
Datos primarios. Los que ubican un individuo de una especie en un lugar, en un

punto en el tiempo. Existen datos primarios con base en observaciones o con base en
ejemplares. Los datos basados en ejemplares son preferibles ya que se pueden
verificar.
Datos secundarios. Los que dependen de interpretación, generalización, promediado,

etc. de datos primarios.
Datos de no-presencia
Ausencias estrictas: Datos que documentan de manera explícita la ausencia de una

especie de algún sitio. Son datos que requieren haber realizado inventarios
cuidadosos, usando los métodos apropiados, y por el tiempo necesario. Tienden a ser
datos muy poco frecuentes en países grandes y/o con poca infraestructura
institucional.
Pseudoausencias: Son datos generados por algún método que pretende simular
la información de ausencias estrictas, por ejemplo, se toman al azar de la región G
pero con la restricción de estar a una distancia d de la presencia más cercana. Esto
genera puntos con más densidad lejos de las zonas donde se han observado los
puntos. Su uso es muy poco frecuente, ya que hay toda clase de
problemas teóricos con su generación. GARP los genera al azar.
Transfondo (background): Son datos tomados al azar de la región de interés y

pretender utilizarse para caracterizar el ambiente en general, no específicamente
aquel donde la especie esté ausente. En otras palabras, puede ser que un dato de
presencia y uno de trasfondo estén muy cerca uno de otro, o incluso en el mismo
lugar. Se pueden usar con métodos como GLIM o GAM, sujetos a
la interpretación correcta (Perce & ; Cherry &...). Son especialmente adecuados en
Maxent.
Datos de presencias. Los datos derivados de la observación, o la captura de un

individuo de una especie en un sitio y tiempo dado. En general no implican la
existencia de una población viable.
 Definiciones relacionadas con el

espacio E, e ilustradas en la figura de
abajo.
E-espacio: Un espacio abstracto, compuesto por las n variables scenopoéticas
utilizadas para representar las condiciones ambientales que una especie tolera.
Habitualmente compuestos por variables bioclimáticas o topográficas o ambas. Es
frecuente utilizar también transformaciones de estas, como componentes principales.
Abajo se ilustra uno en dos dimensiones, para 150,000 puntos del Hemisferio
Occidental. Un E-espacio hereda ciertas propiedades del G-espacio del que se obtiene
(resolución de los puntos, por ejemplo).
Nichos Grinnelianos: Un subconjunto del espacio E (o sea, compuesto por variables

scenopoéticas). Los nichos definidos a continuación son todos Grinnelianos.
Nicho Fundamental (símbolo NF): El conjunto de condiciones scenopoéticas que
permiten que una especie sobreviva (que su tasa intrínseca de crecimiento sea
positiva). Generalmente imposible de medir, pero se puede aproximar mediante
experimentos fisiológicos o primeros principios biofísicos (Kerany & Porter, Kearny,
Buckley). Es la elipse de color rojo en la ilustración abajo.
Nicho Fundamental Existente (Símbolo N*F): La intersección del nicho fundamental

con el espacio de variables existente E. En un tiempo dado, las combinaciones de
variables ambientales existentes y que además pertenecen al nicho fundamental. Son
todos los puntos (rojos y azules) dentro de la elipse en la ilustración abajo.
Nicho Realizado (Símbolo NR): Lo que queda del nicho fundamental existente
después de las interacciones con especies competidoras, parasitas, depredadores, etc.
Son los puntos azules del diagrama de abajo.
Scenopoéticas (variables): Son variables no interactivas de una especie. Las

condiciones medioambientales que permiten a la especie sobrevivir. La característica
de estas variables (Hutchinson, 1973) es que su dinámica no es modificada por la
presencia o ausencia de una especie en particular. Se trata de condiciones dentro de
las cuales una especie sobrevive o no. Ejemplos: La temperatura media del mes de
febrero, la elevación sobre el nivel del mar. Una variable NO scenopoética es, por
ejemplo, la cantidad de semillas usadas por una especie de ratón presente en una
zona.
 Antes que nada: el diseño del estudio
El peor error que se puede cometer en un proyecto de ENM/SDM es actuar
"en automático", confiando en el software sin entender el problema biológico en lo
que se refiere a los factores que afectan el área de distribución y las características
del método que se usa para modelarla. Las preguntas esenciales son las siguientes
 ¿Con qué tipo de datos se cuenta? Si se cuenta con datos de ausencias

verdaderas, la estimación de la probabilidad de presencia y por lo tanto área de
distribución real Go es posible. Si, como es frecuentemente el caso, solamente
se cuanta con datos de presencias, el objeto que se estima esta mucho menos
bien definido. Generalmente se supone que los métodos de presencias estrictas
(no hay datos de ausencias) estiman un objeto intermedio entre el área
ocupada Go y el área potencial A en el diagrama BAM (Jiménez-Valverde et al.,
2008).
 ¿Cuál es la configuración BAM de su problema? Un problema en el que se

asume que la especie ha sido capaz de muestrear totalmente la región de
ambientes favorables, o sea, en la que M contiene a A, se denomina
caso Hutchinsoniano, y es el óptimo para modelar. Corresponde a especies sin
restricciones en sus movimientos, que se supone que en el pasado han sido
capaces de muestrear ambientes favorables y desfavorables. Otro extremo es
aquel en el cual se considera que la región favorable a la especie (A) contiene
completamente a la zona de movimientos. Este es el caso Wallaciano, el más
difícil de modelar. Corresponde a especies que habitan endémicamente islas o
regiones muy pequeñas. A menos que se cuente con datos exhaustivos de
presencia, los modelos en estas situaciones son difíciles de interpretar. El
caso Clásico, como su nombre indica, es el más común y la dificultad para
modelarlo es intermedia.
 Definición de las áreas de referencia G y de M. Casi todos los métodos de

SDM/ENM se afectan por la selección del área de referencia G.
Solamente BIOCLIM es invariante a cambios en G, y en este caso definir un
área G más o menos grande tiene implicaciones solamente para las
extrapolaciones. Las muestras del "background" deben de provenir del área M,
que es, teóricamente, la que la especie ha muestreado en su historia (Barve et
al. 2011). GARP utiliza el área de referencia M para obtener valores de
"pseudoausencias" que se usan al calcular una regresión log-lineal. Entonces,
para GARP una M más grande puede ser beneficiosa al proveer de verdaderas
ausencias. Para GARP es preferible utilizar áreas de referencia bastante más
grandes que las que se espera correspondan a Go. Maxent utiliza el área de
referencia para obtener la distribución "nula" de tipos de espacios climáticos.
Maxent trata de minimizar la "divergencia" entre la distribución que replique
los valores observados y aquella calculada con el modelo nulo. Entonces, si se
usan áreas M muy pequeñas en relación a la Go esperada, Maxent va a tratar
simplemente de replicarlas. Es preferible utilizar, como en GARP (pero por
razones distintas) áreas M bastante mayores que la Go esperada.
1. Las recomendaciones.
 Si tiene ausencias utilice métodos de regresión. Si no cuenta con
ausencias, utilice Maxent o GARP.
 Si su especie es un caso claro Wallaciano, de una especie que nunca ha
podido muestrear más ambientes que los favorables, probablemente
sea preferible no modelarla, en cualquier caso, sea explícito respecto a
esta situación.
 Defina biológicamente su área de referencia M, en la duda,
generalmente de tamaño mayor que el esperado de Go.
 La región M debe contener todos los puntos conocidos de ocurrencias
de las especie, esto es, no deben usarse cotas "políticas"
 Distinga bien qué tipo de salida da su algoritmo: probabilidades, índices
de similitud, pertenencia a conjuntos...
 ¿Qué datos debo incluir?
Tres clases de datos:
1. De la mejor calidad posible para el problema en cuestión. Esto es, no existen

datos intrínsecamente buenos, solo datos inadecuados, o inapropiados,
en relación con una pregunta, y obviamente.
2. Bien documentado. Cuál es la fuente, cual es la resolución, cuál es su
incertidumbre...
3. De preferencia, accesibles públicamente de tal forma que el análisis sea
replicable.
Principalmente se usan datos de ocurrencias y capas climáticas. Los primeros

generalmente requieren estar organizados en tablas con formatos especificados, .txt o
.csv, según el programa que se use. En general, estos datos se pueden manejar
simplemente usando Excel.
Los formatos que se utilizan para representar los datos climáticos son frecuentemente
tipo raster, y el usuario debe tener la capacidad de procesarlos utilizando software de
GIS. ArcGIS, Idrisi, e incluso DIVA_GIS permiten transformar entre formatos de raster,
como .asc o grid.
 Selección de un método apropiado

Choosing particular algorithms for niche modeling can be challenging, given that each
previous study seems to have its own preferences and its own clear advantage. As a
result, no clear signal emerges as to which is the best platform for such analyses. What
is more, a plethora of comparative analyses of different niche modeling
algorithms (Elith et al. 2006, Stockman et al. 2006, Guisan et al. 2007, Ortega-Huerta
and Peterson 2008, Wisz et al. 2008) presents a similar diversity of results. Of these
evaluations, it turns out, some are flat-out erroneous (Stockman et al. 2006) and some
are based on inappropriate assumptions (Elith et al. 2006). Some of these
complications associated with model comparisons and comparative evaluations are
treated in Peterson et al. (2008) and McNyset and Blackburn (2006). Still other
researchers argue for seeking consensus among results from many algorithms (Araújo
et al. 2005, Marmion et al. 2009), although even these ideas are not agreed upon
completely. The end result, then, is that no solid guide is available to help us with
choosing among the many choices.
What is clear, however, is that many options exist. The requirements for a useful
algorithm include the following:
1. If the available data is presence only, use either envelope methods

(Bioclim, Mahalanobis distance) or machine learning methods (GARP, Maxent,
Neural Networks). If true-absence data is available, use regression methods
(GLIM, GAM, Regression Trees).
2. The method must have the potential to respond to complex structures in
the E-space. That is, if species’ responses to environmental variables are non-
linear, a linear model will not suffice. In this sense, in general, extremely simple
approaches such as BIOCLIM (Nix 1986) or DOMAIN (Carpenter et al.
1993) are not recommendable unless the data has been explored first and
presences in E-space have box-like or ellipsoidal structures. Approaches
capable of replicating complex responses to presence-only data include the
maximum entropy Maxent (Phillips et al. 2006) and genetic algorithms like
GARP (Stockwell and Peters 1999).
3. The algorithm should not be overly “data hungry.” That is, some very
powerful algorithms tend to require large amounts of input occurrence data to
function effectively (Wisz et al. 2008), which are rarely available in niche
modeling applications.
4. Using too few data runs the risk of providing a very narrow model. Too
many data tend to create “overfitting” problems. What is too few? Depends on
how well the occurrence points represent the –unknown—range of
preferences of the species. GARP has been shown to be rather tolerant to small
datasets, so a rule of thumb is that more than 10 occurrence points at distinct
localities may be the lowest safe number. What is too many? Maxent is
sensitive to large numbers of occurrences, in the sense that it becomes a fitting
exercise with low capacity for extrapolation. This is not bad if Go is being
modeled and if points are known to come from the extreme localities of a
distribution. If extrapolations are required, more than a few hundred data
points are unadvisable.
In this guide, we present three niche modeling algorithms in detail: Maxent, GARP and
Bioclim. GARP and Maxent perform similarly (Peterson et al. 2008) (contra Elith et al.
2006), are both powerful in characterizing ecological niches, have both been applied
widely, and often yield complementary results. This latter point is apparent in that
while GARP may err on the side of producing overly broad results, Maxent often errs
on the side of overfitting, so the two together provide a quite-useful
counterpoint (Papeş and Gaubert 2007). In the following modules, then, we treat
requirements regarding data input, model calibration strategies, model evaluation
strategies, and many other topics in niche modeling.
 Maxent
1. Que hace Maxent y cómo. Qué calcula. Los detalles de esta sección se
encuentran en el documento al pie (Las Salidas de Maxent). Maxent es un
algoritmo cuya teoría esta sumamente bien entendida (Elith et al. 2011,
Phillips y Dudik, 2008) y que en la práctica ha demostrado dar buenos
resultados. Sin embargo es un método que tiende a "abrazar" mucho los datos.
Esto es, es mejor para "interpolar" entre puntos de ocurrencia que para
predecir áreas no observadas. Abajo se incluye el documento tutorial de
Maxent escrito por su autor, S. Phillips, y otro documento con prácticas
sugeridas sobre el uso de Maxent.
2. Qué parámetros tiene. En la tabla de la derecha se comentan los
principales settings de Maxent.
3. Salidas. Sentido de Raw y Logistic. La salida cruda de Maxent es una medida
de similitud de los ambientes en cada pixel a los pixeles donde la especie ha
sido observada. Podría considerarse como una aproximación a la distribución
potencial. Para cualquier retícula realistamente grande, los valores del raw
output de Maxent son muy pequeños (deben sumar a uno sobre todos los
elementos de la retícula). En cambio, bajo el supuesto de que se puede asignar
un valor conocido de probabilidad de observación a los pixeles llamados
"típicos", se considera que la salida logística de Maxent es una aproximación a
la verdadera probabilidad de presencia. El usuario debe decidir cuál es ese
valor de probabilidad típica. Maxent asigna un default de 0.5. No se recomienda
cambiarlo. El segundo documento incluido abajo es una explicación más
detallada de las salidas de Maxent.
4. Maxent y Point Processes. Publicaciones muy recientes muestran
matemáticamente que Maxent es esencialmente equivalente a un proceso
de estimación Puntual de distribución de Poisson con los puntos del
background adecuadamente ponderados. Sugerimos consultar los artículos de
Fithian & Hastie (2012) y Royle et al. (2012) incluidos abajo.
5. FCF = Frequently Commited Fuckups.
1. Confundir la salida legista con la salida cruda.
2. Usar la salida cruda desde el valor más chico.
3. No saber asignar un umbral para decidir si Y=1.
4. Usar como salida la "imagen"( el .jpg) del mapa de Maxent.
6. Recomendaciones.
1. Explorar los efectos de cambiar los defaults.
2. Usar la salida logística.
3. Usar como umbral de probabilidad la mínima de los puntos de
ocurrencia (Least Observed Value Threshold).
4. Aprender a manejar archivos .asc de ArcMap.
La pantalla original de Maxent
 Parámetros de Maxent
Sugerencias para experimentar
Create response curves
Esta opción es útil para una visualización rápida de las formas de las respuestas, pero
no son substituto de un análisis detallad por Jacknife.
Make pictures of predictions
Provee imágenes de la proyección geográfica de los resultados del modelo.
Do Jacknife to measure variable importance
Esta opción es muy útil, ya que permite un análisis de la contribución de cada variable
a las características finales del modelo (Peterson y Cohoon, 1999). Las gráficas de
salida son particularmente informativas.
Output format
Como se describe en el documento anexo (abajo), la opción de
salida logística representa un intento de estimar la probabilidad de presencia en cada
pixel, bajo un supuesto simplificador representado por el parámetro llamado "default
prevalence", que se asume igual a 0.5. La salida cruda es un estimado de la
probabilidad de estar en un pixel x, dado que se observó a la especie. Las salidas
crudas y logísticas tienen una relación monotónica, pero no lineal. La salida
acumulativa se usa muy poco.
Output file type
Se usa generalmente la salida tipo "asc" que puede ser importada por un SIG.
Auto features
Generalmente se utiliza el default.
 GARP
1. Qué hace GARP y cómo. Qué calcula.
GARP (Genetic Algorithm for Rule Production) es un algoritmo genético que encuentra
regiones del mapa que son similares a las de los puntos de entrenamiento. Funciona
poniendo a "competir" algoritmos radicalmente diferentes (dos versiones de una caja
bioclimática, una regresión log-linear, que usa como ceros datos del background, las
llamadas "reglas atómicas" y en algunas versiones, un método de clasificación llamado
e-balls) para clasificar las presencias (observadas) y las ausencias (inventadas con las
muestras del background). El resultado es una combinación de reglas lógicas que
describen diferentes combinaciones de los algoritmos que replican más
correctamente las presencias y las seudoausencias. El método balancea de manera
diferente los errores de omisión (clasificar como ausencias los datos de presencias) y
los de comisión (clasificar como presencias datos del background). Los errores de
omisión son mucho más graves en SDM/ENM que los de comisión, por lo que
distinguirlos es una de las cualidades más importantes de GARP.
GARP genera soluciones estocásticamente por lo que es indispensable correr al menos
unas n > 100 simulaciones por conjunto de datos para luego superponerlas y obtener
un numero entero (entre 0 y n) que describe el grado de consenso del algoritmo para
identificar regiones similares a las de las ocurrencias y disimilares al "background". El
resultado de n corridas de GARP se puede usar para mapear y desplegar la predicción
sobre qué tan similares son las zonas de la región de referencia a aquellas donde la
especie fue observada. GARP no da "probabilidades" de ningún tipo, sino un índice de
que tan favorables son los ambientes a los requerimientos de la especie.
2. Parámetros y defaults. Se recomienda:
1. Se debe usar la configuración de "rule types" como aparece por default.

2. No modificar el parámetro de "At least 20 training points"
3. El porcentaje de puntos utilizados para "model training" puede ser más alto si
se tienen muy pocas ocurrencias. Con menos de 15 puntos, por ejemplo, es
preferible usar el 100% para training
4. Number of runs entre 100 y mil.
5. Se puede bajar el "convergence limit" a 0.001 para entrenar modelos más
ajustados a los datos.
6. El balance entre omisión y comisión se explica en el documento anexo.
7. En la ventana de "how layers will be used" usar para explora el papel de las
variables las opciones "All combinations of selected layers"
3. FCF = Frequently Committed Fuck-ups.
1. Hacer una sola corrida de GARP.

2. No entender cómo funcionan los "best subsets" (consultar Anderson Lew,
Peterson 2002)
3. Incluir datos categóricos
4. Recomendaciones
1. Obtener de 100 a mil replicas.

2. Explorar diferentes configuraciones de "best subsets"
Abajo se anexa una descripción detallada de la forma de usar GARP escrita por A. T.
Peterson
 Bioclim en DIVA-Gis
Un paquete de software muy fácil de usar es el llamado DIVA-GIS, que contiene una
buena cantidad de herramientas para depurar y organizar los datos, así como una
implementación del método llamado Bioclim, el más simple que existe (simple porque
es fácil de entender y visualizar, porque no es afectado por el "área de referencia" y
porque se puede programar hasta en Excel).
Usaremos como ejemplo una mariposa mexicana, Baronia brevicornis. Los datos de
presencias fueron obtenidos de la REMIB, y la fuente original es la Colección de
Lepidopteros del Instituto de Biología de la UNAM
1) Los datos de ocurrencias tienen el formato que se ejemplifica la siguiente tabla. Se

trata simplemente de las coordenadas decimales de las ocurrencias de la especie en
tal y como están registradas en la colección de donde provienen los datos.
La precisión real de estos datos es probablemente de una centésima de grado, o
alrededor de 1 km. La tabla completa se puede descargar del archivo anexo al final.
Name: B_brevicornis
Longitude: 18.5
Latitude: 49
Name: B_brevicornis
Longitude: 19
Latitude: 48.7
La tabla se importa a DIVA-GIS como un "shape file" de puntos, y los puntos se ven
en E y en G como se ilustra abajo.
2) Los datos climáticos se importan, por ejemplo de WorldClim, a DIVA-GIS, y se crea

un "stack" con las variables scenopoéticas seleccionadas.
3) Se procede a correr el modelo, el cual es una simple "caja" rectangular que rodea
los puntos extremos (el rectángulo amarillo en la figura).
4) Bioclim construye rectángulos menos incluyentes, que corresponden a dejar fuera

un x % de puntos (por ejemplo, conservar el 90% más interno, el 80%...). Bioclim
genera un índice de "calidad" de cada punto en la caja, que es más alto mientras más
interna es la caja. Por ejemplo, los puntos cerca del centro del rectángulo tienen un
valor alto, los puntos cerca de la periferia, un valor bajo.
Recomendaciones. Bioclim jamás debe usarse sin haber realizado

una exploración preliminar de los datos en el espacio E. Por ejemplo, en el ejemplo de
la figura, los puntos rojos (las observaciones) tienen una tendencia que hace que el
extremo superior izquierdo del rectángulo contenga muchos puntos que en realidad
están alejados de las observaciones. En este caso Bioclim podría sobrepredecir muy
sustancialmente el área Go.
FCF:
1) Usar Bioclim sin constatar primero que los datos de presencias no tengan
tendencias en el espacio E. En otras palabras, Bioclim no debe usarse cuando los
puntos de presencia en E tienen correlaciones.
2) Creer que los números que Bioclim asigna a los puntos del espacio son
"probabilidades".
Y los puntos aparecen como se ve arriba en el espacio geográfico G.

Y como se ven en un subconjunto del espacio E compuesto por dos variables
(Precipitación anual en mm y Temperatura promedio en centígrados x 10) :
 Métodos Estadísticos
Cuando la investigadora es tan afortunada (o aplicada) para contar con datos de
ausencias estrictas (como los de la tabla de abajo), se pueden aplicar métodos de
regresión para estimar el Santo Grial, que es la probabilidad de presencia
condicionada al ambiente: p(Y=1|z). Los datos de ausencias estrictas son series de 1 y
0 (asociadas a las coordenadas, lo cual permite obtener los parámetros ambientales).
La modelación de este tipo de datos se conoce desde hace mucho tiempo, empezando
con el método más simple, que es el modelo lineal, pasando por el modelo logístico, los
modelos lineales generalizados (GLIM), los modelos aditivos generalizados (GAM) y
los árboles de regresión en sus diversas variantes. Una revisión reciente de estos
métodos se encuentra en Franklin, 2009.
Primer punto importante: recordar que ausencias estrictas no es lo mismo que

pseudoausencias, ni que “background”. Ausencias estrictas significa que alguien
realizó un inventario por el tiempo suficiente, y los métodos adecuados como para
concluir que en una cierta localidad (con z ambiente) la especie está ausente. O no
existen poblaciones “fuente” detectables de dicha especie. Eso es un 0.
Segundo punto. Habiendo datos de ausencias estrictas se pueden ajustar varios

modelos tipo regresión para acercarse al Santo Grial de la modelación de nichos, que
es la probabilidad de la presencia condicionada al ambiente (1) a la derecha:
Del cual sale de forma obvia la probabilidad de la ausencia, puesto que ambas suman
1. El más simple modelo para ajustar la probabilidad de presencia es modelo lineal
(ecuación 2), que prácticamente nunca se usa, entre otras cosas, porque no está
acotado, y podría dar valores de probabilidad menores que cero o mayores que uno .
El termino épsilon representa errores normalmente distribuidos con media cero y
variancia 1.
Un modelo que resuelve el problema de acotar los valores de probabilidad, es el

llamado “modelo logístico”, que aparece abajo (ecuación 3): que se transforma de la
siguiente forma:
En otras palabras, se ajusta un modelo lineal a la transformación “logit” (el logaritmo

de la razón de la probabilidad de presencia a la probabilidad de ausencia). El logit
puede variar desde menos infinito a más infinito, y la correspondiente probabilidad se
mueve entre 0 y 1, como debe hacer toda probabilidad, tal y como se ilustra en la
figura a la derecha:
El método más deseable para ajustar este modelo es utilizando Generalized Linear
Models (GLIMs), disponibles en una gran variedad de programas estadísticos, incluido
R.
En el GLIM se ajusta la serie de unos y ceros como función de los datos ambientales
utilizando el “link” logit, con una distribución de errores binomial.
En un GLIM, se presupone un modelo para los datos (el modelo logístico en el caso
anterior). Cuando el énfasis del problema está puesto en reproducir los datos de
manera muy justa, sin preocuparse por la extrapolación, se pueden utilizar métodos
no paramétricos (que no suponen un modelo específico). Uno de los más populares es
el llamado GAM (Generalized Additive Model). En un GAM se ajusta la siguiente
combinación lineal (ecuación 4):
Las funciones f(zi) son ajustes de tipo “smoothers” a la vecindad de cada dato. Esto es,
se interpola una función empírica descriptiva (polinomios de 2, 3 u superior orden) u
otras, sin absolutamente ninguna pretensión teórica más allá que la de reproducir de
manera lo más justa posible la estructura observada de los datos. Los GAMs suelen
proporcionar ajustes muy buenos a datos existentes, y es posible (dependiendo del
software usado) reproducirlos o transferirlos a conjuntos de datos nuevos, por
ejemplo, fuera de la región donde se entrenaron los puntos, o con climas diferentes.
Sin embargo estos métodos son extremadamente sensitivos a extrapolaciones. O sea, a
transferir las predicciones a combinaciones ambientales fuera de las utilizadas para
entrenar el modelo.
FCF
1) Sobreajustar, usando cientos de puntos, y luego tratar de transferir, "extrapolando"

a geografías o tiempos distintos.
2) Interpretar erróneamente la salida, que es un estimado del nicho realizado (en E) o

del área ocupada (en G).
. . . (1)
. . . (2)
. . . (3)
. . . (4)
 Validación del modelo

Medidas de desempeño. Validar un modelo consiste en contrastar sus predicciones
respecto a datos considerados independientes para obtener una medida de
1) su significancia en relación con una cierta hipótesis nula, o
2) su desempeño (capacidad de clasificar correctamente nuevos datos).
En esta sección nos vamos a concentrar en medidas de desempeño. La mayor parte de

las medidas modernas de desempeño están basadas en la así llamada matriz
de confusión. En el diagrama de abajo se representa la región ocupada en la realidad
(la "verdad") con el color azul, y la predicción, con el color amarillo. Los puntos de
prueba, (puntos independientes usados para verificar el modelo) pueden caer en
cuatro regiones. Las estrellas están bien clasificadas y los círculos son errores. Así,
puntos caídos en a están correctamente identificados como presencias, y puntos
caídos en d son ausencias correctamente identificadas. Los puntos obscuros son
errores de omisión (b), y los círculos abiertos son errores de comisión. En ENM/SDM
los errores de omisión significan clasificar equivocadamente un dato de gran fuerza,
que es una ocurrencia, tal vez respaldada por un ejemplar físico. Por el contrario, los
errores de comisión significan clasificar como ausentes puntos de muchos tipos, en
donde la especie puede estar ausente por una variedad de razones, o
simplemente no haber sido detectada.
La matriz de confusión. Una "matriz de confusión" (abajo) resume esta información.

Prácticamente todas las medidas de desempeño de los modelos SDM/ENM
(kappa, True Skill Statistic; ver Fielding y Bell 2000 para un buen resumen) están
basadas en combinaciones de estos números.
ROCs y AUCs. Una de las principales herramientas utilizadas para validar ENM/SDM
es la llamada Receiver Operating Characteristic (ROC), una curva que describe la tasa
de identificación correcta de presencias (sensitivity, en las y) contra la tasa de falsas
alarmas (1-specificity, en las x). Cuando se obtienen estos números para un rango de
valores de umbral (para decidir si un punto se debe calificar como ausencia o
presencia), se traza la ROC, que es la línea roja en la figura de abajo. La línea azul es la
que se obtendría si para diferentes valores del umbral se utilizara un clasificador
enteramente aleatorio. La idea de la ROC a su vez da origen al estadístico llamado AUC
(Area Under the Curve), que es el área total bajo la curva roja. Un clasificador aleatorio
tiene una AUC de 0.5. Un muy buen clasificador tiene un área muy cercana a 1 (o a
cero, sorprendentemente!). El estadístico AUC fue desarrollado originalmente para
describir el desempeño de aparatos de radar. A despecho de ser un estadístico de uso
casi universal en la literatura de ENM/SDM, la AUC tiene muchos problemas serios
(Austin, 2007; Lobo et al. 2007; Peterson et al. 2008). Entre otros:
 que requeriría, en teoría, de datos de ausencias verdaderas. En el caso de que

no se cuente con ausencias verdaderas, la abscisa de la ROC no es la proporción
de "falsas alarmas", sino la proporción de área predicha por el modelo.
 Que asigna igual ponderación a los errores de omisión y comisión
 Que (en la mayor parte de las versiones) presupone que el clasificador
(algoritmo de modelación) genera todos los valores del rango [0,1], lo cual no
siempre es cierto (región bajo la línea roja en la figura).
En vista de estos problemas se desarrolló desde hace varios años la idea de

ROCs parciales. En la ROC parcial, como se usa en ENM/SDM, hay las siguientes
diferencias:
 el eje de las abscisas no es la proporción de errores de comisión, sino

el área total predicha por el algoritmo (función del valor del umbral).
 Se establece un parámetro E que es una medida del error que se tolera en las
omisiones (recordar que el error de omisión es más grave que el de comisión)
 El estadístico no es el área bajo la curva completa, sino la razón (a+b)/b, por lo
que un identificador que seleccione presencias y ausencias al azar daría un
valor de 1 (a+b sería igual a b) y un muy buen identificador separaría bien
presencias de ausencias y daría un valor mayor que 1 (Peterson et al., 2008).
Recomendaciones:
1. Familiarizarse con la literatura sobre aplicaciones de ROC a ENM/SDM (Lobo

et al, 2007; Peterson et al., 2008).
2. Utilizar el método de "ROC parcial", usando el programa anexo abajo,
desarrollado por Narayani Barve.
ROC completa, con la tasa de errores de comisión en el eje x y la tasa de identificación
correcta de presencias en el eje de las y. El área total bajo la línea azul (b) es de 0.5
UNA ROC parcial. Se considera únicamente la sección de la curva comprendida entre

el valor de la curva en el punto E. El valor 1-E es la proporción de errores
de omisión mínima tolerada (por ejemplo, 0.05).
 Resumiendo. Lo que se debe hacer y lo que
no se debe hacer
1. Siempre:
 Depure los datos de ocurrencias sobre la base de información de
expertos.
 Documente explícitamente los archivos de autoridades taxonómicas.
 Utilice métodos estandard de georeferenciamiento de datos
 Defina explícitamente las áreas de referencia G y M.
 Seleccione conscientemente y documente las razones para elegir las
áreas de referencia G y M.
 Documente el workflow o "marcha" del análisis (o sea, para cada
especie, documente los valores de parámetros y settings de los métodos
usados).
 Documente las variables usadas, las proyecciones, fuentes de los datos,
fuentes de las variables ambientales.
 Documente explícitamente la salida utilizada.
2. Procure:
 Utilizar el algoritmo adecuado a sus datos. Si tiene datos de ausencias,
utilizar regression trees, o GAMS o GLIMs. Si tiene pocas (< 10 puntos)
presencias, GARP. Si tiene un número relativamente alto (30< n < 500)
de presencias, Maxent.
 Si tiene más de 500 puntos distintos para una especie, considere
"adelgazar" la muestra para evitar sobre-modelación.
 No sobredefinir el problema usando "muchas" capas ambientales
 Tener clara la configuración BAM de su especie. En particular, tenga
mucho cuidado con problemas tipo Mundo de Wallace.
 Si hay puntos suficientes, valide usando ROC parcial.
 En la duda, explicar, documentar, repetir.
3. Evite:
 Utilizar algoritmos poco conocidos o "novedosos".

 Asumir que el usuario entiende lo que se hizo aunque no sea explícito.
 Usar terminología vaga o poco definida. Sea descriptivo. Utilice
términos estandarizados.
 Tipos de datos existentes
 Datos Ambientales
1. Variables ambientales. Son las capas predictoras que se utilizan en los
algoritmos de ENM/SDM. Prácticamente todas son el resultado de
interpolaciones o transformaciones matemáticas de ciertos datos primarios
climáticos o de percepción remota.
1. Selección de variables. Es aconsejable utilizar variables que se sepa
inciden en la ecología de las especies en cuestión (Austin, 2007). Este
autor es crítico de la práctica de usar muchas variables con la esperanza
de que el método computacional sea capaz por si solo de identificar las
mejores.
2. Calidad de las variables ambientales. La calidad (precisión, sesgo,
incertidumbres) de este tipo de variables es rara vez reportada. Sin
embargo es indispensable reportar los metadatos de las variables
utilizadas. Específicamente su fuente, resolución y proyección.
3. ¿Cuántas usar? Generalmente están correlacionadas, por lo que
conviene explorar su covarianza y se puede reducir el número de
variables usando PCA (Hirzel et al. 2002) o seleccionar las variables
crudas más importantes biológicamente desechando las más
correlacionadas (Jimenez-Valverde et al. 2009). En general se debe
evitar utilizar mucho más de diez variables, o más variables que puntos
de ocurrencias.
4. ¿Se usan interacciones? Hay algoritmos como algunas
implementaciones de Maxent que permiten incluir interacciones entre
variables. Esto es necesario para ajustar superficies no lineales y se
debe permitir si se tienen más de 20 datos de ocurrencias.
5. ¿Se usan datos categóricos? En general, evitense. La razón es que la
mayoría de las capas categóricas (como tipo de vegetación) son de baja
resolución y la experiencia indica que es muy fácil confundir a GARP o a
Maxent con uno o pocos puntos georreferenciados marginalmente.
Datos de Ocurrencias y Ausencias
1. Puntos de ocurrencia. Los datos que se deben de usar son los datos
primarios. Los datos secundarios (por ejemplo, provenientes de Atlas) no
deben ser utilizados en ENM/SDM ya que incluyen en general errores e
imprecisiones muy difíciles de corregir.
1. Control de calidad de los datos de ocurrencia.
1. La nomenclatura debe ser consistente respecto a un concepto
taxonómico, y debe de existir una razonable certidumbre sobre
las identificaciones de los ejemplares. Lo anterior implica la
participación de una autoridad en la taxonomía del grupo en
cuestión.
2. La georreferenciación de los puntos debe hacerse de acuerdo a
un sistema internacional estandarizado (Wieczorek et al. 2004).
La CONABIO tiene un manual de georeferenciacion y el proyecto
MANIS tiene otro, llamado biogeomancer. Se puede usar
cualquiera de los dos como referencia de prácticas
estandarizadas de georeferenciación.
3. La resolución de las georreferencias (su radio de incertidumbre)
se debe de filtrar para retener solo los REGISTROS que

cumplan un nivel de precisión adecuado al problema y
razonablemente coincidentes con la resolución de los datos
ambientales (por ejemplo, hay datos provenientes de Atlas con
resoluciones de 50 o 100 km de lado, que no deben jamás usarse
con datos climáticos de 1 km de resolución).
2. Número de datos de ocurrencia. Para poder desarrollar modelos que
incluyan el paso critico de evaluación, se debe contar con un mínimo
aproximado de 40 puntos. Sacrificando el paso de evaluación, la
experiencia indica que aproximadamente 20 puntos son suficientes. Es
posible utilizar muchos menos puntos, siempre y cuando el investigador
tenga experiencia en visualizar el espacio de variables ambientales y en
aplicar métodos exploratorios al modelar. Se recomienda evitar
modelar con menos de 10 puntos y de hacerlo se debe reportar el
detalle del método usado (Wisz et al. 2007). Utilizar muchos cientos de
datos en la fase de modelación es desaconsejable. La experiencia indica
que más de alrededor de 200 puntos puede conducir a modelos
"sobreajustados".
3. Datos de no-presencia. Hay tres clases principales de datos de no-
presencia: ausencias estrictas, pseudoausencias, y transfondo
(background).
1. Los datos de ausencias estrictas, o "true absences" son las
observaciones confiables (generalmente derivadas de un
inventario de campo) sobre la no presencia de una especie en un
sitio. Estos datos permiten el uso de modelos de regresión para
estimar directamente Go. Lo más frecuente es que estos datos no
estén disponibles, y su interpretación no es inmediata, ya que no
es igual "ausencia del área potencial", que "ausencia del área
ocupada". Carecer de ausencias estrictas impide calcular
directamente Go. Cuando se cuenta únicamente con datos de
presencias, estimar Go requiere de datos auxiliares o supuestos
bastante fuertes sobre la presencia de "ambientes típicos"
[Phillips & Dudik] o de "ambientes óptimos" [Luo, 2011].
2. Los datos de pseudoausencias se refieren a datos generados de
manera ad hoc para simular ausencias. Por ejemplo tomando una
muestra al azar de puntos en el área de distribución, como hace
GARP, o especificando una región conocida o hipotetizada como
desfavorable para la especie. Las pseudoausencias deben ser
utilizadas con mucho cuidado, ya que su significado es muy
distinto cuando se trata de una especie con Go muy restringida
respecto a G, en cuyo caso la mayor parte de una muestra de
puntos al azar caerán fuera de Go, o cuando se trata de una
especie con una Go cercana a G, en cuyo caso una muestra al azar
de puntos en G caerán dentro de Go, convirtiendo a las
pseudoausencias básicamente en ruido. Cuando se utilizan
pseudoausencias en modelos de tipo regresión, la interpretación
de los resultados debe tomar en cuenta este hecho [Pearce,
Phillips, Wade]
3. Los datos de "trasfondo" (background en INGLES ). Son

muestras tomadas del área de referencia G completa. Maxent los
utiliza para calcular la Entropía Relativa Mínima (Elith &
Phillips, 2011). Los datos de transfondo, que en Maxent se usan
para generar una hipótesis nula, y los datos de pseudoausencias,
que en regresión se usan como substitutos de ceros, son
conceptualmente totalmente distintos, y no se deben confundir.
1. Fuentes de datos de ocurrencias. Algunas fuentes de datos primarios muy

importantes están abajo. Es indispensable consultar o revisar por expertos los
datos primarios.
1. CONABIO (REMIB). Datos provenientes de 125 colecciones o proyectos.
Son principalmente provenientes del territorio Mexicano. Hay datos de
una amplia diversidad de taxa. Amplia proporción georreferenciados
usando protocolos internacionales. Una parte importante ha sido
revisada taxonómicamente.
2. Unidad Informática para la Biodiversidad, Instituto de Biología,
UNAM UNIBIO. Datos provenientes de las colecciones nacionales de la
UNAM. Existe una significativa superposición con CONABIO, pero hay
muchas colecciones solamente representadas aquí. La georreferencia y
la taxonomía están controladas.
3. Global Biodiversity Information Facility (GBIF). Los datos (más de 300
millones de puntos) provienen de más de 12,700 fuentes. Proveniencia
global. Es la fuente más grande del mundo de este tipo de datos. La
georreferencia es heterogénea, no necesariamente sobre la base de
protocolos estandard, y muchas veces equivocada. La taxonomía es
heterogénea y no controlada.
4. VertNet Incluye las redes Norteamericanas MaNIS, ORNIS, HerpNet y
FishNet. La taxonomía no está controlada. La georreferencia ha seguido
protocolos internacionales.
5. SpeciesLink Incluye datos de unas 250 colecciones. Datos
principalmente de Brasil y Sudamérica, ocasionalmente con especies de
distribución hasta México. La georreferencia está bien documentada,
aunque muchas veces no está presentada a coordenadas. La taxonomía
no está controlada.
6. SEINet. Datos de 27 colecciones sobre plantas del Suroeste de los
Estados Unidos. Contienen muchos datos botánicos mexicanos. La
georreferencia y la taxonomía en general han sido revisadas por
expertos.
7. INBio Contiene datos de muchas especies que existen en México. La
georreferencia es en general de buena calidad, pero no documentada. La
taxonomía está controlada en muchos grupos.
8. Ocean Biogeographic Information System OBIS
9. Australia's Virtual Herbarium AVH. Contiene información sobre muchas
especies invasoras en México. Tanto la georreferencia como la
taxonomía están controladas.
10. Existen innumerables fuentes de datos primarios en colecciones no
digitalizadas y los datos propios de los investigadores. Véase la sección
de control de calidad de los datos.
 Definiciones
Definiciones relacionadas con el espacio G, e ilustradas en la figura de abajo.
A: La región del planeta donde se encuentran las condiciones scenopoéticas

favorables a una especie. Por ejemplo, todos los sitios con un clima parecido al de los
Bosques Mesófilos de Montaña de México posiblemente tuvieran
condiciones scenopoéticas favorables para el quetzal Pharamachros mocinno.
Área Ocupada (símbolo GO): La región del planeta donde la probabilidad de

encontrar a una especie (históricamente, suponiendo efectos antropogénicos
despreciables) seria alta. Es también, por hipótesis, la región donde coinciden los
factores A, B y M del diagrama BAM. Por ejemplo, los Bosques Mesofilos de Montaña
de los estados de Oaxaca y Chiapas eran la GO histórica de el quetzal P. mocinno).
Área Invadible (símbolo GI): La región del planeta en donde, además de condiciones
scenopoéticas favorables, existe un ambiente biótico adecuado para la especie.
G-espacio: Una región del planeta, expresada como una retícula en un sistema
de información geográfica. Un espacio G tiene una extensión (México,
Norte América el Hemisferio Occidental...) y una resolución (tamaño de las celdas en
la retícula. Por ejemplo, en grados, 1 grado, 1/2 grado, 1/4 de grado... o en km de lado,
1 km, 10 km...).
Proyección. La operación de hacer corresponder a cada punto en la superficie del

esferoide de la tierra, otro punto en una área plana. Hay varios tipos de proyecciones
(Mercator,....). Sin proyectar, no se puede, estrictamente, tomar medidas de distancia
ni de área en un mapa.
Región de Accesibilidad (símbolo M). Una región del planeta que la especie ha
podido "muestrear", en el sentido de haber sido accesible a propágalos, dispersores,
individuos migrantes, durante un cierto periodo de tiempo.
 Definiciones relacionadas con GIS
 Definiciones relacionadas con los datos
Datos primarios. Los que ubican un individuo de una especie en un lugar, en un

punto en el tiempo. Existen datos primarios con base en observaciones o con base en
ejemplares. Los datos basados en ejemplares son preferibles ya que se pueden
verificar.
Datos secundarios. Los que dependen de interpretación, generalización, promediado,

etc. de datos primarios.
Datos de no-presencia
Ausencias estrictas: Datos que documentan de manera explícita la ausencia de una

especie de algún sitio. Son datos que requieren haber realizado inventarios
cuidadosos, usando los métodos apropiados, y por el tiempo necesario. Tienden a ser
datos muy poco frecuentes en países grandes y/o con poca infraestructura
institucional.
Pseudoausencias: Son datos generados por algún método que pretende simular
la información de ausencias estrictas, por ejemplo, se toman al azar de la región G
pero con la restricción de estar a una distancia d de la presencia más cercana. Esto
genera puntos con mas densidad lejos de las zonas donde se han observado los
puntos. Su uso es muy poco frecuente, ya que hay toda clase de
problemas teóricos con su generación. GARP los genera al azar.
Transfondo (background): Son datos tomados al azar de la región de interés y

pretender utilizarse para caracterizar el ambiente en general, no específicamente
aquel donde la especie este ausente. En otras palabras, puede ser que un dato de
presencia y uno de trasfondo estén muy cerca uno de otro, o incluso en el mismo
lugar. Se pueden usar con métodos como GLIM o GAM, sujetos a
la interpretación correcta (Perce & ; Cherry &...). Son especialmente adecuados en
Maxent.
Datos de presencias. Los datos derivados de la observación, o la captura de un

individuo de una especie en un sitio y tiempo dado. En general no implican la
existencia de una población viable.
Definiciones relacionadas con el espacio E, e ilustradas en la figura de abajo.
E-espacio: Un espacio abstracto, compuesto por las n variables scenopoéticas

utilizadas para representar las condiciones ambientales que una especie tolera.
Habitualmente compuestos por variables bioclimáticas o topográficas o ambas. Es
frecuente utilizar también transformaciones de estas, como componentes principales.
Abajo se ilustra uno en dos dimensiones, para 150,000 puntos del Hemisferio
Occidental. Un E-espacio hereda ciertas propiedades del G-espacio del que se obtiene
(resolución de los puntos, por ejemplo).
Nichos Grinnelianos: Un subconjunto del espacio E (o sea, compuesto por variables

scenopoéticas). Los nichos definidos a continuación son todos Grinnelianos.
Nicho Fundamental (símbolo NF): El conjunto de condiciones scenopoéticas que

permiten que una especie sobreviva (que su tasa intrínseca de crecimiento sea
positiva). Generalmente imposible de medir, pero se puede aproximar mediante
experimentos fisiológicos o primeros principios biofísicos (Kerany & Porter, Kearny,
Buckley). Es la elipse de color rojo en la ilustración abajo.
Nicho Fundamental Existente (Símbolo N*F ): La intersección del nicho fundamental

con el espacio de variables existente E. En un tiempo dado, las combinaciones de
variables ambientales existentes y que además pertenecen al nicho fundamental. Son
todos los puntos (rojos y azules) dentro de la elipse en la ilustración abajo.
Nicho Realizado (Símbolo NR): Lo que queda del nicho fundamental existente
después de las interacciones con especies competidoras, parasitas, depredadores, etc.
Son los puntos azules del diagrama de abajo.
Scenopoéticas (variables): Son variables no interactivas con una especie. Las

condiciones medioambientales que permiten a la especie sobrevivir. La característica
de estas variables (Hutchinson, 1973) es que su dinámica no es modificada por la
presencia o ausencia de una especie en particular. Se trata de condiciones dentro de
las cuales una especie sobrevive o no. Ejemplos: La temperatura media del mes de
febrero, la elevación sobre el nivel del mar. Una variable NO scenopoética es, por
ejemplo, la cantidad de semillas usadas por una especie de ratón presente en una
zona.
Bibliografía
Anderson, R. P., D. Lew and A. T. Peterson. 2003. Evaluating predictive models
of species' distributions: Criteria for selecting optimal models. Ecological
Modeling 162:211-232.
Araújo, M. B., R. J. Whittaker, R. J. Ladle and M. Erhard. 2005. Reducing

uncertainty in projections of extinction risk from climate change. Global
Ecology and Biogeography 14:529-538.
Austin, M. 2007. Species distribution models and ecological theory: a critical
assessment and some possible new approaches. Ecological Modelling 200:1-
19.
Barve, N., V. Barve, A. Jiménez-Valverde, A. Lira-Noriega, S. P. Maher, A. T.

Peterson, J. Soberón and F. Villalobos. 2011. The crucial role of the accessible
area in ecological niche modeling and species distribution
modeling. Ecological Modelling 222:1810-1819.
Carpenter, G., A. N. Gillison and J. Winter. 1993. DOMAIN: A flexible modeling

procedure for mapping potential distributions of animals and
plants. Biodiversity and Conservation 2:667-680.
Colwell, R. K. and T. F. Rangel. 2009. Hutchinson's duality: the once and future
niche. Proceedings of the National Academy of Sciences USA 106:19644-
19650.
Elith, J., C. Graham, R. Anderson, M. Dudik, S. Ferrier, A. Guisan, R. Hijmans, F.

Huettmann, J. Leathwick, A. Lehmann, J. Li, L. Lohmann, B. A. Loiselle, G.
Manion, C. Moritz, M. Nakamura, Y. Nakazawa, J. M. C. M. Overton, A. T.
Peterson, S. Phillips, K. Richardson, R. Scachetti-Pereira, R. Schapire, J. Soberón,
S. Williams, M. Wisz and N. Zimmermann. 2006. Novel methods improve
prediction of species' distributions from occurrence data. Ecography 29:129-
151.
Elith, J. and J. Leathwick. 2009. Species distribution models: ecological

explanation and prediction across space and time. Annual Review of Ecology,
Evolution and Systematics 40:677-697.
Elith, J., S. Phillips, T. Hastie, M. Dudik, Y. En Chee and C. J. Yates. 2011. A

statistical explanation of MaxEnt for ecologists. Diversity and
Distributions 17:43-57.
Fielding, A. H. and J. H. Bell. 1997. A review of methods for the assessment of

prediction errors in conservation presence/absence models. Environmental
Conservation 24 38-49.
Franklin, J. 2009. Mapping Species Distributions. Spatial Inference and
Prediction. Cambridge University Press, Cambridge.
Good, R. D. 1931. A theory of plant geography. The New Phytologist 30:149-

171.
Grinnell, J. 1917. Field tests of theories concerning distributional

control. American Naturalist 51:115-128.
Guisan, A., C. H. Graham, J. Elith and F. Huettmann. 2007. Sensitivity of

predictive species distribution models to change in grain size. Diversity and
Hirzel, A. H., J. Hausser, D. Chessel and N. Perrin. 2002. Ecological-niche factor

analysis: how to compute habitat-suitability maps without absence
data? Ecology 83:2027-2036.
Hutchinson, G. E. 1957. Concluding remarks. Cold Spring harbor Symposia on

Quantitative Biology 22:415-427.
Hutchinson, G. E. 1978. An Introduction to Population Ecology. Yale University

Press, New Haven.
Jiménez-Valverde, A., J. M. Lobo and J. Hortal. 2008. Not as good as they seem:
the importance of concept in species distribution modelling. Diversity and
Li, W., Q. Guo and C. Elkan. 2011. Can we model the probability of presence of
species without absence data? Ecography doi: 10.1111/j.1600-
0587.2011.06888.x
Lobo, J. M., A. Jiménez-Valverde and R. Real. 2007. AUC: a misleading measure

of the performance of predictive distribution models. Global Ecology and
Biogeography 17:145-151.
Marmion, M., M. Parviainen, M. Luoto, R. K. Heikkinen and W. Thuiller. 2009.
Evaluation of consensus methods in predictive species distribution
modeling. Diversity and Distributions 15:59-69.
McNyset, K. and J. K. Blackburn. 2006. Does GARP really fail miserably? A

response to Stockman et al. (2006). Diversity and Distributions 12:782-786.
Nix, H. A. 1986. A biogeographic analysis of Australian elapid snakes.in R.

Longmore, editor. Atlas of Elapid Snakes of Australia. Australian Government
Publishing Service, Canberra.
Openshaw, S. 1984. The Modifiable Areal Unit Problem. Geo Books, Norwich.
Ortega-Huerta, M. and A. T. Peterson. 2008. Modeling ecological niches and

predicting geographic distributions: a test of six presence-only
methods. Revista Mexicana de Biodiversidad 79:205-216.
Papes, M. and P. Gaubert. 2007. Modelling ecological niches from low numbers
of occurrences: assessment of the conservation status of poorly known
viverrids (Mammalia, Carnivora). Diversity and Distributions 13:890-902.
Pearson, R. G., M. Nakamura, A. T. Peterson and C. Raxworthy. 2007. Predicting

specie's distributions from small numbers of occurrence records: A test case
using cryptic geckos in Madagascar. Journal of Biogeography 34:102-117.
Peterson, A. T. and K. C. Cohoon. 1999. Sensitivity of distributional prediction

algorithms to geographic data completeness. Ecological Modeling 117:159-
164.
Peterson, A. T., M. Papes and M. Eaton. 2007. Transferability and model

evaluation in ecological niche modeling: a comparison of GARP and
Maxent. Ecography 30:550-560.
Peterson, A. T., M. Papes and J. Soberón. 2008. Rethinking receiver operating

characteristic analysis applications in ecological niche modeling. Ecological
Modelling 213:63-72.
Peterson, A. T., J. Soberón, R. G. Pearson, R. Anderson, E. Martínez-Meyer, M.
Nakamura and M. Araújo. 2011. Ecological Niches and Geographic Distributions.
Princeton University Press, Princeton.
Phillips, S. and M. Dudík. 2008. Modeling of species distributions with Maxent:

new extensions and a comprehensive evaluation. Ecography 31:161-175.
Phillips, S. J., R. P. Anderson and R. E. Schapire. 2006. Maximum entropy

modeling of species geographic distributions. Ecological Modelling 190:231-
259.
Soberón, J. 2010. Niche and area of distribution modeling: a population ecology

perspective. Ecography 33:159-167.
Soberón, J. and M. Nakamura. 2009. Niches and distributional areas: concepts,

methods and assumptions. Proceedings of the National Academy of
Sciences USA 106:19644-19650.
Soberón, J. and A. T. Peterson. 2005. Interpretation of models of fundamental

ecological niches and species' distributional areas. Biodiversity
Informatics 2:1-10.
Stockwell, D. R. B. and D. P. Peters. 1999. The GARP modelling system:

problems and solutions to automated spatial prediction. International
Journal of Geographic Information Systems13:143-158.
Udvardy, M. 1969. Dynamic Zoogeography. With Special Reference to Land

Animals. van Nostrand Reinhold, New York.
Ward, G., T. Hastie, S. Barry, J. Elith and J. R. Leathwick. 2009. Presence-only

data and the EM algorithm. Biometrics 65:554-563.
 Curso Febrero 2014
Este es un curso/seminario de dos días dedicado a los aspectos conceptuales de la
modelación de áreas de distribución y de nichos. Leeremos algunos artículos y
revisaremos varios conceptos fundamentales.
Asimismo se realizaran algunos ejercicios con algoritmos y software de amplia

distribución.
El temario es el que sigue:
Primer día (Feb 4)
9:00-10:00 Introducción. ¿Por qué resulta interesante estudiar Áreas de Distribución,

y como es que se relacionan con los nichos?
10:00-11:00 Nicho. Historia del concepto, taxonomía de nichos.
11:00-11:15 Break
11:15-12:15 El área de distribución. Mackey & Lindenmayer, 2001
12:15-13:15 Áreas y nichos. El diagrama BAM, la dualidad de Hutchinson. Soberon &

Nakamura, PNAS
3:00-4:00 ¿De dónde vienen los datos? Ocurrencias, ambientes (Enrique Martínez)
4:00 Preguntas, comentarios dudas, cacayacas…
Segundo día (Feb 5)
9:00-10:00 Principales algoritmos de modelación. Ejemplo anotado de modelación

usando Dismo
Hijmans & Elith Dismo Handbook
10:00-11:00 Ejemplo anotado de modelación usando Maxent (Enrique Martínez)
11:00-11:15, Break
12:15-13:15 Ejemplos de aplicaciones interesantes. Lira & Manthey (2014), Martínez-
Meyer et al (2013), Gaikwad et al 2011
3:00-4:00 ENM/SDM en Conabio (Pilar Rodríguez)
4:00-5:00 Sumario, discusión general
1. Fuentes de datos ambientales.

1. La mejor fuente concentradora de datos nacionales es el portal de
geoinformación de la CONABIO, en la cual se pueden encontrar datos
topográficos, climáticos y satelitales. No toda la información con la que
cuenta CONABIO aparece en esta página, por lo que se recomienda
consultar directamente la existencia de productos específicos.
2. WorldClim. Buena cobertura global de 19 variables bioclimáticas. Hay
serias disparidades regionales en el número de estaciones
meteorológicas utilizadas como datos primarios.
3. La CRU del Tyndall Center. Coberturas globales con datos climáticos a
varias resoluciones. Relacionados con el IPCC, que también contiene
datos climáticos mundiales.
4. El centro EROS contiene entre muchísimos productos, datos

topográficos y sus derivados.
5. Una excelente fuente de datos de percepción remota es el Global Land-
Cover Facility, en el cual existen imágenes MODIS, Landsat y de varios
otros sensores.
6. El programa IGBP-DIS provee datos de variables edafológicas, en
formato GRID, a una resolución aproximada de 10km de lado (5 minutos
de arco). Está basado en datos de FAO.
 Estudios de caso.
 Guía para la elaboración de mapas de distribución potencial
Dr. Roberto Gámez Pastrana
 Modelo de distribución potencial con DIVA-GIS, MAXENT Y
ARCMAP
Introducción
La distribución de los seres vivos es consecuencia de la combinación de múltiples

factores tanto ambientales como históricos, entendidos estos últimos como los
relacionados con eventos geológicos.
Para cualquiera de nosotros resulta claro que algunas especies solo se encuentran
en determinados ambientes a los cuales se han adaptado a lo largo de miles de
años. Así por ejemplo, existen especies que solo se presentan en climas templados,
mientras que otras solo se encuentran en lugares cálidos y húmedos.
Aunque es cierto que la presencia de una especie depende de factores tanto

abióticos (temperatura, precipitación, tipo de suelo, entre otros) como bióticos
(alimento, depredadores, polinizadores, etc.), el clima resulta ser uno de los más
importantes debido a que condiciona de forma importante la ausencia o la
presencia de los seres vivos. Lo anterior resulta ser mucho más evidente en las
plantas dado que, a diferencia de los animales, carecen de la posibilidad de
desplazarse. Por esta misma característica, los estudios de distribución en las
plantas resultan comparativamente más sencillos, ya que en los animales, procesos
tales como la migración o el hecho de que algunas especies ocupan diferentes
ambientes para reproducirse o alimentarse, hace complicada la definición de los
límites ambientales en los que se desarrolla.
Cuando se habla de distribución deben distinguirse dos categorías diferentes: la

real (también llamada ocurrencia) y la potencial. La distribución real se refiere a
los sitios en los que se han observado o colectado individuos y la potencial hace
alusión a las áreas que tienen condiciones ambientales muy similares a los sitios
donde se encuentran las especies y que tienen muy altas probabilidades de estar
ocupadas por estas mismas.
El concepto de distribución potencial resulta ser sumamente útil debido a que

permite salvar en problema de que, en países tan grandes y complejos como
México, resulta prácticamente imposible disponer de información para todo el
territorio.
Este documento está diseñado para ayudarle a determinar áreas de distribución
potencial, a través de una metodología que esperamos que resulte sencilla. Está
enfocada a considerar el clima como el factor de mayor peso en la distribución, por
lo que los resultados que obtenga harán referencia a áreas de distribución
potencial basadas en el clima.
Los análisis se fundamentan en el empleo del programa DIVA-GIS versión 5.7.

DIVA-GIS es un programa gratuito (freeware) cuya elaboración fue apoyada por el
International Plant Genetic Resources Institute (IPGRI), el Centro Internacional de
la Papa (CIP) y el Museo de Biología de Vertebrados de la Universidad de California
en Berkeley, mientras que IDRISI ANDES es un programa comercial desarrollado
por la Clark University de Massachusetts.
La presente guía está organizada en seis secciones que abordan: 1) la instalación

del programa y datos adjuntos; 2) la búsqueda y depuración de la información; 3)
la construcción de mapas de distribución real; 4) la elaboración de mapas de
distribución potencial basados en datos climáticos presentes y proyecciones del
clima para el futuro; 5) la detección de cambios y 6) la interpretación de los
resultados.
Aún cuando el proceso parece largo y complicado, en el momento que empiece a

practicarlo se dará cuenta que es sencillo, lo cual deja claro que lo más importante,
son las ideas y las explicaciones que surgen del razonamiento humano. Ojala que
este documento le sea de utilidad.
Dr. Roberto Gámez Pastrana
Verano, 2011
1. PROGRAMAS Y DATOS COMPLEMENTARIOS
1.1 Instalación de DIVA-GIS
DIVA-GIS, en su versión 5.7, debe ser descargado del sitio web http://www.diva-
gis.org o directamente desde http://www.diva-gis.org/down.htm.
El programa está incluido en un archivo comprimido de formato ZIP, por lo que

será necesario contar previamente con un programa para descomprimirlo tal
como: WINZIP, PKZIP, WINRAR o STUFFIT.
 Salve el archivo en su PC.

 Descomprima el archivo.
 Instale el programa mediante el archivo SETUP.EXE
El directorio de instalación por defecto es C:\Archivos de programa\DIVA-GIS. A

menos que sea necesario no modifique esta ruta y continúe con la instalación.
1.1.2 DATOS COMPLEMENTARIOS.

Dado que los análisis se realizan a partir de datos climáticos, éstos deberán ser
descargados en: http://www.diva-gis.org/climate.htm
De los conjuntos disponibles será necesario descargar los correspondientes al clima
presente (~1950-2000) y futuro (modelo CCM3) a una resolución de 2.5 minutos.
Esta resolución es la más detallada por lo que los archivos son de 256 Mb cada uno.
Los archivos comprimidos deberán ser expandidos en la carpeta:

C:\Archivos de programa\DIVA-GIS\environ\
Dicha ubicación no deberá modificarse por ningún motivo a menos que el programa se
haya instalado en una ubicación diferente a la utilizada por defecto. En dicho caso, los
datos climáticos deben ser expandidos en subcarpeta environ del directorio donde se
hubiese instalado el programa.
En el caso de presentarse algún problema en la instalación o requerir mayor
información sobre el programa, puedes descargar los manuales de usuario en:
IMPORTANTE: Cada uno de los paquetes de datos climáticos requiere un espacio

de casi 750Mb al descomprimirse, por lo que deberá considerar la existencia de
cerca de 1500 Mb de espacio libre en su disco duro.
NOTA: En caso de que por alguna razón no tenga acceso a servicio de red de
banda ancha, tanto los programas, como los datos complementarios pueden ser
proporcionados previa solicitud al siguiente correo: mgamez@uv.mx
http://www.divagis.org/Materials.htm, éstos están disponibles en inglés y español,

aún cuando la versión en español no está completa.
2. BÚSQUEDA Y DEPURACIÓN DE INFORMACION

2.1 Las bases de datos.
En la actualidad numerosas colecciones científicas han puesto a la disposición del
público en general, la información de los ejemplares que se encuentran depositados
en las mismas.
Muchas de ellas, a lo largo del tiempo, han georreferenciado (asignado coordenadas
geográficas) su información. Entre las instituciones y proyectos que proporcionan
información sobre la ocurrencia de especies destacan:
Global Biodiversity Information Facility (GBIF) http://www.gbif.org/
Esta base proporciona información sobre una amplia variedad de grupos biológicos
mediante 285 proveedores que suman 7,445 conjuntos de datos y un total de más de
298 millones de registros. Dependiendo del país, el porcentaje de datos
georreferenciados es muy variable, pero para el caso concreto de México, el 68% de
los 5’298,709 registros posee datos geográficos, correspondientes a 105,428 especies.
Adicionalmente este sitio es muy útil ya que proporciona información sobre la
clasificación de las especies.
VertNet http://vertnet.org/index.php
Es una base global de información sobre vertebrados que comprende 4 grandes
disciplinas:
Herpetología (HerpNET), ornitología (ORNIS), mastozoología (MaNIS) e ictiología
(FishNET).
HerpNET http://herpnet.org/
Es una red global de datos sobre colecciones herpetológicas en la que están
actualmente a disposición del público datos de 5.5 millones de especímenes de 55
instituciones a nivel mundial, incluyendo México.
ORNIS (http://www.ornisnet.org/ )
Es una red especializada en datos de especímenes y registros de aves de Norteamérica
(Canadá, Estados Unidos y México) que incluye información sobre 3.85 millones de
especímenes y 37 millones de registros observacionales.
FishNET http://portal.fishnet2.net/
Es una red que involucra a 29 participantes de 4 continentes que proporcionan
información sobre 31,200 especies de peces; 276,500 nombres comunes; con 48,100
imágenes y 42,900 referencias bibliográficas.
Mammal Networked Information System (MaNIS)
http://manisnet.org/portals.html
Proporciona información sobre mamíferos de 17 instituciones Norteamericanas
AmphibiaWeb http://amphibiaweb.org/
Esta colección de datos contiene información sobre 6,850 especies de anfibios, 1170
mapas de distribución, 6047 referencias bibliográficas, 499 registros de sonidos, 104
archivos de video y 23,045 fotografías de 3,585 especies.
Red Mundial sobre Información Biótica (REMIB)
http://www.conabio.gob.mx/remib/doctos/remib_esp.html
Esta red proporciona información sobre diversos grupos biológicos de más de 5.7
millones de datos curatoriales (de colecciones). Para el caso de estudios que
involucren la biodiversidad vegetal de México, resulta una excelente fuente de
consulta, ya que proporciona datos detallados de ejemplares de colecta depositados
en una gran cantidad deherbarios en el Mundo. En la mayoría de los casos dicha
información está geo-referenciada yes de libre acceso, salvo para los casos de especies
que se encuentren bajo algún tipo deamenaza; adicionalmente la interfase de
búsqueda es en español.
Por este conjunto de ventajas, el procedimiento para la recuperación y depuración de
la información de esta red es la que se aborda con detalle en la presente guía.
No obstante, cualquier información geo-referenciada que haya sido obtenida de
cualquiera las otras bases, esencialmente puede ser procesada de manera similar,
dado que necesariamente se requiere solo la información sobre: género, especie,
latitud, longitud y de ser posible entidad federativa (Estado de la República).
Los resultados de la búsqueda aparecerán en una pantalla emergente y tendrán un
aspecto similar al siguiente:
Nota: Espere a que la consulta concluya para no generar datos incompletos.

Concluida la consulta guarde la información recuperada en formato de texto como
sigue:
Una función adicional que posee la base de datos es generar un mapa de los sitios
donde se ha colectado el taxa que hemos consultado:
Aún cuando este mapa de manera preliminar nos permite ubicar las colectas, no es
útil para obtener información ambiental adicional.
2.3. Depuración de la información.

El término de depuración se refiere a eliminación de información que no es útil para
mapear la ocurrencia del género o las especies de interés.
Para ello la información que fue previamente guardada en formato TXT, debe ser
editada en Microsoft EXCELL. Abra el archivo seleccionando el archivo que
previamente salvó empleando para ello la opción de Archivo de texto
(*.prn;*.txt;*.cvs).
Aparecerá una primera pantalla del Asistente para importar texto. Debe asegurarse
que la opción Delimitados esté activa. Oprima siguiente.
Una vez ingresada la tabla de texto a Excel, la primera edición de la información
consiste en suprimir los reglones que contienen información sobre el nombre de la
base de datos, el nombre de la colección, el número de ejemplares encontrados y los
reglones intermedios vacios. En resumen la idea es solo mantener los reglones que
contienen información de los ejemplares de herbario.
La segunda fase de la depuración consiste en suprimir aquellos reglones con

coordenadas no válidas. Para facilitar esta labor ordene los datos utilizando como
criterios de ordenación las columnas J, K y L de la hoja de trabajo. Suprima entonces
los reglones donde la columna K tenga valores de -999 o donde aparezca la palabra
nulo:
La tercera fase y última fase consiste en sustituir todos aquellos valores iguales a 99
por 0 cuando estos están en las columnas L y O. Para facilitar la operación seleccione
la columna L y utilice la herramienta de EXCELL Buscar y reemplazar. Haga lo
mismo con la columna O.
La razón de hacer lo anterior es que la base de datos rellena estos campos con el
número 99 cuando carece de información original.
2.4. Creación de encabezados de campo
Esta operación es relativamente sencilla y consiste escribir el nombre de cada campo,
es decir de cada columna de información. Para ello simplemente agregue un reglón en
blanco antes del primer reglón y llene cada columna con los siguientes encabezados
en mayúscula:
Los significados de las etiquetas con los siguientes:
2.5. Conversión de coordenadas

El programa DIVA-GIS construye mapas de ocurrencia a partir de los valores de
longitud y latitud de los sitios de colecta de una forma rápida y sencilla; no obstante,
requiere que ambas coordenadas estén expresadas en grados de arco con decimales y
no en grados, minutos y segundos. Por esta razón los valores que tenemos en el
archivo de EXCELL deberán ser convertidos.
Con base en lo anterior deberemos calcular dos columnas nuevas: una que expresa la
longitud y otra que exprese la latitud, ambas en grados decimales.
Para ello seleccione primeramente la columna M e inserte una nueva columna en
blanco en este sitio:
Asigne a esta nueva columna el encabezado LONGITUD. Hecho lo anterior, ahora

debemos declarar la operación matemática que realizará EXCELL para convertir la
longitud en grados decimales. Para ello, en la celda M2 escriba el siguiente texto:
+J2-(K2/60)-(L2/3600)
Con ello le estamos solicitando a EXCELL que al valor de los grados (J2) le reste el
resultado de la división del número de minutos entre 60 (K2/60) y le reste además el
resultado de la división del número de segundos entre 3600 (L2/3600).
Suena complicado pero no es nada más que la formula general que se muestra en la
página anterior:
Una vez que se ha calculado ésta celda, arrastre el contenido de la misma hacia abajo
para repetir la operación en todos los reglones:
Para el caso de la latitud, seleccione primeramente la columna Q e inserte una nueva

columna en blanco en este sitio. Asigne a esta nueva columna el encabezado
LATITUD.
Ahora en la celda Q2 escriba el siguiente texto:
+J2+(K2/60)+(L2/3600)
Note que en este caso los equivalentes de minutos y segundos se suman, mientras
que en el caso de la longitud se restan. La razón de ello es bastante simple. Para el
caso de México las coordenadas de longitud corresponden al Oeste. A eso se debe que
el valores de longitud sean negativos. Ahora, para el caso de la latitud, corresponden
al hemisferio norte, por lo que los valores son positivos.
Una vez que haya realizado lo anterior, el archivo está listo para ser usado en DIVA-
GIS, Maxent o ArcMap.
Salve el archivo con un nuevo nombre, siempre y cuando el formato de salida sea de
texto: *.TXT.
Cuando guarde, EXCELL mostrará el siguiente mensaje de advertencia:
Oprima SI y cierre el documento. Si lo mantiene abierto DIVA-GIS será incapaz de

utilizarlo.
Cuando vaya a cerrar el documento EXCELL genera dos nuevas advertencias, conteste
SI a ambas preguntas.
3. Creación de mapas de ocurrencia

Un mapa de ocurrencia es un gráfico donde se muestran los sitios en los que se han
realizado colectas. Para crearlo, deberán realizarse los procedimientos que a
continuación se detallan.
3.1 Importación de puntos
La primera operación es importar la información que hemos creado en el archivo de
texto del apartado anterior. Para ello, abra el programa DIVA-GIS. Posteriormente
seleccione el menú Data (datos), la herramienta Import points to shapefile
(importar puntos hacia archivo de información geográfica) y la opción From text file
(.TXT) (desde archivo de texto .TXT)
Con lo anterior aparecerá una ventana con el siguiente aspecto:
Oprima el cuadro Input File (archivo de entrada) y localice el archivo de texto que creó
anteriormente. Al hacerlo aparecerá la siguiente pantalla:
Si el aspecto es similar al mostrado al anterior oprima Apply (aplicar). En caso
contrario existe un error que deberá ser corregido.
Una vez hecho lo anterior, aparecerá en el programa una pantalla mostrando los datos
de presencia:
Si oprime la herramienta Identify feature (identificar atributo) y posteriormente
cualquier punto, aparecerá una ventana mostrando todos los datos del ejemplar
colectado
Ahora añada el archivo destvd250kg.shp ubicado el c:\mapas\División política.
Después de esto el mapa tendrá el siguiente aspecto:
3.2. Creación de mapas de distribución potencial para el presente.
Para crear el mapa de distribución potencial presente (basado en datos climáticos
válidos para el periodo de 1950 a 2000), Emplearemos utilidad Ecological Niche
Modeling (Modelación de nicho ecológico) mismo que aparece en la barra de
herramientas como una mariposa de color naranja.
Primeramente oprima el icono para activar esta función:
Lo que hace el programa mediante este procedimiento es, calcular los valores de 19
variables climáticas para cada lugar de colecta, estimar su nicho climático (conjunto de
condiciones en las que se desarrolla la especie) y a partir de este nicho, buscar sitios
donde existen condiciones similares y en los que la especie puede, potencialmente,
estar presente.
En este sentido el programa le asigna a cada celda (cuadrado que representa un área)
dos valores posibles: a) inadecuado, cuando las condiciones no son propicias para la
especie y b) adecuado, cuando las condiciones son similares al nicho estimado y en las
cuales la especie puede potencialmente prosperar.
Recuerde que cuando se instaló el programa, se hizo lo mismo con los datos
complementarios del clima. La primera pantalla de la herramienta Ecological Niche
Modeling pregunta sobre el conjunto de datos que será empleado en el análisis; para
el caso de la distribución presente deberá emplearse el conjunto de datos climáticos
worldclim_2-5m:
Como en algunos casos los archivos de colecta contienen información de varias
especies, deberemos activar la opción Many Classes y seleccionar el campo SPP que
corresponde a las especies:
Cuando haga lo anterior el programa mostrará la lista de especies que están
registradas:
Ahora oprima la pestaña Predict de la ventana. Introduzca los valores que se
muestran en la imagen en los recuadros MinX, MaxX, MinY y MaxY. Con ello le
pedimos al programa que calculara datos entre las longitudes 118.5º y 85.5 º oeste y
las latitudes 12.5 º y 35 º Norte. Confirme que esté seleccionada la opción Same as
input para que las áreas correspondan al clima del año 2000 (presente). En el
recuadro One class seleccione la especie para la cual requiera construir el mapa:
Finalmente oprima Output e introduzca el nombre que se le dará al archivo. Es
recomendable usar el nombre de la especie seguido por la palabra PRESENTE.
Oprima Guardar, con lo cual se cierra la ventana. Finalmente oprima Apply para
que el programa inicie el procedimiento. Éste puede llevar varios minutos,
dependiendo de la cantidad de datos y la velocidad del procesador. Por ello es
importante no interrumpir el proceso.
El mapa de distribución potencial tiene el siguiente aspecto:
Las zonas grises corresponden a las zonas inapropiadas para la especie y las
rojas son las apropiadas. El mapa es un conjunto de celdas o cuadros que
representan valores; en este caso, las celdas grises corresponden a 0 (cero) y los
rojos a 1 (uno). Las zonas blancas son zonas con valores nulos a los que
usualmente se les asigna un valor de -9999. Esta información aparentemente
irrelevante, resulta ser de gran importancia para análisis de cambios a través del
tiempo.
Una Breve Guía Didáctica sobre MaxEnt
Por Steven Phillips, AT&T Research
Esta guía didáctica da una introducción básica para el uso del MaxEnt, programa para
el modelado de la distribución geográfica de las especies en base a la máxima
entropía, escrito por Steven Phillips, Miro Dudik y Rob Schapire, con el apoyo de los
laboratorios de investigación de AT&T, la Universidad de Princeton y el Centro para la
Biodiversidad y Conservación del Museo Americano de Historia Natural. Para más
detalles sobre la teoría del modelado en base a máxima entropía, así como sobre la
descripción de los datos empleados y los tipos principales de análisis estadísticos
usados aquí, vea:
Steven J. Phillips, Robert P. Anderson and Robert E. Schapire, Maximum entropy

modeling of species geographic distributions. Ecological Modelling, Vol 190/3-4 pp
231-259, 2006.
Un segundo artículo, el cual describe las características agregadas más recientemente

al programa MaxEnt es:
Steven J. Phillips and Miroslav Dudik, Modeling of species distributions with

Maxent: new extensions and a comprehensive evaluation. Ecography, to appear.
Los datos ambientales que usaremos consisten en datos climáticos y de elevación de

Sudamérica, además de una capa de vegetación potencial. Nuestra especie de muestra
será Bradypus variegatus, la Pereza de Tres Dedos. Esta guía didáctica asumirá que
todos los archivos de datos estarán localizados en el mismo directorio como archivos
del programa MaxEnt; de otro modo, Usted deberá usar la ruta (i.e.,
c:\data\maxent\tutorial) delante de los nombres de los archivos empleados aquí.
Comenzando
Descargando
El programa consiste de un archivo jar, maxent.jar, el cual puede ser usado en

cualquier computador que tenga Java versión 1.4 o posterior. Maxent puede ser
descargado, junto con la literatura asociada, desde
www.cs.princeton.edu/~schapire/maxent; el ambiente de tiempo de ejecución de
Java puede obtenerse desde java.sun.com/javase/downloads. Si Usted está usando
Windows (como asumimos), Usted debería descargar también el archivo maxent.bat y
guardarlo en el mismo directorio de maxent.jar. El sitio web tiene un archivo llamado
“readme.txt”, el cual contiene instrucciones para instalar el programa en su
computador.
Iniciando
Si Usted está usando Microsoft Windows, simplemente haga clic sobre el archivo
maxent.bat. De otro modo, escriba "java -mx512m -jar maxent.jar" en una ventana de
comandos (donde "512" puede reemplazarse por la cantidad de megabytes de
memoria que Usted quiera poner a disposición del programa). Aparecerá la siguiente
pantalla:
Para efectuar una corrida, Usted deberá proporcionar un archivo que contenga las
localidades de presencia (“muestras”), un directorio que contenga las variables
ambientales y un directorio de salida. En nuestro caso, las localidades de presencia
están en el archivo “samples\bradypus.csv”, las capas ambientales están en el
directorio “layers”, y las salidas irán en el directorio “outputs”. Usted puede ingresar
estas localidades manualmente, o navegando para buscarlas. Mientras está navegando
para buscar las variables ambientales, recuerde que Usted está buscando el directorio
que las contiene, no necesita navegar hasta llegar a los archivos en dicho directorio. El
programa se ve así una vez ingresados los archivos para Bradypus:
El archivo “samples\bradypus.csv” contiene las localidades de presencia en formato
.csv. Las primeras líneas son como siguen:
species,longitude,latitude
bradypus_variegatus,-65.4,-10.3833
Pueden haber múltiples especies en el mismo archivo de muestras, en cuyo caso más
especies aparecerán en el panel junto con Bradypus. Se pueden usar sistemas de
coordenadas diferentes a latitud y longitud, siempre y cuando se considere que los
archivos de muestras y las capas ambientales usen el mismo sistema de coordenadas.
La coodenada “x” (longitud, en nuestro caso) debe venir antes de la coordenada “y”
(latitud) en el archivo de muestras. Si los datos de presencia tienen registros
duplicados (múltiples registros de la misma especie en la misma cuadrícula), éstos
pueden ser eliminados haciendo clic en el botón “Settings” (“Configuración”) y
seleccionando “Delete duplicates” (“Borrar duplicados”).
El directorio “layers” (“capas”) contiene un número de cuadrículas (raster grids) en
ASCII (en el formato .asc de ESRI), cada uno de los cuales describe una variable
ambiental. Todas las cuadrículas deben tener los mismos límites geográficos y tamaño
de celda (i.e. todos los encabezados de los archivos ASCII deben coincidir
perfectamente unos con otros). Una de nuestras variables, “ecoreg”, es una variable
categórica que describe los tipos de vegetación portenciales. Las categorías deben ser
indicadas por números, más que por letras o palabras. Usted debe decirle al programa
cuales variables son categóricas, como se ha hecho anteriormente en el cuadro.
Efectuando una corrida
Simplemente presione el botón “Run” (“Correr”). Un monitor de progreso describe los
pasos que están siendo tomados. Después de que las capas ambientales están
cargadas y los primeros pasos se han tomado, el progreso hacia el entrenamiento del
modelo de maxent se muestra así:
La ganancia se relaciona estrechamente con la desviación, una medida de precisión de
ajuste usada generalmente tanto en modelos aditivos como lineales. Comienza en cero
e incrementa hacia una asíntota durante la corrida. Durante este proceso, Maxent
genera una distribución de probabilidad de los píxeles en la cuadrícula, comenzando
desde la distribución uniforme mejorando reiteradamente el ajuste de los datos. La
ganancia se define como la probabilidad logarítmica promedio de la muestras de
presencia, menos una constante que hace que la distribución uniforme tenga cero
ganancia. Al final de la corrida, la ganancia indica qué tan concentrado está el modelo
alrededor de las muestras de presencia; por ejemplo, si la ganancia es dos, esto
significa que la verosimilitud promedio de las muestras de presencia es exp(2) ≈ 7,4
veces más alta que un píxel aleatorio de fondo. Note que Maxent no está calculando
directamente la “probabilidad de ocurrencia”. La probabilidad que el programa le
asigna a cada píxel es típicamente muy pequeña, dado que los valores deben sumar
uno entre todos los píxeles en la cuadrícula (aunque nosotros regresaremos a este
punto cuando comparemos formatos de salida).
La corrida produce múltiples archivos de salida, de los cuales el más importante para
analizar su modelo es un archivo html llamado “bradypus.html”. Parte de este archivo
proporciona los índices para las otras salidas, como esto:
Mirando una predicción
Para ver otras salidas (más interesantes) que pueda haber en bradypus.html,
activaremos un par de opciones y correremos nuevamente el modelo. Presione el
botón “Make pictures of predictions” (“Hacer una imagen de las predicciones”), luego
haga clic en “Settings”, y escriba “25” en la entrada “Random test percentage”
(“Porcentaje de prueba aleatorio”). Luego, presione nuevamente el botón “Run”. Luego
de completada la corrida, el archivo bradypus.html contiene una imagen como esta:
La imagen usa los colores para indicar la probabilidad que las condiciones son
adecuadas, el rojo indica una alta probabilidad de condiciones adecuadas para la
especie, verde indica las condiciones típicas de aquéllos lugares donde la especie se
encuentra, y sombras más tenues de azul indican una baja probabilidad de
condiciones adecuadas. Para el caso de Bradypus, vemos que las condiciones
adecuadas predichas como altamente probables abarcan la mayor parte de las tierras
bajas de Centroamérica, las tierras bajas húmedas del noroeste de Sudamérica, la
cuenca del Amazonas, islas del Caribe y gran parte de la foresta Atlántica en el sureste
de Brasil. El indicado es un archivo de imagen (.png) al cual Usted puede simplemente
hacerle clic (en Windows) o abrir en la mayoría de los programas de procesamiento
de imágenes. Si Usted quiere copiar estas imágenes o si quiere abrirlas con otro
programa, encontrará a los archivos .png en el directorio llamado “plots” que ha sido
creado como una salida durante la corrida.
Los puntos de prueba son una muestra aleatoria tomada de las localidades de
presencia de la especie. La misma muestra aleatoria es usada cada vez que Usted corre
Maxent sobre el mismo conjunto de datos, a menos que Usted seleccione la opción
“random seed” en el menú de configuración. De modo alterno, datos de prueba
alternos para una o más especies pueden proveerse en un archivo aparte, dándole el
nombre de “Test sample file” (“Archivo de muestra de prueba”) en el menú de
configuración.
Formatos de salida
Maxent sustenta tres formatos de salida para los valores del modelo: crudo,
cumulativo y logístico. Primero, la salida cruda la constituye el modelo exponencial de
Maxent per se. Segundo, el valor cumulativo correspondiente a un valor crudo de r es
el porcentaje de la distribución de Maxent cuyo valor crudo es al menos r. La salida
cumulativa se interpreta mejor en términos de la tasa de omisión predicha: Si
configuramos un umbral cumulativo de c, la predicción binaria resultante tendrá una
tasa de omisión de c% sobre las muestras deducidas a partir de la misma distribución
de Maxtent y podremos predecir una tasa de omisión similar para muestras deducidas
a partir de la distribución de la especie. Tercero, si c es el exponencial de la entropía
de la distribución de Maxent, entonces el valor logístico correspondiente a un dato
crudo de r es c·r/(1+c·r). Esta es una función logística, porque los valores crudos son
una función exponencial de las variables ambientales. Los tres formatos de salida
están relacionados de manera monótona, pero están a escalas diferentes y tienen
diferentes interpretaciones. La salida por defecto es logística, lo cual es más fácil de
conceptualizar: Proporciona un estimado entre cero y uno de probabilidad de
presencia. Note que la probabilidad de presencia depende de detalles del diseño de
muestreo, tales como el tamaño de la parcela y (para organismos altamente móviles)
tiempo de observación; la salida logística estima la probabilidad de presencia
asumiendo que el diseño de muestreo es tal que las localidades de presencia típicas
tienen una probabilidad de presencia de alrededor de 0,5. La imagen antes expuesta
del modelo de Bradypus usa el formato logístico. Comparativamente, se obtiene la
siguiente imagen cuando se usa el formato crudo:
Note que hemos usado una escala logarítmica para los colores. Una escala lineal
proporcionaría una imagen mayormente azul con unos pocos píxeles rojos (Usted
puede verificar esto deseleccionando “Logscale pictures” en el menú de configuración)
pues el formato crudo típicamente le otorga valores relativamente altos a un pequeño
número de lugares – lo cual puede pensarse como un artefacto de la salida cruda dada
por una distribución exponencial. Al emplear el formato cumulativo se obtiene la
siguiente imagen:
Como en el caso de la salida cruda, hemos usado una escala logarítmica para colorear
la imagen para resaltar las diferencias entre los valores más bajos. La salida
cumulativa puede ser interpretada como una predicción de las condiciones adecuadas
para la especie por arriba de un umbral en el rango aproximado de 1-20 (o del
amarillo al naranja en ésta imagen), dependiendo del nivel de omisión predicho que es
aceptable para la aplicación.
Análisis estadístico
El “25” que introdujimos en el “random test percentage” le indica al programa que
debe escoger de manera aleatoria y apartar el 25% de los registros de muestras para
usarlos en la prueba. Esto permite al programa efectuar algunos análisis estadísticos
simples. La mayor parte de los análisis empleados usan un umbral para hacer una
predicción binaria, estando las condiciones adecuadas por arriba de dicho umbral y
las inadecuadas por debajo. La primera gráfica muestra como la omisión de prueba y
la de entrenamiento así como el área predicha varían con la escogencia del umbral
cumulativo, como se vé en la siguiente gráfica:
Aquí vemos que la omisión sobre las muestras de prueba se ajusta muy bien a la tasa
de omisión predicha, la tasa de omisión para los datos de prueba de la distribución de
Maxent por sí misma. La tasa de omisión predicha es una línea recta, definida por el
formato de salida cumulativo. En algunas situaciones, la línea de la tasa de omisión se
ubica por debajo de la línea de omisión: Una razón común para ello es que los datos de
prueba y aprendizaje no sean independientes, por ejemplo si éstos derivan de los
mismos datos de presencia autocorrelacionados espacialmente.
La siguiente gráfica nos muestra la curva operada por el receptor (ROC, por sus siglas
en inglés) tanto para los datos de entrenamiento como para los de prueba, mostrada
abajo. También se proporciona el área bajo la curva (AUC, por sus siglas en inglés)
ROC; si hay datos de prueba disponibles, el error estándar del AUC para éstos se darán
posteriormente en la página web.
Las líneas azul y roja serán idénticas si Usted usa los mismos datos para el
entrenamiento y para la prueba. Si Usted divide los datos en dos porciones, una para
el entrenamiento y otra para la prueba, es normal que la línea roja (entrenamiento)
muestre una mayor AUC que la línea azul (prueba). La línea roja (entrenamiento)
muestra el “ajuste” del modelo a los datos de entrenamiento y es la auténtica prueba
de la capacidad que tienen los modelos de predecir. La línea turquesa muestra lo que
Usted esperaría si su modelo no fuese mejor que el azar. Si la línea azul (la línea de
prueba) se ubicase por debajo de la línea turquesa, entonces esto indicaría que su
modelo se desempeña peor de lo que lo haría un modelo aleatorio. Mientras más cerca
se encuentre la línea azul del tope superior izquierdo, mejor será el modelo para
predecir las presencias contenidas en la muestra de prueba de los datos. La siguiente
es una buena referencia de inicio para obtener información más detallada sobre las
estadísticas relacionadas con las AUC: Fielding, A.H. & Bell, J.F. (2007) A review of
methods for the assessment of prediction errors in conservation presence/ absence
models. Environmental Conservation 24(1): 38-49. Dado que nosostros contamos
solamente con datos de presencia y no con datos de ausencia, “fractional predicted
area” (“el área fraccionada predicha” o la fracción del total del área de estudio
predicha presentes) es empleada en lugar de la tasa mayormente usada (la fracción de
ausencias predichas presentes). Para profundizar en la discusión sobre esta
alternativa, vea el artículo aparecido en Ecological Modelling mencionado en la
primera página de esta guía. Es importante notar que los valores de las AUC tienden a
ser mayores para especies con rangos estrechos en relación al área estudiada descrita
por los datos ambientales. Esto no necesariamente indica que los modelos sean
mejores; por el contrario, este comportamiento es un artefacto de las estadísticas de
las AUC.
Si los datos de prueba están disponibles, el programa automáticamente calcula la
significancia estadística de la predicción, usando una prueba binomial de omisión.
Para Bradypus, esta da:
Para información más detallada sobre la estadística binomial, vea el artículo aparecido
en Ecological Modelling arriba mencionado.
¿Cuáles variables importan más?
Una aplicación natural del modelado de la distribución de especies es contestar la
pregunta de ¿cuáles son las variables más importantes para la especie cuya
distribuciónes está siendo modelada? Hay más de una manera para contestar esto;
aquí delinearemos las maneras posibles en las cuales Maxent puede ser usado para
ello.
Mientras se está entrenando al modelo Maxent, podemos rastrear cuáles son las
variables ambientales que contribuyen en mayor medida al modelo. Cada paso del
algoritmo de Maxent incrementa la ganancia del modelo mediante la modificación del
coeficiente para una única característica; el programa asigna el incremento en la
ganancia a la(s) variable(s) ambiental(es) de las cuales depende dicha característica.
Haciendo una conversión a porcentajes al final del proceso de entrenamiento,
obtenemos la siguiente tabla:
Estos valores de contribución porcentual únicamente están definidos de manera

heurística: ellos dependen de la ruta particular que usa el código Maxent para obtener
la solución óptima y un algoritmo diferente podría obtener la misma solución por
medio de una ruta distinta, lo cual resultaría en valores de contribución porcentual
diferentes. Más aun, cuando hay variables ambientales altamente correlacionadas, las
contribuciones porcentuales deberían ser interpretadas con precaución. En nuestro
ejemplo de Bradypus, la precipitación anual está altamente correlacionada con la
precipitación de octubre y julio. Aunque la tabla arriba expuesta muestra que Maxent
usó la variable “precipitación de octubre” más que cualquier otra, pero usó muy poco
a la precipitación anual, esto no necesariamente implica que la precipitación de
octubre sea mucho más importante para la especie que la precipitación anual.
A fin de estimar cuales son las variables más importantes en el modelo, podemos
correr también una prueba de jackknife seleccionando “Do jackknife to measure
variable important” (“Hacer un jackknife para medir la importancia de la variable”) en
la casilla de verificación. Cuando presionamos nuevamente el botón “Run”, se crea un
conjunto de modelos. En cada oportunidad se excluye una variable y se crea un
modelo con las remanentes. Entonces se crea un modelo usando cada variable de
manera aislada. Adicionalmente, se crea un modelo usando todas las variables, tal y
como se hizo anteriormente. Los resultados de la prueba de jackknife aparecen como
tres gráficos de barras en los archivos “bradypus.html” y el primero de éstos es
mostrado abajo.
Vemos que si Maxent usa solamente pre6190_l1 (precipitación promedio de enero)
casi no obtiene ganancia, así que la variable no es (por sí misma) útil para estimar la
distribución de Bradypus. Por otra parte, la precipitación de octubre (pre6190_l10)
permite un ajuste razonablemente bueno a los datos de entrenamiento. Las barras
azul claro sugieren que ninguna variable contiene una cantidad sustancial de
información útil, que no esté contenida en las otras variables, dado que no decrece de
manera considerable la ganancia del entrenamiento cuando se omite una variable
dada.
El archivo bradypus.html tiene dos gráficas adicionales de jackknife, las cuales
prueban la ganancia o el AUC en lugar de la ganancia del entrenamiento, como se
muestra abajo.
La comparación de las tres gráficas de jackknife plots puede ser muy informativa. La
gráfica correspondiente al AUC muestra que la precipitación anual (pre6190_ann) es
la variable que por si sola predice de manera más efectiva la distribución de los datos
de frecuencia que fueron puestos de lado para usarlos como prueba, cuando el
desempeño para la predicción es medido mediante el AUC, aun cuando apenas fue
usado por el modelo construido usando todas las variables. La importancia relativa de
la precipitación anual también incrementa en la gráfica de la ganancia de la prueba.
Adicionalmente, en las gráficas de la ganancia de la prueba y de AUC, algunas de las
barras azul claro (especialmente aquellas que representan las variables de
precipitación mensual) son más largas que la barra roja, indicando que el desempeño
para la predicción mejora cuando las variables correspondientes no son usadas.
Esto nos dice que las variables de precipitación mensual ayudan a que Maxent
obtenga un buen ajuste a los datos de entrenamiento, pero la variable precipitación
anual generaliza mejor, dando resultados comparativamente mejores sobre los datos
de prueba puestos aparte. Dicho de otra manera, los modelos hechos con las variables
de precipitación mensual parecen ser menos transferibles. Esto es importante si
nuestro objetivo es transferir el modelo, por ejemplo aplicándolo a variables
climáticas futuras a fin de estimar su distribución futura bajo el escenario de cambio
climático. Tiene sentido que los valores de precipitación mensuales sean menos
transferibles: las condiciones potencialmente adecuadas para Bradypus no
dependerán de los valores precisos de la precipitación en determinados meses, sino
en la precipitación media anual y quizás en la consistencia de las precipitaciones o la
carencia de periodos prolongados de sequía. Cuando modelamos a una escala
continental, probablemente ocurrirán cambios en los lapsos precisos de los patrones
de estacionalidad de la precipitación, afectando la precipitación mensual pero no las
condiciones adecuadas para Bradypus.
En general, es mejor usar variables que probablemente sean más relevantes para la
especie estudiada. Por ejemplo, el sitio web de Worldclim (www.worldclim.org)
provee las variables “BIOCLIM”, incluyendo variables derivadas tales como
“precipitación en el trimestre más húmedo”, más que valores mensuales.
Una última nota sobre las salidas de jackknife: la gráfica de la ganancia de la prueba
muestra que el modelo hecho solamente con la precipitación de enero (pre6190_l1)
genera una ganancia negativa de la prueba. Esto significa que el modelo es
ligeramente peor que un modelo nulo (i.e., una distribución uniforme) para predecir la
distribución de las presencias puestas aparte para la prueba. Esto puede considerarse
como una evidencia más de que los valores de precipitación mensuales no son la
mejor opción como variables para la predicción.
¿Cómo depende la predicción de las variables?
Ahora presione “Create response curves” (“Crear curvas de respuesta”), deseleccione
la opción jackknife y corra el modelo nuevamente. Esto produce la siguiente sección a
ser añadida al archivo “bradypus.html”:
Cada una de las imágenes miniatura puede ser seccionada (haciendo clic sobre ellas)
para obtener una gráfica más detallada y si Usted desea copiar o abrir estas gráficas
con otro programa, los archivos .png pueden encontrarse en el directorio “plots”.
Mirando a vap6190_ann, vemos que la respuesta es baja para valores de vap6190_ann
en el rango de 1-200, pero alta para valores en el rango de 200-300. El valor mostrado
en el eje de las “y” es la probabilidad predicha de condiciones favorables, tal y como es
dada en el formato de salida logístico, con todas las demás variables configuradas a su
valor promedio calculado en base a las localidades de presencia.
Note que si las variables ambientales están correlacionadas, como lo están aquí, las
curvas de respuesta marginal pueden ser inconducentes. Por ejemplo, si dos variables
altamente correlacionadas tienen curvas de respuesta aproximadamente opuestas la
una de la otra, entonces el efecto combinado de ambas variables será bajo para
muchos píxeles. Otro ejemplo, vemos que la disponibilidad predicha esta
negativamente correlacionada con la precipitación anual (pre6190_ann), si mantienen
fijas a las demás variables. En otras palabras, una vez que el efecto de todas las demás
variables haya sido considerado, el efecto marginal de aumentar la precipitación anual
debe disminuir la disponibilidad predicha. Sin embargo, la precipitación anual está
altamente correlacionada con las variables de precipitación anual, así que en realidad
no podemos mantener fácilmente fijos los valores mensuales mientras varían los
valores anuales. En este caso el programa produce un segundo conjunto de curvas de
respuesta, en el cual cada una de las curvas es hecha mediante la generación de un
modelo usando sólo la variable correspondiente, The program therefore produces a
second set of response curves, in which each curve is made by generating a model
using only the corresponding variable, sin tomar en cuenta las otras variables:
En contraste con la respuesta marginal a la precipitación anual observada en el primer
conjunto de curvas de respuesta, vemos ahora que la disponibilidad predicha
generalmente aumenta con el incremento de la precipitación anual.
Tipos de características y curvas de respuesta
Las curvas de respuesta nos permiten ver la diferencia entre tipos de características.
Deseleccione “auto features” (“Características automáticas”), seleccione “Threshold
features” (“características de umbral”) y presione el botón “Run” de nuevo. Observe
los perfiles de las características resultantes – se dará cuenta que son funciones en
escalera, como esta de pre6190_l10:
Si se efectúa la misma corrida usando solamente características claves, el perfil

resultante de la característica se ve así:
Los contornos de ambos perfiles son similares, pero ellos difieren porque tipos de
características distintos permiten perfiles diferentes de curvas de respuesta. El
exponente en un modelo Mawent es la sumatoria de las características y una suma de
las características de umbral es siempre una función en escalera, de tal modo que la
salida logística es también una función en escalera (como lo son las salidas crudas y
cumulativas). En comparación, una sumatoria de características clave siempre es una
función lineal por tramos. Esto explica la secuencia de segmentos de línea conectadas
en la segunda curva de respuesta mostrada arriba (Note que las líneas son
ligeramente curvadas, especialmente hacia los valores extremos de la variable; esto es
debido a la salida logística aplica una función sigmoidea al exponente de Maxent)
Usando todas las clases juntas (la opción por defecto en caso de tener muestras
suficientes) permite muchas respuestas complejas para ser cuidadosamente
modeladas.Una explicación más profunda de los diversos tipos de características
puede encontrarse haciendo clic en el botón de ayuda.
El formato SWD
Otro formato de entrada puede ser muy útil, especialmente cuando sus cuadrículas
ambientales sean muy grandes. A falta de un nombre mejor, es llamado “samples with
data” (muestras con datos”) o simplemente SWD. La versión SWD de nuestro archivo
Bradypus, llamada “bradypus_swd.csv”, comienza del siguiente modo:
species,longitude,latitude,cld6190_ann,dtr6190_ann,ecoreg,frs6190_ann,h_dem,pre61
90_ann,pre6190_l10,pre6190_l1,pre6190_l4,pre6190_l7,tmn6190_ann,tmp6190_ann,t
mx6190_ann,vap6190_ann
bradypus_variegatus,-65.4,-
10.3833,76.0,104.0,10.0,2.0,121.0,46.0,41.0,84.0,54.0,3.0,192.0,266.0,337.0,279.0
10.3833,76.0,104.0,10.0,2.0,121.0,46.0,40.0,84.0,54.0,3.0,192.0,266.0,337.0,279.0
16.8,57.0,114.0,10.0,1.0,211.0,65.0,56.0,129.0,58.0,34.0,140.0,244.0,321.0,221.0
17.45,57.0,112.0,10.0,3.0,363.0,36.0,33.0,71.0,27.0,13.0,135.0,229.0,307.0,202.0
17.4,57.0,113.0,10.0,3.0,303.0,39.0,35.0,77.0,29.0,15.0,134.0,229.0,306.0,202.0
Puede ser usado en lugar de un archivo de datos normal. La diferencia radica
únicamente en que el programa no necesita mirar en las capas de variables
ambientales (los archivos ASCII) para obtener los valores de las variables en los
puntos de muestra, en lugar de eso lee los valores de las variables ambientales
directamente de la tabla. Así, las capas ambientales son únicamente usadas para leer
los datos ambientales de los píxeles de fondo, es decir aquellos píxeles donde la
especie no necesariamente ha sido detectada. De hecho, los píxeles de fondo también
pueden ser especificados en un archivo con formato SWD. El archivo “background.csv”
contiene 10.000 datos de punto de fondo. Los primeros de ellos se ven del siguiente
modo:
background,-
61.775,6.175,60.0,100.0,10.0,0.0,747.0,55.0,24.0,57.0,45.0,81.0,182.0,239.0,300.0,232.
0
background,-
66.075,5.325,67.0,116.0,10.0,3.0,1038.0,75.0,16.0,68.0,64.0,145.0,181.0,246.0,331.0,2
34.0
background,-59.875,-
26.325,47.0,129.0,9.0,1.0,73.0,31.0,43.0,32.0,43.0,10.0,97.0,218.0,339.0,189.0
background,-68.375,-
15.375,58.0,112.0,10.0,44.0,2039.0,33.0,67.0,31.0,30.0,6.0,101.0,181.0,251.0,133.0
background,-
68.525,4.775,72.0,95.0,10.0,0.0,65.0,72.0,16.0,65.0,69.0,133.0,218.0,271.0,346.0,289.0
Podemos correr Maxent con “bradypus_swd.csv” como archivo de muestras y

“background.csv” (ambos localizados en el directorio “swd”) como archivo de capas
ambientales. Trate de correrlo y se dará cuenta que corre mucho más rápido, debido a
que no tiene que cargar las grandes cuadrículas ambientales. Otra ventaja es que
Usted puede asociar diferentes registros con condiciones ambientales de diferentes
periodos de tiempo. Por ejemplo, dos registros obtenidos a 100 años de diferencia el
uno del otro en una misma celda de la cuadrícula probablemente reflejan una
variación considerable en las condiciones ambientales, pero a menos que Usted use el
formato SWD, ambos registros recibirán los mismos valores de variables ambientales.
El inconveniente es que no puede elaborar imágenes o cuadrículas como salidas,
porque no tienen todos los datos ambientales. El modo de sortear este inconveniente
es usando una “proyección”, como se describe más adelante.
Corrida de lotes (“Batch running”)
En ocasiones usted necesita generar múltiples modelos, quizás con ligeras variaciones
en los parámetros de modelado o en las entradas. La generación de modelos puede ser
automatizada con argumentos tipo comando, obviando la necesidad de hacer clic y
escribiendo repetidamente en la interfase del programa. Los argumentos de línea de
comando pueden o bien ser dados desde una ventana de comando (también conocida
como “fichero” –“shell” – ), o pueden ser definidos en un archivo de lotes (“batch”).
Déle un vistazo al archivo “batchExample.bat” (por ejemplo, haga clic con el botón
derecho en el archivo .bat en Windows Explorer y ábralo usando Notepad). Contiene
la siguiente línea:
java -mx512m -jar maxent.jar environmentallayers=layers togglelayertype=ecoreg
samplesfile=samples\bradypus.csv outputdirectory=outputs redoifexists autorun
El efecto es decirle al programa donde encontrar capas ambientales y archivos de
muestras y donde poner las salidas, o indicar que la variable ecoreg es categórica. El
indicador “autorun” (“corrida automática”) le dice al programa de iniciar la corrida
inmediatamente, sin esperar a que el botón “Run” sea presionado. Ahora intente darle
doble clic en el archivo para ver qué es lo que hace.
Muchos aspectos del programa Maxent pueden ser controlados por argumentos de
línes de comando. Presione el botón “Help” para ver todas las posibilidades. Múltiples
corridas pueden aparecer en el mismo archivo y pueden ser corridos simplemente
una después de la otra. Usted puede cambiar el valor por defecto de muchos de los
parámetros agregando argumentos de línea de comandos al archivo “maxent.bat”.
Muchos de los argumentos de líneas de comandos también tienen abreviaciones, así la
corrida descrita en batchExample.bat podría también ser iniciada usando este
comando:
java -mx512m -jar maxent.jar –e layers –t eco –s samples\bradypus.csv –o outputs –r -

a
Regularización.
El parámetro “multiplicador de regularización” (“regularization multiplier”) ubicado
en el panel de configuración influye el nivel de enfoque o cuan cercanamente se ajusta
la distribución de salida obtenida. Un valor menor que el valor por defecto de 1,0
producirá una distribución de salida más localizada la cual se ajusta estrechamente a
los registros de presencia dados, pudiendo ser un ajuste excesivo (ajustándose tan
cercanamente a los datos de entrenamiento que el modelo no generaliza bien para
identificar los datos de prueba independientes). Un multiplicador de regularización
mayor producirá una predicción más extendida, menos localizada. Intente cambiar el
multiplicador y examine las imágenes producidas y los cambios en las AUC. Como
ejemplo, configurando el multiplicador a tres hace que la siguiente imagen muestre
una distribución mucho más difusa que la presentada anteriormente:
El potencial de ajustar en exceso se incrementa en la medida que la complejidad del
modelo se incrementa. Primero intente configurar el multiplicador con un valor muy
bajo (i. e. 0,01) con el conjunto de características por defecto para ver un modelo
altamente ajustado en exceso. Luego intente usar el mismo multiplicador de
regularización únicamente con características cuadráticas y lineales.
Haciendo proyecciones
Un modelo entrenado con un conjunto de capas ambientales (o archivo SWD) puede
ser “proyectado” al aplicársele otro conjunto de capas ambientales (o archivo SWD).
Las situaciones en las cuales se requiere de proyecciones inclyen el modelado de la
distribución de las especies bajo las condiciones climáticas cambiantes, la aplicación
de un modelo de distribución nativa a una especie invasora para explorar el riesgo de
invasión en área geográficas diferentes, o simplemente evaluar el modelo bajo un
conjunto de localidades de prueba con la finalidad de efectuar análisis estadísticos
más profundos. Aquí vamos a llevar a cabo una proyección con un objetivo muy
simple: Elaborar una cuadrícula en formato ASCII y su figura asociada como salida
cuando las muestras y el fondo están en formato SWD.
Escriba, o navegue, Type in, los archivos de muestras “swd\bradypus_swd.csv” y las

capas ambientales en “swd\background.csv”, luego ingrese el directorio capas
(“layers”) en el “Projection Layers Directory” (“Directorio de Capas de Proyección”),
cpomo se muestra en la siguiente figura.
El directorio de capas de proyección (o archivo SWD) debe contener variables con los
mismos nombres que las variables empleadas para el entrenamiento del modelo, pero
describiendo unas condiciones diferentes (i.e., una región geográfica diferente o
modelo climático diferente). Para ambos conjuntos de datos, los de entrenamiento y
los de proyección, el nombre de cada variable es o bien el título de la columna (si se
está usando un archivo en formato SWD) o el nombre del archivo pero sin la
terminación .asc (si se está usando un directorio de cuadrículas).
Cuando usted presiona “Run”, se entrena un modelo usando los datos SWD el cual es
posteriormente proyectado sobre cuadrículas ASCII en el directorio “layers”. La
cuadrícula de salida en formato ASCIII se llama “bradypus_variegatus_layers.asc” y en
líneas generales el nombre del directorio es añadido al nombre de la especie, con el fin
de distinguirlo de la salida estándar (no proyectada). Si se selecciona “make pictures
of predictions” (“hacer figuras de las predicciones”), aparecerá una figura del modelo
proyectado en el archivo “bradypus.html”.
Analizando la salida de Maxent en R
Maxent produce un cierto número de archivos de salida en cada corrida. Algunos de
éstos archivos pueden ser importados por otros programas si Usted quiere efectuar
sus propios análisis de las predicciones. Aquí demostramos el uso del paquete
estadístico gratuito R con salidas de MaxEnt: Se entiende que esta sección está
dirigida a usuarios con experiencia en el uso de R. Usaremos el siguiente par de
archivos producidos por Maxent:
bradypus_variegatus.csv
bradypus_variegatus_samplePredictions.csv
El primero de éstos se produjo cuando los datos de fondo son dados en formato SWD y
el segundo se produce en todos los casos. Asegúrese que Usted dispone de datos de
prueba (por ejemplo, configurando el porcentaje aleatorio de prueba en 25);
estaremos evaluando las salidas de MaxEnt usando los mismos datos de prueba que
usó Maxent. Primero, iniciamos R e instalamos algunos paquetes (asumiendo que
estas es la primera vez que lo estamos usando) y entonces los cargamos escribiendo
(o pegando):
install.packages("ROCR", dependencies=TRUE)
install.packages("vcd", dependencies=TRUE)
library(ROCR)
library(vcd)
library(boot)
A través de ésta sección usaremos texto azul para mostrar los códigos y comandos de
R y verde para mostrar las salidas de R. Seguidamente nos dirigimos hacia el
directorio donde están las salidas de MaxEnt, por ejemplo:
setwd(“c:/maxent/tutorial/outputs”)
y luego lea en las predicciones de Maxent en los puntos de presencia y de fondo, y

extraiga las columnas que necesitamos:
presence <- read.csv(“bradypus_variegatus_samplePredictions.csv")

background <- read.csv(“bradypus_variegatus.csv")
pp <- presence$Cumulative.prediction # get the column of predictions
testpp <- pp[presence$Test.or.train=="test"] # select only test points
trainpp <- pp[presence$Test.or.train=="train"] # select only test points
bb <- background$Maxent.cumulative.values.at.background.points
Ahora podemos poner los valores de la predicción en el formato requerido por ROCR,
el paquete que usaremos para hacer algunos análisis ROC y genere la curva ROC:
combined <- c(testpp, bb) # combine into a single vector

label <- c(rep(1,length(testpp)),rep(0,length(bb))) # labels: 1=present, 0=random
pred <- prediction(combined, label) # labeled predictions
perf <- performance(pred, "tpr", "fpr") # True / false positives, for ROC curve
plot(perf, colorize=TRUE) # Show the ROC curve
performance(pred, "auc")@y.values[[1]] # Calculate the AUC
El comando graficar proporciona el siguiente resultado:
Mientras que el comando “performance” (“desempeño”) proporciona un AUC de

0,8677759, el cual es consistente con el AUC reportada por MaxEnt. A continuación,
como un ejemplo de las pruebas disponibles en R pero no así en MaxEnt, llevaremos a
cabo un estimado de la desviación estándar del AUC mediante reiteraciones
(“bootstrap”).
AUC <- function(p,ind) {

pres <- p[ind]
combined <- c(pres, bb)
label <- c(rep(1,length(pres)),rep(0,length(bb)))
predic <- prediction(combined, label)
return(performance(predic, "auc")@y.values[[1]])
}
b1 <- boot(testpp, AUC, 100) # do 100 bootstrap AUC calculations

b1 # gives estimates of standard error and bias
Esto proporciona la siguiente salida:
ORDINARY NONPARAMETRIC BOOTSTRAP
Call:
boot(data = testpp, statistic = AUC, R = 100)
Bootstrap Statistics :
original bias std. error
t1* 0.8677759 -0.0003724138 0.02972513
y vemos que el estimado por reiteraciones del error estándar (0,02972513) es

cercano al error estándar calculado por MaxEnt (0,028). Los resultados de las
reiteraciones también pueden ser empleadas para determinar los intervalos de
confianza para las AUC:
boot.ci(b1)
dados los siguientes cuatro estimados – vea la sección de recursos al final de ésta guía
para referencias que definen y comparan estos estimados.
Intervals :
Level Normal Basic
95% ( 0.8099, 0.9264 ) ( 0.8104, 0.9291 )
Level Percentile BCa
95% ( 0.8064, 0.9252 ) ( 0.7786, 0.9191 )
Aquellos que estén familiarizados con el uso de las reiteraciones notarán que aquí
estamos reiterando solamente los valores de presencia. Podríamos también reiterar
los valores de fondo, pero los resultados no cambiarían mucho, dado que hay un gran
número de valores de fondo (10000).
Como un ejemplo final, investigaremos el cálculo de las estadísticas binomial y Kappa

de Cohen para algunas reglas de umbral de ejemplo. Primero, el siguiente código R
calcula el índice Kappa para el umbral dado según la predicción de presencia mínima:
confusion <- function(thresh) {

return(cbind(c(length(testpp[testpp>=thresh]), length(testpp[testpp<thresh])),
c(length(bb[bb>=thresh]), length(bb[bb<thresh]))))
}
mykappa <- function(thresh) {
return(Kappa(confusion(thresh)))
}
mykappa(min(trainpp))
el cual da un resultado de 0,0072. Si queremos usar el umbral que minimiza la

sumatoria de la sensibilidad y de la especificidad en base a los datos de prueba,
podemos hacer lo siguiente, usando los valores de la tasa positiva verdadera y de la
tasa positiva falsa del objeto “desempeño” (“performance”) usado arriba para graficar
la curva ROC:
fpr = perf@x.values[[1]]
tpr = perf@y.values[[1]]
maxsum = 0
for (i in 1:length(perf@alpha.values[[1]])) {
sum = tpr[[i]] + (1-fpr[[i]])
if (sum > maxsum) {
maxsum = sum
cutoff = perf@alpha.values[[1]][[i]]
index = i
}
}
mykappa(cutoff)
esto da un valor de Kappa de 0,0144. Para determinar las probabilidades binomiales

de estos dos valores de umbral podemos hacer lo siguiente:
mybinomial <- function(thresh) {

conf <- confusion(thresh)
trials <- length(testpp)
return(binom.test(conf[[1]][[1]], trials, conf[[1,2]] / length(bb), "greater"))
}
mybinomial(min(trainpp))
mybinomial(cutoff)
esto da valores de p de 5,979e-09 y 2,397e-11 respectivamente, los cuales son

ligeramente mayores que los valores de p dados por MaxEnt. La razón de ésta
diferencia radica en el hecho de que el número de muestras de prueba es mayor que
25, el umbral por arriba del cual MaxEnt usa una aproximación normal para calcular
valores de p binomios.
Recursos de R
Algunos buenos materiales introductorios sobre el uso de R puede encontrarse en:

http://spider.stat.umn.edu/R/doc/manual/R-intro.html, y otras páginas en el mismo
sitio.
http://www.math.ilstu.edu/dhkim/Rstuff/Rtutor.html
MODELO DE DISTRIBUCIÓN GEOGRÁFICA POTENCIAL CON EL MÉTODO DE
SOBREPOSICIÓN DE CAPAS
Miriam Alejandra Zavalza Ávila, Luis Ángel Hernández Martínez y Ulises
Romero Méndez
ÍNDICE
Obtención y preparación de datos de GBIF..................................................3
Obtención y preparación de datos de presencia........................................ ..3
Convertir datos de presencia a shapefile usando ArcMap 10.2....................7
Convertir datos de presencia a shapefile usando QGIS 2.4....................... 10
Obtención de datos de presencia de CONABIO.........................................13
Unir varios shapefiles en un solo archivo usando QGIS 2.x....................... 14
Unir varios shapefiles en un solo archivo usando ArcMap 10.2................. 15
Obtención y preparación de datos de terreno.............................................16
Datos de relieve.......................................................................................... 16
Máscara de corte........................................................................................ 18
Recortar el MDE usando SAGAGIS 2.1.................................................... 18
Derivar Aspecto y Pendiente a partir de un MDE en SAGAGIS 2.1.......... 20
Recortar el MDE usando ArcMap 10.2....................................................... 21
Derivar Aspecto y Pendiente a partir de un MDE en ArcMap 10.2............. 23
Otros datos de terreno................................................................................ 26
Conversión de shapefiles a capas raster usando SAGAGIS 2.1...............28
Conversión de shapefiles a capas raster usando ArcMap 10.2.................. 30
Obtención y preparación de datos climáticos............................................. 33
Unir los mosaicos en SAGAGIS 2.1.......................................................... 36
Unir los mosaicos en ArcMap 10.2............................................................. 37
Modelado en Maxent 3.3.3k........................................................................39
Modelado en DIVAGIS 7.5.........................................................................43
Modelado por superposición aditiva en ArcMap 10.2................................. 49
Extracción de atributos ambientales y análisis de correlación....................51
Reclasificación y sobreposición aditiva de capas raster en ArcMap 10.2...56
1
Obtención y preparación de
datos de presencia.
Para modelar el nicho potencial de una especie se requiere contar con la
geolocalización precisa de individuos o poblaciones en el espacio real. Los
datos de presencia pueden encontrarse en distintos formatos y fuentes, así
como con grados variables de calidad e información adicional.
• Tesis, monografías, artículos y otros trabajos impresos pueden incluir, como

anexos, listas de puntos de presencia. Si éste fuera el caso, sería
necesario capturar la información, además de convertir las coordenadas
al formato de grados decimales.
• Si se cuenta con mapas de distribución, será necesario digitalizarlos,
georreferenciarlos, y usarlos como base para crear una capa vectorial
de puntos.
• Algunas bases de datos en internet (como la de CONABIO) permiten la
descarga directa de archivos vectoriales de puntos. Otras, sin embargo,
sólo tienen disponibles archivos de texto, que deben ser depurados y
convertidos antes de poder utilizarse. Se detallará el proceso a
continuación, utilizando la base de datos de la Global Biodiversity
Information Facility (GBIF) y la de CONABIO como ejemplos.
Obtención y preparación de datos de la base de datos GBIF.

1. Accesar en el navegador a la página http://www.gbif.org. Para descargar
datos, se necesita estar registrado en ella. Dar clic al enlace “Create a
new account”, en la parte superior derecha de la página de inicio (1), o
“Login”, si ya se está registrado.
2. Colocar el ratón sobre la pestaña “Data”(2). Se desplegará una lista;

hacer clic sobre “Explore species”.
• Alternativamente, se puede dar clic sobre “Species”(3) en la página de

inicio.
3
3. Aparecerá una página de búsqueda en la que habrá que escribir el
nombre de la especie de interés. En este caso, Astrophytum capricorne.
4. Aparecerá una página de resultados, con los grupos taxonómicos que

coincidan con la página de resultados. Dar clic en el conjunto de datos
deseados.
5. Se desplegará una página con los detalles sobre el conjunto de datos

seleccionados. Dar clic en el botón “View Occurrences”.
6. Aparecerá una lista con los registros de ocurrencias. Dar clic en el botón
“Download”.
7. Aparecerá un cuadro de diálogo y después una página de confirmación

para informar que la descarga se está preparando. Cuando la descarga
4
esté lista, GBIF enviará un correo con el enlace al archivo. Sin embargo,
a veces el correo no llega. El status de la descarga puede consultarse
desde la página de cuenta, en la pestaña “Downloads”.
8. Cuando el status sea Ready for download, dar clic en “download”. Se

descargará un archivo *.zip con varios documentos.
5
9. El archivo que contiene la información necesaria es occurrence.txt. Los
contenidos de este documento pueden importarse a algún programa de
hoja de cálculo para su fácil edición y depuración. Los programas
utilizados en este manual para modelar el nicho requieren únicamente
tres columnas: identificador, latitud, y longitud. Pueden descartarse los
registros que no tengan esta información, a menos que sea posible
deducirla con la suficiente certeza a partir de otros datos (ver la columna
“locality”).
10. Guardar este archivo, que servirá como base para generar los archivos
necesarios para modelar el nicho, en formato *.xls.
6
Convertir datos de presencia a shapefile usando ArcMap 10.2.
1. Importar el archivo *.xls a ArcMap utilizando la herramienta “Excel to
Table”, localizada en System Toolboxes > Conversion Tools > Excel.
2. Aparecerá un cuadro de diálogo en el cual se seleccionará el archivo a

importar y la tabla de datos que se exportará como resultado. Esta
última no es importante para este o futuros procesos, por lo que se
puede dejar este campo como viene predeterminado.
3. En la tabla de contenidos aparecerá la tabla que acabamos de importar.

Dar clic derecho sobre el nombre de la tabla y seleccionar la opción
“Display XY Data...” del menú desplegable.
7
4. Aparecerá un cuadro de
diálogo. Definir los campos que
contienen la información de
longitud (X) y latitud (Y), y
definir el sistema de proyección
haciendo clic en el botón
“Edit”(1) y seleccionando el
adecuado de la lista que
aparecerá en una ventana
emergente.
5. Aparecerá un archivo vectorial de

puntos en la tabla de
contenidos. Dar clic en el
nombre de esta capa y
seleccionar “Data > Export
Data” del menú desplegable.
8
6. Seleccionar la ubicación y el nombre con el que guardaremos el
archivo. En la parte inferior, seleccionar la opción “Save as Type:
Shapefile”.
9
Convertir datos de presencia a shapefile usando QGIS 2.4.
1. Guardar el archivo *.xls como *.csv.
2. En la barra de herramientas de QGIS, hacer clic en el menú “Capa >

Insertar capa de texto delimitado”.
3. Aparecerá un cuadro de diálogo en el que se definirá el archivo a importar,

el tipo de archivo (seleccionar CSV), y las columnas de la geometría
(generalmente, QGIS selecciona correctamente las columnas que
tengan “latitud” o “longitud” como parte del título).
Nota: Ya que la tabla de datos no contiene información sobre el sistema
de proyección, QGIS usará por defecto del sistema de coordenadas del
proyecto, que se define en el menú “Proyecto > Propiedades del
proyecto”, pestaña “SRC”.
10
4. Dar clic derecho en el nombre de la capa de puntos (en el panel Capas), y
dar clic en “Guardar como...” en el menú desplegable.
11
5. Aparecerá un cuadro de diálogo, donde se definirá el tipo de archivo como
“Archivo shape de ESRI”, la ubicación y nombre del archivo en el campo
“Guardar como”, y las demás opciones pueden dejarse por defecto. Dar
clic en el botón Aceptar.
12
Obtención de datos de presencia de CONABIO.
1. Accesar a la página http://www.conabio.gob.mx/informacion/gis/
2. Hacer clic en la pestaña Buscar, en la parte superior izquierda, para

buscar el nombre del organismo de interés.
3. Al presionar Enter, aparecerán los resultados de la búsqueda. Buscar

entre los resultados alguno cuyo nombre incluya “Distribución conocida”,
y hacer clic en “Ver Metadato” (1). En el encabezado del metadato, dar
clic en “SHP” (2) para descargar el archivo *.zip que contiene los
archivos *.shp, *.shx, *.prj y *.dbf que deberán extraerse.
13
Unir varios shapefiles en un solo archivo usando QGIS 2.x.
1. Archivar los shapefiles a unir en una misma carpeta.
2. Hacer clic en el menú “Vectorial > Herramientas de gestión de datos >

Combinar archivos shape en uno”.
3. En el cuadro de diálogo que aparecerá, seleccionar la carpeta que

contiene los shapefiles, definir el tipo de archivo como “Punto”, y definir
la ubicación y nombre del archivo de salida, es decir, el archivo que
contendrá los puntos de todos los shapefiles a fusionar. Activar la casilla
de “Añadir resultado al mapa” permitirá visualizar inmediatamente el
resultado de esta operación.
14
Unir varios shapefiles en un solo archivo usando ArcMap 10.2.
1. Abrir la herramienta “System Toolbox > Data Management Tools > General >
Merge”.
2. Hacer clic en el botón junto

al campo “Input Dataset”,
navegar hasta la ubicación
de los shapefiles a unir,
mantener presionada la
tecla Ctrl y hacer clic
izquierdo en los archivos
deseados. Cuando ya
estén todos
seleccionados, presionar
el botón “Add”. Pueden
eliminarse los campos del
shapefile haciendo clic en
la “X” a la derecha del
campo “Field Map
(Optional)”.
3. Hacer clic en “Ok”. ArcMap procesará las capas.
4. Cuando haya terminado el proceso, exportar la capa como shapefile

siguiendo el procedimiento descrito en los pasos 5 y 6 de la sección
“Convertir datos de presencia a shapefile usando ArcMap
10.2”Obtención y preparación de datos de presencia.
15
Obtención y preparación de datos de terreno.
Para fines de este manual, los datos de terreno abarcan la información sobre
el relieve, y otras características correspondientes al medio abiótico distintas
al clima; por ejemplo, el uso de suelo y vegetación, la presencia de cuerpos
de agua, tipos de suelo, etcétera.
Datos de relieve.
Estos datos se encuentran representados en los modelos digitales de
elevación (MDE, o DEM, por sus siglas en inglés), a partir de los cuales se
pueden obtener capas raster que representen la orientación, pendiente y
curvatura del terreno.
En el caso de México, esta información se puede obtener gratuita y
fácilmente del INEGI, a través del portal de descarga del Continuo de
Elevaciones Mexicano. El continuo base fue generado en una resolución de
15 m, del que se derivan las resoluciones de 30, 60, 90 y 120 m. INEGI tiene
disponible información sobre el relieve continental y submarino. Para
descargar MDE continentales, hacer clic en la pestaña “Geografía” en la
parte superior izquierda de la página principal del sitio de INEGI. Se
desplegará un menú, colocar el cursor sobre “Temas” y hacer clic en “Datos
de Relieve”.
16
Hacer clic en “Continental” en la página de Datos de relieve. Hacer clic en
“Continuo de Elevaciones Mexicano (CEM) 3.0 – Descarga”. Se desplegará
la interfaz de descarga del CEM.
1. Seleccionar la resolución y área de descarga deseadas en el cuadro de la

izquierda.
2. Descargar los archivos necesarios.
17
Máscara de corte.
Para procesar las capas raster que se utilizarán para el modelo, primero hay
que preparar un shapefile que delimite el polígono del área del modelo, en el
mismo sistema de proyección que los puntos de presencia.
Recortar el MDE usando SAGAGIS 2.1.

1. Importar el MDE utilizando el módulo Import / Export GDAL /OGR >
GDAL: Import Raster.
•Nota: Al hacer clic en cualquier campo en el que haya que definir una ruta,
aparecerá un botón con tres puntos que, al ser presionado, abrirá una
ventana en la cual se podrá navegar hasta el archivo deseado.
2. Reproyectar el MDE a la misma proyección que los datos de presencia,

utilizando el módulo Projection – Proj.4 >Coordinate Transformation
(Grid). Para seleccionar el MDE importado, primero habrá que definir el
sistema de grillas (Grid System) a partir de la lista desplegable. Eso
permitirá seleccionar el MDE de la lista desplegable junto a “Source”. La
proyección por defecto es WGS 84 (EPSG:4326). Al hacer clic en OK se
empezará a ejecutar el módulo.
18
3. Cargar el shapefile de la máscara de corte desde File > Shapes > Load o
el botón Load.
4. Cortar el MDE utilizando el módulo Shapes – Grid > Clip Grid with
Polygon. Asegurarse de seleccionar el MDE reproyectado.
5. Exportar el MDE recortado como archivo *.asc utilizando el módulo Import

/Export – Grids > Export ESRI Arc/Info Grid. Asegurarse de seleccionar
la capa correcta. Definir la ruta y nombre de archivo en el campo “File”.
19
Derivar Aspecto y Pendiente a partir de un MDE en SAGAGIS 2.1.
1. Utilizar el módulo Terrain Analysis – Morphometry > Slope, Aspect,
Curvature, seleccionando el MDE como capa de “Elevation”.
2. Definir todas las capas que se quieran crear como “create”. Las que no
sean necesarias pueden quedar como “not set”. Elegir el método
preferido en la lista desplegable “Method”.
3. Exportar las capas generadas, una a la vez, como archivo *.asc utilizando
el módulo Import /Export – Grids > Export ESRI Arc/Info Grid.
20
Recortar el MDE usando ArcMap 10.2.
1. Agregar el MDE al proyecto. No es necesario crear pirámides.
2. Agregar el shapefile de la máscara de corte al proyecto.
3. Para reproyectar el MDE, usar la herramienta Tools > System Toolboxes >
Data Management Tools > Projections and Transformations > Raster >
Project Raster. Seleccionar el raster a reproyectar de la lista
desplegable “Input”, y definir el sistema de coordenadas al que se va a a
convertir presionando el botón junto al campo “Output Coordinate
System” y seleccionando el adecuado en la ventana que aparecerá.
Cuando todo esté listo, presionar el botón OK en la parte inferior
izquierda de la ventana.
4. Para recortar el MDE reproyectado, usar la herramienta Tools > System

Toolboxes > Spatial Analyst Tools > Extraction > Extract by Mask.
Seleccionar la capa reproyectada en la lista desplegable “Input raster” y
el shapefile en la lista “Input raster or feature mask data”.
21
5. Para exportar a *.asc el raster recortado, usar la herramienta Tools >
System Toolboxes > Conversion Tools > From Raster > Raster to ASCII.
Seleccionar el raster recortado en la lista desplegable “Input raster” y
hacer doble clic en el campo “Output ASCII raster file”. Aparecerá una
ventana en la que se definirá la ubicación y nombre del archivo. En la
parte inferior, hacer clic en la lista desplegable “Tipo” y seleccionar el
segundo “File”, para que el archivo sea guardado como *.asc y no *.txt.
22
Derivar Aspecto y Pendiente a partir de un MDE en ArcMap 10.2.
1. Para generar una cobertura de aspecto, usar la herramienta Tools >
System Toolboxes > Spatial Analyst > Surface > Aspect.
2. Para generar una cobertura de pendiente, usar la herramienta Tools >

System Toolboxes > Spatial Analyst > Surface > Slope. En la lista
desplegable “Output measurement” puede definirse si las unidades en
que se medirá la pendiente serán grados (DEGREE) o porcentaje
(PERCENT_RISE).
3. Exportar las capas raster generadas haciendo clic derecho en la

herramienta Tools > System Toolboxes > Conversion Tools > From
23
Raster > Raster to ASCII. Seleccionar la opción “Batch del menú
desplegable.
4. En la ventana que aparecerá, agregar las capas raster a convertir en la

columna “Input Raster”, haciendo clic en cada fila y seleccionando la
capa de interés en la lista desplegable. Presionar el botón “+”, en la
parte superior derecha de la ventana, agregará otra fila a la lista.
24
5. Hacer doble clic en algún campo de la columna “Output ASCII raster file”
abrirá una ventana en la cual se podrá seleccionar la ruta, nombre y tipo
de archivo como si fuera un archivo individual. Cuando todos los
archivos a exportar hayan sido definidos, dar clic en OK.
25
Otros datos de terreno.
El INEGI, además, tiene disponibles distintas coberturas con información
adicional sobre el terreno, que, dependiendo de la especie a modelar,
pueden resultar útiles. Éstos recursos se encuentran en la pestaña
Geografía > Temas > Recursos Naturales.
En la página de Recursos Naturales, hacer clic en la información de interés.
26
Buscar enlaces para descargar “datos vectoriales”.
27
Conversión de shapefiles a capas raster usando SAGAGIS 2.1.
1. Cargar los shapefiles a convertir, así como alguna de las capas raster ya
reproyectadas y la máscara de corte.
2. Reproyectar usando el módulo Projection – Proj.4 > Coordinate

Transformation (Shapes List).
3. Utilizar el módulo Grid Gridding > Shapes to Grid. (Nota: Para convertir
un vector a raster, debe poseer una columna numérica que represente
las categorías que queremos distinguir en el raster. En el caso de las
capas vectoriales de INEGI, esta columna suele ser “FC”).
4. Tras hacer clic en Okay, aparecerá una ventana dónde definir las
propiedades dela capa a generar. Cambiar “Cellsize” al mismo que la
28
capa raster cargada durante el primer paso (Este dato puede
consultarse seleccionando la capa en la pestaña “Data” del panel
“Manager”, y después, viendo la pestaña “Description” en el panel
“Object Description”).
5. Recortar las capas raster generadas utilizando el módulo Shapes – Grid >
Clip Grid with Polygon.
6. Exportar las capas raster recortadas utilizando el módulo Import /Export –

Grids > Export ESRI Arc/Info Grid.
29
Conversión de shapefiles a capas raster usando ArcMap 10.2.
1. Reproyectar los shapefiles usando la herramienta “Tools > System Toolboxes
> Data Management Tools > Projections and Transformations > Batch
Project”. Agregar las capas una a una haciendo clic en el botón junto al
campo “Input Feature Class or Dataset”.
2. Convertir los shapefiles haciendo clic derecho en la herramienta “Tools >

System Toolboxes > Conversion Tools > To Raster > Polygon to Raster” para
ejecutarla en modo de lotes (batch).
1. Hacer doble clic en el campo “Input Features” para definir los

shapefiles a convertir.
2. Seleccionar el campo que servirá para la conversión a raster en el

campo “Value Field”.
3. Cambiar el valor de Cellsize si es necesario. A mayor tamaño de

celda, menor resoución. Generar rásteres de alta resolución toma
más tiempo.
30
3. Recortar las capas raster generadas utilizando la herramienta “Tools >
System Toolboxes > Spatial Analyst Tools > Extraction > Extract by Mask”;
usando como máscara el MDE recortado. Presionar el botón
“Environment...” para hacer ajustes.
1. En “Output Coordinates > Output Coordinate System” = “Same as

layer [MDE recortado]”.
2. En “Processing Extent > Extent” = “Same as layer [MDE recortado]”.
3. En “Cartography > Cartographic Coordinate System” = “Same as layer

[MDE recortado]”.
4. En “Raster Analysis > Cellsize” = “Same as layer [MDE recortado]”.
5. En “Raster Analysis > Mask”, seleccionar el MDE recortado de la lista

desplegable.
31
4. Exportar las capas recortadas usando la herramienta “Tools > System
Toolboxes > Conversion Tools > From Raster > Raster to ASCII” en modo de
lotes.
32
Obtención y preparación de
datos climáticos.
Nota: Para descargar información climática específica para DIVAGIS, ir a
http://divagis.org/climate.
Aunque la información climática puede obtenerse de diversas fuentes, ya

sea de las estaciones climáticas o depnedencias oficiales del país, para fines
de este manual se utilizarán las 19 capas bioclimáticas de WorldClim
(http://www.worldclim.org/download).
1. Seleccionar el periodo de la información climática deseada (Condiciones

actuales, pasadas o futuras).
33
2. Seleccionar la resolución deseada. En este caso, 30 segundos de arco.
Dependiendo de la velocidad de descarga de internet y la extensión en
que se va a trabajar, se pueden descargar las capas globales o los
mosaicos individuales. Para descargar todo el territorio mexicano, se
necesita descargar los mosaicos 12, 22 y 23. Hacer clic en el mosaico a
descargar y aparecerán los enlaces de descarga. Hacer clic en “Bioclim”
de formato genérico (BIL).
34
3. Si se descarga el archivo global, se puede proceder a reproyectarlo,
cortarlo y exportarlo como *.asc.
35
Unir los mosaicos en SAGAGIS 2.1.
1. Importar las capas a unir utilizando el módulo Import / Export GDAL /OGR
> GDAL: Import Raster.
2. Definir la proyección de las capas utilizando el módulo Projection – Proj. 4

> Coordinate Transformation (Grid List). La proyección de las capas de
WorldClim es WGS 84 (EPSG: 4326).
3. Unir las capas de la misma variable utilizando el módulo Grid Tools >
Mosaicking. Será necesario correr el módulo una vez por capa a
generar.
4. Cortar las capas unidas utilizando el módulo Shapes – Grid > Clip Grid
with Polygon.
5. Exportar las capas recortadas con el módulo Import /Export – Grids >
Export ESRI Arc/Info Grid.
36
Unir los mosaicos en ArcMap 10.2.
1. Usar la herramienta System Toolboxes > Data Management Tools >
Raster > Raster Dataset > Mosaic To New Raster.
1. Agregar los archivos a unir en el botón a la derecha del campo

“Input Rasters”. Mantener presionada la tecla Ctrl para seleccionar
múltiples archivos.
2. Definir la ubicación donde se guardará el archivo presionando el

botón a la derecha de Output Location.
3. Definir el nombre y extensión del archivo en el campo Raster

Dataset Name with Extension.
4. Elegir un sistema de referencia con el botón a la derecha del

campo Spatial Reference for Raster.
5. Escribir “1” en el campo Number of Bands.
37
6. Las demás opciones pueden quedar en la configuración por
defecto.
2. Cortar el mosaico generado con la herramienta Tools > System Toolboxes
> Spatial Analyst Tools > Extraction > Extract by Mask; usando como
máscara el MDE recortado. (Ver paso 3 de “Conversión de shapefiles a
capas raster usando ArcMap 10.2.”)
3. Para exportar a *.asc el raster recortado, usar la herramienta Tools >

System Toolboxes > Conversion Tools > From Raster > Raster to ASCII.
38
Modelado en Maxent
3.3.3k.
Archivos necesarios para el proceso.
Preparación del archivo de presencia.

1. Copiar la lista de coordenadas del shapefile que contiene todos los puntos
de presencia a una hoja de cálculo. El orden de columnas para Maxent es
especie, longitud, latitud. (Nota: El archivo puede contener más de una
especie).
2. Guardar el archivo como texto delimitado por comas (*.csv).
39
Modelado en Maxent
1. Correr el archivo maxent.jar
2. Cargar el archivo de los puntos de presencia presionando el botón
“Browse” en el apartado “Samples”. Seleccionar las especies a modelar, si el
archivo contiene más de una.
3. Cargar las capas raster del modelo seleccionando la carpeta que las
contiene con el botón “Browse” en el apartado “Environmental Layers”. Tener
atención en señalar las capas categóricas como tales.
4. Definir el tipo, ubicación y formato de los archivos a generar con las
opciones de la parte inferior de la ventana.
40
5. Configurar el modelo a discreción con las opciones del botón “Settings”.
41
6. Cuando la configuración esté lista, presionar el botón “Run”.
42
Modelado en DIVA-GIS 7.5
Archivos necesarios para el proceso
Información climática para DIVAGIS

1. Visitar la página http://www.divagis.org/climate.
2. Descargar el archivo (zip) con la resolución (10, 5 o 2.5 minutos) e

información (condiciones actuales o futuras) deseada.
43
3. Descomprimir los archivos en la carpeta C:/Archivos de programa/diva
gis/environ.
Preparación de capas raster
1. Hacer clic en el Menú Data > Import to Gridfile > Multiple Files.
2. Seleccionar el tipo de archivo, definir la carpeta donde se guardarán las

carpetas convertidas, y agregar los archivos a convertir con el botón
“Add File”.
44
Modelado en DIVAGIS 7.5
1. Agregar el archivo shp de presencia con el menú Layer > Add Layer.
2. Agregar las capas raster que se usarán para el modelo haciendo un stack
con el menú Stack > Make Stack. Seleccionar las capas a agregar con el
botón Add Grid. Definir ubicación y nombre de archivo del stack con el
botón Filename.
3. Hacer de la capa de puntos la capa activa haciendo clic sobre ella con el
boón izquierdo en el panel de contenidos (la capa activa se distingue
por aparecer en relieve). Hacer clic en el menú Modeling > Bioclim /
Domain.
45
4. En la pestaña Input, seleccionar si se modelará con base en la información
climática o en algún stack. Además, se puede definir si se removerán
duplicados de los datos y si hay una o varias clases en el shp.
46
5. En la pestaña Predict, presionar el botón Maximum extent para que la
extensión del modelo sea la misma que la de las capas raster. Si se está
modelando a partir de la información climática, se puede seleccionar un
área con el botón Draw a rectangle, o escribiendo las coordenadas
máximas y mínimas para X y Y. De lo contrario, la extensión del modelo
será la de las coordenadas máximas de la capa de puntos de presencia.
6. Elegir un tipo de modelo de la lista desplegable Type output y definir la

ubicación y nombre del archivo .grd del modelo.
47
7. Exportar el modelo con el menú Data > Export Gridfile > Single File. El
botón Output perite navegar hacia la dirección deseada de
almacenamiento y agrega la extensión adecuada al nombre de archivo.
48
Modelado por superposición
aditiva en ArcMap 10.2
Archivos necesarios para el proceso.
• Además debe contar con alguna plataforma para análisis estadísticos como
el SPSS o el Statgraphics, durante el desarrollo de esta guía
utilizaremos el SPSS versión 21.
Preparación de archivo de presencia.

1. Copiar la lista de coordenadas de la especie de interés en una hoja de
cálculo. Esta base de datos debe contener un identificador numérico
(ID), el nombre de la especie, longitud y latitud. Además es
recomendable añadir otros datos útiles, como la localidad, el autor
nomenclatural, el estatus de riesgo etc.
49
2. Guardar el archivo en formato *.csv delimitado por tabulaciones.
3. Importar el archivo en forma de puntos siguiendo la ruta > file > Add Data
> Add XY Data.
4. Una vez desplegados los registros georreferenciados de la especie se

debe asegurar visualmente que todos se hallan dentro del área de
estudio. De no ser así se deben hacer las correcciones pertinentes en la
base de datos. También es recomendable realizar un análisis de
concordancia visual para corroborar la correcta ubicación de los
registros mediante las localidades correspondientes a cada coordenada.
Si el despliegue de puntos es correcto se procederá a exportar como shape file
(*.shp) la capa de puntos mediante la siguiente ruta: haciendo clic derecho sobre
la figura > Data > Export Data. No deben utilizarse caracteres especiales para
nombrar el archivo de salida, utilizando guión bajo para separar las palabras.
50
Extracción de atributos ambientales y análisis de correlación.
1. Agregar las capas raster de las variables ambientales, todas en formato
*.grd con igual tamaño de píxel. Para fines de este manual se utilizaran
las variables disponibles en WorldClim, a excepción de las capas
promedio, además de la elevación (MDE). (El tamaño de píxel
recomendado es de 1km aproximadamente).
2. Una vez añadido el shape file de puntos y las capas raster que contienen
las variables ambientales, así como el MDE, procederemos a extraer los
valores de dichas capas: > ArcToolbox > Spatial Analyst Tools >
Extraction > Extract Multi Values to Points. En este paso se asocian los
valores de cada capa a la tabla de atributos del shape file de puntos
geográficos de la especie de estudio.
3. Esta tabla de atributos de los puntos debe ser exportada en formato *.dbf,
para luego ser importada desde el programa SPSS: > Archivo > Abrir >
Datos (debe asegurarse que en la opción "Archivos de tipo" de la
ventana de apertura de archivos del SPSS se halle seleccionada la
opción de dBase *.dbf.
51
4. El análisis de correlación se lleva a cabo mediante la ruta > Analizar >
Correlaciones > Bivariadas. En la ventana de correlaciones bivariadas
deberán agregarse a la casilla de "Variables" las columnas que
contengan los datos ambientales y los valores del MDE, además de
seleccionar las opciones de correlación de Pearson y la prueba de
significación bilateral.
52
5. Como resultado de este análisis se obtendrá una tabla con los valores de
correlación de las variables ambientales, a partir de esta se llevará un
proceso de selección mediante el cual se eliminarán las variables
correlacionadas significativamente (>.075). En esta etapa debe tomarse
en cuenta la biología de la especie en cuestión, por ejemplo, al modelar
la distribución potencial de especies cuya distribución está ligada
fuertemente a la altitud, se debe considerar la importancia de la variable
elevación (MDE), eliminando las variables que correlacionen con esta.
6. Durante este ejercicio las

variables ambientales que
serán utilizadas son las
siguientes: Bio 5, Bio 6, Bio
7, Bio 12, Bio 17, Bio 19 y la
elevación (MDE). Estas
deben ser analizadas
nuevamente en el SPSS, en
esta ocasión a través de una
análisis de frecuencias que
nos permitirá identificar
datos atípicos, reconocer los
rangos (máximo y mínimo)
para realizar la extracción de
atributos y llevar a cabo la
reclasificación más adelante.
Las frecuencias se obtienen
mediante la ruta > Analizar > Estadísticos descriptivos > Frecuencias.
53
7. En la ventana de Análisis de Frecuencias se deben añadir a la ventana de
"Variables" únicamente las que fueron seleccionadas después del
análisis de correlación y en la opción de "Gráficos" seleccionar la opción
de "Histogramas".
8. Al concluir el paso anterior ya podremos observar las frecuencias en la

ventana de resultados del SPSS. Estas gráficas permiten detectar datos
atípicos que debieran evaluarse para decidir si es necesario eliminarlos
de la base de datos original o si bien es posible corregirlos, además
permiten identificar el rango de extracción de atributos como se muestra
en la figura.
54
9. La extracción se lleva a cabo en la ruta > ArcToolbox > Spatial Analyst
Tools > Extraction > Extract by Attributes. En la ventana de este proceso
se añade la máscara de elevación en la casilla de "Input raster",
mientras que en la casilla de "Where clause" se introduce la sintaxis de
extracción de la siguiente manera: ("VALUE" >= Valor mínimo) AND
("VALUE" <= Valor máximo). El Valor mínimo en este ejemplo es
1000 como se puede observar en el gráfico de frecuencias y el Valor
máximo es de 1600. Las observaciones que van de 1800 a 1900 se
consideraron datos atípicos y no son considerados en la extracción.
Cuando exista más de un rango para extraer debe agregarse el prefijo
"OR" de la siguiente forma: ("VALUE" >= Valor mínimo) AND
("VALUE" <= Valor máximo) "OR" ("VALUE" >= Valor mínimo) AND
("VALUE" <= Valor máximo). Por último en la casilla de "Output raster"
se añade la ruta del nuevo raster de salida. Al finalizar este paso
tendremos la variable de elevación (MDE) en una nueva capa que
contiene únicamente los valores donde se hallan los registros de
presencia. Este proceso debe realizarse con cada una de las variables
seleccionadas a través del análisis de correlación bivariada.
55
Reclasificación y sobreposición aditiva de capas raster en
ArcMap 10.2.
1. Al contar con las capas nuevas producto de la extracción se procederá a
reclasificar cada una de ellas con ayuda del gráfico de frecuencias.
Debe asignarse un valor con orden descendente (101) dando el
número más alto al rango de valores que contiene el mayor número de
registros de la especie. A continuación se muestra un ejemplo de
reclasificación de la variable de elevación (MDE).
56
2. Este procedimiento se realiza siguiendo la ruta >ArcToolbox > Spatial
Analyst Tools > Reclass > Reclassify. En la opción de "Input raster" debe
añadirse la variable que se pretende reclasificar y en la opción de
"Reclass field" el campo "Value". Al dar clic sobre el botón Classify se
desplegará la ventana donde es posible definir el número de clases a
utilizar (en esta ocasión 6). Luego hacer clic sobre "OK".
3. Posteriormente en el recuadro de "Reclassification" es necesario ingresar

la reclasificación como fue estructurada en al pasos anteriores y dar clic
en "Aceptar".
57
4. La reclasificación debe realizarse con cada capa siguiendo los mismos
lineamientos. Se deberá obtener una nueva capa con los valores de
reclasificación sustituyendo los valores originales para todas las capas
utilizadas en el modelado.
5. Para finalizar, las capas reclasificadas deben ser superpuestas mediante

la ruta ArcToolbox > Spatial Analyst Tools > Map Algebra > Raster
Calculator. La sintaxis que se debe ingresar es la siguiente:
"Capa1"+"Capa2"+"Capa3", hasta completar todas las capas utilizadas.
Luego de definir la carpeta de salida dar clic en "OK".
6. Como resultado del proceso anterior se obtiene un modelo que

representa, en porcentaje, la idoneidad ambiental para albergar a la
especie de estudio en el área geográfica de modelado. Los valores del
modelo deben dividirse entre el número mayor para definir dicho
porcentaje.
58
59
60
61
62
63
64
65
66
67
68
69
70

Compi Lación Sobre Teorías y Ejemplos PDF

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Compi Lación Sobre Teorías y Ejemplos PDF

Загружено:

Авторское право:

Доступные форматы

UNIVERSIDAD JUÁREZ DEL ESTADO DE DURANGO

FACULTAD DE CIENCIAS BIOLÓGICAS

Compilación sobre teorías y ejemplos

Compilado y editado por

Dr. Ulises Romero Méndez

Laboratorio de Sistemas de Información Geográfica (GISLAB)

Gómez Palacio, Durango, México Diciembre de 2014

CONABIO elaboró una serie de páginas que contienen la teoría, conceptos e

La presente compilación de páginas, trabajos y ejercicios, fue realizada con la

Se agradece de antemano a la CONABIO y a los autores de ésta página WEB, de donde

Ulises Romero Méndez

*Nota. En esta guía presentamos recomendaciones prácticas sobre el uso de

Las tres preguntas conceptuales clave en SDM y ENM son:

1) ¿Qué objeto (área potencial, área invadible, área ocupada), o sus

2) ¿Con qué clase de datos se cuenta (únicamente presencias, presencias

3) ¿Cuál es el contexto ecológico y biogeográfico del problema, o

Las respuestas a estas preguntas determinan, primero, qué

Además, existen varias preguntas prácticas muy importantes:

1) Respecto a la cantidad y tipo de datos ¿Hay un número mínimo de datos de

2) Respecto a las variables predictoras, ¿Conviene usar muchas o pocas? ¿Crudas,

3) Respecto a la verificación. ¿Cómo se verifica un resultado? ¿Existe algún método

Los consejos prácticos son el resultado de más de 15 años de

El área Go de Rhynchopsitta terrisi

Este explosivo crecimiento se debe en buena medida a:

 los avances técnicos constituidos por los sistemas de información geográfica y

La idea fundamental tanto en la modelación de áreas (SDM) como en la modelación

La utilización de programas llamados Sistemas de Información Geográfica (SIGs) es

Arriba se muestra una parte del continente americano, superpuesta con

Abajo se muestra el correspondiente espacio E, para la misma región, usando tres

La importancia fundamental de definir nichos y áreas en términos de subconjuntos

1. La región del mundo donde se encuentran las condiciones ambientales que

Heurísticamente, estos conceptos permiten definir dos importantes regiones: el área

área ocupada y del área invadible.

 Casos extremos del BAM

 Las ausencias se deben a razones radicalmente diferentes, dependiendo de la

Es importante contar con información sobre M (por

Mundo de Hutchinson. Llamado de esta manera porque se supone que

Un post-proceso utilizando hipótesis biogeográficas para recortar el área estimada

Mundo de Wallace. Llamado así porque el factor limitante para establecer

La cantidad fundamental en la que esta uno interesado es la probabilidad de que la

1) Se está en el pixel x, o bien

Esta es una probabilidad indisolublemente asociada a los métodos de observación,

La probabilidad p[z(x)|Y=1] es la probabilidad de estar en el ambiente z dado que se

Hasta este momento, la cantidad p(Y=1|x) es una cantidad de tipo estadístico. No se le

 Ecología de Poblaciones y el BAM

Entonces, en una retícula de extensión geográfica y resolución arbitraria, se usa como

1. Un término denso-independiente, ri,g, que representa la tasa intrínseca de

Resolver las ecuaciones de abajo es muy difícil, salvo para

1. La region A es la zona donde la tasa de crecimiento intrínseca es positiva.

Una de las consecuencias de analizar el diagrama BAM sobre la base de ecuaciones de

A: La región del planeta donde se encuentran las condiciones scenopoéticas

Área Ocupada (símbolo GO): La región del planeta donde la probabilidad de

Proyección. La operación de hacer corresponder a cada punto en la superficie del

Datos primarios. Los que ubican un individuo de una especie en un lugar, en un

Datos secundarios. Los que dependen de interpretación, generalización, promediado,

Ausencias estrictas: Datos que documentan de manera explícita la ausencia de una

Transfondo (background): Son datos tomados al azar de la región de interés y

Datos de presencias. Los datos derivados de la observación, o la captura de un

 Definiciones relacionadas con el

Nichos Grinnelianos: Un subconjunto del espacio E (o sea, compuesto por variables

Nicho Fundamental Existente (Símbolo N*F): La intersección del nicho fundamental

Scenopoéticas (variables): Son variables no interactivas de una especie. Las

 ¿Con qué tipo de datos se cuenta? Si se cuenta con datos de ausencias