Вы находитесь на странице: 1из 35

Maestra en Ciencias de la GeoInformacin y Observacin de la Tierra

Mdulo 3.

PRINCIPIOS DE MODELAMIENTO Y GEOESTADSTICA

Anlisis Exploratorio de Datos


Marzo, 2013
CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Objetivos de la Clase
El Definir qu es el Anlisis Exploratorio de Datos (A.E.D.). Indicar cules son las etapas a seguir en la realizacin de un A.E.D. Comprobar si se verifican algunas hiptesis de inters en los datos.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Contenidos de la Clase
El Mtodo Estadstico Terminologa Introduccin al AED Etapas del AED Elementos del AED

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Estadstica
Ciencia que proporciona un conjunto de tcnicas para: Recolectar y resumir, clasificar, analizar e interpretar
el comportamiento de cierto conjunto de datos con respecto a una caracterstica motivo de investigacin.
CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

El mtodo estadstico
Se desarrolla empleando el ciclo deductivoinductivo: 1. Planteamiento del problema. 2. Recoleccin de datos. 3. Organizacin y clasificacin de los datos recogidos. 4. Anlisis e interpretacin de los resultados
CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Bases Estadsticas
Poblacin y muestras. Variables y Muestreo. Datos. Cualitativos Cuantitativos Nominal Discretos Ordinal Continuos

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Introduccin al AED
Conjunto de tcnicas estadsticas cuya finalidad es conseguir un entendimiento bsico de los datos. Explicar el tipo de relaciones existentes entre las variables analizadas. Primera aproximacin a los datos, sin ninguna idea preconcebida.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Introduccin al AED
Definido por John W. Tukey (E.D.A.: Exploratory data analysis, 1977) es, bsicamente, el tratamiento estadstico al que se someten las muestras recogidas durante un proceso de investigacin en cualquier campo cientfico.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Finalidad del AED


Organizar y preparar los datos. Detectar fallos en el diseo y recogida de los mismos, tratamiento y evaluacin de datos ausentes (missing). identificacin de casos atpicos (outliers). Comprobacin del supuesto de Normalidad.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Importancia del AED


til en la refinacin de modelos. Proporciona una perspectiva razonada para la interpretacin de datos. Ayuda a comprender la estructura de los datos. Necesaria para la posterior aplicacin de tcnicas estadsticas que requieren ciertos supuestos como la Normalidad.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Etapas del A.E.D.


1. Preparar los datos. 2. Realizar un examen grfico y un anlisis descriptivo. 3. Realizar un examen de las relaciones entre las variables analizadas y una cuantificacin del grado de interrelacin existente entre ellas.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Etapas del A.E.D.


1. Identificar los posibles: Casos atpicos y Los datos ausentes adems de evaluar el impacto potencial que puedan ejercer en anlisis estadsticos posteriores. 2. Evaluar, la normalidad.
CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Elementos Bsicos
Estadsticos descriptivos.
Medidas de dispersin, posicin y forma.

Tablas de frecuencia. Herramientas grficas.


Histograma, Grficos Boxplot, steam and leaf y Q-Q.

Prueba o test de normalidad.


Prueba de Anderson- Darling, Kolmogorov-Smirnov o Shapiro-Wilks.
CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Anlisis unidimensional
Escala de medida Representaciones grficas Diagrama de barras Diagrama de lneas Diagrama de sectores Boxplot Histogramas Polgono de frecuencias Medidas de tendencia central Medidas de dispersin

Nominal

Moda

Ordinal

Mediana

Rango Intercuartlico

Continuos

Media

Desviacin Tpica

Discreto

Media Geomtrica

Coeficiente de Variacin

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Estadsticos descriptivos:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Distribucin de frecuencias-Tipos

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED - Asimetra

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED - Curtosis
Coeficiente de aplanamiento

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Tabla de frecuencia:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Histograma:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Grfico Boxplot:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Grfico steam and leaf:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Grfico Q-Q:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

AED Variable: Cadmio


Prueba o test de normalidad. Prueba de Kolmogorov-Smirnov o ShapiroWilks.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

XlStat
Luego de instalar o en el mismo momento se deben habilitar los macros.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

XlStat
Se deben seleccionar los datos de trabajo: suelos.xls

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

XlStat
Se deben seleccionar tambin mas para grficos.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

XlStat
Los resultados sern presentados en hojas adicionales:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

XlStat
Los resultados sern presentados en hojas adicionales:

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Propiedades - NORMALIDAD
1. La distribucin normal estndar tiene media = 0 y desviacin estndar =1.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Propiedades - NORMALIDAD
3. El rea bajo la curva o probabilidad de menos infinito a ms infinito vale 1. 4. La distribucin normal es simtrica, la mitad de curva tiene un rea de 0.5. 5. La escala horizontal de la curva se mide en desviaciones estndar.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Prueba de Hiptesis - NORMALIDAD


1. Planteamiento de Hiptesis
Ho: La muestra de pH sigue una distribucin Normal Ha: La muestra de pH no sigue una distribucin Normal

2. Definicin del nivel de significancia:


= 0.05

3. Determinacin del estadstico de prueba: Test Anderson-Darling


CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Prueba de Hiptesis - NORMALIDAD


4. Determinacin de la condicin de rechazo:
Para decidir si rechazamos o no tenemos en cuenta el valor de la probabilidad (p-valor), y el valor de significancia con la siguiente relacin: P-Valor < se rechaza la Hiptesis nula En este caso tendramos que p-valor del Test Anderson-Darling es = 0. 175 y el p-valor de la Prueba de Shapiro-Wilk es = 0.435, con un nivel de significacin de 0.05 no podemos rechazar Ho.

5. Conclusin.
Se puede afirmar con una seguridad estadstica del 95% que los datos de la muestra del pH Cd siguen una distribucin normal.

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Prueba de Hiptesis - NORMALIDAD

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Gracias por su atencin

CENTRO DE LEVATAMIENTOS AEROESPACIALES Y APLICACIONES SIG PARA EL DESARROLLO SOSTENIBLE DE LOS RECURSOS NATURALES

Вам также может понравиться