Вы находитесь на странице: 1из 12

UNIVERSIDAD NACIONALJORGE BASADRE GROHMANN

FACULTAD DE CIENCIAS JURIDICAS Y EMPRESARIALES

E.A.P. INGENIERIA COMERCIAL

1-1-2015 ANALISIS
MULTIVARIADO

CURSO : METODOS PREDICTIVOS


DOCENTE : Dr. Humberto Espada
ALUMNA : PAREDES, Gladys

TACNA – PERU
2015
CASO PRÁCTICO:

En el siguiente caso analizaremos las variables con respecto al PBI, teniendo en


cuenta las variables AGRICULTURA, MINERÍA, SERVICIO, DISTRIBUCIÓN.
Usaremos una base de datos de 51 datos por cada variable.

Para este ejemplo utilizaremos el programa STATGRAPHICS.


1. Procesando en el programa STATGRAPHICS:
2. Resultados:
Análisis Multivariado

Datos/Variables:
PBI
AGRICULTURA
MINERÍA
SERVICIO
DISTRIBUCIÓN

Existen 51 casos completos a utilizarse en los cálculos.

El StatAdvisor

Este procedimiento está diseñado para resumir varias columnas de datos cuantitativos.
Calculará varios estadísticos, incluyendo correlaciones, covarianzas y correlaciones
parciales. En el procedimiento también están incluidas una serie de gráficas
multivariadas, que proporcionan vistas interesantes de los datos. Use los íconos de
Opciones Tabulares y de Opciones Gráficas en la barra de herramientas para análisis,
para acceder a estos diferentes procedimientos.

Después de este procedimiento, tal vez quiera seleccionar otro para construir un modelo
estadístico de sus datos. Dependiendo de sus objetivos, uno de varios procedimientos
podría ser apropiado. A continuación se presenta una lista de objetivos con una
indicación del procedimiento que podría ser apropiado:

OBJETIVO: Construir un modelo para predecir una variable dados los valores de una ó
más variables.

PROCEDIMIENTO: Relacionar – Varios Factores – Regresión Múltiple

OBJETIVO: Agrupar filas de datos con características similares.


PROCEDIMIENTO: Describir – Métodos Multivariados – Análisis de Conglomerados

OBJETIVO: Desarrollar un métodos para predecir a cuál de varios grupos pertenencen


nuevas filas.

PROCEDIMIENTO: Relacionar – Métodos de Clasificación – Análisis Discriminante

OBJETIVO: Reducir el número de columnas a un conjunto más pequeño de medidas


significativas.

PROCEDIMIENTO: Describir – Métodos Multivariados – Análisis Factorial

OBJETIVO: Determina que combinación de columnas contribuyen con la mayor


variabilidad en los datos.

PROCEDIMIENTO: Describir – Métodos Multivariados – Componentes Principales

OBJETIVO: Encontrar combinaciones de las columnas que están fuertemente


asociadas entre sí.

PROCEDIMIENTO: Describir – Métodos Multivariados – Correlaciones Canónicas

2.1. Resumen Estadístico

PBI AGRICULTURA MINERÍA SERVICI DISTRIBUCIÓN


O
Recuento 51 51 51 51 51
Promedio 183395. 44074.1 26273.7 42640.6 37984.1
Desviación Estándar 93079.5 17023.0 16144.2 26071.6 18288.5

Coeficiente de 50.7534 38.6236% 61.4463 61.1426% 48.1478%


Variación % %
Mínimo 56320.0 18470.0 4170.0 13920.0 11590.0
Máximo 396380. 74950.0 49630.0 111280. 81310.0
Rango 340060. 56480.0 45460.0 97360.0 69720.0
Sesgo Estandarizado 1.2678 0.0324392 0.020935 2.9455 1.19626
2
Curtosis -1.34571 -1.91974 -2.41252 0.147234 -1.226
Estandarizada

El StatAdvisor

Esta tabla muestra el resumen estadístico para cada una de las variables seleccionadas.
Incluye medidas de tendencia central, de variabilidad, y de forma. De particular interés
aquí es el sesgo estandarizado y la curtosis estandarizada, las cuales pueden usarse
para determinar si la muestra proviene de una distribución normal. Valores de estos
estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la
normalidad, las cuales tenderían a invalidar muchos de los procedimientos estadísticos
que se aplican habitualmente a estos datos. en este caso, las siguientes variables
muestran valores de sesgo estandarizado y de curtosis estandarizada fuera del rango
esperado:
SERVICIO
Las siguientes variables muestran curtosis estandarizada fuera del rango esperado:

MINERÍA
Para hacer las variables más normales, podría intentar una transformación tal como
LOG(Y), RAÍZ(Y), ó 1/Y.

2.2. Intervalos de confianza del 95.0%

Media Error Est. Límite Inferior Límite Superior

PBI 183395. 13033.7 157216. 209575.

AGRICULTURA 44074.1 2383.7 39286.3 48861.9

MINERÍA 26273.7 2260.64 21733.1 30814.4

SERVICIO 42640.6 3650.75 35307.8 49973.3

DISTRIBUCIÓN 37984.1 2560.9 32840.4 43127.9

Sigma Límite Inferior Límite Superior

PBI 93079.5 77880.4 115705.

AGRICULTURA 17023.0 14243.3 21160.9

MINERÍA 16144.2 13508.0 20068.5

SERVICIO 26071.6 21814.3 32409.0

DISTRIBUCIÓN 18288.5 15302.2 22734.0

El StatAdvisor

Esta tabla muestra intervalos de confianza del 95.0% para las medias y desviaciones
estándar de cada una de las variables. Estos intervalos acotan el error de muestreo en
los estimados de los parámetros de las poblaciones de las cuales provienen los datos.
Pueden usarse para ayudarle a juzgar con que precisión se han estimado las medias y
desviaciones estándar poblacionales. Los intervalos asumen que las poblaciones de
las cuales provienen las muestras pueden ser representadas por distribuciones
normales. Mientras que los intervalos de confianza para las medias son bastante
robustos y no muy sensibles a violaciones de este supuesto, los intervalos de confianza
para las desviaciones estándar son muy sensibles. Se puede verificar el supuesto de
normalidad en el procedimiento de Análisis de una Variable.
2.3. Correlaciones

PBI AGRICULTURA MINERÍA SERVICIO DISTRIBUCIÓN

PBI 0.9734 0.9358 0.9726 0.9977


(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
AGRICULTURA 0.9734 0.9458 0.9090 0.9708

(51) (51) (51) (51)


0.0000 0.0000 0.0000 0.0000
MINERÍA 0.9358 0.9458 0.8448 0.9343
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
SERVICIO 0.9726 0.9090 0.8448 0.9661
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
DISTRIBUCIÓN 0.9977 0.9708 0.9343 0.9661

(51) (51) (51) (51)


0.0000 0.0000 0.0000 0.0000
Correlación
(Tamaño de Muestra)
Valor-P

El StatAdvisor

Esta tabla muestra las correlaciones momento producto de Pearson, entre cada par de
variables. El rango de estos coeficientes de correlación va de -1 a +1, y miden la fuerza
de la relación lineal entre las variables. También se muestra, entre paréntesis, el
número de pares de datos utilizados para calcular cada coeficiente. El tercer número
en cada bloque de la tabla es un valor-P que prueba la significancia estadística de las
correlaciones estimadas. Valores-P abajo de 0.05 indican correlaciones
significativamente diferentes de cero, con un nivel de confianza del 95.0%. Los
siguientes pares de variables tienen valores-P por debajo de 0.05:

PBI y AGRICULTURA
PBI y MINERÍA
PBI y SERVICIO
PBI y DISTRIBUCIÓN
AGRICULTURA y MINERÍA
AGRICULTURA y SERVICIO
AGRICULTURA y DISTRIBUCIÓN
MINERÍA y SERVICIO
MINERÍA y DISTRIBUCIÓN
SERVICIO y DISTRIBUCIÓN
2.4. Correlación Ordinal de Spearman

PBI AGRICULTURA MINERÍA SERVICI DISTRIBUCIÓN


O
PBI 0.9866 0.9420 0.9929 0.9964
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
AGRICULTURA 0.9866 0.9357 0.9748 0.9839

(51) (51) (51) (51)


0.0000 0.0000 0.0000 0.0000
MINERÍA 0.9420 0.9357 0.9364 0.9465
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
SERVICIO 0.9929 0.9748 0.9364 0.9874
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
DISTRIBUCIÓN 0.9964 0.9839 0.9465 0.9874

(51) (51) (51) (51)


0.0000 0.0000 0.0000 0.0000
Correlación
(Tamaño de Muestra)
Valor-P

El StatAdvisor

Esta tabla muestra las correlaciones por rango de Spearman, entre cada par de
variables. El rango de estos coeficientes de correlación va de -1 a +1, y miden la fuerza
de la asociación entre las variables. En contraste con las correlaciones de Pearson más
comunes, los coeficientes de Spearman se calculan a partir del orden (ranks) de los
datos, más que de sus valores mismos. En consecuencia, son menos sensibles a
valores aberrantes (outliers) que los coeficientes de Pearson. También se muestra,
entre paréntesis, el número de pares de datos utilizados para calcular cada coeficiente.
El tercer número en cada bloque de la tabla es un valor-P que prueba la significancia
estadística de las correlaciones estimadas. Valores-P abajo de 0.05 indican
correlaciones significativamente diferentes de cero, con un nivel de confianza del 95.0%.
Los siguientes pares de variables tienen valores-P por debajo de 0.05:

PBI y AGRICULTURA
PBI y MINERÍA
PBI y SERVICIO
PBI y DISTRIBUCIÓN
AGRICULTURA y MINERÍA
AGRICULTURA y SERVICIO
AGRICULTURA y DISTRIBUCIÓN
MINERÍA y SERVICIO
MINERÍA y DISTRIBUCIÓN
SERVICIO y DISTRIBUCIÓN
2.5. Covarianzas

PBI AGRICULTURA MINERÍA SERVICIO DISTRIBUCIÓN

PBI 8.66379E 1.5424E9 1.40625E 2.36034E 1.69843E9


9 9 9
(51) (51) (51) (51) (51)
AGRICULTURA 1.5424E9 2.89783E8 2.59922E 4.03416E 3.02223E8
8 8
(51) (51) (51) (51) (51)
MINERÍA 1.40625E 2.59922E8 2.60636E 3.55572E 2.75842E8
9 8 8
(51) (51) (51) (51) (51)
SERVICIO 2.36034E 4.03416E8 3.55572E 6.79726E 4.60626E8
9 8 8
(51) (51) (51) (51) (51)
DISTRIBUCIÓN 1.69843E 3.02223E8 2.75842E 4.60626E 3.3447E8
9 8 8
(51) (51) (51) (51) (51)
Covarianza
(Tamaño de Muestra)

El StatAdvisor
Esta tabla muestra las covarianzas estimadas entre cada par de variables. Las
covarianzas miden qué tanto varían las variables conjuntamente, y se utilizan para
calcular las correlaciones momento producto de Pearson. También se muestra, entre
paréntesis, el número de pares de datos utilizados para calcular cada coeficiente.

2.6. Correlaciones Parciales

PBI AGRICULTURA MINERÍA SERVICIO DISTRIBUCIÓN

PBI 0.7739 0.7715 0.9120 0.8815


(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
AGRICULTURA 0.7739 -0.5024 -0.7734 -0.5116

(51) (51) (51) (51)


0.0000 0.0003 0.0000 0.0002
MINERÍA 0.7715 -0.5024 -0.8412 -0.5154
(51) (51) (51) (51)
0.0000 0.0003 0.0000 0.0002
SERVICIO 0.9120 -0.7734 -0.8412 -0.6329
(51) (51) (51) (51)
0.0000 0.0000 0.0000 0.0000
DISTRIBUCIÓN 0.8815 -0.5116 -0.5154 -0.6329

(51) (51) (51) (51)


0.0000 0.0002 0.0002 0.0000
Correlación
(Tamaño de Muestra)
Valor-P
El StatAdvisor

Esta tabla muestra los coeficientes de correlación parcial entre cada par de variables.
Las correlaciones parciales miden la fuerza de la relación lineal entre las variables,
considerando primero el ajuste por su relación con las otras variables de la tabla.
Ayudan a juzgar que tan útil sería una variable para mejorar las predicciones de la
segunda variable, dada la información de todas las otras variables que ya han sido
consideradas. También se muestra, entre paréntesis, el número de pares de datos
utilizados para calcular cada coeficiente. El tercer número en cada bloque de la tabla
es un valor-P que prueba la significancia estadística de las correlaciones estimadas.
Valores-P abajo de 0.05 indican correlaciones significativamente diferentes de cero, con
un nivel de confianza del 95.0%. Los siguientes pares de variables tienen valores-P por
debajo de 0.05:

PBI y AGRICULTURA
PBI y MINERÍA
PBI y SERVICIO
PBI y DISTRIBUCIÓN
AGRICULTURA y MINERÍA
AGRICULTURA y SERVICIO
AGRICULTURA y DISTRIBUCIÓN
MINERÍA y SERVICIO
MINERÍA y DISTRIBUCIÓN
SERVICIO y DISTRIBUCIÓN

3. Análisis de los gráficos:

3.1. Matriz de dispersión

Matriz de Dispersiones La Matriz de Dispersiones crea una matriz de dispersiones


divariadas para todos los pares de variables de Opciones de Análisis.
3.2. Gráficas de Estrellas

3.3. Gráficas de Rayos


La mayor diferencia es la ubicación de los vértices. Para cada variable, el vértice se
localiza en el medio del rayo si el valor de esa variable es igual a la media muestral.
Se localiza al final del rayo si está 3 o más desviaciones estándar por encima de la
media y muy cerca del centro de la figura si el valor está 3 o más desviaciones
estándar por debajo de la media muestral.
3.4. Llave Glifo

Se han desarrollado muchos métodos para desplegar datos multivariados. Un método


útil es el del glifo. Un glifo es una figura simbólica construida para desplegar el valor de
variables cuantitativas múltiples. El procedimiento Análisis de Múltiples Variables genera
glifos en forma de polígonos:

PBI

DISTRIBUCIÓN AGRICULTURA

SERVICIO MINERÍA

Вам также может понравиться