Академический Документы
Профессиональный Документы
Культура Документы
FACULTAD DE INGENIERIA
ESCUELA ACADEMICA PROFESIONAL DE INGENIERIA DE
MINAS
CODIGO: 2013-38967
CICLO: 8VO
TACNA-PERÚ
2017
EXPLORACION DE DATOS GEOESTADISTICA
INTRODUCCION
1
EXPLORACION DE DATOS GEOESTADISTICA
EXPLORACION DE DATOS
TABLA DE FRECUENCIAS
Una tabla de frecuencias completa organiza los datos de manera tal que en una
columna de la tabla aparecen los valores de la variable, de distinta manera según
se trate de una variable discreta o de una variable continua, y en sucesivas
columnas se muestran diferentes tipos de frecuencias asociadas a esos valores
(frecuencias absolutas, frecuencias relativas, frecuencias absolutas acumuladas
y frecuencias relativas acumuladas). Para datos categorizados en escala
nominal no se usan frecuencias acumuladas.
2
EXPLORACION DE DATOS GEOESTADISTICA
3
EXPLORACION DE DATOS GEOESTADISTICA
DIAGRAMA DE DISPERSION
Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un
tipo de diagrama matemático que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos. Los datos se
muestran como un conjunto de puntos, cada uno con el valor de una variable
que determina la posición en el eje horizontal (x) y el valor de la otra variable
determinado por la posición en el eje vertical (y).1
Se emplea cuando una variable está bajo el control del experimentador. Si existe
un parámetro que se incrementa o disminuye de forma sistemática por el
experimentador, se le denomina parámetro de control o variable independiente y
habitualmente se representa a lo largo del eje horizontal (eje de las abscisas).
La variable medida o dependiente usualmente se representa a lo largo del eje
vertical (eje de las ordenadas). Si no existe una variable dependiente, cualquier
variable se puede representar en cada eje y el diagrama de dispersión mostrará
el grado de correlación (no causalidad) entre las dos variables.
4
EXPLORACION DE DATOS GEOESTADISTICA
5
EXPLORACION DE DATOS GEOESTADISTICA
Los parámetros estadísticos sirven para sintetizar la información dada por una
tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:
De centralización.
De posición
De dispersión.
MEDIDAS DE CENTRALIZACION
Las medidas de centralización son:
MEDIA
Otro valor que es usado como medida de posición central para describir al
conjunto de datos es el promedio o media aritmética. La media es un valor que
se ubica en el centro o cercana al centro de una distribución. Se obtiene por el
cociente entre la suma de todos los datos y la cantidad total de datos.
MEDIANA
Hay valores que se ubican en el centro de la distribución, o cercanos a éste, y
otros que se encuentran en los extremos. Aquel valor que ocupa exactamente el
centro de la distribución, de modo que la mitad de los datos son valores menores
o iguales que éste y la otra mitad son valores que lo superan, se
denomina mediana.
6
EXPLORACION DE DATOS GEOESTADISTICA
MODA
Todos los valores de una variable no están igualmente distribuidos dentro del
rango de variación; esto es, los valores se presentan con diferentes frecuencias.
Al valor que aparece con mayor frecuencia se lo denomina modo o moda. Una
distribución puede tener más de un valor modal (multimodal), también puede ser
que no exista ninguna moda. El modo es la medida de tendencia central más
usada en variables con escala nominal.
MEDIDAS DE POSICION
Las medidas de posición dividen un conjunto de datos en grupos con el mismo
número de individuos.
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
Las medidas de posición son:
7
EXPLORACION DE DATOS GEOESTADISTICA
CUARTIL
PERCENTIL
El percentil es una medida de posición usada en estadística que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual
se encuentra un porcentaje dado de observaciones en un grupo de
observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran
el 20 por ciento de las observaciones. Se representan con la letra P. Para el
percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son
valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en
18851
P25 = Q1.
8
EXPLORACION DE DATOS GEOESTADISTICA
P50 = Q2 = mediana.
P75 = Q3.
MEDIDAS DE DISPERSION
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los
valores de la distribución.
Las medidas de dispersión son:
LA VARIANZA
DESVIACION ESTANDAR
9
EXPLORACION DE DATOS GEOESTADISTICA
COEFICIENTE DE VARIACION
COEFICIENTE DE ASIMETRIA
Las medidas de asimetría son indicadores que permiten establecer el grado de
simetría (o asimetría) que presenta una distribución de probabilidad de
una variable aleatoria sin tener que hacer su representación gráfica. Como eje
de simetría consideramos una recta paralela al eje de ordenadas que pasa por
10
EXPLORACION DE DATOS GEOESTADISTICA
CURTOSIS
También conocida como apuntamiento o sesgo, la curtosis es -en teoría de la
probabilidad y estadística- una medida que sirve para analizar el grado de
concentración que presentan los valores de una variable analizada alrededor de
la zona central de la distribución de frecuencias, sin necesidad de generar el
gráfico.
La medida de curtosis trata de estudiar la proporción de la varianza que se
explica por la combinación de datos extremos respecto a la media en
contraposición con datos poco alejados de la misma.
Una mayor curtosis implica una mayor concentración de datos muy cerca de la
media de la distribución coexistiendo al mismo tiempo con una relativamente
elevada frecuencia de datos muy alejados de la misma. Esto explica una forma
de la distribución de frecuencias con colas muy elevadas y con un centro muy
apuntado.
Un coeficiente de apuntamiento o de curtosis es el basado en el cuarto momento
con respecto a la media y se define como:
11
EXPLORACION DE DATOS GEOESTADISTICA
12
EXPLORACION DE DATOS GEOESTADISTICA
PRACTOCA Nº 01 DE GEOESTADISTICA
1. DATA:
Y
COORDENADAS Fe
N-M
X Y (%)
1 265418.12 4732201.04 0.1
2 265415.34 4732180.6 0.05
3 265407.06 4732194.4 0.2
4 265418.08 4732249.79 0.01
5 265405.61 4732185.19 0.01
6 265418.94 4732183.05 0.01
7 265410.5 4732181.3 0.01
8 265418.76 4732205.39 0.01
9 265411.34 4732253.36 0.01
13
EXPLORACION DE DATOS GEOESTADISTICA
14
EXPLORACION DE DATOS GEOESTADISTICA
2. ANALISIS CUALITATIVO:
VARIABLE VALOR
FORMULAS: VALOR MINIMO 0.02
𝑅 VALOR MAXIMO 0.72
𝐴= Nº de datos 70
𝐾
rango 0.7
𝐾 = 1 + 3.3𝐿𝑜𝑔(𝑛) K 8
AMPLITUD 0.0875
𝑅 = 𝑉𝑎𝑙𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑚𝑖𝑛
TABLA DE FRECUENCIAS
# Intervalos xi fi hi Fi Hi hi*100 Hi*100
Intervalos
1 0.010 0.098 0.054 71.000 0.710 71.000 0.710 71% 71%
2 0.098 0.185 0.141 19.000 0.190 90.000 0.900 19% 90%
3 0.185 0.273 0.229 2.000 0.020 92.000 0.920 2% 92%
4 0.273 0.360 0.316 2.000 0.020 94.000 0.940 2% 94%
5 0.360 0.448 0.404 2.000 0.020 96.000 0.960 2% 96%
6 0.448 0.535 0.491 3.000 0.030 99.000 0.990 3% 99%
7 0.535 0.623 0.579 0.000 0.000 99.000 0.990 0% 99%
8 0.623 0.710 0.666 1.000 0.010 100.000 1.000 1% 100%
100.000 1.000 100%
GRAFICOS:
Histograma
80.000
70.000
60.000
50.000
40.000
fi
30.000
20.000
10.000
0.000
-10.000 0.054 0.141 0.229 0.316 0.404 0.491 0.579 0.666
xi
15
EXPLORACION DE DATOS GEOESTADISTICA
Grafica Acumulada
120%
100%
80%
Hi*100
60%
40%
20%
0%
0.054 0.141 0.229 0.316 0.404 0.491 0.579 0.666
xi
Ubicacion de Puntos
4732270
4732260
4732250
4732240
Coordenada Y
4732230
4732220
4732210
4732200
4732190
4732180
4732170
4732160
265395 265400 265405 265410 265415 265420 265425
Coordenada X
CAMPANA DE GAUSS
X fx FX
-1
-0.8
1.536E-18
2.0749E-12
1.95333E-20
3.216E-14
CAMPANA DE GAUSS
-0.6 1.6026E-07 3.17351E-09
-0.4 0.00070776 1.92984E-05 3
-0.2 0.17871958 0.007673227
0 2.58036305 0.231939803 2.5
0.2 2.1301732 0.831258715
0.4 0.10054823 0.995984645 2
0.6 0.00027137 0.999992953
0.8 4.1876E-08 0.999999999 1.5
1 3.6949E-13 1
1.2 1.8641E-19 1 1
1.4 5.3772E-27 1
1.6 8.8688E-36 1 0.5
1.8 8.3638E-46 1
2 4.5099E-57 1 0
2.2 1.3904E-69 1 -2 -1 0 1 2 3 4
2.4 2.4511E-83 1 -0.5
2.6 2.4706E-98 1
2.8 1.424E-114 1
3 4.692E-132 1
16
EXPLORACION DE DATOS GEOESTADISTICA
GRAFICO ACUMALADO FX
1.2
0.8
0.6
0.4
0.2
0
-2 -1 0 1 2 3 4
-0.2
3. ANALISIS CUANTITATIVO:
media 0.087
mediana 0.050
moda 0.010
cuartil Q1 0.020
cuartil Q2 0.050
cuartil Q3 0.100
percentil1 0.020
percentil2 0.050
percentil3 0.100
MEDIDA VALOR
Varianza 0.014
Desv. Estándar 0.118
COEF. VARIACIÓN 8.543
17
EXPLORACION DE DATOS GEOESTADISTICA
DATA N°02
COORDENADAS Cu
N-M
X Y (%)
1 62 118 0.05
2 69 112 0.05
3 68 129 0.05
4 67 144 0.04
5 80 0 0.06
6 78 11 0.05
7 74 29 0.06
8 78 68 0.06
9 75 85 0.06
10 71 99 0.05
11 78 107 0.04
12 74 120 0.41
13 78 128 0.08
14 71 137 0.11
15 71 160 0.13
16 87 20 0.16
17 88 37 0.02
18 83 47 0.03
19 87 63 0.26
20 87 77 0.09
21 82 94 0.09
22 86 109 0.22
23 87 121 0.14
24 82 145 0.34
25 86 160 0.03
26 95 10 0.05
27 98 34 0.05
28 92 47 0.05
29 96 82 0.05
30 93 92 0.11
31 96 117 0.11
32 91 131 0.07
33 96 145 0.09
34 91 150 0.03
35 103 2 0.26
36 104 19 0.19
37 103 53 0.18
38 102 70 0.12
39 109 79 0.13
40 103 88 0.11
41 102 101 0.02
42 106 108 0.05
43 107 117 0.12
44 101 132 0.18
45 114 8 0.18
46 114 23 0.33
47 113 36 0.02
48 119 41 0.02
49 119 59 0.02
50 112 64 0.06
51 120 72 0.09
52 119 88 0.1
53 117 102 0.02
18
EXPLORACION DE DATOS GEOESTADISTICA
ANALISIS CUALITATIVO
FORMULAS
𝑅 Variable Valor
𝐴=𝐾
n 70
𝐾 = 1 + 3.3𝐿𝑜𝑔(𝑛) mínimo 0.02
máximo 0.72
𝑅 = 𝑉𝑎𝑙𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑚𝑖𝑛 A 0.088
K 8.000
𝐿𝑖+𝑈𝑖
𝑥𝑖 = 2 R 0.7
19
EXPLORACION DE DATOS GEOESTADISTICA
GRAFICOS
Histograma
50.000 44.000
40.000
30.000
18.000
20.000
FI
Grafica Acumulada
63%
Ubicacion de datos
180
160
140
Coodenada Y
120
100
80
60
40
20
0
0 20 40 60 80 100 120 140 160
Coordenada X
20
EXPLORACION DE DATOS GEOESTADISTICA
CAMPANA DE GAUSS
x fx Fx
-1.00 0.0000 0.0000 CAMPANA DE GAUSS
-0.80 0.0000 0.0000
3.0000
-0.60 0.0000 0.0000
-0.40 0.0002 0.0000 2.0000
-0.20 0.0903 0.0034
1.0000
0.00 2.2069 0.1696
0.20 2.5484 0.7856 0.0000
0.40 0.1390 0.9944 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
0.60 0.0004 1.0000 -1.0000
ANALISIS CUANTITATIVO:
MEDIDAS DE CENTRALIZACION:
media 0.109
MEDIANA 0.060
MODA 0.050
cuartil Q1 0.050
cuartil Q2 0.060
cuartil Q3 0.130
percentil1 0.050
percentil2 0.060
percentil3 0.130
21
EXPLORACION DE DATOS GEOESTADISTICA
MEDIDAS DE DISPERSION:
MEDIDA VALOR
Varianza 0.013
Desv. Estandar 0.114
COEF. VARIACIÓN 8.860
MEDIDAS DE FORMA:
Coefic. de Asimetr. 2.958
Kurtosis 11.669
22
EXPLORACION DE DATOS GEOESTADISTICA
CONCLUSIONES
23
EXPLORACION DE DATOS GEOESTADISTICA
REFERENCIAS BIBLIOGRAFICAS
http://www.fca.proed.unc.edu.ar/mod/book/tool/print/index
.php?id=3270
https://es.wikipedia.org/wiki/An%C3%A1lisis_exploratorio
_de_datos
http://www.vitutor.com/estadistica/descriptiva/a_7.html
http://www.ub.edu/aplica_infor/spss/cap2-3.htm
24