Вы находитесь на странице: 1из 25

UNIVERSIDAD NACIONAL JORGE BASADRE GROHMANN

FACULTAD DE INGENIERIA
ESCUELA ACADEMICA PROFESIONAL DE INGENIERIA DE
MINAS

“PRACTICA Nº01 DE GEOESTADISTICA”

CURSO: TOPICOS DE INGENIERIA DE MINAS II

TEMA: EXPLORACION DE DATOS

NOMBRE: ANTONIO ABARCA SOTOMAYOR

CODIGO: 2013-38967

CICLO: 8VO

DOCENTE: ING. JORGE SEGURA DAVILA

TACNA-PERÚ

2017
EXPLORACION DE DATOS GEOESTADISTICA

INTRODUCCION

El objetivo del análisis exploratorio es resumir y visualizar datos de manera que


se facilite la identificación de tendencias o patrones que los subyacen y que son
relevantes para responder alguna pregunta de interés.

Un importante concepto en Estadística es el de variable aleatoria ya que


permiten describir fenómenos aleatorios, donde existe variabilidad. Los datos de
las variables aleatorias varían en torno a valores característicos que proveen
información valiosa para comprender el fenómeno en estudio.

El análisis exploratorio sintetiza valores de variables aleatorias tratando de


maximizar la relación señal/ruido del conjunto de datos.

En las clases de este Capítulo se proveen herramientas de la Estadística


Descriptiva para organizar, representar y explorar datos de una variable sin
pretender extender los resultados a una población de la cual estos podrían
provenir.

A través de medidas resumen y una variedad de gráficos se muestran de manera


sintética las cantidades relevadas en distintos tipos de
estudios, estudios poblacionales oestudios muestrales, estudios experimentale
s o estudios observacionales).

En la exploración de datos las técnicas a usar dependen del tipo de variable, el


cual está íntimamente asociado a la escala de medición (Escala Nominal, Escala
Ordinal, Escala Intercalar y Escala de Razón). Para variables cuantitativas se
usan medidas resumen tales como medias, desvíos estándar, mínimos y
máximos e histogramas y gráficos de barras, mientras que para variables
cualitativas o categorizadas se usan porcentajes y gráficos de sectores y de
barras apiladas.

1
EXPLORACION DE DATOS GEOESTADISTICA

EXPLORACION DE DATOS

La aplicación de un procedimiento de inferencia estadística requiere que los


datos provengan de una población que cumpla determinadas características.

El análisis exploratorio de datos es el paso previo a la aplicación de cualquier


método de análisis inferencial.

Una primera aproximación consiste en reducir toda la información muestral a un


reducido grupo de valores numéricos, los parámetros estadísticos, cuyo
conocimiento puede dar pie a la detección de algún patrón de comportamiento
que nos aporte información sobre la distribución de probabilidad bajo la que se
ha obtenido la muestra.

FRECUENCIAS Y DISTRIBUCIONES DE FRECUENCIAS


Las frecuencias asociadas a los valores de una variable aleatoria indican la
cantidad de veces que un mismo valor fue observado en el conjunto de unidades
en análisis.

Las frecuencias en que se presentan los valores de una variable se pueden


tabular o graficar.

El objetivo de conocer empíricamente (es decir a partir de los datos)


la distribución de una variable aleatoria se relaciona con la necesidad de poder
luego aproximar, razonablemente, la distribución observada de la variable con
un modelo probabilístico teórico que permitirán calcular una probabilidad de
interés para comprender mejor un fenómeno aleatorio y concluir bajo incerteza.

TABLA DE FRECUENCIAS

Una tabla de frecuencias completa organiza los datos de manera tal que en una
columna de la tabla aparecen los valores de la variable, de distinta manera según
se trate de una variable discreta o de una variable continua, y en sucesivas
columnas se muestran diferentes tipos de frecuencias asociadas a esos valores
(frecuencias absolutas, frecuencias relativas, frecuencias absolutas acumuladas
y frecuencias relativas acumuladas). Para datos categorizados en escala
nominal no se usan frecuencias acumuladas.

HISTOGRAMAS Y POLÍGONOS DE FRECUENCIAS

Para representar frecuencias de una variable aleatoria continua se usan


histogramas. En el eje de las abscisas se representan los valores de la variable
clasificados según intervalos de clase y en la ordenada, la frecuencia de datos

2
EXPLORACION DE DATOS GEOESTADISTICA

en cada intervalo de clase. En un histograma los intervalos de clase o "clases"


son sucesivos y no hay "huecos" entre clases para mostrar la naturaleza continua
de la variable. Cada barra se levanta sobre un intervalo de clase y la altura de la
barra señala la frecuencia relevada para la clase. Como n hay huecos entre los
intervalos de clase sucesivos, las barras se dibujan pegadas, y no separadas
como en las variables discretas, para indicar que la variable continua puede
asumir cualquiera de los valores comprendidos entre la primera y la última clase.

El polígono de frecuencia es una gráfica construida a partir de segmentos de


línea que unen las marcas de clase (MC) de los intervalos de clase de un
histograma, si se usan FA o FR, o si no se unen los límites superiores de cada
clase en el caso de usarse FAA o FRA. Los polígonos de frecuencias relativas
acumuladas también se conocen como ojiva y se usan para representar
la función de distribución empírica de los datos.

3
EXPLORACION DE DATOS GEOESTADISTICA

CURVA ACUMULATIVA U OJIVA


Es un gráfico acumulativo que representa la frecuencia relativa acumulada hasta
cada valor de la variable. Si el rango es finito el primer valor del rango tiene
frecuencia acumulada (anterior) cero y el último tiene frecuencia acumulada 1
(100%). Así el eje vertical siempre toma valores de cero a uno y representa
frecuencias relativas (o probabilidades si se trata de distribuciones teóricas). Se
utiliza para introducir el concepto y el cálculo de la mediana, los cuartiles, los
deciles y en general los parámetros llamados de posición. Si el rango es infinito,
como suele ocurrir en las distribuciones teóricas (Normal, student, chi-cuadrado,
etc.,) el cero puede no alcanzarse y será el valor asintótico por la izquierda, si
tampoco se alcanza el uno también será el valor asintótico derecho, y en muchos
casos no se alcanza ni uno ni otro, teniendo dos asíntotas. Este gráfico es la
integral del histograma (cuando trabajamos con distribuciones reales) o de la
función densidad (cuando trabajamos con distribuciones teóricas).

CURVA ACUMULATIVA DE FRECUENCIAS ABSOLUTAS


Es un gráfico acumulativo que representa la frecuencia absoluta acumulada
hasta cada valor de la variable. Realmente no es un gráfico relacionado con el
histograma, pero es muy parecido a la curva acumulativa y a la función de
distribución. Se usa mucho en enseñanza no universitaria por su sencillez, ya
que permite trabajar con números enteros (frecuencias absolutas) y, como la
anterior, permite introducir y calcular mediana, cuartiles, etc. Esta curva no irá
entre cero y uno sino entre cero y el total de individuos de la muestra.

DIAGRAMA DE DISPERSION
Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un
tipo de diagrama matemático que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos. Los datos se
muestran como un conjunto de puntos, cada uno con el valor de una variable
que determina la posición en el eje horizontal (x) y el valor de la otra variable
determinado por la posición en el eje vertical (y).1
Se emplea cuando una variable está bajo el control del experimentador. Si existe
un parámetro que se incrementa o disminuye de forma sistemática por el
experimentador, se le denomina parámetro de control o variable independiente y
habitualmente se representa a lo largo del eje horizontal (eje de las abscisas).
La variable medida o dependiente usualmente se representa a lo largo del eje
vertical (eje de las ordenadas). Si no existe una variable dependiente, cualquier
variable se puede representar en cada eje y el diagrama de dispersión mostrará
el grado de correlación (no causalidad) entre las dos variables.

4
EXPLORACION DE DATOS GEOESTADISTICA

Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las


variables con un intervalo de confianza determinado. La correlación puede ser
positiva (aumento), negativa (descenso), o nula (las variables no están
correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea
de tendencia") con el fin de estudiar la correlación entre las variables. Una
ecuación para la correlación entre las variables puede ser determinada por
procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste
es conocido como regresión lineal y garantiza una solución correcta en un
tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo,
es su capacidad para mostrar las relaciones no lineales entre las variables.
Además, si los datos son representados por un modelo de mezcla de relaciones
simples, estas relaciones son visualmente evidentes como patrones
superpuestos.

PARAMETROS ESTADISTICOS BASICOS

Algunos resúmenes de conjuntos de datos usan números, llamados estadísticas.


La estadística más familiar es la media, a menudo llamada el promedio. Ésta es
una manera de describir el centro de un conjunto de datos. Sin embargo, otras
estadísticas, tales como la mediana o el modo, son a veces más útiles que la
media para describir los datos. Frecuentemente, se quiere saber más acerca de
un conjunto de datos que lo que cualquiera de las estadísticas de centro, o
medidas centrales (measure of center), le pueden decir. El rango (range) y los

5
EXPLORACION DE DATOS GEOESTADISTICA

cuartiles (quartiles) son estadísticas que ayudan a describir cuán disperso es un


conjunto de datos.

Un parámetro estadístico es un número que se obtiene a partir de los datos de


una distribución estadística.

Los parámetros estadísticos sirven para sintetizar la información dada por una
tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:

De centralización.
De posición
De dispersión.

MEDIDAS DE CENTRALIZACION
Las medidas de centralización son:

MEDIA

Otro valor que es usado como medida de posición central para describir al
conjunto de datos es el promedio o media aritmética. La media es un valor que
se ubica en el centro o cercana al centro de una distribución. Se obtiene por el
cociente entre la suma de todos los datos y la cantidad total de datos.

MEDIANA
Hay valores que se ubican en el centro de la distribución, o cercanos a éste, y
otros que se encuentran en los extremos. Aquel valor que ocupa exactamente el
centro de la distribución, de modo que la mitad de los datos son valores menores
o iguales que éste y la otra mitad son valores que lo superan, se
denomina mediana.

6
EXPLORACION DE DATOS GEOESTADISTICA

La mediana es una medida de posición “robusta” (soporta varios valores


extremos sin modificar su valor). De hecho, ésta no será afectada hasta que el
50% de los datos se contaminen con valores aberrantes. La mediana es
resistente a valores extremos pero la media no.
.

MODA
Todos los valores de una variable no están igualmente distribuidos dentro del
rango de variación; esto es, los valores se presentan con diferentes frecuencias.
Al valor que aparece con mayor frecuencia se lo denomina modo o moda. Una
distribución puede tener más de un valor modal (multimodal), también puede ser
que no exista ninguna moda. El modo es la medida de tendencia central más
usada en variables con escala nominal.

MEDIDAS DE POSICION
Las medidas de posición dividen un conjunto de datos en grupos con el mismo
número de individuos.
Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
Las medidas de posición son:

7
EXPLORACION DE DATOS GEOESTADISTICA

CUARTIL

En la distribución de los valores de una variable, los cuartiles son medidas de


posición, pero no necesariamente posición central. Un cuartil es un valor de la
variable cuya ubicación en la distribución, deja por debajo una proporción del
total de los datos. El nombre del cuartil hace referencia a dicha proporción. De
otro modo, en la distribución de una variable hay una proporción de valores, en
relación al total de datos, menores o iguales a un valor determinado. Por ejemplo,
en el caso del peso de las cabezas de ajo vimos que una proporción de 0,50 son
valores de peso menores o iguales que 37,6 g; entonces, el valor 37,6 es el
cuartil 0,50. Este ejemplo, ilustra que para la proporción 0,50 la palabra cuartil
es sinónimo de mediana.
Los cuartiles pueden obtenerse, o aproximarse, utilizando el polígono de
frecuencias construido a partir de la frecuencia relativa acumulada, FRA.
Debemos proceder en forma similar a la antes indicada para obtener la mediana:
ubicar en el eje de las FRA el valor de la proporción a la que hace referencia el
nombre del cuartil, cortar al polígono y luego bajar al eje de la abscisa, donde
están los valores de la variable y leer sobre ese eje el valor del cuartil.

 Primer cuartil (Q1) como la mediana de la primera mitad de valores;


 Segundo cuartil (Q2) como la propia mediana de la serie;
 Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
Pero esto conduce a distintos métodos de cálculo de los cuartiles primero (así
como tercero) según la propia mediana se incluya o excluya en la serie de la
primera (respecto de la segunda) mitad de valores.

PERCENTIL
El percentil es una medida de posición usada en estadística que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual
se encuentra un porcentaje dado de observaciones en un grupo de
observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran
el 20 por ciento de las observaciones. Se representan con la letra P. Para el
percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son
valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en
18851
P25 = Q1.

8
EXPLORACION DE DATOS GEOESTADISTICA

P50 = Q2 = mediana.
P75 = Q3.

MEDIDAS DE DISPERSION

Las medidas de dispersión nos informan sobre cuanto se alejan del centro los
valores de la distribución.
Las medidas de dispersión son:

LA VARIANZA

En teoría de probabilidad, la varianza o variancia de una variable aleatoria es


una medida de dispersión definida como la esperanza del cuadrado de la
desviación de dicha variable respecto a su media. O en pocas palabras, la media
de los residuos al cuadrado.
Está medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si
la variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una
medida de dispersión alternativa expresada en las mismas unidades de los datos
de la variable objeto de estudio. La varianza tiene como valor mínimo 0.

DESVIACION ESTANDAR

La desviación típica o desviación estándar (denotada con el símbolo σ o s,


dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades

9
EXPLORACION DE DATOS GEOESTADISTICA

racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la


variable.

COEFICIENTE DE VARIACION

En estadística, cuando se desea hacer referencia a la relación entre el tamaño


de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media
aritmética, mostrando una mejor interpretación porcentual del grado de
variabilidad que la desviación típica o estándar. Por otro lado presenta problemas
ya que a diferencia de la desviación típica este coeficiente es variable ante
cambios de origen. Por ello es importante que todos los valores sean positivos y
su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de
variación mayor heterogeneidad de los valores de la variable; y a menor C.V.,
mayor homogeneidad en los valores de la variable. Suele representarse por
medio de las siglas C.V.
Se calcula:

COEFICIENTE DE ASIMETRIA
Las medidas de asimetría son indicadores que permiten establecer el grado de
simetría (o asimetría) que presenta una distribución de probabilidad de
una variable aleatoria sin tener que hacer su representación gráfica. Como eje
de simetría consideramos una recta paralela al eje de ordenadas que pasa por

10
EXPLORACION DE DATOS GEOESTADISTICA

la media de la distribución. Si una distribución es simétrica, existe el mismo


número de valores a la derecha que a la izquierda de la media, por tanto, el
mismo número de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la izquierda) si la "cola" a la izquierda
de la media es más larga que la de la derecha, es decir, si hay valores más
separados de la media a la derecha. Diremos que hay asimetría negativa (o a la
derecha) si la "cola" a la derecha de la media es más larga que la de la izquierda,
es decir, si hay valores más separados de la media a la izquierda.

CURTOSIS
También conocida como apuntamiento o sesgo, la curtosis es -en teoría de la
probabilidad y estadística- una medida que sirve para analizar el grado de
concentración que presentan los valores de una variable analizada alrededor de
la zona central de la distribución de frecuencias, sin necesidad de generar el
gráfico.
La medida de curtosis trata de estudiar la proporción de la varianza que se
explica por la combinación de datos extremos respecto a la media en
contraposición con datos poco alejados de la misma.
Una mayor curtosis implica una mayor concentración de datos muy cerca de la
media de la distribución coexistiendo al mismo tiempo con una relativamente
elevada frecuencia de datos muy alejados de la misma. Esto explica una forma
de la distribución de frecuencias con colas muy elevadas y con un centro muy
apuntado.
Un coeficiente de apuntamiento o de curtosis es el basado en el cuarto momento
con respecto a la media y se define como:

11
EXPLORACION DE DATOS GEOESTADISTICA

 Si la curtosis<0, el histograma de la muestra está más aplastado que el


de la distribución normal.
 Si la curtosis=0, el histograma de la muestra está igual de aplastado que
el de la distribución normal.
 Si la curtosis>0, el histograma de la muestra está menos aplastado que el
de la distribución normal.

12
EXPLORACION DE DATOS GEOESTADISTICA

PRACTOCA Nº 01 DE GEOESTADISTICA

1. DATA:
Y
COORDENADAS Fe
N-M
X Y (%)
1 265418.12 4732201.04 0.1
2 265415.34 4732180.6 0.05
3 265407.06 4732194.4 0.2
4 265418.08 4732249.79 0.01
5 265405.61 4732185.19 0.01
6 265418.94 4732183.05 0.01
7 265410.5 4732181.3 0.01
8 265418.76 4732205.39 0.01
9 265411.34 4732253.36 0.01

10 265418.63 4732190.63 0.02


11 265407.15 4732217.67 0.01

12 265413.68 4732217.02 0.01


13 265419.08 4732248.34 0.01
14 265399.64 4732184.68 0.01
15 265420.41 4732193.18 0.01
16 265406.44 4732194.91 0.1
17 265422.63 4732255.62 0.03
18 265411.51 4732229.23 0.05
19 265411.74 4732242.24 0.09
20 265422.15 4732252.89 0.04
21 265408.99 4732259.17 0.04
22 265400.28 4732209.75 0.05
23 265410.39 4732189.74 0.18
24 265402.45 4732192.85 0.03
25 265419.26 4732173.24 0.03

26 265405.44 4732213.25 0.08


27 265409.83 4732257.35 0.1
28 265417.33 4732249.72 0.09
29 265400.32 4732250.12 0.12
30 265404.11 4732222.81 0.1
31 265413.74 4732199.63 0.09
32 265404.73 4732177.89 0.07
33 265421.16 4732183.08 0.06
34 265400.32 4732188.08 0.08
35 265416.22 4732231.52 0.09
36 265418.25 4732217.32 0.1
37 265416.93 4732177.6 0.12
38 265400.76 4732206.36 0.03
39 265411.82 4732208.64 0.04
40 265402.61 4732224.13 0.03
41 265417.24 4732186.98 0.03
42 265420.34 4732194.99 0.04
43 265411.69 4732245.21 0.02
44 265405.48 4732238.74 0.02
45 265421.75 4732231.64 0.02
46 265422.07 4732205.12 0.02
47 265417.74 4732203.94 0.02
48 265412.72 4732191.4 0.02
49 265401.28 4732209.77 0.02
50 265406.35 4732226.83 0.02
51 265402.84 4732181.23 0.02

13
EXPLORACION DE DATOS GEOESTADISTICA

52 265404.79 4732249.15 0.02


53 265400.54 4732172.37 0.03
54 265410.59 4732193.29 0.06
55 265416.58 4732218.3 0.01
56 265419.16 4732211.82 0.01
57 265407.78 4732178.14 0.01
58 265419.15 4732183.88 0.01
59 265410.04 4732211.3 0.02
60 265403.46 4732256.98 0.01
61 265421.62 4732258.91 0.01
62 265422.8 4732207.28 0.01
63 265401.28 4732197.45 0.01
64 265409.4 4732203.28 0.01
65 265404.37 4732230.28 0.05
66 265412.31 4732183.41 0.06
67 265407.75 4732220.97 0.03
68 265410.07 4732211.21 0.03
69 265408.7 4732232.06 0.4
70 265402.01 4732213.02 0.47
71 265408.5 4732221.14 0.16
72 265410.14 4732179.06 0.46
73 265423.31 4732229.31 0.29
74 265411.5 4732250.08 0.31
75 265408.14 4732207.8 0.46
76 265418.63 4732222.55 0.02
77 265415.91 4732243.13 0.06
78 265405.46 4732238.63 0.03
79 265410.99 4732193.64 0.06
80 265403.64 4732203.54 0.09
81 265406.06 4732249.81 0.07
82 265406.9 4732183.26 0.08
83 265401.34 4732237.05 0.1
84 265420.54 4732253.81 0.08
85 265400.58 4732190.47 0.11
86 265401.1 4732241.73 0.09
87 265401.32 4732241.7 0.11
88 265411.35 4732171.12 0.13
89 265406.56 4732179.79 0.1
90 265412.98 4732220.46 0.03
91 265415.23 4732220.55 0.71
92 265416.54 4732252.6 0.01
93 265402.64 4732206.05 0.09
94 265423.01 4732242.14 0.14
95 265403.8 4732228.11 0.1
96 265410.29 4732204.25 0.13
97 265411.86 4732207.19 0.1
98 265408.71 4732196.99 0.1
99 265407.81 4732226.35 0.23
100 265404.74 4732195.54 0.38

14
EXPLORACION DE DATOS GEOESTADISTICA

2. ANALISIS CUALITATIVO:

VARIABLE VALOR
FORMULAS: VALOR MINIMO 0.02
𝑅 VALOR MAXIMO 0.72
𝐴= Nº de datos 70
𝐾
rango 0.7
𝐾 = 1 + 3.3𝐿𝑜𝑔(𝑛) K 8
AMPLITUD 0.0875
𝑅 = 𝑉𝑎𝑙𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑚𝑖𝑛

TABLA DE FRECUENCIAS
# Intervalos xi fi hi Fi Hi hi*100 Hi*100
Intervalos
1 0.010 0.098 0.054 71.000 0.710 71.000 0.710 71% 71%
2 0.098 0.185 0.141 19.000 0.190 90.000 0.900 19% 90%
3 0.185 0.273 0.229 2.000 0.020 92.000 0.920 2% 92%
4 0.273 0.360 0.316 2.000 0.020 94.000 0.940 2% 94%
5 0.360 0.448 0.404 2.000 0.020 96.000 0.960 2% 96%
6 0.448 0.535 0.491 3.000 0.030 99.000 0.990 3% 99%
7 0.535 0.623 0.579 0.000 0.000 99.000 0.990 0% 99%
8 0.623 0.710 0.666 1.000 0.010 100.000 1.000 1% 100%
100.000 1.000 100%

GRAFICOS:

Histograma
80.000
70.000
60.000
50.000
40.000
fi

30.000
20.000
10.000
0.000
-10.000 0.054 0.141 0.229 0.316 0.404 0.491 0.579 0.666
xi

15
EXPLORACION DE DATOS GEOESTADISTICA

Grafica Acumulada
120%
100%
80%
Hi*100

60%
40%
20%
0%
0.054 0.141 0.229 0.316 0.404 0.491 0.579 0.666
xi

Ubicacion de Puntos
4732270
4732260
4732250
4732240
Coordenada Y

4732230
4732220
4732210
4732200
4732190
4732180
4732170
4732160
265395 265400 265405 265410 265415 265420 265425
Coordenada X

CAMPANA DE GAUSS
X fx FX
-1
-0.8
1.536E-18
2.0749E-12
1.95333E-20
3.216E-14
CAMPANA DE GAUSS
-0.6 1.6026E-07 3.17351E-09
-0.4 0.00070776 1.92984E-05 3
-0.2 0.17871958 0.007673227
0 2.58036305 0.231939803 2.5
0.2 2.1301732 0.831258715
0.4 0.10054823 0.995984645 2
0.6 0.00027137 0.999992953
0.8 4.1876E-08 0.999999999 1.5
1 3.6949E-13 1
1.2 1.8641E-19 1 1
1.4 5.3772E-27 1
1.6 8.8688E-36 1 0.5
1.8 8.3638E-46 1
2 4.5099E-57 1 0
2.2 1.3904E-69 1 -2 -1 0 1 2 3 4
2.4 2.4511E-83 1 -0.5
2.6 2.4706E-98 1
2.8 1.424E-114 1
3 4.692E-132 1

16
EXPLORACION DE DATOS GEOESTADISTICA

GRAFICO ACUMALADO FX
1.2

0.8

0.6

0.4

0.2

0
-2 -1 0 1 2 3 4
-0.2

3. ANALISIS CUANTITATIVO:

3.1 MEDIDAS DE CENTRALIZACION

media 0.087
mediana 0.050
moda 0.010
cuartil Q1 0.020
cuartil Q2 0.050
cuartil Q3 0.100
percentil1 0.020
percentil2 0.050
percentil3 0.100

3.2. MEDIDAS DE DISPERSION

MEDIDA VALOR
Varianza 0.014
Desv. Estándar 0.118
COEF. VARIACIÓN 8.543

3.3. MEDIDAS DE FORMA

COEF. DE ASIMETRIA 2.922


CURTOSIS 9.793

17
EXPLORACION DE DATOS GEOESTADISTICA

DATA N°02
COORDENADAS Cu
N-M
X Y (%)
1 62 118 0.05
2 69 112 0.05
3 68 129 0.05
4 67 144 0.04
5 80 0 0.06
6 78 11 0.05
7 74 29 0.06
8 78 68 0.06
9 75 85 0.06
10 71 99 0.05
11 78 107 0.04
12 74 120 0.41
13 78 128 0.08
14 71 137 0.11
15 71 160 0.13
16 87 20 0.16
17 88 37 0.02
18 83 47 0.03
19 87 63 0.26
20 87 77 0.09
21 82 94 0.09
22 86 109 0.22
23 87 121 0.14
24 82 145 0.34
25 86 160 0.03
26 95 10 0.05
27 98 34 0.05
28 92 47 0.05
29 96 82 0.05
30 93 92 0.11
31 96 117 0.11
32 91 131 0.07
33 96 145 0.09
34 91 150 0.03
35 103 2 0.26
36 104 19 0.19
37 103 53 0.18
38 102 70 0.12
39 109 79 0.13
40 103 88 0.11
41 102 101 0.02
42 106 108 0.05
43 107 117 0.12
44 101 132 0.18
45 114 8 0.18
46 114 23 0.33
47 113 36 0.02
48 119 41 0.02
49 119 59 0.02
50 112 64 0.06
51 120 72 0.09
52 119 88 0.1
53 117 102 0.02

18
EXPLORACION DE DATOS GEOESTADISTICA

54 112 112 0.03


55 112 129 0.39
56 111 149 0.72
57 117 159 0.13
58 125 2 0.16
59 124 12 0.09
60 129 40 0.04
61 128 52 0.06
62 130 62 0.05
63 128 80 0.06
64 126 93 0.13
65 122 108 0.03
66 121 122 0.03
67 122 133 0.02
68 135 11 0.06
69 136 22 0.06
70 137 129 0.11

ANALISIS CUALITATIVO

FORMULAS

𝑅 Variable Valor
 𝐴=𝐾
n 70
 𝐾 = 1 + 3.3𝐿𝑜𝑔(𝑛) mínimo 0.02
máximo 0.72
 𝑅 = 𝑉𝑎𝑙𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑚𝑖𝑛 A 0.088
K 8.000
𝐿𝑖+𝑈𝑖
 𝑥𝑖 = 2 R 0.7

N° Intervalos xi fi hi Fi Hi hi*100 Hi*100


Intervalos
1 0.020 0.108 0.064 44.000 0.629 44.000 0.629 63% 63%
2 0.108 0.195 0.151 18.000 0.257 62.000 0.886 26% 89%
3 0.195 0.283 0.239 3.000 0.043 65.000 0.929 4% 93%
4 0.283 0.370 0.326 2.000 0.029 67.000 0.957 3% 96%
5 0.370 0.458 0.414 2.000 0.029 69.000 0.986 3% 99%
6 0.458 0.545 0.501 0.000 0.000 69.000 0.986 0% 99%
7 0.545 0.633 0.589 0.000 0.000 69.000 0.986 0% 99%
8 0.633 0.720 0.676 1.000 0.014 70.000 1.000 1% 100%
70.000 1.000 100%

19
EXPLORACION DE DATOS GEOESTADISTICA

GRAFICOS

Histograma
50.000 44.000
40.000

30.000
18.000
20.000
FI

10.000 3.000 2.000 2.000


0.000 0.000 1.000
0.000
0.064 0.151 0.239 0.326 0.414 0.501 0.589 0.676
-10.000
XI

Grafica Acumulada

96% 99% 99% 99% 100%


89% 93%
Hi*100

63%

0.064 0.151 0.239 0.326 0.414 0.501 0.589 0.676


xi

Ubicacion de datos
180
160
140
Coodenada Y

120
100
80
60
40
20
0
0 20 40 60 80 100 120 140 160
Coordenada X

20
EXPLORACION DE DATOS GEOESTADISTICA

CAMPANA DE GAUSS
x fx Fx
-1.00 0.0000 0.0000 CAMPANA DE GAUSS
-0.80 0.0000 0.0000
3.0000
-0.60 0.0000 0.0000
-0.40 0.0002 0.0000 2.0000
-0.20 0.0903 0.0034
1.0000
0.00 2.2069 0.1696
0.20 2.5484 0.7856 0.0000
0.40 0.1390 0.9944 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
0.60 0.0004 1.0000 -1.0000

0.80 0.0000 1.0000


1.00 0.0000 1.0000
1.20 0.0000 1.0000 GRAFICO ACUMULADO FX
1.40 0.0000 1.0000 1.2000
1.60 0.0000 1.0000 1.0000
1.80 0.0000 1.0000 0.8000
2.00 0.0000 1.0000 0.6000
2.20 0.0000 1.0000 0.4000
2.40 0.0000 1.0000 0.2000
2.60 0.0000 1.0000
0.0000
2.80 0.0000 1.0000 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
-0.2000
3.00 0.0000 1.0000

ANALISIS CUANTITATIVO:
MEDIDAS DE CENTRALIZACION:
media 0.109
MEDIANA 0.060
MODA 0.050
cuartil Q1 0.050
cuartil Q2 0.060
cuartil Q3 0.130
percentil1 0.050
percentil2 0.060
percentil3 0.130

21
EXPLORACION DE DATOS GEOESTADISTICA

MEDIDAS DE DISPERSION:

MEDIDA VALOR
Varianza 0.013
Desv. Estandar 0.114
COEF. VARIACIÓN 8.860

MEDIDAS DE FORMA:
Coefic. de Asimetr. 2.958
Kurtosis 11.669

22
EXPLORACION DE DATOS GEOESTADISTICA

CONCLUSIONES

 Se logró analizar los datos de las leyes de la data brindada por el


ingeniero facilitando la labor con el programa Excel haciéndolo más
sencillo.

 Las gráficas de histogramas y la de dispersión ayudaron a analizar


el comportamiento de las frecuencias de distribución

 Se recomienda utilizar adecuadamente los parámetros estadísticos


para que no haiga errores al momento de calcular.

23
EXPLORACION DE DATOS GEOESTADISTICA

REFERENCIAS BIBLIOGRAFICAS

 http://www.fca.proed.unc.edu.ar/mod/book/tool/print/index
.php?id=3270

 https://es.wikipedia.org/wiki/An%C3%A1lisis_exploratorio
_de_datos

 http://www.vitutor.com/estadistica/descriptiva/a_7.html

 http://www.ub.edu/aplica_infor/spss/cap2-3.htm

24

Вам также может понравиться