Вы находитесь на странице: 1из 22

UNIVERSIDAD NACIONAL DE SAN CRISTÓBAL DE HUAMANGA

FACULTAD DE INGENIERÍA DE MINAS, GEOLOGÍA Y CIVIL


ESCUELA PROFESIONAL DE INGENIERÍA DE MINAS

PROYECTO N° 01

“ANÁLISIS ESTADÍSTICO DE DATOS”

ASIGNATURA: Prospección Minera


DOCENTE: Ing. CCATAMAYO BARRIOS, Henrry
ALUMNOS: AYALA VÁSQUEZ, Eliceo
MÁRQUEZ RISCO, Aaron

AYACUCHO – PERÚ
2019
DEDICATORIA:
A nuestros padres, como agradecimiento a su
esfuerzo y apoyo incondicional, durante
nuestro proceso de formación profesional.
RESUMEN

Las herramientas utilizadas para el proceso de los datos han sido Microsoft Excel y el programa
estadístico SPSS , con el fin de agilizar los resultados.

Cada uno de los datos han sido seleccionados y agrupados según el programa usado, para
poder darnos cuenta la cuantificación de los minerales encontrados en esta exploración
minera, todos los datos recopilados se subieron al Excel, y luego llevado al SPSS para tener una
mayor exactitud, y de esta forma poder conseguir los resultados mas precisos posibles.

En los graficos realizada que a continuación se mostrará el informe desarrollado, ha sido


producto del SPSS para hacer una representación estadística del trabajo, y de esta manera se
pueda entender mejor la forma como han sido procesados cada uno de los datos.
INDICE
INTRODUCCIÓN

Este estudio es realizado con el fin de conocer e interpretar los resultados de los sondeos en la
etapa de una exploración minera, y de esta forma darles su máximo provecho, ya que el costo de
sondeos es muy alto.

Según un estudio realizado, la probabilidad de explotar esta unidad minera es rentable, y lo que
pretendemos será verificar este estudio usando la estadística y obtener resultados e
interpretación certera.

Así que por este importante medio queremos hacer llegar este estudio, que ha sido realizado de
la manera mas precisa posible y con la mejor de todas las intenciones.
1.OBJETIVOS

1.1 OBJETIVO GENERAL

 Realizar un análisis estadístico de datos de un yacimiento cuprífero ubicado en el norte


del Perú correspondiente a muestras de sondajes diamantinos.

1.2 OBJETIVOS ESPECÍFICOS

 Realizar un estudio exploratorio de los datos tanto de estadísticas descriptivas e


histogramas usando el software
 Detectar anomalías o errores en la base de datos, como son datos erróneos, duplicados
y atípicos.
 Determinar intervalos de confianza en los valores promedios de las distintas variables.
2. MARCO TEÓRICO

2.1 Conceptos básicos de la estadística

2.1 La estadística

La estadística se puede definir como un conjunto de procedimientos, herramientas y técnicas


utilizadas para recolectar, presentar y analizar datos, sobre los cuales basar decisiones en una
situación de incertidumbre o frente a información incompleta, cuando no se puede conocer la
realidad en forma exhaustiva. El modelamiento estadístico permite organizar nuestras
elecciones y decisiones, para que éstas sean coherentes con lo que se conoce del fenómeno
estudiado, aunque no permite legitimar las elecciones de manera absoluta (siempre existe la
posibilidad de tomar decisiones erróneas).

2.1.2 población, muestra y muestreo

a) población

Es un conjunto de objetos, individuos, elementos o eventos con determinadas características. A


menudo se obtiene una muestra de dicha población, es decir, un subconjunto representativo.
Luego de realizar un análisis estadístico a la muestra, los resultados se extrapolan al resto de la
población (inferencia estadística). La estadística es comúnmente considerada como una
colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido
recopilados a partir de otros datos numéricos.

b) muestra
Una muestra es un subconjunto de casos o individuos de una población. En diversas aplicaciones
interesa que una muestra sea representativa y para ello debe escogerse una técnica de muestra
adecuada que produzca una muestra aleatoria adecuada se obtiene una muestra sesgada cuyo
interés y utilidad es más limitado dependiendo del grado de sesgos que presente.

c) muestreo

Se conoce como muestreo a la técnica para la selección de una muestra a partir de


una población estadística inferencial.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población,
se puede extraer dos o más muestras de la misma población.
2.2 ANÁLISIS ESTADÍSTICO DE DATOS
El análisis de datos estadístico es un procedimiento para realizar diversas operaciones
estadísticas. Es un tipo de investigación cuantitativa que busca cuantificar los datos y, por
lo general, aplica alguna forma de análisis estadístico. Estos análisis de datos involucran
alguna forma de herramientas estadísticas, como paquetes de software para realizar
análisis de estos, equipos y herramientas.
Estos software incluyen el Sistema de análisis estadístico (SAS), el Paquete estadístico
para las ciencias sociales (SPSS), Stat soft, R, etc.

Los datos en el análisis de datos estadísticos consisten en variables. En ocasiones, los


datos son univariados o multivariantes. Dependiendo del número de variables, el
investigador usa diferentes técnicas estadísticas.
Si los datos en el análisis de datos estadísticos son múltiples en números, entonces se
pueden realizar varios multivariados. Estos son análisis de datos estadísticos factoriales,
análisis de datos estadísticos discriminantes, etc.
2.2.1 Características y tipos de datos estadísticos
a) datos cualitativos
Los datos cualitativos son básicamente los que involucra a las cualidades tales como:
 Colores: blanco, rojo, negro, verde, etc.
 Profesión: ingenieros, contadores, abogados, etc.
 Calidad de productos: bueno, regular, etc.
b) datos cuantitativos
Los datos cuantitativos son básicamente los que involucra a las cantidades tales como:
 Numero de datos de perforaciones diamantinos
 Avance de perforaciones
 Tiempo de construcción de una infraestructura
 Salarios
2.2.2 variabilidad de datos
a) variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser
medidas con números. Son variables cuyos valores son cualidades que presentan la
población.
De dividen en dos:

Nominales

En este caso la variable no es representada por números ni tampoco tiene algún tipo de
orden, así que es menos precisa en lo que matemáticamente se refiere.

Ordinales.

Son aquellos que agrupan a los objetos, individuales, en categorías ordenadas, para
establecer relaciones comparativas. Es decir, son susceptibles de ordenación, pero no de
medición cuantitativas.

b) variable cuantitativa
Se llama así, cuando la variable está asociado a una característica cuantitativa. Es decir,
estas surgen cuando se puede establecer cuanto o en qué cantidad se posee una
determinada característica.

De dividen en dos:

Discretas. Surgen por el procedimiento de conteo, es decir los valores estadísticos


discretos suelen tomas valores enteros.

Continuas. Son aquellos que surgen cuando se mide alguna característica. Es decir, las
variables continúan, puede tomar teóricamente cualquier valor dentro de un intervalo.

2.2.3 estudio exploratorio de datos


La estadística busca estudiar una o varias variables regionalizadas conocidas vía una toma
de muestra. Previo al uso de métodos geoestadísticos propiamente tal, conviene realizar
un estudio exploratorio de los datos disponibles, el cual tiene tres objetivos:
 Analizar (mediante herramientas estadísticas simples) la cantidad, la calidad y la
ubicación de los datos disponibles.
 Definir las zonas de estudio. Una división del campo en varias subzonas puede
ser relevante si uno observa cambios abruptos en la distribución espacial de
valores, o si la geología del fenómeno lo indica.
 Anticipar dificultades o problemas que puedan surgir en la fase de estimación
local (por ejemplo, presencia de valores atípicos que se destacan de aquellos de
los datos vecinos).
2.3 DISTRIBUCIÓN ESTADÍSTICA DE VALORES
2.3.1 Histogramas
El histograma representa gráficamente las frecuencias de ocurrencia en función del valor.
Consiste en dividir el rango de los valores en intervalos (generalmente, con el mismo
ancho) y visualizar la proporción de datos que caben dentro de cada intervalo.

El histograma es una herramienta útil para detectar valores atípicos. Ahora, cabe destacar
que un dato atípico no es forzosamente falso y nunca debe ser eliminado sin razón (por
ejemplo, un error de trascripción, una falla en el protocolo de medición o un valor ausente
codificado como -99). Podría reflejar el comportamiento verdadero de la variable
regionalizada y eliminarlo impediría prever la ocurrencia de tales valores en las zonas no
muestreadas.
La visualización del histograma de los datos también es un primer medio de verificar su
homogeneidad. Eventualmente, una división del campo en varias sub-zonas será
necesaria. Así, por ejemplo, un histograma multimodal puede conducir a la identificación,
entre los datos, de varias “poblaciones” susceptibles de estar geográficamente separadas.
2.4 ESTADÍSTICA DESCRIPTIVA
Se define como el conjunto de métodos que implican la recolección, presentación y
caracterización de un conjunto de datos a fin de describir de forma apropiada las diversas
características de estas. Es decir, un estudio estadístico se considera “descriptivo” cuando
solo se analiza y describe los datos.

2.4.1 Media

La media o promedio es una medida de tendencia central. Resulta al efectuar una serie
determinada de operaciones con un conjunto de números y que, en determinadas
condiciones, puede representar por sí solo a todo el conjunto.

2.4.2 Mediana

En el ámbito de la estadística, la mediana representa el valor de la variable de posición


central en un conjunto de datos ordenados. Se le denota Me.

2.4.3 Moda

La moda es el valor con mayor frecuencia en una de las distribuciones de datos. Esto va
en forma de una columna cuando encontremos dos modas, es decir, dos datos que tengan
la misma frecuencia absoluta máxima.

2.5 INTERVALOS DE CONFIANZA

Una aplicación directa de la teoría de probabilidades es la definición de intervalos de


confianza para los parámetros de una población, dada la información de una muestra de
tamaño n.

2.5.1 Intervalos de confianza para una proporción

Se considera una variable aleatoria de Bernoulli X, igual a 1 si se cumple una cierta


propiedad A, 0 en caso contrario. Se tiene

Dada una muestra de tamaño n, se puede estimar la proporción (probabilidad) p1 con la


frecuencia empírica.
En virtud del teorema del límite central, se tiene:

2.5.2 Intervalo de confianza para una esperanza

Supongamos que se conoce el valor de la varianza σ2 de una población, pero no se tiene


certeza sobre el valor de la esperanza μ. En virtud del teorema del límite central, se tiene:

Utilizando las tablas de la distribución normal estándar, se obtiene un intervalo de


confianza 1 – α

En particular, μ tiene 95% de probabilidad de encontrarse entre Ẋ - 1.96σ/√n y

X +1.96σ/ √n.

2.6 DETECCIÓN EVENTUALES ANOMALÍAS O ERRORES EN LA BASE DE


DATOS

2.6.1 Datos erróneos


Toda medición posee incertidumbre, es decir, un error. Una estimación del error se puede llevar
a cabo al replicar la medición (suponiendo que se mide la misma magnitud bajo las mismas
condiciones) y calcular la desviación estándar o la varianza de los valores medidos.

2.6.2Datos duplicados
Se pueden producir casos duplicados en los datos por muchas razones, incluyendo:
 Errores en la entrada de datos si por accidente se introduce el mismo caso más de una
vez.
 Casos múltiples que comparten un valor de identificador primario común pero tienen
valores diferentes de un identificador secundario, como los miembros de una familia
que viven en el mismo domicilio.
 Casos múltiples que representan el mismo caso pero con valores diferentes para
variables que no sean las que identifican el caso, como en el caso de varias compras
realizadas por la misma persona o empresa de diferentes productos o en diferentes
momentos.

La identificación de los casos duplicados le permite definir prácticamente como quiera lo que se
considera duplicado y le proporciona cierto control sobre la determinación automática de los
casos primarios frente a los duplicados.

2.6.3 Datos atípicos


Un valor atípico es una observación que es numéricamente distante del resto de los datos.
Las estadísticas derivadas de los conjuntos de datos que incluyen valores atípicos serán
frecuentemente engañosas.
Los valores atípicos pueden ser indicativos de datos que pertenecen a una población
diferente del resto de las muestras establecidas.

3. DESARROLLO DEL TRABAJO

3.1 Estudio exploratorio de datos

3.1.1 Tabla estadístico


Los datos mostrados son el resultado de analizar mediante el programa SPSS los 1112 datos en
los cuales se presenta las medidas de dispersión.

3.1.2 Histogramas
Refleja gráficamente las frecuencias de ocurrencia en función del valor. Consiste en dividir el
rango de los valores en intervalos (generalmente con el mismo ancho) y visualizar la proporción
de datos que caben dentro de cada intervalo.
a)

b)
c)
d)

e)
f)

g)
h)

i)
3.2 Anomalías errores en la base de datos
3.2.1 Datos o casos duplicados

Son los datos de las variables que fueron introducidos varias veces sin un control adecuado.

En el recuadro mostrado se muestra el resultado de que no hubo ningún caso repetido.

3.2.2 Datos o casos atípicos

Es la observación extremadamente grande o pequeña, que generan un efecto desproporcionado


en los resultados estadísticos.
Como en el caso del histograma (f) en el que el valor de (-99) le genero una desproporción
extremadamente grande en comparación con los datos que se manejaron que fueron menores a
(0.1).

Listado de motivos de casos con anomalías o datos atípicos


3.3 Intervalos de confianza

Es el par o varios pares de números entre los cuales se estima que estará cierto valor desconocido
con una determinada probabilidad de acierto.
3.3.1 Intervalo de confianza al 95 %
3.3.2 Intervalo de confianza al 90%

OBSERVACIÓN:

La diferencia de valores entre cada intervalo del mismo mineral son muy pequeñas las cuales nos
están estimando un valor probable muy asertivo y confiable.
4. CONCLUSIONES

Como se pudo observar en la investigación realizada, los datos obtenidos al final nos da como
conclusión lo siguiente:
- Al observar los datos, se nota que la probabilidad de que existan minerales económicos
hacen a la unidad minera rentable para su explotación.
- El uso de la estadística, es fundamental en estos estudios pues facilita y resume los
resultados de los sondeos

5. BIBLIOGRAFÍA

Вам также может понравиться