You are on page 1of 28

UNIVERSIDAD NACIONAL DEL ALTIPLANO PUNO

FACULTAD DE INGENIERIA GEOLOGICA Y METALURGICA


ESCUELA PROFESIONAL DE INGENIERIA GEOLOGICA

CURSO DE GEOESTADISTICA I
TEMA 4: VARIABLES Y DISTRIBUCION DE
FRECUENCIAS
Por: Ing. MSc. Roger Gonzales Aliaga

Puno, Marzo del 2012

VARIABLES Y DISTRIBUCION DE FRECUENCIA


1.
2.
3.
4.
5.

Variables.
Elementos bsicos de la geoestadstica
Resumen de informacin muestral
Tablas estadsticas y distribucin de frecuencias
Grficos estadsticos

1. VARIABLES
Las observaciones o mediciones sobre los elementos de una poblacin constituyen la materia
prima con la cual se trabaja en Geoestadstica. La variable estadstica se representan con un
smbolo o letra mayscula tal como X, Y, Z, A, etc. Ahora los valores que puede tomar una
variable se representan mediante letras minsculas x1 , x2 , x3 . Xn.
Si la variable toma un solo valor se denomina constante; se acostumbra clasificar las variables en
dos grandes grupos.
Es necesario distinguir los diversos tipos de variables que puedan encontrar en diversos tipos de
estudios e investigaciones, de acuerdo a esto las se dividen en:
1.1. Segn su naturaleza las variables pueden ser de dos tipos:
a) Variables cualitativas o estadsticas de atributos: expresan una cualidad caracterstica o
atributo tienen carcter cualitativo, no se pueden medir numricamente (por ejemplo: tipo de
alteracin en un afloramiento, estado de alteracin de una roca, nacionalidad, color de la piel,
sexo, etc.).
b) Variables cuantitativas: tienen valor numrico (edad, ley de mineral, contenido de arsnico
en una muestra de agua, contenido de mercurio en la piel de una trucha, contenido de oro en
una veta (ley), el pH, la temperatura del agua de un rio, precio del platino o de la plata, ingresos
anuales por canon minero, etc.).

1. VARIABLES
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
variables discretas
Una variable discreta es aquella que puede asumir valores enteros o mejor dicho que varen de
un en uno. Por ejemplo el numero de personas que habitan en una casa el numero de dientes en
una rueda dentada.
variables continuas
Una variable continua es cuando puede tomar cualquier valor, dependiendo principalmente de
la precisin con que se trabaje. As por ejemplo los resultados de leyes o contenidos de un
agente contaminante en un rio , que puede ser: 100.27 ppm de Hg, la velocidad de un vehculo
puede ser 80,3 km/h, ley de mineral (g/tn), rea, volumen...etc.
1.2. Segn la relacin entre variables:
a) Variables dependientes, son aquellas que se explican por otras variables, son los efectos o
los resultados respecto a los cuales hay que buscar su motivo, causa o razn de ser. Es la
variable que traduce la consecuencia del efecto de una o varias razones o causas de otras
variables.
b) Variables independientes, son las variables explicativas o predictivas, cuyas asociacin,
relacin o influencia en la variable dependiente se pretende describir en la investigacin.

1. VARIABLES
Variables categorizadas
En contraposicin a las variables cuantitativas, aqu hacemos referencia a aquellas
variables cuya escala de medida es un conjunto de categoras. Entre ellas podemos
distinguir al menos:
Categorizadas nominales, como la orientacin de un conjunto de vetas que se
podra considerar como Norte, Sur, Este, Oeste o la combinacin de estas.
Normalmente estas variables se utilizan en Geologa Estructural con un diagrama de
roseta.
Categorizadas ordinales, como el grado de alteracin de una roca que puede ser
"severo", "moderado" o "leve.
Es importante sealar que las variables continuas se pueden discretizar (por ejemplo
tomando intervalos) y as ser tratadas como discretas o que cuando una variable discreta
asume una gran variedad de valores.

2. ELEMENTOS BASICOS DE LA GEOESTADISTICA


Despus de la conceptualizacin geoestadstica y la precisin de sus objetivos, es fcil
advertir que en el trabajo estadstico existes tres elementos bsicos como son: la
poblacin o muestra (unidad de anlisis), las variables o caractersticas y los datos.
a.

Los elementos o unidades de anlisis (poblacin) pueden ser de manera mas


comn personas, instituciones, lotes de muestreo de diferentes tipos de materiales.
Estas unidades tienen una caracterstica comn, en cuanto constituyen el objeto de
estudio de una investigacin. Toda poblacin tiene N elementos y una muestra
n elementos.

a.

Las variables dimensiones o caractersticas que se quieren conocer en relacin a


las unidades de anlisis, como el consumo de minerales de los pases en desarrollo.

a.

Los datos o valores que alcanzan las unidades en las variables estudiadas, las cuales
son las respuestas o resultados que se obtienen luego de un anlisis geoqumico de
una muestra de roca.

3. RESUMEN DE INFORMACION MUESTRAL


Al registrar los resultados de un estudio observacional o experimental, se obtiene
un nmero de observaciones que puede ser muy grande y su simple listado es de
poca relevancia en el sentido interpretativo. Aunque a partir de dichos registros se
puede encontrar la respuesta buscada, estos datos no estn ordenados de manera
tal que adquieran significado para el investigador. Es por esto deseable presentar las
observaciones en forma resumida.
Para los fines de ordenar, resumir y presentar la informacin, se utilizan tablas y
grficos apropiados para cada tipo de variable (variables numricas, continuas o
discretas, o bien, variables no numricas o de naturaleza categrica), por lo que
trataremos las distintas situaciones por separado.
Las tablas estadsticas presentan ordenadamente los datos estadsticos en filas y
columnas, clasificados y agrupados de acuerdo a un criterios especifico. En las
tablas conviene distinguir las tablas de frecuencias o de distribucin y los cuadros
estadsticos o de anlisis.
Los datos presentados en las tablas o cuadros estadsticos constituyen la
informacin estadstica. Esta informacin no solo es un valor numrico si no que
adems merece una interpretacin de tipo cualitativo segn el contexto que lo
origino.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Las partes de una tabla estadstica son:
a.

b.
c.
d.
e.
f.

Titulo, es la descripcin clara y precisa del contenido de la tabla, en el titulo


se indica el lugar o rea geogrfica y la institucin en donde se hizo el
trabajo estadstico. Tambin se indica la naturaleza de los datos, las
variables y el periodo o poca que abarca la informacin muestral.
Encabezamiento, es la primera fila del cuerpo de la tabla en la que se
indica las categoras o variables precedidas por la palabra por.
Columna matriz, es la primera columna de la tabla y en ella se especifica
las categoras o variables precedidas por la palabra segn.
Cuerpo, vienen a ser las celdas formadas por las filas y las columnas y en
donde se encuentra la informacin estadstica.
Fuente, es donde se consigna o indica de donde se obtuvo la informacin
que se muestra en la tabla.
Nota de pie, es la aclaracin que se hace en referencia a los datos de la
tabla si es que fuera necesario.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Piura

: EMPRESA DE EXPLORACIONES MAJAS S.A.


Numero de muestras de roca extradas para anlisis geoqumico
Por aos de exploracin segn prospectos trabajados
Ao de muestreo

Columna
matriz

Encabezamiento

Prospecto

2009

2010

2011

Total

Rio Blanco

120

200

521

841

Rio Azul

135

125

112

372

Rio Rojo

140

129

30

299

Rio Negro

110

122

32

264

Total

505

576

695

1776

Fuente
Nota

: DIRECCION REGIONAL DE ENERGIA Y MINAS


: datos hipotticos

Pie

Titulo

Cuerpo

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Las tablas de frecuencias o de distribucin son aquellas que muestran trabajo
estadstico, resultado de la operacin de tabulacin, que presenta la distribucin de un
conjunto de elementos de acuerdo a las categoras de las variables. En ellas se observa la
frecuencia o repeticin de cada uno de los valores de la variable, que se obtiene
despus de realizar la operacin de tabulacin.
Las tablas de frecuencias se suelen clasificar en dos tipos:
- Tabla de distribucin de frecuencias para datos no agrupados
- Tabla de distribucin de frecuencias para datos agrupados
Las tablas de datos no agrupados son aquellos que presentan un solo individuo en cada
clase o expresada en otra forma cuando la frecuencia es cada un de las clases es uno.
En las tablas de datos agrupados, la frecuencia en cada clase es por lo general mayor
que uno, pudindose dar que en alguna clase la frecuencia sea un cero. A las tablas de
datos agrupados se les clasifica en tablas de variable discreta y variable continua.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Para describir la distribucin de frecuencia correspondiente a una variable continua, es
indispensable agrupar los valores registrados mediante un conjunto de intervalos. Aqu
indicamos los pasos a seguir para la construccin de la tabla de frecuencias.
El intervalo de frecuencia se obtiene calculando primero el rango (R)que esta dado por:
R=Xmax Xmin
luego se calcula el nmero de intervalos de clase por la ley de Sturges (K), con la
formula siguiente. Este valor nunca siempre es un entero positivo.
K=1+3.32 log (n)
culminando esta operacin se calcula el ancho o amplitud de cada clase (C) que esta
dado por la formula:
C=R/K
Luego de esta operacin C se suma al valor mnimo (Xmin) y se completa el nmero de
intervalos obtenidos de acuerdo a K.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


La marca de clase se utiliza para graficar los polgonos de frecuencia y se calcula de la
siguiente manera:

Yi=Yi-1 Yi+1
Ahora se denomina frecuencia absoluta al nmero de veces que el valor de la variable
se repite en el conjunto de datos y se representa por (fi). La frecuencia absoluta
acumulada es la suma de los valores de la columna de fi, por lo tato el ultimo valor debe
ser igual a n; a la frecuencia absoluta acumulada se le representa por (Fi).
Otra columna importante dentro de la tabla de frecuencias, es la frecuencia relativa (hi)
que asociada con un valor dado, puede ser considerada como una estimacin de la
probabilidad de ocurrencia de dicho valor. Una propiedad que cumplen las frecuencias
relativas es que su suma es igual a 1. La sumatoria de la frecuencia relativa debe ser
igual a 1.
En la sexta columna se calculan las frecuencias relativas acumuladas (Hi), sumando las
frecuencias relativas de la misma manera que se sumaron las frecuencias absolutas para
obtener las absolutas acumuladas. Ahora el ultimo valor de Hi debe ser igual a 1 como
dice la propiedad antes mencionada.

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Tabla de distribucin de frecuencias para datos agrupados con variable continua, para
un conjunto de muestras obtenidas en una prospeccin de Au.
Intervalo de
frecuencia

Yi-1 - Yi+1

Marca de clase

Frecuencia
absoluta

Frecuencia absoluta
acumulada

Frecuencia
relativa

Frecuecnia relativa
acumulada

Yi

fi

Fi

hi

Hi

0.07

- 1.49

0.78

50

50

0.71

0.71

1.49

- 2.91

2.20

57

0.10

0.81

2.91

- 4.33

3.62

65

0.11

0.93

4.33

- 5.75

5.04

66

0.01

0.94

5.75

- 7.17

6.46

68

0.03

0.97

7.17

- 8.59

7.88

69

0.01

0.99

8.59

- 10.01

9.30

70

0.01

1.00

TOTAL

70

4. TABLAS ESTADISTICAS Y DISTRIBUCION DE FRECUENCIAS


Tabla de distribucin de frecuencias para datos no agrupados.
Como ejemplo presentamos un cuadro de notas obtenidas por un alumno que estudia
en la Escuela de Ingeniera Geolgica de la UNA-PUNO, sus notas estn en una escala de
0 a 20.
Ntese que en este tipo de cuadro no aparece la
frecuencia f por que en cada clase esta uno.
Asimismo por simplicidad se ha suprimido los
casilleros correspondientes a Xi, quedando
sobreentendido que:
X1=13.52, X2=14.20, X3=13.80;.
NOTA: En trabajos de investigacin normalmente
los datos trabajados estadsticamente y que se
presentan en cuadros se le denomina tabla y,
cuadro cuando solo se menciona cifras sin trabajo
estadstico.

Curso

Nota

Xi
Geofsica

13.52

Geoestadstica

14.20

Mineraloga

13.80

Hidrogeologa

17.12

Petrologa

11.30

5. GRAFICOS ESTADISTICOS
Para la representacin de una distribucin los grficos son las formas usuales de
presentar las distribuciones teniendo la ventaja de que las hacen mas intelegibles.
Los grficos son las representaciones visuales de los datos en donde se evidencian
fundamentalmente 3 caractersticas:
a.
b.
c.

Forma
Acumulacin o tendencia
Dispersin o variabilidad

Los grficos no deben considerarse como sustitutos de un anlisis estadsticos,


sino ms bien como una ayuda visual del comportamiento de los datos. Estos
pueden ser univariados, bivariados y multivariados, segn el nmero de variables
involucradas.

5. GRAFICOS ESTADISTICOS
Las partes de un grafico estadstico son:
a.
b.

Cdigo o nmero de grfico, es elemento numrico que permite identificar al grfico


estadstico. Si se presenta ms de un grfico en un captulo, cada uno debe incluir el
nmero del captulo seguido de un punto y el nmero de grfico correspondiente.
Ttulo, es la inscripcin que se coloca despus del nmero de grfico, con el propsito de
dar a conocer las variables y sus caractersticas contenidas en l. El ttulo expresar el
contenido del grfico en forma ordenada, clara y breve, evitando la descripcin excesiva
o la brevedad extrema en la descripcin del contenido de la informacin. Deber
describir el contenido conceptual del grfico, indicar la fecha o perodo de referencia de
la informacin y especificar (cuando sea necesario) la unidad de medida en que se
cuantifican las cifras o la ubicacin geogrfica a la que corresponde la informacin.
Se recomienda que en el diseo y determinacin de un grfico se tenga en cuenta 4
preguntas bsicas: donde?, que?, como? y cuando?.
PER: PRODUCCIN DE GAS NATURAL SEGN ZONAS GEOGRFICAS, 2001-08
(Miles de barriles)
Dnde? : Per
Qu? : Produccin de gas natural
Cmo? : Segn zonas geogrficas
Cundo? : Del 2001 al 2008

5. GRAFICOS ESTADISTICOS
c. Cuerpo del grfico, es la ilustracin de los valores asociados a los datos presentados
mediante los siguientes elementos:
Figura Conjunto de puntos, lneas, barras, polgonos o figuras utilizados en la
representacin de los datos estadsticos.
Escala o eje de valores Es la lnea recta segmentada que representa la escala de medicin
a la que corresponden los datos estadsticos del grfico. Si se visualizan los rtulos de
datos, es optativo mostrar u ocultar el eje de valores.
Leyenda Es la descripcin de la simbologa utilizada, sea sta mediante colores,
densidades de color, sombreados o tipos de lnea usados para diferenciar conceptos a los
que se refieren los datos estadsticos. Contiene una muestra de la simbologa y el rtulo
del concepto con que se asocia. Corresponde a las caractersticas que en el ttulo,
generalmente, vienen precedidas de la preposicin "por".
d. Pie del grfico, constituye la parte inferior del grfico y comprende las notas, llamadas y
fuente. Se destina para anotar aquellas aclaraciones o sealamientos particulares y
generales sobre la informacin, necesarios para una mejor interpretacin de sta por
parte del usuario. Si los grficos estn acompaados de cuadros, el uso del pie de grfico
es optativo.

5. GRAFICOS ESTADISTICOS
Piura

: EMPRESA DE EXPLORACIONES MAJAS S.A.


Numero de muestras de roca extradas para anlisis geoqumico
Por aos de exploracin segn prospectos trabajados

Titulo

600

Figura

500

Leyenda
400

Eje de valores

Ao 2009

300

Ao 2010

Cuerpo

Ao 2011
200

100

Eje de conceptos

0
Rio Blanco

Fuente
Nota

Rio Azul

Rio Rojo

Rio Negro

: DIRECCION REGIONAL DE ENERGIA Y MINAS


: datos hipotticos

Pie

5. GRAFICOS ESTADISTICOS
Principales clases o tipos de grficos:
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.
l.
m.
n.

Histogramas y polgonos
Polgono de frecuencia
Ojiva
Grficos lineales
Diagrama de frecuencias
Crono diagramas
Lnea de regresin
Grafico tela de araa
Grafico de barras
Grficos circulares
Grafico de pirmide
Estereogramas (3D)
Pictogramas
Cartogramas (mapas)

5. GRAFICOS ESTADISTICOS
Grficos lineales, son aquellas que representan la informacin a travs de
lneas, rectas o curvas. Como ejemplo graficaremos las notas de 10 semestres de
un alumno de geologa.
Notas por semestre

Semestre

Promedio

11

18

II

14

16

III

12

14

IV

13

15

VI

12

VII

13

VIII

11

IX

15

16

12
10
Promedio

8
6
4
2
0
I

II

III

IV

VI

VII

VIII

IX

5. GRAFICOS ESTADISTICOS
Crono diagramas, son diagramas lineales, se utilizan cuando se trabajan con
series de tiempo en el eje X pueden ir los aos meses, das, horas, etc. Como
ejemplo graficaremos la produccin de cobre en sud Amrica de Per y Chile.
450000

Aos

Produccin de cobre

400000
350000

Per

Chile

1980

269000

197000

300000

1981

297000

250000

250000

1982

310000

295000

200000

1983

245000

360000

150000

1984

210000

420000

100000

Peru
Chile

50000
0
1980

1981

1982

1983

1984

5. GRAFICOS ESTADISTICOS
Grfico de barras, se construye sobre el sistema de ejes cartesianos. Para cada
categora se traza una barra vertical en que la altura es la frecuencia absoluta de
la categora; el ancho de la barra es arbitrario pero tiene la misma dimensin.
Graficaremos la desnutricin crnica en el ao 1999.

200000
180000

Sexo

Nios
censados

Desnutridos
Normales
crnicos

160000
140000
120000
100000

Masculino

333183

161494

171689

Femenino

320671

176353

144318

60000

Total

653854

337847

316007

40000

Nios normales

80000

Desnutridos cronicos"

20000
0
Masculino

Femenino

5. GRAFICOS ESTADISTICOS
Grfico circular o torta, esta es otra forma de representar los datos, en especial cuando se
trata de cualidades. Es un grfico dibujado desde dentro de un crculo; para esto es
necesario calcular el porcentaje de cada categora respecto del total y luego repartir
proporcionalmente estos porcentajes en los 360 del crculo.
Para transformar la frecuencia relativa a grados sexagesimales se aplica el siguiente
mtodo.
Como ejemplo pondremos al numero de clientes que trabajan en el sector minero en los
cuatro bancos principales de nuestro pas.

Bancos

Nro. de
clientes

Grados

Banco de Crdito
Banco Continental
Banco Scotiabank
Banco de la Nacion
Total

10000
5000
3500
2000
20500

48.8
24.4
17.1
9.8
100

175.6
87.8
61.5
35.1
360

Banco de Credito
Banco Continental
Banco Scotiabank
Banco de la Nacion

5. GRAFICOS ESTADISTICOS
Histogramas y polgonos de frecuencia, se construyen sobre el sistema de
coordenadas cartesianas. Se utiliza cuando la variable en estudio es continua o esta
agrupada en una tabla de frecuencia con intervalos en cada categora.
En el eje X se identifica la variable en estudio y en el eje Y s grfica la frecuencia
absoluta o la frecuencia relativa. Consiste en una serie de rectngulos en donde su
altura depende del valor de cada frecuencia.
Cada categora de la variable se representa por una barra. El ancho de cada barra
depende de la amplitud del intervalo.
El polgono se grfica uniendo la punta superior de cada barra por segmento de
recta. Para que el polgono quede cerrado se considera un punto en la recta
horizontal, antes y despus de las anotadas.
El polgono se dibuja midiendo los puntos medios de cada barra, que corresponde a
la marca de clase.

5. GRAFICOS ESTADISTICOS
El polgono se dibuja midiendo los puntos medios de cada barra, que corresponde a
la marca de clase.

5. GRAFICOS ESTADISTICOS
Histogramas y ojivas, tambin se grfica la columna de frecuencia absoluta
acumulada. El grfico siempre ser en forma ascendente. La ojiva se dibuja midiendo
segmentos de recta en la parte superior de cada barra, y no se cierra.

5. GRAFICOS ESTADISTICOS
Barras subliminales, es un grfico de barras muy apropiado para comprobar
subdivisiones en la variable. Por ejemplo: % de estudiantes en diferentes carreras,
separadas por sexo. Cada barra es un 100%.

Pictogramas, un pictograma es la representacin de datos estadsticos por medio de


smbolos que por su forma sugieren la naturaleza del dato. Por ejemplo: produccin
de bicicletas (en miles.)

5. GRAFICOS ESTADISTICOS
EJEMPLO en el aso de una variable discreta; en una
unidad minera ubicada al sur del Per, la
asistenta social hizo una encuesta para un
presupuesto familiar, a 21 trabajadores respecto
a n de hijos en cada familia.
Variable x = n de hijos
Los datos son los siguientes:
3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
x1 x2
x21