Вы находитесь на странице: 1из 11

TEMA 1.

3
Representación del conjunto de datos en graficas
(histogramas, polígonos de frecuencias, diagramas circulares,
de barras etc.) y tablas (con distribución de frecuencias,
frecuencias absolutas, frecuencias relativas y acumuladas)

María Fernanda Vázquez Bautista


4to semestre, grupo A
Ing. en Geociencias
GOC-1006 Geoestadística
Ing. Ignacio Arias Arias
Tema 1.3 Geoestadística

Contenido
1.3. Representación del conjunto de datos en graficas (histogramas, polígonos
de frecuencias, diagramas circulares, de barras etc.) y tablas (con distribución de
frecuencias, frecuencias absolutas, frecuencias relativas y acumuladas) ........................ 2

1.3.1. Histograma............................................................................................. 2

1.3.2. Polígonos de frecuencia......................................................................... 4

1.3.3. Diagrama circular ................................................................................... 6

1.3.3.1. Cálculo de los sectores ................................................................... 6

1.3.4. Diagramas de barras.............................................................................. 7

1.3.5. Tablas (con distribución de frecuencias, frecuencias absolutas,


frecuencias relativas y acumuladas) ............................................................................. 8

1.3.5.1. Tipos de frecuencias ....................................................................... 8

1.3.5.2. Ejemplos de frecuencias ................................................................. 9

1
Tema 1.3 Geoestadística

1.3. Representación del conjunto de datos en graficas (histogramas,


polígonos de frecuencias, diagramas circulares, de barras etc.) y tablas
(con distribución de frecuencias, frecuencias absolutas, frecuencias
relativas y acumuladas)
Los auxiliares gráficos no se pueden utilizar como un reemplazo del propio procedimiento
de prueba. En realidad, el valor del estadístico de prueba indica el tipo adecuado de
evidencia en apoyo de H0 o H1. Sin embargo, una imagen ofrece una buena ilustración y
a menudo es un mejor comunicador de evidencia para el beneficiario del análisis.
Además, una imagen con frecuencia dejará claro por qué se encontró una diferencia
significativa. La falla de una suposición importante se puede expresar mediante un
resumen gráfico. Para la comparación de medias, las gráficas de caja y bigote
simultáneas proporcionan una imagen clara.
1.3.1. Histograma
Al dividir cada frecuencia de clase entre el número total de observaciones, obtenemos la
proporción del conjunto de observaciones en cada una de las clases. Una tabla que lista
las frecuencias relativas se denomina distribución de frecuencias relativas. En la tabla 1.1
se presenta la distribución de frecuencias relativas para los datos de la tabla 1, que
muestra los puntos medios de cada intervalo de clase. La información que brinda una
distribución de frecuencias relativas en forma tabular es más fácil de entender si se
presenta en forma gráfica.
Tabla 1. Vida de las baterías para automóvil
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 2.9 3.0 4.2 3.5
Ye, K., Walpole, R. E., Myers, R. H., & Myers, S. L.
(2012). Histogramas. En K. Ye, R. E. Walpole, R. H.
Myers, & S. L. Myers, Probabilidad y estadística para
ingeniería y ciencias (Novena ed., págs. 22-24). México:
PEARSON EDUCACIÓN.
Con los puntos medios de cada intervalo y las frecuencias relativas correspondientes
construimos un histograma de frecuencias relativas (figura 1).

2
Tema 1.3 Geoestadística

Muchas distribuciones de frecuencias continuas se pueden representar gráficamente


mediante la curva en forma de campana característica de la (figura 1.2). Herramientas
gráficas como las de las figuras 1 y 1.2 ayudan a comprender la naturaleza de la
población.
Tabla 1.1. Distribución de frecuencias relativas de la vida de las baterías
Punto medio de la Frecuencia,
Intervalo de clase Frecuencia relativa
clase f
1.5-1.9 1.7 2 0.050
2.0-2.4 2.2 1 0.025
2.5-2.9 2.7 4 0.100
3.0-3.4 3.2 15 0.375
3.5-3.9 3.7 10 0.250
4.0-4.4 4.2 5 0.125
4.5-4.9 4.7 3 0.075
Ye, K., Walpole, R. E., Myers, R. H., & Myers, S. L. (2012). Histogramas. En K. Ye, R. E. Walpole, R. H.
Myers, & S. L. Myers, Probabilidad y estadística para ingeniería y ciencias (Novena ed., págs. 22-24).
México: PEARSON EDUCACIÓN.

1.1 Histograma de frecuencias relativas. (Ye, Walpole, Myers, &


Myers, 2012)

Se dice que una distribución es simétrica si se puede doblar a lo largo de un eje vertical
de manera que ambos lados coincidan. Si una distribución carece de simetría respecto
de un eje vertical, se dice que está sesgada. La distribución que se ilustra en la figura
1.3a se dice que está sesgada a la derecha porque tiene una cola derecha larga y una
cola izquierda mucho más corta. En la figura 1.3b observamos que la distribución es

3
Tema 1.3 Geoestadística

simétrica; mientras que en la figura 1.3c está sesgada a la izquierda. Al girar un diagrama
de tallo y hojas en dirección contraria a la de las manecillas del reloj en un ángulo de 90°,
vemos que las columnas de hojas que resultan forman una imagen parecida a un
histograma. Por lo tanto, si nuestro objetivo principal al observar los datos es determinar
la forma general o la forma de la distribución, rara vez será necesario construir un
histograma de frecuencias relativas. (Ye, Walpole, Myers, & Myers, 2012)

1.2 Estimación de la distribución de frecuencias. (Ye,


Walpole, Myers, & Myers, 2012)

1.3 Sesgo de los datos. (Ye, Walpole, Myers, &


Myers, 2012)

1.3.2. Polígonos de frecuencia


Es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de
frecuencia. Estos histogramas emplean columnas verticales para reflejar frecuencias: el
polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas
columnas (figura 2.1).

4
Tema 1.3 Geoestadística

Este se caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque
nunca debe haber espacios entre lo que son unas y otras.
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se
desarrollan mediante la marca de clase que tiene coincidencia con el punto medio de las
distintas columnas del histograma. En el momento de la representación de todas las
frecuencias que forman parte de una tabla de datos agrupados, se genera el histograma
de frecuencias acumuladas que posibilita la diagramación del polígono correspondiente.

2.1 Polígono de frecuencias. (Salvador, 2012)

Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias


distribuciones distintas o la clasificación cruzada de una variable cuantitativa continua con
una cualitativa o cuantitativa discreta en el mismo dibujo.
El punto de más altura de un polígono de frecuencia equivale a la mayor frecuencia,
mientras que el área que se sitúa debajo de la curva incluye todos los datos que existen.
Cabe recordar que la frecuencia es la repetición mayor o menor de un evento, o el número
de veces que un acontecimiento periódico se reitera en una unidad temporal. (Salvador,
2012)
Tabla 2. Concentración de cloro en ppm
Clase Frecuencia Centro clase
0 15.0
15.2-15.4 2 15.3
15.5-15.7 5 15.6
15.8-16.0 11 15.9
16.1-16.3 6 16.2

5
Tema 1.3 Geoestadística

16.4-16-6 3 16.5
16.7-16.9 3 16.8
0 17.1
30
Salvador, K. (20 de Octubre de 2012). Estadística. Obtenido de
Blogspot: http://poligonosyojivas.blogspot.mx/2012/10/poligono-de-
frecuencia.html
1.3.3. Diagrama circular
El diagrama circular (también llamado gráfica circular, gráfica de pastel o diagrama de
sectores) sirve para representar variables cualitativas o discretas (figura 3.1). Se utiliza
para representar la proporción de elementos de cada uno de los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a la frecuencia relativa.
Entiéndase como porción la parte del círculo que representa a cada valor que toma la
variable.
1.3.3.1. Cálculo de los sectores
Un círculo completo son 360º (o 2π radianes). El ángulo de cada porción debe ser
proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa un 50%
del total de elementos, su sector del círculo tendrá un ángulo de 180º (o π radianes).
Sea (X1,X2,…,XN) un conjunto de elementos. La fórmula para calcular el ángulo de cada
sector es la siguiente:
360°
𝛼= ∙ 𝑛𝑖 = 360° ∙ 𝑓𝑖
𝑁
Siendo N el total de elementos, ni el número de sujetos iguales y fi la frecuencia relativa.
El ángulo de cada sector se calcula como 360º dividido por el total de sujetos (N) y
multiplicado por la frecuencia absoluta (ni), o bien el producto de la frecuencia relativa (fi)
por 360º. También podemos calcular el ángulo en radianes:
360°
𝛼= ∙ 𝑛𝑖 = 2𝜋 ∙ 𝑓𝑖
𝑁
Por ejemplo, los continentes suponen el 29,1% de superficie de la Tierra, el resto es agua.
Supongamos que se pretende representar mediante un diagrama circular la proporción
de superficie de cada continente respecto a la superficie de todos los continentes.
Para dibujar el diagrama, calcula el ángulo de cada uno de los sectores (que serán
Europa, África, América, Asia, Oceanía, la Antártida). Se obtiene la tabla 3. (Universo
Fórmulas, 2015)

6
Tema 1.3 Geoestadística

Tabla 3. Superficie de cada continente


Continente Superficie Proporción Ángulo Ángulo
(km2) (%) (grados °) (radianes)
Europa 10,366,825 7% 25 0.43
África 30,883,779 20% 73 1.27
América 42,028,106 28% 101 1.76
Asia 44,555,317 30% 107 1.87
Oceanía 8,543,220 6% 20 0.36
Antártida 14,107,637 9% 34 0.59
∑ 149,884,884 100% 360° 2π
Calendario Atlante de Agostini 2008 (INE, 2013)

Una vez calculados los ángulos, puede representarlos gráficamente. El diagrama circular
será el siguiente:

3.1 Diagrama circular.

1.3.4. Diagramas de barras


Un gráfico de barras es una forma de resumir un conjunto de datos por categorías.
Muestra los datos usando varias barras de la misma anchura, cada una de las cuales
representa una categoría concreta. La altura de cada barra es proporcional a una
agregación específica (por ejemplo, la suma de los valores de la categoría que
representa). Las categorías podrían ser desde grupos de edad a ubicaciones geográficas.

7
Tema 1.3 Geoestadística

Si se aplica al crear el análisis, el gráfico de barras puede mostrar información adicional


en líneas de referencia o varios tipos distintos de curvas. Estas líneas o curvas podrían,
por ejemplo, mostrar si los puntos de los datos se adaptan bien a un ajuste de curva
polinómica determinado, o resumir un conjunto de puntos de datos de muestra
ajustándolos a un modelo que describirá los datos y mostrará una curva o una línea recta
sobre la visualización. La curva normalmente cambia su aspecto en función de los valores
que se hayan filtrado del análisis.
Por ejemplo, una tabla de datos contiene las cifras de ventas de varias frutas y verduras
distintas. El gráfico de barras puede mostrar la suma total de ventas de varios años (figura
4.1a). Las barras están coloreadas según la columna Categoría, que contiene los dos
valores: Frutas y Verduras (4.1b). En la figura 4.1c, se ha agregado la columna Categoría
al eje X, de manera que las barras se han dividido en dos barras distintas, una para cada
categoría. Las barras también pueden mostrarse de forma horizontal. (TIBCO, 2018)

(a) (b) (c)

4.1 Diagrama de barras de las ventas de una tienda. (TIBCO, 2018)

1.3.5. Tablas (con distribución de frecuencias, frecuencias absolutas,


frecuencias relativas y acumuladas)
En estadística, la frecuencia (o frecuencia absoluta) de un evento i, es el número de veces
en que dicho evento se repite durante un experimento o muestra estadística.
Comúnmente, la distribución de la frecuencia suele visualizarse con el uso de
histogramas.
1.3.5.1. Tipos de frecuencias
 Frecuencia absoluta de un valor de la variable estadística X, es el número de
veces que aparece ese valor en el estudio. Se suele denotar por Fi a la frecuencia
absoluta del valor X = xi de la variable X. Dada una muestra de N elementos, la
suma de todas las frecuencias absolutas debe dar el total de la muestra estudiada
N.

8
Tema 1.3 Geoestadística

 Frecuencia relativa: (fi), es el cociente entre la frecuencia absoluta y el tamaño


de la muestra (N). Es decir, siendo el fi para todo el conjunto i. Se presenta en una
tabla o nube de puntos en una distribución de frecuencias. Si multiplicamos la
frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (p i)
𝑛𝑖 𝑛𝑖
𝑓𝑖 = =
𝑁 ∑𝑖 𝑛𝑖
 Frecuencia absoluta acumulada: (Ni), se refiere al total de las frecuencias
absolutas para todos los eventos iguales o anteriores que un cierto valor, en una
lista ordenada de eventos.
 Frecuencia relativa acumulada: (Fi), es el cociente entre la frecuencia absoluta
acumulada y el total de la muestra.
𝑁𝑖
𝐹𝑖 =
𝑁
1.3.5.2. Ejemplos de frecuencias
Supongamos que las calificaciones de un estudiante de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.16, porque corresponde a la división 3/18 ( 3 de las
veces que aparece de las 18 notas que aparecen en total).
La frecuencia absoluta acumulada para el valor 11 es 7, porque hay 7 valores menores o
iguales a 11.
La frecuencia relativa acumulada para el valor 11 es 0.38, porque corresponde a la
división 7/18 (frecuencia absoluta acumulada dividida entre el número total de muestras).

9
Tema 1.3 Geoestadística

Bibliografía
Salvador, K. (20 de Octubre de 2012). Estadística. Obtenido de Blogspot:
http://poligonosyojivas.blogspot.mx/2012/10/poligono-de-frecuencia.html
TIBCO. (5 de Febrero de 2018). Copyright © TIBCO Software Inc. All Rights Reserved.
Obtenido de TIBCO Spotfire Web Player:
https://docs.tibco.com/pub/spotfire_web_player/6.0.0-november-2013/es-
ES/WebHelp/GUID-6023CECC-E502-4AE1-B5C5-FFE5DAF6FAE2.html
Universo Fórmulas. (10 de Enero de 2015). Universo Formulas © 2017. Obtenido de
Universo Formulas ©:
http://www.universoformulas.com/estadistica/descriptiva/diagrama-circular/
Ye, K., Walpole, R. E., Myers, R. H., & Myers, S. L. (2012). Histogramas. En K. Ye, R. E.
Walpole, R. H. Myers, & S. L. Myers, Probabilidad y estadística para ingeniería y
ciencias (Novena ed., págs. 22-24). México: PEARSON EDUCACIÓN.

10

Вам также может понравиться