Вы находитесь на странице: 1из 12

Método de Sturges

con Excel

Estadística y Probabilidad I
Act. Adolfo Sánchez López

1 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel
1. DISTRIBUCIÓN DE FRECUENCIAS SIMPLE.

Muy frecuentemente se presenta en Estadística variables cuantitativas susceptibles de


tomar valores numéricos distintos.

A continuación, se presenta el resultado de una encuesta realizada en 40 familias


escogidas aleatoriamente, considerando como característica específica, el número de hijos, y
se observan los siguientes datos.

2 2 4 0 3 0 4 1 2 3
0 4 3 3 1 4 3 2 2 2
4 2 0 2 2 3 2 3 1 2
3 4 3 4 1 2 1 1 3 4

El proceso de condensar o reducir los valores observados se denomina tabulación, y el


resultado de una tabulación es un cuadro, tabla estadística o tabla de frecuencias, que
presenta en forma ordenada y sistemática, un conjunto de datos numéricos. La tabulación
puede efectuarse en forma manual o mediante procesos electrónicos.

En este ejemplo, debido a lo reducido de la información, se procederá al conteo en forma


manual. En ella aparecen, en la primera columna, los valores de la variable estadística (Xi:
que en este caso es el número de hijos); en la segunda, unas rayitas que se han ido
escribiendo, una por el número de hijos, que tiene la puntuación correspondiente a la primera
columna; y en la tercera columna figuran las frecuencias absolutas (fi) o sea el número de
familias que hay de cada clase.

Columna
No. de hijos Frecuencia
de
Xi fi
conteo
0 0, 0, 0, 0 4
1 1, 1, 1, 1, 1, 1 6
2 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2 12
3 3, 3, 3, 3, 3, 3, 3, 3, 3, 3 10
4 4, 4, 4, 4, 4, 4, 4, 4 8
Total 40

El propósito de la reducción de los datos es presentar en forma reducida y ordenada los


valores de la variable observada, lo cual hemos efectuado en esta primera fase, lo que nos
permite aprovechar toda la información y obtener una visión más amplia que con los datos
originales dispersos. Ya teniendo esta ordenación, podemos proceder a elaborar otras
columnas de la tabla, para aumentar el material con fines de análisis, siendo posible elaborar

2 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel
columnas de las frecuencias acumuladas (fa), de frecuencias relativas (fr) y de
frecuencias relativas acumuladas (fra).

Frecuencia
Frecuencia Frecuencia
No. de hijos Frecuencia Relativa
Acumulada Relativa
Xi fi Acumulada
fai fri
frai
0 4 4 4/40 4/40
1 6 10 6/40 10/40
2 12 22 12/40 22/40
3 10 32 10/40 32/40
4 8 40 8/40 40/40
Total 40

La representación gráfica más adecuada de estos datos se hace mediante un diagrama


de barras que representa en coordenadas cartesianas los valores de la variable estadística
como abscisas, y construyendo en cada punto una ordenada, que mida la frecuencia
absoluta correspondiente ha dicho valor.

Los cocientes de las frecuencias absolutas por el número total de observaciones son las
frecuencias relativas. Análogamente se puede construir un diagrama de frecuencias
relativas tomando éstas como ordenadas.

En el caso que acabamos de ver, la variable sólo toma valores discretos y se dice que es
una variable estadística discreta, pero más frecuentemente la variable estadística es
continua; es decir, puede tomar, teóricamente, todos los valores de un cierto intervalo.

2. DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS.

Cuando los datos estadísticos son demasiado numerosos y la variable toma un número
grande de valores distintos, lo cual representa muchas dificultades en su interpretación y
análisis, es recomendable efectuar una reducción mediante la formación de una serie de
grupos y frecuencias. Para esto se divide el intervalo total en que están repartidas las
observaciones en intervalos parciales, generalmente iguales, llamados casillas o intervalos
de clase. Se suelen tomar estas casillas de modo que sus extremos tengan una cifra decimal
más que las observaciones, para que se sepa sin dudar en que casilla se encuentra cada
observación.

Las series de los intervalos de clase y frecuencias, deben mostrar las frecuencias con que
se distribuyen los diversos valores entre los intervalos de clase que se han determinado
previamente.

3 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel
La elaboración de una distribución de frecuencias, considerando los intervalos de
clase, debe atender tres puntos fundamentales:
a). El número de intervalos de clase en que se han de agrupar los datos.
b). Clasificar los datos en los intervalos de clase que les corresponden.
c). Conteo del número de casos en cada intervalo de clase.

En el primer punto, es conveniente tener mucho cuidado al determinar el número de


intervalos de clase en que se van a agrupar los datos; la amplitud. longitud o anchura del
intervalo de clase de los valores que cubre cada intervalo de clase. La distancia entre los
límites inferior y superior de cada intervalo de clase es la anchura de dicho intervalo de clase.
La anchura del intervalo de clase depende de la amplitud que abarquen los valores de la
variable y del número de observaciones.

Generalmente para el agrupamiento de los datos en los intervalos de clase, se siguen los
siguientes pasos:
1) No deben de utilizarse menos de 5 o más de 15 intervalos de clase: el número
apropiado en una situación dada depende de la naturaleza de los datos, de su número
o del intervalo que cubren.
2) Los intervalos de clase deben de formarse de tal modo, que todos los datos se puedan
incluir.
3) Debe asegurarse que cada valor observado pueda ubicarse en un único intervalo de
clase, hay que evitar confusiones entre límites superiores o inferiores, pues entre los
intervalos de clase sucesivos pueden existir valores que provoquen confusión al
clasificarlos.
4) Es aconsejable que siempre que sea posible, los intervalos de clase se tomen de igual
amplitud; también es aconsejable, que las amplitudes sean múltiplos de 5, 10 o 100, o
de otros números con los que sea fácil operar, con el objeto de que hagan fácil la
interpretación y utilización de la tabla resultante.

El número de intervalos de clase que han de adoptarse para una variable determinada,
depende muchas veces del juicio personal y de otras consideraciones relativas a la
construcción de la distribuciones de frecuencias, ante esta situación, se puede acudir como
un auxiliar al Método de Sturges, como guía para determinar el número aproximado de
intervalos de clase.

Método de Sturges:
K = 1+ 3.322 log(n)
K: número aproximado de intervalos de clase.
n: número total de observaciones

Después de que se ha determinado el número de intervalos de clase, debe de obtenerse


el Rango, amplitud o recorrido de la variable, que es la diferencia entre el valor máximo y el

4 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel
valor mínimo observados entre los datos originales. Posteriormente, al dividirse el Rango
entre el número de intervalos de clase, se obtiene el valor del tamaño de los intervalos de
clase (C).
C = Rango = Vmax - Vmin
K K

Ya teniendo el número de intervalos de clase y la anchura del intervalo podemos elaborar


nuestra distribución de frecuencias, la cual se construye tomando primero el valor mínimo de
los datos observados, o el que resultara si se hace una ampliación del recorrido de la
variable, el cual constituirá el límite inferior del primer intervalo de clase, para obtener el
límite superior de dicho intervalo de clase, simplemente sumamos la anchura del intervalo de
clase menos uno al límite inferior; ( C - 1). Para obtener los límites de clase de los intervalos
restantes, procedemos a sumar de forma sucesiva la anchura del intervalo menos 1 a
cada límite inferior. Recuérdese que se está clasificando la información en intervalos de
clase de anchura o tamaño C; esto se explicará más detalle en el ejemplo que
posteriormente resolveremos.

Cuando ya se tienen bien definidos los intervalos de clase con sus respectivos límites, se
procede a determinarse las frecuencias (fi) de cada uno de los intervalos, la cuales se
obtienen mediante el conteo de los datos que le corresponden a cada intervalo de clase.

El siguiente ejemplo de refiere a una variable continua, que consta de observaciones que
toman un número grande de valores distintos. Se considera a continuación las calificaciones
obtenidas en un examen por un grupo de 40 alumnos. Los valores observados en el orden en
que fueron obtenidos son:
51 62 73 83 92 61 58 72

63 64 71 77 69 78 57 65

78 52 54 40 67 85 73 82

78 72 56 68 84 88 53 81

79 99 75 66 55 65 74 48

El número de intervalos de clase que han de adoptarse para una variable determinada,
depende muchas veces del juicio personal y de otras consideraciones relativas a la
construcción de la distribuciones de frecuencias, ante esta situación, se puede acudir como
un auxiliar al Método de Sturges, como guía para determinar el número aproximado de
intervalos de clase.
Método de Sturges:
K = 1+ 3.322 log(n)
K: número aproximado de intervalos de clase.
n: número total de observaciones
5 Prof. Act. Adolfo Sánchez López
Método de Sturges
con Excel
Después de que se ha determinado el número de intervalos de clase, debe de obtenerse
el Rango, amplitud o recorrido de la variable, que es la diferencia entre el valor máximo y el
valor mínimo observados entre los datos originales.

Posteriormente, al dividirse el Rango entre el número de intervalos de clase, se obtiene el


valor del tamaño de los intervalos de clase (C).
C = Rango = Vmax - Vmin
K K

Ya teniendo el número de intervalos de clase y la anchura del intervalo podemos elaborar


nuestra distribución de frecuencias, la cual se construye tomando primero el valor mínimo de
los datos observados, o el que resultara si se hace una ampliación del recorrido de la
variable, el cual constituirá el límite inferior del primer intervalo de clase, para obtener el
límite superior de dicho intervalo de clase, simplemente sumamos la anchura del intervalo de
clase menos uno al límite inferior; (C - 1). Para obtener los límites de clase de los intervalos
restantes, procedemos a sumar de forma sucesiva la anchura del intervalo menos 1 a
cada límite inferior. Recuérdese que se está clasificando la información en intervalos de
clase de anchura o tamaño C; esto se explicará más detalle en el ejemplo que
posteriormente resolveremos.

El recorrido de la variable, se determina mediante la diferencia entre el valor máximo (99)


y el valor mínimo (40) de los datos observados, R = 99 – 40 = 59.

El número de clases de que constará la distribución podemos determinarlo utilizando el


Método de Sturges:
k = 1+ 3.322 log(40)

= 1+ 3.322(1.6021)

= 1 + 5.3220

= 6.3220

∴ K=6

que es el número de intervalos de clase con los que se trabajará.

Cuando ya se ha fijado el número de intervalos de clases, el siguiente paso para la


construcción de la distribución de frecuencias es la determinación del tamaño del intervalo de
clase, el cual se obtiene dividiendo el recorrido o amplitud del intervalo de clase entre el
número de clases:
C = 99 – 40 = 10
6

C = 10
6 Prof. Act. Adolfo Sánchez López
Método de Sturges
con Excel
El límite inferior del primer intervalo de clase, se recomienda que sea el valor mínimo del
conjunto de datos que se tiene, es decir, en este caso 40. A continuación se dan todos los
intervalos de clase (I. C.).

Intervalos
de Clase
I. C.
40 - 49
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99

USO de LA COMPUTADORA Y de EXCEL.


1. Para que puedas seguir las funciones que se te dan a continuación, coloca los valores
(datos) que se te dieron desde la celda A2, hasta la celda H6, es decir:

A2 B2 C2 D2 E2 F2 G2 H2
A3 B3 C3 D3 E3 F3 G3 H3
A4 B4 C4 D4 E4 F4 G4 H4
A5 B5 C5 D5 E5 F5 G5 H5
A6 B6 C6 D6 E6 F6 G6 H6

Ya con los datos, obtendrás la siguiente tabla:

51 62 73 83 92 61 58 72
63 64 71 77 69 78 57 65
78 52 54 40 67 85 73 82
78 72 56 68 84 88 53 81
79 99 75 66 55 65 74 48

Cuando ya se tienen bien definidos los intervalos de clase con sus respectivos límites, se
procede a determinar la frecuencia (fi) de cada uno de los intervalos, los cuales se obtienen
mediante el conteo de los datos que le corresponden a cada intervalo de clase.

2. Ahora coloca desde la celda A13, hasta la celda A17 los Intervalos de Clase (I. C.), en
las celdas B13 hasta la B17 las frecuencias y así sucesivamente los valores.

Obtener el valor de las frecuencias con el auxilio de Excel. Coloca en cada celda de
la respectiva frecuencia, cada una, de las siguientes funciones que se te dan a continuación.
7 Prof. Act. Adolfo Sánchez López
Método de Sturges
con Excel
Para obtener el valor de f1 en la celda B14, escribimos:

ƒX=CONTAR.SI(A2:H6,40)+CONTAR.SI(A2:H6,41)+CONTAR.SI(A2:H6,42)+CONTAR.SI(A2:
H6,43)+CONTAR.SI(A2:H6,44)+CONTAR.SI(A2:H6,45)+CONTAR.SI(A2:H6,46)+CONTAR.S
I(A2:H6,47)+CONTAR.SI(A2:H6,48)+CONTAR.SI(A2:H6,49)

Para obtener el valor de f2 en la celda B15:

ƒX=CONTAR.SI(A2:H6,50)+CONTAR.SI(A2:H6,51)+CONTAR.SI(A2:H6,52)+CONTAR.SI(A2:
H6,53)+CONTAR.SI(A2:H6,54)+CONTAR.SI(A2:H6,55)+CONTAR.SI(A2:H6,56)+CONTAR.S
I(A2:H6,57)+CONTAR.SI(A2:H6,58)+CONTAR.SI(A2:H6,59)

Para obtener el valor de f3 en la celda B16:

ƒX=CONTAR.SI(A2:H6,60)+CONTAR.SI(A2:H6,61)+CONTAR.SI(A2:H6,62)+CONTAR.SI(A2:
H6,63)+CONTAR.SI(A2:H6,64)+CONTAR.SI(A2:H6,65)+CONTAR.SI(A2:H6,66)+CONTAR.S
I(A2:H6,67)+CONTAR.SI(A2:H6,68)+CONTAR.SI(A2:H6,69)

Para obtener el valor de f4 en la celda B17:

ƒX=CONTAR.SI(A2:H6,70)+CONTAR.SI(A2:H6,71)+CONTAR.SI(A2:H6,72)+CONTAR.SI(A2:
H6,73)+CONTAR.SI(A2:H6,74)+CONTAR.SI(A2:H6,75)+CONTAR.SI(A2:H6,76)+CONTAR.S
I(A2:H6,77)+CONTAR.SI(A2:H6,78)+CONTAR.SI(A2:H6,79)

Para obtener el valor de f5 en la celda B18:

ƒX=CONTAR.SI(A2:H6,80)+CONTAR.SI(A2:H6,81)+CONTAR.SI(A2:H6,82)+CONTAR.SI(A2:
H6,83)+CONTAR.SI(A2:H6,84)+CONTAR.SI(A2:H6,85)+CONTAR.SI(A2:H6,86)+CONTAR.S
I(A2:H6,87)+CONTAR.SI(A2:H6,88)+CONTAR.SI(A2:H6,89)

Finalmente para obtener el valor de f6 en la celda B19:

ƒX=CONTAR.SI(A2:H6,90)+CONTAR.SI(A2:H6,91)+CONTAR.SI(A2:H6,92)+CONTAR.SI(A2:
H6,93)+CONTAR.SI(A2:H6,94)+CONTAR.SI(A2:H6,95)+CONTAR.SI(A2:H6,96)+CONTAR.S
I(A2:H6,97)+CONTAR.SI(A2:H6,98)+CONTAR.SI(A2:H6,99)

A continuación se dan las frecuencias de cada uno de los intervalos de clase.

8 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel
I.C. fi
40-49 2
50-59 8
60-69 10
70-79 12
80-89 6
90-99 2
Total n=40

Generalmente la representación gráfica de esta distribución de frecuencias facilita la


comprensión de algunas características de la gran masa de datos de estudio. Utilizar gráficas
hace más fácil el trasmitir conclusiones a personas no habituadas a la interpretación de
distribuciones de frecuencias.

Una distribución de frecuencias puede presentarse gráficamente de dos formas básicas.


Una forma es representarla por medio de un Histograma y otra mediante un polígono de
frecuencias.

Histograma de Frecuencias: Se obtiene construyendo sobre cada intervalo real de clase


de la variable estadística un rectángulo, levantado sobre el eje de las abscisas(X), cuyas
áreas son proporcionales a las frecuencias representadas; la escala de las frecuencias se
marca sobre el eje de las ordenadas (Y). La altura de cada rectángulo del histograma es
igual a la frecuencia de la clase cuando los intervalos son de igual tamaño. En cambio
cuando éstos varían, la frecuencia es representada por el área y no por la altura (La suma de
las áreas de los rectángulos debe de ser la unidad).

HISTOGRAMA
I.R.C fi
39.5-49.5 2
49.5-59.5 8
59.5-69.5 10
69.5-79.5 12
79.5-89.5 6
89.5-99.5 2
Total 40

9 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel

Polígono de Frecuencias: es un diagrama de líneas, utilizando los mismos ejes y


escalas del histograma. Para trazar un polígono, se hace una marca para cada frecuencia en
el eje vertical sobre el punto medio del intervalo del eje de las X (suponiendo que los
intervalos de clase son de igual tamaño). Después se unen estos puntos por medio de líneas
rectas y se extienden hacia ambos extremos. Un convencionalismo gráfico permite cerrar el
polígono, iniciándolo y terminándolo sobre el eje de las abscisas en dos puntos medios
hipotéticos, considerando una propiedad geométrica que dice que el área del polígono es
igual a la suma del área de los rectángulos del histograma.

Polígono de
frecuencias
mi fi
34.5 0
44.5 2
54.5 8
64.5 10
74.5 12
84.5 6
94.5 2
104.5 0
Total 40

10 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel

Polígono de Frecuencias Acumuladas u Ojiva: Es una gráfica que muestra las


frecuencias acumuladas mayores o menores que cualquier límite real superior de clase,
trazado sobre los límites reales superiores de clase.

En algunos casos es preferible considerar una distribución de frecuencias acumuladas de


todos los valores mayores o iguales al límite real inferior de clase de cada intervalo real de
clase, esta distribución se llama a veces distribución acumulada “mayor que “, “más” o
“ascendente”, mientras que la considerada anteriormente es la distribución acumulada
“menor que”, “menos” o “descendente”.

Ojiva Ascendente
mi fai
39.5 0
49,5 2
59,5 10
69,5 20
79,5 32
89,5 38
99,5 40

11 Prof. Act. Adolfo Sánchez López


Método de Sturges
con Excel

39.5 49.5 59.5 69.5 79.5 89.5 99.5

Ojiva Descendente
mi fi
39.5 40
49,5 38
59,5 30
69,5 20
79,5 8
89,5 2
99,5 0

39.5 49.5 59.5 69.5 79.5 89.5 99.5

12 Prof. Act. Adolfo Sánchez López

Похожие интересы