Вы находитесь на странице: 1из 17

MAESTRÍA EN CIENCIAS DE LA COMPUTACIÓN

EXAMEN

ALUMNO:

ROCHA ANGULO RAFAEL AUGUSTO

INVESTIGADOR:

DR. HECTOR PUGA SOBERANES

FECHA:

17 DE OCTUBRE DEL 2018


Con el siguiente grupo de datos, realice los cálculos estadísticos necesarios para su
análisis, tanto como datos agrupados como para datos no agrupados.

144 162 166 170 177


144 162 166 171 178
146 162 166 171 178
149 163 167 171 179
149 163 167 171 179
151 163 167 171 179
153 163 167 171 179
154 163 167 171 179
154 163 167 171 180
154 163 167 171 180
155 163 167 171 180
155 163 167 171 180
156 164 167 171 181
156 164 168 172 181
157 164 168 172 181
157 164 168 172 181
157 164 168 172 181
157 164 168 172 182
157 164 168 173 182
158 164 168 173 182
158 165 168 173 184
158 165 168 173 185
158 165 168 173 185
158 165 169 173 185
158 165 169 173 186
158 165 169 174 187
158 165 169 174 187
159 165 169 174 187
159 166 169 174 188
160 166 169 175 188
160 166 169 175 191
160 166 169 175 192
161 166 170 175 192
161 166 170 176 193
161 166 170 176 194
161 166 170 176 194
162 166 170 177 195
162 166 170 177 195
162 166 170 177 198
Como datos no agrupados
Primero que nada, se toman los elementos de la tabla y se ordenan para poder trabajar
con ellos. Pero como se puede ver, los datos en este caso ya vienen ordenados, por lo
que se pueden usar para sacar los estadísticos siguientes.
MODA
Lo primero que se calcula es la moda; la moda es el valor que es más veces se repite
dentro de la población de datos. Entonces viendo nuestro conjunto de datos, contamos los
valores para verificar cuales son los que más se repiten, en este caso el valor que más se
repite es el 166, ya que se repite 15 veces dentro del grupo de datos.
MEDIANA
La mediana es el valor que está en el centro del conjunto de datos, ósea que es el dato
que se sitúa justo al medio de los datos.
Para poder calcularla, existen 2 casos posibles:

En este caso, el número de elementos a contar es de 200, el cual es un numero par, por
tanto, el caso numero 2 es el que usaremos para calcular la mediana.
La n en el conjunto de datos, es el número de elementos que hay en la población de datos
con la que se está trabajando, en este caso n = 200, calculamos:
(X200/2 + X200/2+1) / 2
Por tanto, quedaría
(X100 + X101) / 2
Los elementos en las posiciones 100 y 101 son 168 y 168, respectivamente, entonces al
ser iguales sabemos que el valor será 168 si sumamos y dividimos, por tanto, la mediana
de la población de datos es 168.
MEDIA
La media es la medida que se usa para determinar la concentración de datos dentro de
una distribución. Para poder calcularla se suman todos los elementos del conjunto de
datos y se divide por el número de elementos de la población en total.
Para calcular la media de la población de datos que se tiene, se suman todos los datos
que se tienen en la población, dando un resultado de 33837, este resultado solamente
hay que dividirlo por el número de elementos de la población, que es 200, entonces la
media resultante seria de:
33837
=169.19
200
Siendo esta la media de la población.
DECILES, CUARTILES Y PERCENTILES
Son técnicas con las cuales se puede medir la dispersión de un conjunto de datos.
CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro
partes iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75%
por encima, el segundo cuartil, al igual que la mediana, divide la información en dos
partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por
encima.
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes
fórmulas:

Para el conjunto de datos dado, para calcular los cuartiles, quedaría como:
Q1 = 1 * 200 / 4 = 163
Q2 = 2 * 200 / 4 = 166
Q3 = 3 * 200 / 4 = 168
DECILES
Los deciles son los valores que dividen a la distribución en las partes iguales, cada una de
las cuales engloba el 10 % de los datos. En total habrá 9 deciles.
Para calcular los deciles se usa la siguiente formula:
Para el caso de los conjuntos que se presentan, los deciles correspondientes se calculan
de la siguiente manera:
D1= 1*200/10 = 20, el valor de los datos es 157.
D2= 2*200/10 = 40, el valor de los datos es 162.
D3= 3*200/10 = 60, el valor de los datos es 164.
D4= 4*200/10 = 80, el valor de los datos es 166.
D5= 5*200/10 = 100, el valor de los datos es 188.
D6= 6*200/10 = 120, el valor de los datos es 170.
D7= 7*200/10 = 140, el valor de los datos es 173.
D8= 8*200/10 = 160, el valor de los datos es 177.
D9= 9*200/10 = 180, el valor de los datos es 182.

VARIANZA
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media
de una distribución estadística.
Para calcularla se aplica la fórmula:

En donde la sumatoria de i= 1 hasta n de la diferencia de cada elemento de la población y


la media al cuadrado entre el número de elementos de la población de datos.
Sabiendo esto, primero se realiza la diferencia entre los elementos de la población de
datos con la media que se calculó en el paso anterior, que es de 169.19. Los resultados
de la diferencia son los siguientes:

142 -169.19 -27.19


144 -169.19 -25.19
144 -169.19 -25.19
146 -169.19 -23.19
149 -169.19 -20.19
149 -169.19 -20.19
151 -169.19 -18.19
153 -169.19 -16.19
154 -169.19 -15.19
154 -169.19 -15.19
154 -169.19 -15.19
155 -169.19 -14.19
155 -169.19 -14.19
156 -169.19 -13.19
156 -169.19 -13.19
157 -169.19 -12.19
157 -169.19 -12.19
157 -169.19 -12.19
157 -169.19 -12.19
157 -169.19 -12.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
158 -169.19 -11.19
159 -169.19 -10.19
159 -169.19 -10.19
160 -169.19 -9.19
160 -169.19 -9.19
160 -169.19 -9.19
161 -169.19 -8.19
161 -169.19 -8.19
161 -169.19 -8.19
161 -169.19 -8.19
162 -169.19 -7.19
162 -169.19 -7.19
162 -169.19 -7.19
162 -169.19 -7.19
162 -169.19 -7.19
162 -169.19 -7.19
162 -169.19 -7.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
163 -169.19 -6.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
164 -169.19 -5.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
165 -169.19 -4.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
166 -169.19 -3.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
167 -169.19 -2.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
168 -169.19 -1.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
169 -169.19 -0.19
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
170 -169.19 0.81
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
171 -169.19 1.82
172 -169.19 2.82
172 -169.19 2.82
172 -169.19 2.82
172 -169.19 2.82
172 -169.19 2.82
173 -169.19 3.82
173 -169.19 3.82
173 -169.19 3.82
173 -169.19 3.82
173 -169.19 3.82
173 -169.19 3.82
173 -169.19 3.82
174 -169.19 4.82
174 -169.19 4.82
174 -169.19 4.82
174 -169.19 4.82
175 -169.19 5.82
175 -169.19 5.82
175 -169.19 5.82
175 -169.19 5.82
176 -169.19 6.82
176 -169.19 6.82
176 -169.19 6.82
177 -169.19 7.82
177 -169.19 7.82
177 -169.19 7.82
177 -169.19 7.82
177 -169.19 7.82
178 -169.19 8.82
178 -169.19 8.82
179 -169.19 9.82
179 -169.19 9.82
179 -169.19 9.82
179 -169.19 9.82
179 -169.19 9.82
180 -169.19 10.82
180 -169.19 10.82
180 -169.19 10.82
180 -169.19 10.82
181 -169.19 11.82
181 -169.19 11.82
181 -169.19 11.82
181 -169.19 11.82
181 -169.19 11.82
182 -169.19 12.82
182 -169.19 12.82
182 -169.19 12.82
184 -169.19 14.82
185 -169.19 15.82
185 -169.19 15.82
185 -169.19 15.82
186 -169.19 16.82
187 -169.19 17.82
187 -169.19 17.82
187 -169.19 17.82
188 -169.19 18.82
188 -169.19 18.82
191 -169.19 21.82
192 -169.19 22.82
192 -169.19 22.82
193 -169.19 23.82
194 -169.19 24.82
194 -169.19 24.82
195 -169.19 25.82
195 -169.19 25.82
198 -169.19 28.82
Una vez calculada la diferencia se calcula el cuadrado de los resultados de la diferencia y
al sumar este resultado queda como 20688.155.
Ahora para calcular la varianza, solamente hay que dividir el valor de la sumatoria de los
cuadrados de la diferencia de cada elemento de la población con respecto a la media
entre el número total de elementos de la población, por tanto, la varianza seria:
20688.155
=103.44
200
DESVIACION ESTANDAR
La desviación estándar es la raíz cuadrada de la varianza. Por lo tanto, la desviación
estándar de la población de datos está dada por:

√2 103.44
dando como resultado 10.17 de desviación.

Datos agrupados
Para poder trabajar con datos agrupados es necesario elaborar una tabla de frecuencias,
las cuales estas compuesta por información recabada, la cual debe de clasificarse y
ordenarse en columnas y filas de acuerdo a categorías. Dentro de estas tablas se
incluyen los conceptos:

- Frecuencia absoluta (FA): es el conteo de las observaciones en cada evento.


- Frecuencia absoluta acumulada (FAA): es la suma de las frecuencias absolutas en
forma escalonada. El ultimo resultado deberá ser igual número de datos tomados.
- Frecuencia relativa (FR): Se expresa en porcentajes o decimales, y es el cociente
entre la frecuencia absoluta de cada evento entre el tamaño total de la muestra. La
suma total es 100 o 1.
- Frecuencia relativa acumulada (FRA): es la suma escalonada de la frecuencia
relativa. Se expresa en porcentajes.
Ahora, se tiene que construir la tabla de frecuencias de la población de datos con la
que estamos trabajando, para ello se tiene que calcular primero el rango, que es la
diferencia entre el valor máximo de la población de datos y el valor mínimo, para la
población existente tenemos como valor máximo 198 y como valor mínimo 142,
entonces
198 – 142 = 56
Una vez calculado el rango, se calcula el número de intervalos que habrá dentro de la
tabla de frecuencias, la cual se calcula mediante el uso de la fórmula:
1+3.33log(n)
Donde n es el número de elementos en la población de datos
Por tanto, el número de intervalos que se va a tener es de:
1+3.33log (200) = 8.66 tiende a 9 intervalos
Lo que sigue es determinar la amplitud de clase que habrá entre los intervalos, esto se
calcula como el cociente del rango y los intervalos: entonces se tiene que la amplitud
de clase de la población está dada por:
56/8.66 = 6.46, tiende a 6 por decimales.
Después de haber calculado los valores anteriores, colocamos los 9 intervalos, los
cuales se elaboran desde el primer dato de valor mínimo, en este caso 142, y se le
suma la amplitud, ósea
142 + 6 = 148
El siguiente intervalo empezaría en 149 y se vuelve a sumar la amplitud y así hasta
llenar la tabla con los 9 intervalos de clase.
También es importante calcular la marca de clase, la cual es el promedio entre el valor
mínimo y le valor máximo entre cada clase.
Y la tabla de frecuencias de la población de datos con la que se está trabajando
quedara de la siguiente manera:
limite inferior limite superior Marca de clase FA FAA FR FRA
142 148 145.23 4 4 2.00% 2.00%
149 155 152.23 9 13 4.50% 6.50%
156 162 159.23 31 44 15.50% 22.00%
163 169 166.23 69 113 34.50% 56.50%
170 176 173.23 44 157 22.00% 78.50%
177 183 180.23 24 181 12.00% 90.50%
184 190 187.23 10 191 5.00% 95.50%
191 197 194.23 8 199 4.00% 99.50%
198 204 201.23 1 200 0.50% 100.00%
Suma 200 100.00%

Ahora con la tabla de frecuencias podemos calcular las medidas de posición central, las
cuales son la mediana, la moda y la media.
MEDIA
Para calcular la media, aplicamos la formula

En donde:
N = es el tamaño de la población
Xi: es la i-enésima observación dentro del conjunto
X: es la media.
Fi: es la frecuencia absoluta.
Ahora sustituimos los valores que tenemos en la formula y quedara como
Media = (145.23*4) +(152.23*9) +(159.23*31) +(166.23*69) +(173.23*44) +(180.23*24)
+(187.23*10) +(194.23*8) +(201.23*1) = 33932.47 / 200 = 169.66, este sería el valor de la
media.

MEDIANA
La mediana se calcula mediante la formula
Donde
Li-1 = límite inferior de la clase de mediana
ni = frecuencia de la clase mediana FA
N = total de datos o frecuencias
Ni – frecuencia acumulada anterior a la mediana
Ai = ancho de clase.
Primero que nada, hay que dividir n/2 para detectar en que intervalo se trabajara y se
aplicara la formula. Entonces
200/2 = 100
Una vez calculado el intervalo, se localiza encontrando el primer intervalo de clase donde
la frecuencia acumulada FAA es igual o mayor que n/2.
Una vez encontrado el intervalo, en este caso es en el intervalo 163-169, se identifica el
valor del límite inferior, 163 en este caso, el ancho de intervalo, 6 para este caso y la
frecuencia absoluta del intervalo, 69 para este caso.
Se aplica la fórmula de la mediana para datos agrupados

Quedando la formula con los datos seleccionados como:


200
−69
2
163+ ∗6=165.69
69
Dando un resultado de 165.69 de mediana.
MODA
Es el valor que representa la mayor frecuencia absoluta. La moda se representa por Mo.
Para calcularla, se toma el intervalo de la tabla de frecuencias absolutas con un mayor
número. Luego se aplica la siguiente fórmula para encontrar el valor de la moda:
En donde:
Li Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo posterior al modal.
ti Amplitud de los intervalos.
En este caso, el intervalo con mayor frecuencia absoluta es el que va de 163-169,
entonces sustituyendo en la formula, quedaría como:
Mo = 163 + ((69-31) / (63-31) +(69-44)) * 6 = 167, este sería el valor con más frecuencia,
o la moda.
DECILES
Para datos agrupados los deciles se calculan mediante la fórmula:

Dónde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k.
Para el caso de los datos que se han estado procesando, se aplica la fórmula de la
siguiente manera:
D1 = 142+((1) *(200/10)-0) /4*6 = 172
D2 = 149+((2) *(200/10)-4) /9*6 = 173
D3 = 156+((3) *(200/10)-13) /31*6 = 165
D4 = 163+((4) *(200/10)-44) /69*6 = 166
D5 = 170+((5) *(200/10)-113) /44*6 = 168
D6 = 170+((5) *(200/10)-113) /44*6 = 168
D7 = 184+((7) *(200/10)-181) /10*6 = 159
D8 = 191+((8) *(200/10)-191) /8*6 = 168
D9 = 198+((9) *(200/10)-199) /1*6 = 84

CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro
partes iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75%
por encima, el segundo cuartil, al igual que la mediana, divide la información en dos
partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por
encima.
La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la
siguiente:

Dónde: Lk = Límite real inferior de la clase del cuartil k


n = Número de datos.
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k.
Para hacer el cálculo de los cuartiles en el conjunto de los datos que tenemos, primero
hay que calcular en qué posición se encuentran los cuartiles, para ello hay que calcular el
25% de la población total, entonces tenemos que (0.25) (200) = 50, entonces ahora hay
que verificar en la tabla de frecuencias en donde se encuentra el primer cuartil, en este
caso se encuentra en el intervalo 156 a 162, entonces aplicamos la fórmula de los
cuartiles, quedando:
Q1 = 156+((1) *(200/4)-13) /31*6 = 163
Para los cuartiles Q2 y Q3, se hace el mismo calculo, obteniendo como resultado:
Q2 = 163+((2) *(200/4)-44) /69*6= 168
Q3 = 170+((3) *(200/4)-113) /44*6 = 175
VARIANZA
Para calcular la varianza, se realiza la diferencia entre la marca de clase y la media al
cuadrado, por la frecuencia absoluta entre el número de elementos menos 1, quedando la
fórmula de la siguiente manera:
=(((145.23-169.66)^2)*4)+(((152.23-169.66)^2)*9 )+((((159.23-169.66)^2)*39)+(((166.23-
169.66)^2)*69)+(((173.23-169.66)^2)*69)+(((180.23-169.23)^2)*24)+(((187.23-
169.66)^2)*10)+(((194.23-169.66)^2)*8)+(((201.23-169.66)^2)*1))/199 = 107.84, sería el
valor de varianza.
DESVIACION ESTANDAR
Para obtener la desviación estándar, solamente sacamos la raíz cuadrada del valor de la
varianza, el cual nos da un valor de 10.38.

GRAFICACION DE LOS DATOS


Para obtener una mejor perspectiva del comportamiento de los datos, se realizan las
gráficas para poder visualizar los resultados.
En este caso se agrega una gráfica de barras, que es la más común en estos casos, en la
siguiente grafica se puede ver el comportamiento de la frecuencia relativa.

Frecuencia Relativa
40.00%

35.00%

30.00%

25.00%

20.00%

15.00%

10.00%

5.00%

0.00%
1 2 3 4 5 6 7 8 9

Este resultado también se puede visualizar como una gráfica de pastel.


Frecuencia Relativa

5.00% 4.00% 0.50% 2.00% 4.50%


12.00% 15.50%

22.00%

34.50%

1 2 3 4 5 6 7 8 9

Bibliografía
Arturo, R. V. (2014). Cuartiles, deciles y percentiles. Estaqdo de Hidalgo: Independiente.
Brandonw, M., & Alfredo, A. (2014). Analisis de datos agrupados y no agrupados.
Barranquilla, Colombia: Independiente.
Rodrigo, P. V. (2015). Estadistica grado once, deciles. Institucion Educativa Tecnico
Induistria Popayan Cauca.
Rodrigo, P. V. (2015). Estadistica grado once, percentiles. Popayan Cauca, Colombia:
Institucion Educativa Tecnico Industrial Popayán Cauca.

Вам также может понравиться