Академический Документы
Профессиональный Документы
Культура Документы
Página 2 de 154
TABLA DE CONTENIDO
TEMATICA................................................................................................................................4
OBJETIVO GENERAL ..............................................................................................................4
ESPECIFICOS ESPECIFICOS ..................................................................................................5
1) ESTADISTICA .....................................................................................................................6
POBLACION, MUESTRA Y DATOS ..........................................................................................6
VARIABLES ESTADISTICAS Y SU CLASIFCACION ................................................................7
DIVISION DE LA ESTADISTICA DESCRIPTIVA .......................................................................7
2) DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS PARA DATOS NO AGRUPADOS ...11
FRECUENCIA ABSOLUTA f. ...................................................................................................11
FRECUENCIA RELATIVA fr.....................................................................................................13
ESTADÍSTICAS CON MÁS DE DOS VARIABLES. .................................................................16
ESTADÍSTICAS MIXTAS. ........................................................................................................19
OTRAS CLASES DE GRAFICAS .............................................................................................24
APLIQUEMOS LO APRENDIDO 1 ....................................................................................27
3) DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS PARA DATOS AGRUPADOS..........32
OBSERVACIÓN COMPUESTA................................................................................................32
INTERVALOS DE CLASE. .......................................................................................................32
AMPLITUD DEL INTERVALO DE CLASE................................................................................33
LÍMITES REALES DE CLASE..................................................................................................35
MARCAS DE CLASE. ..............................................................................................................35
APLIQUEMOS LO APRENDIDO 2 ....................................................................................37
4. MEDIDAS DE TENDENCIA CENTRAL ..............................................................................41
MEDIA ARITMETICA O PROMEDIO .......................................................................................42
MEDIA PARA DATOS NO AGRUPADOS. ................................................................................................... 42
DATOS AGRUPADOS ..................................................................................................................................... 45
LA MEDIA PARA DATOS AGRUPADOS...................................................................................................... 46
LA MEDIA PARA DATOS AGRUPADOS...................................................................................................... 47
TEMATICA
OBJETIVO GENERAL
ESPECIFICOS ESPECIFICOS
1) ESTADISTICA
Es una parte de la Matemática aplicada que nos proporciona instrumentos para recopilar,
organizar, resumir, presentar, analizar, hacer predicciones e interpretar datos para
tomar decisiones sobre determinados hechos o fenómenos de estudio.
Antiguamente la Estadística solo era aplicada a los asuntos del Estado. Ahora,
frecuentemente la Estadística se emplea para acontecimientos ordinarios, tales como
predicción del tiempo, mediciones, probabilidades futbolísticas, uso popular de productos
alimenticios, simpatía de algún personaje público, etc. Pero para ello, es necesario que la
Estadística se use adecuadamente para hacer más eficiente las investigaciones que nos
proponemos a realizar, por lo que todos los investigadores se deben familiarizar con las
técnicas y conceptos básicos de esta ciencia tan útil.
Estadística Descriptiva. Es la parte de la Estadística que se encarga de recolectar,
clasificar, organizar, resumir, presentar y analizar en forma descriptiva sin sacar conclusiones
de tipo general.
Estadística inferencial. Es la parte de la Estadística, cuyo propósito es inferir o deducir
conclusiones y/o predicciones con respecto a una población en estudio a partir de la
información de una muestra. Para asegurar la validez de las inferencias utiliza las
Probabilidades.
Recolección de datos: Esto se puede hacer mediante el diseño de un cuestionario, test o
encuesta oportuna para escoger los datos que correspondan, el primer análisis que se debe
realizar es el del tipo de variable que pretendemos estudiar (Cualitativa o Cuantitativa;
Discreta o Continua). Esto condicionará en gran medida su posterior tratamiento.
Organización y procesamiento de datos: Determinado el modo de agrupamiento de las
observaciones, procedemos a su recuento, construyendo la tabla de frecuencias.
Posteriormente podremos visualizar tales frecuencias de forma gráfica con el diagrama
estadístico apropiado.
Análisis final y presentación de datos: La obtención de las diferentes conclusiones
respecto de la variable estudiada, se podrá realizar con auxilio de los diferentes parámetros
estadísticos (medidas de tendencia de centralización, medidas de posición, dispersión, etc.)
POBLACION, MUESTRA Y DATOS
El estudio estadístico puede estar orientado hacia dos campos; sea una población o una
muestra; cuando la población es muy grande se toma una muestra, a este proceso se
denomina muestreo que puede ser aleatorio y no aleatorio.
A) Población. Es el conjunto de todos los elementos cuyo estudio nos interesa. Si se
dispone de datos de una o más variables sobre la población completa, o se puede
acceder a ellos, la Estadística tendrá como misión que la recolección sea adecuada, se
ordenen, se estructuren y se resuman dichos datos para su mejor comprensión, es decir,
que se describan. Ello nos llevará a hablar de Estadística Descriptiva. Por ejemplo, el
conjunto de los hombres mayores de 65 años y residentes en un barrio, vereda que sería
una población.
B) Muestra. Es el conjunto de elementos de los que efectivamente se dispone de datos, y
que es una parte (a menudo pequeña) de la población. Cuando no se puede acceder a
los datos de toda la población, que es lo más frecuente, y se debe trabajar con sólo los de
Página 7 de 154
la muestra, a la simple descripción de los datos se añade el interés por valorar hasta qué
punto los resultados de la muestra son extrapolables o generalizables a la población; en
consecuencia, será necesario utilizar no sólo las técnicas de la Estadística Descriptiva,
siempre obligadas en todo caso para la comprensión de los resultados, sino también otras
que permiten inferir afirmaciones sobre la población a partir de los datos de la muestra y
que constituyen la Estadística Inferencial. Por ejemplo, el grupo de los hombres mayores
de 65 años y residentes en un barrio, vereda que son usuarios de bibliotecas públicas
sería una muestra de la población citada en el párrafo anterior.
C) Datos. Es la medida, valores o características que posee cada uno de los elementos
pertenecientes a una muestra o la población.
VARIABLES ESTADISTICAS Y SU CLASIFCACION
Lo que se estudia en una muestra o población es una serie de variables en cada individuo o
elemento. El aspecto que deseamos estudiar (edad, sexo, peso, ...) recibe el nombre de
variable estadística. A lo largo de esta unidad observaremos, que las técnicas estadísticas
a seguir serán diferentes según el tipo de variable objeto de estudio. La clasificación más
tradicional de las variables estadísticas es la siguiente:
1) Variables cualitativas, también llamadas caracteres, variables categóricas o atributos,
que son aquellas que no necesitan números para expresarse; cada forma particular en
que pueden presentarse se denomina modalidad. Por ejemplo, el sexo de una persona es
una variable cualitativa y “hombre” o “mujer” son sus únicas modalidades. En
consecuencia, para una variable cualitativa, cada dato no es más que la información de
que un determinado elemento de la muestra presenta una determinada modalidad. Los
valores de las observaciones quedan expresados por características o atributos. Por
ejemplo: Estado civil; Color preferido; Nivel de estudios; Raza;..
2) Variables cuantitativas o numéricas, que son aquellas que necesitan números para ser
expresadas, como la edad de alguien o el número de páginas de un libro. Cada forma
particular en que se presentan es un valor numérico, y un dato es en estas variables un
número que refleja el valor de la variable en un elemento de la muestra. También pueden
distinguirse al menos dos subtipos. Los valores de las observaciones son numéricos
(cuantificables) y, en consecuencia, ordenables. A su vez las variables cuantitativas se
subdividen en dos tipos:
DISCRETAS: Toman valores concretos y pueden enumerarse y sus valores son
consecutivos (Nº de hijos: 0, 1, 2, ...)
CONTINUAS: Pueden tomar cualquier valor de un cierto intervalo, que pueden ser
resultados de la toma de medidas (Peso; Estatura; ...).
Establecimiento Educativo
Jornada Grado y curso Fecha
Área
Estimado(a) estudiante, tu opinión acerca de la forma como el profesor organiza, desarrolla y evalúa el curso es
muy importante para nuestra institución educativa. A continuación se presentan una serie de aspectos
relevantes en este sentido, para que valores el desempeño del docente con la mayor objetividad posible,
marcando con una equis (X) frente a cada aspecto la respuesta que mejor represente tu opinión.
Casi
Algunas
sie
Nunca vec Siempre
mpr
es
e
EL PROFESOR
2. Presenta los temas con mucha claridad
3. Comunica claramente los objetivos de cada clase
4. Responde las dudas de los estudiantes en clase
5. Expresa expectativas positivas de los estudiantes
Página 10 de 154
6. Explica los criterios de evaluación de la materia
7. Evalúa adecuadamente la materia
8. Programa y coordina salidas pedagógicas como complemento
a la materia
9. Atiende dudas académicas de los estudiantes fuera de clase
10. Realiza actividades de recuperación y refuerzo con estudiantes
que lo necesitan
11. Indica normas de comportamiento en clase claras para todos
12. Es respetado por todos los estudiantes del curso
13. Realiza clases activas y dinámicas
14. Informa a padres de familia y acudientes sobre el desempeño
de los estudiantes
15. Llega a clase y sus orientaciones son seguidas por todos los
estudiantes
LAS CLASES
16. Son interesantes porque tratan temas llamativos
17. Empiezan y terminan a la hora indicada
18. Desarrollan los temas propuestos en el tiempo indicado
19. Tratan temas importantes para el barrio, la zona o la
comunidad
20. ¿Cuáles de los siguientes recursos usa el profesor para desarrollar sus clases?
Una distribución de frecuencias indica como las aparecen los datos estadísticos, desde el
menor de ellos hasta el mayor de ese conjunto de trabajo sin que se haya hecho ninguna
modificación al tamaño de las unidades originales. En estas distribuciones los valores de
cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus
respectivas repeticiones.
Para algunos estadísticos definen datos No agrupados cuando el tamaño de la muestra es
menor a 30 o la muestra es mayor y homogénea, los datos pueden tratarse individualmente,
y en este caso se les llama Datos no agrupados. Sin embargo, cuando la muestra es grande
(mayor 30), es laborioso hacerlo de esta forma, por lo que se lleva a cabo algún tipo de
agrupación preliminar para realizar el tratamiento adecuado a los datos. En este último caso,
se les llama Datos Agrupados. Para trabajar con datos no agrupados, lo primero que
podemos hacer es ordenarlos, en forma ascendente o descendente. Una vez ordenados los
datos de la muestra se organizan en una tabla de frecuencias.
FRECUENCIA ABSOLUTA f.
Se llama frecuencia absoluta de un dato al número de veces que se repite ese dato o
resultado en una observación de una muestra o población.
La suma de las frecuencias absolutas de todos los datos que se han obtenido en la encuesta
o estudio, ha de ser igual al número total de datos observados.
EJEMPLO. Vamos a hacer un recuento de datos y ver su frecuencia relativa en el caso
siguiente: Hemos preguntado a los 22 alumnos y alumnas de clase sobre cuál será el
resultado del próximo partido entre el Pasto y el rival BB…., obteniendo estos resultados:
TABLA 1: TOMA DE DATOS
G P E E G G P E G G E P G G G
E E P G P P E
Dónde:
G ///////// 9
E /////// 7
P ////// 6
TOTAL N = 22
7
Empatan E 16
Pierde el equipo de
P 6 22
casa
TOTAL n = 22
10 25
FRECUENCIA ABSOLUTA
8 20
ACUMULDAD
FRECUENCIA
6 15
4 10
2 5
0 0
G E P G E P
RESULTADOS DEL PARTIDO RESULTADOS DEL PARTIDO
FRECUENCIA RELATIVA fr
Se llama frecuencia relativa de un dato al cociente entre su frecuencia absoluta y el número
total de datos. La suma de todas las frecuencias relativas de los datos de un estudio tiene
que ser igual a 1 o al ciento por ciento 100%. Para los resultados de la encuesta anterior,
escribimos una nueva columna a la derecha de la tabla de frecuencias en la que vamos
calculando cada una de las frecuencias relativas:
= fi
fi
fr ; fr * 100
N N
TABLA 4: FRECUENCIA RELATIVA
Resultado del Frecuencia
Frecuencia relativa Frecuencia relativa
partido absoluta
f fr fr %
G 9 9/22 0.41 9/22*100 41%
E 7 7/22 0.32 7/22*100 32%
P 6 6/22 0.27 6/22*100 27%
TOTAL n = 22 1.00 1.0 100% 100%
EJEMPLO. Veamos ahora otro caso; Hemos hecho una votación entre los 22 alumnos y
alumnas para elegir de entre cuatro candidatos al representante del curso, obteniéndose los
siguientes resultados (nombres).
Carlos, Paula, Carmen, Ana, Carmen, Paula, Paula, Carlos, Ana, Paula, Carlos, Paula, Ana,
Carmen, Paula, Carmen, Carlos, Carlos, Paula, Carlos, Paula, Carmen
Hacemos, en primer lugar, el recuento de los datos:
TABLA 5: RECUENTO DE DATOS
Número de veces que se
Nombre del candidato Recuento
repite
Carlos ////// 6
Paula //////// 8
Carmen ///// 5
Ana /// 3
TOTAL n = 22
Carlos 6 6
Paula 8 14
Carmen 5 19
Ana 3 22
TOTAL n = 22
Página 15 de 154
La suma de las frecuencias absolutas es: 6 + 8 + 5 + 3 = 22
La persona con mayor votación ha sido Paula, por lo tanto será la representante o delegada
del curso.
Con los nombres de los candidatos y los valores de las frecuencias absolutas, relativas y
relativas acumuladas diseñas graficas de líneas, de barras u otras; ubicando en el horizontal
los nombres y el eje vertical las frecuencias.
Gráfico lineal. Proceso que consiste en representar puntos en un sistema de coordenadas
dado por las parejas de valores que pertenecen a la observación de un elemento de una
muestra, que luego son unidos por medio de líneas rectas. Cuando se utiliza como variable el
tiempo, este se ubica en el eje horizontal.
8
FRECUENCIA ASOLUTA
8
6
6
4
2 4
0 2
Carlos Paula Carmen Ana
CANDIDATOS 0
Carlos Paula Carmen Ana
Página 16 de 154
FRECUENCA ACUMULADA FRECUENCIA ACUMULADA
25 25
20 20
ACUMULADA
ACUMULADA
FRECUENCIA
FRECEUNCIA
15 15
10 10
5 5
0 0
Carlos Paula Carmen Ana
CANDIDATOS
X1 X2 X3
A 18 60.0 170.0
B 17 55.0 175.0
C 18 45.0 160.0
D 18 55.0 155.0
E 19 50.0 155.0
F 19 55.0 160.0
G 19 55.0 170.0
H 17 60.0 1550
I 19 55.0 175.0
J 18 50.0 160.0
Con los datos obtenidos de cada variable completar las tablas de frecuencias
Página 17 de 154
TABLA 9: FRECUENCIA ABSOLUTA PARA LA EDAD
Frecuencia
Edad en años Frecuencia absoluta
Absoluta acumulada
XI f fa
17 2 2
18 4 6
19 4 10
TOTAL n = 10
12 4,5
4
FRECUENCIA ABSOLUTA
FRECUENCIA ABSOLUTA
10
3,5
8 3
2,5
6 2
4 1,5
1
2 0,5
0
0
17 18 19
17 18 19
EDAD
EDAD EN ANOS
12 12
FRECEUNCIA ACUMULADA
FRECUENCIA ACUMULADA
10 10
8 8
6 6
4 4
2 2
0 0
17 18 19 0 17 18 19
EDAD EDAD
Página 18 de 154
TABLA 10: FRECUENCIA ABSOLUTA PARA EL PESO
Frecuencia Frecuencia
Peso en Kg
absoluta Absoluta acumulada
X f fa
45
50
55
60
TOTAL n=
Frecuencia
Estatura en Cm Frecuencia absoluta
Absoluta acumulada
X f fa
155
160
165
170
175
TOTAL n=
17
18
19
TOTAL n=
Página 19 de 154
TABLA 13: FRECUENCIA RELATIVA PARA EL PESO
Frecuencia Frecuencia relativa
Peso en kg Frecuencia relativa
absoluta acumulada
X f fr fr*100 fra%
45
50
55
60
TOTAL n=
155
160
165
170
175
TOTAL n=
ESTADÍSTICAS MIXTAS.
Se presenta cuando se estudia la relación existente entre cualidades y las variables
cuantitativas de un elemento perteneciente a una muestra o población. Por ejemplo, si se
desea saber la relación que existe entre las variables: sexo, edad, peso y estatura en una
muestra de estudiantes del grado 11, ver Tabla siguiente.
Página 20 de 154
TABLA 15. DATOS MIXTOS.
CUALIDAD VARIABLES
SEXO EDAD (AÑOS) PESO (Kg) ESTATURA (Cm)
M 18 50.0 170.0
M 17 55.0 175.0
M 18 55.0 160.0
M 18 60.0 155.0
M 19 55.0 155.0
Con los datos obtenidos de cada variable del sexo masculino completar las tablas de
frecuencias y además calcular el valor promedio o media aritmética para datos no agrupados.
Frecuencia Frecuencia
Edad en años
absoluta Absoluta acumulada
XI f fa
17
18
19
TOTAL n=
Frecuencia Frecuencia
Peso en Kg
absoluta Absoluta acumulada
XI f fa
50
55
60
TOTAL n=
Página 21 de 154
TABLA 18: FRECUENCIA ABSOLUTA PARA LA ESTATURA
Frecuencia Frecuencia
Estatura en Cm
absoluta Absoluta acumulada
XI f fa
155
160
165
170
TOTAL n=
TOTAL n=
Con los datos obtenidos de cada variable del sexo femenino completar las tablas de
frecuencias y además calcular el valor promedio o media aritmética para datos no agrupados.
TOTAL n=
Página 23 de 154
TABLA 24: FRECUENCIA ABSOLUTA PARA EL PESO
Frecuencia Frecuencia
Peso en Kg
absoluta Absoluta acumulada
X f fa
TOTAL n=
TOTAL n=
TOTAL n=
Página 24 de 154
TABLA 27: FRECUENCIA RELATIVA PARA EL PESO
TOTAL n=
TOTAL n=
700
600
500
INGRESO
400
300
200
100
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
AÑOS
La Figura 1 indica que en el año de 2001 se ha obtenido un ingreso máximo, esto muestra la
gráfica con su punto más alto, en tanto que en el año de 2002 el ingreso es mínimo.
Página 26 de 154
700
600
500
INGRESO
400
300
200
100
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
AÑOS
2008 653
499
2006 451
INGRESO
380
2004 243
253
2002 201
665
2000 355
0 200 400 600 800
AÑOS
G9; 179
2008 G8; 173
G9; 127
2007 G8; 136
G9; 131
2006 G8; 105
G9; 121
2005 G8; 81
AÑOS
G9; 87
2004 G8; 62
G9; 46
2003 G8; 126
G9; 82
2002 G8; 44
G9; 170
2001 G8; 343
G9; 91
2000 G8; 164
APLIQUEMOS LO APRENDIDO 1
Para las siguientes tablas de datos seguir los pasos adecuados para construir la tabla de
distribución de frecuencias y dibujar el diagrama de barras y polígono de frecuencias.
TABLA: INFORMACIÓN RECOLECTADA RELACIONADA CON
No EDAD X PESO X ESTATURA X
1 14 45 140
2 18 55 165
3 18 55 165
4 17 55 160
5 16 50 155
6 16 50 155
7 16 50 155
8 16 50 150
9 17 55 160
10 17 55 160
11 17 55 160
12 17 55 160
13 15 50 150
14 15 45 150
15 15 45 145
16 15 50 145
17 15 50 150
18 14 45 140
19 14 60 140
20 18 60 165
Página 28 de 154
1) Las calificaciones de un grupo de alumnos en Matemáticas son los siguientes:
5 2 4 9 7 4 5 6 5 7 7 5 5 2 10 5 6 5 4 5
8 8 4 1 8 4 8 6 6 3 6 7 6 6 7 6 7 3 5 6
9 6 1 4 6 3 5 5 6 7 5 2 4 9 7 4 5 6 5 7
7 5 5 2 5 8 8 4 3 5 5 4 5 6 5 7 7 5 5 2
10 5 6 5 4 5 8 8 4 1 8 4 8 6 6 3 6 7 6 6
7 6 7 3 5 6 9 6 1 4 6 3 5 5 6 7 5 2 4 1
3) En una cierta ciudad se registra el número de nacimientos ocurridos por semana durante
un año.
16 14 12 18 18 16 10 16 17 15 12 18 19
12 17 11 19 16 19 18 18 16 14 12 17 10
13 11 17 12 15 19 11 15 19 14 11 16 11
17 18 10 15 13 12 13 19 11 17 13 12 18
5) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100
puntos.
38 51 32 65 25 72 28 34 12 29 43
71 62 50 37 18 13 24 19 47 81 53
16 62 50 37 14 68 17 75 94 16 25
55 38 46 16 72 34 64 61 33 59 21
13 92 37 43 58 40 52 88 27 74 66
Página 29 de 154
63 28 36 19 56 28 84 38 16 42 50
38 46 16 72 64 46 61 33 59 68 77
98 51 62 13 17 51 43 47 54 58 26
12 42 34 68 77 42 45 60 31 72 23
18 22 70 34 15 22 59 20 68 55 49
33 52 14 40 38 52 54 50 11 41 76
6) Con los datos de la tabla siguiente formar grupos para organizar las tablas adecuadas
para construir las gráficas estudiadas hasta el momento utilizando los datos que se
presentan a continuación, de acuerdo a las siguientes condiciones.
a) Gráficas lineal y de barras para el grado 10 según el grado académico, electrónica y
computación
b) Gráficas lineal y de barras para el grado 11 según el grado académico, electrónica y
computación
c) Gráficas de barras para el grado 10 y 11 según el grado académico, electrónica y
computación
d) Gráficas lineal y de barras para frecuencias acumuladas el grado 10 según el grado
académico, electrónica y computación
e) Gráficas lineal y de barras para frecuencias acumuladas el grado 11 según el grado
académico, electrónica y computación
f) Gráficas lineal y de barras para el grado 10 uniendo todos los grados
g) Gráficas lineal y de barras para el grado 11 uniendo todos los grados.
TABLA 1. INGRESO DE ESTUDIANTES DE LA INSTITUCIÓN B
2003 32 30 61 26 67 27
2004 49 32 70 51 126 49
2005 53 52 75 56 129 97
2006 87 49 73 54 153 83
INTERVALOS DE CLASE.
Son grupos pequeños de datos observados, utilizados para realizar cálculo cuando los datos
son numerosos, su conformación está sometida a diferentes reglas establecidas
Página 33 de 154
universalmente. El propósito es no perder información primaria en el cálculo y expresar
correctamente las características de la variable. Algunos autores acostumbran y
recomiendan tomar el número de grupos o intervalos ( i ) entre 5 y 20, otros entre 5 y 15 con
el objeto de no distorsionar la información, en éste caso se toma el primer caso. Como n
intervalo de clase es el conjunto de todos los números comprendidos entre dos valores
dados, llamados límites inferior y superior del intervalo. Se denota por (Li, Ls)
Para formar los grupos se debe:
Ordenar los datos de mayor a menor o de menor a mayor.
Buscar el rango o recorrido ( R ), que equivale a la diferencia entre el valor máximo y el
valor mínimo de los datos ordenados de la muestra de trabajo.
R = Xmáx - Xmím
Para i = 5 Para i = 20
28 28
C 5 . 6 Cm = 6 C 1 . 4 Cm
5 20
Estos dos resultados indican que se tiene 5 grupos o intervalos con amplitud de 5.6 = 6 y
para 20 intervalos con amplitud de 1.4. Entonces la amplitud o tamaño del intervalo de clase
que se puede tomar estará comprendido entre 1.4 y 5.6, tomando números enteros 2, 3, 4 y
5. El tamaño del intervalo de clase ( C ) también se puede hallar tomando un promedio entre i
= 5 e i = 20 mediante la siguiente expresión:
R
C
8
EJEMPLO: Para hallar la amplitud del intervalo de rango ( R ) 28, según la expresión del
promedio será
28
C = 3.5 = 4 Valor que está comprendido entre 1.4 y 5.6 cm.
8
Página 34 de 154
Al tomar el peso a una muestra de 40 estudiantes se obtuvo los datos que están en la Tabla
4, las columnas 1 y 2 los datos se encuentran sin ordenar; en cambio en la Tabla 5 columnas
1 y 2 los datos están ordenados. Hallar el rango o recorrido: R = 168 - 139 = 29
O sea que ( C ) puede tomar valores desde 1.45 hasta 5.8, que tomando números enteros
serán 1, 2, 3, 4, 5 y 6 o tomando la expresión que utiliza el promedio se tendrá:
29
C 3 . 63 4
8
TABLA 4. DATOS OBSERVADOS.
Número de datos Estatura Número de datos Estatura
XI XI
1 149 21 148
2 153 22 161
3 144 23 147
4 153 24 155
5 160 25 142
6 142 26 154
7 159 27 139
8 143 28 156
9 163 29 158
10 152 30 154
11 155 31 156
12 150 32 157
13 144 33 150
14 151 34 152
15 147 35 158
16 146 36 152
17 168 37 162
18 153 38 166
19 151 39 154
20 152 40 153
Después de calcular la amplitud del intervalo se procede a encontrar y formar los intervalos
de clase. Tomando como punto de partida el mínimo dato observado y sumando
Página 35 de 154
horizontalmente el tamaño del intervalo de clase menos la unidad ( C - 1), así: 139 + (4 -1) =
139 + 3 = 142, verticalmente se suma el verdadero valor de ( C ), cuyo valor es 4 así: 139 + 4
= 143, hasta llegar al tope del máximo valor, ver Tabla 6 primera columna. Con los datos
ordenados de la Tabla 5 se procede a contabilizar los datos que se encuentran
comprendidos en éstos intervalos; estos resultados están en la columna 2 Tabla 6 que se
denomina frecuencia absoluta f i.
TABLA. 5 DATOS OBSERVADOS Y ORDENADOS
Estatura Estatura
Numero datos Numero datos
ordenadas ordenadas
XI XI
1 139 21 153
2 142 22 153
3 142 23 153
4 143 24 154
5 144 25 154
6 144 26 154
7 146 27 155
8 147 28 155
9 147 29 156
10 148 30 156
11 149 31 157
12 150 32 158
13 150 33 158
14 151 34 159
15 151 35 160
16 152 36 161
17 152 37 162
18 152 38 163
19 152 39 166
20 153 40 168
Li Ls
Xi
2
Al igual que para los datos no agrupados, la frecuencia relativa de un dato es igual al
cociente entre su frecuencia absoluta y el número total de datos. La suma de todas las
frecuencias relativas de los datos de un estudio tiene que ser igual a 1 o al ciento por ciento
100%. Para los resultados de la encuesta anterior, escribimos una nueva columna a la
derecha de la tabla de frecuencias en la que vamos calculando cada una de las frecuencias
relativas.
APLIQUEMOS LO APRENDIDO 2
Para cada una de las actividades siguientes Construir la tabla de frecuencias y además
dibujar el histograma y el polígono de frecuencias relativas y acumuladas. Para lo cual se
debe seguir los siguientes eventos.
1) Encontrar la puntuación más alta (máximo) y la más baja (mínimo).
2) Encontrar el rango R. R = Valor máximo – Valor mínimo.
3) Encontrar la amplitud o intervalo de clase C = R/8, (8 intervalos aproximadamente) o
utilizando la Regla de Sturges
4) Construir el histograma y polígono de frecuencias correspondiente.
Marcas de clase y frecuencia relativa;
Marcas de clase y frecuencia relativa acumulada;
Marcas de clase y frecuencia absoluta
Marcas de clase y frecuencia absoluta acumulada
Página 38 de 154
1) Puntuación obtenida con base a 50 puntos por estudiantes de ESTADISTICA.
13 15 24 28 33 35 38 42 23 38 36 34 29 25 17 17 34 36 39 44
31 26 20 11 13 22 27 47 39 37 34 32 35 28 38 41 48 15 32 13
35 38 42 23 38 36 17 34 24 28 33 35 38 42 23 38 36 34 29 25
17 17 34 36 39 44 31 26 20 11 13 22 27 47 39 37 34 32 35 28
38 41 47 39 37 34 32 35 28 38 41 48 15 32 13 35 34 29 25 17
36 39 44 31 26 20 31 26 20 11 13 22 27 47 39 17 34 36 39 44
36 34 29 25 17 17 34 36 39 44 13 15 24 28 33 35 38 42 23 38
3) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
375 354 376 387 444 411 424 360 282 500
416 358 317 363 365 241 404 422 241 288
328 263 402 254 362 424 440 317 299 279
408 348 315 385 481 500 438 310 482 446
333 382 300 347 421 368 365 387 358 440
294 390 249 418 315 230 273 379 359 263
385 481 279 408 317 299 424 440 254 362
402 288 328 422 241 291 404 363 365 358
411 424 360 282 500 328 263 402 254 362
317 500 416 360 282 411 424 387 444 354
376 375 420 289 252 405 359 252 399 269
405 359 252 399 269 416 358 317 363 365
387 444 411 424 360 424 440 317 299 279
Página 39 de 154
5) TABLA DE DATOS OBSERVADO PESOS EN KILOGRAMOS
31 28 32 35 33 20 32 31 28 32 33 32
28 22 29 29 33 32 35 28 22 29 33 35
28 22 29 29 33 32 35 28 22 29 33 35
27 21 33 29 25 32 24 27 21 33 25 24
27 21 33 29 25 32 24 27 21 33 25 24
21 22 18 30 27 29 26 21 22 33 27 26
21 22 33 30 27 29 26 21 22 33 27 26
23 24 20 25 26 33 32 23 24 20 26 32
23 24 20 25 26 31 32 23 24 20 26 32
24 20 32 32 29 20 21 24 20 32 29 21
24 20 32 32 29 20 21 24 20 32 29 21
31 28 32 35 33 28 32 31 28 32 33 32
31 28 32 35 33 28 32 31 28 32 33 32
28 22 29 29 33 22 35 28 22 29 33 35
28 22 29 29 33 22 35 28 22 29 33 35
27 21 33 29 25 21 24 27 21 33 25 24
33 32 31 28 26 24 32 23 24 20 26 32
6) Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un
examen de Física: 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
7) Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:
Intervalos
fi
Li Ls
38 44 7
45 51 8
52 58 15
59 65 25
66 72 18
73 79 9
80 86 6
8) Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
fi 8 10 16 14 10 5 2
Página 40 de 154
9) Un dentista observa el número de caries en cada uno de los 100 niños de cierto colegio.
La información obtenida esta resumida en la siguiente tabla: construir la tabla de
frecuencias y sus graficas
No de
0 1 2 3 4
caries
fi 25 20 30 15 10
10)Estas son las notas obtenidas por los 100 candidatos que se presentaron a un concurso:
Presenta datos en una tabla de intervalos de clase y frecuencias.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 8 24 19 47 81 53
16 62 50 37 4 17 75 94 6 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 6 42 50
98 51 62 3 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 5 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
11)Realizar las operaciones correspondientes y llenar los espacios en blanco para calcular:
Frecuencia
Intervalos Marca de Frecuencia Frecuencia Frecuencia
relativa
No de clase clase absoluta acumulada relativa
acumulada
Li Ls X f fa fr% fra%
1 30 34 20
2 35 30
3 35
4 40
5 45
6 39
7 30
8 20
9 10
n=
Página 41 de 154
Observación semi-compuesta. Este caso hace relación cuando las observaciones son
varias y la variable toma pocos valores y distintos. Los valores obtenidos se ubican en dos
columnas, en la primera los valores de la variable y en la segunda la frecuencia o número de
veces que cada valor aparece repetido. Al consultar a 25 estudiantes (observación) sobre el
número de hermanos y hermanas (variable Xi), se puede elaborar la Tabla 2:
--- Xi
X=
n
---
X = Media aritmética
Xi = Datos observados
n. = Número de observaciones.
Si se desea saber la edad media de un grupo de 18 estudiantes que tienen las siguientes
edades:
20, 17, 20, 16, 15, 17, 16, 19, 19, 15, 16, 18, 18, 23, 18 ,16, 17 y 16,
Uno de los proceso será.
20+17+20+16+15+17+16+19+19+15+16+18+18+23+18+16+17+16 = 316
X
X i
=
316
= 17.6
n 18
En el segundo caso, el proceso se puede hacer menos extenso y su resultado será el mismo.
X
fX
i i
n= fX
i i =
X
fX
i i
n
TABLA 5: MEDIA ARITMETICA PARA EL PESO
n= fX
i i =
X
fX
i i
n
Página 45 de 154
TABLA 6: MEDIA ARITMETICA PARA LA ESTATURA
n= fX i i =
X
fXi i
n
DATOS AGRUPADOS
Es una observación compuesta en donde las observaciones son numerosas y la variable (X i)
toma diferentes valores, entonces se recurre a agrupar los valores de la variable (Xi) en
grupos pequeños llamados intervalos de clases y son utilizados para el proceso de cálculo.
Ahora, los datos representativos son las marcas de clase a cambio de los observados y
datos que reciben el nombre, de datos agrupados. Un grupo de estudiantes de una
institución educativa de una ciudad Z aplicaron una encuesta a una muestra de 100 casas,
para determinar las edades de los componentes familiares; el trabajo produjo resultados
numerosos por lo cual se procedió a agrupar datos y elaborar la Tabla 7
TABLA 7: OBSERVACIONES COMPUESTAS
X
X i f
* i
n
Encontrar la media de las edades utilizando la expresión para datos agrupados, en estos
casos se debe encontrar primeramente sus intervalos de clase siguiendo los pasos que se
describen a continuación, su resultado se encuentra en la Tabla 8
Primero. Ordenar y hallar las frecuencias respectivas
Segundo. Hallar el recorrido R y determinar la amplitud del intervalo (c).
R = Xmax - Xmín: R = 23 - 14 = 9 R=9
Tomando para un mínimo de intervalos i = 5, su amplitud (c) será:
R 9
c 1 .8
i 5
TABLA 8: FRECUENCIA ABSOLUTA
Orden de datos Edad en años Frecuencia absoluta
Xi fi
1. 14 1
2. 15 5
3. 16 10
4. 17 8
5. 18 8
6. 19 3
7. 20 3
8. 21 0
9. 22 1
10. 23 1
n = 40
Página 47 de 154
Para un máximo de intervalos i = 20, su amplitud (c) será:
R 9
c 0.45
i 20
O sea, que la amplitud del intervalo estará comprendido entre 0.45 y 1.8, que bien pueden
ser 1 y 2 aproximando. En éste caso se tomará c = 2
Tercero. Elaborar tablas con sus intervalos, productos de frecuencia y marcas de clase, ver
Tabla 9
Cuarto. Hallar la media aritmética.
X
X i f
* i
694
17.35
n 40
X = 17 años cumplidos
Intervalo de
Orden Marcas de Clase Frecuencia Producto
clase
Li Ls Xi fi Xi*fi
1. 14 15 14.5 6 87.0
2. 16 17 16.5 18 297.0
3. 18 19 18.5 11 203.5
4. 20 21 20.5 3 61.5
5. 22 23 22.5 2 45.0
n = 40 Σ X i* fi = 694
Li Ls X f X*f
Página 50 de 154
∑
n= X *f =
X
fX i i
n
n= X *f =
X
fX i i
n
Página 51 de 154
TABLA 14: LA MEDIA ARITMETICA PARA LA ESTATURA
Li Ls X f X*f
n= X i
*
f=
X
fX i i
n
APLIQUEMOS LO APRENDIDO 3
Hallar media para cada uno de los siguientes:
4) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100 puntos.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 18 24 19 47 81 53
16 62 50 37 14 17 75 94 16 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 16 42 50
38 46 16 72 64 61 33 59 68 77
98 51 62 13 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 15 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
7) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
G n X1 * X2 * X3 *...* Xn
Dónde:
G = Media geométrica.
n = Número de observaciones.
X1, X2, X3, ..., Valor de cada observación.
EJEMPLO. Si se tiene cinco puntajes 65, 70, 80, 50 y 85 significa que el número de
observaciones es cinco (n=5), por lo tanto la media geométrica será:
65 70 80 50 85 350
X 70
5 5
Comparando los dos resultados, se tiene: 69 < 70; En forma general se puede afirmar que:
Página 56 de 154
GX
Método para datos agrupados. Si los valores X1, X2, X3, X4, ..., Xn, se representan con sus
correspondientes frecuencias f1, f2, f3, f4, ..., fn y además con intervalos de clase, entonces
para hallar la media geométrica G se utiliza la siguiente expresión:
f1 f2 f3
G X1 * X 2 * X 3 ...Xn fn
G 40 2.8935743 * 10 49 17.24
Como la media aritmética es,
Xi * fi 694
X 17.35 Entonces:
n 40
G< X o sea 17.24 < 17.35
Para el cálculo de G por medio de logaritmos se utiliza la siguiente expresión:
1
G Anti log(
n
( f i * LogX i ))
n
H
1
X
i
Dónde:
n = Número de observaciones.
Xi = Datos observados.
Se desea hallar la media armónica para los puntajes de 50, 65, 70, 80 y 85, para esto n=5.
n 5 5
H 67.626 67.63
1 1 1 1 1 1 0.073935035
X
50 65 70 80 85
i
Comparando la media aritmética, la media geométrica y la media armónica encontrada se
tiene:
67.6 < 68.8 < 70 En general será:
H G X
Método para datos agrupados. Cuando se utiliza datos agrupados o sea aquellos que
están expresados por medio de una distribución de frecuencias e intervalos de clase y se
desea hallar la media armónica se utiliza la siguiente expresión:
n
H
f
X i
i
Dónde:
H = Media armónica para datos agrupados.
n = Número de observaciones.
fi = Frecuencia absoluta.
Xi = Marcas de clase.
Tomando los datos de la Tabla 16 se puede hallar la media armónica. Utilizando el resultado
de las columnas 2 y 3 con el número de observaciones n = 40 de la Tabla 16 y reemplazando
se tiene:
Página 58 de 154
n 40
H 16.92
f 2.3345
Xi
i
TABLA 16: COCIENTE
Marcas de clase Frecuencia absoluta Cociente
Xi fi fi / (xi)
14.5 6 0.41379103
16.5 18 1.09090909
18.5 11 0.59459459
20.5 3 0.14634146
22.5 2 0.08888888
n = 40 2.33452714
2
2 2 2
X 1 X 2 X 3 ... X n
2
Xi
C =
n n
Dónde:
C = Media cuadrática.
n = Número de observaciones.
Xi = Observaciones.
Para hallar la media cuadrática de los valores siguientes 3, 4, 5, -6, -1, -3 y 2 se procede así:
2 2 2 2
X
2
X 1 * f1 X 2 * f 2 X 3 * f 3 ... X n * f n i * fi
C =
n n
APLIQUEMOS LO APRENDIDO 4
Con los datos observados que se presentan a continuación realizar y discutir con sus
compañeros los resultados finales y hacer sus correspondientes interpretaciones en cada
uno de los siguientes casos:
Hallar la media aritmética para datos agrupados y no agrupados
Hallar la media geométrica para datos agrupados y no agrupados
Hallar la media armónica para datos agrupados y no agrupados
Hallar la media cuadrática para datos agrupados y no agrupados
Página 60 de 154
Comparar los resultado de la media aritmética, media geométrica, media armónica y
media cuadrática.
La medida de longitud de un tablero (mm):
3000, 3015, 2995, 2855, 3040, 3050, 3020, 2955, 2985, 2995, 3015, 3120, 3150, 3100, 3115,
3130, 3125, 2855, 2985 y 3070
Medidas de peso (Kg):
40, 45, 60, 42, 51, 42, 44, 59, 55, 48, 46, 53, 57, 50, 58, 49, 43, 41, 54, 59, 48, 51, 56, 53, 50,
49, 45, 47, 42 y 59
MEDIANA
La mediana es una medida de posición de tendencia central. Se simboliza por Me.
La mediana de un conjunto de datos es aquel valor que ocupa la posición central, previa
ordenación de los datos en forma ascendente o descendente; por lo cual podemos decir que
por encima del valor de la mediana se encuentra el 50% de los datos y por debajo del valor
de la mediana se encuentra el otro 50% de los datos del conjunto. Según lo anterior, veamos
cual será el valor de la mediana para datos no agrupados en una tabla de frecuencias.
Si todos los valores de una determinada variable son ordenados en sentido creciente o
decreciente; se dice que la mediana es aquella observación, dato o valor que ocupa el punto
central o divide a una muestra en dos partes iguales. La mediana se la puede calcular tanto
para datos no agrupados como para agrupados.
LA MEDIANA PARA DATOS NO AGRUPADOS
En este caso los datos no se encuentran expresados mediante una distribución de
frecuencias, se puede ordenar con facilidad en forma creciente o decreciente las
observaciones que pueden dar dos casos, uno para datos impares y otro para los pares.
EJEMPLO Considerando que un estudiante tiene los siguientes puntajes en una determinada
actividad: 40, 80, 90, 70 y 100; hallar el puntaje mediano
Al ordenar los datos en forma creciente o decreciente se puede tomar la mediana como el
dato central que divide a la muestra en dos partes iguales, que en este caso el valor que
ocupa el tercer lugar con un valor de 80 es la mediana. Este resultado se puede encontrar
mediante:
n +1
PMe =
2
PMe = Posición de la mediana.
n = Número de observaciones.
Página 61 de 154
EJEMPLO Considerando los datos de la tabla en donde n es igual a los cinco puntajes, se
tendrá el siguiente resultado:
=
n +1 51
PMe = =3
2 2
El número 3 indica la posición de la mediana, que se halla en tercer lugar a partir de
izquierda hacia la derecha o de derecha hacia la izquierda y pertenece a la puntuación
mediana, Me = 80
EJEMPLO. Tomando otro caso, en donde se supone que un estudiante llegó a obtener los
puntajes que van de 1 a 100, éstas son: 100, 90, 80, 60, 40 y 70. En este caso los datos son
pares, entonces la mediana se la puede encontrar por medio de una fórmula, que con
anterioridad se ha ordenado los datos. Para hallar la mediana se calcula la posición de esta,
así:
TABLA 18: ORDENAMIENTO DATOS PARES
Lugar 1 2 3 4 5 6
Creciente 40 60 70 80 90 100
Decreciente 100 90 80 70 60 40
n +1 6 1
P Me = = =3.5
2 2
PMe = 3.5 Posición de la mediana.
Esto indica que el valor de la mediana estará entre el tercero y cuarto lugar, que de acuerdo
a la tabla anterior corresponde a los puntajes de 70. y 80., conociendo éstos datos se
procede a encontrar el valor de la mediana:
70 80 150
Me = = 75
2 2
Me = 75 Puntaje mediano.
n
c( - faa)
Me = Lri + 2
fme
Dónde:
Me = Mediana.
Página 63 de 154
c = Amplitud de intervalo.
n/2 = Posición de la mediana.
n = Número de observaciones.
fme = Frecuencia de la clase mediana.
Lri = Límite real inferior de la clase mediana.
faa = Frecuencia acumulada del intervalo anterior.
EJEMPLO. En una encuesta realizada por unos estudiantes sobre los componentes
familiares en 102 casas resultaron los intervalos que se encuentran en la tabla siguiente y de
ella se tiene:
Frecuencia
Intervalo de clase Limite real de clase Frecuencia absoluta
acumulada
Li Ls Lri Lrs f fa
0 10 -0.5 10.5 110 110
11 21 10.5 21.5 157 267
22 32 21.5 32.5 122 389
33 43 32.5 43.5 62 451
44 54 43.5 54.5 48 499
55 65 54.5 65.5 50 549
66 76 65.5 76.5 9 558
77 87 76.5 87.5 2 560
88 98 87.5 98.5 1 561
n = 561
n = 561
PMe = 561/2 = 280.5
PMe = 280.5 posición de la mediana.
De acuerdo a la posición de la mediana, ésta se encontrará entre las frecuencias
acumuladas 267 y 389, que pertenecen al intervalo 21.5 y 32.5, de donde:
Lri = 21.5
faa = 267
fme = 122
c = 11
Si se reemplaza en la expresión para la mediana:
n
c( - faa)
Me = Lri + 2
fme
Página 64 de 154
11 ( 280 . 5 267 ) 148 . 5
Me 21 . 5 22 . 71
122 122
Me = 23 Años cumplidos.
Este resultado indica que el 50% de 561 personas tiene edad menor a 22.71 años y el otro
50% corresponde a edades mayores a 22.71 años y menores de 98
Frecuencia
Intervalo de clase Limite real de clase Frecuencia absoluta
acumulada
Li Ls Lri Lrs f fa
n=
n
c( - faa)
Me = Lri + 2 =
fme
Frecuencia
Intervalo de clase Limite real de clase Frecuencia absoluta
acumulada
Li Ls Lri Lrs f fa
n=
n
c( - faa)
Me = Lri + 2 =
fme
Página 65 de 154
TABLA 26: FRECUENCIA ABSOLUTA ACUMULADA PARA LA ESTATURA
Frecuencia
Intervalo de clase Limite real de clase Frecuencia absoluta
acumulada
Li Ls Lri Lrs f fa
n=
n
c( - faa)
Me = Lri + 2 =
fme
APLIQUEMOS LO APRENDIDO 5
Hallar mediana para cada uno de los siguientes casos:
4) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100 puntos.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 18 24 19 47 81 53
16 62 50 37 14 17 75 94 16 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 16 42 50
38 46 16 72 64 61 33 59 68 77
98 51 62 13 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 15 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
LOS CUARTILES Q
Son éstas, otras medidas de posición de la familia de la mediana, que dividen la distribución
en cuatro partes iguales o cuatro subconjuntos de igual tamaño Q1, Q2, Q3 previa
ordenación de los datos de forma ascendente o distribución de frecuencias en
intervalos.
Posición cuartil 1 (j = 1) y n = 8
n * 1 + 2 8 *1 + 2 10
PQ1 = = = = 2.5
4 4 4
La posición 2,5 dice que el cuartil 1 está ubicado al 25% del trayecto comprendido entre el
segundo dato, que es 9 y el tercer dato que es 9, es decir, Q 1.
Posición cuartil 2 (j = 2) y n = 8
n * 2 + 2 8 * 2 + 2 18
PQ2 = = = = 4.5
4 4 4
La posición 4,5 dice que el cuartil 2 está ubicado al 50% del trayecto comprendido entre el
cuarto dato, que es 12 y el quinto dato que también es 12, es decir, Q 2.
Posición cuartil 3 (j = 3) y n = 8
n * 3 + 2 8 * 3 + 2 26
PQ3 = = = = 6.5
4 4 4
La posición 6,5 dice que el cuartil 3 está ubicado al 75% del trayecto comprendido entre el
sexto dato, que es 12 y el séptimo dato que es 15, es decir, Q3
Cuartil 2. Como la posición del cuartil 2 es 4,5, su valor (Q2) es el promedio de los datos
cuarto y quinto.
X 4 + X 5 12 + 12
Q2 = = = 12
2 2
Este resultado indica que el 50% de los datos es inferior a 12 y mayor que 6.
Página 70 de 154
Cuartil 3. Como la posición del cuartil 3 es 6,5, su valor (Q3) es el promedio de los datos
sexto y séptimo.
X 6 + X 7 12 + 15
Q3 = = = 13.5
2 2
Este resultado indica que el 75% de los datos es inferior a 13.5 y mayor que 6.
Con los resultados anteriores podemos construir el siguiente gráfico de los cuartiles
X1 X2 X3 X4 X5 X6 X7 X8
6 9 9 12 12 12 15 17
Q1 = 25%
Q2 = 50%
Q3 = 75%
Posición cuartil 2 (j = 2) y n = 8
n * 2 + 2 8 * 2 + 2 18
PQ2 = = = = 4.5
4 4 4
Como la posición del cuartil 2 es 4,5, su valor es el promedio de los datos cuarto y quinto
Para observar con claridad cuáles son los datos cuarto y quinto es importante calcular la
frecuencia acumulada.
Página 71 de 154
Datos observados Frecuencia absoluta Frecuencia acumulada
X f. fa
6 1 1
9, 9 2 3
12, 12, 12 3 6
15 1 7
17 1 8
Total n. = 8
n* j
c( - faa)
Qj = Lri + 4
fqj
Qj = Identifica al cuartil 1, 2, 3
j = Índice que identifica al cuartil 1, 2, 3
Lri = Límite real inferior de la clase cuartílica.
fQj = Frecuencia de la clase cuartílica.
c = Amplitud del intervalo de clase.
faa = Frecuencia acumulada del intervalo anterior.
j*n/4 = Posición del cuartil.
EJEMPLO. En la institución Z, 40 estudiantes tienen un peso mínimo de 39 y un máximo de
68 kilogramos. Si la amplitud del intervalo es (c = 4), los datos agrupados se encuentran en
la Tabla siguiente.
Página 72 de 154
HALLAR EL CUARTIL Q1: n = 40 Y J = 1.
j* n 1 40
PQ 1 * 10
4 4
Posición cuartil uno Q1, que se halla entre las frecuencias acumuladas 7 y 13 que pertenecen
al intervalo 46.5 y 50.5
Lri = 46.5
faa = 7
PQ1 = 10
fQ1 = 6
c=4
Reemplazando en la expresión se tendrá el valor del Q 1.
40 *1
4( 7)
Q 1 46 . 5 4 46 . 5 2 48 . 5 Kg
6
Este resultado indica que el 25% de los estudiantes tienen un peso que está comprendido
entre 39 y 48.5 Kg.
Página 73 de 154
CALCULAR Q2 CUANDO J = 2.
2 * 40 2 40
P Q2 * 20
4 4
Posición cuartil Q2, éste se encontrará entre las frecuencias acumuladas 13 y 26, que
pertenecen al intervalo 50.5 y 54.5
Lri = 50.5
faa = 13
fq2 = 13
PQ2 = 20
c=4
Reemplazando se obtendrá el cuartil Q2.
40 * 2
4( 13 )
Q 2 50 . 5 4 50 . 5 2 . 54 52 . 65 Kg
13
Este resultado indica que el 50% de los estudiantes tienen un peso que está comprendido
entre 39 y 52.65 Kg
40 * 3
4( 26 )
Q 3 54 . 5 4 54 . 5 2 . 79 56 . 78 Kg
7
Este resultado indica que el 75% de los estudiantes tienen un peso que está comprendido
entre 39 y 56.78 Kg.
Página 74 de 154
TABLA 28: CALCULO DE CUARTILES PARA LA EDAD
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n*j
c( - faa)
Qj = Lri + 4 =
fqj
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n* j
c( - faa)
Qj = Lri + 4 =
fqj
Página 75 de 154
TABLA 30: CALCULO DE PARA CUARTILES PARA LA ESTATURA
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n* j
c( - faa)
Qj = Lri + 4 =
fqj
APLIQUEMOS LO APRENDIDO 6
1) ¿El valor de la mediana con qué valor del cuartil?. Plantee y resuelva un ejercicio para
ilustrar su respuesta.
2) Calcule los 3 cuartiles para las siguientes distribuciones de datos de manera manual.
a) 5, 2, 6, 4, 1 y 3
b) 5, 2, 8, 4, 1, 6, 7 y 3
c) 9, 2, 8, 4, 5, 6, 7, 3 y 1
d) 36, 8, 12, 32, 24, 28, 16 y 4
e) 80, 70, 40, 60, 50, 30, 20 y 10
2) Dada la siguiente tabla:
Datos X 6 9 12 15 17
observados
Frecuencia f. 1 2 5 4 2
absoluta
9) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
LOS DECILES D
Son éstas, otras medidas de posición de la familia de la mediana, que dividen la distribución
en cuatro partes iguales o cuatro subconjuntos de igual tamaño D1, D2, D3, D4, D5, D6, D7, D8,
D9 previa ordenación de los datos de forma ascendente o distribución de frecuencias
en intervalos.
Posición decill 5 (j = 5 y n = 8
Aplicando la ecuación para el quinto decil ( j = 5 )se obtiene:
n * 5 + 5 8 * 5 + 5 45
PD5 = = = = 4.5
10 10 10
La posición 4,5 dice que el decil 5 está ubicado al 50% del trayecto comprendido entre el
cuarto y quinto dato, que es 12 y 12es decir, D5.
Posición decil 7 (j = 7) y n = 8
n * 7 + 5 8 * 7 + 5 61
PD7 = = = = 6.1
10 10 10
La posición 6,1 dice que el decil 7 está ubicado al 70% del trayecto comprendido entre el
sexto dato, que es 12 y el séptimo dato que es 15, es decir, D 7.
Posición decil 9 (j = 9) y n = 8
n * 9 + 5 8 * 9 + 5 77
PD9 = = = = 7,7
10 10 10
La posición 7,7 dice que el decil 9 está ubicado al 90% del trayecto comprendido entre el
séptimo dato, que es 15 y el octavo dato que es 17, es decir, D 9.
Decil 5. Como la posición del decil 5 es 4,5, su valor (D5) es el promedio de los datos cuarto
y quinto
X 4 + X 5 12 + 12
D5 = = = 12
2 2
Este resultado indica que el 50% de los datos es inferior a 12 y mayor que 6.
Decil 7. Como la posición del decil 7 es 6,1, su valor (D 7) es el promedio de los datos sexto y
séptimo.
X 6 + X 7 12 + 17
D7 = = = 14,5
2 2
Este resultado indica que el 70% de los datos es inferior a 14,5 y mayor que 6.
Página 79 de 154
Decil 9. Como la posición del decil 9 es 7,7, su valor (D9) es el promedio de los datos
séptimo y octavo.
X 7 + X 8 15 + 17
D9 = = = 16
2 2
Este resultado indica que el 90% de los datos es inferior a 16 y mayor que 6.
X1 X2 X3 X4 X5 X6 X7 X8
6 9 9 12 12 12 15 17
D5 = 50%
D7 = 75%
D9 = 90%
HALLAR D4 CUANDO J = 4
4 * 40 4 * 40
PD4 16
10 10
Posición decíl D4, éste se halla entre las frecuencias acumuladas 13 y 26, que pertenece al
intervalo 50.5 y 54.5
Lri = 50.5
faa = 13
fD2 = 13
PD2 = 16
c=4
Reemplazando se obtendrá el decíl.
40 * 4
4( 13 )
D 4 50 . 5 10 51 . 42 Kg
13
Página 81 de 154
Este resultado indica que el 40% de los estudiantes tienen un peso que está comprendido
entre 39 y 51.42 Kg
EL DECÍL D6 CUANDO J = 6
6 * 40 6 40
P D6 * 24
10 10
Posición decíl D6, éste se hallará entre las frecuencias acumuladas 13 y 26, que pertenece al
intervalo 50.5 y 54.5
Lri = 50.5
faa = 13
fD6 = 13
PD6 = 24
c=4
Reemplazando en su expresión se obtendrá el decíl
40 * 6
4( 13 )
D 6 50 .5 10 53 .88 Kg
13
Este resultado indica que el 60% de los estudiantes tienen un peso que está comprendido
entre 39 y 53.88 Kg
EL DECÍL D8 CUANDO J = 8
8 * 40 8 40
P D8 * 32
10 10
Posición decíl D8, éste se halla entre las frecuencias acumuladas 26 y 33, que tiene por
intervalo 54.5 y 58.5
Lri = 54.5
faa = 26
fD6 = 7
PD6 = 32
c=4
Reemplazando en su expresión se obtendrá el decíl
40 * 8
4( 26 )
D 8 54 . 5 10 57 . 93 Kg
7
Este resultado indica que el 80% de los estudiantes tienen un peso que está comprendido
entre 39 y 57.93 Kg.
Página 82 de 154
TABLA 32: CALCULO DE LOS DECILES PARA LA EDAD
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n* j
c( - faa)
10
Dj = Lri + =
fDj
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n* j
c( - faa)
Dj = Lri + 10 =
fDj
Página 83 de 154
TABLA 34: CALCULO DE LOS DECILES PARA LA ESTATURA
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n* j
c( - faa)
Dj = Lri + 10 =
fDj
APLIQUEMOS LO APRENDIDO 7
1) ¿El valor de la mediana con qué valor del cuartil, decil coincide?. Plantee y resuelva un
ejercicio para ilustrar su respuesta.
2) Calcule los deciles 2, 4, 6 y 8 para las siguientes distribuciones de datos de manera
manual.
f) 5, 2, 6, 4, 1 y 3
g) 5, 2, 8, 4, 1, 6, 7 y 3
h) 9, 2, 8, 4, 5, 6, 7, 3 y 1
i) 36, 8, 12, 32, 24, 28, 16 y 4
j) 80, 70, 40, 60, 50, 30, 20 y 10
3) Dada la siguiente tabla:
Datos observados X 6 9 12 15 17
Frecuencia absoluta f. 1 2 5 4 2
8) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100 puntos.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 18 24 19 47 81 53
16 62 50 37 14 17 75 94 16 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 16 42 50
38 46 16 72 64 61 33 59 68 77
98 51 62 13 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 15 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
11) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
Página 85 de 154
12) TABLA DE DATOS OBSERVADOS DE PUNTAJES
375 354 376 387 444 411 424 360 282 500
416 358 317 363 365 241 404 422 241 288
328 263 402 254 362 424 440 317 299 279
408 348 315 385 481 500 438 310 482 446
333 382 300 347 421 368 365 387 358 440
294 390 249 418 315 230 273 379 359 263
385 481 279 408 317 299 424 440 254 362
402 288 328 422 241 291 404 363 365 358
411 424 360 282 500 328 263 402 254 362
317 500 416 360 282 411 424 387 444 354
376 375 420 289 252 405 359 252 399 269
405 359 252 399 269 416 358 317 363 365
387 444 411 424 360 424 440 317 299 279
Ejemplo: Encontrar los centiles dada la siguiente distribución de datos (peso en kilogramos):
80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solución:
Página 86 de 154
En primer lugar para calcular los centiles se ordena los datos de menor a mayor
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
65 65 67 68 70 72 72 73 78 80
Posición Centil 20 (j = 20 y n = 10
Aplicando la ecuación para el centil ( j = 20 ) se obtiene:
n * j + 50 10 * 20 + 50 250
PC20 = = = = 2.5
100 100 100
La posición 2,5 dice que el centil 20 está ubicado al 20% del trayecto comprendido entre el
segundo y tercer dato, que es 65 y 67es decir, C 20
Centil 20. Como la posición del centil 20 es 2,5, su valor (C 20) es el promedio de los datos
segundo y tercero
6
=
6
X 2 + X 3 65 + 67 132
C 20 = = =
2 2 2
Este resultado indica que el 20% de los datos es inferior a 66 y mayor que 65.
Página 87 de 154
Centil 40. Como la posición del centil 40 es 4,5, su valor (C 40) es el promedio entre los datos
cuarto y quinto.
X 4 + X 5 68 + 70 138
C 40 = = = - 69
2 2 2
Este resultado indica que el 40% de los datos es inferior a 69 y mayor que 65.
Centil 80. Como la posición del centil 80 es 8,5, su valor (C 80) es el promedio de los datos
octavo y noveno.
=
X 7 + X 8 73 + 78 151
C 80 = = = 75,5
2 2 2
Este resultado indica que el 80% de los datos es inferior a 72,5 y mayor que 65.
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
65 65 67 68 70 72 72 73 78 80
C20 = 20%
C40 = 40%
C80 = 80%
Dónde:
Cj = Identifica al centíl 1, 2, 3,....,99
n* j j = Índice que identifica el centíl 1, 2, 3,...,99
c( - faa)
Cj = Lri + 100 Lri = Límite real inferior de la clase centílica.
f Cj fCj = Frecuencia de la clase centílica.
faa = Frecuencia acumulada del intervalo anterior.
j*n/100 = Posición del centíl.
Hallar los centiles C20, C40, C60 y C80 para la siguiente tabla de datos.
=
8
j* n *
PC20
100
=
8
j* n
LRI = 46,5. FCJ = 7. FAA = 7 C= 4
100
Página 88 de 154
Al reemplazar en su ecuación correspondiente se obtendrá los siguientes resultados:
40 * 20
4( 7)
C 20 46 . 5 100 47 . 17 Kg equivale al 20%
7
6
=
=
1
j* n *
PC40
100
6
=
1
j* n
Lri = 50,5. Fcj = 6. Faa = 13 C= 4
100
4
=
=
2
j* n *
PC60
100
4
=
2
j* n
Lri = 50,5. fCj = 13. faa = 13 C= 4
100
2
=
=
3
j* n *
PC80
100
2
=
3
j* n
Lri = 54,5. fCj = 7. faa = 26 c= 4
100
Los resultados de los centiles C20, C40, C60 y C80 son iguales al de los deciles D2, D4, D6 y D8.
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n*j
c( - faa)
Cj = Lri + 100 =
f Cj
Página 90 de 154
TABLA 37: CALCULO DE LOS CENTILES PARA EL PESO
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n*j
c( - faa)
Cj = Lri + 100 =
f Cj
Frecuencia Frecuencia
Intervalo de clase Limite real de clase
absoluta acumulada
Li Ls Lri Lrs f fa
n=
n*j
c( - faa)
Cj = Lri + 100 =
f Cj
Página 91 de 154
APLIQUEMOS LO APRENDIDO 8
1) ¿El valor de la mediana con qué valor del cuartil, decil y del percentil coincide?. Plantee y
resuelva un ejercicio para ilustrar su respuesta.
2) ¿Por qué a los cuartiles, deciles y percentiles se les considera como medidas de
posición?
3) Calcule los 3 cuartiles y los deciles 2, 4, 6 y 8 para las siguientes distribuciones de datos
de manera manual.
a) 5, 2, 6, 4, 1 y 3
b) 5, 2, 8, 4, 1, 6, 7 y 3
c) 9, 2, 8, 4, 5, 6, 7, 3 y 1
d) 36, 8, 12, 32, 24, 28, 16 y 4
e) 80, 70, 40, 60, 50, 30, 20 y 10
4) Dada la siguiente tabla:
Datos observados X 6 9 12 15 17
Frecuencia absoluta f. 1 2 5 4 2
14) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
LA MODA
Se define como aquel valor del conjunto que se presenta con mayor frecuencia. Esto quiere
decir que si elegimos aleatoriamente un dato de un conjunto, el valor con mayor probabilidad
de ser seleccionado es la moda. La moda se simboliza por Mo.
LA MODA PARA DATOS NO AGRUPADOS
La moda es una medida de tendencia central que pertenece al valor que más se repite o que
tiene mayor frecuencia en un grupo de observaciones o datos y su cálculo se hace tanto para
datos no agrupados y agrupados.
Moda para datos no agrupados. En este caso la moda puede existir o no, si existe no
puede ser única. Cuando una información estadística posee una sola moda se llama
unimodal, si tiene dos se denomina bimodal.
EJEMPLO. Suponiendo que un estudiante A obtuvo cuatro valoraciones, en donde sus
puntajes son: 65, 70, 80 y 90, de acuerdo al concepto de moda ésta no existe ya que todos
los valores de las observaciones tienen la misma frecuencia igual a la unidad, ver la tabla
siguiente.
TABLA 39: MODA CERO
Calificación Frecuencia absoluta
XI fI
65 1
70 1
80 1
90 1
n=4
Página 94 de 154
Un segundo estudiante B realizó seis valoraciones y sus puntajes se encuentran en la tabla
siguiente, en donde el puntaje modal, indica que existen dos modas identificadas con los
puntajes de 65 y 80, denominada bimodal.
TABLA 40: FRECUENCIA BIMODAL
Calificación Frecuencia absoluta
XI fI
60 1
65 2 Moda 1
80 2 Moda 2
100 1
n=6
Hallar la moda para datos no agrupados relacionados con la edad, peso y estatura
TABLA 41: FRECUENCIA DE LA EDAD
Datos observados Frecuencia
XI fI
Mo =
Mo =
Página 95 de 154
TABLA 43: FRECUENCIA DE LA ESTATURA
Datos observados Frecuencia
XI fI
Mo =
Lri Lrs fi
-0.50 10.50 110 fa
10.50 21.50 157 fmo
21.50 32.50 122 fp
32.50 43.50 62
43.50 54.50 48
54.50 65.50 50
65.50 76.50 9
76.50 87.50 2
87.50 98.50 1
n = 561
Lri Lrs fi
n=
Página 97 de 154
da
Mo = Lri + c=
da + dp
Lri Lrs fi
n=
da
Mo = Lri + *c =
da + dp
n=
Página 98 de 154
APLIQUEMOS LO APRENDIDO 9
PARA DATOS NO AGRUPADOS EN INTERVALOS
1) Calcular la moda para las siguientes distribuciones de datos de manera manual.
a) 5, 2, 6, 4, 1 y 3
b) 5, 2, 8, 4, 1, 6, 7 y 3
c) 9, 2, 8, 4, 5, 6, 7, 3 y 1
d) 36, 8, 12, 32, 24, 28, 16 y 4
e) 80, 70, 40, 60, 50, 30, 20 y 10
2) Dada la siguiente tabla calcular la moda:
Datos observados X 6 9 12 15 17
Frecuencia absoluta f. 1 2 5 4 2
n=
=
=
fmo = Lri = da dp c
da
Mo = Lri + *c =
da + dp
2) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100 puntos.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 18 24 19 47 81 53
16 62 50 37 14 17 75 94 16 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 16 42 50
38 46 16 72 64 61 33 59 68 77
98 51 62 13 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 15 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
Página 100 de 154
3) Puntuación obtenida con base a 50 puntos por estudiantes de ESTADISTICA.
13 15 24 28 33 35 38 42 23 38 36 34 29 25 17 17 34 36 39 44
31 26 20 11 13 22 27 47 39 37 34 32 35 28 38 41 48 15 32 13
35 38 42 23 38 36 17 34 24 28 33 35 38 42 23 38 36 34 29 25
17 17 34 36 39 44 31 26 20 11 13 22 27 47 39 37 34 32 35 28
38 41 47 39 37 34 32 35 28 38 41 48 15 32 13 35 34 29 25 17
36 39 44 31 26 20 31 26 20 11 13 22 27 47 39 17 34 36 39 44
36 34 29 25 17 17 34 36 39 44 13 15 24 28 33 35 38 42 23 38
167 169 182 170 169 167 170 162 172 171 174 171 155 171 171 170 157 170 173
174 168 166 172 172 158 159 163 163 168 174 175 150 154 175 160 175 177 178
169 165 180 166 184 183 174 173 162 185 189 169 173 171 173 174 168 166 172
158 159 163 163 175 177 178 180 169 165 172 158 164 167 168 174 172 168 176
170 164 167 168 174 172 168 176 166 170 175 156 172 159 161 185 186 192 179
5) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
8) Los siguientes datos pertenecen a las edades de un grupo de estudiantes, seguir los
procesos que se necesitan para construir la tabla de frecuencias, para calcular la moda.
TABLA DE DATOS OBSERVADOS
31 28 32 35 33 32 31 28 32 33 32
28 22 29 29 33 35 28 22 29 33 35
28 22 29 29 33 35 28 22 29 33 35
27 21 33 29 25 24 27 21 33 25 24
27 21 33 29 25 24 27 21 33 25 24
21 22 33 30 27 26 21 22 33 27 26
21 22 33 30 27 26 21 22 33 27 26
23 24 20 25 26 32 23 24 20 26 32
23 24 20 25 26 32 23 24 20 26 32
24 20 32 32 29 21 24 20 32 29 21
24 20 32 32 29 21 24 20 32 29 21
31 28 32 35 33 32 31 28 32 33 32
31 28 32 35 33 32 31 28 32 33 32
28 22 29 29 33 35 28 22 29 33 35
28 22 29 29 33 35 28 22 29 33 35
27 21 33 29 25 24 27 21 33 25 24
33 32 31 28 26 32 23 24 20 26 32
Página 102 de 154
5. MEDIDAS DE DISPERSION
Las medidas de tendencia central también son llamadas medidas de posición, que tratan de
medir o dar a conocer los datos que se dispersan o se alejan con relación a la media,
mediana, moda, cuartiles, deciles o percentiles; en esta unidad se tomará como referencia la
media aritmética. En general el uso de las medidas de tendencia central no son ayuda
suficiente para comparar dos o más distribuciones o muestras, especialmente cuando la
media es igual en cada una de ellas. Entre las diferentes medidas de dispersión están: el
rango o recorrido, desviación media, varianza, coeficiente de variación, etc..
LA DESVIACION MEDIA PARA DATOS NO AGRUPADOS
Método para datos no agrupados . La media aritmética de las desviaciones para datos no
agrupados con relación a la media aritmética de los datos se puede escribir de la siguiente
forma:
X i X fi * (X i X )
DM DM
n n
Dónde:
X = Media aritmética de los datos.
Dm = desviación media.
Xi = Valor de cada uno de los datos observados.
fi = Frecuencia absoluta de cada valor Xi.
Para el cálculo de la desviación media se puede elaborar ciertas tablas que permiten
organizar cada uno de los resultados obtenidos en el proceso, ver las dos Tablas siguientes
TABLA 1: DATOS AGRUPADOS GRUPO A
40 1 20 20
45 2 15 30
50 3 10 30
55 4 5 20
60 5 0 0
Página 103 de 154
65 4 5 20
70 3 10 30
75 2 15 30
80 1 20 20
n = 25 f i * ( X i X ) 200
GRUPO A
fi * (X i X ) 200
DM = 8
n 25
TABLA 2: DATOS AGRUPADOS GRUPO B
45 1 15 15
50 2 10 20
55 3 5 15
60 5 0 0
65 3 5 15
70 2 10 20
75 1 15 15
n = 17 fi * ( X i X ) 100
GRUPO B
fi * (X i X ) 100
DM 5 .9
n 17
De acuerdo a los resultados de la desviación media, se puede afirmar que el grupo A
presenta mayor dispersión que el grupo B con relación a la media, por lo tanto quien ocupa el
Página 104 de 154
primer puesto es el grupo B y el segundo para el A. Si no se está convencido se puede
recurrir al concepto de varianza.
TABLA 3: DESVIACION MEDIA DE LA EDAD
n= fi * ( X i
X )
fi * (X i X )
DM =
n
n= fi * ( X i
X )
fi * (X i X )
DM =
n
n=
fi * ( X i X )
Página 106 de 154
fi * (X i X )
DM =
n
Xi = Marcas de clase.
fi = Frecuencia absoluta de cada intervalo.
n = Número de observaciones.
n=
fi * ( X i X )
Página 107 de 154
fi * ( X i X )
DM
n
n=
fi * ( X i X )
fi * ( X i X )
DM
n
n=
fi * ( X i X )
fi * ( X i X )
DM
n
2 2
S2
(X i X ) S2
fi ( X i X )
n n
Xi = Datos observados.
fi = Frecuencia absoluta de cada uno de los datos.
Siguiendo el proceso para solucionar el problema anterior de los grupos A y B ahora
utilizando el concepto de varianza. En primer lugar se debe elaborar tablas de valores para
cada uno de los grupos, ver Tabla 1 y 2 que pertenece a A y B respectivamente.
Reemplazando los datos de las Tablas 1 y 2 se obtiene la varianza tanto para A y B.
Página 109 de 154
TABLA 1: DATOS PROCESADOS GRUPO A
Datos Frecuencia Desviación Potencia Producto
Xi fi (X i X ) (X i X ) 2 fi* ( X i X ) 2
55 4 -5 25 100
60 5 0 0 0
65 4 5 25 100
70 3 10 100 300
75 2 15 225 450
80 1 20 400 400
n = 25 2
f i ( X i X ) 2500
2
S2
(Xi X )
2500
100
n 25
TABLA 2: DATOS PROCESADOS GRUPO B
Datos Frecuencia Desviación Potencia Producto
Xi fi (X i X ) (X i X ) 2 fi*( X i - X )2
55 3 -5 25 75
60 4 0 0 0
65 5 5 25 75
70 2 10 100 200
75 1 15 225 225
n = 17 f (X
i i X ) 2 1000
Página 110 de 154
2
S2
(Xi X )
1000
58.82
n 17
Según los resultados de las varianzas el grupo B ocupa el primer puesto 100>58.82
n=
fi ( X i X )2
2
S2
(X i X )
n
TABLA 4: LA VARIANZA PARA EL PESO
n=
fi ( X i X )2
2
S2
(X i X )
n
n=
f (X
i i X )2
2
S2
(X i X )
n
S2
f (X
i i X)
n
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
n= 2
fi ( X i X )
2
S2
fi ( X i X )
n
2
S
fi ( X i X ) S Varianza
n
S = Desviación típica.
fi = Frecuencia de cada dato Xi.
Xi = Valor de cada uno de los datos.
Siguiendo con el caso de los dos grupos A y B tomar el concepto desviación típica para
decidir cuál de los grupos ocupa el primer lugar mediante el uso de los valores de las Tablas
1 y 2 y la fórmula anterior, se tiene:
55 4 -5 25 100
60 5 0 0 0
65 4 5 25 100
70 3 10 100 300
75 2 15 225 450
80 1 20 400 400
2
n = 25 f i ( X i X ) 2500
Página 115 de 154
GRUPO A
2
S
fi ( X i X )
2500
25 5
n 100
TABLA 2: DATOS PROCESADOS GRUPO B
55 3 -5 25 75
60 4 0 0 0
65 5 5 25 75
70 2 10 100 200
75 1 15 225 225
2
n = 17 f i ( X i X ) 1000
GRUPO B
2
S
fi ( X i X )
1000
58 . 82 7 . 67
n 17
Según estos resultados se puede afirmar que el grupo B ocupa el primer lugar, debido a que
éste presenta menor desviación con relación a la media aritmética.
LA DESVIACIÓN TÍPICA PARA DATOS AGRUPADOS
Cuando no se puede obtener la media aritmética, la desviación media, varianza y desviación
típica con los datos realmente observados debido a que éstos son numerosos, se procede a
agrupar en clases o intervalos, en donde Xi representa las marcas de clase y f i las
frecuencias de cada intervalo, para esto se utiliza expresiones semejantes a las anteriores
con algunas modificaciones.
2
S
f (X
i i X)
n
Página 116 de 154
Veamos el siguiente caso, después de tabular los datos, agrupar en intervalos ver Tabla 1
para una muestra de 200 elementos.
TABLA 1: LA MEDIA ARITMETICA
Li Ls fi Xi f*X
4 7 5 5.5 27.5
8 11 20 9.5 190
12 15 40 13.5 540
16 19 60 17.5 1050
20 23 40 21.5 860
24 27 20 25.5 510
28 31 10 29.5 295
32 35 5 33.5 167.5
n = 200 f *X
i i = 3640
Para utilizar la expresión para S, hay necesidad de hallar la media aritmética y confeccionar
la Tabla 2 tomando como referencia la Tabla 1, así:
X
f i * Xi
=
3640
18.2
n 200
Reemplazando en la expresión, se obtiene valor de la desviación típica.
2
S
f (Xi X )
=
7182.00
= 35.91 = 5.99 = 6
n 200
2
S
f (X i X)
n
n= 2
fi ( X i X )
2
S
f (X i X)
n
Página 118 de 154
TABLA 4: LA DESVIACION ESTANDAR PARA EL PESO
Marcas de
Frecuencia Desviación Potencia Producto
clase
Xi fi (X i X ) (X i X ) 2 fi*( X i - X )2
n= 2
fi ( X i X )
2
S
f (X i X)
n
APLIQUEMOS LO APRENDIDO 10
1) Calcular la desviación media, la varianza, y la desviación típica para las siguientes
distribuciones de datos de manera manual.
Página 119 de 154
a) 5, 2, 6, 4, 1 y 3
b) 5, 2, 8, 4, 1, 6, 7 y 3
c) 9, 2, 8, 4, 5, 6, 7, 3 y 1
d) 36, 8, 12, 32, 24, 28, 16 y 4
e) 80, 70, 40, 60, 50, 30, 20 y 10
6) Dada la siguiente tabla calcular la desviación media, la varianza, y la desviación típica:
Datos observados X 6 9 12 15 17
Frecuencia absoluta f. 1 2 5 4 2
3) A continuación se registra los puntajes de conjunto de personas obtenidos con base a 100 puntos.
38 51 32 65 25 28 34 12 29 43
71 62 50 37 18 24 19 47 81 53
16 62 50 37 14 17 75 94 16 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 16 42 50
38 46 16 72 64 61 33 59 68 77
98 51 62 13 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 15 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
Página 121 de 154
4) Puntuación obtenida con base a 50 puntos por estudiantes de ESTADISTICA.
13 15 24 28 33 35 38 42 23 38 36 34 29 25 17 17 34 36 39 44
31 26 20 11 13 22 27 47 39 37 34 32 35 28 38 41 48 15 32 13
35 38 42 23 38 36 17 34 24 28 33 35 38 42 23 38 36 34 29 25
17 17 34 36 39 44 31 26 20 11 13 22 27 47 39 37 34 32 35 28
38 41 47 39 37 34 32 35 28 38 41 48 15 32 13 35 34 29 25 17
36 39 44 31 26 20 31 26 20 11 13 22 27 47 39 17 34 36 39 44
36 34 29 25 17 17 34 36 39 44 13 15 24 28 33 35 38 42 23 38
6) En una prueba de inteligencia aplicada a unos alumnos dio como resultado los siguientes valores.
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91 114 125 108 107 118
130 99 114 91 145 95 101 115 104 87 108 115 103 132 110 87 105 88 103 114
123 108 131 127 100 91 114 125 108 107 118 123 87 105 88 103 114 125 108 107
114 91 145 95 101 115 104 87 108 115 87 105 88 103 114 125 108 107 94 96
El concepto de probabilidad nace con el deseo del hombre de conocer con certeza los
eventos venideros. Es por ello que el estudio de las probabilidades surge como una
herramienta utilizada por los nobles para ganar en los juegos y pasatiempos de la época. El
desarrollo de estas herramientas fue asignado a los matemáticos de la corte.
Con el tiempo estas técnicas matemáticas se perfeccionaron y utilizaron en otras actividades
muy diferentes para las que fueron creadas. Actualmente con avance de la computación se
han desarrollado programas para el estudio de las probabilidades disminuyendo
considerablemente el margen de error en el cálculo.
La estadística y las probabilidades desempeñan un papel fundamental en el desarrollo de
problemas que están relacionados con la enumeración de experimentos, pruebas, sucesos y
datos. Entre las diferentes maneras que existen para ordenar y contar están: principio
fundamental del conteo, factorial, variaciones, permutaciones y combinaciones.
LEY DE LA MULTIPLICACION.
Este método que consiste en descomponer un experimento en otros simples y multiplicar el
número de posibilidades de cada uno de éstos para calcular las posibilidades totales.
Este principio se enuncia de la siguiente manera: Sí un suceso puede realizarse de n1
maneras diferentes, un segundo suceso puede realizarse de n2 maneras diferentes, un tercer
suceso puede realizarse de n3 maneras diferentes y así sucesivamente hasta llegar al último;
el número de maneras que los sucesos se pueden ordenar es equivalente al producto, así:
n1*n2*n3*.... = n; Total de ordenaciones.
EJEMPLO
Para formar una junta directiva hay 3 candidatos para presidente, 2 para tesorero y 2 para
secretarias; los tres cargos podrán ocuparse de: 3*2*2 = 12 maneras u ordenaciones
diferentes. Para determinar el número de ternas se procede a formar el árbol de
ordenaciones, así:
T1 S1 El conjunto solución
P1 S2
T2 S1
S2 S = {P1T1S1, P1T1S2, P1T2S1, P1T2S2,
T1 S1 P2T1S1, P2T1S2, P2T2S1, P2T2S2,
P2 S2 P3T1S1, P3T1S2, P3T2S1, P3T2S2}
T2 S1
S2
T1 S1
P3 S2
T2 S1
S2
FIGURA 1
Página 124 de 154
NOTACIÓN FACTORIAL
La notación factorial n!; significa el producto ordenado de enteros positivos desde n hasta 1 o
desde 1 hasta n; que se lee; n factorial y se puede escribir de la siguiente manera:
EJEMPLO
Se desea hallar el factorial de 1, 2, 3, 4, 5 y 6 se tiene:
FACTORIAL
0! = 0
1! = 1
2! = 2 * 1 = 2
3! = 3 * 2 * 1 = 6
4! = 4 * 3 * 2 * 1 = 24
5! = 5 * 4 * 3 * 2 * 1 = 120
6! = 6 * 5 * 4 * 3 * 2 * 1= 720
n!
nVr
(n - r)!
Dónde:
nV r = Símbolo para una variación.
n = Número total de elementos o sucesos de un conjunto.
r = Tamaño de la muestra o pruebas ordenadas.
! = Símbolo que identifica el factorial.
n r nVr
6 1 6
6 2 30
6 3 120
6 4 360
6 5 720
6 6 720
EJEMPLO
Un profesor tiene 10 estudiantes y quiere formar grupos de 4 estudiantes. De cuántas
maneras podrá organizar?. En este caso se tiene n = 10 y r = 4 que reemplazando en su
fórmula se tiene:
10! 10! 10*9*8*7*6*5*4*3*1
10 V4 = = 5040
(10 - 4)! 6! 6*5*4*3*2*1
El resultado anterior de 5040 está expresando un número grande de grupos y cada uno con
4 estudiantes que se forman a partir de 10 estudiantes.
Página 126 de 154
Si los valores de n son pequeños se halla las variaciones gráfica y analíticamente.
Suponiendo un grupo de 4 estudiantes Alejandra, Beatriz y Diana solicitan reingreso a la
universidad y tienen que presentar entrevista; ellas piensan que pueden ser llamadas
individualmente o en grupos de dos y resuelven analítica y gráficamente, ver Figura 5. El
conjunto solución S según la Figura 5 equivale:
S = {A, B, C, D} = 4 formas de 1 en 1, que va desde el origen a la columna 1.
S1 = {AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC}
S1 = 12 formas de 2 en 2, que va desde la columna 1 a 2
0 r=1 r=2 S1
A B =AB
C =AC
D =AD
B A =BA
C =BC
D =BD
C A =CA
B =CB
D =CD
D A =DA
B =DB
C =DC
EJEMPLO
Analíticamente se puede hallar utilizando la fórmula que identifica la variación.
Para n = 4 y r = 1
4! 4! 4 3 2 1
4 V1 = * * * 4 4V1 = 4 formas de 1 en 1
(4 1)! 3! 3*2*1
Para n = 4 y r = 2
4! 4! 4 3 2 1
4 V2 = * * * 12 4V2 = 12 formas de 2 en 2
(4 2)! 2 2*1
Página 127 de 154
PERMUTACIONES
La permutación es la enumeración de cierto número de elementos o sucesos en donde
entran todos los elementos o sucesos de un conjunto dado. Una permutación es un caso
particular de las variaciones donde r = n; su expresión matemática es la siguiente:
n! n!
nVn n! nP n = n! n! = n(n - 1)(n - 2)(n - 3)...1
(n - n)! 0!
Las permutaciones son un caso particular de las variaciones, se cumple para n = r. Debido a
esto, algunos matemáticos no hacen diferencia entre estos dos conceptos; simplemente
utilizan permutaciones para hallar el ordenamiento cuando, r menor o igual a n.
EJEMPLO
Considerando el grupo de estudiantes: Alejandra, Beatriz, Carolina y Diana se puede hallar
las permutaciones de 4 en 4 gráfica y analíticamente; esto se encuentra en la Figura 6. En
forma analítica para n = 4 y r = 4 es.
nP n = 4P4 = 4*3*2*1 nP n = 24
0 1 2 3 4
B C D
A D C
C B D
D B
D B C
C B
A C D
B D C
C A D
D A
D A C
C A
A B D
C D B
B A D
D A
D A B
B A
A B C
D C B
B A C
C A
C A B
B A
COMBINACIONES
Se denomina combinación a una ordenación o enumeración de; cierto número de elementos
o sucesos tomados de r en r de un conjunto de n elementos, sin repetición de ellos en más
de un ordenamiento. En las combinaciones se cumple que: r siempre es menor o igual a n,
r n sus expresiones matemáticas para el cálculo son:
=
n! n n!
nCr
(n r)!r! r (n r)!r!
0 1 2 3 4
A B C D
D
C D
D
B C D
D
C
D
EJEMPLO
Analíticamente se hace mediante fórmulas, así:
4! 4! 4*3*2*1
4 C1 = 4
(4 1)!1! 3!*1! 3*2*1
4! 4! 4 3 21
4 C2 = * * * 6
(4 2)!2! 2!* 2! 2*1*2*1
4! 4! 4*3*2*1
4 C3 = 4
(4 3)!3! 1!* 3! 1*3*2*1
4! 4! 4 3 21
4 C4 = * * * 1
(4 4)!4! 0!* 4! 1*4*3*2*1
Cuando el número de elementos es muy grande, se dificulta hallar el número de
combinaciones gráficamente, entonces se procede a resolver analíticamente.
Página 130 de 154
APLIQUEMOS LO APRENDIDO 11
1) Tú puedes desarrollar las inquietudes de:
Un estudiante desea organizar un derrotero de exámenes con las asignaturas de
física, química, biología y estadística; además desea saber de cuantas maneras puede
hacer, identificando el primero, segundo, tercero y cuarto examen.
Otro estudiante realiza el mismo ejercicio utilizando asignaturas de física, química,
biología, estadística, matemáticas y español.
2) Tú puedes ordenar los elementos de laboratorio de química: una pipeta, un tubo de
ensayo, un beaker y una probeta de: 1 en 1, 2 en 2, 3 en 3 y 4 en 4; analítica y
gráficamente.
3) Tú puedes hallar el número de variaciones de 3 en 3 de las cuatro estudiantes del caso
anterior; gráfica y analíticamente.
.
4) Tú puedes hallar los diferentes ordenamientos gráfica y analíticamente con los colores
siguientes: rojo, naranja, amarillo, verde y azul de acuerdo a: 5V1, 5C1; 5V2, 5C2; 5V3,
5C3; 5V4. 5C4; 5P5. 5C5
Según el concepto clásico de probabilidad se considera que todos los eventos elementales
de S tienen igual posibilidad o probabilidad de ser seleccionados.
EJEMPLO
Considerando un experimento que consiste en contestar 3 preguntas con V si la afirmación
es correcta y con F si la afirmación es falsa. Para este caso se puede tomar las siguientes
condiciones:
Identificar el espacio muestral S o evento seguro.
El evento A de contestar dos preguntas verdaderas.
El evento B de contestar por lo menos una verdadera
El evento C de contestar y que sean verdaderas.
El evento A B
El evento A B
El evento A C
Página 131 de 154
0 1ª OPCIÓN 2ª OPCIÓN 3ª OPCIÓN
F F
V
F V F
V
F F
V
V V F
V
APLIQUEMOS LO APRENDIDO 12
1) Considerando un experimento que consiste en contestar 3 preguntas con V si la
afirmación es correcta y con F si la afirmación es falsa. Para este caso se puede tomar
las siguientes condiciones:
Identificar el espacio muestral S o evento seguro.
El evento A de contestar dos preguntas verdaderas.
El evento B de contestar por lo menos una verdadera
El evento C de contestar y que todas sean verdaderas.
El evento A B
El evento A B
Hallar la probabilidad del evento A de contestar dos preguntas verdaderas.
Hallar la probabilidad del evento B de contestar por lo menos una verdadera
Hallar la probabilidad del evento C de contestar y que todas sean verdaderas.
Hallar la probabilidad del evento A B
Hallar la probabilidad del evento A B
Diagrama de árbol
0 1ª Opción 2ª Opción 3ª Opción
F F
V
F V F
V
F F
V
V V F
V
7) En una bolsa hay bolas de colores, pero no sabemos cuántas ni qué colores tienen. En
100 extracciones (devolviendo la bola cada vez) hemos obtenido bola blanca en 41
ocasiones, bola negra en 19, bola verde en 18 y bola azul en 22. Al hacer una nueva
extracción, qué probabilidad asignarías a:
Página 134 de 154
Ahora, si hay 22 bolas:
a) Sacar bola blanca. • El 41% son blancas; cuantas bolas blancas hay?.
b) Sacar bola negra. • El 19% son negras; cuantas bolas negras hay?
c) Sacar bola verde. • El 18% son verdes; cuantas bolas verdes hay?
d) Sacar bola azul. • El 22% son azules; cuantas bolas azules hay?
10)Martha tiene en su maleta de viaje 3 blusas de colores: blanco, azul y amarillo; y 4 faldas
de colores: verde, rosado, beige y negra. ¿De cuantas maneras diferentes puede
hacerlo?. Martha tiene:
a) 3 opciones de escoger blusas
b) 4 opciones de escoger faldas
Aplicando la técnica de la multiplicación se tendrán las siguientes posibilidades: 3 * 4 = 12
alternativas posibles:
Página 135 de 154
Falda verde
Falda rosada
Blusa blanca
Falda beige
Falda negra
Falda verde
Falda rosada
Blusa azul
Falda beige
Falda negra
Falda verde
Falda rosada
Blusa amarilla
Falda beige
Falda negra
Es un método gráfico para mostrar la secuencia o posibilidades que puede ocurrir un evento,
contando las ramas finales.
12)En una heladería hay 3 clases de jugos, 2 clases de empanadas y 4 clases de dulces.
¿Cuál es el número de posibilidades que una persona puede elegir?.
Página 136 de 154
Q
R
P
S
T
M
Q
R
H
S
T
Q
R
P
S
T
G
Q
R
H
S
T
Q
R
P S
T
C Q
R
H
S
T
20)Se saca una bolita al azar de una urna que contiene 7 bolitas amarillas, 3 azules y 5 rojas.
Cuál es la probabilidad de obtener
a) una bolita amarilla?
b) una bolita azul?
c) una bolita que no sea azul?
d) una bolita verde?
Página 138 de 154
DISTRIBUCIÓN BINOMIAL
Esta distribución también se conoce como distribución de Bernoulli, en honor del matemático
suizo Jacob Bernoulli quien fue que la dedujo. Esta distribución se utiliza para tamaños de
pruebas, experimentos o muestras menores de 50 debido a que si el número de muestras
es mayor o muy grande los resultados no pueden ser los esperados, entonces se utiliza la
distribución normal. Sea S un espacio muestral en donde se pueden presentar pruebas
repetidas e independientes o que es lo mismo decir pruebas con reemplazamiento, entonces
se tiene dos resultados posibles llamados éxito E y fracaso F.
P(E) = p P(F) = q
Como las pruebas para un éxito y un fracaso son independientes, lo cual implica que no
importa las veces que se repita un experimento y sus probabilidades siempre serán las
mismas. En una distribución Binomial se pueden presentar diferentes características entre
ellas están:
La existencia de dos resultados en cada prueba.
En cada prueba tanto el éxito y fracaso son iguales de seleccionar.
El experimento consta de (n) pruebas con reemplazamiento.
La variable K representa al número de éxitos en (n) pruebas.
EJEMPLO. Si se toma una muestra de 29 estudiantes del tercer semestre de los cuales 8
son mujeres y 21 hombres, llamando éxito a la probabilidad de seleccionar una mujer y
fracaso al seleccionar un hombre en un experimento con reemplazamiento, las
probabilidades de éxito y fracaso serán:
n(E)=número de mujeres. Éxito.
n(f) = número de hombres, Fracaso
n(S) = total de estudiantes.
n( E ) 8
P(E)=p = = 0.276 = 27.6%. El 27.6% indica la probabilidad de seleccionar una
n( S ) 29
mujer.
n( F ) 21
P(F)=q = = 0.724 = 72.4%. El 72.4% indica la probabilidad de seleccionar un
n( S ) 29
hombre.
Este resultado también se puede hallar mediante:
P(F) = 1 - p
P(F) = 1 - 0.276 = 72.4%
Página 139 de 154
P(F) = 72.4%
De esto se puede deducir que la suma de las dos probabilidades siempre es igual a la
unidad. De acuerdo a las condiciones anteriores la distribución Binomial para obtener K
éxitos en n pruebas, matemáticamente se escribe de la siguiente forma:
n n Dónde:
P(K) = pk qn-K = pK (1 - p)n-K n = Número de pruebas con repetición.
K = Variable para cada éxito en cada prueba.
k k
P(K) = Probabilidad de K éxitos en n pruebas.
n n B = Hace referncia al binomio con los
B(K; n, p) = pK qn-K = pK (1 - p)n-K parámetros n y p
k k
Tomando los 29 estudiantes de los cuales 8 son mujeres y 21 hombres con sus
probabilidades de 0.276 y 0.724 respectivamente, hallar las probabilidades de seleccionar:
a) 5 (K) mujeres en 6 (n) pruebas.
b) 3 (K) mujeres en 4 (n) pruebas.
c) 6 (K) mujeres en 7 (n) pruebas.
d) 8 (K) mujeres en 10 (n) pruebas.
e) 8 (K) mujeres en 15 (n) pruebas.
Para solucionar éste problema se utiliza una de las expresiones escritas anteriormente y
reemplazando cada uno de los datos de acuerdo a las condiciones exigidas.
n
B(k; n, p) = pK * qn-K
k
6
B(5; 6, 0.276) = (0.276)5 (0.724)6-5 = 6(0.0016)(0.724) = 0.0069 = 0.69%
5
4
B(3; 4, 0.276) = (0.276)3 (0.724)4-3 = 4(0.0210)(0.724) = 0.0608 = 6.08%
3
7
B(6; 7, 0.276) = (0.276)6 (0.724)7-6 = 7(0.00044)(0.724) = 0.0022 = 0.22%
6
10
B(8; 10, 0.276) = (0.276)8(0.724)10-8 =45(0.00003)(0.52) = 0.0007 = 0.07%
8
15
B(8; 15, 0.276) = (0.276)8(0.724)15-8=64(0.00003)(0.0104) = 0.02015 = 2.015%
8
Los resultados anteriores se pueden analizar, para el quinto caso indica que la probabilidad
de obtener 8 (k) mujeres en 15 (n) pruebas con p = 0.276, es igual a la probabilidad de
2.015%.
Página 140 de 154
USO DE LA TABLA BINOMIAL.
La tabla que se utiliza en éste tema está identificada con la letra B, ver Anexo 1, además
está compuesta para diversos valores de K según sea los de n. En éste caso se ha tomado
para n = 20 y su aplicación se extiende a diferentes casos. La tabla Binomial se aplica a
valores individuales que están o no en la tabla que está conformada por filas y columnas, un
modelo se presenta en la Tabla 1. Para hallar la probabilidad de elegir diferentes éxitos
utilizando la tabla de probabilidad B. Cuando la probabilidad del éxito es de: p = 0.05
n=1 y K = 1,
n=2 y K = 0, 1, 2
TABLA 1 BINOMIAL
PROBABILIDAD P
n K 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45
1 0.0500
2 0 0.9025
1 0.0925 0.4550
2 0.0025
APLIQUEMOS LO APRENDIDO 13
Hallar la probabilidad Binomial utilizando el proceso matemático.
a) P(2; 8, 0.4) g) P(8; 15, 0.25 m) P(4; 8, 0.45)
s) P(12; 14, 0.6)
b) P(3; 5, 0.15) h) P(2; 6, 0.4) n) P(5; 8, 0.35)
t) P(3; 10, 0.35)
c) P(4; 8; 0.45) i) P(4; 6, 0.25) o) P(3; 6, 0.3)
u) P(6; 7, 0.45)
d) P(12; 18, 0.35) j) P(3; 10, 0.35) p) P(6; 10, 0.45)
v) P(8; 10, 0.45)
e) P(3; 10, 0.65) k) P(15; 17, 0.45) q) P(8; 15 0.25)
w) P(5; 12, 0.5)
f) P(10; 16, 0.8) l) P(8; 15, 0.75) r) P(4; 8, 0.55)
DISTRIBUCIÓN DE POISSON
Es una función de distribución de probabilidades K derivada de la distribución Binomial
cuando cumple las siguientes condiciones:
El número de pruebas n aumenta considerablemente.
La probabilidad del éxito p se aproxima a cero.
La probabilidad del fracaso q = 1 - p se aproxima a la unidad.
La distribución de Poisson fue elaborada por un matemático francés de apellido Poisson, con
el propósito de aplicar a diferentes procesos físicos en donde se considera el tiempo como
variable fundamental de todo evento o suceso. Para hallar la probabilidad de K éxitos o
cambios se utiliza la expresión matemática:
Dónde:
K = Variable aleatoria de éxitos.
e * K K μ = Valor esperado que es función del tiempo.
P(K; μ) = e = 2.718282.., una constante.
K! K!* e P(K; μ) = Función de probabilidad para cada
valor de K.
e * K K
P(K; μ) =
K! K!* e
Para K = 0 y μ = 4 se obtiene:
1
P(0; 4) = (2.718282)-4 = 0.0183 = 1.83%. P(0; 4) = 1.83%
1
Para K = 2 y μ = 4 se obtiene:
16
P(2; 4) = (2.718282)-4 = 0.1465 = 14.65%. P(2; 4) = 14.65%
2
Para K = 4 y μ = 4 se obtiene:
256
P(4; 4) = (2.718282)-4 = 0.1954 = 19.54%. P(4; 4) = 19.54%
24
USO DE LA TABLA.DE POISSON
Mediante el uso de la tabla P se puede hallar la probabilidad para cada valor de K una vez
conocido el valor de la media (μ). El valor de la media está ubicado en la parte superior
horizontal y los de K verticalmente, la intersección de los dos valores determina el valor de la
probabilidad, ver Anexo 2. Sea K=0, 2, 4 y la media μ=4. Mediante el uso de la tabla P las
probabilidades correspondientes son:
P(0; 4) = 0.0183 = 1.83%
P(2; 4) = 0.1465 = 14.65%
P(4; 4) = 0.1954 = 19.54%
Según los resultados anteriores una probabilidad se puede hallar mediante dos procesos,
sea con la fórmula o con la tabla P y sus valores son iguales. En algunos problemas la media
o valor esperado μ no es fácil encontrar multiplicando n *p, debido a que se desconoce un
elemento de ellos, a cambio de éstos se encuentra otros que mediante ciertos procesos
permiten calcular la media para luego encontrar las probabilidades deseadas.
EJEMPLO. Suponiendo que en una fábrica de maletines se ha examinado una población de
N=410 unidades, encontrándose diferentes defectos que en la Tabla 2 están representados
por Ki. En la columna dos en 310 maletines hay cero defectuosos, 53 tienen un defecto, etc.
El valor esperado o promedio será:
K Ni 190
μ= i*
= 0.4634 = 0.46; μ = 0.46
N 410
TABLA 2 DEFECTOS Y PROCESOS
DEFECTOS MALETÍN PRODUCTO PROBABILIDAD PROBABILIDAD PRODUCTO
Con éste resultado y los de Ki podemos calcular sus probabilidades correspondientes, éstos
resultados están en la Tabla .2 cuarta columna, los resultados de la sexta columna permiten
comprobar si el cálculo es el correcto. Completar la siguiente tabla y encontrar el valor
promedio o valor esperado.
TABLA 3 COMPLETAR LA TABLA
PARTES
ESTUDIANTES PRODUCTOI PROBABILIDAD PROBABILIDAD PRODUCTO
INCOMPLETAS
0 400 0
1 120 120
2 56 112
3 12 36
4 8 32
5 4 20
SUMA 600 320
APLIQUEMOS LO APRENDIDO 14
1) Se realiza una prueba en donde se debe contestar 5 preguntas, con un SI cuando la
respuesta es correcta y con un NO, cuando la respuesta es incorrecta. Hallar el espacio
muestral o población correspondiente; para hallar la probabilidad de contestar:
a) Correctamente una pregunta
b) Correctamente dos preguntas
c) Correctamente tres preguntas
d) correctamente cuatro preguntas
e) Correctamente cinco preguntas
2) En entidad educativa de preescolar está conformada por un total de 50 estudiantes
distribuidos de la siguiente manera 20 son niños y 30 niñas; considerando las niñas son el
éxito y fracaso a la selección de niños: hallar probabilidades para los siguientes
escogencias.
a) 10 niñas en 12 pruebas
Página 144 de 154
b) 8 niñas en 11 pruebas
c) 6 niñas en 10 pruebas
d) 4 niñas en 9 pruebas
e) 2 niñas en 8 pruebas
Además hallar la:
a) Media para la distribución binomial µ
b) Varianza s2, para la distribución binomial
c) Desviación estándar para la distribución binomial
3) En una bolsa en donde se encuentran 45 bolas distribuidas así, 25 blancas (éxito) y 20
rojas (fracaso) y se desea seleccionar grupos de la siguiente manera.
a) 3 blancas en 5 pruebas con repetición
b) 4 blancas en 7 pruebas con repetición
c) 5 blancas en 9 pruebas con repetición
d) 6 blancas en 11 pruebas con repetición
e) 7 blancas en 15 pruebas con repetición
Además hallar la:
a) media para la distribución binomial µ
b) varianza S2, para la distribución binomial
c) desviación estándar para la distribución binomial
En de la distribución Binomial. Se considera como propiedades a: media, Varianza y
desviación típica.
Media E(X) = np
Varianza S2 = npq
Desviación típica S = npq
4) En una fábrica de maletines se encontró que de cada 100 maletines 5 tienen algunos
defectos, si se toma una muestra de 180 maletines; hallar la probabilidad para los
siguientes casos:
a) Escoger un maletín defectuoso
b) Escoger dos maletines defectuosos
c) Escoger tres maletines defectuosos
d) Escoger cuatro maletines defectuosos
e) Escoger cinco maletines defectuosos
5) En una fábrica de lapiceros se ha encontrado que de cada cien dos son defectuosos.
Hallar la probabilidad, K=1, 3 y 5 lapiceros defectuosos en una muestra de 200.
2
p= = 0.02
100
Página 145 de 154
q = 0.98
μ = n*p = 200*0.02 = 4
En la distribución de Poisson, la Varianza es equivalente al valor de la media o valor
esperado:
E(K) = μ = np Media
Var(K) = μ Varianza
σ= Desviación típica
DISTRIBUCIÓN NORMAL
La distribución Normal fue introducida por Gauss en relación con la teoría de errores de
medidas físicas, de allí, que su gráfica también lleva el nombre de campana de Gauss. La
distribución Normal es una distribución continua más importante y utilizada en diferentes
trabajos estadísticos. Se utiliza la distribución Normal y no la distribución Binomial o de
Poisson cuando el número de pruebas n se hace muy grande y las probabilidades del éxito y
fracaso están girando a 0.5, o sea que ninguna de ellas se aproxima a cero. Esta distribución
está expresada mediante la fórmula:
1 2 Dónde:
1 ( X ) /
2 f(X) = función de probabilidad a calcular.
f(X) = *e σ = Desviación típica, constante.
2 X = Variable aleatoria continua.
μ = Media o valor esperado, constante.
e = 2.718282..., constante.
π = 3.141592..., constante.
0.5 0.5
Área Área
50% 50%
99.75%
95.45%
68.27%
Dónde:
Z = Nueva variable, variable tipificada.
X X = Variable aleatoria.
Z= μ = Media aritmética, constante.
σ = Desviación típica, constante.
Página 147 de 154
f(Z)
A1 A1
0.3315 0.3315
-0.96 0.96 Z
FIGURA 4 Ubicación de Z
El área correspondiente para Z=-0.96 en la tabla N, Z estará entre 0 y 0.96, esto por simetría.
Para utilizar la tabla N en éste caso y en otros se toma la primera columna hasta llegar a 0.9
a partir de éste valor se desplaza por la fila hacia la derecha hasta llegar a la columna
identificada por 6, en la intersección de ésta fila y columna se encuentra un valor que
corresponde al área entre 0 y 0.96 equivalente a 0.3315, que en forma de probabilidad se
escribe: A1 = P(0 Z 0.96) = 0.3315
El área de probabilidad es: P(Z -0.96) o P(0.96 Z), o sea el área que se encuentra a la
izquierda de -0.96 o a la derecha de 0.96, esto por simetría. Además el área de probabilidad
no es la encontrada, el área verdadera está identificada con la letra A y no A 1, ver Figura 4.
A partir de cero hacia la izquierda o derecha en una curva Normal el área es 0.5, el área de
probabilidad A, será: A = 0.5 - A1 = 0.5 - 0.3315 = 0.1685
A = 0.1685 se llama área de probabilidad buscada.
P(X < 6) = 0.1685 = 16.85%
El resultado anterior indica que el 16.85% obtuvieron puntaje menor que 6, no aprobaron la
materia. Para identificar cuantos estudiantes obtuvieron un puntaje menor que 6, se
multiplica la probabilidad o área A por el total de estudiantes N = 101
Número de Estudiantes: n1 = A*N = 0.1685*101 = 17.02 = 17
Página 149 de 154
B) PARA LA PROBABILIDAD P(6 X 8),
Se procede de la misma forma con: X= 6, μ=7.07, σ=1.12
Z1 = X 6 7 . 07 1 . 07 -0.95 Z1 = -0.95
1 . 12 1 . 12
Z2 = X 8 7 . 07 0 . 93 0.83 Z2 = 0.83
1 . 12 1 . 12
Ubicando los valores de Z1 y Z2 se tiene, ver Figura 5
A1 A2
-0.95 0.83 Z
FIGURA 5 Ubicación de Z1 y Z
A1 A
0 0.84 Z
FIGURA 6 Ubicación de Z
Página 150 de 154
En la tabla N se encuentra el área A 1, para el área A se obtiene restando de 0.5 el área A 1.
A1 = P(0 Z 0.84) = 0.2996
El área A de probabilidad será:
A = 0.5 - A1 = 0.5 - 0.2996 = 0.2004
P(X > 8) = 0.2004 = 20.04%
El 20.04% de los estudiantes obtuvieron un puntaje mayor que 8.
Para el número de estudiantes: n3 = N*A = 101*0.2004 = 20.24 = 20
El resultado indica los estudiantes que obtuvieron puntaje mayor que 8.
Como la población N es de 101 estudiantes, entonces la suma de n 1, n2 y n3 debe igual a N,
así: N = n1 + n2 + n3 = 17 + 63 + 20 = 100
Hay un faltante de un estudiante, debido a los decimales que no se han tenido en cuenta en
los tres casos.
D) PROBABILIDAD P(X=7.03) cuando X = 7.03, μ = 7.07, σ = 1.12
Exactamente X se encontrará entre: X1 = 7.02 y X2 = 7.04
Z2 = X 2 7 . 04 7 . 07 0 . 04 -0.03
1 . 12 1 . 12
Representando los valores de Z1 y Z2 en la Figura 7
-0.04 -0.03 Z
FIGURA 7 Ubicación de Z1 y Z2
A
Área
Prob
-2.70 -0.06 Z
FIGURA 8 Ubicación de Z1 y Z2
A
Área
pr
o
0.38 2.17 Z
FIGURA 9 Ubicación de Z1 y Z2
A1 0.5
-1.85 Z
FIGURA 10 Ubicación de Z
A A1
-1.12 0
FIGURA 11 ubicación de Z
APLIQUEMOS LO APRENDIDO 15
1) Hallar las probabilidades y el número de estudiantes cuando la media es de 7.10 y la
desviación típica de 1.2 en una muestra de 145 en los intervalos:
a) P(8 X) f) P(X 6.5)
b) P(6 X) g) P(X 5)
c) P(X 5.5) h) P(8 X)
d) P(5 X 8) i) P(X 4)
e) P(7 X)
2) Una población normal tiene una media de 80 una desviación estándar de 14
a) Calcule la probabilidad de un valor localizado entre 75 y 90 P(75 ≤ X ≤ 90)
b) Calcule la probabilidad de un valor de 75 ó menor. P(X ≤ 75)
c) Calcule la probabilidad de un valor localizado entre 55 y 70. P(55 ≤ X ≤ 70)
Página 154 de 154
3) Los montos de dinero que se piden en las solicitudes de préstamos en un BANCO tiene
una distribución normal, una media de $70.000 y una desviación estándar de $20.000.
Esta mañana se recibió una solicitud de préstamo. ¿Cuál es la probabilidad de que:
a) El monto solicitado sea de $80.000 o superior? P(X ≥ 80.000)
b) El monto solicitado oscile entre $65.000 y $80.000? P(65.000 ≤ X ≤ 80.000)
c) El monto solicitado sea de $65.000 o superior. P(X ≥ 65.000)
4) Entre las ciudades de Estados Unidos con una población de más de 250.000 habitantes
El tiempo de viaje más largo pertenece a la ciudad de Nueva York, donde el tiempo medio
es de 38.3 minutos. Suponga que la distribución de los tiempos de viaje en la ciudad de
Nueva York tiene una distribución de probabilidad normal y la desviación estándar es de
7.5 minutos.
a) ¿Qué porcentaje de viajes consumen menos de 30 minutos?. P( X ≤ 30)
b) ¿Qué porcentaje de viajes consumen entre 30 y 35 minutos? P(30 ≤ X ≤ 35
c) ¿Qué porcentaje de viajes consumen entre 30 y 40 minutos? P(30 ≤ X ≤ 40