Вы находитесь на странице: 1из 26

PROBABILIDAD Y ESTADÍSTICA

UNIDAD 1. Estadística descriptiva


1.1. Conceptos básicos de estadística: Definición, Teoría de decisión, Población,
Muestra aleatoria, Parámetros aleatorios.
1.2. Descripción de datos: Datos agrupados y no agrupados, Frecuencia de clase,
Frecuencia relativa, Punto medio, Límites.
1.3. Medidas de tendencia central: Media aritmética, geométrica y ponderada,
Mediana, Moda. Medidas de dispersión: Varianza, Desviación estándar,
Desviación Media, Desviación Mediana, Rango.
1.4. Parámetros para datos agrupados.
1.5. Distribución de frecuencias.
1.6. Técnicas de agrupación de datos.
1.7. Técnicas de muestreo.
1.8. Histogramas.
Probabilidad y Estadística 3
DATOS ORDENADOS
Frecuencias
Frecuencia Absoluta: Es el número de veces que aparece un determinado valor en
un estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es
igual al número total de datos, que se representa por n.

Frecuencia Acumulada: Es la suma de las frecuencias absolutas de todos


los valores inferiores o iguales al valor considerado. Se representa por FA.

Frecuencia Relativa: Es el cociente entre la frecuencia absoluta de un determinado


valor y el número total de datos. Se puede expresar en tantos por ciento y se
representa por fr.
Probabilidad y Estadística 4
DATOS ORDENADOS
Medidas de tendencia central

Valor promedio de la distribución y se obtiene al sumar todos


los datos y dividir el resultado entre el número total de datos, su
símbolo es 𝒙.
𝑛
𝑖=1 𝑥𝑖 𝑓𝑖
𝑥= 𝑛
𝑖=1 𝑓𝑖

Probabilidad y Estadística 5
DATOS ORDENADOS
Medidas de tendencia central

Valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor (o viceversa) y se puede hallar sólo para variables
cuantitativas, su símbolo es 𝒙.
Número Valor de la
Posición
de datos mediana
𝒏+𝟏
n=impar Un dato central 𝑥=𝑘
𝟐
𝒏 𝒏 𝑘+𝑙
n=par Dos datos centrales y + 𝟏 𝑥=
𝟐 𝟐
Probabilidad y Estadística
2 6
DATOS ORDENADOS
Medidas de tendencia central

Valor(es) que más se repite(n) en una distribución, esto es,


el(los) que tiene(n) mayor frecuencia absoluta y aplica
para variables cualitativas y cuantitativas. Se representa por 𝒙.

Probabilidad y Estadística 7
DATOS ORDENADOS
Medidas de dispersión
Desviación media Desviación mediana
𝑛 𝑛
𝑖=1 𝑥𝑖 − 𝑥 𝑓𝑖 𝑖=1 𝑥𝑖 − 𝑥 𝑓𝑖
𝐷𝑥 = 𝑛 𝐷𝑥 = 𝑛
𝑖=1 𝑓𝑖 𝑖=1 𝑓𝑖

Desviación moda
𝑛
𝑖=1 𝑥𝑖 − 𝑥 𝑓𝑖
𝐷𝑥 = 𝑛
𝑖=1 𝑓𝑖
Probabilidad y Estadística 8
DATOS ORDENADOS
Medidas de dispersión

Varianza Desviación típica o estándar


𝑛
2 𝑖=1 𝑥𝑖 − 𝑥 2 𝑓𝑖 𝑛
𝜎 = 𝑛 𝑖=1 𝑥𝑖 − 𝑥 2 𝑓𝑖
𝑖=1 𝑓𝑖 𝜎= 𝑛
𝑖=1 𝑓𝑖

Rango
𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑀𝑒𝑛𝑜𝑟
Probabilidad y Estadística 9
DATOS ORDENADOS

Un ingeniero desea adquirir un disco duro, para ello, revisó el precio del artículo en 50 tiendas
virtuales y registró los datos que se muestran en la tabla de datos crudos.

Precio ($)
300 600 400 500 700 200 900 400 1000 400
400 400 700 600 100 500 400 300 600 500
1000 400 300 400 600 400 700 400 500 300
500 200 400 500 400 600 300 600 400 1000
400 300 500 400 500 400 700 400 700 400
Probabilidad y Estadística 10
DATOS ORDENADOS

1. Construye la tabla de datos ordenados y calcule las medidas de tendencia central.

Probabilidad y Estadística 11
DATOS ORDENADOS

1. ¿Qué nombre recibe la tabla inicial donde se indicaron los precios del
disco duro?

2. ¿Qué nombre recibe la tabla construida?

3. En términos del contexto, ¿cuál de las tres medidas de tendencia central


es significativa? Explicar ampliamente.

4. Matemáticamente, ¿cuál de las tres medidas de tendencia central es


significativa? Justifica tu respuesta.

Probabilidad y Estadística 12
SIMBOLOGÍA
Símbolo Lectura Significado(s)
𝑥 Equis barra • Media
• Media aritmética
• Promedio
𝑥 Equis gusano • Mediana

𝑥 Equis gorro • Moda

𝜎2 Sigma cuadrada • Varianza


• Variancia
𝜎 Sigma • Desviación típica
• Desviación estándar
𝐷𝑥 D equis barra • Desviación media

𝐷𝑥 D equis gusano • Desviación mediana

𝐷𝑥 D equis gorro • Desviación moda


• Desviación modal
Probabilidad y Estadística 13
DATOS ORDENADOS
AGRUPADOS
Se utiliza cuando el número de datos es grande y la variabilidad es alta.

Medidas de tendencia central

𝑛 𝑛
𝑖=1 𝑚𝑖 𝑓𝑖 − 𝑓𝐴
𝑥= 𝑛 𝑥=𝐿+ 2 𝐶
𝑖=1 𝑓𝑖 𝑓𝑚
𝑳 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑟𝑒𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝑪 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑜 𝑠𝑒𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑠𝑢𝑠 𝑙í𝑚𝑖𝑡𝑒𝑠 𝑟𝑒𝑎𝑙𝑒𝑠
𝒇𝒎 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝒇𝑨 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
𝒏 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
Probabilidad y Estadística 15
DATOS ORDENADOS
AGRUPADOS
Medidas de tendencia central

𝑑1
𝑥=𝐿+ 𝐶
𝑑1 + 𝑑2

𝑳 = 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑟𝑒𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙


𝑪 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑜 𝑠𝑒𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑠𝑢𝑠 𝑙í𝑚𝑖𝑡𝑒𝑠 𝑟𝑒𝑎𝑙𝑒𝑠
𝒅𝟏 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝒅𝟐 = 𝐷𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒
𝒏 = 𝑁ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑒𝑛 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛

Probabilidad y Estadística 16
DATOS AGRUPADOS
Medidas de dispersión
Desviación media Desviación mediana
𝑛 𝑛
𝑖=1 𝑚𝑖 − 𝑥 𝑓𝑖 𝑖=1 𝑚𝑖 − 𝑥 𝑓𝑖
𝐷𝑥 = 𝑛 𝐷𝑥 = 𝑛
𝑖=1 𝑓𝑖 𝑖=1 𝑓𝑖

Desviación moda
𝑛
𝑖=1 𝑚𝑖 − 𝑥 𝑓𝑖
𝐷𝑥 = 𝑛
𝑖=1 𝑓𝑖
Probabilidad y Estadística 17
DATOS AGRUPADOS
Medidas de dispersión
Varianza
𝑛 2
2 𝑖=1 𝑚𝑖 − 𝑥 𝑓𝑖
𝜎 = 𝑛
𝑖=1 𝑓𝑖

Desviación típica o estándar


𝑛
𝑖=1 𝑚𝑖 − 𝑥 2 𝑓𝑖
𝜎= 𝑛
𝑖=1 𝑓𝑖
Probabilidad y Estadística 18
DATOS AGRUPADOS

Criterios básicos a seguir para la subdivisión en clases:

1. Lo mejor es tener de 5 a 12 clases.

2. Cada clase debe tener la misma anchura.

3. Las clases deben establecerse de modo que cada pieza de datos


pertenezca exactamente a una clase.

4. A menudo ofrece ventajas el empleo de una anchura impar de clase.


Probabilidad y Estadística 19
DATOS AGRUPADOS

Procedimiento:
1. Empleamos el Método Sturges para determinar el número de clases.

𝒌 = 𝟏 + 𝟑. 𝟑𝟑𝟐 𝐥𝐨𝐠 𝒏
𝒌 = 𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆𝒔 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐𝒔
𝒏 = 𝑻𝒂𝒎𝒂ñ𝒐 𝒎𝒖𝒆𝒔𝒕𝒓𝒂𝒍
a) El valor de 𝒌 debe ser impar.
b) El valor de 𝒌 se trunca. Si el resultado es un número par, entonces le
aumentamos uno al resultado.
Probabilidad y Estadística 20
DATOS AGRUPADOS

Procedimiento:
2. Determinamos las puntuaciones alta y baja y encontramos el rango.
𝑹𝒂𝒏𝒈𝒐 = 𝑫𝒂𝒕𝒐 𝑴𝒂𝒚𝒐𝒓 − 𝑫𝒂𝒕𝒐 𝑴𝒆𝒏𝒐𝒓

3. Calculamos el ancho de los intervalos o clases el cual denotaremos por C.


El valor obtenido siempre se ajusta al siguiente entero.
𝑪 = 𝑹𝒂𝒏𝒈𝒐 ÷ 𝒌

Probabilidad y Estadística 21
DATOS AGRUPADOS
Procedimiento:
4. Elegimos un punto inicial. Para tal propósito realizamos los cálculos
siguientes:
𝑵𝒖𝒆𝒗𝒐 𝑹𝒂𝒏𝒈𝒐 = 𝑪𝒌
𝑫𝑹 = 𝑵𝒖𝒆𝒗𝒐 𝑹𝒂𝒏𝒈𝒐 − 𝑹𝒂𝒏𝒈𝒐 𝑶𝒓𝒊𝒈𝒊𝒏𝒂𝒍
𝑫𝑹 − 𝟏
Par: Divido en partes iguales y se Impar: Divido DR entre 2 y el resultado
reparte en los extremos de los datos se lo restamos al extremo izquierdo. El
originales. Resta al extremo izquierdo 𝑫𝑹
valor sobrante (𝑫𝑹 − 𝟏 − ) se le
y suma al extremo derecho. 𝟐
suma al extremo derecho.
5.Probabilidad
Construimos
y Estadística
los intervalos y ubicamos los datos. 22
DATOS AGRUPADOS

La tabla presenta las calificaciones de 50 estudiantes en la asignatura


de Probabilidad y Estadística:

Calificaciones de Probabilidad y Estadística


55 69 86 75 88 45 64 90 87 79
69 35 38 40 59 45 99 68 65 44
83 93 65 32 43 49 57 96 86 62
61 81 71 70 85 74 69 77 53 100
73 41 52 42 78 63 89 66 50 58
Probabilidad y Estadística 23
DATOS AGRUPADOS

Calificaciones de Probabilidad y Estadística


32 35 38 40 41 42 43 44 45 45
49 50 52 53 55 57 58 59 61 62
63 64 65 65 66 68 69 69 69 70
71 73 74 75 77 78 79 81 83 85
86 86 87 88 89 90 93 96 99 100

Probabilidad y Estadística 24
Probabilidad y Estadística 25
DATOS AGRUPADOS

1. ¿Qué nombre recibe la tabla inicial?

2. ¿Qué nombre recibe la tabla construida mediante el método


Sturges?

3. En términos del contexto, ¿cuál de las tres medidas de tendencia


central es significativa? Explicar ampliamente.

4. Matemáticamente, ¿cuál de las tres medidas de tendencia central


es significativa? Justifica tu respuesta.
Probabilidad y Estadística 26

Вам также может понравиться