Вы находитесь на странице: 1из 114

ESTADÍSTICA Y

PROBABILIDAD
JUSTIFICACIÓN DEL ESPACIO
ACADÉMICO
Los profesionales de Ingeniería Industrial deben en su
profesión tomar decisiones que requieren de análisis de
un conjunto de información disponible o que deben
obtener, para poder elegir entre diferentes alternativas.
En estos aspectos es en donde la Estadística Descriptiva
presenta un apoyo por cuanto presenta los
procedimientos para recolectar datos necesarios y su
posterior procesamiento, interpretación y análisis. De
otra parte, en modelos que se utilizan en diferentes áreas
de la Ingeniería Industrial (Investigación de Operaciones,
Logística, Control de calidad, Producción) es necesario
tener un buen conocimiento de los modelos
probabilísticos, parte integrante de este curso.
LOS PROPÓSITOS

• Adquirir un conocimiento preciso de las bases


necesarias de la Estadística Descriptiva y de las
probabilidades para su aplicación en la vida
profesional, como herramienta determinante en la
toma de decisiones.
• El curso de Estadística pretende desarrollar en los
estudiantes las competencias propias del área, para
poder realizar un análisis estadístico básico como la
media, la varianza y la desviación estándar a partir de
un conjunto de datos dado, al igual podrá describir
probabilísticamente una distribución de datos,
identificando el tipo de variable (discreta o continua).
OBJETIVO GENERAL

• Conocer los principales métodos de la


Estadística Descriptiva para recolectar,
resumir, interpretar y analizar información
numérica y de los fundamentos de la teoría de
probabilidades y de algunos modelos
probabilísticos.
OBJETIVOS ESPECÍFICOS
• Análisis de datos: Representar datos en forma gráfica y tabular.
• Determinar de forma manual las medidas de posición y de
dispersión. Interpretar el resumen de las estadísticas que brinda un
software.
• Determinar la probabilidad de un evento en ejercicios
seleccionados.
• Operar con las principales distribuciones de variables discretas.
• Operar con las principales distribuciones de variables continuas.
• Determinar funciones generadoras de momentos.
• Operar con múltiples variables aleatorias discretas y continuas.
• Conocer los principales modelos de probabilidades para variables
aleatorias discretas y variables aleatorias continuas.
• Utilizar las funciones de distribución conjuntas.
LA ESTADÍSTICA

La estadística, en general, es la ciencia que


trata de la recopilación, organización,
presentación, análisis e interpretación de
datos numéricos con el fin de realizar una
toma de decisión más efectiva.
HISTORIA DE LA ESTADÍSTICA
Historia.
DIVISIÓN DE LA ESTADÍSTICA

• Estadística • Estadística
Descriptiva Inferencial
ESTADÍSTICA DESCRIPTIVA:

• Consiste en la presentación de datos en


forma de tablas y gráficas. Esta comprende
cualquier actividad relacionada con los datos
y está diseñada para resumir o describir los
mismos sin factores pertinentes adicionales;
esto es, sin intentar inferir nada que vaya
más allá de los datos.
ESTADÍSTICA INFERENCIAL:
• Se deriva de muestras, de observaciones
hechas sólo acerca de una parte de un
conjunto numeroso de elementos y esto
implica que su análisis requiere de
generalizaciones que van más allá de los
datos. La Estadística Inferencial investiga
o analiza una población partiendo de una
muestra tomada.
MÉTODO ESTADÍSTICO
• El conjunto de los métodos que se utilizan para medir las
características de la información, para resumir los valores
individuales, y para analizar los datos a fin de extraerles el
máximo de información, es lo que se llama métodos
estadísticos. Los métodos de análisis para la información
cuantitativa se pueden dividir en los siguientes siete pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.
7. Toma de decisiones.
APLICACIÓN DE LA ESTADÍSTICA
La estadística prácticamente se puede
utilizar en todas las actividades del ser
humano, donde se presenta con mayor
incidencia es en: Economía, Agricultura,
Informática, Prevención de Riesgos,
Control de Medio Ambiente, Química
Analítica, Medicina, Ingeniería, Psicología,
etc.
SUMATORIA SIMPLE
El sumatorio (o sumatoria) es un operador
matemático, representado por la letra griega
sigma mayúscula ( σ ) que permite representar
de manera abreviada sumas con muchos
sumandos, con un número indeterminado
(representado por alguna letra) de ellos, o
incluso con infinitos sumandos.
SUMATORIA SIMPLE
𝑛

෍ 𝑋𝑖
𝑖=1

Donde:
𝑖 = 1 : El límite inferior,
𝑛 : El límite superior,
𝑋𝑖 : Elemento genérico,
σ Adaptado de la letra S del alfabeto griego es
decir “sigma”
SUMATORIA SIMPLE
Los sumandos de un sumatorio se expresan
generalmente como una variable
(habitualmente x,y,z,...) cuyos valores dependen
de un índice (habitualmente i,j,k...) que toma
valores enteros. El ´índice empieza tomando el
valor que aparece en la parte inferior del
sumatorio y se va incrementando en una unidad
hasta llegar al valor que aparece en la parte
superior del sumatorio.
SUMATORIA SIMPLE
Ejemplo:
6

෍ 𝑋𝑖 = 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5 + 𝑋6
𝑖=1
𝑛

෍ 𝑖 = 1 + 2 + 3+, , , , , , 𝑛
𝑖=1
6

෍𝑖 =
𝑖=1
7

෍𝑖 =
𝑖=3
9

෍𝑖 =
𝑖=5
SUMATORIA SIMPLE
Ejemplo:
4

෍ 𝐴𝑖 =
𝑖=1
6

෍ 𝑌𝑖 =
𝑖=1
4

෍𝑗 =
𝑗=1
5

෍ 𝐴𝑗 =
𝑗=1
7

෍𝑗 =
𝑗=5
SUMATORIA SIMPLE
Ejemplo, Otras operaciones sobre sumatorias simples.
σ4𝑖=1 𝑖 𝑖 =

σ4𝑖=1 𝑖 2 =

σ4𝑖=1 2𝑖 =
2
4 4

෍𝑖 ≠ ෍ 𝑖2
𝑖=1 𝑖=1
3

෍ 𝑖2
𝑖=1
2
3

෍𝑖
𝑖=1
PROPIEDADES DE LAS SUMATORIA
1. La sumatoria de una constante k, desde uno
hasta n, es igual a n veces la constante:

𝑎) Solo cuando el límite inferior es uno:


𝑛

෍ 𝐾 = 𝐾 + 𝐾 + 𝐾+, , , , 𝐾 = 𝑛𝐾
𝑖=1
PROPIEDADES DE LAS SUMATORIA
1. La sumatoria de una constante k, desde uno
hasta n, es igual a n veces la constante:

b) Solo cuando el límite inferior diferente a uno


𝑛

෍𝐾 = 𝑛−𝑖 +1 𝐾
𝑖≠1
PROPIEDADES DE LAS SUMATORIA
1. La sumatoria de una constante k, desde uno hasta n, es igual a n veces la
constante:

Ejemplos:
4

෍2 =
𝑖=1
6

෍2 =
𝑖=3
10

෍8 =
𝑖=5
6

෍2 =
𝑖=1
PROPIEDADES DE LAS SUMATORIA
1. La sumatoria de una constante k, desde uno hasta n, es igual a n veces la
constante:

Ejemplos:
4

෍2 = 2 + 2 + 2 + 2 = 2 ∗ 4
𝑖=1
6

෍2 = 6−3 +1 2=4∗2=8
𝑖=3
10

෍8 = 10 − 5 + 1 8 = 6 ∗ 8 = 48
𝑖=5
6

෍ 2 = 2 ∗ 6 = 12
𝑖=1
PROPIEDADES DE LAS SUMATORIA
2. La sumatoria del producto de una constante
por una variable es igual al producto de la
constante por la sumatoria de la variable.

𝑛 𝑛

෍ 𝐾𝑖 = 𝐾 ෍ 𝑖
𝑖=1 𝑖=1
PROPIEDADES DE LAS SUMATORIA
2. La sumatoria del producto de una constante por
una variable es igual al producto de la constante
por la sumatoria de la variable.
Ejemplos
5 5

෍ 2𝑖 = 2 ෍ 𝑖 =
𝑖=1 𝑖=1
8 8

෍ 8𝑖 = 8 ෍ 𝑖 =
𝑖=3 𝑖=3
PROPIEDADES DE LAS SUMATORIA
2. La sumatoria del producto de una constante por
una variable es igual al producto de la constante
por la sumatoria de la variable.
Ejemplos
5 5

෍ 2𝑖 = 2 ෍ 𝑖 = 30
𝑖=1 𝑖=1
8 8

෍ 8𝑖 = 8 ෍ 𝑖 = 264
𝑖=3 𝑖=3
PROPIEDADES DE LAS SUMATORIA
3. La sumatoria de dos o más variables, es igual a la
suma de las sumatorias de cada una de las variables
(ley distributiva).
𝑛 𝑛 𝑛 𝑛

෍ 𝑋𝑖 + 𝑌𝑖 + 𝑍𝑖 = ෍ 𝑋𝑖 + ෍ 𝑌𝑖 + ෍ 𝑍𝑖
𝑖=1 𝑖=1 𝑖=1 𝑖=1

4
2
෍ 2𝑖 − 6
𝑖=1
FORMULAS ESPECIALES
𝑛
𝑛 𝑛+1
𝑎. ) ෍ 𝑖 =
2
𝑖=1

10

෍𝑖 =
𝑖=1
FORMULAS ESPECIALES
𝑛
2
𝑛 𝑛 + 1 2𝑛 + 1
𝑏. ) ෍ 𝑖 =
6
𝑖=1

10

෍ 𝑖2 =
𝑖=1
FORMULAS ESPECIALES
𝑛 2
3
𝑛 𝑛+1
𝑐. ) ෍ 𝑖 =
2
𝑖=1

෍ 𝑖3 =
𝑖=1
¿QUÉ ES UN DATO?
• Dato es una representación simbólica (numérica,
alfabética, etc.), un atributo o una característica
de una entidad. El dato no tiene valor semántico
(sentido) en sí mismo, pero si recibe un
tratamiento (procesamiento) apropiado, se
puede utilizar en la realización de cálculos o toma
de decisiones. Es de empleo muy común
prácticamente en cualquier disciplina científica.
• Un Conjunto de datos es una colección de datos
normalmente tabulada. Por cada elemento (o
individuo) se indican varias características.
FORMAS DE RESUMIR LOS DATOS
• Tablas
Tablas de frecuencias (distribución de frecuencias)
Frecuencias relativas (porcentaje del total)
• Gráficos
Histogramas
Polígonos de Frecuencias
Diagrama de Puntos
Diagrama de Cajas (Box plots) etc.
Diagrama de Pareto
ESCALAS DE MEDICIÓN
La recolección de datos requiere alguna
de las escalas de medición siguientes:
nominal, ordinal, de intervalo o de razón.
La escala de medición determina la
cantidad de información contenida en el
dato e indica la manera más apropiada de
resumir y de analizar estadísticamente los
datos.
ESCALAS DE MEDICIÓN
ESCALA NOMINAL
Su fin es identificar sujetos/objetos dentro de una
distribución, por lo que únicamente podremos
establecer las relaciones de igualdad/desigualdad
entre los sujetos/objetos de una distribución. Un
ejemplo es el nombre de las ciudades: solo
podemos diferenciarlas entre sí de acuerdo con esta
escala. El número de los jugadores de fútbol o de
baloncesto nos proporciona la misma información:
solo sirve para identificarlos y diferenciarlos del
resto de jugadores, no podemos establecer ningún
tipo de orden o de gradación en función de este
número.
ESCALA NOMINAL
Cuando el dato de una variable es una etiqueta o un
nombre que identifica un atributo de un elemento,
se considera que la escala de medición es una
escala nominal. Los datos nominales pueden ser
numéricos o no numéricos. Ejemplo:
1. El sexo de una persona es un dato nominal no
numérico.
2. El número de seguro social de una persona es un
dato nominal numérico.
Ejemplos de variables que deben ser medidas en escalas nominales
son:
• Clasificación de los estudiantes por carreras (Administración – 1;
Sistemas – 2; Electrónica – 3; Derecho – 4; etc.).
• Nacionalidad (colombiano, ruso, italiano, senegalés, etc.).
• Uso de anteojos (normales, bifocales, lentes de contacto,
transición, etc.).
• Número de camiseta de los jugadores en un equipo de fútbol (1, 2,
3,…, 20).
• Código de identificación de un estudiante o un funcionario en su
carné.
• Colores (blanco, amarillo, azul, negro, naranja, etc.).
• Color de los ojos (negros, pardos, azules, verdes, etc.).
• Estado civil (soltero, casado, viudo, divorciado, unión libre).
• Profesión (ingeniero, abogado, médico, docente, etc.).
• Cereales cultivados en una región: trigo, maíz, centeno, soya, etc.
• Sexo (masculino, femenino).
• Afiliación religiosa o política (cristiano, musulmán, católico,
etc.; o liberal, conservador, independiente, etc.).
• Tipo de escuela (pública o privada).
• Raza (blanco, negro, amarillo, mestizo, etc.).
• Ciudad de nacimiento.
• Canal de televisión.
• Sabor favorito de helado (vainilla, chocolate, fresa, etc.).
• Colores de automóviles conducidos por estudiantes.
• Barrio de residencia de los estudiantes.
• Estrato (1, 2, 3, 4, 5, 6).
• Nombres de personas, compañías, etc.
• Grupos sanguíneos (O, A, B, AB).
• Número del documento de identidad.
ESCALA ORDINAL
Este tipo de escala está destinada a ordenar a los
sujetos/objetos de una distribución en función de
alguna característica. Cabe señalar que la distancia
entre sus unidades no es uniforme. De esta forma,
podemos decir que A está por encima que B, pero
no que sea el doble o que sea la mitad uno que
otro. Un ejemplo es el orden de llegada en una
carrera. Además del atributo de
igualdad/desigualdad, en esta escala podemos
añadir el ordenamiento de sus componentes.
ESCALA ORDINAL
Una escala de medición para una variable es
ordinal si los datos muestran las propiedades de
los datos nominales y además tiene sentido el
orden o jerarquía de los datos. Por ejemplo, una
empresa automovilística envía a sus clientes
cuestionarios para obtener información sobre su
servicio de reparación. Cada cliente evalúa el
servicio de reparación como excelente, bueno o
malo.
ESCALA ORDINAL
Como los datos obtenidos son las etiquetas
excelente, bueno o malo, tienen las propiedades
de los datos nominales, pero además pueden
ser ordenados o jerarquizados en relación con la
calidad del servicio. Un dato excelente indica el
mejor servicio, seguido por bueno y, por último,
malo. Por lo que la escala de medición es
ordinal. Los datos ordinales pueden ser
numéricos o no numéricos. Ejemplo:
ESCALA ORDINAL
Son ejemplos de variables que pueden ser medidas o representadas en
escalas ordinales los siguientes:
1. Las medidas pequeño, mediano y grande para dar el tamaño de
un objeto son datos ordinales no numéricos.
2. Notas escolares cualitativas (I - insuficiente; A - aceptable; B -
bueno; S - sobresaliente; E - excelente).
3. Rangos militares (recluta, dragoneante, cabo, sargento, teniente,
etc.).
4. Asignación del orden de atención según llegada de pacientes a
consulta médica (primer turno, segundo turno, tercer turno, etc.).
5. Grado de escolaridad (primaria, bachillerato, técnico profesional,
tecnólogo, universitario, etc.).
6. Preferencia a la compra de productos de consumo (siempre,
frecuentemente, ocasionalmente, nunca).
7. Etapa de desarrollo de un ser vivo (recién nacido, bebe, niño,
joven, adulto, anciano).
8. Clasificación de películas por una comisión especializada (menores
de 12 años - 1; mayores de 12 años en compañía de adultos - 2;
mayores de 18 años - 3; categoría X - 4; triple X - 5).
9. Madurez de una fruta en el momento de comprarla (verde,
pintona, madura, muy madura, podrida).
10. Calificaciones de un curso (A, B, C, …)
11. Calidad de vida en una ciudad.
12. Grado de satisfacción con la prestación de un servicio público.
13. Posición de un candidato político según su grado de popularidad.
14. Nivel socio-económico.
15. Clasificación de los equipos de fútbol durante el campeonato
nacional.
16. Clasificación de los libros por año de edición.
17. Grados de desnutrición de la población infantil en una región.
18. Intensidad de consumo de alcohol.
19. Días de la semana.
20. Meses del año.
ESCALA DE INTERVALO
En esta escala la distancia entre las unidades de
medida sí es uniforme, de forma que podemos
decir que D es el doble que A, por ejemplo. Por ello,
permite realizar operaciones matemáticas, como
suma, resta, multiplicación o división. El cero es
arbitrario, no indica la ausencia de atributo. Como
ejemplo puede servir la escala de tiempo que
utilizamos: el cero es arbitrario, puesto en el
nacimiento de Cristo, o la escala para medir la
temperatura en grados centígrados, en la que el
cero es también relativo.
ESCALA DE INTERVALO
Una escala de medición para una variable es una
escala de intervalo si los datos tienen las
características de los datos ordinales y el
intervalo entre valores se expresa en términos
de una unidad de medición fija. Los datos de
intervalo siempre son numéricos. Las
calificaciones en una prueba de aptitudes
escolares son un ejemplo de datos de intervalo.
ESCALA DE INTERVALO
Por ejemplo, las calificaciones obtenidas por tres
alumnos en la prueba de matemáticas con 620,
550 y 470, pueden ser ordenadas en orden de
mejor a peor. Además las diferencias entre las
calificaciones tienen significado. Por ejemplo, el
estudiante 1 obtuvo 620 – 550 = 70 puntos más
que el estudiante 2 mientras que el estudiante 2
obtuvo 550 – 470 = 80 puntos más que el
estudiante tres.
ESCALA DE INTERVALO
Las mediciones de temperatura son datos de
intervalo. Suponga que la temperatura en un
lugar es de 21°C y en otro es de 4°C. Estos
lugares se pueden jerarquizar de acuerdo con lo
calurosos que son: el primero es más caliente
que el segundo. La unidad fija de medición, 1°C ,
permite decir cuán más caliente es el primer
lugar: 17°C.
Ejemplos
• Lapsos de tiempo transcurridos entre 1995-1999 y 2000-
2004.
• Escalas de los test psicológicos.
• Temperatura del cuerpo humano.
• Ubicación de una carretera respecto de un punto de
referencia (Km 85, Ruta 5).
• Nivel de aceite en el motor de un automóvil medido con
una vara graduada.
• Variables usadas en test de rendimiento.
• Temperatura corporal.
• Puntaje obtenido por un equipo en un campeonato
deportivo.
• Sobrepeso respecto de un patrón de comparación.
ESCALA DE RAZÓN
Similar a la de intervalo, con la única diferencia
que el cero en esta escala sí indica la ausencia
de atributo, es cero absoluto. Como ejemplo
podemos señalar la altura en centímetros, o el
peso en gramos. En ambos casos 4 es doble que
2 (2+2=4), o 4 es la mitad que 8, por ejemplo,
debido a que la distancia entre sus unidades de
medida es uniforme.
ESCALA DE RAZÓN
Una variable tiene una escala de razón si los
datos tienen todas las propiedades de los datos
de intervalo y la proporción entre dos valores
tiene significado. Variables como distancia,
altura, peso y tiempo usan la escala de razón en
la medición. Esta escala requiere que se tenga el
valor cero para indicar que en este punto no
existe la variable.
ESCALA DE RAZÓN
Por ejemplo, considere el costo de un automóvil.
El valor cero para el costo indica que el
automóvil no cuesta, que es gratis. Además, si se
compara el costo de un automóvil de $30.000,
con el costo de otro automóvil, $15.000, la
propiedad de razón muestra que
$30.000/$15.000=2: el primer automóvil cuesta
el doble del costo del segundo.
Ejemplos
• Número de hijos en una familia.
• Medición magnitudes físicas como: longitud, masa, intensidad de
corriente, peso, velocidad, etc.
• Estatura de las personas.
• Litros de agua consumidos por persona al día.
• Velocidad de un auto de carreras.
• Número de goles marcados por un jugador en un partido.
• Longitud, masa, intensidad de corriente eléctrica.
• Nivel de productividad.
• Ventas de un producto.
• Ingreso familiar mensual.
• Peso (quilates) de una joya de oro.
• Tiempo de vuelo.
• Coeficiente intelectual.
• Goles marcados por un futbolista en un partido.
ESCALAS DE MEDICIÓN
DEFINICIONES BÁSICAS
• LA POBLACIÓN: es el conjunto de todos los
elementos sobre los que se quiere realizar un
estudio estadístico.

• LA MUESTRA: es una parte representativa de


la población que se elige para hacer el estudio
estadístico.
DEFINICIONES BÁSICAS
VARIABLE: Característica de la población que se
analiza en el estudio estadístico. Hay dos tipos de
variables estadísticas:
 Cualitativas, (atributos) son los que no se
pueden expresar con números (el estado
civil, el sexo, la raza, etc.) se pueden describir
por medio de palabras.
 Cuantitativas, (variables) son los que se
pueden expresar con números (estatura de
todas la personas de la U.) se pueden
describir por medio números.
VARIABLES CUANTITATIVAS
• Datos Discretos: Son aquellos que surgen por el
procedimiento de conteo. Es decir, los datos
discretos toman valores enteros (ej., el número
de hijos por familia; el número de automóviles
que pasan por una avenida en una hora, etc.).

• Datos Continuos: Son aquellos que surgen


cuando se mide alguna característica. Es decir,
toman al menos teóricamente cualquier valor
dentro de un intervalo (ej., el peso, la estatura, la
tensión arterial de las personas, etc.)
VARIABLES CUANTITATIVAS
• Los datos cualitativos comprenden etiquetas
o nombres que se usan para identificar un
atributo de cada elemento. Los datos
cualitativos emplean la escala nominal o la
ordinal y pueden ser numéricos o no.
• Los datos cuantitativos requieren valores
numéricos que indiquen cuánto o cuántos. Los
datos cuantitativos se obtienen usando las
escalas de medición de intervalo o de razón.
VARIABLE CUALITATIVA
El análisis estadístico adecuado para una
determinada variable depende de si la variable es
cualitativa o cuantitativa. Si la variable es
cualitativa, el análisis estadístico es bastante
limitado. Tales datos se resumen contando el
número de observaciones o calculando la
proporción de observaciones en cada categoría
cualitativa. Sin embargo, aun cuando para los datos
cualitativos se use un código numérico, las
operaciones aritméticas de adición, sustracción,
multiplicación o división no tienen sentido.
VARIABLES CUANTITATIVAS
Por otro lado, las operaciones aritméticas sí
tienen sentido en las variables cuantitativas. Por
ejemplo, cuando se tienen variables
cuantitativas, los datos se pueden sumar y luego
dividir entre el número de observaciones para
calcular el valor promedio. Este promedio suele
ser útil y fácil de interpretar. En general hay más
alternativas para el análisis estadístico cuando
se tienen datos cuantitativos
EJERCICIOS
1. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes caracteres
estadísticos estudiados en los carros de cierta
marca:
a) Modelo de carro
b) Color de su carrocería
c) Potencia de su motor
d) Consumo medio de gasolina en 100 km
e) Número de piezas
EJERCICIOS
2. Clasifique, como cualitativos o cuantitativos
(discretos o continuos), los siguientes
caracteres estadísticos estudiados en una
fábrica de tornillos:
a) La producción diaria de tornillos.
b) Las longitudes de los tornillos.
c) El color de los tornillos.
d) Las anchuras de los tornillos.
Ejemplo
La revista Viaja Bien realiza una encuesta anual
entre sus suscriptores con objeto de determinar los
mejores alojamientos del mundo. En la tabla se
presenta una muestra de nueve hoteles europeos.
Los precios de una habitación doble estándar van
de $(precio más bajo) a $$$$(precio más alto). La
calificación general corresponde a la evaluación de
habitaciones, servicio, restaurante,
ubicación/atmósfera y áreas públicas; cuanto más
alta sea la calificación general, mayor es el nivel de
satisfacción.
Ejemplo
1. ¿Cuántos elementos hay en este conjunto de
datos?
2. ¿Cuántas variables hay en este conjunto de
datos?
3. ¿Cuáles variables son cualitativas y cuáles
cuantitativas (discretas o continuas)?
4. ¿Qué tipo de escala de medición se usa para
cada variable?
Solución
1. 9
2. 4
3. Cualitativas: país y precio de la habitación.
Cuantitativas: cantidad de habitaciones y
evaluación general.
4. País es nominal; precio de la habitación es
ordinal; número de habitaciones es de razón;
evaluación general es de intervalo.
Ejemplo
En una encuesta de The Wall Street Journal (13 de octubre de
2003) se les hacen a los suscriptores 46 preguntas acerca de
sus características e intereses. De cada una de las preguntas
siguientes: ¿Cuál proporciona datos cualitativos o
cuantitativos e indica la escala de medición apropiada?
a. ¿Cuál es su edad?
b. ¿Es usted hombre o mujer?
c. ¿Cuándo empezó a leer el WSJ? Preparatoria, universidad al
comienzo de la carrera, a la mitad de la carrera, al final de la
carrera o ya retirado.
d. ¿Cuánto tiempo hace que tiene su trabajo o cargo actual?
e. ¿Qué tipo de automóvil piensa comprarse la próxima vez
que compre uno? Ocho categorías para las respuestas, entre
las que se encontraban sedán, automóvil deportivo, miniván,
etcétera.
Solución
a. Cuantitativo, discreto de razón
b. Cualitativo; nominal
c. Cualitativo; ordinal
d. Cuantitativo, discreto de razón
e. Cualitativo; nominal
DISTRIBUCIÓN DE FRECUENCIAS
• Es un método para clasificar, organizar y
resumir datos.
SÍMBOLOS:
𝑁 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑛 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑋𝑖 = 𝐼𝑑𝑒𝑛𝑡𝑖𝑓𝑖𝑐𝑎 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑖
𝑛𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎. 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒 𝑐𝑎𝑑𝑎 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒.

𝑁𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑐𝑜𝑚𝑢𝑙𝑎𝑑𝑎.


ℎ𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎. 𝑉𝑎𝑙𝑜𝑟 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑢𝑎𝑙.
𝐻𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑎 𝑎𝑐𝑜𝑚𝑢𝑙𝑎𝑑𝑎𝑑.

𝑌𝑖 = 𝐿𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑡𝑜𝑚𝑎 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒.


TABLAS DE FRECUENCIAS
• Variables discretas:
Ejemplo: En un estudio con un grupo de 2.000 personas
que habían sido tratadas psicológicamente por problemas
de ansiedad, se desea preguntar a las mismas, cuántas
veces habían sufrido un ataque de ansiedad desde que
terminó el tratamiento recibido. Pero no se quiere
realizar una investigación exhaustiva, por lo cual se
selecciono una muestra de 20 personas. El resultado de
esta encuesta, se anota a continuación:

X1= 2 X6= 4 X11= 4 X16= 0


X2= 2 X7= 0 X12= 0 X17= 2
X3= 1 X8= 1 X13= 0 X18= 3
X4= 2 X9= 0 X14= 4 X19= 0
X5= 1 X10= 0 X15= 4 X20= 3
TABLAS DE FRECUENCIAS
• N=
• n=

Yi ni hi Ni Hi
0 7 35% 7 35%
1 3 15% 10 50%
2 4 20% 14 70%
3 2 10% 16 80%
4 4 20% 20 100%
n= 20 100%
Ejemplo
• La siguiente es una muestra que representa un
estudio hecho en la ciudad de Bogotá, este se
realizó con fin de conocer la principal causa de
muerte en esta ciudad. ¿Cuál sería la principal
causa de muerte? ¿Con qué porcentaje?; ¿Cuál
sería la menor causa de muerte? ¿Con qué
porcentaje?; ¿Qué quiere decir N2? ¿Qué quiere
decir H3?
Ejemplo

1 5 3 1 2 4 1 3 1 5
2 1 1 5 3 1 2 1 4 1
4 1 3 1 5 1 2 1 1 2
5 1 1 5 1 5 3 1 2 1
2 3 1 1 2 1 5 1 5 1
1 2 5 1 1 2 3 4 1 1
1 1 2 1 1 2 1 1 2 3
3 3 1 5 2 3 5 1 3 4
1 1 2 4 5 4 1 5 1 5
5 1 1 5 1 1 5 1 1 5
LOS GRÁFICOS ESTADÍSTICOS MÁS
UTILIZADOS SON:
• DIAGRAMA DE BARRAS, consiste en dibujar una
barra sobre cada uno de los datos con una altura
proporcional a la frecuencia absoluta o relativa. Si
en un diagrama de barras unimos los extremos
superiores de cada una obtenemos una línea
poligonal que se llama polígono de frecuencias
• EL DIAGRAMA DE SECTORES, es un círculo
dividido en sectores circulares de amplitudes
proporcionales a las frecuencias absolutas o
relativas
EJEMPLOS DE GRÁFICOS VARIABLES
DISCRETAS:
TABLAS DE FRECUENCIAS
• Variables continuas:
Tomamos como ejemplo una muestra de 20
alumnos del grado decimo jornada tarde del
colegio Inem Santiago Pérez, ubicado en la
localidad 6 de Tunjuelito, a fin de conocer su peso
en kilos:

1 67,9 6 56,4 11 50,2 16 47,4


2 61,6 7 75,3 12 80,2 17 78,7
3 64,4 8 65,8 13 68,5 18 43,5
4 62,6 9 72,3 14 61,1 19 59,0
5 47,2 10 58,3 15 68,8 20 99,5
PASOS PARA ELABORAR TABLA DE
FRECUENCIAS EN DATOS CONTINUOS
• Determinar el valor máximo y mínimo.
• Calcular el rango: R =Xmax - Xmin
• Introducir dos nuevos símbolos:
M = número de intervalos
C = amplitud del intervalo.
• Calcular:
Y´j-1 = Límite inferior del intervalo Y
Y´j = Límite superior del intervalo Y
Donde Y´j-1 - Y´j = C
Y´0 = Xmin Y´j-1 Y´j
Y´0 Y´1
Y´1 Y´2
Y´2 Y´3
Y´3 Y´4
Y´4 Y´5
• Calcular: frecuencia absoluta, relativa, etc.
PASOS
1. X MAX= 99,5
X MIN= 43,5
2. R= 55,9
3. n= 20
m= 5 5 < m < 16
4. C= 11,19 m= 1 + 3.3 log n
m= √n

Y´j-1 Y´j ni hi Ni Hi
1 43,54 54,73 4 20,0% 4 20,0%
2 54,73 65,92 8 40,0% 12 60,0%
3 65,92 77,11 5 25,0% 17 85,0%
4 77,11 88,30 2 10,0% 19 95,0%
5 88,30 99,49 1 5,0% 20 100,0%
RESPUESTA
LA REGLA DE STURGES
Consiste en obtener una primera aproximación de
cuántas clases debe tener la serie de clases y
frecuencias mediante la raíz cuadrada del número
de elementos. Ejemplo: se tienen 72 salarios de una
empresa, la raíz cuadrada de 72 es 8.49, la
sugerencia inicial será utilizar 9 clases para construir
las demás clases según el número de datos. Los
salarios máximo y mínimo 179.2 y 74.65, lo que da
una diferencia (rango) de 104.55. Y como la regla de
Sturges indica 9 clases, cada una debe medir
aproximadamente 104.55/9 = 11.61 que
redondeado a 12 si es una variable de tipo discreta.
Ejercicio
• En un barrio de Bogotá, en el año 2012, se entrevistó a
un cierto número de mujeres casadas nacidas entre los
años 1935 y 1944 y se les preguntó a qué edad
contrajeron matrimonio. A continuación se muestran
los datos correspondientes a 50 de estas mujeres:
Realizar tablas de frecuencias, con 6 intervalos.

15 17 25 15 16 11 15 13 12 10
15 14 16 14 17 13 14 20 29 19
16 18 10 18 12 11 20 34 13 22
19 14 17 16 16 15 12 24 25 9
21 15 13 23 24 10 10 16 14 18
FORMAS DE RESUMIR LOS DATOS
CONTINUOS
• Gráficos
Histogramas. Está formado por rectángulos cuyas
bases miden la amplitud de las clases y cuyas
alturas son proporcionales a las frecuencias
absolutas (o relativas, si es el caso).
Polígonos de Frecuencias. Si en un histograma
unimos los extremos superiores de cada una
obtenemos una línea poligonal que se llama
polígono de frecuencias
DIAGRAMA DE PARETO
El diagrama de Pareto, es una gráfica para organizar datos de
forma que estos queden en orden descendente, de izquierda a
derecha y separados por barras. Permite asignar un orden de
prioridades. El diagrama permite mostrar gráficamente el
principio de Pareto (pocos vitales, muchos triviales), es decir, que
hay muchos problemas sin importancia frente a unos pocos muy
importantes. Mediante la gráfica colocamos los "pocos que son
vitales" a la izquierda y los "muchos triviales" a la derecha.

Fuente: https://es.wikipedia.org/wiki/Diagrama_de_Pareto
LAS VENTAJAS DEL DIAGRAMA DE
PARETO
• Permite centrarse en los aspectos cuya mejora
tendrá más impacto, optimizando por tanto los
esfuerzos.
• Proporciona una visión simple y rápida de la
importancia relativa de los problemas.
• Ayuda a evitar que se empeoren algunas causas
al tratar de solucionar otras y ser resueltas.
• Su visión gráfica del análisis es fácil de
comprender y estimula al equipo para continuar
con la mejora.
Ejemplo
Número de
En una empresa textil se Factores
defectos
desea analizar el Seda 13
número de defectos en Algodón 171
los tejidos que fabrica. Tul 105
En la tabla siguiente se
Tafetán 7
muestran los factores
Raso 7
que se han identificado
como causantes de los Encaje 8
mismos así como el Lana 4
número de defectos Lino 9
asociado a ellos: Satén 11
Viscosa 9
Tul es un tejido ligero con estructura abierta, en forma de red
Tafetán es un tejido de seda 344
Raso es un tipo de ligamento empleado generalmente para realizar un
tejido de seda muy liso, pastoso y lustros
DIAGRAMA DE PARETO
Frecuancia
Número de Frecuencia Frecuancia
Factores relativa
defectos acomulada relativa
acomulada
De mayor
a menor
DIAGRAMA DE PARETO
Frecuancia
Número de Frecuencia Frecuancia
Factores relativa
defectos acomulada relativa
acomulada
Algodón 171 171 0,49709 0,49709
Tul 105 276 0,30523 0,80233
Seda 13 289 0,03779 0,84012
Satén 11 300 0,03198 0,87209
Lino 9 309 0,02616 0,89826
Viscosa 9 318 0,02616 0,92442
Encaje 8 326 0,02326 0,94767
Tafetán 7 333 0,02035 0,96802
Raso 7 340 0,02035 0,98837
Lana 4 344 0,01163 1,00000
344
DIAGRAMA DE PARETO
DIAGRAMA DE PARETO
Número de
Causas de reprobar una materia
personas
No entregar taller 153
No presentar parciales 213
No asistir a clase 87
No se estudia 372
Falta de empatía con el profesor 27
Desinterés por la materia 7
No participar activamente en clase 16
No se realiza un análisis crítico de los temas estudiados 34
Problemas de aprendizaje 6
MEDIDAS DE TENDENCIA
CENTRAL
• Media (aritmética, ponderada, geométrica,
armónica)

• Mediana

• Moda

• Cuartiles, deciles, percentiles


MEDIA ARITMÉTICA
• Datos originales: El índice de tendencia central
más utilizado es la media. Se define como la
suma de los valores observados, dividida por
el número de ellas. Se representa con la X, en
mayúsculas , con una barra horizontal encima.
Datos originales:

Calcula la media de los siguientes datos

14 25 14 8 22 14 14 14 13 21 15
MEDIA ARITMÉTICA
• Datos agrupados:

• Hallar la media de los ejercicios:


 En un estudio con un grupo de 2.000 personas…..
 Tomamos como ejemplo una muestra de 20…….
 En cierto barrio de Bogotá, en el año 2012, se
entrevistó….
PROPIEDADES DE LA MEDIA
ARITMÉTICA
1. En un conjunto de números, la suma algebraica de las
desviaciones de estos números respecto a su media
aritmética es cero. σ 𝑋𝑖 − 𝑋ത = 0
2. En un conjunto de números 𝑋𝑖 , la suma de los cuadrados
de sus desviaciones respecto a un número a es un mínimo
ത Ejemplo. (1, 2, 3 y 4) 𝑎 = 2; 3.
si y sólo si a = 𝑋.
3. La media aritmética de una variable más una constante,
es la media aritmética de la variable más la constante.
𝑋𝑖 = 𝑋 + 𝐾. ò 𝑌ത = 𝑋ത + 𝐾.
4. La media aritmética de una variable por una constante, es
igual a la media aritmética de la variable por la constante.
𝑋𝑖 = 𝑋K.
PROPIEDADES DE LA MEDIA
ARITMÉTICA
• La media aritmética de la suma de dos
variables es igual a la suma de las medias
aritméticas de las variables.
• Si dos conjuntos de datos tienen medias:
𝑛1 𝑛2
σ𝑖=1 𝑋1𝑖 σ𝑖=1 𝑋2𝑖
𝑋1 = 𝑋2 =
𝑛1 𝑛2
𝑛1 𝑛2

෍ 𝑋1𝑖 = 𝑛1 𝑋1 ෍ 𝑋2𝑖 = 𝑛2 𝑋2
𝑖=1 𝑖=1
𝑛1 𝑥1 + 𝑛2 𝑥2
𝑋ധ =
𝑛1 + 𝑛2
VENTAJAS Y DESVENTAJAS DE LA
MEDIA ARITMÉTICA
La media aritmética tiene ventajas:
Primero, se trata de un concepto familiar para la
mayoría de las personas y es intuitivamente claro.
Segundo, cada conjunto de datos tiene una media;
es una medida que puede calcularse y es única
debido a que cada conjunto de datos posee una y
sólo una media.
Tercero, la media es útil para llevar a cabo
procedimientos estadísticos como la comparación
de medias de varios conjuntos de datos.
VENTAJAS Y DESVENTAJAS DE LA
MEDIA ARITMÉTICA
La media aritmética tiene desventajas:
Primero, aunque la media es confiable en cuanto a
que toma en cuenta todos los valores del conjunto
de datos, puede verse afectada por valores atípicos.
Segundo, resulta tedioso calcular la media de 600
datos debido a que utilizamos cada uno de los
datos en nuestro cálculo.
Tercera, somos incapaces de calcular la media para
un conjunto de datos que tiene clases de extremo
abierto en la parte inferior o superior de la escala.
No podemos calcular un valor para la media de
estos datos debido a la clase de extremo abierto
“5.4 o más”.
MEDIA ARITMÉTICA PONDERADA

• Es una media aritmética que se emplea en distribuciones


de tipo unitario, en las que se introducen unos coeficientes
de ponderación, denominados ω , que son valores
i

positivos, que representan el número de veces que un valor


de la variable es más importante que otro.

• Ejemplo: un alumno de estadística I, obtuvo las siguientes


notas durante los tres cortes: 1º corte 2.3; 2º corte 3.1; y
3º corte 2.9; ¿cuál será la nota definitiva del este alumno?
MEDIA GEOMÉTRICA
• El empleo más frecuente de la media
geométrica es el de promediar variables tales
como porcentajes, tasas, números índices.
etc., es decir, en los casos en los que se
supone que la variable presenta variaciones
acumulativas.
Para datos originales

Para datos agrupados


EJERCICIO
DATOS ORIGINALES
• Suponga que tenemos 5 observaciones cuyos
valores son:
X1 = 3
X2 = 8
X3 = 9
X4 = 7
X5 = 6

Calcular la media geométrica.


EJERCICIO
DATOS AGRUPADOS
• Suponga que tenemos 10 observaciones cuyos
valores son:
X1 = 2
X2 = 6
X3 = 3
X4 = 3
X5 = 4
X6 = 2
X7 = 5
X8 = 4
X9 = 3
X10 = 2

Calcular la media geométrica.


MEDIA GEOMÉTRICA
𝑛 𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜
𝐺= −1
𝑉𝑎𝑙𝑜𝑟 𝑎𝑙 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑖𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑖𝑜𝑑𝑜

• Suponga que la población de un lugar en 1980


fue de 2 personas, y el número estimado para
1990 es 22. ¿Cuál fue el incremento porcentual
promedio anual estimado? R=27,09%

• Una producción se incrementó de 23,000


unidades en 1971 a 120.520 unidades en 1991.
Obtenga la media geométrica del incremento
porcentual anual. R=8,63%
MEDIA ARMÓNICA
• Obsérvese que la inversa de la media
armónica es la media aritmética de los
inversos de los valores de la variable. Se suele
utilizar para promediar variables tales como
productividades, velocidades, tiempos,
rendimientos, cambios, etc.
Para datos originales

Para datos agrupados


Ejemplo
Supóngase que en una carrera de automóviles
de relevos, 3 pilotos condujeron 3.000
kilómetros, es decir 1.000 kilómetros cada uno,
con las siguientes velocidades promedio:
Velocidad
Conductor promedio
(km/h)
A 100
B 120
C 140

Hallar la velocidad promedio.


EJERCICIO
• Suponga que tenemos 5 observaciones cuyos
valores son:
X1 = 11
X2 = 13
X3 = 10
X4 = 12
X5 = 11

Calcular la media armónica.


EJERCICIO
DATOS AGRUPADOS
• Suponga que tenemos 10 observaciones cuyos
valores son:
X1 = 8
X2 = 4
X3 = 7
X4 = 4
X5 = 7
X6 = 8
X7 = 8
X8 = 6
Calcular la media armónica.
X9 = 6
X10 = 5
LA MEDIANA
• La mediana de un conjunto de datos es un
valor tal, que cuando escribimos todos los
datos ordenados de menor a mayor ocupa el
lugar central de la lista ordenada. Si el número
de datos es impar, la mediana es el dato
central; si el número de datos es par, la
mediana es la media de los dos datos
centrales.
EJEMPLOS DATOS ORIGINALES
X1= 14
X2= 15
X3= 12
X4= 5
Número impar de observaciones. X5= 9
X6= 6
X7= 11

X1= 27
X2= 38
X3= 23
Número par de observaciones. X4= 28
X5= 36
X6= 39
X7= 35
X8= 26
PASOS A SEGUIR EN EL CÁLCULO DE LA
MEDIANA DATOS AGRUPADOS
1) Obtener las frecuencias absolutas acumuladas.
2) Buscar la mitad de las observaciones, por medio
de n/2.
3) Localizar el resultado anterior n/2 en las
columnas de las frecuencias absolutas
acumuladas. Si no aparece, se toma el valor
inmediatamente anterior y se simboliza con Nj-1
y al inmediatamente superior por Nj.
4) Casos.
CASOS DATOS AGRUPADOS

CASO A
• Variables discretas
Ó

CASO B

CASO A

Ó
• Variables continuas
CASO B
EJERCICIOS
• Variables discretas, caso a:
Yj nj Nj
0 2 2
1 3 5
2 6 11
3 5 16
4 4 20

• Variables discretas, caso b:


Yj nj Nj
0 2 2
1 3 5
2 5 10
3 6 16
4 4 20
EJERCICIOS
• Variables continuas, caso a:
Y´j-1 Y´j ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 5 10
14,1 18 6 16
18,1 22 4 20

• Variables continuas, caso b:


Y´j-1 Y´j ni Ni
2,1 6 2 2
6,1 10 3 5
10,1 14 6 11
14,1 18 5 16
18,1 22 4 20
LA MODA
• La moda es el valor de la variable que más
veces se repite, y en consecuencia, en una
distribución de frecuencias, es el valor de la
variable que viene afectada por la máxima
frecuencia de la distribución.
EJERCICIOS
• Datos originales:

Calcula la moda los


siguientes datos:

14 25 14 8 22 14 14 14 13 21 15
EJERCICIOS
• Datos agrupados:
Variables discretas
Yj nj
0 2
1 3
2 6
3 5
4 4
Variables continuas

Y´j-1 Y´j ni Yi
𝑑1
𝑀𝑂 = Ý𝑗−1 + 𝐶 2,1 6 2 4,05
𝑑1 + 𝑑2
6,1 10 3 8,05
10,1 14 5 12,05
14,1 18 6 16,05
18,1 22 4 20,05

Ý𝑗−1 =limite inferior de la clase modal (la clase que contiene la moda)

d1 = la diferencia entre la frecuencia de la clase modal y la frecuencia


de la clase anterior

d2 = la diferencia entre la frecuencia de la clase modal y la frecuencia


de la clase siguiente

Вам также может понравиться