Вы находитесь на странице: 1из 197

PRESENTACIÓN

• CURSO: ESTADÍSTICA BÁSICA


• PROFESORA: ANNE E. ANICETO CAPRISTÁN
• TÍTULO : LIC. EN ESTADÍSTICA
• GRADOS:
BACHILLER: CIENCIAS FÍSICAS Y MATEMÁTICAS
MAESTRIA: DOCENCIA UNIVERSITARIA
MAESTRIA: BIOESTADÍSTICA (Estudios concluidos)
MAESTRIA:INGENIERÍA INDUSTRIAL (Estudios concluidos)
• EXPERIENCIA DOCENTE: 21 AÑOS
• CORREO: anneanicetoc@hotmail.com
• AULA VIRTUAL: aaniceto

Mg. Anne Aniceto C. 1


ESTADÍSTICA BÁSICA
PRIMERA FASE:
• VARIABLES,POBLACION Y MUESTRA
• ESTADISTICA DESCRIPTIVA
• RESUMEN DE DATOS MEDIANTE
INDICADORES
• TABLAS BIDIMENSIONALES
• REGRESIÓN Y CORRELACION
• PROBABILIDADES.
Estadística
Ciencia que proporciona métodos que permiten:
recolectar, resumir, clasificar, analizar, interpretar y
predecir el comportamiento de los datos o
informaciones numéricas de una o más características
de un estudio, con el propósito de apoyar la adecuada
toma de decisiones.

Es la ciencia de reunir, organizar, presentar,


analizar é interpretar datos, para apoyar la toma de
decisiones.

Mg. Anne Aniceto C. 3


ANALOGÍAS
Métodos Estadísticos
Tecnología

Materia
Datos prima

Proceso
Procesode
deproducción
producción Producto Estadístico
Producto
(Descriptivo ó inferencial)

Maquinaria
Computadoras
Investigador
Mano de obra

Mg. Anne Aniceto C. 4


Clasificación de la Estadística

Estadística

Descriptiva Inferencial

Mg. Anne Aniceto C. 5


Mg. Anne Aniceto C. 6
Estadística Descriptiva
Es un conjunto de métodos utilizados para organizar, resumir y
presentar datos de manera informativa. La estadística
descriptiva utiliza:
- Medidas de descripción numéricas
- Técnicas gráficas

Ejemplo 1: En el semestre 2014-II, el 18% de los alumnos


matriculados en la Universidad Nacional del Callao son de la
Escuela de Ingeniería.
Ejemplo 2: El promedio final de los estudiantes que llevaron el
curso de Estadística en el semestre 2014-II fue de 12.9

Mg. Anne Aniceto C. 7


Estadística Inferencial
Es un conjunto de métodos que permiten efectuar una
estimación, predicción o generalización sobre una
población, basado en el análisis de datos de una
muestra.
Ejemplo 1: En investigaciones de opinión: Los canales
de TV o radio, ponen sus líneas telefónicas a
disposición del publico, para averiguar la opinión de los
televidentes sobre temas de actualidad.
Ejemplo 2: En el control de calidad de productos, la
industrias obtienen datos del número (proporción) de
defectos de sus productos, inspeccionando una
muestra representativa de éstos.
Mg. Anne Aniceto C. 8
Muestreo:
Proceso mediante el cual se
Población: obtienen los datos que conforman
Conjunto de todas las unidades elementales la muestra.
(individuos u objetos), a partir de las cuales se
desea obtener cierto tipo de información
(universo).

POBLACION
Muestra:
Subconjunto de la población. Conjunto
de unidades elementales que son
objeto de observación.

Parámetro:
Es una característica o
índice estadístico obtenido Estadígrafo o MUESTRA
de toda una población. estadístico:
Generalmente es Es una característica
desconocido y se desea obtenida de una
estimar. muestra.
Unidad de análisis(Unidad elemental). Es aquel (individuo ú objeto) a la que se le aplica el
Mg. Anne Aniceto C. 9
instrumento de medición.
Definiciones Básicas
 Población, es la colección de todos los elementos
(individuos u objetos) que poseen al menos una
característica en común.
 Parámetro, es una medida resumen (constante) que
describe una característica de toda una población; para
determinar su valor es necesario utilizar toda la
información de la población (censo).
 Unidad de Análisis o unidad elemental, es el elemento
(individuo u objeto) de la población que posee las
características que se van a estudiar o analizar.
Mg. Anne Aniceto C. 10
Mg. Anne Aniceto C. 11
Población
Muestra
Parámetro
Estadígrafo

Mg. Anne Aniceto C. 12


PARÁMETRO
Es una medida usada para describir alguna
característica de una población.
Para determinar su valor es necesario usar la
información de la población completa (Censo).
Los más usados son:
Media poblacional ()
Proporción poblacional (π)
Varianza poblacional (2)
Mg. Anne Aniceto C. 13
Definiciones Básicas
Muestra, es un subconjunto o parte de la
población que será objeto de observación. Las
muestras se diseñan y seleccionan mediante
un procedimiento llamado muestreo.
Estadígrafo, es un valor que resume y
describe información contenida en una
muestra

Mg. Anne Aniceto C. 14


ESTADÍGRAFO

Es una medida usada para describir alguna


característica de la muestra.
Su valor es usado con propósitos de estimación
de los parámetros de una población, de la cual se
extrajo la muestra.
Los más usados son:
Media muestral ( X )
Proporción muestral (p)
Varianza muestral ( S2 )
Mg. Anne Aniceto C. 15
Cálculo del
Tamaño de
Muestra
Prueba
de hipótesis Muestreo

VARIABLES

Presentación Recolección
de datos de datos

Procesamiento
de datos

Mg. Anne Aniceto C. 16


VARIABLES

Es una característica de los elementos de la


población que se va investigar y que toma diferentes
valores o categorías.

Variable

Cualitativa Cuantitativa

Nominal Ordinal Discreta Continua

Mg. Anne Aniceto C. 17


VARIABLES
CUALITATIVAS
 Una variable cualitativa (atributo) indica a qué grupo o a qué
categoría pertenece una observación. Todo lo que podemos hacer
es calcular la proporción de datos que están en cada categoría.
Pueden ser nominales u ordinales.
Una variable cualitativa es nominal si se expresa en escala
nominal (diferencias). No puede establecerse un orden entre
sus observaciones o categorías.
Ej.: Estado civil, sexo, color, giro o actividad económica.
Una variable cualitativa es ordinal (Jerárquica) si se expresa en
escala ordinal (orden). Puede establecerse un orden entre sus
observaciones o atributos
Ej.: Sector socio económico, grado de instrucción, calidad de
servicio,

Mg. Anne Aniceto C. 18


Variables Cualitativas:
Representación Gráfica
 Algunas de las representaciones más utilizadas para variables
categóricas.

Gráfico polar o de
Gráfico de barras
sectores circulares

Mg. Anne Aniceto C. 19


VARIABLES
CUANTITATIVAS
 Una variable cuantitativa toma valores numéricos
sobre los cuales podemos realizar operaciones
aritméticas. Pueden ser discretas o continuas.
Una variable cuantitativa es discreta, si toma solo un
número contable de valores. Relacionado con los
números enteros.
Una variable cuantitativa es continua, si toma un
número incontable (no contable) de valores.
Relacionado con los números reales.

Variable discreta Variable continua

3 ... 0 1/16 1/4 1/2 1


0 1 2 Mg. Anne Aniceto C. 20
ESCALAS DE MEDICIÓN

ESCALA VARIABLES ESCALA


NOMINAL CUALITATIVAS ORDINAL

Mg. Anne Aniceto C. 21


ESCALAS DE MEDICIÓN

Escala nominal: Los datos se pueden agrupar


en categorías que no mantienen una relación
de orden entre si, por lo tanto no están
definidas las operaciones lógicas (>, <, , )
sino solo presentan una relación de diferencia.
Ejemplos: color de ojos, sexo, profesión,
estado civil, religión.

Mg. Anne Aniceto C. 22


ESCALAS DE MEDICIÓN
Escala ordinal: Existe un orden o jerarquía
entre las categorías (>, <, , ) y una relación
de diferencia.
Ejemplos: Grados militares, organigrama de
una empresa, escalafón de los profesores
universitarios, grados de disnea, estadios de
un tumor.

Mg. Anne Aniceto C. 23


ESCALAS DE MEDICIÓN

ESCALA DE VARIABLES ESCALA DE


INTERVALO CUANTITATIVAS RAZÓN

Mg. Anne Aniceto C. 24


ESCALAS DE MEDICIÓN
Escala de Intervalo: Valores numéricos de las
variables y presentan relaciones de orden (>, <,
, ), diferencia y tienen sentido las operaciones
de suma y resta. Tiene dos propiedades:
Existe una unidad de medida que se mantiene
constante para todos los valores que toma la
variable.
Existe un valor patrón u origen relativo que
no significa la ausencia de valor en la variable.
Ejemplo: temperatura, movimientos sísmicos.
Mg. Anne Aniceto C. 25
ESCALAS DE MEDICIÓN
Escala de razón o proporción: es la más
completa y general de todas las escalas. Se
caracteriza porque los valores de la variable son
números entre los cuales, además de las
relaciones de orden (>, <, , ), diferencia y
distancia (+,-), se pueden establecer múltiplos y
proporciones (x , ÷ ).
Ejemplos: peso, altura, volumen.

Mg. Anne Aniceto C. 26


Ejemplos
Variables Cuantitativas Variables cualitativas
Datos cuantitativos Datos categóricos

Persona Edad ingreso Artículo Calidad del artículo


1 55 7587.35 1 Def.
2 42 6832.55 2 No def.
. . . 3 Def.
. . . . .
. .
Individuo Aumento de peso Opinión Calidad
1 +10 Servicio
2 +5 1 Excelente
3 -3 2 Muy bueno
. . 3 Bueno
. . . .
. .
Mg. Anne Aniceto C. 27
Unidad de análisis /
Variable
Unidad de análisis Variable (Característica)

- Persona - Salario, cargo, ocupación, edad, sexo, estado


civil.
- Familia - Ingreso familiar, consumo familiar, propiedad
de la vivienda, número de miembros, número
de hijos.
- Negocio - Consumo de energía, número de unidades
producidas, actividad económica, inversión
anual, número de trabajadores, volumen de
ventas, valor en la bolsa.
- Hogar - Color de la fachada, área techada, número de
habitaciones, número de moradores, material
usado en su construcción.
Mg. Anne Aniceto C. 28
EJEMPLOS
- Si el estudio está interesado por la cantidad de unidades producidas
por día.
U. Análisis : Cada unidad producida por día
Variable : Número de unidades producidas por día.
Tipo : Discreta (Número entero)
Dato : 15, 0, 12, 19, etc.
Estadístico : Número promedio de unidades producidas por día
(muestra).
Decimos: “En promedio se producen 12.8 unidades por día”.
- Si el estudio está interesado por el ingreso mensual de los
trabajadores.
Variable : Ingreso mensual de los trabajadores
Tipo : Continua (Número Real)
Dato : $3500.00, $2827.35, $3743.50, etc.
Estadístico : Ingreso promedio mensual de los trabajadores (muestra).
Decimos: “El ingreso promedio mensual de los trabajadores es
$3255.17”
Mg. Anne Aniceto C. 29
EJEMPLOS

- Si el estudio está interesado en el género de los consumidores de


gaseosas.
U. Análisis : Cada consumidor de gaseosas
Variable : Género (Sexo) del consumidor de gaseosas
Tipo/Sub tipo : Cualitativa Nominal (atributo de la persona)
Dato : Hombre, mujer
Estadístico : Porcentaje de consumidores de gaseosas según sexo (en
la muestra).
Su valor es: 40% Hombres – 60% Mujeres (Por ejemplo)
- Si el estudio está interesado en la calidad del servicio que brinda un
restaurante
U. Análisis : Cada restaurante
Variable : Calidad del servicio brindado por el restaurante
Tipo : Cualitativo Ordinal (atributo del restaurante)
Dato : Excelente, bueno, regular ó malo
Estadístico : Porcentaje de clientes según su opinión sobre la calidad del
servicio que brinda el restaurante (en la muestra).
Su valor es: 20% Excelente – 55% Bueno
15%
Mg. Anne Regular
Aniceto C. - 10% Malo 30
Fases del método estadístico
• Planeamiento
• Recopilación de datos
• Clasificación, tabulación y presentación
de los datos
• Interpretación y análisis
• Conclusión

Mg. Anne Aniceto C. 31


Fuentes de Datos
FuentesdeDatos

Primarias Secundarias

Experimentos Observación Censos Encuestas

Mg. Anne Aniceto C. 32


Aplicaciones en
los Negocios
Hay varias áreas donde el uso de la estadística es muy
notoria:
● Marketing e investigación de Mercados y de
opinión.
● Control de calidad
● Diseño y análisis de experimentos
● Pronósticos económicos para planeación
estratégica
● Investigación de operaciones .
● Presentación de resultados
Mg. Anne Aniceto C. 33
EL PPROBLEMA DE LA ESTADISTICA

• •
• • • ••
•• •
Muestra • •• •
Problema Representativa
Mide Variables
Identifica
Población
• • Describe muestra, gráficas,
• • • estadísticas
• • • •
• •• • • • • •
•• •
• • • • • Efectúa pruebas Construye intervalos
• • • • • • de hipótesis de confianza
• • • •
• • • • ••
• • ••• • Toma decisiones
Estima parámetros
sobre parámetros
Identifica parámetros, variables.
Selecciona tamaño de muestra,
significancia, confiabilidad.
Resuelve problema
Diseña experimento, plan de muestreo
Mg. Anne Aniceto C. 34
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
Donde:
n: Es el tamaño de la muestra.
N: Tamaño de la población.
Z: Factor de confiabilidad. Es 1,96 cuando se tiene un
nivel de confianza del 95% (valor de distribución
normal estandarizada correspondiente al nivel de
confianza escogido).
S2 : Varianza obtenida por antecedentes o prueba piloto
d: Es el margen de error permisible. Establecido por el
investigador.
Mg. Anne Aniceto C. 35
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
1). Para variables cuantitativas, la varianza (S2) es
conocida o se estima a través de una muestra piloto.
a) Para poblaciones infinitas o tamaños de población
desconocida: 2 2
Z S
n 2
d
b) Para poblaciones finitas o conocidas:
2 2
NZ S
n 2
d ( N  1)  Z S
2 2

Mg. Anne Aniceto C. 36


ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

2)Para variables cualitativas, la proporción (P) es


conocida por antecedentes o muestra piloto:
a) Tamaño de la población N es desconocida.
2
Z PQ
n 2
d
b) Tamaño de la población N es conocida:
2
NZ PQ
n 2
d ( N  1)  Z PQ
2

Mg. Anne Aniceto C. 37


ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
Ejemplo: Estimar el tamaño de la muestra para un
estudio sobre satisfacción , para una población
de 120 estudiantes de primer año de estudios
generales de la UNAC.
120(1,96) 2 (0,5)(0,5)
n
N= 120 (0,1) 2 (120  1)  (1,96) 2 (0,5)(0,5)

Z=1,96 (para un nivel de confianza al 95%).


P= 0,5 Q= 1-P = 0,5 115,248
n  53,59
d = 0,1 2,1504
Mg. Anne Aniceto C. 38
ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA

Donde:
n: Es el tamaño de la muestra.
N: Tamaño de la población.
Z: Factor de confiabilidad. Es 1,96 cuando se tiene un
nivel de confianza del 95% (valor de distribución
normal estandarizada correspondiente al nivel de
confianza escogido).
P = 0,5
Q = 1-P = 0,5
d: Es el margen de error permisible. Establecido por el
investigador.
Mg. Anne Aniceto C. 39
Tipos de Muestreo

Probabilístico No
(Aleatorio) Probabilístico

Accidental
Aleatorio Simple

Sistemático Por conveniencia

Estratificado Por cuotas

Por conglomerados Bola de Nieve


Mg. Anne Aniceto C. 40
Técnicas de
muestreo
MUESTREO
• El muestreo es el proceso mediante el cual el
investigador podrá seleccionar las unidades
estadísticas o sujetos de estudio a partir de la
muestra calculada previamente.
• Si el muestreo no se realiza con criterio, los
resultados de la investigación no serán válidos,
ya que se pueden cometer errores de sesgo o de
imparcialidad al momento de elegir los sujetos o
elementos.

Mg. Anne Aniceto C. 41


Técnicas de muestreo

Muestreo Probabilístico

También se conoce como muestreo aleatorio, la


característica de este muestreo es que todos los
sujetos de la población de estudio tienen la misma
probabilidad de ser seleccionados para formar
parte de la muestra.

Mg. Anne Aniceto C. 42


Mg. Anne Aniceto C. 43
Técnicas
de muestreo
1. Muestreo Aleatorio Simple (MAS)
- Cada unidad tiene igual probabilidad de ser incluida en la
muestra.
- Lista de todos los individuos de la población de estudio: “marco
muestral”.
- Selección al azar (tablas de números aleatorios, calculadoras,
software).

Procedimiento
1. Elaborar el listado de personas o elementos (Población de
estudio) sin ningún ordenamiento en particular.
2. Generar tantos números aleatorios como el tamaño de la
muestra (n). Cuyos valores deben estar entre 1y N.
3. Elaborar el listado de la muestra, seleccionando los
elementos de acuerdo con la ubicación proporcionada por los
números aleatorios.

Mg. Anne Aniceto C. 44


Técnicas de muestreo

1. Muestreo Aleatorio Simple (MAS)

Mg. Anne Aniceto C. 45


Técnicas de muestreo

2.- Muestreo Sistemático


Se selecciona individuos del marco muestral a
intervalos regulares., no se dispone de un marco
muestral
Ejemplo
5, 10, 15, 20, 25, ............

Lleva a sesgo de selección si el marco muestral está


distribuido siguiendo algún patrón particular.

Mg. Anne Aniceto C. 46


Técnicas de muestreo

2.- Muestreo Sistemático

Mg. Anne Aniceto C. 47


Mg. Anne Aniceto C. 48
Técnicas de muestreo

3. Muestreo Estratificado
Procedimiento:

1. Determinar la característica de los estratos o la


composición de los estratos.
2. Si se conoce el porcentaje de los estratos, distribuir
porcentualmente el tamaño de muestra en los estratos.
3. Si se conoce la cantidad de individuos en cada estrato, se
calcula el factor de proporción con la siguiente fórmula:
K = n/N.
4. El cual se multiplica por la cantidad respectiva en los
estratos.
5. Seleccionar aleatoriamente los individuos en cada estrato.
6. Elaborar la lista de la muestra por cada estrato

Mg. Anne Aniceto C. 49


Técnicas de muestreo

Ejm. Se desea investigar que proporción de alumnos tiene


Internet en casa según características socioeconómicas
familiares del colegio secundario “Renovación” que tiene 830
alumnos distribuidos en 19 secciones. Si el tamaño muestral es
de 263 alumnos que técnica de muestreo utilizaría?

Datos:
N = 830
n = 263 alumnos
Distribuir la muestra por años de estudio y utilizamos la técnica
de muestreo aleatorio estratificado. Donde:
n
K
N Mg. Anne Aniceto C. 50
Población y muestra de alumnos del colegio secundario
“Renovación” por años de estudio del 2005
Años de estudio Secciones Nº alumnos Tamaño de la muestra (n)

1º A NA=44 nA=14
n * N1 263* 213
N1= 213 B 42 13 n1    67.49  68
N 830
C 42 68 13

D 44 14
n1 * N A 68 * 44
nA    14
E 41 14

2º A 44 13 N1 213
N2= 181 B 46 15

C 46 57 15

D 45 14

3º A 42 13

N3= 62 B 40 13

C 42 51 13

D 38 12

4º A 48 15

N4=140 B 46 44 14

C 46 15

5º A 44 14

N5= 134 B 46 43 15

C 44 14

Total 19 N = 830
Mg. Anne
n=263
Aniceto C. 51
Mg. Anne Aniceto C. 52
Técnicas de muestreo

4. Muestreo por conglomerados

También se denomina de etapas múltiples.


Se utiliza para poblaciones grandes y dispersas, dentro de cada
conglomerado debe haber mucha variabilidad y entre ellos deben
ser parecidos.
No es posible disponer de un listado de las unidades de estudio .
En lugar de individuos se seleccionan conglomerados que están
agrupados de forma natural (cuadras de casas, departamentos,
hospitales, provincias, etc.)
Se selecciona en primer lugar una muestra de conglomerados , a
partir de estos se selecciona un subgrupo. A partir de este
subgrupo se selecciona otro subgrupo y así sucesivamente, hasta
llegar a las unidades de análisis.

Mg. Anne Aniceto C. 53


4.Muestreo por conglomerados

Mg. Anne Aniceto C. 54


Ejemplo
En una investigación en la que se trata de conocer el grado
de satisfacción laboral los profesores de instituto
necesitamos una muestra de 700 sujetos. Ante la dificultad
de acceder individualmente a estos sujetos se decide hacer
una muestra por conglomerados. Sabiendo que el número de
profesores por instituto es aproximadamente de 35, los
pasos a seguir serían los siguientes:
1. Recoger un listado de todos los institutos.
2. Asignar un número a cada uno de ellos.
3. Elegir por muestreo aleatorio simple o sistemático los 20
institutos (700/35=20) que nos proporcionarán los 700
profesores que necesitamos

Mg. Anne Aniceto C. 55


Técnicas de muestreo

 MÉTODOS DE MUESTREO ALEATORIO


SIMPLE SISTEMÁTICO CONGLOMERADOS
ESTRATIFICADO
i Tamaño: n = 40 i Tamaño: n = 40 i Divide
i Listado : N
ii Tabla números subgrupo
ii Rango: N/n = 600/40= 15 ii Tamaño: n
aleatorios ii Elige al azar
iii Tabla números aleatorios iii Divide N subgrupo
iii Listado : N
iv Listado : N iii muestra n
1
1 1º 3 NA
nA
2 2 2º18 NB nB
3 3º33 NC nC
3 4
4 n
600
600

Mg. Anne Aniceto C. 56


Técnicas de muestreo

Muestreo No Probabilístico

No existe el criterio de que todos los sujetos tengan


la misma posibilidad de ser elegidos para formar
parte de la muestra, ya que en este tipo de muestreo
hay uno o más Criterios de decisión por parte del
investigador para que un determinado sujeto pueda o
no formar parte del estudio.

Mg. Anne Aniceto C. 57


Técnicas de muestreo

1. Muestreo Accidental

Se hace sobre la base de la presencia o no, en un


lugar y momento determinados.
Aunque se parece a un muestreo probabilístico, no
todas las personas tienen la misma probabilidad de
estar en el momento y lugar donde se seleccionan a
los sujetos.

Ejemplo: Entrevistar a los primeros 50 transeúntes


que pasan en una calle

Mg. Anne Aniceto C. 58


Mg. Anne Aniceto C. 59
Técnicas de muestreo

2. Muestreo por conveniencia


El investigador decide en base a los conocimientos de la
población, quienes son los que deben formar parte de la
muestra.
Se tiene en cuenta los criterios de inclusión y exclusión, los
cuales deben estar bien establecidos y se deben cumplir
rigurosamente.
Ejemplo: El caso más frecuente de este procedimiento es el
utilizar como muestra individuos a los que se tiene fácil acceso
(los profesores de universidad emplean con mucha frecuencia a
sus propios alumnos). Un caso particular es el de los voluntarios.

Mg. Anne Aniceto C. 60


Mg. Anne Aniceto C. 61
Técnicas de muestreo

3. Muestreo por cuotas


La muestra se selecciona tomando en cuenta
características (variables) específicas de la
población.
Tiene similitud con el muestreo estratificado solo
que en este caso la selección dentro de cada cuota
(estrato) se hace de manera accidental.
Generalmente se usa para encuestas de opinión y
mercado.
Ejemplo: encuesta de gustos y preferencias en un
supermercado
Mg. Anne Aniceto C. 62
Mg. Anne Aniceto C. 63
Técnicas de muestreo

4. Muestreo por “Bola de Nieve”


Se utiliza cuando la población es de difícil acceso por
razones sociales (prostitutas, alcohólicos,
drogadictos, etc.)
En este caso se contacta con una persona del grupo a
estudiar, puede ser el líder de una pandilla, el amigo
de un colaborador, etc. Y a partir de éste se poco a
poco
se va llegando a un número mayor de individuos. Este
tipo se emplea muy frecuentemente cuando se hacen
estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc.
Mg. Anne Aniceto C. 64
Mg. Anne Aniceto C. 65
ESTADISTICA DESCRIPTIVA
ORGANIZACIÓN Y PRESENTACION DE DATOS

Primer caso:

 Datos cualitativos (Categóricos)

Segundo caso:

 Datos cuantitativos discretos, con pocos valores


distintos

Mg. Anne Aniceto C. 66


Mg. Anne Aniceto C. 67
¿Por qué es necesaria la estadística descriptiva?
La estadística descriptiva es necesaria, porque
proporciona métodos y procedimientos que permiten
la producción de información acerca de lo que ocurre
en la población (estudios de las distribuciones de
frecuencias).

Objetivos:
 Descripción Gráfica
 Descripción Numérica

Mg. Anne Aniceto C. 68


Organización y Presentación de
Datos

• Determinar si la variable es Cualitativa o


Cuantitativa.
• Construir la tabla de distribución de frecuencias, l
dependiendo del tipo de variable.
• construir el gráfico adecuado .

Mg. Anne Aniceto C. 69


Distribución de frecuencias
 La distribución de frecuencias se construye según el
tipo de variable:

 Variables cualitativas: Cada categoría es una clase.

Pocos valores distintos: Cada


valor es una clase.
Discreta Muchos valores distintos:
Varios valores se agrupan en
una clase, con [ , )
Continua: Varios valores se
agrupan en una clase, con [ , )

Mg. Anne Aniceto C. 70


Variables Cualitativas

Variable fj hj
C1 f1 h1
C2 f2 h2
... ... ...
Ck fk hk

Mg. Anne Aniceto C. 71


Variables cualitativas: Tabla de
distribución de frecuencias
k
Propiedades f
j 1
j  f 1  f 2  ....  f k  n
fj
hj  ; j  1,2,....,n
n
k

h
j 1
j  h1  h2  .... hk  1

p j  h j * 100% ; j  1, 2 ,...., k
k

p
j 1
j  p1  p2  .... pk  100

Mg. Anne Aniceto C. 72


Representación Gráfica.
Para representar gráficamente la distribución de
frecuencias de una variable cualitativa, por lo
general se utilizan las Gráficas de Barras y las
Gráficas de sectores Circulares.

Nota : Cuando trabajamos con variables


nominales, las categorías pueden ser colocadas en
orden alfabético; sin embargo, cuando se trata
de variables ordinales, las categorías deberán
ser colocadas en orden jerárquico.

Mg. Anne Aniceto C. 73


Ejemplo:
En una planta embotelladora se registraron 54
accidentes personales en el último trimestre. El
gerente de producción entre otras cosas, está
interesado en determinar la parte del cuerpo que
resultó lesionada o afectada. Al tomar la
información, se determinó que las partes del cuerpo
lesionadas o más afectadas fueron: dedos (D), ojos
(O), brazos (B) y piernas (P);

Mg. Anne Aniceto C. 74


Cuadro 1
Parte del cuerpo lesionada al producirse el
accidente
D D B P B B
D D D P D O
D P D O D P
O B B O B D
D B B D O B
P B P D D P
D P D D P B
D D D B O P
B P B O D D
Mg. Anne Aniceto C. 75
Número de Proporción de
Parte Lesionada Accidentes accidentes
(fj ) (hj)
Brazos
Dedos
Ojos
Piernas
Total

Mg. Anne Aniceto C. 76


Número de Proporción de
Parte Lesionada Accidentes accidentes
(fj ) (hj )

Brazos 14
Dedos 22
Ojos 7
Piernas 11
Total 54
k

f
j 1
j n
Mg. Anne Aniceto C. 77
fj
h j  ; j  1,2,....,n
n

Número de Proporción de
Parte Lesionada Accidentes accidentes
(fj ) (hj )

Brazos 14 0.259
Dedos 22 0.407
Ojos 7 0.130
Piernas 11 0.204
Total 54 1.000
k

h
j 1
j 1
Mg. Anne Aniceto C. 78
h j %  h j *100%; j  1,2,....,n

Número de Porcentaje de
Parte Lesionada Accidentes accidentes
(fj) (hj%=pj)

Brazos 14 25.9%
Dedos 22 40.7%
Ojos 7 13.0%
Piernas 11 20.4%
Total n = 54 100.0%
k

p
j 1
j  1 00

Mg. Anne Aniceto C. 79


Representación gráfica:
Gráfico de Barras
Accidentes ocurridos en la planta
Según parte lesionada
25
22

20

15 14
Count

11
10
7

0
Brazo Dedos Ojos Pierna
Parte Lesionada

Mg. Anne Aniceto C. 80


Representación gráfica:
Gráfico Circular
Accidentes ocurridos en la planta
Según parte lesionada
Category
Pierna
11, 20.4% Brazo
Dedo
Ojo
Pierna

Ojo
7, 13.0%
Brazo
14, 25.9%

Dedo
22, 40.7%

Mg. Anne Aniceto C. 81


• Variables Cuantitativas Discretas
Tabla de distribución de frecuencias
Variable fj hj Fj Hj

X1 f1 h1 F1=f1 H1=h1

X2 f2 h2 F2=f1+f2 H2=h1+h2

..... ... ... ... ...


Xk fk hk Fk=n Hk=1

Mg. Anne Aniceto C. 82


Ejemplo
Los siguientes datos corresponden al
número de trabajadores ausentes por día,
en los últimos 20 días laborales de la
empresa “Milenium”.

2 1 2 4 1
3 2 3 2 0
3 2 1 3 2
3 3 1 2 4
Mg. Anne Aniceto C. 83
Valor de X Frecuencia Frecuencia Frecuencia Frecuencia
Xj absoluta Relativa Absoluta Relativa
fj hj Acumulada Acumulada
(Número de
Ausencias) (Número (Proporción Fj Hj
de Días) de días)
0
1
2
3
4
Total
Mg. Anne Aniceto C. 84
Número Número Proporción
de de Días de días
j Ausencias Fj Hj
Xj fj hj
1 0 1 0.05 1 0.05
2 1 4 0.2 5 0.25
3 2 7 0.35 12 0.6
4 3 6 0.3 18 0.9
5 4 2 0.1 20 1.0
---- Total 20 1.0 ---- ----

Mg. Anne Aniceto C. 85


Representación gráfica:
Gráfico de Barras

Mg. Anne Aniceto C. 86


Gráfico de Barras – Líneas
de Proyección

Mg. Anne Aniceto C. 87


Representación gráfica de Hj% ó Pj
Gráfico de Barras – Líneas de Proyección

Mg. Anne Aniceto C. 88


Organizacion y Presentación de
Datos
 Datos discretos con muchos valores
distintos
 Datos continuos

- Varios valores se agrupan en una clase –


(intervalos de clase)

Mg. Anne Aniceto C. 89


Ejemplo:
Para ilustrar el procedimiento, supongamos que
contamos con los resultados de una encuesta a un
grupo de 35 clientes del supermercado PLAZA, a
quienes se les consultó lo siguiente:

- Razones por la que acuden a dicho supermercado


- Número de visitas que realizan por semana a dicho
supermercado
- Gasto (aproximado) que realizan en cada visita a
dicho supermercado

Mg. Anne Aniceto C. 90


Clientes del supermercado Plaza.
Razones Visitas Gasto
Razones Visitas Gasto
4 1 79.1
3 1 30.0
4 3 82.7
2 2 35.3
1 7 84.3
5 1 48.4
2 1 86.0
3 2 50.1
4 5 90.3
2 1 55.3
3 6 95.2
4 2 57.2
5 1 100.1
1 1 58.1
4 2 101.2
5 1 60.4
3 4 102.2
1 2 65.3
5 1 103.4
4 1 66.0
4 2 104.3
5 3 68.0
3 4 110.1
4 1 69.1
5 1 115.3
2 3 70.2
4 3 118.4
1 3 72.5
3 2 119.1
4 1 73.1
4 1 125.1
2 4 75.3
3 3 130.2
5 4 77.2 Mg. Anne Aniceto C. 91
3 1 140.0
Descripción de la columna 1: Razones por
las que acude al supermercado

Razones (Columna 1) Código

Aire acondicionado 1

Guardería 2

Ofertas permanentes 3

Playa de estacionamiento 4

Tarjeta de crédito 5

Mg. Anne Aniceto C. 92


PASOS PARA CONSTRUIR TABLA DE FRECUENCIAS
1) Usar la Regla de Sturges: K=1+3.3*log(n) y 5 ≤ k ≤15.
(Redondear al entero más cercano).
2) Calcular la amplitud, rango o recorrido ( R )
R=Valor máximo - Valor mínimo
3) Calcular Tamaño del Intervalo de Clase(TIC):TIC = R / k
(Redondear por exceso, a la cantidad de decimales que
tienen los datos).
4) calcular el Nuevo Rango: NR = TIC*k
5) Verificar que NR > R
6) Calcular el Nuevo Máximo: NM = Valor Mínimo + NR
Ingresar a Gráfica/Histograma. Representación Gráfica:
Procedimiento
Histograma: Conjunto de barras del mismo ancho pero diferente altura.
Mg. Anne Aniceto C. 93
Para nuestro ejemplo, los cálculos previos son:
1. Xmín = 30, Xmáx = 140
2. R = 110
3. K=1+3.3*log(35) = 6.09542  6
4. TIC = R/k 18.333  18.4
Nuevo Rango
Nuevo Máximo
5. 18.4*6 = 110.4 > 110.
6. Xmín + Nuevo Rango = 30 + 110.4 = 140.4

Mg. Anne Aniceto C. 94


Limite Limite Marca de
Inf. Sup. clase fj hj=fj/n Fj Hj=Fj/n

30 48.4 39.2 2 0.0571 2 0.0571

48.4 66.8 57.2 8 0.2286 10 0.2857

66.8 85.2 76.0 10 0.2857 20 0.5714

85.2 103.6 94.4 7 0.2000 27 0.7714

103.6 122.0 112.8 5 0.1429 32 0.9143

122.0 140.4 131.2 3 0.0857 35 1.0000

35 1.0000

Mg. Anne Aniceto C. 95


Histograma
10
10

8
8
7
Frequency

6
5

4
3

2
2

0
30.0 48.4 66.8 85.2 103.6 122.0 140.4
Gasto

Mg. Anne Aniceto C.


96
POLÍGONO DE FRECUENCIAS (ABSOLUTAS O
RELATIVAS)
Unión de los puntos medios (Marcas de clase) de las
bases superiores de las barras.
 Ventajas:
 Sencillez en su construcción.
 Esquema más claro del patrón de datos.
 A medida que crece el número de clases y
observaciones, el polígono se hace más suave
y curvo.
 El polígono de frecuencias relativas son
usados para comparar la distribución de
frecuencias de dos o más poblaciones.
Mg. Anne Aniceto C. 97
Polígono de frecuencias.

Mg. Anne Aniceto C. 98


Diagrama de cajas o
Box plot

En 1977, John Tukey publica un


método para representar
gráficamente cinco estadísticos
descriptivos.

Mg. Anne Aniceto C. 99


• BOXPLOT: Interpretación
• En la caja central,el Boxplot contiene el 50% de los
datos.
• La línea interior marca la mediana y los límites de la
caja son el primer y tercer cuartil.
• Si la mediana no equidista de los vértices, entonces
la distribución es asimétrica.
• Los puntos que quedan fuera del diagrama son datos
atípicos (outliers).

Mg. Anne Aniceto C. 100


Mg. Anne Aniceto C. 101
RESUMEN DE DATOS
• Posición
– Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
• Cuantiles, percentiles, cuartiles, deciles,...
• Centralización
– Indican valores hacia donde tienden agruparse los datos.
• Media, mediana y moda
• Dispersión
– Indican la mayor o menor concentración de los datos con respecto a
las medidas de centralización.
• Desviación típica, coeficiente de variación, rango, varianza
• Forma
– Asimetría
– Apuntamiento o curtosis
Mg. Anne Aniceto C. 102
Estadísticos de posición
• Percentiles de orden k = cuantil de orden k/100
– La mediana es el percentil 50
– El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

• Cuartiles: Dividen a la muestra en 4 grupos con frecuencias


similares.
– Primer cuartil = Percentil 25 = Cuantil 0,25
– Segundo cuartil = Percentil 50 = Cuantil 0,5 mediana
– Tercer cuartil = Percentil 75 = cuantil 0,75

Mg. Anne Aniceto C. 103


Gráfico de cajas y bigotes
Diagrama de cajas de Tukey: Resumen en 5 números

0.08
0.06
densidad

0.04
0.02

Mín. P25 P50 P75 Máx.


0.00

40 45 50 55 60 65

• Se grafica con 5 números:


Velocidad (Km/h) de 200 vehículos en ciudad

– Mínimo, máximo, cuartil 1 y 3 y valor mediano


– Suelen dar una buena idea de la distribución.
• La zona central, ‘caja’, contiene al 50% central de las
observaciones. Su tamaño se llama ‘rango intercuartílico’
(R.I.Q) RIQ = 𝑄3 − 𝑄1
• Es costumbre que ‘los bigotes’, no lleguen hasta los extremos,
sino hasta las observaciones que se separan de la caja en no
más de 1,5 R.I.Q
– Más allá de esa distancia se consideran datos anómalos.
Mg. Anne Aniceto C. 104
Estadísticos de centralización
Para datos sin agrupar

• Media Es la media aritmética (promedio) de los valores de una


variable. Suma de los valores dividido por el tamaño muestral.
– Media de 2,2,3,7 es (2+2+3+7)/4=3,5
x
 x
i i
– Muy sensible a valores extremos.
n
• Mediana Es un valor que divide a las observaciones en dos
grupos con el mismo número de individuos (percentil 50). Si el
número de datos es par, se elige la media de los dos datos
centrales. Es necesario ordenar los datos de menor a mayor.
– Mediana de 1,2,4,5,6,6,8 es 5
– Mediana de 1,2,4,5,6,6,8,9 es (5+6)/2=5,5
– No es sensible a valores extremos.
• Mediana de 1,2,4,5,6,6,800 es 5. La media es 117,7
• Moda Es el valor que mas se repite en el conjunto de datos.
Mg. Anne Aniceto C. 105
Para datos Agrupados

• Datos organizados en tabla


• Media aritmética
– si está en intervalos (variable continua) usar
como y i las marcas de clase. Si los datos están
tabulados como variable discreta usar x i .

x
 xf i i i
n
• Mediana Cuantil de orden α α=0,5 para el caso de
la mediana. Se determina el intervalo mediano con
αn
  n  Fi 1
C  Li 1  (ci )
fi
Mg. Anne Aniceto C. 106
Medidas de dispersión
Miden el grado de dispersión (variabilidad) de los
datos, independientemente de su causa.
• Amplitud o Rango:
Diferencia entre observaciónes extremas.
– 2,1,4,3,8,4. El rango es 8-1=7
– Es muy sensible a los valores extremos.
• 𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛

• Rango intercuartílico :
– Es la distancia entre primer y tercer cuartil.
• Rango intercuartílico = P75 - P25
– No es tan sensible a valores extremos.
Mg. Anne Aniceto C. 107
• Varianza S2 : Mide el promedio de las desviaciones (al
cuadrado) de las observaciones con respecto a la media.

1
S   ( xi  x )2
2

n i
– Es sensible a valores extremos (alejados de la media).
– Sus unidades son el cuadrado de las de la variable
Desviación típica
Es la raíz cuadrada positiva de la varianza. Tiene las
misma unidades que la variable de estudio.

Mg. Anne Aniceto C.


S S 2
108
Dispersión en distribuciones ‘normales’
0.05

0.05
0.04

0.04
0.03

0.03
0.02

0.02
0.01

0.01
x s x 2s
68.5 % 95 %
0.00

0.00
150 160 170 180 190 150 160 170 180 190

• Centrado en la media y a una desviación típica de


distancia hay aproximadamente el 68% de las
observaciones.
• A dos desviaciones típicas tenemos el 95% (aprox.)
• A tres desviaciones típicas tenemos el 99% (aprox.)

Mg. Anne Aniceto C. 109


Coeficiente de variación

S
CV 
x
Es la razón entre la desviación típica y la media.

– También se la denomina variabilidad relativa.


– Es frecuente mostrarla en porcentajes
• Si la media es 80 y la desviación típica 20 entonces
• CV=20/80=0,25=25% (variabilidad relativa)

• Es una cantidad adimensional. Se usa para comparar la


variabilidad de diferentes variables en distintas unidades.
– Si el peso tiene CV=30% y la altura tiene CV=10%, los
individuos presentan más dispersión en peso que en altura.

Mg. Anne Aniceto C. 110


Asimetría o Sesgo
• Una distribución es simétrica si la mitad izquierda de su distribución es
la imagen de su mitad derecha.
• En las distribuciones simétricas media y mediana coinciden. Si sólo hay
una moda también coincide.
• La asimetría es positiva o negativa en función de a qué lado se
encuentra la cola de la distribución.
• La media tiende a desplazarse hacia las valores extremos (colas).
• Las discrepancias entre las medidas de centralización son indicación de
asimetría.

Mg. Anne Aniceto C. 111


Apuntamiento o Kurtosis
• Este coeficiente indica la forma que tiene el conjunto de
datos con respecto a las medidas de dispersión.

(𝑄3 −𝑄−)
C.Ap.= K=
𝐶. 𝐴𝑝 = 𝐾 =
(𝑄 3 1 𝑄1)
2(𝑃90 −𝑃10 )
2(𝑃90 − 𝑃10 )

• Si K= 0.264 La distribución es mesocúrtica


• Si K>0.264 La distribución es lepticúrtica
• Si K<0.264 La distribución es platicúrtica

Mg. Anne Aniceto C. 112


Apuntamiento o curtosis
Se puede decir también que nos indica el grado de apuntamiento
(aplastamiento) de una distribución con respecto a la distribución
normal o gaussiana. Es adimensional. Según el paquete estadístico
Platicúrtica (aplanada): curtosis < 0 Serán de especial interés las
Mesocúrtica (como la normal): curtosis = 0 mesocúrticas y simétricas
Lepticúrtica (apuntada): curtosis > 0 (parecidas a la normal).

Apuntada como la normal


0.3
0.2
0.1

x s
68 %
0.0

-3 -2 -1 0 1 2 3
Mg. Anne Aniceto C. 113
ESTADÍSTICA BIDIMENSIONAL
Analiza el comportamiento conjunto de dos variables
en una unidad de estudio, es decir busca la asociación
o relación que existe entre ambas, se representa
como un conjunto de pares de datos (X,Y), donde:
X : es la variable independiente (llamado factor)
Y : es la variable dependiente (llamado resultado)
Ejemplos:
• Peso y talla de un grupo de personas
• Gasto en publicidad y volumen de ventas
• Nivel de estudios y región de procedencia
• Ingresos y nivel socioeconómico
• Coeficiente intelectual y rendimiento académico
……..ESTADÍSTICA BIDIMENSIONAL…………..

La relación o dependencia de variables se da entre:


I. Dos variables cualitativas; carrera profesional y
género; Nivel de satisfacción y nivel de estudios.
II. Dos variables cuantitativas; Ingresos y gastos en
una familia, Precio de PC y la velocidad del
procesador.
III. Una variable cualitativa y una cuantitativa;
Nivel de estudios y edad de las personas; Zona
de ventas y volumen de ventas.
Mg. Anne Aniceto C. 115
ORGANIZACIÓN DE DATOS
La asociación o dependencia de dos variables
cualitativas se debe resumir los resultados en:
• Gráfico de barras agrupadas
• Tablas de contingencia o bidimensionales
y k

x
Y1 y2 ... yj ... yl  fi.  ni.
i1

x1 f11 f12 … f1j … f1l f1.

x2 f21 f22 … f2j … f2l f2.


… … … …
… … … …

xi fi1 fi2 … fij … fil fi.


… … … … …
… … …

xk fk1 fk2 … fkj … fkl fk.


k 
 fij  n

 f.j  n.j f.1 f.2 … f.j … f.l
n.. 
i1 j1
j1

Mg. Anne Aniceto C. 116


Donde:
Las frecuencias absolutas conjuntas se designa con el índice
ij es decir: fij
La suma de los totales se considera de tres formas:
a) Totales por fila; es la suma total de las frecuencias
absolutas en fila:ni.
b) Totales por columna; es la suma total de las frecuencias
absolutas en columna:
n. j
c) Total general; es la suma total de las frecuencias
absolutas: n.. (igual a n)

Mg. Anne Aniceto C. 117


Para obtener los porcentajes, llamadas también
frecuencias relativas o proporciones, existen tres
maneras:
f i.
hi. 
a) Con relación al total general, está dado por: n

f. j
b) Con relación al total de fila : h. j 
n
f ij
c) Con relación al total de columna : hij 
n

Mg. Anne Aniceto C. 118


Distribuciones marginales
a) Distribución marginal de X; está dado por las marcas de clase (Xi) y
por los totales de las frecuencia por filas (fi.) :
X fi.
x1 f1.
x2 f2.
: :
xk fk.
Total ni.

b) Distribución marginal de Y; está dado por las marcas de clase (Yj) y


por los totales de las frecuencias por columnas (f.j) :
Y f.j
y1 f.j
y2 f.j
: :
yl f.l
Total n.j

Mg. Anne Aniceto C. 119


Presentación de resultados
Tabla1. Nivel de instrucción por región de procedencia
Nivel de estudios
Región de Total
Primaria Secundaria Superior
procedencia
n % n % n % n %

40 10.7 80 21.3 60 16.0 180 48.0


Costa
35 9.3 35 9.3 30 8.0 100 26.7
Sierra
Selva 30 8.0 40 10.7 25 6.7 95 25.3

Total 105 28.0 155 41.3 115 30.7 375 100.0

Del grupo de personas encuestadas, 180 son de la costa y 40 (10.7%) de ellos


tienen grado de instrucción primaria, 80 (21.3%) tienen secundaria y el 16%
alcanzaron estudios superiores, …. En relación al nivel de estudios alcanzados
mayormente es secundaria, el 21.3% tienen primaria y son de la costa, el 10.7%
tienen secundaria y son de la selva.
Estos resultados indican que el mayor porcentaje de personas con nivel de estudios
superiores son de la costa, lo cual demuestra que hay asociación o dependencia en
el nivel de estudios alcanzado por la región de procedencia de las personas.
Mg. Anne Aniceto C. 120
Gráfico 1. Nivel de instrucción por región de procedencia
25
21.3

20
16.0
Frecuencia (%)

15
10.7 10.7
9.3 9.3
10 8.0 8.0
6.7

0
Costa Sierra Selva

Primaria Secundaria Superior

El nivel de estudios que mayormente han alcanzado las personas es secundaria


en todas las regiones, que representan un 41%, en la región de la costa el 16%
tiene estudios superiores y en la sierra y selva sólo el 8% y el 6.7% .

Mg. Anne Aniceto C. 121


Estadístico de asociación: Chi cuadrado
El estadístico Chi-cuadrado (χ2) mide el grado de asociación o
dependencia entre dos variables cualitativas, que consiste en
comparar los valores observados y esperados en una tabla de
contingencia.
Si el resultado del estadístico es cercano a cero, no existe ningún
grado de asociación; si el resultado es diferente de cero, puede
afirmarse que existe algún tipo de asociación entre las dos variables.

  f  eij 
k l
2
El estadístico se define como: ij
2  i 1 j 1

Donde: eij
fij : son las frecuencias observadas de la muestra
eij : son las frecuencias esperadas , se obtiene  f  f . j 
eij  i.
k: número de categorías de la variable en fila n
l: número de categorías de la variable en columna

Mg. Anne Aniceto C. 122


En la tabla 1.
1) Hallar las frecuencias esperadas
2) Encuentre el estadístico Chi-cuadrado para comprobar si existe o
no asociación entre la región de procedencia y nivel de estudios.

Tabla1. Nivel de instrucción por región de procedencia

Nivel de estudios
Región de Total
Primaria Secundaria Superior
procedencia
n e.1 n e.2 n e.3 n

40 80 60 180
Costa
35 35 30 100
Sierra

Selva 30 40 25 95

Total 105 155 115 375

Mg. Anne Aniceto C. 123


Resumen de estadísticos
Para variables cuantitativas: k

x f i i.
a) Media o promedio de la variable X : x i 1
n
l

b) Media o promedio de la variable Y : y


j 1
j f. j
y
n
c) Varianza de la variable X : k
 fi. xi  x2
S2x  i1
n

l
d) Varianza de la variable Y :  f.j yi  y2
j1
S2y 
n

e) Covarianza de la variable X e Y : mide la variabilidad de X e Y


 f x  x y j  y 
k l

ij i
Covx, y   i 1 j 1

Mg. Anne Aniceto C. 124


Medidas de Asociación
Comprobar el grado de relación de variables cuantitativas a través de:
* Gráfico de dispersión
* Covarianza
* Coeficiente de correlación de Pearson
a) Gráfico de dispersión; representación de pares de valores
observados en el plano cartesiano, describe la relación existente
entre las variables, ejemplo de casos:

No hay relación Relación lineal positiva

Relación lineal negativa Relación no lineal


Mg. Anne Aniceto C. 125
Medidas de Asociación
c) Covarianza: mide la variabilidad conjunta de X e Y

 f x  xy  y
k l

ij i j
Covx, y   i 1 j 1

n
d) Coeficiente de correlación de Pearson (R): mide el grado de
asociación lineal entre las variables X e Y
cov(X , Y )
R Donde: 1  R  1
S xS y

Grado de relación de variables


R CORRELACIÓN
R= ± 1 Correlación perfecta
R= ± 0.9 R= ± 0.99 Correlación muy buena
R= ± 0.7 R= ± 0.89 Correlación buena
R= ± 0.40 R= ± 0.69 Correlación moderada
R= ± 0.30 R= ± 0.39 Correlación baja
R= ± 0.10 R= ± 0.29 Correlación muy baja
R= 0 Correlación nula
Mg. Anne Aniceto C. 126
Aplicación
Se ha recolectado la estatura (X) en cm y su peso (Y) en kg de un grupo de
estudiantes cuyos resultados se muestran en la tabla de distribución de
frecuencias bidimensionales.

Estatura en Peso en kg
cm [50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2
c) Encuentre e interprete el peso y la talla promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar el coeficiente de correlación de Pearson
Mg. Anne Aniceto C. 127
REGRESION Y CORRELACION LINEAL SIMPLE

• Es un modelo matemático para predecir el


efecto de una variable sobre otra, ambas
cuantitativas.
• Una variable es la dependiente y otra la
independiente
• Se gráfica con el diagrama de dispersión.
• Dice cómo es la relación entre las dos variables.
• El análisis consiste en encontrar la “mejor” línea
recta de esos puntos.
Diagrama de dispersión
Es la ubicación de los pares de puntos en el plano
cartesiano, también es conocido como nube de
puntos .
Publicidad Ventas
Relación entre publicidad y
12 58
ventas
14 65
80
15 52
60
10 42
19 67 40

13 40 20

15 44 0
19 69 0 5 10 15 20

18 55
Tipos de diagrama de dispersión
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o
inversa:
1
S xy   ( xi  x )( yi  y )
– Directa: Sxy > 0 n i
– Inversa: Sxy < 0
– Incorrelacionadas: Sxy = 0

• El signo de la covarianza nos dice si el aspecto de la


nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relación entre las variables.

Mg. Anne Aniceto C. 131


Coeficiente de correlación
lineal de Pearson
• El coeficiente de correlación lineal de Pearson de dos
variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente (excluyendo
rectas horizontales y verticales).
• Tiene el mismo signo que Sxy . Por lo tanto de su signo
obtenemos el que la posible relación sea directa o
inversa.
• r es útil para determinar si hay relación lineal entre
dos variables, pero no servirá para otro tipo de
relaciones (cuadrática, logarítmica, exponencial)
S xy
r 
Sx S y
Mg. Anne Aniceto C. 132
REGRESIÓN LINEAL SIMPLE
En términos generales la regresión lineal simple
consiste en analizar la relación entre dos variables
cuantitativas, es decir se debe establecer una relación
funcional Y= f(x), llamado modelo de regresión o
ecuación de la recta, cuyos objetivos son:
1) Medir el grado de relación con el coeficiente de
correlación de Pearson.
2) Predecir el efecto de una variable sobre otra
(estimar valores).
El estadístico de correlación de Pearson también puede
calcularse :
k 
n fij xi  x ( y j  y )
i1 j1
R
k 
n xi 2
x
2
n y j2  y
Mg. Anne Aniceto C.
2
133
i1 j1
Propiedades del coeficiente de
• Sólo toma valores en [-1,1]. correlación
• Las variables no presentan correlación r = 0.
• Relación lineal perfecta entre dos variables r = 1 o r = -1.
• Cuanto más cerca esté r de 1 o -1 mejor será el grado de relación
lineal.
• Siempre que no existan observaciones anómalas

iRelación Relación
nversa directa casi
perfecta Variables
perfecta
negativa incorrelacionada
s

-1 +1
Mg. 0
Anne Aniceto C. 134
correlaciones positivas
330 130
120
280
110
230 100
90
180 80
70
130 60
50
80 r=0,1 r=0,4
40
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

110 100
100 90
90 80
80
70
70
60
60
50 50

40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Mg. Anne Aniceto C. 135


Correlaciones casi
perfectas y positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200

Mg. Anne Aniceto C. 136


correlaciones negativas
80
90
80 70
70 60
60 50
50
40
40
30 30
20 20
10 r=-0,5 r=-0,7
10
0
0
140 150 160 170 180 190 200
140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Mg. Anne Aniceto C. 137


Regresión lineal simple
• El análisis de regresión sirve para predecir una variable
en función a otra.
– Y = Variable dependiente
– X = Variable independiente

• El modelo de regresión quedara establecido por el


siguiente modelo:

ˆ  a  bx
y

138
Mg. Anne Aniceto C.
Interpretación de los
coeficientes de regresión lineal
• La pendiente b1(b): indica el cambio promedio en la
variable respuesta (y), cuando la variable predictora
(x) aumenta en una unidad adicional.
• El intercepto b0 (a)indica el valor promedio de la
variable respuesta (y), cuando la variable predictora
(x) es igual a cero. Sin embargo carece de
interpretación práctica si dicho valor está fuera del
rango del conjunto de valores X.
• Y= b0 + b1 X o también Y= a + bX

Mg. Anne Aniceto C. 139


Para determinar el modelo de regresión lineal simple
utilizaremos el método de mínimos cuadrados:

 y  na  b x
 xy  a x  b x 2

La recta de regresión estimada será:

yˆ  y  b1 ( x  x )
Mg. Anne Aniceto C. 140
Otras fórmulas adicionales
S xy
S r
b 2XY
a  y  bx Sx S y
SX

Sx 
2  x 2
x 2
Sy 
2  y 2
y2
n n
Análisis de Regresión y
Correlación lineal
Salidas en SPSS
Registro de Pesca de sardinas (toneladas m.) y el precio de venta (soles por
kg).

Mg. Anne Aniceto C. 142


Análisis de Regresión y
Correlación lineal
Salidas en SPSS

Mg. Anne Aniceto C. 143


Bondad de ajuste: Coeficiente de Determinación

• Es una medida que nos indica la bondad del ajuste


(bondad de la predicción)
R2 =r2 ó también como

2
S
R  1
2 e
2
S Y

Mg. Anne Aniceto C. 144


Análisis de Regresión y
Correlación lineal
Salidas en SPSS

Mg. Anne Aniceto C. 145


Análisis de Regresión y
Correlación lineal
Salidas en SPSS
9,00

8,00

7,00
precio de las sardinas

6,00

5,00

4,00

3,00

2,00

1,00 2,00 3,00 4,00

pesca mensual de sardinas


Mg. Anne Aniceto C. 146
Análisis de
Regresión y
Correlación lineal
Salidas en SPSS

Mg. Anne Aniceto C. 147


Análisis de
Regresión y
Correlación lineal
Salidas en SPSS

Mg. Anne Aniceto C. 148


Análisis de Regresión
y Correlación lineal
Salidas en SPSS
Prueba de hipótesis
Ho: ρ=0
Ha: ρ≠ 0
α=0.05
Si sig ≤ 0.05 entonces
rechazar la hipótesis
nula

Mg. Anne Aniceto C. 149


Análisis de Regresión y
Correlación lineal
Salidas en SPSS

Ecuación de regresión lineal

y = 7,754 – 1,424x si x=4,5 toneladas

y = 7,754 – 1,424(4,5) =1.346


Mg. Anne Aniceto C. 150
TEORIA DE
PROBABILIDADES:
ANALISIS
COMBINATORIO
OBJETIVOS:
 proporcionar los fundamentos de las
probabilidades y su aplicación para procesos
estadísticos
 Utilizar las propiedades conjuntistas para
el planteamiento del problema.
ANALISIS COMBINATORIO :
Es parte de la matemática que estudia
sistemáticamente las distintas Ordenaciones de
los diferentes elementos de un conjunto dado
cundo se forman grupos de un grado determinado.
Mg. Anne Aniceto C. 151
ANALISIS
COMBINATORIO
PRINCIPIO FUNDAMENTAL :
“Si cierta selección de ordenación de objetivos
puede realizarse de “ m ”maneras diferentes y otra
selección puede efectuarse de “ n “ maneras
distintas , ambas selecciones , se pueden producir
de “ m x n “ maneras diferentes.
Ejemplo 1 :
Si un partido político tiene 3 candidatos a la presidencia
y 5 candidatos a la vicepresidencia , El número de
parejas distintas de candidatos para ambos cargos se
formaran de 3 x 5 = 15 formas.
Mg. Anne Aniceto C. 152
ANALISIS
COMBINATORIO
PRINCIPIO FUNDAMENTAL :
Ejemplo 2 :
Si Carlos tiene 3 camisas de vestir y 4
pantalones
¿ Cuántos serian las diferentes formas que tendrá
para vestirse con dichas prendas?
tendremos : 3 x 4 = 12 formas de vestirse.

Mg. Anne Aniceto C. 153


ANALISIS
COMBINATORIO
VARIACIONES:

Son los diferentes grupos que se pueden formar con los


elementos dados , tomados de “n” en “n” , de tal modo que
unas agrupaciones del mismo número de elementos se
diferencien de otras, por lo menos en un elemento, o si
tienen los mismos elementos , por el orden en que están
colocados.
El número de variaciones de “ m “ elementos tomados de “n” en
“n” será:
Donde:
m!
Vm  (m  n)!
n

m = número total de elementos

n = número de elementos de cada grupo.


Mg. Anne Aniceto C. 154
ANALISIS
COMBINATORIO
Ejemplo 1:
Supongamos que Alberto (A) , Beatriz (B) , Carlos ( C )
Daniel(D) se quieren Sentar en dos sillas disponibles. ¿De
cuántas maneras diferentes se puede ubicar ?

Silla I A A A B B B C C C D D D

Silla II B C D A C D A B D A B C

12 maneras diferentes

m! 4! 4! 4x3x2!
Vm  (m  n)!  V4  (4  2)!  2!  2!  4x3  12
n 2

Mg. Anne Aniceto C. 155


ANALISIS
COMBINATORIO
Ejemplo 2 :

Se tiene 5 libros de distintas materias . ¿De cuántos modos


diferentes podrán disponerse?

Solución.

5!

m=5
V5  (5  5)!  5 x 4 x 3 x 2 x 1  120
5
n=5

Mg. Anne Aniceto C. 156


ANALISIS
COMBINATORIO

PERMUTACIONES:

Sea “ n ” el número de elementos de un conjunto A


y “ r ” un número natural donde 0 < r  n ; las
permutaciones se definen como el número
de ordenaciones diferentes que se pueden
formar con los elementos del conjunto A ,
tomando en grupos de “ n ” en “ n ” o de “ r ” en “
r ” pueden ser sin repetición o con repetición.

Mg. Anne Aniceto C. 157


ANALISIS
COMBINATORIO
Permutaciones sin repetición:
a) De “ n ” elementos diferentes tomados todos a la vez :
Si “ n ” es el número de elementos de un conjunto A; el
número de permutaciones que pueden hacerse con todos los
“ n ” elementos se obtiene así:
P(n, n)  n!
Ejemplo : De un conjunto A = { x ,y , z}. Hallar el número
de permutaciones que pueden formarse con todo los
elementos de A.

Solución
:Como n = 3 , el número de permutaciones sin repetición
será:
xyz yxz zxy
P(3,3)  3!  3 x 2 x 1  6
xzy yzx zyx
Mg. Anne Aniceto C. 158
ANALISIS
COMBINATORIO
Permutaciones sin repetición:
b) De “ n ” elementos diferentes tomados de “ r ” en “ r ” con r < n
De “ n ” elementos diferentes , el número de permutaciones
diferentes sin repetición tomados de “ r ” en “ r ” está dado
por:
Ejemplo
Si A = { a , b, c, d} . Cuantas ordenaciones diferentes
pueden formarse tomando grupos de a 2 ?

Solución
:n = 4 ; r = 2 como:
n!
4! P(n, r) 
P(4,2)   4 x 3  12 (n - r)!
2!
Mg. Anne Aniceto C. 159
ANALISIS
COMBINATORIO
COMBINACIONES :
Las combinaciones son las diferentes grupos de “n”elementos
que se pueden formar tomándolos de “ r ” en “ r ” , donde
0 < r  n ; de modo que cada grupo difiere del otro en por lo
menos un elemento.

En las combinaciones sólo se tiene en cuenta los


elementos que intervienen en ellas y no en el orden en que
están agrupados la fórmula correspondiente es:

n!
C(n, r) 
r!(n  r)!
Mg. Anne Aniceto C. 160
ANALISIS
COMBINATORIO
COMBINACIONES :
Ejemplo :
De un grupo de 10 libros ¿Cuántas selecciones de 4 libros se
pueden hacer?

Solución:
n = 10 ; r = 4 C(n, r) 
n!
r!(n  r)!

10! 10!
C(10,4)  
4!(10  4)! 4!6!
10! 10 x 9 x 8 x 7 x 6! 10 x 9 x 8 x 7
   210
4!6! 4! . 6! 4 x 3 x 2 x1
Mg. Anne Aniceto C. 161
PROBABILIDADES

EXPERIMENTO ALEATORIO:
Un experimento aleatorio o estadístico es cualquier
experimento u operación cuyo resultado no puede predecirse
con exactitud antes de realizarse el experimento.

Ejemplos:
• Lanzar un dado y observar el número que aparece en
la cara superior.
• De un lote de bombillas de luz , extraer uno que sea
defectuoso.

Mg. Anne Aniceto C. 162


PROBABILIDADES

ESPACIO MUESTRAL:
Es el conjunto formado por todo los resultados posibles del
experimento aleatorio. Denotaremos por la notación 
(omega) o con la letra S
SUCESO O EVENTOS
Se llama suceso o evento , cualquier subconjunto del
espacio muestral  . A los sucesos generalmente se les
denota por letras mayúsculas , tales como A , B , C, etc.

Mg. Anne Aniceto C. 163


PROBABILIDADES

Entonces : A es un suceso  A  
Relacionando con la teoría conjuntista al
espacio muestral  se le llama el universo y el
   ; luego:
 (universo) se llama suceso seguro.
 (nulo) se llama suceso imposible.

Mg. Anne Aniceto C. 164


PROBABILIDADES

PROBABILIDAD DE UN SUCESO
Sea el suceso o evento A del espacio muestral  ;
la probabilidad de A denotada por P(A) es la razón
entre el número de resultados favorables al suceso
A y el número total de resultados del espacio
muestral.
n(A) nº de casos favorables
P(A)  P(A) 
n nº de casos posibles

Mg. Anne Aniceto C. 165


PROBABILIDADES
Ejemplo 1 :

Si se lanza una moneda tres veces ¿Cuál es la probabilidad de


a. Obtener exactamente dos caras ?
b. Al menos dos caras ?
c. ninguna cara?
Solución:
n(A) 3
 P(A)    0.375
n 8
n(B) 4 1
 P(B)     0.5
n 8 2
n(C) 1
 P(C)    0.125
n 8

Mg. Anne Aniceto C. 166


PROBABILIDADES
AXIOMAS DE PROBABILIDAD

1. La probabilidad de un suceso A , toma valores entre 0 y


1 ; es decir 0  P(A)  1 .
2. La probabilidad de un suceso seguro  es 1 P( ) = 1
3. Si un suceso A =  , A es un suceso imposible P(A) = 0

4. Si A y B son sucesos de  ; donde A  B =  ;


entonces , la probabilidad de ocurrencia del suceso A  B
es :
P (A  B) = P(A) + P(B)

Mg. Anne Aniceto C. 167


PROBABILIDADES
Ejemplo 2
La probabilidad de que no asistan a clase no menos de
8 estudiantes es 0.2 y la probabilidad de que no asistan a
clase no más de 5 estudiantes es 0.3 . Hallar la probabilidad
de que no asistan 6 ó 7 estudiantes.

Solución:
Sean los sucesos :
A : No asistan a clase no menos de 8 estudiantes
A = { 8 , 9 , 10 , .....................}
B: No asisten a clase no más de 5 estudiantes.
B={0,1,2,3,4,5}
C : No asisten a clase a 6 ó 7 estudiantes .
C={6,7}

Mg. Anne Aniceto C. 168


PROBABILIDADES

Como A , B y C son mutuamente excluyentes


donde A  B  C =  (Universo) ; entonces:

P(A  B  C)  PΩ   P(A)  P(B)  P(C)  1


 0.2  0.3  P(C)  1
P(C)  1 - 0.5  P(C)  0.5

Mg. Anne Aniceto C. 169


PROBABILIDADES
TEOREMAS SOBRE PROBABILIDADES

1. Si  (Suceso imposible ) ; entonces P( ) = 0

2. Si A’ es un suceso complementario de A ; entonces


P(A’) = 1 – P(A)
Esto se deduce de la siguiente relación :
Como A  A’ = 
A y A’ son sucesos excluyentes, por lo tanto:

P(A)  P(A' )  PΩ 


P(A)  P(A' )  1  P(A' )  1  P(A)

Mg. Anne Aniceto C. 170


PROBABILIDADES
TEOREMAS SOBRE PROBABILIDADES
3. Si A y B son sucesos no excluyentes (conjuntos no
comparables) ; se tiene que:

P(A  B)  P(A)  P(B) - P(A  B)

Extendiendo para tres conjuntos no comparables. Se


tiene que:

Mg. Anne Aniceto C. 171


PROBABILIDADES

TEOREMAS SOBRE PROBABILIDADES

A B

P(A  B  C)  P(A)  P(B)  P(C) - P(A  B) - P(A  C) - P(B  C)  P(A  B  C)

Mg. Anne Aniceto C. 172


PROBABILIDADES

Ejemplo 1:

De un total de 200 estudiantes ; 120 están matriculados en

Matemática Básica y 90 en Estadística; 50 en ambos

cursos. Si se elige al azar uno de los 200 estudiantes, ¿Cuál

es la probabilidad de que un estudiante elegido esté

matriculado en una de las asignatura?

Mg. Anne Aniceto C. 173


PROBABILIDADES

Ejemplo 1:
Solución:
Espacio muestral: n( ) = 200
Suceso A : Seleccionar un alumno matriculado en M. B.
120 3
n(A)  120  P(A)  
200 5
Suceso B : Seleccionar un alumno matriculado en Est.
90 9
n(B)  90  P(B)  
200 20
Suceso (A B) : Seleccionar un alumno matriculado en M.B. y
Estadística.
50 1
n(A  B)  50  P(A  B)  
200 4
Como se sabe que : P(A  B)  P(A)  P(B) - P(A  B)
3 9 1 4
P(A  B)   -  P(A  B) 
5 20Mg. Anne
4 Aniceto C. 5 174
PROBABILIDADES
Ejemplo 2:
En un salón de clase de 40 alumnos, 30 de ellos
postulan a la UNAC y 26 a la UNMSM . Se elige al azar
un alumno de este salón. ¿Cuál es la probabilidad de que
sea un alumno que postula a ambas Universidades?
Solución:

Suceso A : Alumnos que postulan a la UNAC ; n(A) = 30


Suceso B : Alumnos que postulan a la UNMSM; n(B) = 26
Suceso A  B : Alumnos que postulan a ambas
universidades.

Mg. Anne Aniceto C. 175


PROBABILIDADES

Sabemos que :

n(A  B)  n(A)  n(B) - n(A  B)  40

n(A  B)  30  26 - n(A  B)  40  56  n(A  B)  40


n(A  B)  16
n(A  B) 16 2
P(A  B)     0.4
n() 40 5

Mg. Anne Aniceto C. 176


PROBABILIDADES
Ejemplo 3:
Con 7 contadores y 4 médicos se van formar comités de 6
miembros. ¿Cuál es la probabilidad que el comité incluya
a. Exactamente dos médicos?
b. A los sumo tres contadores?

Solución:
Evento B: A lo sumo tres contadores:
n(B)  C(7,2) x C(4,4)  C(7,3) x C(4,3)
7! 4! 7! 4!
n(B)      21  140  161
2! . 5! 4!.0! 3! . 4! 3!.1!
161
 P(B)   0.348
462
Mg. Anne Aniceto C. 177
Probabilidad Condicional
Ejemplo 1: Se dispone de 11 Hojas de Registro Laboral,
pertenecientes a trabajadores masculinos y femeninos agrupados
por el turno en que labora

Sexo M F
Turno (Masculino) (Femenino) Total
D (Día) 5 3 8
N (Noche) 1 2 3
Total 6 5 11

a) ¿Cuál es la probabilidad de extraer una Hoja de


Registro Laboral perteneciente a un trabajador que
labora en el día?
8
P(D) =
11
Mg. Anne Aniceto C. 178
b)¿Cuál es la probabilidad de extraer una Hoja de
Registro Laboral perteneciente a un trabajador
que labora en el día y que sea mujer?
3
P(D  F) =
11

c) Dado que la Hoja de Registro Laboral


perteneciente a un trabajador que labora en el día,
¿cuál es la probabilidad que sea mujer?
3
P(F ) =
D 8
Mg. Anne Aniceto C. 179
Derivación de la fórmula:
P(F  D)
P(F ) =
D P(D)

Comprobando:

3
P(F ) = 11 3
D 8 P(F )=
D 8
11

Mg. Anne Aniceto C. 180


Aplicación:

La probabilidad de que el personal administrativo


que labora en una empresa, llegue tarde el día
lunes es 0,50 y la probabilidad de que llegue
retrasado los días lunes y martes es 0,20. Dado
que cierto trabajador llegó tarde el día lunes,
¿cuál es la probabilidad de que llegue tarde el
día siguiente?.
P(TM  TL )
P(TL ) = 0,50 P(TM ) =
TL P(TL )
P(TL  TM ) = 0,20 =
0,20
= 0,40
0,50
Mg. Anne Aniceto C. 181
Regla de la Multiplicación
A partir de

P(A  B)
P(B )
A P(A)

Se despeja

P(A  B)  P(A)  P B ( A)
Mg. Anne Aniceto C. 182
Aplicación:

Se sabe que en un lote de discos duros de 50


unidades, hay 4 que no están adecuadamente
embalados. Si se extraen al azar 2 discos
duros, uno a continuación del otro, ¿cuál es la
probabilidad de que ambos se encuentren mal
embalados?.
4
P(D1 ) 
50 (
P(D1  D 2 )  P(D1 )  P D 2
D1
)
4 3 12
3 =  
P(D 2 ) 50 49 2450
D1 49

Mg. Anne Aniceto C. 183


Ejercicio

En una población de pacientes hospitalizados, la


probabilidad de que uno de ellos, elegido
aleatoriamente tenga problemas cardiacos es
0,35. La probabilidad de que un paciente con
problemas cardiacos sea un fumador es de 0,86.
¿Cuál es la probabilidad de que el paciente
elegido al azar de entre la población sea fumador
y tenga problemas cardiacos?.

Mg. Anne Aniceto C. 184


Regla de la multiplicación
para sucesos
independientes.
Los sucesos A y B se consideran independientes
cuando la ocurrencia de uno no influye sobre la
probabilidad de ocurrencia del otro; esto significa
que, independientemente de que A haya ocurrido o
no, la probabilidad asignada a B es siempre la
misma.
P(B )  P(B)
A
Entonces,
 P(A  B)  P(A)  P(B)
Mg. Anne Aniceto C. 185
Ejemplo:
¿Cuál es la probabilidad de que en una familia con
dos hijos, ambos sean varones?

P(V1  V2 )  P(V1 )  P(V2 )


P(V1 )  0,5
P(V2 )  0,5 = (0,5) (0,5)

P(V1  V2 )  0,25

Mg. Anne Aniceto C. 186


El Teorema de Bayes
Consiste en una partición de la
probabilidad total.
Ejemplo 1:
La Compañía de Seguros JL ha desarrollado un novedoso
seguro médico familiar. De acuerdo con una
investigación hecha en el mercado, la probabilidad de
que el producto tenga éxito es 0,80 si una compañía
competidora no introduce un plan similar en el mercado,
en tanto que la probabilidad de éxito es 0,30 si la
empresa competidora lanza al mercado un seguro
similar. Además, la compañía JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.
Mg. Anne Aniceto C. 187
Dado que el producto de la Compañía JL tuvo
éxito, ¿cuál es la probabilidad de que la firma
competidora haya comercializado su novedoso plan
de seguro?
Solución:
P(C) = probabilidad de que la compañía
competidora comercialice el producto,
P(C´) = probabilidad de que la compañía
competidora no comercialice el producto,
P(E) = probabilidad de que el plan de seguro
familiar de la compañía JL tenga éxito.
Mg. Anne Aniceto C. 188
P. Marginal P. Condicional P. Conjunta

P(E/C) = 0,30 P(C  E) = 0,40  0,30 = 0,12

P(E/C´) = 0,80 P (C'


 E) = 0,60  0,80 = 0,48

P. Total P(E) = 0,60

Mg. Anne Aniceto C. 189


Luego, de acuerdo con el
Teorema de Bayes
P(C  E)
P(C )=
E P(C  E) + P(C'  E)

0.12 0.12
   0.20
0.12  0.48 0.60

La probabilidad que la compañía de seguros haya


participado en el mercado, dado que JL tuvo
éxito es de 0,20.
Mg. Anne Aniceto C. 190
Ejemplo 2:

El Gerente de Imagen Institucional está


considerando comprar un lote de 10000 unidades USB
de un proveedor nacional. El fabricante de estos
equipos estima la proporción de equipos defectuosas
en el lote, en la siguiente forma.
Proporción de Probabilidad
piezas defectuosas () P()
1 = 0,10 P(1) = 0,20
2 = 0,15 P(2) = 0,30
3 = 0,25 P(3) = 0,50
Mg. Anne Aniceto C. 191
Esto significa que el proveedor no está seguro
acerca de la proporción de equipos defectuosos
en el lote, sin embargo, basándose en
experiencias anteriores, cree que hay una
probabilidad de 0,20 de que el lote tenga 10%
de piezas defectuosas, una probabilidad de
0,30 de que tenga 15%. Y finalmente, de 0,50
de que tenga 25% de piezas defectuosas.
Supongamos que elige una unidad USB al azar en
el lote:

Mg. Anne Aniceto C. 192


A) ¿Cuál es la probabilidad de
qué esta sea defectuosa?

B) Dado que la unidad USB


resultó defectuosa, ¿cuál es
la probabilidad de que el lote
tenga 25% de piezas
defectuosas?

Mg. Anne Aniceto C. 193


P. Condicional
P. Marginal P. Conjunta
P(D/1)= 0,10
1=0,10 P( 1  D) = 0,20  0,10 = 0,0200

P(D/2)= 0,15
P(2) = 0,30 2=0,15 P( 2  D) = 0,30  0,15 = 0,045

P(D/3)= 0,25
3=0,25 P( 3  D) = 0,50  0,25 = 0,1250

Mg. Anne Aniceto C.


P(D) = 0,1900
194
Respuesta A:
Hay tres maneras posibles de obtener un USB
defectuoso del lote. Por lo tanto, la
probabilidad de obtener una unidad defectuosa,
cualquiera que se la tasa porcentual de
defectuosos 10, 15 ó 25 es:

P(D)  P(1  D)  P( 2  D)  P( 3  D)

 0,0200  0,0450  0,1250

 0,19
Mg. Anne Aniceto C. 195
Respuesta B:

De acuerdo con el Teorema de Bayes, la probabilidad


de que el lote contenga 25% de piezas defectuosas,
dado que la unidad elegida es defectuosa, es:

P( 3  D) 0.1250
P( 3 / D)    0.6579
P( D) 0.1900

Mg. Anne Aniceto C. 196


Mg. Anne Aniceto C. 197

Вам также может понравиться