Вы находитесь на странице: 1из 79

Dr.

Jorge Luis Melndez Rosales


j_melendez2564@hotmail.com
Mtodos Estadsticos para
la investigacin
PASOS DE UNA I NVESTI GACI N
1. Concebir la idea a investigar
2. Plantear el problema de investigacin
3. Elaborar el marco terico
4. Definir el tipo de investigacin
5. Establecer la hiptesis y definir las variables
6. Seleccionar el diseo apropiado
7. Seleccionar la muestra
8. Recoleccin de datos
9. Analizar los datos
10. Presentar los resultados
DEFINICIONES PRELIMINARES
1. Unidad de estudio:
Es el animal, persona o
cosa de quien se dice
algo.
Es quien nos va a dar la
informacin.
Es el objeto o elemento
indivisible que ser
estudiado.
2. Poblacin:
Es el conjunto de todas
las unidades de estudio
que cumplen con ciertas
caractersticas de
inters (criterios de
inclusin).
3. Muestra:
Es un subconjunto de la poblacin en estudio.
Una buena muestra rene 2 condiciones
fundamentales:
a. Representatividad.
b. Adecuacin.
MUESTRA
(n)
Condiciones:
Representativa: Se toma
u.e. de todos los sectores
de la poblacin.
Adecuada: Utiliza las
frmulas de la teora del
muestreo.
POBLACIN
(N)
Extensin:
Finita
Infinita
Naturaleza:
Poblacin Objeto;
Constituida por las u.e.
Poblacin objetivo:
Informacin que genera la
poblacin objeto
CARACTERSTICAS
V A R I A B L E S
Qu me interesa saber de la unidad de estudio?
Peso
Edad
Numero de hermanos
Color de ojos
Tipo de sangre
Ingreso familiar
Gasto familiar

Ventas
Ganancias
Gasto en publicidad
Numero de trabajadores
Numero de computadoras

Cliente
Empresa
Unidades de estudio
4. Variable:
Es una caracterstica de estudio de una unidad de estudio o de una
poblacin en estudio.
Las variables son caractersticas observables y medibles.
Al evaluarlas o medirlas, stas toman diferentes valores (cualidades o
cantidades).
Se denota por las letras X, Y, Z, etc.
Clasificacin
Relacin Independiente - Dependiente
Naturaleza
Cuantitativas
Discretas
Continuas
Cualitativas
www.bioestadistico.com
ESCALAS DE MEDICIN
DE LAS VARIABLES
Slo identifica la categora. No orden.
La variable tiene dos o ms categoras.
X: Sexo, religin o afiliacin poltica
NOMINAL
Adems de identificar, mantiene un orden o
jerarqua. Hay varias categoras.
X: Grado de instruccin, Nivel de autoestima
ORDINAL
Identifica, ordena y establece distancias o intervalos entre
categoras (suma y resta).
El cero no significa ausencia de la ue .
X: Temperatura ambiental, Rendimiento acadmico, etc
INTERVALO
Identifica, ordena, establece distancias y es
posible obtener razones (multiplicacin y
divisin).
El cero significa ausencia de la ue.
X: Peso, talla, Tiempo de exposicin a la TV.
RAZON
Anlisis para datos cuantitativos.
Recoleccin de datos cuantitativos
Anlisis de datos cuantitativos
Encuesta
Recoleccin de datos
cuantitativos
Instrumentos
Medir variables o
conceptos
Requisitos
Tipos
Confiabilidad Validez Objetividad
Calculada con

- Medida de
estabilidad
- Mtodo de formas
alternativas o
paralelas
- Medida de
consistencia
interna
- Mtodo de
mitades partidas
Sustentada en evidencias
que poseen
-Relacin con el contenido
- Relacin con el criterio
- Relacin con el constructo
- Validez total

Que implica

Estandarizacin
Observacin
Anlisis de
contenido
Entrevista
Ficha.
Historia clinica Fichas de resumen
Cuestionario definido
Lista de cotejos
Test
Baterias
Escalas de Gutman
Escala de Likert
Diferencial semntico
-Escala de Guttman
- Escala de Likert
- Diferencial semntico
Tcnicas
Observacin
Encuestas
Censo
Lluvia de ideas
Entrevista
Focus Groups
Anlisis de contenido
Etc.
Anlisis de datos
cuantitativos
Programas
computacionales
efectuado
mediante
Estadstica
Pasos
SPSS
MegaStat SAS
Stats
Descriptiva
Inferencial
Seleccionar el
programa
Ejecutarlo
Explorar datos
Evaluar la confiabilidad
y validez
Anlisis estadstico de
variables e hiptesis
Reportar resultados
-Distribucin de
frecuencias
- Medidas de tendencia
central
- Medidas de variabilidad
- Grficas
- Puntuaciones z
- Estimar parmetros
- Probar hiptesis
- Basada en la
distribucin muestral
La matriz de
datos
Media,
Mediana,
Moda,
Cuantiles
Rango, desv.
estandar,
varianza, CV
Mediante
anlisis
paramtricos y
no paramtricos
TCNICA DE RECOLECCIN DE DATOS:
Comprende procedimientos y actividades que le permiten al
investigador obtener la informacin necesaria para dar respuesta a
su pregunta de investigacin.
Se pueden mencionar como tcnicas de recoleccin de informacin
la observacin (ver o experiencia), la encuesta (preguntar), la
entrevista (dialogar), la revisin documental (leer), las sesiones
en profundidad (hacer o participar), etc.
Diferencia entre
TCNICA - INSTRUMENTO
INSTRUMENTO DE RECOLECCIN DE DATOS:
Constituyen las vas mediante la cual es posible aplicar una
determinada tcnica de recoleccin de informacin.

Tcnicas e Instrumentos
(De Barrera, J ., 2.000)
Tcnicas Instrumentos
Instrumento de
Registro
Observacin
Gua de Observacin
Lista de Cotejo
Escala de Observacin
Papel y Lpiz (formato)
Cmara fotogrfica
Cmara de Vdeo
Revisin Documental
Matriz de categoras Papel y Lpiz (formato)
Entrevista
Gua de Entrevista
Grabador. Papel y Lpiz
Cmara de vdeo.
Encuesta
Cuestionario
Escala
Test
Prueba de conocimiento
Papel y Lpiz (formato)
Sociometra
Test sociomtrico Papel y Lpiz (formato)
Sesin en
profundidad
Gua de Observacin
Grabador. Papel y Lpiz
Cmara de vdeo
Cmara fotogrfica
LA CONFIABILIDAD
LA VALIDEZ
El instrumento mide lo que pretende medir
La confiabilidad de la medicin es una
cuestin clsica en la generalizacin
cientfica.
La medicin es confiable en la medida que
conduzca a los mismos resultados o
similares, sin importar las oportunidades
para que ocurran las variaciones.
Varios tipos de Validez:
Validez de contenido
Validez de constructo
Es realizado por especialistas del rea
Presentacin de la informacin
Cuadro de Distribucin de Frecuencias
Grficos Estadsticos
PRESENTACION DE LA INFORMACION
BASE DE DATOS
Intervalo Frecuencia Porcentaje
00 - 500 19 38%
500 1000 12 24%
1000 1500 8 16%
1500 2000 2 4%
MAS DE 3000 9 18%
TOTAL 50
Ingreso Mensual
Resumen
CUADROS DE DISTRIBUCIN
DE FRECUENCIAS
GRAFICOS ESTADSTICOS.
Datos sin Agrupar
Datos no tabulados
Datos Agrupados
Datos Tabulados
DEFINICIN:
Un CDF es una tabla rectangular que
representa en forma ordenada y resumida
el comportamiento de una variable en
estudio.

PARTES :
1. Nmero
2. Ttulo: Especificar la poblacin y la
variable en estudio
3. Encabezado o conceptos.
4. Cuerpo o contenido del cuadro de
frecuencias
5. Nota de pie (no siempre es necesaria)
6. Fuente
7. Elaboracin

1. CUADRO DE FRECUENCIAS
GASTO
Nmeros de
Clientes ( fi )
Porcentaje de
Clientes ( % )
200 - 400 190 38%
400 - 600 120 24%
600 - 800 80 16%
800 - 1000 20 4%
1000- 1200 90 18%
TOTAL 500 100%
1
CUADRO N 01
DISTRIBUCIN DE 500 NUEVOS CLIENTES DE TIENDAS SAGA
FALABELLA DE LA CIUDAD DE TRUJILLO DE ACUERDO AL
GASTO EN SOLES EN COMPRAS DURANTE EL AO 2010.
* Solamente se han considerado a clientes que actualmente radican en la
ciudad de Trujillo.
Fuente: Departamento de Ventas de la Tiendas Saga Falabella Sucursal
Trujillo.
Elaboracin: Jos Lus Soto Avalos (Jefe del Departamento de Ventas)
2
3
4
5
6
7
Nmero del Cuadro
Ttulo
Encabezado
Cuerpo
Nota de Pie
Fuente
Elaboracin
NOTA:
Para la construccin de un CDF
se debe tener en cuenta el tipo de
variables
CONSTRUCCION DE CUADROS DE FRECUENCIAS
Ejemplo: CUANTITATIVA DISCRETA
El Jefe de Recursos Humanos de la Empresa Agroindustrial Vir se
encuentra preocupado por las solicitudes de sus trabajadores sobre
prstamos por poca escolar. El Gerente ceder al pedido de R.R.H.H. si
presentan un informe del nmeros de hijos menores de los trabajadores.
Se recolect la informacin y se obtuvo:
3 1 2 6 3
2 4 6 2 2
3 2 2 3 4
5 4 3 3 4
2 3 4 5 3
Elaborar un cuadro de distribucin de Frecuencias.
I. PARA VARIABLES CUANTITATIVA DISCRETA:
CONSTRUCCION DE CUADROS DE FRECUENCIAS
NMERO DE HIJOS EN EDAD ESCOLAR DE LOS TRABAJADORES DE LA
EMPRESA AGROINDUSTRIAL VIR EN ELAO 2010.
CUADRO N 02
* Solo se consider los trabajadores del rea de Manufactura
Fuente: Departamento de Recursos Humanos.
Elaboracin: Franco Fernndez-Dvila (Jefe de Recursos Humanos)
Nmero de Hijos
Casos
fi
Fi
Porcentaje
hi%
Hi%
1 1 1 4% 4%
2 7 8 28% 32%
3 8 16 32% 64%
4 5 21 20% 84%
5 2 23 8% 92%
6 2 25 8% 100%
Total 25 100%
CONSTRUCCION DE CUADROS DE FRECUENCIAS
Ejemplo: CUALITATIVA
El Jefe de Produccin de la empresa Coca Cola desea presentar un
informe a Gerencia sobre los diferentes sabores o marcas de gaseosas
que se han producido durante el mes de julio, para ello tiene reportes de
toda la produccin segn el formato 400 ML.

COCA COLA COCA COLA COCA COLA COCA COLA
FANTA SPRITE FANTA FANTA
COCA COLA INCA COLA FANTA SPRITE
FANTA INCA COLA FANTA INCA COLA
SPRITE INCA COLA SPRITE INCA COLA
SPRITE COCA COLA SPRITE INCA COLA
SPRITE COCA COLA INCA COLA INCA COLA

Elaborar un cuadro de distribucin de Frecuencias.
II. PARA VARIABLE CUALITATIVA:
CONSTRUCCION DE CUADROS DE FRECUENCIAS


MARCA DE GASEOSA fi hi%
COCA COLA 7 25%
FANTA 6 22%
SPRITE 7 25%
INCA COLA 8 28%
TOTAL 28 100%
MARCAS DE BEBIDAS GASEOSAS PRODUCIDAS POR LA PLANTA
COCA COLA EN EL FORMATO 400 ML DURANTE EL MES DE JULIO
DEL 2010.
CUADRO N 03
Fuente: rea de Produccin
Elaboracin: Ing. Marco Marchena Pereda.
III. PARA VARIABLE CONTINUA

Ejercicio:
A continuacin se presentan los gastos
en soles correspondientes a las
compras de 40 clientes que realizan en
la tienda Saga Falabella y que solicitan
un incremento de crdito.

Identifique la Unidad de Estudio, la
Variable y la Muestra.
Elaborar un cuadro de distribucin
de Frecuencias.
370 445 320 460 540 379 420 570
348 470 315 365 470 390 430 303
437 530 380 540 305 475 598 382
310 320 415 590 490 580 355 475
570 395 560 330 360 530 405 485
CONSTRUCCION DE CUADROS DE FRECUENCIAS
CONSTRUCCION DE CUADROS DE FRECUENCIAS
PARA UNA VARIABLE CUANTITATIVA CONTINUA:
Pasos a Seguir:

Determinacin del recorrido o rango R. R=Vmax - Vmin
Determinacin del nmero de intervalos m , donde m=1+3.322 log n
(Redondeo)
Determinacin de la amplitud de cada intervalo A, donde A= R / m
(Inmediato superior)
Determinacin del nuevo rango R2.
Determinacin de los intervalos y construccin del cuadro estadstico
PASOS:
DETERMINAR :

EL RANGO (R) (Vmax Vmin)
R = 598 303 = 295


EL NMERO DE INTERVALOS
(m)
m = 1+3.322 log n
m = 1 + 3.322 log (40) = 6.32
6

AMPLITUD INTERVLICA (A)
A = R/m = 295/6 = 49.16 = 50

NR - R = 300 295 = 5
1
2
3
5
INTERVALOS:
La diferencia es grande, entonces equilibrar.
NUEVO RANGO. NR = A x m
NR = 50 x 6 = 300
4
CONSTRUCCION DE CUADROS DE FRECUENCIAS
370 445 320 460 540 379 420 570
348 470 315 365 470 390 430 303
437 530 380 540 305 475 598 382
310 320 415 590 490 580 355 475
570 395 560 330 360 530 405 485
MONSTOS
Soles
Clientes
fi
Fi hi% Hi% Yi
300 350 8 8 20 20 325
350 400 9 17 23 43 375
400 450 6 23 15 58 425
450 500 7 30 17 75 475
500 550 4 34 10 85 525
550 600 6 40 15 100 575
TOTAL 40 100
MONTOS EN SOLES CORRESPONDIENTES A LAS COMPRAR DE 40 CLIENTES DE
SAGA FALABELLA, AO 2010.
CUADRO N 05
* Compras realizadas en Saga Falabella de la Ciudad de Trujillo
Fuente: Departamento de Ventas Saga Falabella
Elaboracin: Lic. Jos Lus Soto Avalos.
CONSTRUCCION DE CUADROS DE FRECUENCIAS
DEFINICIN:

Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el
comportamiento de una variable en estudio.

Los grficos estadsticos son representaciones de informacin real que existe en
nuestro mundo, es una expresin artstica de datos reales y observados.

Un grfico sirve tambin para comparar visualmente el comportamiento de dos o
ms variables similares o relacionadas.
2. GRAFICO ESTADSTICO
PARTES:

Numeracin
Titulo
Diagrama
Escalas
Fuente
DISTRIBUCIN DE CLIENTES DE UNA FINANCIERA SEGN
LUGAR DE PROCEDENCIA . TRUJILLO. MARZO 2010
Fuente: Cuadro Estadstico de la Entidad Financiera
GRAFICO N 01
Numeracin
Titulo
Diagrama
Escalas
Fuente
N DE CLIENTES
CAJAMARCA
CHICLAYO
HUARAZ
LIMA
TRUJILLO
PRINCIPALES TIPOS DE GRAFICOS:
Hay varias formas de hacer la representacin grfica de un conjunto de datos
estadsticos.
Presentaremos aqu los mas utilizados:
a. Grafico de bastones
b. Histograma de frecuencias
c. Polgono de frecuencias
d. Grafico de barras: simples,
dobles y mltiples
e. Grafico de Series de tiempo
f. Grafico de dispersin
g. Grafico de cajas y bigote
h. Grafico de pastel-sectorial-
pye
i. Etc.
a. V. Cuantitaiva Discreta
b. V. Cuantitativa Continua
c. V. Cuantitativa Continua
d. V. Cualitativa Nominal
Ordinal.
e. V. Cuantitativa en el tiempo
f. V. Cuantitativas Continuas
g. V. Cuantitativa Continua -
Cualitativa
h. V. Cualitativas.
Grafico N 01
DISTRIBUCIN DE 20 EMPRESAS PRODUCTORAS DE CALZADO DE VESTIR
SEGN SU NMERO DE TRABAJADORES EN EL DISTRITO EL PORVENIR .
TRUJILLO. MARZO 2011
fi., hi
frecuencias
Valores discretos
Fuente: Cuadro N 01
X1 X2 X3 X4 X5 . . . Xn
1. GRAFICO DE BASTONES
2. HISTOGRAMA DE FRECUENCIAS
Intervalos
Amplitud Intervlica
Frecuencias
simples
Grfico N 02
DISTRIBUCIN DE TRABAJADORES DE UNA AGENCIA DEL
BCP SEGN SU SUELDOS EN EL DISTRITO LA
ESPERANZA. TRUJILLO. MARZO 2011
Fuente: Cuadro N 02
8
9
6
7
4
6
0
2
4
6
8
10
300 - 350 350 - 400 400 - 450 450 - 500 500 - 550 550 - 600
fi, hi
Intervalos
Frecuencias
Simples (hi%)
Grafico N 03
Fuente: Of. RRHH
DISTRIBUCIN DE TRABAJADORES DE EMPRESAS
PRODUCTORAS DE CALZADO DE VESTIR SEGN SU SUELDOS EN
EL DISTRITO EL PORVENIR . TRUJILLO. MARZO 2010
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
483 800 1,117 1,434 1,751 2,068 2,385
P
e
r
c
e
n
t

Sueldo
Frequency Polygon
3. POLIGONO DE FRECUENCIAS:
4. OJIVAS:
Ojiva: Es la representacin grfica de una distribucin de frecuencias absolutas acumuladas o relativas acumuladas.
Ojiva menor que: Es la representacin grfica de una distribucin de frecuencias absolutas acumuladas o relativas
acumuladas menores que (en orden descendente las F
i
o H
i
).
Ojiva mayor que: Es la representacin grfica de una distribucin de frecuencias absolutas acumuladas o relativas
acumuladas mayores que (en orden ascendente las F
i
o H
i
).


GRAFICO N 03
DISTRIBUCIN DE LAS VIVINEDAS DEL DISTRITO DE FLORENCIA
DE MORA SEGN TENENCIA DE SERVICIOS BASICOS EN LOS AOS
2000 Y 2005 - FONCODES
Fuente: Oficina de FONCODES
fi, hi
Frecuencia
Leyenda
5. GRAFICO DE BARRAS:
El diagrama de dispersin es una herramienta de anlisis que muestra pares
relacionados de variables que presentan un posible patrn relacionado.
Se usa en el anlisis de regresin lineal simple.
6. DIAGRAMA DE DISPERSIN:
7. GRAFICO DE PUNTOS:
Consiste en colocar un punto cada vez que se repite un valor. Permite detectar la presencia de
valores anormales (outliers).
Se usan para datos cualitativos o cuantitativos discretos



Distribucin de familia

.
: :
: : :
. : : :
. : : : : .
---+---------+---------+---------+---------+---------+---familia
1.0 2.0 3.0 4.0 5.0 6.0
Permite tener una idea visual de la distribucin de los datos, es decir, determinar
si hay simetra o no en la distribucin de sus datos.
Es til para comparar grupos, detectar outliers, valores anormales, valores
atpicos.
La grfica puede ser representada en forma vertical u horizontal.
8. GRAFICO DE CAJAS Y BIGOTE:
max
X
min
X
Bigote superior
Bigote inferior
1 Q
3
Q
Me Q =
2
1
Q
3
Q
1
Q
Me Q =
2
Anlisis de Simetra
Asimetra Negativa o
a la Izquierda
Asimetra Positiva o
a la Derecha
3
Q
1
Q
Me Q =
2
Las grficas de control son
herramientas estadsticas que
permiten analizar el comportamiento
de un proceso a travs del tiempo
(monitoreo).
Permiten analizar las variaciones
existentes en un proceso comparando
los datos actuales con los histricos.

9. CARTAS DE CONTROL:
10. GRAFICO DE SERIES
DE TIEMPO:
Analiza una variable cuantitativa a travs del tiempo.
Determinar los diferentes patrones de comportamiento
que tienen la variable en estudio. Es una lnea
poligonal, construida sobre un plano cartesiano. En el
eje X se ubica el tiempo (aos, meses, etc). En el eje Y
los valores de las variables en estudio (produccin,
PBI, Inflacin, etc)
GRAFICO N 05
N DE EGRESADOS DE LAS CARRERAS DE INGENIERIA
TRUJILLO 2000-2010
Fuente: ANR Tiempo
0
500
1000
1500
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
N DE EGRESADOS
- Se utilizan cuando se tiene informacin de una variable cualitativa.
- Se trata de un crculo, cuya rea se divide en sectores proporcionales a las partes
integrantes de un total.
- Para la representacin es necesario establecer primero el porcentaje de cada elemento,
respecto del total.
- A continuacin los 360 se reparten en proporcin a los respectivos porcentajes.
- Luego se dibujan los sectores cuyos radios lmites forman los ngulos calculados
mediante la relacin anterior.
11. GRAFICO SECTORIAL:
Medidas estadsticas
Medidas de posicin
Medidas de Variabilidad
Medidas de Forma
Es un valor, es un nmero que se obtiene de la muestra.
Llamado tambin INDICADOR o Medida Resumen.
MEDIDA ESTADSTICA :
Medidas Estadsticas
Medidas de Posicin
Tendencia Central
Localizacin
Medidas de variacin
o dispersin
Medida de
asimetra
Medida de apuntamiento
o Kurtosis
La Media aritmtica
La media
geomtrica
La media armnica
La media cuadrtica
La mediana
La moda
Los cuartiles
Los deciles
Los percentiles

Rango
Varianza
Desviacin Estndar
Coeficiente de
Variacin
Coeficiente
de
Asimetra
Coeficiente
de
Kurtosis
Medidas de forma

VARIABLES
CUANTITATIVAS








Tendencia Central (media, mediana, moda)
Localizacin (cuartiles, deciles, percentiles)

Centro de Distribucin
Localizacin

1. MEDIDAS DE POSICIN
LA MEDIANA:
Me = 12,5
50% son menores a 12,5 50% son mayores a 12,5
- Se denota por Me.
- Es el valor que divide al conjunto de datos en dos partes iguales. La
mitad de ellos son menores a Me y la otra mitad son mayores a Me. 50%
cada uno
Vmn
Vmax
50%
50%
0
5
10
15
20
25
1 2 3 4 5 6
0
5
10
15
20
25
1 2 3 4 5 6
0
5
10
15
20
25
1 2 3 4 5 6
Mediana
Mediana
Mediana
50%
50%
50%
50%
50%
50%
a. Medidas de Tendencia Central
La Moda:
- Se denota por Mo
- Se define como el valor que ms repite en un conjunto de datos.
- Tambin se le conoce como el valor ms frecuente o comn.
- Un conjunto de datos puede presentar los siguientes casos:
0
5
10
15
20
25
30
1 2 3 4 5 6
0
2
4
6
8
10
12
1 2 3 4 5 6
0
5
10
15
20
25
30
1 2 3 4 5 6
Amodal : Sin moda
Unimodal : 1 moda
Bimodal : 2 modas
Trimodal : 3 modas

0
5
10
15
20
25
1 2 3 4 5 6
CUARTILES
Se denotan por Q1, Q2 y Q3
Son los valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cuatro partes iguales.
Q2 = Me
Valor Mnimo
Valor Mximo
25% 25% 25% 25%
Q3 Q1
50%
75%
b. Medidas de Tendencia Central
DECILES

Se denotan por D1, D2 y D9
Son los valores que dividen a un conjunto de datos
ordenados en forma ascendente o descendente en diez
partes iguales.
Valor Mnimo Valor Mximo
10%
D1
10% 10% 10% 10% 10% 10%
10% 10% 10%
D2 D3 D4 D5 D6 D7 D8 D9
PERCENTILES

Se denotan por P1, P2 y P99
Son los valores que dividen a un conjunto de datos ordenados en
forma ascendente o descendente en cien partes iguales.
Valor Mnimo Valor Mximo
1%
P1
1%
P2
1%
P98
1%
P99 P50

Varianza, desviacin estndar, rango, coeficiente de variacin.

Dispersin

Dispersin Grande

Dispersin Pequea
2. MEDIDAS DE VARIACIN O DISPERSIN
RANGO
Mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor ms elevado y el valor ms bajo
VARIANZA
Mide la variabilidad entre los valores de la serie y la media, pero en
unidades elevadas al cuadrado. No se puede interpretar.




DESVIACIN ESTNDAR
Mide la variabilidad de un conjunto de datos con respecto al promedio pero
en unidades originales. Es la raz cuadrada positiva de la varianza.
2
n
2
i=1
(Xi-X)
V(x)=S =
n-1

2
m
2
i=1
fi(Yi-X)
V(x)=S =
n-1

Sin Agrupar Agrupados


DS(x)=S= V(X) COEFICIENTE DE VARIACIN
2
S
CV(x)= .100
X
El inters del coeficiente de variacin es determinar
si un conjunto de datos es homogneo o
heterogneo,
Compara con un valor convencional (33%).

Medidas de Asimetra y Curtosis.

ASIMETRA CURTOSIS
Distribucin
Simtrica.
Asimetra
Positiva
Asimetra
Negativa
M(x) = Me = Mo
Mo < Me < M(x)
M(x) < Me < Mo
Leptocrtica
Mesocrtica
Platicrtica
3. MEDIDAS DE FORMA
( )
3
3
nS
x x
CAs
i


=
( )
3
3
nS
x Y f
CAs
i i


=
ASIMETRA
( )
3
4
4

nS
x x
K
i
( )
3
4
4

nS
x Y f
K
i i
CURTOSIS
Datos sin Agrupar Datos Agrupados
Datos sin Agrupar Datos Agrupados
El concepto de asimetra de
una distribucin indica la
deformacin horizontal de las
distribuciones de frecuencia.
El concepto de curtosis de una
distribucin indica la
deformacin vertical de las
distribuciones de frecuencia,
es decir la medida de
apuntamiento o achatamiento
de una distribucin.
CAs < 0 asimetra negativa; CAs = 0 distribucin simtrica; CAs > 0 asimetra
positiva.
K > 0 Leptocrtica; K = 0 Mesocrtica; K < 0 Platicrtica
E
S
T
A
D
I
S
T
I
C
A

Anlisis de Correlacin
y
Regresin Lineal Simple
El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin
o afinidad entre las variables cuantitativas consideradas en un estudio.
1. ANLISIS DE CORRELACIN:
Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre
dos variables. Se llamar CORRELACION LINEAL O RECTILINEA si la funcin es
una recta, y de CORRELACION NO LINEAL cuando la funcin es una curva o una
funcin de grado superior.
El COEFICIENTE DE CORRELACION DE PEARSON, es el estadgrafo que mide el
grado de asociacin o afinidad entre las variables cuantitativas y se denota por r la
cual se define como:


= = = =
= = =

=
n
i
n
i
i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
Y Y n X X n
Y X Y X n
r
1
2
1
1
2
1 1
2 2
1 1 1
) ( ) (
-1 -0.7 -0.4 0 0.4 0.7 +1
Perfecta Alta Regular Baja Baja Regular Alta Perfecta
N E G A T I V A P O S I T I V A
Interpretacin:
DIAGRAMA DE DISPERSION:
E
S
T
A
D
I
S
T
I
C
A

2. ANLISIS DE REGRESIN:
Es una tcnica estadstica que consisten en determinar la relacin funcional entre
dos variables cuantitativas en estudio.
Esta relacin funcional, es una ecuacin matemtica de la forma Y= A + B X, que
recibe el nombre tambin de Funcin de Regresin o Modelo de Regresin.
A la variable Y se le denomina variable dependiente, a la variable X independiente
y a A, B se les llama parmetros de la ecuacin de regresin.
La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacer
estimaciones futuros de la variable dependiente.

Pasos a seguir:


= =
= = =

=
n
i
n
i
i i
n
i
n
i
i i
n
i
i i
X X n
Y X Y X n
B
1
2
1
2
1 1 1
) (
X B Y A =
Realizar el diagrama de dispersin y ver el comportamiento de la variable.
Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los
parmetros de la ecuacin. Las formulas son las siguientes:

Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacin
matemtica el respectivo valor de Xo, de la siguiente manera:
Y = A + B (Xo)
Ecuacin de la recta
a: Ordenada en el origen o intercepto, distancia
entre el origen y el punto en que la recta corta al eje
Y, puede ser +, - 0.
b: Coeficiente de regresin, expresa la cantidad en
la que vara Y cuando X aumenta en una unidad, puede
ser +, - 0
Qu tan bueno es el modelo?
Coeficiente de determinacin
Porcentaje de la variabilidad de Y que es explicada por la ecuacin
de regresin ajustada.
> 0.70 entonces, el modelo es adecuado.
Donde: r= coeficiente de correlacin lineal.
E
S
T
A
D
I
S
T
I
C
A

El gerente de BCP esta haciendo un estudio entre el gasto de mantenimiento de
sus computadoras y el ao de antigedad de dichas maquinas. Para esto recurre a
la oficina de Mantenimiento y Contabilidad obteniendo la siguiente informacin:
N de
maquina
Tiempo de
antigedad
(aos)
Costo de
mantenimiento.
($)
1 1 14
2 1 16
3 2 20
4 2 24
5 3 30
6 3 28
1. Realice el diagrama de dispersin.
2. Estime la ecuacin de regresin
lineal.
3. Estime cuanto sera el costo de
mantenimiento de una computadora
que tiene 7 aos.
4. Calcule e interprete el valor del
coeficiente de regresin lineal r
Solucin
APLICACIN 1:
APLICACIN 2:
El dueo de una licorera est interesado en medir el efecto del
precio de las botellas de whisky escocs sobre la cantidad vendida.
Los resultados de la tabla adjunta se obtuvieron de una muestra
aleatoria de las ventas de ocho semanas. El precio est medido en
dlares y las ventas en cajas:
PRECIO 192 205 197 213 208 199 178 172
VENTAS 25 14 18 12 11 15 29 35
A. Estimar la recta de regresin para
las ventas.
B. Estimar cunto ser la cantidad
vendida si el precio de la caja es
de 200 dlares.
Determinacin del tamao de
muestra
Muestreo
Tcnicas de muestreo
Pasos en la determinacin del tamao de
muestra.
Frmulas en el MAS.
Parmetros
1. Muestreo:
Es una tcnica estadstica por la cual se realizan
inferencias a la poblacin examinando solo una muestra.
Es una tcnica empleada para seleccionar elementos de
una poblacin.
Por su gran importancia los investigadores lo utilizan en
los diferentes campos de saber y tambin lo usamos en la
vida diaria.
2. TCNICAS DE MUESTREO:
Tcnicas de Muestreo
No Probabilstico Probabilstico
Simple Sistemtico
Estratificado Conglomerados
Conveniencia Por Juicio Por Cuota
3. PASOS A SEGUIR PARA DETERMINAR LA
MUESTRA:
1 Identificar el tipo de variable a analizar.
2 Asumir que la poblacin es infinita y aplicar la formula respectiva
sealadas anteriormente.
Esta muestra se llama muestra previa.
3 Luego si se conoce el tamao de la poblacin N, obtener la fraccin de
muestreo
N
n
0
- Si
% 5
0
<
N
n
, entonces la muestra definitiva es n
0
(muestra previa)
- Si
% 5
0
>
N
n
, entonces se ajusta la muestra.
4 Para ajustar la muestra se tiene que aplicar la siguiente formula:
N
n
n
n
0
0
1+
=
, n es la muestra final.

2
2
0
E
PQ Z
n =
2
2 2
0
E
S Z
n =
PQ Z N E
PQN Z
n
2 2
2
) 1 ( +
=
2 2 2
2 2
) 1 ( S Z N E
N S Z
n
+
=
VARIABLE
Cualitativa
(Proporcin Poblacional)
Cuantitativa
(Promedio Poblacional)
POBLACION
INFINITA
(Cuando no
se conoce N)
POBLACION
FINITA
(Cuando se
conoce N)
4. FRMULAS PARA CALCULAR EL TAMAO
DE MUESTRA

Z= es el valor de la distribucin normal estandarizada para un nivel de
confianza fijado por el investigador. (90%, 95%, 99%)

S= Desviacin estndar de la variable fundamental del estudio o de
inters para el investigador. Obtenida por estudios anteriores, muestra
piloto, o por criterio de experto.

P= es la proporcin de la poblacin que cumple con la caracterstica de
inters. (Obtenida por estudios anteriores, muestra piloto, criterio de
experto, asumir p=50%)

E= Error de estimacin. Absoluto Relativo. Fijada por el investigador.
N=Tamao de la poblacin.

5. PARMETROS
ESTIMACION DE LOS VALORES A APLICAR EN LAS FORMULAS
A. Valor de Z: es el valor de la abcisa de la distribucin normal
estandarizada teniendo en cuenta el nivel de confianza fijado por el
investigador, por lo tanto este valor se encuentra en las tablas estadstica
respectiva. Para hacer el trabajo menos tedioso, presentamos a
continuacin los diferentes valores de Z.
TABLA N 01

VALORES DE LA DISTRIBUCIN NORMAL
ESTANDARIZADA(Z)
Nivel de
confianza
(1-o)
Nivel de
significancia
(o)
Valor Z
Bilateral Unilateral
90% = 0.90
95% = 0.95
99% = 0.99
10% = 0.10
5% = 0.05
1% = 0.01
1.64
1.96
2.58
1.28
1.64
2.32
B. Clculo del Valor de P: Se calcula este valor cuando la variable de
estudio es cualitativa.
TABLA N 02

COMPORTAMIENTO DE P y Q

P Q=1-P PQ
0.05
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95
0.95
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.05
0.0475
0.090
0.160
0.210
0.240
0.250
0.240
0.210
0.160
0.090
0.0475
Prueba de hiptesis
Es un enunciado acerca del valor de un parmetro poblacional.

Qu es una hiptesis estadstica?
Qu es una Prueba de Hiptesis?
Es un procedimiento basado en la informacin muestral y en la teora
de probabilidad, para determinar si una hiptesis estadstica debe ser
aceptada o rechazada.
DEFINICIONES PRELIMINARES
Qu es una hiptesis?
Es un respuesta a priori a un problema..

Qu clases de hiptesis existen?
HIPOTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un
parmetro poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando
toma un valor especfico.
HIPOTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula.
Error Tipo I:
Se comete este error cuando se rechaza la hiptesis nula, cuando es
verdadera.
Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
Se comete este error cuando se acepta la hiptesis, cuando es falsa.
Se denota por = P(Aceotar Ho/Ho es falsa)
Qu errores se cometen en una prueba de hiptesis?
Tipos de Pruebas de Hipotesis:
Prueba de cola inferior o
izquierda
Ho: u = u
0

H
1
: u < u
0

Prueba de cola superior o
derecha
Ho: u = u
0

H
1
: u > u
0

Ho: u = u0
H1: u = u0

Prueba Bilateral o de dos colas:
Prueba de una cola:
o
o
o/2 o/2
1. Plantear la hiptesis nula y alternativa. (Ho y H1)
2. Especificar el nivel de significancia (Generalmente la plantea
el investigador). ( =0.05, 0.01)
3. Calcular un valor experimental: Estadstico de prueba que
debe ser especificado en trminos de un estimador del
parmetro a probar.
4. Calcular el valor critico: Valor que se encuentra el la tabla
de Probabilidades, que es valor que determinara la regin
de aceptacin y rechazo.
5. Tomar la decisin de aceptar o rechazar Ho.
6. Dar conclusin respectiva
ETAPAS DE UNA PRUEBA DE HIPTESIS
METODO TRADICIONAL
METODO MODERNO
1. Plantear la hiptesis nula y alternativa. (Ho y H1)
2. Observar el valor p (significancia)
Si p< 0.05 RECHAZAR Ho
Si p 0.05 ACEPTAR Ho
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Prueba de hiptesis para la media de una Poblacin,
desviacin estndar poblacional conocida o muestras grandes
Cuando se plantean hiptesis para la media de la
poblacin y la desviacin estndar poblacional es
conocida o el tamao de la muestra es grande, el
estadstico de prueba est dado por:





el cual se distribuye como una Normal de media 0 y
desvo estndar 1.
) 1 , 0 (
n /
N
x
z ~

=
o

8-12
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Cuando se plantean hiptesis para la proporcin de
la poblacin, el estadstico de prueba est dado
por:


donde


el cual se distribuye como una Normal de media 0 y
desvo estndar 1
Prueba de hiptesis para la proporcin de una poblacin,
) 1 , 0 ( N
p p
z
p
Ho
~

=
o
n
q p
Ho Ho
p
*
= o
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Cuando se plantean hiptesis para la media de la
poblacin y la desviacin estndar poblacional es
desconocida y el tamao de la muestra es
pequeo, el estadstico de prueba est dado por:





el cual se distribuye como una t de Student con n-1
grados de libertad.
Prueba de hiptesis para la media de una poblacin,
desviacin estndar desconocida y tamao muestral pequeo
1
1
n /
=

=
n gl
n
t
S
x
t

Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Prueba de hiptesis para dos medias
desviacin estndar poblacional conocida o muestras grandes
Muestras independientes
Cuando se plantean hiptesis para la diferencia de
medias de dos poblaciones y las desviaciones
estndar poblacionales son conocidas o el tamao de
la muestra es grande, el estadstico de prueba est
dado por:




el cual se distribuye como una Normal de media 0 y
desvo estndar 1.

) 1 , 0 (
( ) (
2
2
2
1
2
1
) 2 1 2 1
N
n n
x x
z ~
+

=
o o

Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Prueba de hiptesis para dos medias
desviaciones estndar poblacionales desconocidas pero
iguales y muestras pequeas - Muestras independientes
Cuando se plantean hiptesis para la diferencia de medias de
dos poblaciones y las desviaciones estndar poblacionales son
desconocidas y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:

;donde


el cual se distribuye como una t de Student con n
1
+n
2
-1 grados
de libertad

2
2 1
2
1 2 1
2 1
)
1 1
(
) ( ) (
+ =
~
+

=
n n gl
p
t
n n
S
x x
t

) 1 ( ) 1 (
* ) 1 ( * ) 1 (
2 1
2
2 2
2
1 1 2
+
+
=
n n
S n S n
S
p
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Prueba de hiptesis para dos medias
desviaciones estndar poblacionales desconocidas, distintas
y muestras pequeas - Muestras independientes
Cuando se plantean hiptesis para la diferencia de medias de
dos poblaciones y las desviaciones estndar poblacionales son
desconocidas y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:

;donde parte entera


el cual se distribuye como una t de Student con v grados de
libertad

v gl
t
n
S
n
S
x x
t
=
~
+

=
) (
) ( ) (
2
2
2
1
2
1
1 2 1

) 1 (
) (
) 1 (
) (
) (
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

+
=
n
n
S
n
n
S
n
S
n
S
v
Material Preparado por Lic. Olga Susana Filippini y Lic. Hugo Delfino
Prueba de hiptesis para dos medias
desviacin estndar poblacional conocida o muestras
grandes Muestras relacionadas o dependientes
Cuando las muestras estn relacionadas y se quiere probar
si luego de aplicar un tratamiento las medias difieren
(antes/despus) y las desviaciones estndar poblacionales
son desconocidas y el tamao de la muestra es pequeo, el
estadstico de prueba est dado por:

donde


el cual se distribuye como una t de Student con n-1 grados
de libertad.
1 =
~

=
n gl
d
d
t
n
s
d
t

n
x x
n
d
d
n
i
i
n
i
i
= =

= =
1
2
1
) (
1
) (
1
2
2

=
n
d d
S
n
i
i
d
MUCHAS GRACIAS

Вам также может понравиться