Вы находитесь на странице: 1из 154

HUANCAVELICA

FACULTAD DE CIENCIAS DE
INGENIERIA
E.P. ING. CIVIL

SESIN N 04

Presentado por:

Carlos Enrique Espinoza


Quispe
LAS VARIABLES
ESTADSTICAS
Escalas de medida

NOMINAL O DE DE ORDEN INTERVALOS


CLASIFICACIN JERRQUICO RAZN
IGUALES

Clase social, Sistemas N de


Sexo,
nivel digesimal, hijos,
ciudad,
educativo, vigesimal, ingresos,
situacin centesimal,
escalas de etc. Fecha antigeda
laboral,
actitud del d, edad,
religin, etc.
(likert), etc. calendario, etc.
factoriales,
test, etc.
Definicin: Es un nivel de probabilidad de equivocarse, y
que fija de manera a priori el investigador.

La probabilidad de que un evento ocurra oscila entre 0 y 1;


donde 0 significa la imposibilidad de ocurrencia y 1 la certeza de
que el fenmeno ocurra.
Con qu porcentaje de confianza el investigador
generaliza sus resultados?
Nivel de Significancia de 0,01. O sea el investigador tiene 99% a su favor y 1% en
contra. Para generalizar su resultados sin temor.
Nivel de Significancia de 0,05. O sea el investigador tiene 95% a su favor y 5% en
contra. Para generalizar su resultados sin temor.
Nivel de Significancia de 0,10. O sea el investigador tiene 90% a su favor y 10% en
contra. Para generalizar su resultados sin temor.

Cuando los resultados son significativos al nivel del 0,05


(p<0,05) se concluye que: Existe 5% de probabilidad de error al
aceptar la hiptesis, influencia, correlacin o valor obtenido al
aplicar una prueba estadstica.
Definicin: Es la
representacin grfica de la
distribucin normal de
probabilidades en un sistema
de coordenadas
Caractersticas:
rectangulares.
Es unimodal.
La base est dada en unidades
de desviacin estndar
(puntuaciones Z), de -3s a +3s. 1 x 2
La asimetra es 0. 1
2( )

y e
Es mesocrtica. 2
La media, mediana y moda
coinciden en el mismo punto.
El rea total de la grfica es 1.00.
PARMETROS p1 ,
m1 ,
Caractersticas medibles de una
POBLACIN. x1
Representadas por letras griegas.
VALOR FIJO para una poblacin dada.
s12
P
m2 ,
p2 ,

x2
s22

ESTADSTICOS
Caractersticas medibles de una
MUESTRA, usadas para estimar
parmetros poblacionales.
Representadas por letras latinas.
VARIABLE para la poblacin, fija para la
muestra dada.
ESCALAS DE MEDICIN Y PRUEBAS ESTADSTICAS
PRUEBAS
TIPO DE
ESCALAS ESTADISTICOS PERMITIDOS ESTADISTICAS
RELACION PERMITIDAS
Moda
NOMINAL IGUALDAD Distribucin de Frecuencias.
Coeficiente de Contingencias
Cuartiles, Deciles y Percentiles No
Mediana
paramtricas
ORDINAL MAYOR QUE Coeficiente de Spearman
Coeficiente de Kendall
Chi Cuadrada
Media Aritmtica
Varianza/Desviacin Tpica o Estndar
Coeficiente de Pearson
t de Student y/o Prueba Z

IGUALDAD DE Anlisis de Varianza


INTERVALOS
INTERVALOS Anlisis de Covarianza
Anlisis Multivariado de Varianza Paramtricas
Anlisis Lineal de Patrones
Anlisis Discriminante
Asimetra y la Kurtosis
Media Geomtrica
IGUALDAD DE
RAZON Coeficiente de Variacin
RAZONES
MODA
Definicin : Valor de la variable con mayor frecuencia

Caractersticas
til para medidas nominales y ordinales

No se afecta por valores extremos

Se puede utilizar con clases abiertas

Puede no existir o no ser nica

Datos sin agrupar

Mo = 455
1) Determinar la clase que contiene la Moda
Li 375
2) Realizar la interpolacin para hallar el valor de

1
Mo Li h
1 2

= 12 4 = 12 7
=8 =5

8
Mo 375 15 375 9.23 384.23
85
Extensin del intervalo h = 390-375
Forma grafica de
determinar la moda h Extensin del intervalo

Diferencia
entre la 1 Diferencia
frecuencia de entre la
2
la clase modal frecuencia de
y la clase la clase modal
anterior y la clase
siguiente

Li Mo x
Limite inferior de la clase
modal
EJEMPLO 1:
En un estudio en particular estaban
interesados en evaluar el nmero
de frutos por planta de zapallo. Se
consider solo las plantas de una
parcela; para cada planta se cont
la cantidad de frutos que tenan.
Los datos se presentan en forma
aleatoria a continuacin :

1 5 7 4 1 2 5 4
6 2 7 5 7 6 3 2
5 4 3 6 6 3 4 4
1 4 3 5 4 4
variable xi fi frecuencia
1 3
2 3
Hay 3
3 4 zapallos
4 8 con 2
5 5 frutos
6 4
7 3 Hay 4
zapallos con
N=30
6 frutos
FRECUENCIA ACUMULADA
RELATIVAFRECUENCIA
PORCENTUAL
REALTIVA
FRECUENCIA
PORCENTUAL
ACUMULADA
FRECUENCIA
FRECUENCIA RELATIVA
RELATIVA
ACUMULADA

xi fi F fr Fr fr% Fr%

1 3 3 1/10 1/10 10 10
2 3 6 1/10 1/5 10 20
3 4 10 2/15 1/3 13.33 33.3
4 8 18 4/15 3/5 26.67 60
5 5 1/6 23/30 16.67 76.67
6 4 2
27 2/15 97/10 13.33 90
3
7 3 30 1/10 1 10 100
N=30 1 100
Fuente: Datos brindados por la ctedra
Elemplo 2:
Siguiendo con el estudio del zapallo japons
ahora estamos interesados en evaluar el peso de
los zapallos para eso registramos su peso en
kilogramos. Tom una muestra de 30 zapallos

Variable: peso tipo cuantitativa continua


Muestra 30 zapallos
DATOS:

1.20 1.20 1.20 1.30 1.30 1.30


1.60 1.60 1.60 1.60 1.60 1.60
1.40 1.50 1.50 1.50 1.50 1.50
1.70 1.70 1.70 1.70 1.80 1.80

1.60 1.90 1.80 1.80 2.00 1.90

1 PASO: CALCULAR EL RANGO DE LOS DATOS. QUE


ES LA DIFERENCIA ENTRE EL MAXIMO VALOR Y EL
MINIMO

R= xM-xm= R= XM-xm = 2.00-


1.20=0.80
2PASO: CALCULAR LA CANTIDAD DE
INTERVALOS
Regla de Sturges: K=1,322logN
Alternativamente se puede utilizar: K=5
log N
O sino: K= ; donde 25<N<400
Frmula para calcular la cantidad de
intervalos Con la Ley de Portugal:

K=1+3.322*logN: N<50
K=1,8914+3,9910logN: 50<N<100
K=2,7560+5,8154logN: N>100

1+3.322log 30=5.67
6
3 PASO: CALCULAR LA AMPLITUD DEL
INTERVALO

AMPLITUD= RANGO/N DE INTERVALOS

0.80/6=0.1333 0.15

La amplitud del intervalo es 0.15


SI COMENZAMOS CON 1.10

Clase xi
MARCA DE
CLASE
(1.10-1.25] 1.18

(1.25-1.40] 1.33

(1.40-1.55] 1.48

(1.55-1.70] 1.63

(1.70-1.85] 1.78

(1.85-2.00] 1.93
Clase xi fi fr Fi Fr fr% Fr%

1 (1.10-1.25] 1.18

2 (1.25-1.40] 1.33

3 (1.40-1.55] 1.48

4 (1.55-1.70] 1.63

5 (1.70-1.85] 1.78

6 (1.85-2.00] 1.93
1.20 1.20 1.20 1.30 1.30 1.30 1.40

1.50 1.50 1.50 1.50 1.50 1.60 1.60

1.60 1.60 1.60 1.60 1.60 1.70 1.70

1.70 1.70 1.80 1.80 1.80 1.80 1.90


1.90 2.00
Clase xi fi Fr Fi Fr fr% Fr%

1 (1.10-1.25] 1.18 3 0.10 3 0.10 10 10

2 (1.25-1.40] 1.33 4 0.13 7 0.23 13 23

3 (1.40-1.55] 1.48 5 0.17 12 0.40 17 40

4 (1.55-1.70] 1.63 11 0.37 23 0.77 37 77

5 (1.70-1.85] 1.78 4 0.13 27 0.90 13 90

6 (1.85-2.00] 1.93 3 0.10 30 1.00 10 100


GRAFICOS: HISTOGRAMA
Cantidad de zapallos segn peso

12
cantidad de zapallos

10

2
3
0
0.03 1.18 1.33 1.48 1.63 1.78 1.93 2.08

peso
Fuente: Datos brindados por la ctedra
POLIGONO DE FRECUENCIAS

Fuente: Datos brindados por la ctedra


Fuente: Datos brindados por la ctedra
Permite ayudarnos a determinar si existe relacin de
interdependencia entre 2 variables, es decir, si se
influyen mutuamente.

donde nij es el nmero de


observaciones que
presentan simultneamente
las caractersticas i, j de las
variables A y B,
respectivamente.

As, una tabla de contingencia es una una


tabla de doble entrada, donde en cada casilla
figurar el nmero de casos o individuos que
poseen un nivel de una de las caractersticas
analizadas y otro nivel de la otra
caracterstica.
Se define el cuantil de orden como un valor de la variable
por debajo del cual se encuentra una frecuencia acumulada
Casos particulares son los percentiles, cuartiles, deciles,
quintiles,...
Percentil de orden k = cuantil de orden k/100
La mediana es el percentil 50
El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%

Decil de orden k = cuantil de orden k/10


La mediana es el decil 5
El decil de orden 8 deja por debajo al 80% de las observaciones.
Por encima queda el 20%

Cuartiles: Dividen a la muestra en 4 grupos con


frecuencias similares.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75
El 5% de los recin nacidos tiene un peso demasiado
bajo. Qu peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05

Percentil 5 del peso


25
20
frecuencia

15
10
5
0

1 2 3 4 5

Peso al nacer (Kg) de 100 nios


Qu peso es superado slo por el 25% de los individuos?
Percentil 75 o tercer cuartil

Percentil 75 del peso


30
25
20
frecuencia

15
10
5
0

50 55 60 65 70 75 80 85

Peso (Kg) de 100 deportistas


El colesterol se distribuye simtricamente en la poblacin.
Supongamos que se consideran patolgicos los valores
extremos. El 90% de los individuos son normales Entre qu
valores se encuentran los individuos normales?
Percentiles 5 y 95
20
15
frecuencia

10
5
0

180 200 220 240 260

Colesterol en 100 personas


Entre qu valores se encuentran la mitad de los individuos
ms normales de una poblacin?
Entre el cuartil 1 y 3
Percentiles 25 y 75
20
15
frecuencia

10
5
0

150 160 170 180 190

Altura (cm) en 100 varones

33
Diagrama de cajas de Tukey: Resumen en 5 nmeros

0.08
Resumen con 5
nmeros:

0.06
Mnimo, cuartiles y
mximo.

densidad

0.04
Suelen dar una buena
idea de la distribucin. Mn. P25 P50 P75 Mx.

0.02
La zona central, caja,

0.00
contiene al 50% central
de las observaciones. 40 45 50 55 60 65

Su tamao se llama Velocidad (Km/h) de 200 vehculos en ciudad

rango intercuartlico
(R.I.) Diagrama de cajas de Tukey: Resumen en 5 nmeros

Es costumbre que los


0.04

bigotes, no lleguen
hasta los extremos,
0.03

sino hasta las


densidad

observaciones que se
0.02

separan de la caja en
no ms de 1,5 R.I. Mn. P25 P50 P75 Mx.
0.01

Ms all de esa
distancia se consideran
0.00

anmalas, y as se
marcan. 80 90 100 110 120 130 140

Velocidad (Km/h) de 200 vehculos en autova


Estadsticos

Nmero de aos de escolarizacin


N Vlidos 1508
Nmero de aos de escolarizacin Perdidos 0
Media 12,90
Porcentaje Mediana 12,00
Frecuencia Porcentaje acumulado Moda 12
3 5 ,3 ,3 Percentiles 10 9,00
20 11,00
4 5 ,3 ,7
25 12,00
5 6 ,4 1,1 30 12,00
6 12 ,8 1,9 40 12,00
7 25 1,7 3,5 20%? 50 12,00
60 13,00
8 68 4,5 8,0
70 14,00
9 56 3,7 11,7 75 15,00
10 73 4,8 16,6 80 16,00
11 85 5,6 22,2 90 16,00
12 461 30,6 52,8
13 130 8,6 61,4
14 175 11,6 73,0
15 73 4,8 77,9
16 194 12,9 90,7
90%?
17 43 2,9 93,6
18 45 3,0 96,6
19 22 1,5 98,0
20 30 2,0 100,0
Total 1508 100,0
MEDIANA ( P50, D5,Q2)
Es el valor de la variable que divide a las observaciones en dos
grupos con el mismo nmero de individuos (percentil 50).
Si el nmero de datos es par, se elige la media de los dos datos
centrales
Si el nmero de observaciones es IMPAR 1, 2, 4, 5, 6, 6, 8

Mn es 5

Si el nmero de observaciones es PAR 1, 2, 4, 4, 5, 6, 6, 8


Mn es
(4+5)/2 = 4,5
Caractersticas
Calculada para datos en escala Ordinal, Intervalo y
Proporcin (razn)
nica para un conjunto dado de datos

Fcil de determinar en datos no agrupados

No es influenciada por valores extremos


La mediana es 5
1, 2, 4, 5, 6, 6, 800.
La media es 117,7

Se puede calcular con clases con extremos abiertos


1) Ordenar los valores de menor a
DATOS
SIN AGRUPAR:
mayor i (n 1)0.5
2) Determinar la posicin i

DATOS
3) Hallar el valor de x en la Mn xi
posicin i
AGRUPADOS:

1) Determinar la posicin (igual que para datos sin agrupar)

2) Determinar la clase que contiene la Mediana

3) Realizar la interpolacin n
para hallar el valor de la Mn
2 Fa
Mn Li h
f
1) Determinar la posicin (35 1) 0.5 18
2) clase que contiene la Mediana Li 375
3) Realizar la interpolacin para hallar el valor
de la Mn
n
2 Fa
Mn Li h
f

35 10
Mn 375 2 15 375 7.5 382.5
12 Extensin del intervalo h = 390-375
Mn (P50)
Los coeficientes rhoi de Spearman, simbolizado por rs, y
tau de Kendall, simbolizado como t, son medidas de
correlacin para variables en un nivel de medicin ordinal,
de tal modo que los individuos u objetos de la muestra
pueden ordenarse por rangos o jerarquas.

Ambos coeficientes varan de -1.0 (correlacin negativa


perfecta) a +1,0 ( correlacin positiva perfecta)

Estadsticas sumamente perfecta para variables ordinales


FORMAS TPICAS DE LOS DIAGRAMAS DE
DISPERSIN ESTADSTICA
La Prueba Chi-
cuadrada
Ch2

Carlos Enrique Espinoza Quispe


Definicin: Es una prueba estadstica Simbologa:
para datos no paramtricos, que se utiliza Ch2=X2
generalmente para evaluar hiptesis
estadsticas acerca de la relacin entre dos Nivel de
variables cualitativas categricas. medicin: Nominal
y ordinal.
Hiptesis a probar: Correlacionales.
Variables involucradas: (2) La Prueba Ch2 no considera
relaciones causales.

Frmula (n 1) S 2
: X
2

2
Donde:
n=nmero de elementos de la muestra.
n-1=nmero de grados de libertad.
S2=Varianza de la muestra.
2=Varianza de la poblacin.
Ejemplo 1:
En un estudio de la capacidad de aprendizaje de Matemtica, en los
nios de una poblacin, se tom una muestra representativa de 40
nios. Se les aplic una prueba de diagnstico del aprendizaje en
Matemtica y con los datos obtenidos se calcul la varianza s 2=8,4,
conociendo que la varianza poblacional es de 2=12,37. Calcular el
valor del estadstico chi-cuadrado.

Solucin: Datos:
n=40. ( n 1 ) S 2
(40 1)(8,4)
S2=8,4 X
2
26,48
2
12,37
2=12,37.

Descripcin y manejo de la tabla:

Si: =0,05 y gl=4gl. X2(4)=9,488


Si: =0,05 y gl=6gl. X2(6)=12,592
Si: =0,05 y gl=10gl. X2(10)=18,307
Ejemplo 2: Marca de
Frecuencia
automvil
Determinar si en este ao la
distribucin de la venta de Ford 18
automviles: Ford, Nissan, Nissan 20
Toyota y Volskswagen en
Huancayo es la misma que la del Toyota 35
ao anterior. Volskswagen 37
TOTAL 100
Solucin:
Paso 1: Distribucin de ventas de automviles.
Paso 2: Hiptesis estadstica:
H0: Las ventas del ao en curso es igual a la del ao anterior.
H1: Las ventas del ao en curso no es igual a la del ao
anterior.
Paso 3: El valor de =0.05.
( fo fe) 2
Paso 4: Estadgrafo de prueba: X
2

fe
X (20, 025;3) 9,348
Valor crtico superior:
Paso 5: valor crtico:
X (20,975;3) 0,216
Valor crtico inferior:

( fo fe) 2 (18 25) 2 (10 25) 2 (35 25) 2 (37 25) 2


Paso 6: Clculo de Ch :
2
X
2

fe 25 25 25 25
X 2 1,96 9,00 4,00 4,76
X 2 20,72

Paso 7: Conclusin estadstica:


Como la X2=20,72 cae en la zona de rechazo, entonces se
rechaza la hiptesis nula y se acepta la hiptesis alterna,
afirmndose que las ventas del ao en curso no es igual a la
del ao anterior.
Ejemplo 3:
En la Facultad de Ingeniera de la
Universidad Peruana Los Andes, se desea Nerviosismo y ansiedad
determinar si existe alguna relacin entre el
nivel acadmico (estudiantes del primer Nivel
ao, segundo ao, tercer ao y cuarto ao) acadmico NN LN MN EN TOTAL
y el nivel de nerviosismo medio por una Primer ao 20 20 40 80 160
prueba estndar de nerviosismo y ansiedad
que indica el nerviosismo segn las Segundo
categoras siguientes: no nervioso (NN), ao 10 30 30 30 100
ligeramente nervioso (LN), moderadamente Tercer ao 40 20 10 10 80
nervioso (MN) y extremadamente nervioso Cuarto ao 40 20 0 0 60
(EN). Si se elige aletoriamente a 400
estudiantes de la mencionada Facultad, TOTAL 110 90 80 120 400
cuyos datos se muestran en la tabla
siguiente: Solucin:

Paso 1: Hiptesis estadstica:


H0: Las variables nivel acadmico y nivel de nerviosismo son independientes.
H1: Las variables nivel acadmico y nivel de nerviosismo son dependientes
entre s.
Paso 2: La prueba es unilateral y de cola a la derecha.
Paso 3: Nivel de significancia =0,05.
Paso 4: Esquema de la prueba:

gl=(C-1)(F-1)=(4-1)(4-1)
gl=9
Y con: X2(9)=16,919

(Oij Eij ) 2
Paso 5: Clculo de Ch2: X
2

ij Eij

Nerviosismo y ansiedad

Nivel
acadmico NN LN MN EN TOTAL

Primer ao E11 E12 E13 E14 160

Segundo ao E21 E22 E23 E24 100

Tercer ao E31 E32 E33 E34 80

Cuarto ao E41 E42 E43 E44 60


TOTAL 110 90 80 120 400
Clculo de Ch2:

2
20 44
E11 13,10
44
2
20 36
E12 7,11
36
2
40 32
E12 21,33
32
...
2
0 18
E44 18,00
18 X2(9)=154,14
Paso 6: Decisin

Como la X2=154,14 y este cae en la regin de rechazo; por lo


tanto rechazamos la H0 y aceptamos la H1 que establece una
asociacin entre las variables nivel acadmico y nerviosismo.
Medidas de Tendencia Central
MEDIA ARITMTICA

MEDIANA

centro
MODA

MEDIA ARMNICA.
MEDIA GEOMTRICA.
CUANTILES o SEPARATRICES
Es el cociente entre la suma de los valores de la variable, y el
tamao de la poblacin o de la muestra (nmero de observaciones)

POBLACIN MUESTRA

DATOS SIN N n
AGRUPAR
x i x i
i 1
x i

N n
k k
DATOS
AGRUPADOS
k

x

i fi x i fi x i fi
i 1 x i 1
i 1
k
n
N
f
i 1
i
Estadstica: el concepto de media aritmtica o
promedio
El cobre del
Per

Cul fue el promedio del precio del cobre en los 5 das


que se indican en el cuadro anterior? (Noviembre de
2009)
150,638 + 152,725 + 150,729 + 151,636 +
152,044 = 757,772
Luego este total lo dividimos por 5, y
obtenemos
757,772
= 151,5544 centavos de dlar
5 por libra de cobre
Clculo a partir de datos agrupados.
El clculo de la media aritmtica, cuando
los datos disponibles se encuentran en
tablas de distribucin de frecuencias, se
realiza utilizando la formula siguiente
n
fi Xi
x i 1
n
fi
donde: :media muestral i 1
:frecuencia absoluta de la
clase i x
fi :marca de la clase i
Xi
Ejemplo:
La distribucin de frecuencias siguiente, representa
los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de un
Centro de Salud. El puntaje mximo en la prueba es
50. Calcule e interprete en media.
Xi (
Primero se calcularn las marcas de clase
);
es decir, el valor intermedio de cada clase
clase
Marca dexi Frecuencia
clase ( ) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60
x x 1575
60
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
4 + 8 + 15 + 23 + 10
x 26.25
Interpretacin: Si se elige al azar a un trabajador
tcnico de este hospital, se espera que tenga un
puntaje de 26,25 en su evaluacin de desempeo.

xp(
La media aritmtica ponderada )
donde:
n

wX i i wi = factor de
xp i 1
ponderacin
n

w
i 1
i
Xi
= datos
Ejemplo: Una empresa comercializadora de Seguros
Mdicos dispone de 3 representantes para la zona de
Miraflores, cada uno de los cuales cobra diferente
comisin por pliza vendida, y realiza diferente nmero
de contratos. Calcule e interprete el valor medio de la
comisin

wi Xi
30(30) 25(40) 20(50) 2900
xp $38.67
30 25 20 75

Interpretacin:

Si se elige al azar un representante se espera


que cobre una comisin de $38.67 por pliza
vendida.
Ventajas y desventajas de la media
aritmtica
Ventajas:
Concepto familiar para muchas
personas
Es nica para cada conjunto de datos
Es posible comparar medias de
diferentes muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no
estn agrupados, su clculo es tedioso
Si los datos estn agrupados en clases
con extremos abiertos, no es
Medidas de
Dispersin
Medida de informacin respecto a la cantidad de
VARIABILIDAD presente en un conjunto de datos.

dispersin

AMPLITUD TOTAL
2 2
O RANGO: A
VARIANZA

DESVIACIN TPICA O ESTANDARD

SEMIRECORRIDO INTERCUARTLICO Q

COEFICIENTE DE VARIACIN C
poblacin muestra

DATOS SIN

2 x x
2
x
AGRUPAR 2

2 s
n n 1
DATOS
AGRUPADOS

2 f x x
2
f x
2

2 s
n n 1
La varianza es una media de cuadrados de los desvos (MC)

suma de cuadrados

2 x x 2 de los desvios (SC)

s
n-1 grados de libertad (GL)

La divisin por n-1 asegura que la varianza muestral sea una estimacin
centrada de la varianza poblacional
Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable

DESVIACIN TPICA
Es la raz cuadrada de la varianza S S 2
Tiene las misma dimensionalidad (unidades) que la variable.
Coeficiente de variacin
s
Es el cociente entre la desviacin tpica y la media.
CV

Mide la desviacin tpica en forma de


qu tamao tiene con respecto a la media x
Es frecuente indicarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces
CV =20/80 = 0,25 = 25% (variabilidad relativa)

Es adimensional. Interesante para comparar la variabilidad de


diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos
presentan ms dispersin en peso que en altura.

No debe usarse cuando la variable presenta valores negativos o donde


el valor 0 sea una cantidad fijada arbitrariamente
Por ejemplo 0C 0F
Q3 Q1 P75 P25
Q
2 2
1) Determinar la posicin para cada Percentil

Para el P25(35 1) 0.25 9


Para el P75 (35 1) 0.75 27
2) La clase que contiene P25 Li 360

2) La clase que contiene P75 Li 390

3) Realizar la n.r Fa
interpolacin Pr Li h
f

35 0.75 22
Q3 390 15 399.11 399.11 370.31
7 Q 14,4
2
35 0.25 6
Q2 360 15 370.31
4
Qu medidas de tendencia central y
dispersin utilizar
forman
DUOS
Segn teora de
momentos
Media -
Datos numricos
Varianza y distribuciones simtricas o asimtricas
desviacin tpica con muchas observaciones

Segn el mtodo de las


separatrices
Mediana - Datos ordinales o numricos
Semirrecorrido distribucin asimtrica y con pocas
intercuartlico observaciones-

Segn el mtodo de los extremos

Moda - Datos nominales


Distribuciones bimodales
Amplitud total
La r
de Pearson

Carlos E. Espinoza Quispe


Definicin: Es una prueba estadstica que Simbologa:
sirve para analizar la relacin entre dos
variables medidas en un nivel por intervalos o r
Nivel de
de razn. medicin:
Intervalos o razn.
Hiptesis a probar: Correlacionales del tipo:
A mayor x, mayor y; A mayor x, menor y; Altos valores de x
estn asociados con altos valores en y; Altos valores de x estn
asociados con bajos valores en y.
Variables involucradas: (2) La Prueba r no considera la nocin
de causa y efecto (o sea en esta prueba no existen las VI ni las VD),
solo mide el grado de relacin que puede ser Directa (+) e Inversa
(-).
Frmula
:
EL COEFICIENTE DE CORRELACIN
LINEAL DE PEARSON
Si el coeficiente de correlacin de Pearson (r) es
cercano a 0, las dos variables no tienen mucho que
ver entre s (no tienen casi ninguna covariacin
lineal). Si su valor es cercano a +/-1, esto significa
que la relacin entre las dos variables es lineal y est
bien representada por una lnea.
La Prueba t
de Student

Carlos E. Espinoza Quispe


Definicin: Es una prueba estadstica para evaluar Simbologa: t
si dos grupos difieren entre s de manera
significativa respecto a sus medias. Nivel de
medicin:
Intervalos o razn
Hiptesis: De diferencia entre dos grupos. La hiptesis de
investigacin alterna, propone que los grupos difieren de
manera significativa entre s y la hiptesis nula propone que los
grupos no difieren significativamente.
Variable: La comparacin se realiza sobre una variable
(tericamente dependiente). Si hay diferentes variables, se
efecta varias pruebas t (una por cada variable), y la razn que
motiva la creacin de los grupos es la variable independiente.
El tamao de muestra
_ _ es pequeo: n<30
Frmula X 1 X 2 Grados de Libertad: Es el nmero de
: t maneras en que los datos pueden variar
2 2
S1 S 2 libremente.

n1 n 2 gl=(n1+n2)-2
Tamao del Efecto: Es la diferencia estandarizada entre las
medias de los 2 grupos.
_ _
X 1 X 2 Las medias varan
Tamao del efecto 9,10 7,19
Tamao del efecto 0,97 menos de una S,
Desv. Stad . Sopesada 1,96 una respecto de la
Prueba de Hiptesis

1. Formular la hiptesis nula y alterna de


acuerdo al problema.
2. Escoger un nivel de significancia o riesgo .
3. Escoger el estadgrafo de prueba ms
apropiado.
4. Establecer la regin crtica.
5. Calcular los valores de la prueba estadstica
de una muestra aleatoria de tamao n.
6. Decisin Estadstica.
Ejemplo 1:
Se aplic un test de inteligencia a una muestra de 15 alumnos de
la Provincia de Hunuco y se determin un CI promedio de 105.4
con una desviacin estndar de 5.3. Se sabe que al estandarizar
el mencionado test en los Colegios Secundarios de Huancayo, se
hall un CI medio de 101. Asumiendo un nivel de significancia del
1%, probar que el rendimiento mental del grupo de 15 alumnos, es
ms alto que el promedio de estandarizacin del test.

Solucin:

Rendimiento mental medio en la estandarizacin = 101

x Rendimiento mental medio de la muestra = 105.4


Ho: =101, No existe diferencias significativas en el rendimiento
mental de la muestra y de la poblacin.
H1: >101.

2. Prueba unilateral de cola a la


De acuerdo con H1derecha:
.

3. Nivel de
significancia:
Asumido: 1%=0.01.
4. Distribucin
Como aplicable:
se conoce la media () de la muestra y la media poblacional (), se debe utilizar la
distribucin muestral de medias, adems se desconoce la desviacin estndard (); y
como n<30 y los datos se ajustan obedecen a una distribucin normal.

5. Esquema grfico de la

prueba
Nivel de significancia: =0.01.
Grados de libertad: gl=n-1=15-1=14 gl.
En la tabla t, con 14 gl y =0.01 y a una cola: tc=2.624.
7. Clculo del estadgrafo de la
prueba:
Datos:
x 105,4
x 105,43 101 4,4
101 t 3,11
S 5,3 1,426
S 5,3
n 15 n 1 15 1

8. Toma de
Como tc=3,11 y este cae en la zona de rechazo, por tanto descartamos
decisiones:
la H y aceptamos la H ; es decir el grupo de 15 alumnos tiene un
o 1
rendimiento mental mayor que el promedio de estandarizacin.
Ejemplo 2:
Para verificar la suposicin de que existe diferencia en el rendimiento
acadmico en la asignatura de Anlisis Matemtico I, en los
estudiantes de dos aulas A y B de una Universidad, se tom una
muestra aleatoria de cada aula y se les aplic una misma prueba de
conocimientos, obtenindose los puntajes que a continuacin se
indican.

Aula A: 16,43,24,35,20,27,29,30,40,32.
Aula B: 15,40,18,37,16,29,30,45,20,36.

Realizar la prueba al nivel de significacin de 5%.

Solucin:
1: El rendimiento acadmico en Matemtica del Aula A.

2: El rendimiento acadmico en Matemtica del Aula B.


Ho: 1=2, No existe diferencias significativas en el rendimiento
acadmico de Matemtica en las dos aulas A y B.
H1: 1 2; 1>2 1<2: Existe diferencias significativas en el
rendimiento acadmico de Matemtica en las dos aulas A y B.

2. Determinacin del tipo de

Prueba:
Existe dos posibilidades de la H1, y como no se puede anticipar la
direccin de la prueba, debe realizarse una prueba bilateral.

3. Nivel de
significancia:
Asumido: 5%=0.05.

4. Distribucin

aplicable:
Teniendo en cuenta que se quiere comparar el puntaje en dos muestras pequeas
y como los datos estn distribuidos normalmente, utilizaremos la prueba de
diferencia de medias con la distribucin de Student.

5. Esquema grfico de la

prueba
Nivel de significancia: =0.05.
Grados de libertad: gl=n1+n2-2=10+10-2=18 gl.
En la tabla t, con 18 gl y =0.05 y a dos colas: tc=2.101.
7. Clculo del estadgrafo de la
Datosprueba:
:
x1 29,6;
x1 x 2 29,6 28,6
S 63,84
2
t 0,24
63,84 105,64
1

x 2 28,6; S S
1
2 2
2

S 22 105,64 n 10

8. Toma de
Como la tc=0,24 cae en la zona de aceptacin, por tanto descartamos la
decisiones:
H y aceptamos la H ; es decir no existe diferencias significativas en el
1 0
rendimiento del curso Anlisis Matemtico I en las dos aulas A y B.
Ejemplo 3:
Se necesita verificar la PROCESAMIENTO DE INFORMACION
eficacia de una Estrategia Estudiantes Grupo A Grupo B
Didctica en una Universidad 1 30 44
especfica. 2 43 40

3 24 36
4 35 37
5 20 16
6 27 29
7 29 38
8 30 45
9 25 35
10 34 36
11 27 29
12 29 35
13 32 45

Solucin: 14 40 42
15 18 36
HIPTESIS ALTERNA: HIPTESIS NULA:

H 1 : GE GC H o : GE GC
esto es: H 1 : 1 2 1 2
No existe diferencias
Si existe diferencias en el aprendizaje en
en el aprendizaje en el el grupo A y grupo B.
grupo A y grupo B.

Donde:
Se eligi el nivel
de significancia:
=0,05.

3. El estadgrafo de prueba
Se eligi el nivel de significancia: =0,05.
Luego se seleccion el estadstico de prueba,
t de Student, debido a que la muestra es
pequea y adems sta tiene distribucin
normal y los dos grupos fueron asignados
aleatoriamente.
Asimetra de Pearson: Grupo A = 0,237 y Grupo B =
0,080
La prueba t sigue
una distribucin:
NE+NC-2gl,
Es decir: 15+15-
2=28gl.

Se determin la
regin de rechazo
(RR), 28gl y
=0,05 (2,048)
_ _
X 1 X 2 29,53 36,20
t 2,5654
S S1
2 2
2 (6,74) (7,48)
2 2

n 15
Como la t calculada
(tc) con los datos
procesados es igual a:
-2,5654 y este cae en
la zona de rechazo;
entonces se rechaza la
Ho, y se acepta la
hiptesis alterna H1.
Carlos E. Espinoza
Quispe
Un factor ( tratamientos) Categrica

Una variable de respuesta: Cuantitativa

Pregunta principal: Las medias de cada grupo


difieren o estn afectadas por el tratamiento?

Nmero de grupos: El caso particular


de dos grupos , utilizamos test de t

Nmero de grupos: Cuando son ms de


2 grupos: Problema de las comparaciones
multiples
COMPARACION DE MAS DE DOS
MEDIAS
Cuando se comparan dos medias a nivel de significacin , la
probabilidad de cometer un error de tipo I es

a
Cuando se comparan de a dos a medias tenemos C2
comparaciones posibles.
P(x=0)=(1-p)^n P(x>0)=1-[(1-p)^n]
C2a
Probabilidad de cometer un erro tipo I = 1-[(1-) ]

Para 5 grupos tenemos 10 comparaciones posibles


Para un = 0,05 :
P(x>0)=1-[(1-0,05)^10]= 0,40
Una solucin para este problema es la

CORRECCION DE BONFERRONI :
' a
C2
Suele ser excesivamente severa

0.05
En el ejemplo:
' 0,005
10
HAY OTRAS ALTERNATIVAS: UNA DE ELLAS ES EL

2
ANALISIS DE LA VARIANZA
sentre
Fc 2
sdentro
ANOVA (ANalysis Of
Variance) Modelo I efectos
Finalidad
Comparar simultneamente
fijos
xij i ij
varias medias
xBj
x
Bj
Variacin total
B
B
A
C

A B C grupos
xij i xij i En la
i poblacin

xij x xi x xij xi En la muestra
Elevando al cuadrado:

xij x xi x xij xi
2 2 2

2 xi x xij xi
Sumando:
xij x
ij
2
ij
2
ij

xi x xij xi 2

SC TOTAL SC ENTRE SC DENTRO de


grupos grupos (residual)

xij x
ij
2
xi x xij xi
ij ij
2
2

SC SC ENTRE SC DENTRO de
TOTAL grupos grupos (residual)

( xij x ) Recordar
2
SCentre ij
2
sentre
glentre a 1

( xij xi )
2
SCdentro ij
2
sdentro o residual
gldentro na
HIPOTESIS En general

Modelo I H 0 : i : i 0 H 0 : i : i
MEDIAS DE CUADRADOS ESTIMA

MC entre = SC entre/(a-1) 2
2 i
a = no de grupos
Mod I
ni a 1
ni tamao medio
del grupo
MC dentro = SC dentro/(n-a ) 2
n = tamao de la muestra total
Si Ho es verdadera : MC entre = MC dentro en la poblacin
TEST DE HIPOTESIS

Fcalc = MC entre/ MC dentro

se compara con Ftab (a-1) y (n-a) grados de libertad

Supuestos para la validez del test

Normalidad de Homocedasticidad
los residuos ( ij) de los residuos

C A B

Independencia de las observaciones


Ti2 T 2 2 T 2
SC entre
i n i
n
SC total x ij
ij

n

SC dentro SC total SC entre

Donde: Ti x ij En el i-simo grupo


j
ni Tamao del i-simo grupo

T x ij Gran total
ij

n n
i
i
Tamao total de la muestra
FUENTE DE SUMA DE GL MEDIA DE Fcalc
VARIACION CUADRADOS CUADRADOS
ENTRE SC entre a-1 MC entre
GRUPOS SC entre (a 1)
MC dentro
DENTRO DE SC dentro n-a SC dentro (n a)
GRUPOS

TOTAL SC total n-1

El Fcalculado se compara con

el Ftabulado con (a-1) y (n-a) GL

10
2
CALCULO DE LAS SUMAS DE CUADRADOS
A
4.4
B
8.6
C
3.4
D
8.9
H 0 : i : i
5.9 4.5 7.3 0.0 2
6.2 8.4 8.8 1.7
x ij 597.2
ij
6.3 8.7 0.2
0.1
n ni 16
Ti 22.8 30.2 19.8 10.6 T =83.4 a4
ni 4 4 5 3 n = 16

SC total 597.2 83.4 2 16 162.4775

22.8 2 30.2 2 19.8 2 10.6 2 83.4 2


SC entre 39.1088
4 4 5 3 16
SC dentro SC total SC entre 162.4775 39.1088 123.3687
gl gl numerador (trat-1)
denominado
r (n-trat)
FUENTE DE SUMA DE GL MEDIA DE Fcalc
VARIACION CUADRADOS CUADRADOS
ENTRE 39.1088 3
3 13.036 1.27
GRUPOS
DENTRO DE 123.3687 12
12 10.281
GRUPOS

TOTAL 162.4775 15
F0.95(3, 12)= 3.49

Fcalc menor que Ftab No Se rechaza Ho


las medias no difieren entre s
A B C
2.6 3.2 2.4
2.4 3 2.8
2.9 2.8 2.5
2.6 2.9 2.7
2.7 3.3 2.5
2.9 3.1 2.9
2.5 3 2.4
2.8 3.4 2.6
2.5 3.2 2.2
3 3.2 2.6

-> trat = A
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.69 .2024846 2.4 3

-> trat = B
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 3.11 .1852926 2.8 3.4

-> trat = C
| Obs Mean Std. Dev. Min Max
-------------+--------------------------------------------------------
| 10 2.56 .2065591 2.2 2.9
. oneway x y,b
Analysis of Variance
Source SS df MS F Prob > F
------------------------------------------------------------------------
Between groups 1.65266668 2 .826333338 21.01 0.0000
Within groups 1.06200005 27 .039333335
------------------------------------------------------------------------
Total 2.71466672 29 .093609197

Bartlett's test for equal variances: chi2(2) = 0.1124 Prob>chi2 = 0.945

Ganancia de Peso por Tratamiento


Comparison of x by y (Bonferroni) (30 Preoperative Patients)
Row Mean-|

3.5
Col Mean | A B
---------+----------------------
B | .42 ganancia de peso (kg)
| 0.000 3
C | -.13 -.55
| 0.463 0.000
2.5 2

A B C
Observaciones Independientes.
Distribucin Normal.
Varianzas Homogneas.
Con el fin de obtener inferencias vlidas, resulta
importante determinar si los errores se
encuentran correlacionados.

El supuesto ms importante es la
independencia de las observaciones, pues si no
hubo asignacin aleatoria de tratamientos a
unidades experimentales, entonces los resultados
pueden incluir un efecto persistente de factores
no considerados en el anlisis. Esto invalida el
experimento
No es tan importante como la
Independencia de las Observaciones, pues
el ANOVA es robusto. Esto quiere decir
que, aunque las observaciones no sean
normales, las medias de los tratamientos
son aproximadamente normales debido al
Teorema Central del Limite.

Ante la falta de normalidad se puede optar


por el uso de transformaciones o, como
ltimo recurso, el uso de mtodos no
paramtricos.
Esta prueba resulta fundamental, pues
cualquier situacin de heterogeneidad de las
varianzas invalida las inferencias realizadas.

Pueden existir grupos muy homogneos y, en


el caso de existir un grupo muy heterogneo,
sera posible no detectar diferencias entre los
grupos con varianzas homogneas por el
efecto de la contribucin a la varianza de ese
grupo heterogneo.

Cuando existe el problema de


heterogeneidad de varianzas, lo apropiado
es emplear transformaciones o mtodos no
paramtricos.
Homogeneidad de Varianzas
Bartlett
Normalidad
Kolmogorov-Smirnov
Autocorrelacin
Durbin-Watson

Es importante mencionar que el empleo de


estadstica no paramtrica o el uso de
transformaciones no elimina el problema de la
falta de aleatoriedad (falta de independencia), es
decir, la ejecucin incorrecta de un experimento
no tiene un remedio en la etapa del anlisis.
Carlos E. Espinoza
Quispe
Se elimina la variacin
debida a la/s Covariable/s
de la estimacin de la
varianza del error y se la
evala como un efecto
principal separado
Este procedimiento es la combinacin de las
tcnicas:
Anlisis de la Varianza
Anlisis de Regresin
Objetivos
Estudiar la relacin de una variable cualitativa
(factor) con una variable cuantitativa
(covariable).

La variable cualitativa () La variable cuantitativa (X) recibe el


recibe el nombre de factor, nombre de covariable y no es
dicha variable es controlada controlada por el experimentador
por el experimentador y se pero puede medirla al mismo tiempo
presenta a varios niveles que la variable respuesta (Y: variable
dependiente)
Anlisis de la Covarianza Unifactorial

Modelo Unifactorial con una covariable

Diseos en bloques completos aleatorios con una


covariable

Diseos en bloques completos aleatorios con dos


covariables

Diseos factoriales con dos factores y una covariable.

Diseo factoriales con dos factores y dos covariables


Describe a una situacin que involucra:
Una variable independiente cualitativa con diversos niveles.
Una o ms covariables (variables independiantes
cuantitativas)
Modelo Unifactorial con una covariable
En un diseo con un solo factor y una sola covariable, si se
supone que existe relacin lineal entre la variable respuesta
y la covariable:

i: Es el efecto producido por el tratamiento i-simo


Es el coeficiente de regresin lineal que representa la
cantidad en que varia la variable respuesta por cada
cambio unitario de la covariable.
x : Es el valor de la covariable correspondiente a la
ij

observacin yij. .
:Es la media de la covariable.
En un diseo completamente aleatorizado la suma total de
cuadrados puede descomponerse en suma de cuadrados
entre tratamientos y en suma de cuadrados residual.
A.- Contraste de hiptesis
1. Todos los niveles del factor producen el mismo efecto (H o: i = 0 i) vs
(H1: i 0 por lo menos para algn i).
2. El coeficiente de regresin es 0
Ho: = 0
H 1: 0
B.- Contraste de los efectos del factor
El estadstico de contraste para contrastar la hiptesis nula Ho: i = 0 i
es:

Se rechazar Ho cuando F exp > al nivel de significacin


C.- Contraste del coeficiente de regresin ()


El estadstico de contraste para contrastar la hiptesis nula Ho:
= 0 viene dada por la expresin:

Si este valor es mayor que el valor terico al nivel de


significacin de se rechaza la hiptesis de que el coeficiente de
regresin es igual a 0.
El modelo estadstico para este diseo es:

Siendo
i el efecto producido por el nivel i-simo del factor principal (

)
j el efecto producido por el nivel j-simo bloque ( )
es el efecto ijsimo valor observado en la covariable
Las Sumas de Cuadrados y productos Cruzados tienen las
siguientes expresiones:
.
Modelo estadstico
Modelo estadstico
Consideramos un diseo unifactorial equilibrado con
dos factores, supongamos que hay a niveles para el
factor A y b niveles del factor B y cada rplica del
experimento contiene los ab tratamientos posibles

Siendo
r: n de replicaciones
ij: el efecto producido por la interaccin entre A y B.
Modelo estadstico

Siendo
r: n de replicaciones
ij: el efecto producido por la interaccin entre A y B.
Se tiene ocho variedades de fresas (A, B, C, D, E, F, G y
H) sembradas a lo largo de cuatro franjas de un terreno.
Cada franja se ha dividido en ocho parcelas donde se
siembran las ocho variedades de fresas. No se tiene
seguridad de que el terreno sea igual de frtil en todas
las franjas, por lo que la cantidad de fresas recolectada
podra depender de la franja en la que se siembra.
Adems, en el lmite este del terreno hay un seto que
podra quitar elementos de tierra beneficiosas para las
fresas, influyendo de alguna manera en la cosecha
recogida.
Los datos de los kilos recolectados y la distribucin
del cultivo de las fresas en terreno se representan a
continuacin en la tabla 1
Caso prctico

A B C D E F G H
I
5.8 6.3 4.9 6.5 4.5 5.2 6.5 3.8

G H F E A B D C
II
6.9 7.6 7.9 5.6 7 5.5 4 2.7
Franja Seto
B D C A H G E F
III
7.6 6.4 5 6.9 7.4 5.3 5.2 3.2

G E F H A D B C
IV
7.5 7 6.1 7.2 6.5 5.6 5.8 1.4

Distancia al seto
8 7 6 5 4 3 2 1
(en metros)

Tabla
1
Se pide:

1. Describir el problema planteado, identificando los


elementos.

2. Escribir el modelo matemtico asociado donde se introduzca


el inverso de la distancia al seto como variable
concomitante.

3. Es necesario controlar la influencia de esta variable? Es el


terreno igual de frtil en todas las franjas?

4. Analizar las diferencias entre las ochos variedades de fresas.


De existir diferencias entre las cantidades recolectadas,
decidir por el mtodo de Bonferroni cules son las
variedades de las que recoge ms cosecha.
13
2

La variable respuesta que se


mide es el nmero de kilos
recogidos de cada variedad
de fresa. El factor de inters
es la variedad de fresa. Las
unidades experimentales
son las parcelas, a las que se
les anota el nmero de kilos
recogidos de fresa.

El hecho de que las franjas de


terreno
puedan influir sobre las cosechas,
hace que se deba incluir tambin
el seto, se tomar como posible
variable concomitante el
inverso de la distancia al
seto. As los tratamientos son los
ochos tipos de fresa.
2.- Modelo matemtico (variable concomitante: INV_distancia al
seto) .
El modelo matemtico asociado a esta situacin es:
yij = + i + j + (xij ..) + ij ; i=1, , 8; j=1, , 4

ij N(0,) independientes

yij: kilos de fresa de variedad i recolectados en la franja j.


xij: inverso de la distancia al seto de la parcela de la franja j donde se siembra la
fresa i.
: nmero medio de kilos recolectados.
i: efecto medio adicional sobre la cosecha media de la variedad de fresa i.
j: efecto medio adicional sobre la cosecha media de la franja j.
: influencia de la distancia al seto sobre la cosecha media.
As, yij N( + i + j + (xij ), ) independientes
Para realizar el estudio de la varianza se comprueba
Normalidad

Homocedasticidad

yij ~ N (+i ,)
Para verificar si se trata o no de una distribucin
Normal se realiza un contraste Chi-cuadrado

A continuacin, vamos a verificar la condicin de


Homocedasticidad mediante un Contraste de
Varianza.

13
5
Por lo tanto, P-valor > 0,10.
As que, no se rechaza H0 al
nivel del 10% de significacin.
De este modo, podemos
concluir que la distribucin es
normal.
Es el terreno igual de
frtil
en todas las franjas?
3.- Es necesario controlar la influencia de esta variable?

p-valor asociado a la
variable concominante
es 0,0000.
El inverso de la
distancia al seto influye
sobre la cantidad de
fresa recolectada.
Si es necesario incluir en el
anlisis la distancia al seto.

Sin embargo, las franjas de


terreno no son influyentes
sobre las cosechas
recogidas, lo que hace
suponer que todas ellas son
igual de frtiles.
13
7
Se replantea el modelo,
suprimiendo del
4.- Analizar las mismo
diferencias el las 8 variedades
entre de fresasconcominate
La variable
factor bloque. (INV_SETO) es
significativa e influye
sobre la cosecha
recogida.
Con respecto a las
diferencias entre las
variedades de fresa,
obtenemos un (p-
valor)fresa=0,0110 < a,
siendo significativa las
diferencias a un nivel del
95%, pero no al 99%.

13
8
Las4.-diferencias
Analizar las diferencias entre las 8 variedades de fresas
encontradas entre las
cantidades medias
recogidas de las
variedades son C y H.

Y de la cosecha que
ms se recoge es de la
variedad H, siendo su
media 6.7.

13
9
Efecto de fertilizantes en el estudio de las plantas
Efecto de formas nuevas de promocin en la venta de sus vinos en supermercados.
Las formas de promocin son: Degustaciones, Aumento de espacio en los estantes, Muestrarios en
los extremos del pasillo
Efecto de las dietas en cerdos de la misma edad
Efecto de la renta, segn zona geogrfica, pero ajustando previamente por variables cuantitativas
como la proteccin social (covariable).
Efecto de las horas trabajadas segn la educacin y sexo.
Efecto de reducir las diferencias salariales entre hombres y mujeres al asistir a los cursos de
formacin que antes han sido planificados.
Efecto de la religin en la actitud hacia el divorcio segn nivel educacional
Efecto de los mtodos de enseanza en el rendimiento segn habilidades de los alumnos (cov).
Efecto de documentales en el deseo de viajar a la Patagonia.
Efecto de corregir resultados observados de conocimientos iniciales sobre una materia
determinada.
Efecto de comparar rendimientos en un proceso qumico segn los porcentajes de impureza en la
materia prima a diversas temperaturas.
Efecto de distintos mtodos de aprendizaje en los alumnos.
Efecto de mtodos de adelgazamiento en pacientes.
Efecto de un tratamiento y efecto de una o ms variables de confusin potenciales segn
puntuaciones previas a la prueba, edad, educacin, nivel social y nivel de ansiedad.
Efecto de la hipertensin segn la edad y sexo.
Efecto en la produccin al utilizar diferentes insecticidas en un cultivo de patatas.
MEDIDAS DE RESUMEN
Medidas de tendencia central
Medidas de dispersin
Medidas de posicin
FORMA DE LADISTRIBUCION

medidas de asimetra (sesgo)

as = + as = -

Coeficiente de asimetra
asimetra positiva asimetra negativa
x Mn
as 3
s

Es nulo cuando la
distribucin simtrica distribucin es simtrica
SIMTRICA
las observaciones equidistan del mximo central con la
misma frecuencia.
Coinciden Media, Moda y Mediana
ASIMTRICA
la cola ms larga determina la direccin del sesgo.
Se separan la Media, Mediana y Moda

BIMODAL MULTIMODAL
FORMA DE LADISTRIBUCION
Medidas de
asimetra
Medidas de apuntamieno o
curtosis
Exceso de
frecuencias Exceso de
frecuencias

Distrib. leptocurtica Distrib. platicurtica


Definicin: Es la deformacin horizontal de la Simbologa:
curva de frecuencias. As
Nivel de
medicin:
Intervalos o razn
Frmulas Asimetra a la izquierda o negativa
Coeficientes de :Asimetras de
Pearson:
x Mo 3( x Me) Mo Me x
AS 1 AS 2
S S

Coeficiente Cuartil de Asimetra a la derecha o positiva


Asimetra:
Q 2Q2 Q1 Mo Me x
AS 3 3
Q3 Q1

Coeficiente Percentil de Asimetra Curva Normal:

P90 2 P50 P10


AS 4 Mo Me x
P90 P10
Definicin: El Coeficiente de Curtosis Simbologa: k
Percentlico es una media de la curtosis basada
en los cuartiles y percentiles. Nivel de
medicin: Ordinal,
Intervalos o razn
Q
Frmula K
P90 P10 Si:
: K: Coeficiente de Kurtosis.
De donde:
P90: Percentil 90.
P10: Percentil 10.
Q3 Q1
Q: Desviacin Quartil: Q
2

La grfica La grfica
La grfica
leptocrtic
platicrica mesocrtica
a
El Coeficiente de Curtosis viene Simbologa: k
definido por la siguiente frmula: Nivel de
Frmula
n
medicin: Ordinal,
: (1 / n)( ( xi x ) 4 Intervalos o razn
g2 i 1
3
s4 Los resultados pueden ser los
siguientes:
g2 = 0 (distribucin
mesocrtica).
g2 > 0 (distribucin
leptocrtica).La grfica
La grfica La grfica
g < 0 (distribucin
leptocrtic
platicrica mesocrtica2
platicrtica). a
xg
Se utiliza para calcular tasas medias de
variacin, como la tasa media de crecimiento
poblacional, la tasa media de inflacin
mensual, la tasa media de mortalidad, entre
otros.

a) Obtencin Se obtiene extrayendo la raz


ensima del producto de los n valores
de una serie.

xg n X1 X 2 X3 .........X n
Ejemplo:
La siguiente tabla muestra la tasa de aumento en
las quejas durante los ltimos meses. Calcule e
interprete la tasa media mensual.

La tasa 2,6% tambin se puede expresar como


0,026 , y puesto que se refiere a un aumento a
partir de una base de 100%, el factor de
variacin ser 1,026. Para los otros datos se
opera igual.
b)
Clculos
Por lo tanto, la media geomtrica se
calcula:
x g n x1, x 2 , x 3,...... x

x g 5 (1.026) (1.054) (1.038) (1.005)(1.014)


x g 5 1.143903377
x g 1,0272540 ( Factor de crecimiento medio)

Tasa media
= (x g 1) 100
de
variacin
= (1,0272540 - 1) x 100 = 2,72%

c) Interpretacin

Si se selecciona al azar un mes entre


enero y mayo, se espera que las ventas
se hayan incrementado 2.72% con
respecto al mes anterior.
xh
Se utiliza para calcular el tiempo medio,
velocidad y aceleracin media, como por
ejemplo, el tiempo medio para realizar
determinada ciruga.
a) Obtencin: se obtiene calculando el inverso
de la media aritmtica de los inversos de
una serie.
1
xh n
1

i 1
X
i
n
Ejemplo:
Los siguientes datos registran el tiempo que utilizan
cuatro mdicos al realizar una cierta intervencin
quirrgica. Calcule e interprete el tiempo medio.

Conocer el tiempo medio permite contar con


una herramienta til en la planeacin de los
recursos, como la Sala de Operaciones.
Adems de poder comparar nuestro
desempeo con los estndares de calidad
internacionales.
4 4
xh 1 1 1 1

1976 2340 1710 2223

45 38 52 40 88920

xh 4 88920 43.117953 minutos


8249

xh 43 minutos 7 segundos
b) Interpretacin:

Si se selecciona al azar a uno de los cuatro


mdicos, se espera que realice este tipo de
ciruga en 43 minutos aproximadamente.
Gracias por su
atencin!!

cespinozaq@hotmail.com

Вам также может понравиться