Вы находитесь на странице: 1из 40

PRUEBAS

ESTADISTICAS
PARAMETRICAS
Prueba “t”
de Student

Ing. JULIO MUÑOZ VILELA


¿QUE ES LA PRUEBA “t” ?
ES UNA PRUEBA ESTADISTICA
PARA EVALUAR SI DOS GRUPOS
DIFIEREN ENTRE SI DE MANERA
SIGNIFICATIVA RESPECTO DE
SUS MEDIAS.

SIMBOLO

“t“
HIPOTESIS A PROBAR
Se trata de comparar dos grupos:

La hipótesis alternativa plantea


que los grupos difieren
significativamente entre si y la
hipótesis nula propone que los
grupos no difieren
significativamente entre si.
VARIABLE INVOLUCRADA
 LACOMPARACION SE REALIZA SOBRE LA
VARIABLE INDEPENDIENTE, SI EXISTEN
OTRAS SE DEBE EFECTUAR VARIAS
PRUEBAS “t” UNA POR CADA VARIABLE.

EL NIVEL DE MEDICION DE LAS


VARIABLES ES EL DE INTERVALO O
RAZON
INTERPRETACION
 Se Utiliza para grupos
pequeños (n < 30)
 X la media del grupo. x
 µ la media poblacional
t
x S/ n
 S la Desv. Estandar
 n = tamaño de muestra tiene distribuci ón t( n 1)
INTERPRETACION
 Para saber si el valor “t” es significativo, se
aplica la formula y se calculan los grados de
libertad.
 La prueba “t” se basa en una distribución
muestral o poblacional de diferencia de medias
conocidas como la “t de Student”,
 Esta distribución es identificada por los grados
de libertad, los cuales constituyen el numero
de maneras como los datos pueden variar
libremente.
RECOMENDACION

 Mientras mayor sea el numero de grados de


libertad la distribución “t de Student” se
acerca mas a ser una distribución normal.
 Si los grados de libertad exceden los 120 la
Distribución Normal es utilizada como una
aproximación adecuada de la “t de Student”.
 Calculado “t” y los gl (grados de libertad) se
elige el nivel de significancia y se compara el
valor obtenido con el mostrado en la Tabla
Distribución t-Student

Para muestras pequeñas de población normal

x
T tiene distribución t( n1)
S/ n

PRUEBA “t”


t(v)
0 t1-
EVALUACION DE RESULTADOS
 Si nuestro valor calculado es igual o mayor que el de la
Tabla, se acepta la hipótesis alternativa.
 Pero si el valor es menor se acepta la hipótesis nula.
USO DE LA TABLA……..

 Tomar la Tabla “t” y calcular:


 Media Muestral =
 Media Poblacional =
 α =
 n =
 gl. (t-1) =
Contraste de Hipótesis
 Planteamiento de Hipótesis NULA y ALTERNATIVA
 Determinación del nivel de significancia α
 Determinación del Estadístico de Prueba
 Regla de Decisión comparando los valores calculado
con tabulado
 Conclusiones
HIPOTESIS A Se definen:
CONTRASTAR  Las hipótesis nula y alternativa con una
distribución de probabilidad conocida

 Regla de decisión(nivel de significación )


datos de la muestra  Valor crítico o tabulado

Se calcula una medida Se comparan los valores


asociada a la hipótesis calculado con tabulado
que se desea docimar
¿se rechaza
Ho?
H1 SI
NO
Se extraen conclusiones
Esquema cuando se comprar la diferencia entre
dos medias o proporciones muéstrales
Se acepta la hipótesis nula si el
estadístico de la prueba cae
dentro de esta región.

Se rechaza la
Se rechaza la hipótesis
hipótesis nula nula

Area A = área B
y (A+B) = el
nivel deseado
de significancia

Area A Area B

Valor Valor teórico + Valor


critico de la diferencia critico
Esquema de selección de pruebas estadísticas para medir
relación entre variables

Continua
Coeficiente de correlación lineal de Pearson

Escala de Ordinal y/o


medición numérica Coeficiente de Correlación por rangos de Spearman
para ambas
variables

- Prueba Ji-Cuadrado (Coeficiente )


Si
- Riesgo Relativo (Estudios de cohorte)
- Odds Ratio (Estudios de Casos-control)
- Coeficiente de concordancia Kappa
(Comparación de métodos)
Cada variable
Nominal tiene dos
categorías
(tablas 2x2)
Prueba Ji-Cuadrado para Independencia
de variables (Coeficiente de
No
Contingencia)
Prueba de Correlación de
Rango de SPEARMAN
PRUEBA DE CORRELACION DE RANGO DE SPEARMAN

El coeficiente de correlación por rango se define como:


  d i2 
rs  1  6  
 N( N  1) 
2
 

Donde:
N: # de observaciones, # de individuos o fenómenos
clasificados por rango.

di: Diferencia en los rangos atribuida a dos características


diferentes del i-ésimo individuo o fenómeno.

La correlación por rangos de Spearman mide la relación entre


dos variables que han sido clasificadas por orden de menos a
mayor (o de mayor a menor)
EJEMPLO

Una empresa contrató a 7 técnicos en informática, que fueron


sometidos a un examen de conocimientos básicos. Luego de un
año de servicio, se calificó su rendimiento en el trabajo. A
continuación, se muestran los resultados:

Puntuación en el Clasificación por


Técnico
examen rendimiento
J. Manzo 82 4
M. Contreras 73 7

C. Gutarra 60 6

F. Olaechea 80 3

D. Barrientos 67 5

F. Estombelo 94 1

J. Cordova 89 2
Se utiliza la correlación por rangos de Spearman para determinar,
si hay relación entre las calificaciones del examen y el
rendimiento en el trabajo

1º Se elabora la clasificación de las puntuaciones del


examen

Técnico Puntuación Clasificación Clasificación


en el examen por el examen por rendimiento X  Y  di (X  Y)2  di2
(X) (Y)
J. Manzo 82 3 4 -1 1

M. Contreras 73 5 7 -2 4

C. Gutarra 60 7 6 1 1

F. Olaechea 80 4 3 1 1

D. Barrientos 67 6 5 1 1

F. Estombelo 94 1 1 0 0

J. Cordova 89 2 2 0 0

di2 =8
2º Se calcula del coeficiente de correlación por rangos de
Spearman rs:

  d i2   8 
rs  1  6   1  6   0.857
 N( N  1)   7(7  1) 
2 2

Un coeficiente de correlación oscila entre -1 y 1; los


resultados muestran una fuerte relación positiva entre las
puntuaciones de examen de cada técnico y su rendimiento
en le trabajo
Contrastando la hipotes:

H0: ρs = 0, no hay relación entre las dos variables


H1: ρs ≠ 0, hay relación entre las dos variables

Tabla N, con α=0.10, n=7; los valores críticos serían: ± 0.6786

Se acepta

Se Se
Rechaza Rechaza

0.05 0.05

-0.6786 +0.6786 0.857


Valor critico Valor critico

Como el coef de spearman rs está fuera de la región de aceptación,


rechazamos la H0. Se concluye, al 90% de confianza, existe relación entre las
puntuaciones del examen y el orden de rendimiento en el trabajo
ANALISIS
NO
PARAMETRICO
CONSIDERACIONES

 La mayoría no de estos análisis no requiere de


presupuestos acerca de la forma de la Distribución
Poblacional.
 Las Variables no necesariamente deben estar
medidas en un nivel de intervalo (orden y categoría
cero no real) o de razón ( el cero es real) .
 Pueden analizarse datos nominales (sin orden ni
categoría -Sexo) u ordinales (orden de mayor a
menor- primero, segundo).
 En todo caso la variables deben ser categóricas.
( en días, meses, años, etc.)
METODOS O PRUEBAS NO
PARAMETRICAS MAS EMPLEADAS

 1) LA Ji CUADRADA – CHI-CUADRADA
 2) COEFICIENTES DE CORRELACION E
INDEPENDNENCIA PARA TABULACIONES CRUZADAS.
 3) LOS COEFICIENTES DE CORRELACION PARA
RANGOS ORDENADOS DE SPERMAN Y KENDALL
Ji - CUADRADA

 Es una prueba estadística para evaluar


hipótesis acerca de la relación entre dos
variables.
 Se simboliza por : ‫א‬²
 Prueba hipotesis Correlacionales
 Variables involucradas : dos ( no considera
relaciones causales)
 Nivel de medicion de variables: Nominal y
Ordinal.
Ji - CUADRADA

 La Chi – Cuadrada se calcula a traves de


una Tabla de contingencia o Tabulacion
cruzada, que constituye una Tabla de
dos dimensiones o matriz de dos x dos.

 Cada dimension contiene una variable.

 Cada variable se subdivide en dos o mas


categorias.
La Prueba Ji-Cuadrado
Distribución Ji-Cuadrado χ 2

Supóngase que se tiene una serie de variables aleatorias independientes con distribución normal
estándar, Z1 , Z2 , ... , Zn , entonces la variable aleatoria , X  Z12  ...  Z2n sigue una distribución
Ji-Cuadrado.
La Prueba Ji-Cuadrado

FUNCIÓN DE DENSIDAD MEDIA Y VARIANZA.


χ2
Procedimientos para usar el análisis de ji cuadrada y probar la
independencia de dos variables nominales

Hipótesis nula:
Las variables son independientes

Se construye o se obtiene una tabla de


tabulación cruzada para las frecuencias reales
observadas (Oij )

Suponiendo que las variables son


independientes, se construye una tabla de
tabulación cruzada para las frecuencias
teóricas ( Eij)

Se determina el nivel de significado deseado


en la prueba.

Se determina el valor
calculado del estadístico ji
cuadrada

  
2
r c O ij  E ij 
2

i 1 j1 E ij
USO DE LA TABLA

Tabla 4. Distribución de ji-cuadrado

El área sombreada de naranja


representa la probabilidad P[χ  χ α,n ]  α
2 2

que se determinada por α


, donde: Probabilidad de un valor superior
Grados de libertad 0,1 0,05 0,025 0,01 0,005
χ α2 ,n es el valor critico del margen 1 2,71 3,84 5,02 6,63 7,88

superior de la tabla, y n son los 2 4,61 5,99 7,38 9,21 10,60


3 6,25 7,81 9,35 11,34 12,84
grados de libertad del margen 4 7,78 9,49 11,14 13,28 14,86
izquierdo de la tabla. 5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
Tabla 4. Distribución de ji-cuadrado

Uso de la tabla Ji-


Cuadrado

Probabilidad de un valor superior

P [ 15.99  χ | n  10]  0.10


2 Grados de libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75

P [ 11.07  χ | n  5]  0.05
2 6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
EJEMPLO
Martha Revilla, directora de mantenimiento de la calidad
en MEGA, elige 29 bicicletas y halla una varianza en la
distancia entre ejes de 32.7 pulgadas cuadradas. Si la
señora Revilla tienen que garantizar que la variación no
supere 27 pulgadas cuadradas ¿indica esto que se
cumplen las normas de producción? (α=0.05)

Hipótesis H 0   2  27 H1   2  27

Prueba de una cola a la derecha


n  1s 2  29  132.7 
n  29
s 2  32.7  2

   33.91
 2  27 2 27

 
f 2

02.05;28  41.337

0.05

41.337 2
33.91

Como X2=33.91<41.337 la señora Revilla no rechazará la H0 y


confiará al 95% en que se cumplen las normas de producción
¿Que pasaría, si las instrucciones de la señora Revilla fueran que la
variación se mantuviera inferior a 27 pulgadas cuadradas?

H 0   2  27 H1   2  27

Prueba de una cola a la izquierda

f 2 
02.95;28  16.928

0.05

16.928 2
33.91
X2 =33.91, la señora Revilla no rechazará la H0 y confiará al 95% en
que se cumplen las normas de producción
La señora Revilla, ahora elabora un intervalo de confianza del 90% para
la varianza de la distancia entre ejes.

n  1s 2  2

n  1s 2
 2
0.05; 28  02.95; 28

29  132.7    2  29  132.7 


f  
2
41.337 16.928
 22.15   2  54.09

0.05 0.90 0.05

16.928 41.337 2
0.95

Revilla puede confiar al 90% en que la varianza de la distancia


entre ejes se encuentra entre 22.15 y 54.09 pulgadas cuadradas
Prueba Ji-Cuadrado de Independencia

H0: Las variables X e Y son independientes


H1: Existe asociación entre X e Y

Y
X Categ. 1 ...... Categ. s Total
Cat. 1 O11 ...... O1s R1
......... ....... ...... ....... .....
Cat. r Or1 ...... Ors Rr
Total C1 ...... Cs n
Prueba Ji-Cuadrado de Independencia

 Estadística
80
Si No
70
r c (Oij  E ij ) 2

  
2 60
i 1 j1 E ij 50
Ri Cj 40
donde , Eij 
n 30
20
 10
2 0
 12 Alto Medio Bajo
R.C.
Ejemplo de Prueba Ji-Cuadrado de independencia

Para verificar la suposición de que la fabricación de cierto producto


está asociado con enfermedades respiratorias, a 450 trabajadores de
una empresa que fabrica el producto se evaluó respecto a la
presencia de síntomas de alteraciones respiratorias y se los clasificó
a su vez de acuerdo al nivel de exposición al producto. Los resultados
se presentan en la tabla siguiente:

Presencia de Nivel de Exposición Total


Síntoma Alto Medio Bajo
Si 175 43 27 245
No 90 60 55 205
Total 265 103 82 450
H0: Las alteraciones respiratorias son independientes de la
exposición al producto.

H1: Las alteraciones respiratorias están asociadas a la


exposición al producto

Frecuencias Esperadas: R iC j
E ij 
n

R 2 C3 20582 
Por ejemplo: E 23    37.4
n 450

Presencia de Nivel de Exposición Total


Síntoma Alto Medio Bajo
Si 144.3 56.1 44.6 245
No 120.7 46.9 37.4 205
Total 265 103 82 450
 Estadística

2 3 (Oij  E ij ) 2 80
Si No
  
2
70
i 1 j1 E ij
60
Ri Cj 50
donde , Eij 
n 40
30
20
  0.05 10
2 0
 12 Alto Medio Bajo
R.C.
2
2 3 O ij
2    n
i 1 j1 E ij

1752 552
  ...   450  36.4
144.3 37.4

Que sigue una distribución Ji-cuadrado con


(n-1)*(C-1)=( 2-1)*(3-1)=2 grados de libertad

 
p  P   36.4  0.0000000125  0.005
2
2

En conclusión, se rechaza la H0 (p < 0.05), es decir las


alteraciones respiratorias están asociadas a la
exposición al producto
FIN

MUCHAS
GRACIAS

Вам также может понравиться