Академический Документы
Профессиональный Документы
Культура Документы
VARIABLES ALEATORIAS
EL TIGRE
1
INDICE
Pag.
Introducción 4–5
Pruebas Paramétricas 6
Propiedades 8–9
Distribuciones Discretas 9
Distribución Bernoulli 9 – 12
Distribución Binominal 12 – 19
Distribución Geométrica 19 – 24
Distribución Hipergeométrica 28 – 30
Distribución de Poisson 31 – 34
Variable Aleatoria 34
El Valor Esperado 50
2
Pruebas de wilcoxon de los rangos con signos 51 – 52
Prueba de Kruskal-Wallis 53 – 54
Prueba de U Mann-Whitney 62 – 66
Correlación 66 – 70
Test de Cohen-Kappa 79 – 80
Correlación de Spearman 87 – 92
Kolmogorov-Smirnov 93 – 94
Prueba de Kolmogorov-Smirnov 94 – 96
Conclusiones 97 – 99
Bibliografía 100
3
INTRODUCCION
4
las poblaciones difieren en algún aspecto, que puede ser tanto la tendencia
central como cualquier otra característica.
La prueba Mann-Whitney: es un método no paramétrico aplicado a dos
muestras independientes, cuyos datos han sido medidos al menos en una
escala de nivel ordinal. La prueba calcula el llamado estadístico U, cuya
distribución para muestras con más de 20 observaciones se aproxima
bastante bien a la distribución normal.
5
PRUEBAS PARAMETRICAS
PRUEBAS NO PARAMETRICAS
Se denominan pruebas no paramétricas aquellas que no presuponen una
distribución de probabilidad para los datos, por ello se conocen también como
de distribución libre (distribution free). En la mayor parte de ellas los
resultados estadísticos se derivan únicamente a partir de procedimientos de
ordenación y recuento, por lo que su base lógica es de fácil comprensión.
6
Cuando trabajamos con muestras pequeñas (n < 10) en las que se
desconoce si es válido suponer la normalidad de los datos, conviene utilizar
pruebas no paramétricas, al menos para corroborar los resultados obtenidos a
partir de la utilización de la teoría basada en la normal.
DISTRIBUCION DE PROBABILIDAD
1. y
3. Es monótona no decreciente
7
La función de distribución es la acumulada de la función de densidad de
probabilidad f(x). Es decir, se calcula directamente según:
PROPIEDADES
Para dos números reales cualesquiera a y b tal que (a < b), los sucesos
y finalmente
Por lo tanto una vez conocida la función de distribución F(x) para todos
los valores de la variable aleatoria x conoceremos completamente la distribución
de probabilidad de la variable.
8
Para realizar cálculos es más cómodo conocer las distribución de
probabilidad, para ver una representación gráfica de la probabilidad es más
práctico el uso de la función de densidad.
DISTRIBUCIONES DISCRETAS
DISTRIBUCION BERNOULLI
9
valores X=0 si el suceso no ocurre, y X=1 en caso contrario, y que se
denota
10
Y su función de distribución:
11
DISTRIBUCION BINOMIAL
Se dice que una variable aleatoria (v.a). X sigue una ley binomial de
p:
Esta definición puede interpretarse en el siguiente sentido: Supongamos que
realizamos n pruebas de Bernouilli, Xi, donde en todas ellas, la probabilidad de
éxito es la misma (p), y queremos calcular el número de éxitos, X, obtenidos el
total de las n pruebas.
12
Figura: Función de probabilidad de una variable
binomial cuando n es grande.
13
La función característica de la suma de variables independientes es el
producto de las funciones características de estas:
14
Ejemplo
Un médico aplica un test a 10 alumnos de un colegio para detectar una
Solución:
15
Sea X1 la v.a. que contabiliza el número de resultados positivos. Es claro
16
Si queremos calcular a cuantas personas les dará el test un resultado
positivo aunque en realidad estén sanas, hemos de calcular previamente
17
Por último vamos a calcular la probabilidad p3 de que el test de un
resultado erróneo, que es:
18
DISTRIBUCION GEOMETRICA
19
De este modo tenemos que la ley de probabilidad de X es
Observación
Es sencillo comprobar que realmente f es una ley de probabilidad, es decir,
20
Observación
En la distribución geométrica el conjunto de posibles valores que puede
tomar la variable ( ) es infinito numerable, mientras que en la de Bernouilli y
en la binomial, estos eran en número finito.
21
Ejemplo
Un matrimonio quiere tener una hija, y por ello deciden tener hijos hasta
el nacimiento de una hija. Calcular el número esperado de hijos (entre varones
y hembras) que tendrá el matrimonio. Calcular la probabilidad de que la pareja
acabe teniendo tres hijos o más.
Es claro que
22
La probabilidad de que la pareja acabe teniendo tres o más hijos, es la de
que tenga 2 o más hijos varones (la niña está del tercer lugar en adelante), es
decir,
Observación
La distribución exponencial también puede ser definida como el número
de pruebas realizadas hasta la obtención del primer éxito (como hubiese sido
más adecuado en el ejemplo anterior). En este caso es un ejercicio sencillo
23
comprobar que X sólo puede tomar valores naturales mayores o iguales a 1, y
que:
=1mm
Es decir,
24
De nuevo, el conjunto de posibles valores de esta v.a. discreta es
Su función característica es
Ejemplo
Para tratar a un paciente de una afección de pulmón han de ser operados
en operaciones independientes sus 5 lóbulos pulmonares. La técnica a utilizar es
25
tal que si todo va bien, lo que ocurre con probabilidad de 7/11, el lóbulo queda
definitivamente sano, pero si no es así se deberá esperar el tiempo suficiente para
intentarlo posteriormente de nuevo. Se practicará la cirugía hasta que 4 de sus
5lóbulos funcionen correctamente. ¿Cuál es el valor esperado de intervenciones
que se espera que deba padecer el paciente? ¿Cuál es la probabilidad de que se
necesiten 10 intervenciones?
26
Y=X+r
Luego
Observación
La distribución binomial negativa también se puede definir como el
número de pruebas hasta la aparición de r éxitos. Como el número de pruebas
contabiliza tanto los éxitos como los fracasos se tendría según ésta definición
que
27
DISTRIBUCION HIPERGEOMETRICA
28
De modo que podemos decir que
Este ejemplo sirve para representar el tipo de fenómenos que siguen una
ley de distribución hipergeométrica. Diremos en general que una v.a. X sigue
una distribución hipergeométrica de parámetros, N, n y p, lo que
Observación
Cuando el tamaño de la población (N) es muy grande, la ley
hipergeométrica tiende a aproximarse a la binomial:
29
El valor esperado de la hipergeométrica es el mismo que el de la binomial,
DISTRIBUCION DE POISSON
Poisson cuando
30
Este tipo de leyes se aplican a sucesos con probabilidad muy baja de
ocurrir, obteniéndose como la distribución límite de una sucesión de variable
31
En general utilizaremos la distribución de Poisson como aproximación de
experimentos binomiales donde el número de pruebas es muy alto, pero la
probabilidad de éxito muy baja. A veces se suele utilizar como criterio de
aproximación:
32
La función característica de es
Ejemplo
Cierta enfermedad tiene una probabilidad muy baja de ocurrir,
p=1/100.000. Calcular la probabilidad de que en una ciudad con 500.000
habitantes haya más de 3 personas con dicha enfermedad. Calcular el número
esperado de habitantes que la padecen.
33
Así el número esperado de personas que padecen la enfermedad es .
VARIABLE ALEATORIA
34
DISTRIBUCIONES CONTINUAS CLASIFICACION Y EJEMPLO
Donde:
35
Es decir, que el valor final esté entre 140 ptas. y 141 ptas. tiene un 5% de
probabilidad, que esté entre 141 y 142, otro 5%, etc.
En el ejemplo:
Es decir, que el volumen de precipitaciones esté entre 400 y 401 litros tiene un
1% de probabilidades; que esté entre 401 y 402 litros, otro 1%, etc.
36
Es decir, la precipitación media estimada en Sevilla para el próximo año es de
450 litros.
Un 50% de los valores están a la derecha de este valor central y otro 50%
a la izquierda
X: N (m, s2)
37
m: es el valor medio de la distribución y es precisamente donde se sitúa
el centro de la curva (de la campana de Gauss).
s2: es la varianza. Indica si los valores están más o menos alejados del
valor central: si la varianza es baja los valores están próximos a la media; si es
alta, entonces los valores están muy alejados de ella. Se representa por s2 porque
su raíz cuadrada, s, es la denominada desviación estándar.
X: N (10, 4)
38
Esta nueva variable se distribuye como una normal tipificada,
permitiéndonos, por tanto, conocer la probabilidad acumulada en cada valor.
Y: N (0, 1)
X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,
0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0
0,
0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723
1
0,
0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
2
0,
0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
3
0,
0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
4
0,
0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7090 0,7224
5
39
0,
0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
6
0,
0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7813 0,7852
7
0,
0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
8
0,
0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
9
1,
0,8416 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
0
1,
0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1
1,
0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
2
1,
0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
3
1,
0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
4
1,
0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
5
1,
0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
6
1,
0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
7
1,
0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
8
40
1,
0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
9
2, 0,9772 0,9777 0,9783 0,9788 0,9793 0,9798 0,9803 0,9807 0,9812 0,9816
0 5 8 1 2 2 2 0 7 4 9
2, 0,9821 0,9825 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9853 0,9857
1 4 7 0 1 2 2 1 0 7 4
2, 0,9861 0,9864 0,9867 0,9871 0,9874 0,9877 0,9880 0,9884 0,9887 0,9889
2 0 5 9 3 5 8 9 0 0 9
2, 0,9918 0,9920 0,9922 0,9924 0,9926 0,9928 0,9930 0,9932 0,9934 0,9936
4 0 2 4 5 6 6 5 4 3 1
2, 0,9937 0,9939 0,9941 0,9943 0,9944 0,9946 0,9947 0,9949 0,9950 0,9952
5 9 6 3 0 6 1 7 2 6 0
2, 0,9953 0,9954 0,9956 0,9957 0,9958 0,9959 0,9960 0,9962 0,9963 0,9964
6 4 7 0 3 5 8 9 1 2 3
2, 0,9974 0,9975 0,9976 0,9976 0,9977 0,9978 0,9978 0,9979 0,9980 0,9980
8 4 2 0 7 4 1 8 5 1 7
2, 0,9981 0,9981 0,9982 0,9983 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986
9 3 9 5 1 6 1 6 1 6 1
41
¿Cómo se lee esta tabla?
Ejemplos:
Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486
42
Esta tabla se puede utilizar con una distribución normal:
Ejemplo: el salario medio de los empleados de una empresa se distribuye según
una distribución normal, con media 5 millones de ptas. y desviación típica 1
millón de ptas. Calcular el porcentaje de empleados con un sueldo inferior a 7
millones de ptas.
43
Ejercicio 1: La renta media de los habitantes de un país es de 4 millones
de ptas/año, con una varianza de 1,5. Se supone que se distribuye según una
distribución normal. Calcular:
44
Por lo tanto:
45
Vemos en la tabla el valor de la variable normalizada y cuya probabilidad
acumulada es el 0,8 (80%). Como sabemos que hasta la media la probabilidad
acumulada es del 50%, quiere decir que entre la media y este valor de Y hay un
30% de probabilidad.
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos
superiores a 2,97 millones de ptas. e inferiores a 5,03 millones de ptas.
constituyen el 60% de la población con un nivel medio de renta.
46
Por lo tanto
Por lo tanto
47
a) 5% de la población que más bebe.
Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada
es el 0,95 (95%), por lo que por arriba estaría el 5% restante.
Ese valor corresponde a Y = 1,645 (aprox.). Ahora calculamos la variable
normal X equivalente a ese valor de la normal tipificada:
Por lo tanto
Luego, tan sólo un 1,39% de la población bebe menos que usted. Parece
un argumento de suficiente peso para que dejen de catalogarle de "enamorado
de la bebida"
48
Ejercicio 4: A un examen de oposición se han presentado 2.000
aspirantes. La nota media ha sido un 5,5, con una varianza de 1,5.
a) Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir
organizando una fiesta para celebrar su éxito?
49
Este valor de Y corresponde a 0,842 (aprox.). Ahora calculamos el valor
de la normal X equivalente:
EL VALOR ESPERADO
50
PRUEBA DE LOS SIGNOS
Esta prueba nos permite comparar nuestros datos con una mediana teórica
(por ejemplo un valor publicado en un artículo).
51
Llamemos M0 a la mediana frente a la que vamos a contrastar nuestros
datos, y sea X1, X2 .. Xn los valores observados. Se calcula las diferencias X1-
M0, X2-M0,..., Xn-M0. Si la hipótesis nula fuera cierta estas diferencias se
distribuirían de forma simétrica en torno a cero.
Para efectuar esta prueba se calculan las diferencias en valor absoluto |Xi-
M0| y se ordenan de menor a mayor, asignándoles su rango (número de orden).
Si hubiera dos o más diferencias con igual valor (empates), se les asigna el rango
medio (es decir que si tenemos un empate en las posiciones 2 y 3 se les asigna
el valor 2.5 a ambas). Ahora calculamos R+ la suma de todos los rangos de las
diferencias positivas, aquellas en las que Xi es mayor que M0 y R- la suma de
todos los rangos correspondientes a las diferencias negativas. Si la hipótesis nula
es ciertos ambos estadísticos deberán ser parecidos, mientras que si nuestros
datos tienen a ser más altos que la mediana M0, se reflejará en un valor mayor
de R+, y al contrario si son más bajos. Se trata de contrastar si la menor de las
sumas de rangos es excesivamente pequeña para ser atribuida al azar, o, lo que
es equivalente, si la mayor de las dos sumas de rangos es excesivamente grande.
52
. Ahora la hipótesis nula es que esas diferencias proceden de una distribución
simétrica en torno a cero y si fueran ciertos los valores de R+ y R- serán
parecidos.
PRUEBA DE KRUSKAL-WALLIS
53
El test de Kruskal-Wallis es la alternativa no paramétrica del método
ANOVA, es decir, sirve para contrastar la hipótesis de que k muestras
cuantitativas han sido obtenidas de la misma población.
Niveles Observaciones de X
... ...
54
El número total de elementos en todas las muestras es:
Se calcula el estadístico:
55
En cualquier otro caso, se compara el valor de H con el de la tabla de la
Ejemplo
1. Se desea determinar si la motivación que tienen los mecánicos, los
carpinteros y los electricistas para realizar su trabajo es diferente, se desea probar
la hipótesis nula de que los puntajes obtenidos mediante un test por los
trabajadores de los tres oficios son los mismos, con la alterna de que son
diferentes. Supongamos se toman tres (K = 3) muestras independientes
respectivamente y que los tamaños de las muestras combinadas son como se
indica a continuación.
56
N = 7 + 7 + 6 = 20
Se sustituye estos valores rn la formula y se obtiene
Se concluye que los puntajes sobre motivación son diferentes para los
trabajadores de los tres oficios al nivel de significancia del ∂= 0.01
Total 18 9.5
H = 8.23 DF = 2 P = 0.016
H = 8.25 DF = 2 P = 0.016
57
Interpretación: Como el “p-value” es 0.016 menor que 5, se rechaza la
hipótesis nula y se concluye que los métodos no son todos iguales. Es decir; al
menos uno de los métodos tiene mediana distinta a los otros.
58
ambas poblaciones de origen difieren las observaciones de cada muestra
tenderán a aparecer juntas y el número de rachas será pequeño.
Para conducir una Prueba de corridas en una muestra, realice los pasos
siguientes:
59
a =1 + 2n1n2/(n 1 + n2).
Paso 6: Conclusión:
Nota: Esta prueba es válida para los casos en los cuales n1 y n2 son
grandes, al menos mayores que 10. Para muestras de pequeñas de tamaños, las
tablas especiales deben ser utilizadas.
Ejemplo
60
Respecto de datos numéricos, un medio para obtener el esquema
requerido de dos categorías es clasificar cada observación según si es superior o
inferior a la mediana del grupo. En general, mucho menos corridas o mucho más
corridas que las que sería de esperar al azar resultarían en el rechazo de la
hipótesis nula de que la secuencia de observaciones es una secuencia aleatoria.
61
PRUEBA U DE MANN – WHITNEY
Formulas:
El estadístico U :
─ R1
− R2
Donde:
U1 y U2 = valores estadísticos de U Mann-Whitney.
n1 = tamaño de la muestra del grupo 1.
n2 = tamaño de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.
62
Las dos formulas pueden ofrecer dos valores U, designando el mayor
valor por U’ se verificará si se ha encontrado U o bien U’ y se comparara el
valor resultante es mayor que n1n2/2, se tratara de U’ y el valor de U se puede
hallar mediante la fórmula
U = n1 n2 − U’
Valor Promedio:
E(U) = n1 n2
z = U − E(U) / σU
Donde:
Z = valor estadístico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
E(U)= valor promedio de U.
σU = desviación estándar de U.
La desviación estándar de U
63
Pasos:
Ejemplo:
64
U= 10 (21) + 10 (10 + 1) − 98 = 167
2
R1 = 98 R2 = 398
65
Z = 43 − 105 = −2.62
23.66
Si el nivel de significancia se toma a ∂=0.01, los valores Z críticos son +/-
2.575 así que se rechaza la hipótesis nula y se concluye que el número de
unidades vendidas por los vendedores sin grado académico, no es igual al
número de unidades que logran vender los vendedores con dicho grado.
CORRELACION
66
componentes elementales de una línea de ajuste y, por lo tanto, de una
correlación, son la fuerza, el sentido y la forma:
-1 < r < 1
67
distribuyen alrededor de una recta. Si así ocurre diremos que hay correlación
lineal. La recta se denomina recta de regresión.
Ejemplo
Una persona se entrena para obtener el carnet de conducir repitiendo un
test de 50 preguntas. En la gráfica se describen el nº de errores que corresponden
a los intentos realizados.
68
Observa que hay una correlación muy fuerte (los puntos están "casi"
alineados) y negativa (la recta es decreciente).
Diagrama De Dispersión
La primera forma de describir una distribución bivariante es representar
los pares de valores en el plano cartesiano. El gráfico obtenido recibe el nombre
de nube de puntos o diagrama de dispersión.
69
Línea De Tendencia
La línea de tendencia es la herramienta básica más importante con la que
cuenta el analista técnico.
Es una línea o conjunto de líneas que se trazan en el gráfico uniendo con una
misma pendiente series sucesivas de puntos mínimos (línea de tendencia alcista)
o de puntos máximos (línea de tendencia bajista).
Sirve para determinar en primer lugar la dirección del mercado y
establecer sus objetivos de proyección.
Marca los niveles de soporte o de resistencia que están proyectando los
precios.
Permite analizar en cada momento el nivel de Beneficio/Riesgo que se
puede tomar al iniciar o cerrar una posición, tomando como referencia el precio
actual respecto a línea de tendencia y su proyección.
La ruptura de una línea de tendencia al alza o la baja es una de las señales
que confirma un cambio en la dirección de los precios.
Son la base para trazar los canales que encuadran el posible movimiento
de los precios.
Según sea la dispersión de los datos (nube de puntos) en el plano
cartesiano, pueden darse alguna de las siguientes relaciones, Lineal,
Logarítmica, Exponencial, Cuadrática, entre otras.
70
COEFICIENTE DE CORRELACION DE PEARSON
71
Una correlación de -1 significa que existe una relación lineal inversa
perfecta (negativa) entre las dos variables. Lo que significa que las
puntuaciones bajas en X se asocian con los valores altos en Y, mientras
las puntuaciones altas en X se asocian con los valores bajos en Y.
72
COEFICIENTE DE CORRELACIÓN SIMPLE POR RANGOS DE
KENDALL
La fórmula es la siguiente:
73
Donde:
t (tau) = coeficiente de correlación de Kendall.
S = puntuación efectiva de los rangos.
N = tamaño de la muestra en parejas de variables.
Donde:
Z = valor Z de la distribución normal.
t = coeficiente de correlación de Kendall.
N = tamaño de la muestra.
Pasos:
74
Ejemplo:
Planteamiento de la hipótesis.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se
rechaza Ho.
75
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
76
El cálculo de la puntuación efectiva (S) se realiza con el ordenamiento de los
rangos de la variable dependiente (Y).
El primer valor del rango de Y es 1. Respecto a los demás rangos, existen siete
mayores que Y y ninguno es menor, de manera que queda:
S = (7 - 0) +
Después está el rango 5, luego se hallan tres por arriba y tres por debajo de éste
y se continúa:
S = (7 - 0) + (3 - 3) +
En rango siguiente es el 3, del cual cuatro son mayores y uno menor, y queda:
S = (7 - 0) + (3 - 3) + (4 - 1) +
77
Calculamos el nivel se significancia.
Decisión.
Como el valor Z tiene mayor probabilidad que el nivel de significancia, se acepta
Ho y se rechaza Ha.
Interpretación.
La correlación entre las variables educación materna y desarrollo mental del hijo
no es significativa. Esta misma conclusión se obtuvo mediante el coeficiente de
correlación de Spearman.
78
Donde:
t (tau) = coeficiente de correlación de Kendall.
S = puntuación efectiva de los rangos.
N = tamaño de la muestra en parejas de variables.
Lx = sumatoria de ligas o empates dados en la variable independiente (X).
Ly = sumatoria de ligas o empates dados en la variable dependiente (Y).
TEST DE COHEN-KAPPA
79
La ecuación para κ es:
Tenga en cuenta que las medidas de Cohen kappa acuerdo entre dos
calificadores sólo. Por una medida similar de acuerdo (Fleiss' kappa) que se
utiliza cuando hay más de dos calificadores.
80
Κ Interpretación
81
Bret
20 19 39
Rechazar
Bret
5,46 33,54 39
Rechazar
82
La prueba estadística de Kappa se calcula a partir de:
Donde:
El número de juicios
Ensayos
83
coincidencias frente al total de sujetos: (a + d) / n.
Pero resulta que aunque no existiera ninguna relación entre los dos
métodos de clasificación, está claro que es previsible que encontremos algún
grado de concordancia entre ellos por puro azar. Así, si el método A consiste
en clasificar al paciente con resultado positivo si sale cara al lanzar una
moneda al aire y cruz en el caso contrario, y hacemos lo mismo en el método B
(con otra moneda diferente), es previsible encontrar en promedio del orden de
un 50 % de coincidencias.
84
el acuerdo observado sea inferior al esperado el índice kappa es menor que
cero.
85
interpretación; no obstante, tiene sus problemas y limitaciones que pueden
consultarse por el lector interesado en la bibliografía que acompaña este artículo.
El principal problema de esta medida de concordancia radica en que está pensada
para clasificaciones nominales, en las que no existe un orden de graduación entre
las diferentes categorías. Cuando esto no es así, pensemos por ejemplo en una
clasificación del tipo Muy grave - grave - leve - sin importancia, donde no es lo
mismo que el desacuerdo se produzca clasificando como sin importancia por un
evaluador y leve por otro, a que uno de ellos clasifique como sin importancia y
otro como muy grave. El índice kappa hasta ahora descrito únicamente tiene en
consideración si hay o no acuerdo, esto es si se clasifica o no al sujeto en la
misma categoría, por lo que a la hora de calcularlo pesan por igual las dos
situaciones anteriormente descritas.
CORRELACION DE SPEARMAN
86
Es una prueba no paramétrica que mide la asociación o interdependencia
entre dos variables discretas. Para calcular ρ, los datos son ordenados y
reemplazados por su respectivo orden.
87
correlación por rangos, inversiones entre dos ordenaciones de una distribución
normal bivariante.
Ejemplo.
CI Horas de TV a la semana
106 7
86 0
100 28
100 50
99 28
103 28
97 20
113 12
88
113 7
110 17
Después de realizar todo esto con los datos del ejemplo, se debería acabar con
algo como lo siguiente:
86 0 1 1 0 0
97 20 2 6 4 16
89
99 28 3 8 5 25
103 28 6 8 2 4
110 17 8 5 3 9
Nótese como el número de orden de los valores que son idénticos es la media de
los números de orden que les corresponderían si no lo fueran.
90
De lo que resulta ρ = − 0.187878787879.
91
tamaños de muestra cada vez mayores, de modo que no es práctico para la
mayoría extender las tablas existentes.
92
KOLMOGOROV – SMIRNOV
93
La distribución de Kolmogorov es la distribución de la variable aleatoria
94
K α, donde se encuentra desde
95
Este contraste, que es válido únicamente para variables continuas,
compara la función de distribución (probabilidad acumulada) teórica con la
observada, y calcula un valor de discrepancia, representado habitualmente como
D, que corresponde a la discrepancia máxima en valor absoluto entre la
distribución observada y la distribución teórica, proporcionando asimismo un
valor de probabilidad P, que corresponde, si estamos verificando un ajuste a la
distribución normal, a la probabilidad de obtener una distribución que discrepe
tanto como la observada si verdaderamente se hubiera obtenido una muestra
aleatoria, de tamaño n, de una distribución normal. Si esa probabilidad es grande
no habrá por tanto razones estadísticas para suponer que nuestros datos no
proceden de una distribución, mientras que si es muy pequeña, no será aceptable
suponer ese modelo probabilístico para los datos
96
CONCLUSIONES
y
Es continua por la derecha
Es monótona no decreciente
4. La distribución discreta basada en la función de probabilidad acumulada
(entre 0% y 100%), genera un aleatorio.
5. La distribución de Bernoulli es una variable dicotómica puede tomar dos
modalidades, por ello que el hecho de llamar éxito o fracaso a los
posibles resultados de las pruebas obedece más una tradición literaria o
histórica.
6. La distribución de Bernoulli tiene como función característica
éxito en la sucesión .
8. La distribución de binominal negativa tiene como ley de probabilidad:
97
9. El valor esperado de la hipergeométrica es el mismo que el de la binomial
98
18. La prueba Mann-Whitney es un método no paramétrico aplicado a dos
muestras independientes, cuyos datos han sido medidos al menos en una
escala de nivel ordinal.
19. La correlación indica la fuerza y la dirección de una relación lineal entre
dos variables aleatorias.
20. La correlación de Pearson es independiente de la escala de medida de las
variables.
21. El coeficiente de correlación parcial de Kendall tiene como formula
BIBLIOGRAFIA
1. www.google.co.ve
2. www.geocities.com
3. www.elrincondelvago.com
99
4. es.wikipedia.org
5. Estadística para las ciencias administrativas. Tercera edición. Lincoln L.
Chao
6. www.monografias.com
100