Академический Документы
Профессиональный Документы
Культура Документы
Carlo
CarloFrabetti.
Frabetti.Anaritmetismo.
Anaritmetismo.El
ElPais,
Pais,miércoles
miércoles24
24de
deenero
enerode
de1996.
1996.
4
Manzano
ManzanoV.
V.Inferencia
Inferenciaestadística.
estadística.Aplicaciones
Aplicacionescon
conSPSS/PC+.
SPSS/PC+.Madrid:
Madrid:RA-MA,
RA-MA,1995;
1995;98.
98.
5
Estadística descriptiva.
• Estadística descriptiva.
• Estadística inferencial.
Estadística descriptiva.
– Variables cualitativas:
• Tablas de distribución de frecuencias absolutas
o relativas.
• Gráficas (diagramas de barras y tartas).
– Variables cuantitativas:
• Medidas de tendencia central, de variabilidad, de
posición, de simetría y de apuntamiento.
• Gráficas (histogramas, polígonos de
frecuencias, arbol y hoja, caja y bigotes, nube de
puntos, etc.).
12
• Variables cuantitativas:
• Medidas de tendencia central.
(Distribuciones normales) i =1 n
( )
n
∑ xi − x
2
σ
( )
– Varianza: 2
= 1
n
∑ xi − x
2
n −1
– Desviación estandar: σ= 1
n −1
s
– Coeficiente de variación: CV ( x ) = 100 %
x Q1 − Q3
– Coeficiente Variación intercuartílico: CVI =
Q1 + Q3
15
Ajuste de un modelo
• Media: Modelo para resumir nuestros datos.
• Varianza: Error promediado para evaluar el ajuste del
modelo a los valores de los sujetos.
• Como Desviación Estandar se expresa en las mismas
unidades que la media.
Χ = ∑ xi
n
i =1 n
( )
n
∑1 x i − x
2
σ =
2
n −1
∑ (xi − x )
n 2
σ= 1
n −1
16
• Variables cuantitativas:
• Gráficas (histogramas y polígonos de
frecuencias).
– Intervalos de clase, marca de clase, rango del
intervalo. Pedir 22 intervalos para este fichero.
Satisfacción del usuario en puntuación 18
Porcentaje Porcentaje
Válidos 5,00
Frecuencia
1
Porcentaje
,3
válido
,3
acumulado
,3
Estadística descriptiva.
10,00 2 ,5 ,5 ,8
15,00
20,00
3
4
,8
1,0 1,0
,8 1,5
2,5
Variables cuantitativas
25,00 5 1,3 1,3 3,8
30,00 6 1,5 1,5 5,3
35,00
40,00
45,00
50,00 10
7
8
9
1,8
2,0
2,3
2,5
1,8
2,0
2,3
2,5
7,0
9,0
11,3
13,8
La distribución
55,00 11 2,8 2,8 16,5
60,00
65,00
70,00
75,00
12
13
14
15
3,0
3,3
3,5
3,8
3,0
3,3
3,5
3,8
19,5
22,8
26,3
30,0
Normal
80,00 50
16 4,0 4,0 34,0
85,00 17 4,3 4,3 38,3
90,00 18 4,5 4,5 42,8
95,00 19 4,8 4,8 47,5
40
100,00 20 5,0 5,0 52,5
105,00 19 4,8 4,8 57,3
110,00 18 4,5 4,5 61,8
115,00 17 4,3 4,3 66,0
30
120,00 16 4,0 4,0 70,0
125,00 15 3,8 3,8 73,8
130,00 14 3,5 3,5 77,3
135,00 13 3,3 3,3 80,5
20
140,00 12 3,0 3,0 83,5
145,00 11 2,8 2,8 86,3
150,00 10 2,5 2,5 88,8
155,00 9 2,3 2,3 91,0
10
160,00 8 2,0 2,0 93,0 Std. Dev = 40,82
165,00 7 1,8 1,8 94,8
Mean = 100,0
170,00 6 1,5 1,5 96,3
175,00 5 1,3 1,3 97,5 0 N = 400,00
180,00 4 1,0 1,0 98,5
-5
5,
15
25 0
35 0
45 0
55 0
65 0
75 0
85 0
95 0
10 0
11 ,0
12 ,0
13 ,0
14 ,0
15 ,0
16 ,0
17 ,0
18 ,0
19 ,0
20 ,0
0
,0
185,00
,
,
,
,
,
,
,
,
,
5
5
5
5
5
5
5
5
5
5
5,
3 ,8 ,8 99,3
0
190,00 2 ,5 ,5 99,8
195,00 1 ,3 ,3 100,0
VAR00001
Total 400 100,0 100,0
19
50
La distribución normal
Media, Mediana y Moda,
coinciden
40
Simétrica
Unimodal
30
Dos colas
20
Frecuencia absoluta
Probabilidades de los
valores de la variable en
los intervalos de clase.
10 68% (x±sd)
95% (x ±2sd) Std. Dev = 40,82
0 N = 400,00
-5
5,
15
25 0
35 0
45 0
55 0
65 0
75 0
85 0
95 0
10 0
11 ,0
12 ,0
13 ,0
14 ,0
15 ,0
16 ,0
17 ,0
18 ,0
19 ,0
20 ,0
0
,0
,
,
,
,
,
,
,
,
,
5
5
5
5
5
5
5
5
5
5
5,
0
Estadística descriptiva. Estandarización de los 20
x −x
Z=
60 i
100
s
80
40
N ( x, s 2 ) → N (0,1)
60
20
0 N = 400,00
0,0 40,0 80,0 120,0 160,0 200,0
20
20,0 60,0 100,0 140,0 180,0 Std. Dev = 1,00
68% Mean = 0,00
0
VAR00001 95% N = 400,00
-2,50 -1,50 -,50 99% ,50 1,50 2,50
-2,00 -1,00 0,00 1,00 2,00
Zscore(VAR00001)
21
Estadística inferencial.
• Métodos de inferencia:
– Intervalo de confianza.
– Test de Hipótesis.
24
Intervalo de confianza
25
Teorema del Límite Central.
Inferencia de un parámetro poblacional a partir
de un estimador muestral
Descriptive Statistics Descriptive Statistics
Std. Std.
N Mean Deviation N Mean Deviation
Age Age
236 57,07 14,10 236 55,00 13,35
(years) (years)
Valid N Valid N
236 236
(listwise) (listwise)
Std. Std.
N Mean Deviation Descriptive Statistics N Mean Deviation
Age Age
238 56,46 13,26 Std. 250 55,83 13,10
(years) (years)
N Mean Deviation
Valid N Valid N
238 Age 250
(listwise) 1207 56,39 13,33 (listwise)
(years)
Valid N
Descriptive Statistics 1207 Descriptive Statistics
(listwise)
Std. Std.
N Mean Deviation N Mean Deviation
Age Age
243 56,86 13,30 264 55,94 13,12
(years) (years)
Valid N Valid N
243 264
(listwise) (listwise)
Std. Std.
N Mean Deviation N Mean Deviation
Age Age
258 56,94 13,63 219 54,93 12,88
(years) (years)
Valid N Valid N
258 219
(listwise) (listwise)
26
Teorema Central del Límite.
Inferencia de un parámetro poblacional a partir de
un estimador muestral
Ki N = tamaño poblacional.
n = tamaño muestral.
n,x,s k = número de muestras de tamaño n.
Ki
N, µ, σ
Ki,x,s N N!
k = =
Ki
Ki Ki
n
n! (N− n)!
Ki,x,s
• Sea cual sea la distribución de una variable aleatoria poblacional, con media µ y varianza
σ 2 , la distribución de las medias, x, de muestras de tamaño n es, aproximadamente, una
normal, con media µ y varianza σ 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto
más aproximadamente cuanto mayor sea el tamaño de n (por tanto, a mayor n, mayor
simetría de la distribución).
(*) La raiz cuadrada de este valor es el “Error estandar del estimador”.
27
-1.96*σ/√n µ 1.96*σ/√n
-1.96 0 1.96
(
xi → N µ ,σ 2 n ) Tipificación
xi − µ
→ N (0,1)
σ n
Distribución empírica Distribución estandarizada
28
x −ì
P( − 1.96 ≤ ≤ + 1.96) = 0.95
ó
n
P( x − .
1 96 σ ≤µ ≤x+ .
1 96 σ ) = 0.95
n n
Parámetro (Θ) ∈ Estimador (Θ) ± 1.96 x (error estandar del estimador)
29
pˆ qˆ pˆ qˆ
P( pˆ − t ≤ p ≤ pˆ + t ) = 1 −α
1−α 2 n 1−α 2 n
32
el tamaño muestral.
38
Intervalos de Confianza de los estimadores(*)
Decidir lo que constituye una diferencia clínicamente importante es difícil
e inevitablemente arbitrario. Las características del resultado que se
evalúa (prevenir una muerte, ictus grave, TIA), el riesgo basal, los efectos
adversos, los inconvenientes y el costo, todo influye.
0 10
A
Diferencia de TA entre
Diabéticos y normales
B o entre no tratados y
tratados con un
C fármaco hipotensor.
E
F
G
(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuantía y
dirección) y no tanto en saber la probabilidad de que hallamos llegado a un
resultado falso positivo (si podemos o no rechazar la hipótesis nula).
39
n = (1.96) 2
δ
2
2σ
2
n = (1.96)
δ 2
2 pq
n = (1 . 96 ) 2
δ
En consecuencia, el tamaño muestral dependerá de las
pretensiones del investigador (lo que indica la subjetividad
inherente), ya que éste establecerá las pautas de su estudio.
43
Test de hipótesis
44
Test de Hipótesis.
• Test de hipótesis son procedimientos estadísticos que
nos permiten decidir acerca de una hipótesis
establecida sobre el valor de uno o más parámetros
desconocidos (relaciones entre variables); es decir,
( xi − µ ) 260 − 240
Zi = = =5
σ n 40 100
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
54
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
55
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ
Publishing Group. 1997.
56
Tipo de test estadístico a utilizar para hacer inferencias (estimación de parámetros pobla-
cionales o comparación entre muestras).
DISTRIBU VARIABLE VARIABLE RELACIÓN ENTRE TEST ESTADÍSTICO
CION INDEPEN- DEPENDIENTE LAS MUESTRAS
DIENTE
UNIVARIANTE O BIVARIANTE
Normal Una sola Cuantitativa t-student para una muestra
(Paramé- muestra Cualitativa Chi-cuadrado para una muestra
tricos) (compara con
valor teórico)
No relacionadas Mann-Whitney
W de Wilcoxon
Mediana
Z Kolmogorov-Smirnov
Rachas de Wald-Wolfowitz
Valores extremos de Moses
No relacionadas Kruskal-Wallis
Mediana K variables
ANOVA de dos vías por rangos
tras).
58
DISTRIBUCION VARIABLE VARIABLE RELACIÓN ENTRE TEST ESTADÍSTICO
INDEPENDIENTE DEPENDIENTE LAS MUESTRAS
UNIVARIANTE O BIVARIANTE
COVARIACION (medidas de dos variables en los mismos sujetos o unidades de análisis del estudio)
Paramétrico Ambas variables cuantitativas, pero no hay de- Correlación de Pearson
pendiente o independiente
No paramétrico Ambas variables cuantitativas, pero no hay de- Correlación de Spearman
pendiente o independiente Correlación Tau de Kendal
REGRESIÓN
Paramétrica Cuantitativa o Cuantitativa Regresión lineal simple
Cualitativa
59