Академический Документы
Профессиональный Документы
Культура Документы
INTRODUCCIÓN
¿QUÉ ES LA (BIO)ESTADÍSTICA?
RECOGER
CLASIFICAR - No permite extraer conclusiones
DESCRIPTIVA
REPRESENTAR - Sujeta a errores
RESUMIR
- Permite generalizar de la
INFERENCIAL HACER INFERENCIAS muestra a la población general
- Toma de decisiones
ESTADISTICA DESCRIPTIVA
EJEMPLO:
De las 50 personas estudiadas 10 (20%) eran
varones, la media de edad de 30 años (DE 18), …
CONCEPTOS GENERALES
TIPOS DE EXPERIEMTOS
DETERMINISTAS
ALEATORIAS/ESTOCASTICOS
Población: grupo con al menos una
característica común. Tipos:
finita/infinita.
ESTADISTICO/ESTIMADOR → muestra
PARÁMETRO → población
POBLACIÓN
µ = 173,2
Selección al azar
EJEMPLO:
Se quiere probar la efectividad de un nuevo fármaco para
controlar la hipertensión arterial
•Variable independiente:
Nuevo fármaco (factor de estudio)
•Variable dependiente:
Valores de hipertensión arterial
2. Variables universales
(sociodemográficas)
– Edad
– Sexo
– Clase social
– Estado civil,...
3. Variables complementarias
Cuantitativas Cualitativas
CUANTITATIVAS CUALITATIVAS
Ordinales Nominales
Discretos Continuos
Politómico Dicotómico
peso sexo
endodoncias grupo sanguíneo
colesterol gravedad
nº de hijos religión
• Matriz de datos
- filas
- columnas
• Perdidos
ESCALA A ELEGIR
Consumo de tabaco:
- fumador/no fumador
- nº cigarrillos al día
CODIFICACIÓN:
CUANTITATIVAS CUALITATIVAS
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
ECB 2 39 55 157 2 2 0
Pedro 1 33 70 170 2 2 2
JPG 1 50 70 180 2 1 1
CMO 2 40 51 155 2 1 1
NOTACIÓN
Parámetros: a nivel poblacional. Se
suelen usar caracteres griegos (σ,
μ,…)
Variables: x, y, edad
CUALITATIVA D istribución de
PROPORCIÓN
frecuencias
I nteresa la RANGO
dispersión VARIANZA
DESVIACIÓN TÍPICA
COEFICIENTE DE
VARIACIÓN
SÍNTESIS de DATOS
(variables cualitativas)
Grupo sangu íneo, n º de hermanos y peso (en Kg. ) de 500
alumnos varones de una Universidad
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TIPOS DE FRECUENCIAS
∑n
N i j=1
j i n
j
i
Fi = = =∑ = ∑ f j
N N j=1 N j=1
Ejercicio: Calcular las frecuencias absolutas y relativas del
sexo y del estado de salud de los siguientes datos:
1 1 0 nhombre
2 2 1 fhombre
3 1 1 nmujer
4 1 1 fmujer
5 2 2 nmalo Nmalo
6 1 0 fmalo Fmalo
7 1 2 nregular Nregular
8 1 2 fregular Fregular
9 2 1 nbueno Nbueno
10 1 2 fbueno Fbueno
Ejercicio: En un estudio de 200 radiografías se evalúa
cuantas radiografías han precisado un grupo de pacientes.
Completar la siguiente tabla de frecuencias absolutas y
relativas de la siguiente tabla:
Nº Rx Personas f i F i
0 0.2
1 84
2 0.72
3
4 24
5 0.02
TIPOS DE FRECUENCIAS
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TABLAS DE FRECUENCIA
Distribución del grupo sanguíneo en 500 alumnos varones de
una Universidad
Intervalo de clase ni f i %
Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
REPRESENTACIONES GRÁFICAS
(variables cualitativas)
GRÁFICO DE SECTORES
5,2
19,6 7,6
Médico (n=272)
Residente (n=399)
Enfermería (n=1869)
35,7
31,9 Auxiliar (n=1674)
Celador (n=1027)
40,0
35,7
35,0
31,9
30,0
Frecuencia relativa
25,0
19,6
20,0
15,0
10,0 7,6
5,2
5,0
0,0
Médico Residente Enfermería Auxiliar Celador
(n=272) (n=399) (n=1869) (n=1674) (n=1027)
2000 1869
1800 1674
1600
1400
Frecuencia absoluta
1200
1027
1000
800
600
399
400 272
200
0
Médico Residente Enfermería Auxiliar Celador
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0
Frecuencia relativa
50,0
45,0
Frecuencia relativa (IC 95%)
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
Infrapeso (n=5) Normopeso Sobrepeso (n=33) Obesidad (n=28)
(n=36)
100
88,5
90
82,1
80 73,6 72,3
70
Frecuencia relativa
60
50
40
26,4 27,7
30
17,9
20
11,5
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto
100
11,5
90 17,9
26,4 27,7
80
70
60
50
88,5
40 82,1
73,6 72,3
30
20
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto
60
p=0,003 p<0,001 p<0,001
50
46,2
40
Porcentaje HM
30,4
30
24,2
21,3
20 17,4
14,3 13,2
10,8
10
0
Fijo Temporal Interino Quirúrgica Intensivos Médica Si No
Contrato Área Uso de guantes
2187|1576|1411 2056|1366|1822 2789|2455
µA µB
Medidas de
Cuantiles
tendencia central
cuartiles,
Media Mediana Moda tertiles,
percentiles, …
MODA
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
No hay moda
Moda = 9
MEDIA ARITMÉTICA (I)
48 54 58 60
1 N x1 + x 2 + ... + x N
x = ∑ xi =
N i =1 N
Mismas unidades de la variable
Se afecta por los valores extremos:
EJEMPLO:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 5.0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 6.8
MEDIA PONDERADA
• Se emplea para cuando se quiere dar más peso a unos
valores que a otros.
xP =
∑ (x ×p )
i i
∑p i
EJEMPLO:
Supongamos que en una asignatura se ha obtenido un 5 en
prácticas, 6 en participación en clase, examen teórico 8 y examen
práctico 6. La nota final es 5% las prácticas, 15% la participación
en clase, 45% el examen teórico y 35% el práctico.
5×5+6×15+8×45+6×35
xP = =6.85
5+15+45+35
MEDIA GEOMÉTRICA
EJEMPLO:
En el ejemplo anterior: μ G = 5 48 ⋅ 54 ⋅ 58 ⋅ 60 ⋅ 60 = 55.8
48 54 58 60
MEDIANA
El valor que deja por encima el 50% de las
observaciones y por debajo el otro 50%
En una serie ordenada es el número central EJEMPLO:
• Si n es impar, la mediana
0 1 2 3 4 5 6 7 8 9 10
es el dato central
Mediana = valor central = 5
• Si n es par, la mediana
es la media de los 2 datos 0 1 2 3 4 5 6 7 8 9 10
0 1 2 3 4 5 6 7 8 9 10 11
Mediana = 5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Mediana = 5
75
3,
50
3,
25
3,
00
3,
Mediana 2,5
Media 2,5
75
2,
50
2,
25
2,
00
2,
75
1,
50
1,
25
1,
00
1,
0
50
40
30
20
10
300
200
100
0
0,0 ,2 ,4 ,6 ,8 1,0
,1 ,3 ,5 ,7 ,9
Media 0,10
Mediana 0,04
media = 3.2 horas
media = 448 mm mediana = 1.0 horas
mediana = 445 mm
CUANTILES
• Percentiles 100
• Deciles 10
• Cuartiles 4
CUARTILES
i ⋅ (n+1)
Posición del cuartil i ( Qi )= con i=1,2,3
4
1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5 ⇒ Q1 = =12.5
4 2
CUARTILES
Separan los datos ordenados en cuatro partes iguales
1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5 ⇒ Q1 = =12.5
4 2
PERCENTILES
i ⋅ (n + 1 )
Posición del percentil i ( p i )= con i = 1,..,99
100
MEDIDAS DE DISPERSIÓN
Indican el grado de
variabilidad de los datos
de la muestra
x
ALGUNOS EJEMPLOS…
Matrimonio 1:
20 y 24 años
Matrimonio 2:
14 y 30 años
MEDIDAS DE DISPERSIÓN
Coeficiente de variación
[CV]
AMPLITUD de RANGO
EJEMPLO:
Ampl. Rango = 12 - 7 = 5 Ampl. Rango = 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
AMPLITUD de RANGO INTERCUARTÍLICO
Q3 - Q 1
• No se afecta por los valores extremos
EJEMPLO:
Q3 - Q1 = 17.5 – 12.5 = 5
s 2
=
∑ ( X -X )
i
n-1
• evitas el valor 0
• unidades al cuadrado
cm → cm2
EJEMPLO:
Queremos calcular la varianza en el ejemplo anterior:
48 54 58 60
s2 =
∑ (X i -X ) 1
x = ∑ xi = 56
n-1 N
2 64 + 4 + 4 +16 +16
s = = 26
4
DESVIACIÓN ESTÁNDAR
s=
∑(x - x)
i
n-1
2
(
∑ i
x − x )
s=
n−1
= 4.3095
Para la muestra: se usa n – 1 en el denominador
2
(
∑ ix − x )
s=
n−1
σ=
∑ (x − μ )
i
±1S: 68,27%
±2S: 95,45%
±3S: 99,73%
DISTRIBUCIÓN NORMAL
(distintas medias, distintas DE)
COEFICIENTE DE VARIACIÓN
s
CV= ×100 =...%
x
EJEMPLO:
S = 1 cm S = 2 cm
0,6 % 0,08 %
DIABÉTICOS CONTROLES
Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
DIABÉTICOS CONTROLES
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
MEDIDAS DE FORMA: ASIMETRÍA
COEFICIENTE DE ASIMETRÍA
(n − 1)(n − 2) s3
% del N de
Recuento la columna
talla al alta [300, 310) 1 ,2%
[310, 320) 0 ,0%
[320, 330) 1 ,2%
[330, 340) 1 ,2%
[340, 350) 1 ,2%
[350, 360) 1 ,2%
[360, 370) 2 ,4%
[370, 380) 0 ,0%
[380, 390) 2 ,4%
[390, 400) 5 1,1%
[400, 410) 7 1,6%
[410, 420) 24 5,4%
[420, 430) 44 9,8%
[430, 440) 60 13,4%
[440, 450) 77 17,2%
[450, 460) 66 14,8%
[460, 470) 55 12,3%
[470, 480) 45 10,1%
[480, 490) 22 4,9%
[490, 500) 14 3,1%
[500, 510) 7 1,6%
[510, 520) 3 ,7%
[520, 530) 2 ,4%
[530, 540) 2 ,4%
[540, 550) 1 ,2%
[550, 560) 2 ,4%
[560, 570) 0 ,0%
[570, 580) 0 ,0%
[580, 590) 0 ,0%
[590, 600) 0 ,0%
[600, 610) 0 ,0%
[610, 620) 0 ,0%
[620, 630) 0 ,0%
[630, 640) 2 ,4%
[640, 650) 0 ,0%
[650, 660) 0 ,0%
Total 447 100,0%
HISTOGRAMA
DESCRIPCIÓN VARIABLES
EstadísticosCUANTITATIVAS Estadísticos
Colesterol
Triglicéridos
N Válidos 331
N Válidos 330
Perdidos 27 Perdidos 28
Media 215,529 Media 104,615
Desv. típ. 39,9085 Desv . tí p. 59,5263
Asimetría ,236 Asimetrí a 1,750
Error típ. de asimetría ,134 Error típ. de asimetría ,134
Mínimo 86,0 Mínimo 28,0
Máximo 356,0 Máximo 396,0
Percentiles 25 188,000 Percentiles 25 64,000
50 214,000 50 87,000
75 242,000 75 128,250
DIAGRAMA DE CAJAS (BOX PLOT)
Valores extremos
≥p75 + 1.5 x amplitud RIC
P75 (Q3)
Mediana (Q2)
P25 (Q1)
200
g lucemia (mg/dl)
160 150
120 110
95
80 75
40
0
momento 0 3 meses 6 meses 1 año
DIAGRAMA DE LINEAS
OJO: No siempre
tiene que
representarse la
media
DIAGRAMA DE DISPERSIÓN
RESUMEN GENERAL DE REPRESENTACIONES GRÁFICAS
Diagrama de
Diagrama de barras Diagrama de Box plot Barras de error Diagrama de Diagrama de
Tipo de variable barras agrupado sectores Histrograma Box plot agrupado Barras de error agrupado líneas dispersión
Cualitativa
Ordinal Sí Cuando Sí, si añadimos Sí, si añadimos Sí, No
Sí, pero es No No No
añadimos la preferible el la información la información dependiendo
información de de barras de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Nominal Cuando Sí, si añadimos Sí, si añadimos Sí,
Sí Sí No No No No
añadimos la la información la información dependiendo
información de de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Cuantitativa
Continua No No No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí
la información es un buen es un buen dependiendo
de una var representante representante del estadístico
cuali de la variable y añadimos la que
información de resumamos en
una var cuali el gráfico
Discreta Sí, si solo Sí, si solo No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí, en
puede tomar puede tomar la información es un buen es un buen dependiendo especial si
pocos valores pocos valores de una var representante representante del estadístico la variable
y añadimos la cuali de la variable y añadimos la puede
que
información de tomar
información de resumamos en muchos
una var cuali una var cuali el gráfico valores