Tema 1. Estadística Descriptiva - 2016 - 2017

(BIO)ESTADÍSTICA
INTRODUCCIÓN
¿QUÉ ES LA (BIO)ESTADÍSTICA?
Es la rama de las matemáticas

aplicadas que permite estudiar
fenómenos biológicos cuyos
resultados son en parte inciertos.
OBJETIVO ⇒ cuantificar la incertidumbre del proceso

de
medición en medicina
¿POR QUÉ ES NECESARIA?
♣ Porque es capaz de controlar la

impredecible variabilidad biológica de los
individuos objeto de estudio en las
ciencias de la salud.
♣ Porque analiza y pone en orden los

datos para responder a la naturaleza cada
vez más cuantitativa de las ciencias de la
salud.
♣ Porque su conocimiento permite la

lectura crítica y comprensiva de los
resultados científicos ajenos.
♣ Porque el trabajo clínico es

esencialmente probabilístico y estadístico,
para dar rigor al diagnóstico, pronóstico y
tratamiento.
♣ Porque la perspectiva comunitaria de las

ciencias de la salud exige su uso para
extrapolar las conclusiones desde la
muestra a la globalidad.
♣ Es necesaria en todas las fases de la

investigación en ciencias de la salud:
diseño, recopilación y análisis de los
resultados.
LA ESTADÍSTICA CONSTA DE DOS
PARTES:
RECOGER
CLASIFICAR - No permite extraer conclusiones
DESCRIPTIVA
REPRESENTAR - Sujeta a errores
RESUMIR
- Permite generalizar de la
INFERENCIAL HACER INFERENCIAS muestra a la población general
- Toma de decisiones
ESTADISTICA DESCRIPTIVA
♣ Describe y sintetiza los datos obtenidos de

las observaciones y mediciones, resumiéndolos
en unos índices denominados estadísticos
EJEMPLO:
De las 50 personas estudiadas 10 (20%) eran
varones, la media de edad de 30 años (DE 18), …
CONCEPTOS GENERALES
TIPOS DE EXPERIEMTOS
DETERMINISTAS
ALEATORIAS/ESTOCASTICOS
Población: grupo con al menos una
característica común. Tipos:
finita/infinita.
Muestra: subconjunto de individuos de la

población sobre el que realizamos
mediciones.
Individuo: cada uno de los elementos de

la población o de la muestra.
• Población
Costes
• Muestra Calidad de los datos
Representatividad
de la población
• Individuos
ESTADISTICO/ESTIMADOR → muestra
PARÁMETRO → población
POBLACIÓN
µ = 173,2
Selección al azar
Muestra 1 Muestra 2 Muestra j

..... .....
x1 = 172,1 x2 = 174,1 xj = 173,7
VARIABLES
Propiedades o cualidades que

presentan los individuos de una
población que se desea estudiar
que es observable y medible
MEDICIÓN
Procedimiento de atribuir valores

cuantitativos o cualitativos a
características de objetos, personas o
hechos.
TIPOS DE VARIABLES (I)
Según su relación con lo estudiado

1. Variables relevantes para los objetivos
del estudio
2. Variables universales
3. Variables complementarias
1. Variables relevantes para los objetivos
del estudio
– Variables dependientes (resultado, efecto, desenlace)
– Variables independientes (exposición, explicativas)
EJEMPLO:
Se quiere probar la efectividad de un nuevo fármaco para
controlar la hipertensión arterial
•Variable independiente:
Nuevo fármaco (factor de estudio)
•Variable dependiente:
Valores de hipertensión arterial
2. Variables universales
(sociodemográficas)
– Edad
– Sexo
– Clase social
– Estado civil,...
3. Variables complementarias
– Variables que permiten definir mejor

la población en estudio
– Variables que ayudan a definir
subgrupos de interés
– Variables que incluyan mediciones
temporales
TIPO DE VARIABLES (II)
También podemos tener

distintos tipos de variables en
función de las características de
lo que midan
Cuantitativas Cualitativas
CUANTITATIVAS CUALITATIVAS
Ordinales Nominales
Discretos Continuos
Politómico Dicotómico
peso sexo
endodoncias grupo sanguíneo
colesterol gravedad
nº de hijos religión
Escala métrica Cualidad

Ejercicio 1:
Clasificar las variables del siguiente cuadro según la escala de

medida:
Variable Escala de medida

Estado civil Cualitativa (categórica policotómica)
Glucosa plasmática (mg/dl) Cuantitativa continua
Diabetes (presente/ausente) Cualitativa (categórica dicotómica)
Hipertensión (normotenso/hipertenso) Cualitativa (categórica dicotómica)
Presión arterial (mmHg) Cuantitativa continua
Valoración APGAR (normal/anormal) Cualitativa (categórica dicotómica)
Tiempo de reacción (s) Cuantitativa continua
Número de padres fumadores Cuantitativa discreta
Nivel de colesterol sérico (g/dl) Cuantitativa continua
Hábito de beber (bebedor/abstemio) Cualitativa (categórica dicotómica)
Dosis de alcohol (alta/baja/sin alcohol) Cualitativa (categórica policocotómica)
Consumo de alcohol (g) Cuantitativa continua
ORGANIZACIÓN Y CODIFICACIÓN
DE LOS DATOS
DATOS
• Matriz de datos
- filas
- columnas
• Perdidos
ESCALA A ELEGIR
Siempre elegir la más informativa
Consumo de tabaco:
- fumador/no fumador
- nº cigarrillos al día
CODIFICACIÓN:
CUANTITATIVAS CUALITATIVAS
Peso: 45, 58, 67... Sexo: H (1) M (2)

Endodoncias: 1, 8, 3... ABO: A (1), B(2), O (3)
Colesterol: 150, 200.. Religión: católico (1)..
CODIFICACIÓN (ejemplo):
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
ECB M 39 55 kg 1.57 m No No Nunca
Pedro Hombre 33 70 kg 170 cm No No Sí, de 3 a 5 h semanales
JPG Varón 50 7000 1.80 m No Sí Menos de 3 h a la semana
CMO Mujer 40 51 1.55 No Sí Menos de 3 h a la semana
NOMBRE SEXO EDAD PESO ALTURA BEBE FUMA REALIZA EJERCICIO FÍSICO
ECB 2 39 55 157 2 2 0
Pedro 1 33 70 170 2 2 2
JPG 1 50 70 180 2 1 1
CMO 2 40 51 155 2 1 1
NOTACIÓN
Parámetros: a nivel poblacional. Se
suelen usar caracteres griegos (σ,
μ,…)
Variables: x, y, edad
Valores de las variables en los

individuos: xi, yi, edadi
Estadísticos: a nivel de muestra

ESTADÍSTICA DESCRIPTIVA
TIPO DE VARIABLE ÍNDICE ESTADÍSTICO
CUALITATIVA D istribución de
PROPORCIÓN
frecuencias
CUANTITATIVA Interesa la MEDIA, MEDIANA,

posición MODA
I nteresa la RANGO
dispersión VARIANZA
DESVIACIÓN TÍPICA
COEFICIENTE DE
VARIACIÓN
SÍNTESIS de DATOS
(variables cualitativas)
Grupo sangu íneo, n º de hermanos y peso (en Kg. ) de 500
alumnos varones de una Universidad
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TIPOS DE FRECUENCIAS
Frecuencia absoluta (recuentos)
Frecuencia relativa (frecuencias absolutas en relación

con el total)
Frecuencia simple (nos fijamos en la ocurrencia de un

solo valor de la variable estudiada)
Frecuencia acumulada (sumatorio hasta un

determinado valor de la variable ~ variables que
guardan un orden)
Frecuencia absoluta simple (ni): expresa el

número de veces que ocurre un determinado valor
de una variable.
Frecuencia absoluta acumulada (Ni): para el valor xi

de la variable sería la la suma de las frecuencias absolutas
de los valores inferiores o iguales a él.
i
Ni = ∑ n j =n1 +n 2 +...+n i
j=1
Frecuencia relativa simple (fi): el cociente entre la

frecuencia absoluta simple (ni) y el número total de
observaciones realizadas (N).
n
n
fi = i
N
con ∑
i= 1
fi =1
Frecuencia relativa acumulada (Fi): en el punto xi

el cociente entre la frecuencia absoluta acumulada (Ni)
y el número total de observaciones realizadas (N).
i
∑n
N i j=1
j i n
j
i
Fi = = =∑ = ∑ f j
N N j=1 N j=1
Ejercicio: Calcular las frecuencias absolutas y relativas del
sexo y del estado de salud de los siguientes datos:
Id Sexo Estado de salud Simples Acumuladas

0=malo; 1=regular;
2=bueno
1 1 0 nhombre
2 2 1 fhombre
3 1 1 nmujer
4 1 1 fmujer
5 2 2 nmalo Nmalo
6 1 0 fmalo Fmalo
7 1 2 nregular Nregular
8 1 2 fregular Fregular
9 2 1 nbueno Nbueno
10 1 2 fbueno Fbueno
Ejercicio: En un estudio de 200 radiografías se evalúa
cuantas radiografías han precisado un grupo de pacientes.
Completar la siguiente tabla de frecuencias absolutas y
relativas de la siguiente tabla:
Nº Rx Personas f i F i
0 0.2
1 84
2 0.72
3
4 24
5 0.02
Porcentajes (%): se obtienen

expresando las frecuencias
relativas (simples o acumuladas)
en tanto por 100 en vez de en
tanto por 1.
pi=fi x100
Pi=Fi x100
TRANSFORMACIONES BÁSICAS DE
LAS FRECUENCIAS
Razón (Odds): es un cociente en el que el numerador no está incluido

en el denominador.
Ejemplo: Tenemos en una muestra con 4500 varones y 5000 mujeres. La

odds de ser varón es
4500/5000=0.90
Proporción: es un cociente en la que el numerador está incluido en el

denominador.
Ejemplo: En la muestra anterior la proporción de varones será:

4500/9000=0.4737
(también se puedes expresar en %: 47.37%)
Tasa: es una proporción en la que se quiere resaltar la frecuencia

relativa de la aparición de un evento en un tiempo dato.
Ejemplo: Tasa de mortalidad durante un año

TABLAS DE FRECUENCIA
Grupo sangu íneo, n º de hermanos y peso (en Kg .) de 500
alumnos varones de una Universidad
Grupo Nº de
A lumno n.º Peso
sanguíneo hermanos
1 A 0 70,502
2 B 3 67,231
― ― ― ―
― ― ― ―
― ― ― ―
― ― ― ―
500 AB 2 71,676
TABLAS DE FRECUENCIA
Distribución del grupo sanguíneo en 500 alumnos varones de
una Universidad
Grupo Frecuencia Frecuencia P orcentaje

sanguíneo absoluta (n i) relativa (f i) %
A 150 0,30 30%

B 75 0,15 15%
AB 25 0,05 5%
O 250 0,50 50%
T otal 500 1,00 100%

250
500
Dis tribución de peso (x) en kg. de una muestra de 500 alumnos
varones de una Universidad
Intervalo de clase ni f i %
x < 45 1 0,002 0,2

45 ≤ x < 50 3 0,006 0,6
50 ≤ x < 55 12 0,024 2,4
55 ≤ x < 60 75 0,150 15,0
60 ≤ x < 65 103 0,206 20,6
65 ≤ x < 70 155 0,310 31,0
........ ....... ....... ......
x ≥ 90 cajón de2 sastre 0,004 0,4
Total 500 1,000 100,0

EJEMPLOS
“Se realizó una encuesta a 50 pacientes intervenidos

quirúrgicamente (misma intervención y misma
técnica), preguntando a las 24 horas el grado de dolor,
clasificándolo como dolor intenso, moderado o leve
(según definiciones aceptadas), obteniendo que un
25% era leve, un 50% moderado y un 25% intenso”
“Se estudiaron 100 pacientes operados de cadera, de los

cuales 25 eran varones representando un 25%, siendo la
razón hombre/mujer 1/3 (25/75)”
DIABÉTICOS CONTROLES
Número de sujetos (N)

60 84
Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
Glucosa en sangre en
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
REPRESENTACIONES GRÁFICAS
(variables cualitativas)
GRÁFICO DE SECTORES
5,2
19,6 7,6
Médico (n=272)
Residente (n=399)
Enfermería (n=1869)
35,7
31,9 Auxiliar (n=1674)
Celador (n=1027)
Figura. Gráfico de sectores. Distribución de

frecuencias relativas de la categoría profesional
(N=5241)
DIAGRAMA DE BARRAS SIMPLE
40,0
35,7
35,0
31,9
30,0
Frecuencia relativa
25,0
19,6
20,0
15,0
10,0 7,6
5,2
5,0
0,0
Médico Residente Enfermería Auxiliar Celador
(n=272) (n=399) (n=1869) (n=1674) (n=1027)
Figura. Gráfico de barras. Distribución de

(N=5241)
2000 1869
1800 1674
1600
1400
Frecuencia absoluta
1200
1027
1000
800
600
399
400 272
200
0
Médico Residente Enfermería Auxiliar Celador

(N=5241)
UCI Adultos (n=868)

Traumatología (n=332)
Urgencias (n=323)
Angiología (n=320)
Oncología (n=316)
Cardiología (n=314)
Cir.Cardíaca (n=310)
Cir.General (n=307)
Medicina Interna (n=304)
Nefrología (n=295)
Urología (n=281)
Hematología (n=271)
Neurocirugía (n=270)
Neonatos (n=269)
Ginecología (n=236)
UCI Pediátrica (n=229)
0,0 2,0 4,0 6,0 8,0 10,0 12,0 14,0 16,0 18,0
Frecuencia relativa

frecuencias relativas del servicio evaluado
(N=5245)
DIAGRAMA DE BARRAS SIMPLE (IC 95%)
50,0
45,0
Frecuencia relativa (IC 95%)
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
Infrapeso (n=5) Normopeso Sobrepeso (n=33) Obesidad (n=28)
(n=36)

frecuencias relativas del grado de obesidad
(N=120).
DIAGRAMA DE BARRAS AGRUPADO
100
88,5
90
82,1
80 73,6 72,3
70
Frecuencia relativa
60
50
40
26,4 27,7
30
17,9
20
11,5
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto
Figura. Distribución de frecuencias relativas de

higiene de manos (HM) en función del la
categoría profesional.
DIAGRAMA DE BARRAS AGRUPADO/APILADO
100
11,5
90 17,9
26,4 27,7
80
70
60
50
88,5
40 82,1
73,6 72,3
30
20
10
0
Celadores Médico-residente Enfermería Auxiliares
(n=1027) (n=670) (n=1869) (n=1674)
Incorrecto/No HM Correcto

higiene de manos (HM) en función del la
categoría profesional.
DIAGRAMA DE BARRAS AGRUPADO
60
p=0,003 p<0,001 p<0,001
50
46,2
40
Porcentaje HM
30,4
30
24,2
21,3
20 17,4
14,3 13,2
10,8
10
0
Fijo Temporal Interino Quirúrgica Intensivos Médica Si No
Contrato Área Uso de guantes
2187|1576|1411 2056|1366|1822 2789|2455

higiene de manos (HM) en función del contrato,
área y uso de guantes.
SÍNTESIS de DATOS
(variables cuantitativas)
MEDIDAS DE POSICIÓN
µA µB
Medidas de
Cuantiles
tendencia central
cuartiles,
Media Mediana Moda tertiles,
percentiles, …
MODA
Es el valor que ocurre más a menudo
•No se afecta por valores extremos

•Puede no haber moda o haber varias modas
•Se usa para datos numéricos y categóricos
•Sólo tiene sentido cuando hay muchos datos
EJEMPLO:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
No hay moda
Moda = 9
MEDIA ARITMÉTICA (I)
Es el centro de gravedad de la distribución

de valores
48 54 58 60
Medida de tendencia central más usada

MEDIA ARITMÉTICA (II)
1 N x1 + x 2 + ... + x N
x = ∑ xi =
N i =1 N
Mismas unidades de la variable
Se afecta por los valores extremos:
EJEMPLO:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 5.0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Media = 6.8
MEDIA PONDERADA
• Se emplea para cuando se quiere dar más peso a unos
valores que a otros.
xP =
∑ (x ×p )
i i
∑p i
EJEMPLO:
Supongamos que en una asignatura se ha obtenido un 5 en
prácticas, 6 en participación en clase, examen teórico 8 y examen
práctico 6. La nota final es 5% las prácticas, 15% la participación
en clase, 45% el examen teórico y 35% el práctico.
5×5+6×15+8×45+6×35
xP = =6.85
5+15+45+35
MEDIA GEOMÉTRICA
• Relacionada con la transformación logarítmica

• Eliminar la asimetría positiva
• Mejorar la normalidad
N
μ G = N ∏ x i = N x1 ⋅ ... ⋅ x N
i =1
EJEMPLO:
En el ejemplo anterior: μ G = 5 48 ⋅ 54 ⋅ 58 ⋅ 60 ⋅ 60 = 55.8
48 54 58 60
MEDIANA
El valor que deja por encima el 50% de las
observaciones y por debajo el otro 50%
En una serie ordenada es el número central EJEMPLO:
• Si n es impar, la mediana
0 1 2 3 4 5 6 7 8 9 10
es el dato central
Mediana = valor central = 5
• Si n es par, la mediana
es la media de los 2 datos 0 1 2 3 4 5 6 7 8 9 10
centrales Mediana = media del valor (n/2) y (1 + n/2) =

=(3+5)/2=4
No se afecta por valores extremos

EJEMPLO:
0 1 2 3 4 5 6 7 8 9 10 11
Mediana = 5
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Mediana = 5
75
3,
50
3,
25
3,
00
3,
Mediana 2,5
Media 2,5
75
2,
50
2,
25
2,
00
2,
75
1,
50
1,
25
1,
00
1,
0
50
40
30
20
10
300
200
100
0
0,0 ,2 ,4 ,6 ,8 1,0
,1 ,3 ,5 ,7 ,9
Media 0,10
Mediana 0,04
media = 3.2 horas
media = 448 mm mediana = 1.0 horas
mediana = 445 mm
CUANTILES
Indican cuál es la posición relativa de

una observación con respecto al resto de
la muestra
• Percentiles 100
• Deciles 10
• Cuartiles 4
CUARTILES
Separan los datos ordenados en cuatro partes iguales
25% 25% 25% 25%

Q1 Q2 Q3
i ⋅ (n+1)
Posición del cuartil i ( Qi )= con i=1,2,3
4
Datos en orden creciente: 11 12 13 16 16 17 18 21 22

Posiciones: 1 2 3 4 5 6 7 8 9
1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5 ⇒ Q1 = =12.5
4 2
CUARTILES
Separan los datos ordenados en cuatro partes iguales
25% 25% 25% 25%

Q1 Q2 Q3
Primero, calculamos las posiciones que ocuparán los cuartiles
i ⋅ (n + 1 )
Posición del cuartil i ( Q i )= con i=1,2,3
4
EJEMPLO:
Posiciones: 1 2 3 4 5 6 7 8 9
1×(9+1) 12+13
Posición del cuartil 1 ( Q1 )= =2.5 ⇒ Q1 = =12.5
4 2
PERCENTILES
Separan los datos ordenados en 100

partes iguales
i ⋅ (n + 1 )
Posición del percentil i ( p i )= con i = 1,..,99
100
MEDIDAS DE DISPERSIÓN
Indican el grado de
variabilidad de los datos
de la muestra
x
ALGUNOS EJEMPLOS…
peso = 73 kilos edad = 22 años
Matrimonio 1:
20 y 24 años
Matrimonio 2:
14 y 30 años
MEDIDAS DE DISPERSIÓN
(amplitud) Rango (amplitud) Rango intercuartílico

[min;max] [RIC]
Variancia Desviación estándar

[VAR] [DE]
Coeficiente de variación
[CV]
AMPLITUD de RANGO
Diferencia entre el valor mayor y el

menor
• No tiene en cuenta cómo se distribuyen los

datos
• Ventaja: mismas unidades y fácil de calcular
• Desventaja: toma sólo 2 valores y ↑ con n
EJEMPLO:
Ampl. Rango = 12 - 7 = 5 Ampl. Rango = 12 - 7 = 5
7 8 9 10 11 12 7 8 9 10 11 12
AMPLITUD de RANGO INTERCUARTÍLICO
Diferencia entre el tercer y el primer

cuartil: amplitud del 50% central
Q3 - Q 1
• No se afecta por los valores extremos
EJEMPLO:
Q3 - Q1 = 17.5 – 12.5 = 5
“en un rango de 5 unidades se encuentra el 50% de la

muestra”
VARIANCIA
Media de los cuadrados de las desviaciones

a la media
s 2
=
∑ ( X -X )
i
n-1
• evitas el valor 0
• unidades al cuadrado
cm → cm2
EJEMPLO:
Queremos calcular la varianza en el ejemplo anterior:
48 54 58 60
s2 =
∑ (X i -X ) 1
x = ∑ xi = 56
n-1 N
∑(x -x)=(48-56)+(54-56)+(58-56)+(60-56)+(60-56)= −8−2+2+4+4=0

i
Suma de cuadrados !!
2 64 + 4 + 4 +16 +16
s = = 26
4
DESVIACIÓN ESTÁNDAR
La raíz cuadrada positiva de la varianza
s=
∑(x - x)
i
n-1
El más utilizado para evaluar la

dispersión de los valores en torno a la
media
EJEMPLO:
Queremos calcular la DE de la siguiente serie de datos:
Serie Xi: 10 12 14 15 17 18 18 24
2
(
∑ i
x − x )
s=
n−1
n=8 Media =16
(10−16)2 +(12−16)2 +(14−16)2 +(15−16)2 +(17−16)2 + 2(18−16)2 +(24−16)2

s= =
8−1
= 4.3095
Para la muestra: se usa n – 1 en el denominador
2
(
∑ ix − x )
s=
n−1
Para la población: se usa N en el denominador
σ=
∑ (x − μ )
i
El valor de la desviación estándar es

mayor para los datos si son datos de una
muestra
DISTRIBUCIÓN NORMAL
±1S: 68,27%
±2S: 95,45%
±3S: 99,73%
DISTRIBUCIÓN NORMAL
(distintas medias, distintas DE)
COEFICIENTE DE VARIACIÓN
• Medida de variación relativa
• Siempre como porcentaje
• Muestra la variación relacionada con la media
• Se utiliza para comparar 2 o más grupos
s
CV= ×100 =...%
 x
EJEMPLO:
Tenemos 2 métodos de medida de distancias

¿cuál presenta mayor variabilidad?
Estatura de un individuo Altura de un edificio

x= (1,70 m) x= (25 m)
S = 1 cm S = 2 cm
CV= 1/170 x 100 CV= 2/2500
0,6 % 0,08 %

60 84
Sexo
Masculino n (%) 26 (43.3%) 40 (47.6%)
Femenino n (%) 34 (56.7%) 44 (52.4%)
Peso en kg
media (DE) 56.3 (8.2) 52.7 (7.8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)

60 84
Sexo 26 M (43,3%) 40 M (47,6%)

n (%)
34 F (56,7%) 44 F (52,4%)
Peso en kg
media (DE) 56,3 (8,2) 52,7 (7,8)
Edad en años
moda (amplitud) 15 (12 a 18) 14 (12 a 17)
130 (112 a
mg/dl 80 (75 a 92)
131)
mediana (RIQ)
MEDIDAS DE FORMA: ASIMETRÍA
COEFICIENTE DE ASIMETRÍA
coeficiente asimetría (r) =

n ∑ i
( x − x ) 3
(n − 1)(n − 2) s3
Describe la simetría de los datos con respecto a la

media mediana media moda
Γ<0 Γ=0 Γ>0

MEDIDAS DE FORMA: CURTOSIS
REPRESENTACIONES GRÁFICAS
(variables cuantitativas y otros)
HISTOGRAMA
% del N de
Recuento la columna
talla al alta [300, 310) 1 ,2%
[310, 320) 0 ,0%
[320, 330) 1 ,2%
[330, 340) 1 ,2%
[340, 350) 1 ,2%
[350, 360) 1 ,2%
[360, 370) 2 ,4%
[370, 380) 0 ,0%
[380, 390) 2 ,4%
[390, 400) 5 1,1%
[400, 410) 7 1,6%
[410, 420) 24 5,4%
[420, 430) 44 9,8%
[430, 440) 60 13,4%
[440, 450) 77 17,2%
[450, 460) 66 14,8%
[460, 470) 55 12,3%
[470, 480) 45 10,1%
[480, 490) 22 4,9%
[490, 500) 14 3,1%
[500, 510) 7 1,6%
[510, 520) 3 ,7%
[520, 530) 2 ,4%
[530, 540) 2 ,4%
[540, 550) 1 ,2%
[550, 560) 2 ,4%
[560, 570) 0 ,0%
[570, 580) 0 ,0%
[580, 590) 0 ,0%
[590, 600) 0 ,0%
[600, 610) 0 ,0%
[610, 620) 0 ,0%
[620, 630) 0 ,0%
[630, 640) 2 ,4%
[640, 650) 0 ,0%
[650, 660) 0 ,0%
Total 447 100,0%
HISTOGRAMA
DESCRIPCIÓN VARIABLES
EstadísticosCUANTITATIVAS Estadísticos
Colesterol
Triglicéridos
N Válidos 331
N Válidos 330
Perdidos 27 Perdidos 28
Media 215,529 Media 104,615
Desv. típ. 39,9085 Desv . tí p. 59,5263
Asimetría ,236 Asimetrí a 1,750
Error típ. de asimetría ,134 Error típ. de asimetría ,134
Mínimo 86,0 Mínimo 28,0
Máximo 356,0 Máximo 396,0
Percentiles 25 188,000 Percentiles 25 64,000
50 214,000 50 87,000
75 242,000 75 128,250
DIAGRAMA DE CAJAS (BOX PLOT)
≥p75 + 3 x amplitud RIC
Valores extremos
≥p75 + 1.5 x amplitud RIC
Última observación dentro de los límites
P75 (Q3)
Mediana (Q2)
P25 (Q1)
Primera observación dentro de los límites
≤p25 - 1.5 x amplitud RIC

Valores extremos
≤p25 – 3 x amplitud RIC

DIAGRAMA DE CAJAS AGRUPADO (BOX PLOT AGRUPADO)
DIAGRAMA DE BARRAS DE ERROR
DIAGRAMA DE BARRAS DE ERROR AGRUPADO
200
g lucemia (mg/dl)
160 150
120 110
95
80 75
40
0
momento 0 3 meses 6 meses 1 año
DIAGRAMA DE LINEAS
OJO: No siempre
tiene que
representarse la
media
DIAGRAMA DE DISPERSIÓN
RESUMEN GENERAL DE REPRESENTACIONES GRÁFICAS
Diagrama de
Diagrama de barras Diagrama de Box plot Barras de error Diagrama de Diagrama de
Tipo de variable barras agrupado sectores Histrograma Box plot agrupado Barras de error agrupado líneas dispersión
Cualitativa
Ordinal Sí Cuando Sí, si añadimos Sí, si añadimos Sí, No
Sí, pero es No No No
añadimos la preferible el la información la información dependiendo
información de de barras de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Nominal Cuando Sí, si añadimos Sí, si añadimos Sí,
Sí Sí No No No No
añadimos la la información la información dependiendo
información de de una var de una var del estadístico
otra var cuanti cuanti en la que que
cualitativa la media sea resumamos en
un buen el gráfico
representante
Cuantitativa
Continua No No No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí
la información es un buen es un buen dependiendo
de una var representante representante del estadístico
cuali de la variable y añadimos la que
información de resumamos en
una var cuali el gráfico
Discreta Sí, si solo Sí, si solo No Sí Sí Sí, si añadimos Sí, si la media Sí, si la media Sí, Sí, en
puede tomar puede tomar la información es un buen es un buen dependiendo especial si
pocos valores pocos valores de una var representante representante del estadístico la variable
y añadimos la cuali de la variable y añadimos la puede
que
información de tomar
información de resumamos en muchos
una var cuali una var cuali el gráfico valores

Tema 1. Estadística Descriptiva - 2016 - 2017

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Tema 1. Estadística Descriptiva - 2016 - 2017

Загружено:

Авторское право:

Доступные форматы

(BIO)ESTADÍSTICA

Es la rama de las matemáticas

OBJETIVO ⇒ cuantificar la incertidumbre del proceso

♣ Porque es capaz de controlar la

♣ Porque analiza y pone en orden los

♣ Porque su conocimiento permite la

♣ Porque el trabajo clínico es

♣ Porque la perspectiva comunitaria de las

♣ Es necesaria en todas las fases de la

♣ Describe y sintetiza los datos obtenidos de

Muestra: subconjunto de individuos de la

Individuo: cada uno de los elementos de

Muestra 1 Muestra 2 Muestra j

Propiedades o cualidades que

Procedimiento de atribuir valores

Según su relación con lo estudiado

– Variables dependientes (resultado, efecto, desenlace)

– Variables independientes (exposición, explicativas)

– Variables que permiten definir mejor

También podemos tener

Escala métrica Cualidad

Clasificar las variables del siguiente cuadro según la escala de

Variable Escala de medida

Siempre elegir la más informativa

Peso: 45, 58, 67... Sexo: H (1) M (2)

ECB M 39 55 kg 1.57 m No No Nunca

Pedro Hombre 33 70 kg 170 cm No No Sí, de 3 a 5 h semanales

JPG Varón 50 7000 1.80 m No Sí Menos de 3 h a la semana

CMO Mujer 40 51 1.55 No Sí Menos de 3 h a la semana

Valores de las variables en los

Estadísticos: a nivel de muestra

CUANTITATIVA Interesa la MEDIA, MEDIANA,

Frecuencia absoluta (recuentos)

Frecuencia relativa (frecuencias absolutas en relación

Frecuencia simple (nos fijamos en la ocurrencia de un

Frecuencia acumulada (sumatorio hasta un

Frecuencia absoluta simple (ni): expresa el

Frecuencia absoluta acumulada (Ni): para el valor xi

Frecuencia relativa simple (fi): el cociente entre la

Frecuencia relativa acumulada (Fi): en el punto xi

Id Sexo Estado de salud Simples Acumuladas

Porcentajes (%): se obtienen

Razón (Odds): es un cociente en el que el numerador no está incluido

Ejemplo: Tenemos en una muestra con 4500 varones y 5000 mujeres. La

Proporción: es un cociente en la que el numerador está incluido en el

Ejemplo: En la muestra anterior la proporción de varones será:

Tasa: es una proporción en la que se quiere resaltar la frecuencia

Ejemplo: Tasa de mortalidad durante un año

Grupo Frecuencia Frecuencia P orcentaje

A 150 0,30 30%

T otal 500 1,00 100%

x < 45 1 0,002 0,2

Total 500 1,000 100,0

“Se realizó una encuesta a 50 pacientes intervenidos

“Se estudiaron 100 pacientes operados de cadera, de los

Número de sujetos (N)

Figura. Gráfico de sectores. Distribución de

Figura. Gráfico de barras. Distribución de

Figura. Gráfico de barras. Distribución de

UCI Adultos (n=868)

Figura. Gráfico de barras. Distribución de

Figura. Gráfico de barras. Distribución de

Figura. Distribución de frecuencias relativas de