Академический Документы
Профессиональный Документы
Культура Документы
“…. El mundo está lleno de variaciones, y a veces se hace dificil descubrir las verdaderas diferencias que surgen
CÁTEDRA DE ECONOMÍA DE como consecuencia. La estadística no sería necesaria si todas las personas fueran idénticas.” Norman y Streiner
HERRAMIENTAS ESTADÍSTICAS
DESCRIBIR LA REALIDAD
DESCRIPTIVA
EXPLICAR LA REALIDAD
COMPARACIÓN DE GRUPOS
PREDECIR LA REALIDAD
REGRESIÓN Y CORRELACIÓN
© AJ García Ruiz
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
1
SPSS
MENÚS DE TRABAJO
MENÚ DE OPCIONES
CUADRO DE DIÁLOGO
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz variable
NIVEL DE MEDICIÓN
TIPOS DE VARIABLES
ESTRUCTURA
NOMINALES ORDINALES
◦ CLASIFICAR ◦ CLASIFICAR
◦ ORDENAR
Atributos de las variables
INTERVALO
◦ CLASIFICAR
Variables ◦ ORDENAR
◦ VALOR NUMÉRICO REAL
2016
© A J G a rc ía R u iz
2
VALORES QUE PUEDE ADOPTAR POSICIÓN EN EL ESTUDIO
TIPOS DE VARIABLES
TIPOS DE VARIABLES
CUALITATIVAS O CATEGÓRICAS RESULTADO O DEPENDIENTE
◦ SUS VALORES NO SON NUMÉRICOS
◦ ES ÚNICA EN CADA ESTUDIO
DICOTÓMICA
POLICÓTOMICA PREDICTORA O INDEPENDIENTE
CUANTITATIVAS ◦ PUEDE SER ÚNICA O MÚLTIPLE
◦ VALORES NUMÉRICOS
DISCRETAS
CONTINUAS ¿cuál es cada una?
POSICIÓN EN EL ESTUDIO
TIPOS DE VARIABLES
© A J G a rc ía R u iz
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
3
CATEGORÍAS MUTUAMENTE
EXCLUYENTES Y EXHAUSTIVAS
1 3
• Cating = 1 ....... Ingresos inferiores a 25.... (menor – 24,999)
• Cating = 2 ....... Ingresos de 25 hasta 50... (25 – 49,999)
2 4
• Cating = 3 ....... Ingresos de 50 hasta 75... (50 – 74,999)
• Cating = 4 ....... Ingresos superiores a 75.. (75 – mayor)
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
TG
LDL-c = Ctotal – – HDL-c
5
P (kg)
IMC =
T2 (m)
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
© AJ García Ruiz
2016
© A J G a rc ía R u iz
4
ESTADÍSTICA DESCRIPTIVA
Es la primera fase de un buen análisis
- descriptivos estadístico.
• Medidas de resumen El estadístico de resumen más adecuado
de las variables de estudio depende del
• Representación gráfica
tipo de datos recogidos:
- inferencial • CUALITATIVOS
• Estimación de parámetros
• CUANTITATIVOS
• Contraste de hipótesis
2016
© A J G a rc ía R u iz
ESTADISTICA DESCRIPTIVA
NÚMEROS
◦ MEDIDAS DE TENDENCIA CENTRAL
◦ MEDIDAS DE DISPERSIÓN
◦ MEDIDAS DE FIABILIDAD
◦ MEDIDAS DE LA FORMA DE DISTRIBUCIÓN
GRÁFICOS
◦ HISTOGRAMA
◦ DIAGRAMA DE BARRAS
◦ DIAGRAMA DE SECTORES
2016
© A J G a rc ía R u iz
Tablas de frecuencias
• Tablas de frecuencias
• Gráficos de barras
• Gráficos de sectores
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
5
ESTADISTICA DESCRIPTIVA
Estado civil
viudo
Soltero
Separado
Casado
2016
© A J G a rc ía R u iz
PERCENTILES Y CUARTILES
ESTADISTICA DESCRIPTIVA
Son los estadísticos que se utilizan para describir la Son los valores de una variable
localización de la distribución de una variable en una
muestra.
cuantitativa que dividen los datos
Intentan reducir a un solo número todos los valores de ordenados en grupos, de forma que un
un estudio. porcentaje de los casos se encuentre
por encima y otro porcentaje se
Moda
encuentre por debajo.
Mediana
Percentiles Los cuartiles (los percentiles 25, 50 y 75)
Cuartiles dividen las observaciones en cuatro
Media grupos de igual tamaño.
MEDIA
Media aritmética: Es la suma total del valor
que toma la variable objeto de estudio dividida
por el número de casos.
Media recortada al 5%: Media aritmética
calculada después de haber eliminado el 5%
de los casos mayores y el 5% de los menores.
La eliminación de los casos extremos de los
cálculos da como resultado una mejor
estimación de la tendencia central,
especialmente cuando los datos no son
normales.
2016
© A J G a rc ía R u iz
6
ESTADISTICA DESCRIPTIVA
ESTADISTICA DESCRIPTIVA
Son medidas que acompañan a las de
tendencia central, para dar una idea de
si los datos están muy agrupados o muy
dispersos.
Rango o recorrido
Varianza
Desviación Típica o Estándar
MEDIDAS DE DISPERSIÓN
MEDIDAS DE DISPERSIÓN
7
CONCLUSIÓN
ESTADISTICA DESCRIPTIVA
La varianza tiene el inconveniente de que no viene
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE VARIACIÓN DE
PEARSON
MEDIDAS DE FIABILIDAD
8
MEDIDAS DE LA FORMA DE
DISTRIBUCIÓN
Media Media Media
Moda Moda Moda
Mediana Mediana Mediana
© A J G a rc ía R u iz
Coeficiente de Curtosis:
Medida del grado en que las observaciones están
CONCLUSIONES
agrupadas en torno al punto central.
MEDIDAS DE LA FORMA DE
MEDIDAS DE LA FORMA DE
DISTRIBUCIÓN
ESTADISTICA DESCRIPTIVA
Medidas de asociación
Covarianza
Coef. Correlación de Pearson
Coef. Correlación de Spearman
9
Coeficiente de correlación de Spearman:
MEDIDAS DE ASOCIACIÓN Medida de asociación lineal entre dos variables
MEDIDAS DE ASOCIACIÓN
MEDIDAS DE ASOCIACIÓN
ordinales. Cuanto mayor sea el coeficiente mayor
concordancia habrá en la ordenación en los dos
• Coeficiente de correlación de Pearson: individuos. Para todos los casos, se ordenan los valores
• Medida de asociación lineal entre dos variables en cada variable de menor a mayor y se calcula el
cuantitativas. coeficiente de correlación de Pearson sobre los rangos
asignados.
• Los valores del coeficiente de correlación varían entre
El coeficiente ρ (rho), es una prueba no paramétrica que
-1 y 1. El signo del coeficiente indica la dirección de la
mide la asociación entre dos variables discretas. Para
relación y el valor absoluto indica la intensidad. Los
calcular ρ, los datos son ordenados y reemplazados por
valores absolutos mayores indican que las relaciones
su respectivo orden.
son más fuertes.
• Dos variables pueden estar perfectamente
relacionadas, pero si la relación no es lineal, el
coeficiente de correlación de Pearson no será un
estadístico adecuado para medir su asociación.
MEDIDAS DE ASOCIACIÓN
MEDIDAS DE ASOCIACIÓN
Analizar Correlaciones Bivariadas
2016
© A J G a rc ía R u iz
10
COVARIANZA
MEDIDAS DE ASOCIACIÓN
2016
© A J G a rc ía R u iz
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
2016
5 8 21,63
© A J G a rc ía R u iz © A J G a rc ía R u iz
11
CÁTEDRA DE ECONOMÍA DE LA SALUD Y USO RACIONAL DEL MEDICAMENTO
Departamento de Farmacología. Facultad de Medicina
Gráfico de
UNIVERSIDAD DE MÁLAGA cajas y bigotes
Histograma
puntuaciones
50% de las
puntuaciones
95% de las
10
mediana
8 Q1
Frecuencia
4
Límite inferior: por
debajo de este
2 límite las
Mean=26,9205 puntuaciones se
Std. Dev.=3,56695
N=100 consideran atípicas
0
(outliers)
20,00 25,00 30,00 35,00
2016
IMC
© A J G a rc ía R u iz
- descriptivos
• Medidas de resumen
• Representación gráfica
- inferencial
• Estimación de parámetros
• Contraste de hipótesis
© AJ García Ruiz
2016
© A J G a rc ía R u iz
Error Estándar
Variable cualitativa Variable cuantitativa
pxq DE
EE = EE =
n n
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
12
l Para determinar si dos variables están l Estas pruebas se basan en establecer una
relacionadas (asociadas) o si existen diferencias “hipótesis nula” (Ho), según la cual “no existen
en cierta variable entre dos grupos de sujetos se diferencias” entre los grupos comparados, o “no
emplean las pruebas de contraste de hipótesis. existe relación” entre las variables analizadas
l Ejemplos: (son variables independientes).
l ¿hay diferencias de peso significativas en la población
española según el nivel cultural?; l Mediante la prueba de significación adecuada
l ¿está relacionada la presencia de depresión con el estado se intenta aceptar / rechazar esta hipótesis.
civil?
l ¿es diferente la prevalencia de hipercolesterolemia entre l Si se consigue rechazar, se acepta
hombres y mujeres? consecuentemente una “hipótesis alternativa”
l ¿la antigüedad en la empresa esta asociada a una mayor
(Ha), de que “si existen diferencias o
prevalencia del síndrome de desgaste profesional –burn
out–, etc). asociación”.
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
“p<”
Probabilidad de que los resultados obtenidos puedan
CRITERIOS DE ELECCIÓN
ser debidos al azar, en el caso de que la ¿distribución normal o no normal?
hipótesis nula sea cierta
Tipo de datos:
¿cualitativos o cuantitativos?
“Nivel de significación alfa: ¿independientes o apareados?
Nivel de probabilidad por debajo del cual se considera
que se dispone de evidencia suficiente en contra de la Número de grupos a comparar:
hipótesis nula como para rechazarla ¿dos o más?
Por convenio el nivel de significación alfa = 0,05
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
Test paramétricos
Comparación de medias
• Prueba de T:
• de una muestra
SI • varias muestras Independientes
Análisis de • varias muestras relacionadas
normalidad • ANOVA de 1 factor
NO
Prueba de
Kolmogorov
Pruebas no
Smirnov
paramétricas
Prueba de Chi-cuadrado
Prueba de Friedman
Prueba de Kruskal-Wallis
Prueba de Mann-Whitney
Coef. de correlación de Spearman
Prueba de los signos de Wilcoxon
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
13
...¿Es una variable cuantitativa normal? ...¿Es una variable cuantitativa normal?
Smirnov
hipótesis nula es que la distribución
de datos explorados no se diferencia
de una distribución teórica de datos
normales. Si no se puede rechazar
dicha hipótesis (si la significación
del test es p > 0,05), se asume que
los datos explorados son
normales.
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
5
n Para muestras relacionadas
4
2
n Para una muestra.
Frecuencia
0
1,50 1,56 1,63 1,69 1,75 1,81 1,88 1,94 2,00
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
¿existen diferencias en el
Perfil de Salud de Nottingham o en el IMC
según el sexo de los individuos?.
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
14
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz 1. Kristofferzon and Ternesten-Hasséus Health and Quality of Life Outcomes 2013, 11:182. Disponible en:
http://www.hqlo.com/content/11/1/182
2016
© A J G a rc ía R u iz 1. Kristofferzon and Ternesten-Hasséus Health and Quality of Life Outcomes 2013, 11:182. Disponible en: © A J G a rc ía R u iz
http://www.hqlo.com/content/11/1/182
15
l El análisis de varianza se utiliza para contrastar la hipótesis Es un test que mide la igualdad de varianzas de
de que varias medias son iguales, mediante la comparación variables dependientes para grupos definidos por
de la varianza muestral estimada a partir de las medias de los variables categóricas.
grupos respecto a la estimada dentro de dichos grupos. Esta
técnica es una extensión de la prueba t para dos muestras. Un valor de p<0,05, indica que la varianza de los datos
difiere significativamente entre los grupos.
l Además de determinar que existen diferencias entre las
medias, es posible que desee saber qué medias difieren.
Existen dos tipos de contrastes para comparar medias: a priori
y post hoc. Los contrastes a priori se plantean antes de ejecutar Prueba de homogeneidad de varianzas
el experimento y los contrastes post hoc se realizan después
Estadístico
de haber llevado a cabo el experimento.
de Levene gl1 gl2 Sig.
l Los grupos deben proceder de poblaciones con varianzas sueño 2,260 1 98 ,136
iguales. Para contrastar este supuesto, se utiliza la prueba de aislamiento 11,239 1 98 ,001
Levene de homogeneidad de varianzas. movilidad 1,524 1 98 ,220
2016
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
Descriptivos
Estadístico
de Levene gl1 gl2 Sig.
IMC ,833 1 98 ,364
nhp 3,745 1 98 ,056
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
IMC Inter-grupos 1,343 1 1,343 ,105 ,747
Intra-grupos 1258,250 98 12,839
Total 1259,593 99
nhp Inter-grupos 87,913 1 87,913 10,270 ,002
Intra-grupos 838,897 98 8,560
2016
2016
Total 926,810 99
© A J G a rc ía R u iz © A J G a rc ía R u iz
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
16
n Se ha detectado en nuestro estudio que puede haber
diferencias respecto a la frecuencia de hipertensos y
artrosis/artritis según sexo de los participantes.
2016
© A J G a rc ía R u iz © A J G a rc ía R u iz
TIPOS DE VARIABLES
Variable tipo
Dicotómica aquella variable que sólo puede tomar dos posibles valores
Nominal aquella variable que puede tomar varios valores
aquella variable que puede tomar varios valores y en los que
Ordinal
se puede establecer un orden entre las categorías
aquella variable que puede tomar un rango numérico de
Cuantitativa
valores
aquella variable cuantitativa que puede tener información
Censurada parcial o no completa (tiempo hasta que ocurre algo en
Análisis de Supervivencia)
2016
© A J G a rc ía R u iz
CÁTEDRA DE ECONOMÍA DE LA SALUD Y USO RACIONAL DEL MEDICAMENTO suposiciones que subyacen en la
Departamento de Farmacología. Facultad de Medicina P RUEBAS PARAMÉTRICAS utilización de las pruebas
UNIVERSIDAD DE MÁLAGA paramétricas
Su cálculo implica una
estimación de los
TIPOS DE MUESTRA parámetros de la población El nivel de medición Los datos de la Las varianzas de las
con basa en muestras al menos debe ser muestra se 2 muestras no son
estadísticas intervalo obtienen de una significativamente
población diferentes:
Tipo de muestra Características Ejemplo VENTAJAS
normalmente homocedasticidad
distribuida: media,
son las que se obtienen de 2 1. Mas poder de mediana, moda
comprobar si los valores eficiencia
grupos de sujetos distintos, es iguales.
Muestras decir, que a cada muestra le de creatinina difieren 2. Más sensibles a los
independientes entre un grupo estudio y rasgos de los datos
vamos a aplicar una situación recolectados
uno control.
experimental distinta 3. Menos posibilidad de
errores Prueba de t Prueba de
se obtienen a partir del mismo comprobar si las cifras de 4. Mas robustas de Student Anova
Muestras grupo en distintas situaciones, o creatinina difieren en un
dependientes o sea, que a cada individuo se le mismo grupo en una
DESVENTAJAS
apareadas aplicarán los distintos hechos medición inicial y a los 3 1. Mas complicadas de
experimentales. meses. calcular
2. Limitaciones en los 1 2 muestras + de 2 muestras
tipos de datos que se muestra independientes independientes
pueden evaluar o relacionadas
17
Pruebas paramétricas y su
alternativa no paramétrica
18