Вы находитесь на странице: 1из 41

EL PLAN DE ANALISIS

Patricio Surez Gil


Julio Alonso Lorenzo
La Fresneda, Asturias 2011
Programa MFyC
Qu es investigar?

En esencia es

RESPONDER PREGUNTAS
FASES DE UN PROYECTO
Formular una PREGUNTA
Antecedente y Justificacin
Marco Terico
Diseo del estudio
Poblacin de estudio
Variables o Mediciones
Recogida de Informacin
Plan de Anlisis
Plan de Trabajo, organizacin, recursos y
cronograma
Proyecto/Protocolo Artculo Original

Pregunta
INTRODUCCION
Antecedentes
Marco Terico
MATERIAL Y
METODOS
Diseo
Poblacin
Variables RESULTADOS
Recogida
DISCUSION
Plan Anlisis
Plan de anlisis

Tcnicas que ayudan a responder las


preguntas formuladas.
Ha de definirse antes de recoger los
datos.
En investigacin cuantitativa (datos
numricos) las tcnicas sern
esencialmente estadsticas
Plan de Anlisis: Condicionantes

Preguntas

Tipo de Variables
Diseo del estudio

Tipo de muestreo

Software disponible y dominable

Estudios previos
Plan de Anlisis. Enfoque Bsico

Descriptivo (vs. Contemplativo)


Inferencial:
A poblacin muestreada
Otros marcos inferenciales
Problema de estimacin/contraste de hiptesis.
Pasos

Matriz de datos (n x k)
Depuracin (tcnicas)

Transformacin de variables

Anlisis univariante

Anlisis bivariante

Anlisis multivariante
Qu es una matriz de datos?
Ordenacin de la informacin en una
disposicin de filas y columnas, donde

Filas: Individuos/unidades de observacin (n)

Columnas: Datos o variables (k, kt)


Depuracin

Listarvariables
Descripcin univariante

Valores aberrantes, fuera de recorrido,


fechas, duplicados,
Qu hacer?
Ir al registro original
Reemplazar
Eliminar
Transformacin de variables

Cuantitativas Categricas
Reduccin de categoras

Variables dummy

Estabilizacin de la varianza y
normalizacin: logaritmos, potencias,
inversos, etc.
Anlisis Univariante (i)

V. Cualitativas/categricas
Distribucin de frecuencias
Grficos (barras, sectores, etc.)
V. Cuantitativas
Medidas de tendencia central y dispersin
Histogramas
Grficos
Anlisis Univariante (ii)

Intervalo de Confianza (media, proporcin,)

Cmo se interpreta?

Cmo se calcula?

Cmo se presenta?
P=34%
p=33%
30% 36%

35% p=38% 41%


No aciertan
Algunos disparates:
a.Que 3% no podemos estar seguros que sean fumadores
b.que el 95% de asturianos estn entre el 30% y el 36% como
fumadores habituales
c.que tenemos una probabilidad del 95% de encontrar al 34% de los
fumadores
d.Entre 30-36% de una muestra de asturianos adultos son fumadores
habituales con una probabilidad del 95%
e.Hay un 95% probabilidades de que el % de fumadores habituales
de nuestra muestra est entre el 30 y el 36%
f.Hay un 95% de posibilidades de que los fumadores habituales se
encuentren entre el 30 y el 36%, de nuestra muestra
g.Que la proporcin de fumadores estimada en este estudio es del
33% y que el 95% de los valores se encuentran entre 30 y 36%
h.Que con el 95% de confianza incluye al 33%
Anlisis bivariante (i):
Asociacin o independencia?
2 V. Cuantitativas:
Regresin y Correlacin
1 Cuanti/1 Categrica (k=2):

Comparacin de medias
(t Student o U de McWitney)
1 Cuanti/1 Categrica (k>2): Anova

2 Categricas: z, Ji-cuadrado,

McNemar, etc.
Anlisis bivariante (ii)

Qu es un valor P?
INFERENCIA ESTADSTICA

Fisher (dcada de los 20) Ho: d=0

Se observa d0

Medida de la discrepancia de los datos con la hiptesis,



llamada a tener un papel informal (no especificado), junto
con el resto de la informacin, en el flujo inferencial
INFERENCIA ESTADSTICA

Neyman y Pearson Ho: d=0


(dcada de los 30) H1: d0

Se observa se computa

Y se adopta una decisin

Si se rechaza Ho: d=0

Si no se rechaza Ho: d=0


Crtica principal para los valores p

d grande
n pequea

d pequea
n grande
Con mucha frecuencia se sabe de antemano que las
hiptesis de nulidad son falsas incluso antes de recoger los
datos; en ese caso el rechazo o la aceptacin, simplemente
es un reflejo del tamao de la muestra y no hace, por tanto,
contribucin alguna a la ciencia. Savage (1957)
Rothman (1998)
Resulta preferible omitir los valores
p de los informes sobre estudios
epidemiolgicos puesto que pueden
emplearse las estimaciones
puntuales y los intervalos de
confianza (adems de otras
alternativas)
Anlisis bivariante (ii)
Comit Internacional de Directores de
Revistas Mdicas
(Grupo de Vancouver)

Se evitar la dependencia de las pruebas


estadsticas de verificacin de hiptesis,
tal como el uso de los valores P, que no
aportan ninguna informacin importante.
Anlisis bivariante (iii)

1047 artculos de Atencin Primaria(1992-2000)

812 usan el valor p (78%)

155 usan Int de Conf (15%)

182 usan trminos como muestra significativa,


las probabilidades de enfermar (17%)

79 concluyen que hallamos significacin (8%)


Intervalos de confianza
como alternativa
Rev Thomas Bayes
1701-1761

In recognition of Thomas Bayess important work in probability.


The vault was restored in 1969 with contribution received from
statiticians throughout the world.
Anlisis Multivariante (i)

Diversastcnicas capaces de controlar


la confusin y de detectar interacciones.

Variable respuesta (dependiente)


Variables exposicin (independientes)

Variables de control
Anlisis Multivariante (ii)

Regresin lineal mltiple (Y= B0+B1X1+)


(Regresin no lineal multiple)

Regresin logstica

Regresin de Poisson

Modelos lineales generalizados

Regresin de Cox
Para qu NO sirve el anlisis de
los datos
No controla los Sesgos de seleccin:
Autoseleccin
Berkson
Prdidas en el seguimiento
Supervivencia relativa
Para qu NO sirve el anlisis de
los datos

No controla los sesgos de informacin:


Memoria
Diagnstico
Veracidad
Tipo de cuestionario
Distinta cumplimentacin segn edad
Para qu SI sirve el anlisis de
los datos

Control de Confusin.
Deteccin de Interaccin
X est asociado con Y

Explicacin Tipo Fuente Realidad Modelo Causal

A No hay
Error
Azar Espuria relacin NINGUNO
Aleatorio
causal
B No hay
Error
Sesgo Espuria relacin NINGUNO
Sistemtico
causal
C La causa es
Efecto- Medicin
Verdadera realmente YX
causa Inversa
efecto
D Otros
Efecto- Factores factores Z X
Verdadera
efecto Confusores explican la Z Y
asociacin
E Causa- Relacin
Verdadera XY XY
efecto Causal
SOFTWARE (1)

Grandes paquetes estadsticos:


SAS
SPSS
BMDP
MINITAB
STATA
R
SOFTWARE (2)

Libre distribucin:
Epiinfo (www.cdc.gov)
Epidat 3.1 (en breve, versin 4.0)
R (www.r-project.org)
Plan de implementacin
Plan de implementacin
Cronograma
Cuantificacin de recursos y costes
Recursos fsicos
Costes
Personal
Capacitacin
Supervisin y coordinacin interna
Reuniones de coordinacin, controles de calidad
Presupuesto
Cronograma

Enunciar y listar las tareas


Ordenar lgicamente
Marcar para cada una las forzosamente
precedentes
Tiempo previsto de cada una de
ellas (mximo y mnimo)
Diagramas de Gantt o PERT
Revisar peridicamente
Cronograma
Tareas

1) Plan de anlisis: Al menos el


estadstico/os para la pregunta

2) Limitaciones del estudio para


responder a la pregunta.

3) Cronograma