Вы находитесь на странице: 1из 39

Apuntes sobre investigación

cuantitativa

Pedro J. Rodríguez Esquerdo


Departamento de Matemáticas
pjrodriguez@uprrp.edu
www.edustatspr.com
Investigación
 Sus resultados sirven para
 Aprender
 Descubrir
 Describir
 Explicar comportamiento
 Predecir resultados
 Modelar procesos
 posiblemente Cambiar
 la “realidad”.
(1)
¿Cómo se investiga?
 Un problema o idea
 encuentra o concibe
 plantea concretamente
 elabora el marco teórico (literatura)
 define el tipo de investigación y alcance
 establece hipótesis, variables, población
 diseño de la investigación (experimental, observacional)
 selecciona muestra
 obtiene datos
 analiza
 informa
Problema
Características
 Medición
 Estadísticas
 Experimentación, causa y efecto
 Analiza “realidad objetiva”
 Generaliza resultados
 Se puede repetir (en muchas ocasiones)
 Se establece precisión y confiabilidad
Idea o problema
 Posibles fuentes
 Literatura
 Cursos
 Material audiovisual
 Foros
 Preferiblemente experiencia personal,
intereses individuales, pensamiento
creativo …
Plantea el problema
 En forma concreta, sin ambigüedad,
como pregunta susceptible de prueba
empírica
 ¿qué pasa si …?
 ¿por qué ocurre …?
 ¿como ocurre …?
Plantea el problema
 Objetivos específicos
 Preguntas dirigidas a los objetivos
 Justificación de la investigación (¿por qué es
importante?)
 Viabilidad
 Deficiencias en el conocimiento actual
 Consecuencias de los resultados
 Ejemplos del texto (pp. 59-60)
Marco teórico
 Revisar, detectar, obtener, consultar,
extraer y recopilar información de la
literatura
 Formular el marco (1)

 Proceso de inmersión en el conocimiento


actual;
 Producto es parte del informe de
investigación.
Alcance de la investigación
 Exploratorio (nuevas enfermedades)
 Tema es poco conocido, identifica variables,
sugiere áreas de investigación.
 Descriptivo (censo)
 Especifica propiedades, características y perfiles
del objeto de estudio.
 Correlacional (violencia en tv y crimen)
 Estudia relación cuantitativa entre variables.
 Explicativo (método A v. método B)
 Desea establecer relación de causa y efecto
Formula hipótesis
 Exploratorio: no se formulan.
 Descriptivo: cuando se desea predecir.
 Ejemplos (hipótesis de investigación)
 La incidencia de cáncer del pulmón es mayor
entre fumadores que entre no fumadores.
 El aumento en el precio de la gasolina provoca
un aumento en el uso de la transportación
pública.
 Si A ocurre, entonces B ocurre.
Hipótesis estadísticas
 Hipótesis nula: negación de la hipótesis de
investigación.
 Hipótesis alternativa: lo que se desea demostrar.
 Proceso:
 Se parte de la hipótesis nula como premisa que se toma por
cierta.
 Se obtiene evidencia:
 contraria a la hipótesis nula  se rechaza esa hipótesis y
concluye es probable (valor p) que la alternativa sea correcta.
 a favor de la hipótesis nula  no se rechaza esa hipótesis (no
se concluye que la nula se ha demostrado, solo que no hay
evidencia suficiente para rechazarla).
Evalúa la evidencia
 Evidencia contraria a la hipótesis nula
 Si la nula fuera cierto sería poco probable haber obtenido
los resultados observados.
 Mientras más pequeña es esa probabilidad (valor p), más
fuerte es la evidencia en contra.
 Evidencia a favor de la nula
 Se obtiene un resultado comúnmente observado
cuando la nula es cierta. (valor p grande)
 Significancia de la prueba
 P(Error tipo I ), probabilidad máxima aceptable de
rechazar H0 cuando es cierta.
Ejemplo
 Se quiere demostrar que el método de
enseñanza A logra un aumento
promedio mayor que el método B en
una prueba.
 H0 : µA = µB contra H0 : µA > µB
 Análisis estadístico resulta en
 p value = .03
 p value = .42
Formulación de hipótesis
 Define hipótesis
 Establece población
 Parámetros a estimar
 Aseveraciones sobre los parámetros a
probar
 Establece variables a medir y formas de
medirlas
Diseño de investigación
 Observacional
 No demuestra causa y efecto
 Experimental
 Demuestra causa y efecto
 Requiere
 Comparación
 Selección y/o asignación aleatoria de sujetos
 Replicación
 Ciego (cuando apropiado)
Experimento
 Compara dos o más poblaciones
 Control y factores
 Variables
 Controladas
 Manipuladas (independiente)
 Respuesta (dependiente)
Ejemplo:
¿Es efectivo un fertilizante?
 Problema: una compañía quiere demostrar
que un nuevo fertilizante es más efectivo que
el cultivo sin fertilizante alguno.
 La efectividad del fertilizante se debe medir
en términos de la altura que alcanza la
planta.
 Condiciones:
 Se cuenta con 20 plantas, tiestos, tierra,

agua y fertilizante.
 El trabajo se debe completar en 30 días.
Hipótesis
 Hipótesis nula: El crecimiento promedio mx
de las plantas que reciben el fertilizante es
(menor o) igual al de las plantas que no lo
reciben, my.
 H0: mx = my

 Hipótesis alternativa: El crecimiento


promedio mx de las plantas que reciben el
fertilizante es mayor al de las plantas que no
lo reciben, my.
 Ha: mx > my.
Hipótesis
 Población
 Muestra
 Variables
 Manipuladas
 Controladas
 Respuestas
 ¿Cómo se miden?
 ¿Con qué frecuencia? ¿por qué?
Procedimiento
 10 plantas se asignan aleatoriamente al
grupo control, que no recibirá fertilizante y
las otras 10 al grupo que sí lo recibirá.
 ¿por qué 10 en cada grupo?
 Se mide la altura de cada una de las 20
plantas.
 A cada una de las planta del grupo
experimental se le añade fertilizante según
recomendado.
… procedimiento

 Se mantiene igual condiciones de luz,


aire, agua y de otras variables.
 Al final de los 30 días
 Se mide la altura de cada planta.
 Se calcula el crecimiento obtenido por cada
una.
 Se calcula la media del crecimiento
obtenido por las plantas dentro de cada
grupo.
Datos obtenidos
Grupo Control Grupo fertilizante
Planta Antes Despues Diferencia Planta Antes Despues Diferencia
2 4.0 6.2 2.2 1 4.2 8.1 3.9

4 5.5 7.5 2.0 3 5.6 7.5 1.9

7 5.2 7.7 2.5 5 5.3 8.7 3.4

8 4.9 7.3 2.4 6 5.8 8.8 3.0

11 5.0 7.3 2.3 9 5.3 7.9 2.6

12 5.4 8.1 2.7 10 5.1 8.1 3.0

13 5.1 7.2 2.1 14 5.0 8.2 3.2

16 5.2 7.3 2.1 15 5.0 8.1 3.1

18 4.6 6.7 2.1 17 4.9 9.7 4.8

20 4.8 6.8 2.0 19 5.2 8.8 3.6


Resumen de los datos

 Gráficas apropiadas y cómputo de


estadísticas
 Comparación de medias
 Conclusión: Rechazar o no H0 (valor p)
 Incertidumbre asociada a la conclusión
 Implicaciones del uso del fertilizante
para la población de plantas (inferencia)
Resultados ¿conclusión?
t-Test: Two-Sample Assuming Equal Variances
Fertilizante Control
Mean 3.25 2.24
Variance 0.596 0.054
Observations 10 10
Pooled Variance 0.325
Hypothesized Mean Difference 0
df 18
t Stat 3.9619
P(T<=t) one-tail 0.0005
t Critical one-tail 1.7341
P(T<=t) two-tail 0.0009
t Critical two-tail 2.1009
Hipótesis y errores

 ¿Qué ocurre si se rechaza H0, pero es cierta?


 ¿si no se rechaza, pero es falsa?
Decisión tomada
Rechazar H 0 No rechazar H 0
Estado de la
naturaleza

H0 Error Tipo I OK
cierta
H0 OK Error Tipo II
falsa
Diseño experimental
 Completamente aleatorio
 Completamente aleatorio en bloques
 Factorial
 Cuadrados latinos
 …
 ¿cuál es el más apropiado?
Estudio observacional
 Tipos
 Encuestas (censo, por muestreo)
 Transversales
 Longitudinal
 Longitudinal de cohortes
 Estudio de casos
 Datos disponibles
 Condiciones
 Presupuesto disponible
 Margen de error deseado
 Confiabilidad deseada
 ¡¡Construcción de instrumento de medición!!
Ejemplo (Descripción con datos disponibles)
El Nuevo Día, 18 de agosto de 2003
No chocan más los adolescentes
 “¿SON LA mayoría de los accidentes automovilísticos que ocurren
en el país ocasionados por adolescentes con poca experiencia en el
volante? [] La contestación a [esta] pregunta[s] es no.

 La edad de los conductores en la mayoría de los 290,000 accidentes


que ocurrieron el año pasado en las vías públicas fluctúa entre los
25 a 44 años, según el informe de accidentes de tránsito de la
Oficina de Análisis de Accidentes del Departamento de
Transportación y Obras Públicas.

 Los conductores entre esas edades estuvieron involucrados en un


43% de esos accidentes, seguidos por adolescentes y jóvenes
adultos entre las edades de 16 a 24 años. Estos últimos se vieron
implicados en 65,002 colisiones, un 22.4% del total. “
Selección de la muestra
 Define población
 Obtén un marco
 Tipo de muestra aleatoria (deseamos sea
representativa)
 Simple
 Estratificada
 Sistemática
 Conglomerado
 Mezclas
Tamaño de la muestra

 Depende de
 Presupuesto disponible
 Margen de error deseado
 Confiabilidad deseada
 Variabilidad de la población
 Condiciones por el tipo de muestreo
Cómo se realizó la encuesta
 El Nuevo Día 5 de febrero de 2001

 LA MAS reciente encuesta de El Nuevo Día incluyó entrevistas


realizadas en persona a una muestra representativa de 1,000 adultos de
18 años o más en toda la isla (excepto en Vieques y Culebra), un adulto
por hogar, más 300 entrevistas adicionales con una muestra
representativa de adultos en la isla de Vieques.
 De acuerdo con los datos disponibles del Negociado del Censo, los
resultados de la encuesta se han medido en proporción correcta para
ajustarse a variaciones relacionadas con el sexo y la edad. En teoría,
en 19 de cada 20 casos, los resultados de este tipo de encuesta podrían
variar por un error de muestreo no mayor de ± 3% de lo que se hubiese
obtenido al entrevistar a toda la población de Puerto Rico. Este margen
de error podría ser mayor para descripciones de subgrupos más
pequeños dentro de la muestra de la encuesta, así como para la
población de Vieques.
 Las entrevistas de campo a los residentes de la isla de Puerto Rico se
llevaron a cabo entre el 12 y el 22 de enero de 2001, mientras que a los
residentes de Vieques se les entrevistó del 19 al 23 de enero.
Estadística descriptiva
 Gráficas
 Tallo y hojas
 Histograma
 Barra
 Dispersión
 Medidas
 Promedios: media, mediana, moda, valor medio
 Variación: amplitud, varianza, desviación estándar
 Valor z (valor estandarizado)
Análisis
 Premisas
 Pruebas de hipótesis
 Z, t , una y dos poblaciones, bondad de ajuste,
independencia.
 Análisis de regresión, correlación
 Análisis de varianza (factorial, una vía)
 Análisis de series cronológicas
 Paramétricas y no paramétricas
 Muchas otras…
Teorema del límite central

 Bajo condiciones que generalmente se


cumplen,
 a medida que el tamaño de la muestra
aumenta,
 la distribución de la media muestral
 se hace más acampanada y simétrica y
es unimodal.
Distribución normal estándar
f(z)

-4 -3 -2 -1 0 1 2 3 4
z
¿Para qué sirve?

 ¿Por qué se estandariza?


 ¿Hay distribuciones normales no
estándar?
¡¡¡Recomendación enérgica!!!

Asesórate
antes de
comenzar.
Referencias
 Metodología de la investigación, Hernández, Sampieri
Roberto, Carlos Fernández Collado, Pilar Baptista
Lucio, McGraw Hill, 2006.
 Bioestadística: Métodos y aplicaciones
http://www.bioestadistica.uma.es/libro/ (Universidad
de Málaga)
 What is a Survey? http://www.whatisasurvey.info/
(Fritz Scheuren)

Вам также может понравиться