Вы находитесь на странице: 1из 86

Captulo 5 Diseo de

Investigacin y
Estadsticas
Inferenciales
PO CHUN LEE, PHD
Brevemente
Valores de muestra y muestras de
distribuciones
Diseo de Investigacin Estadstica
Distribucion de las muestras y el teorema del
lmite central.
El error standard
Transformacin de la media muestral a
distribucin muestral.
Introduccin
Hasta ahora, hemos discutido y utilizado ejemplos de conjuntos de
puntuaciones en bruto para examinar las estadsticas descriptivas.
Aprendimos a transformar los valores de puntuacin bruta en valores
estandarizados y usar la Tabla de Valores Z para entender la distribucin de
las proporciones alrededor de las puntuaciones dadas.
Ahora, volvemos nuestra atencin a un nivel diferente de investigacin. Este
es un punto de referencia importante en las estadsticas, ya que requiere un
cambio de pensamiento de trabajar con las puntuaciones individuales en
bruto a trabajar con muestras de puntajes brutos y su relacin con las
poblaciones de donde se tom la muestra.
En el mundo real de la investigacin y las estadsticas, los profesionales casi
siempre se ocupan de los valores de la muestra, ya que muy rara vez tienen
acceso a la informacin de la poblacin.
El propsito primordial de la investigacin es poder hacer observaciones
sobre realidades ms grandes.
Introduccin
Podemos "generalizar" los resultados descubiertos de las
muestras a poblaciones similares?
Por ejemplo, podramos querer entender las puntuaciones de
AP de los estudiantes en comparacin con la puntaciones a
nivel provincial.
Comprendriendo la distribucin de la muestra nos puede
decir algo sobre los puntajes AP de todos los estudiantes?
Las estadsticas inferenciales son mtodos que ayudan a
tomar decisiones sobre cmo los datos del mundo real
indican si es probable que la dinmica en el nivel de la
muestra est relacionada con la dinmica a nivel de la
poblacin. Es decir, necesitamos comenzar a pensar en la
distribucin completa de la muestra como una posible
muestra de la poblacin total de las calificaciones.
Muestra vs. Poblacin
Si derivamos una muestra que es imparcial, los valores de la muestra
(media y DE, por ejemplo) deben ser similares a los valores de la
poblacin. Sin embargo, si intencionalmente hacemos un cambio
para ver qu suceder con nuestra muestra, podramos observar que
los valores de nuestra muestra difieren de los valores de la poblacin.
O, para tomar otro ejemplo, podramos observar que otro maestro ha
estado usando un mtodo "tradicional" de ensear AP, mientras yo he
usado mi nuevo mtodo, y quiero ver cul es ms efectivo. En
cualquier caso, lo que estamos haciendo es:
1. Asumiendo desde el principio que nuestra muestra refleja los valores
de la poblacin
2. Cambiar nuestra muestra de alguna manera o observar
condiciones diferentes entre nuestra muestra y otra muestra similar
3. Ver si nuestra muestra cambiada es ahora diferente de antes o
diferente de la otra muestra
Muestra vs. Poblacin
En todos estos casos, estamos comparando una
muestra con una poblacin, no examinando las
puntuaciones individuales dentro de una
muestra.
Ya no pensamos en nuestros valores de muestra
individualmente sino como un conjunto que se
podra derivar de una poblacin junto con
muchos ms tales conjuntos.
Esa es la diferencia entre estadstica deductiva y
descriptiva.
Muestra vs. Poblacin
La pregunta para estadsticas descriptivas:
Estn nuestros valores de muestra normalmente
distribuidos?
La pregunta para estadsticas inferenciales:
Es probable que los valores muestrales reflejen los
valores poblacionales conocidos (o desconocidos)?
A continuacin
En los captulos anteriores describimos datos para
ver patrones ocultos que podran ayudar a
nuestra comprensin. Los siguientes captulos de
van ms all en dos maneras:
(1) Se discute el diseo de la investigacin, que es
el intento de crear una estructura para clasificar y
comparar los patrones de datos, y
(2) se introduce la estadstica inferencial como la
manera de entender cmo los datos accesibles
pueden ayudar a explicar las relaciones
desconocidas y las realidades sociales.
DISEO DE LA INVESTIGACIN
Antes de examinar en profundidad las estadsticas
inferenciales, necesitamos cubrir algunos aspectos
esenciales del diseo de la investigacin. Las
estadsticas y el diseo de la investigacin son temas
complementarios que deben ser entendidos juntos. A
veces, las dos materias se ensean juntas en un solo
curso (o cursos), pero ms a menudo se ensean
como requisitos previos.
Como no hay manera de secuenciar las ideas, lo que
vamos a hacer es introducir un esquema para disear
la investigacin.
DISEO DE LA INVESTIGACIN
Antes de examinar en profundidad las estadsticas
inferenciales, necesitamos cubrir algunos aspectos
esenciales del diseo de la investigacin. Las
estadsticas y el diseo de la investigacin son temas
complementarios que deben ser entendidos juntos. A
veces, las dos materias se ensean juntas en un solo
curso (o cursos), pero ms a menudo se ensean
como requisitos previos.
Como no hay manera de secuenciar las ideas, lo que
vamos a hacer es introducir un esquema para disear
la investigacin.
DISEO DE LA INVESTIGACIN
Antes de examinar en profundidad las estadsticas
inferenciales, necesitamos cubrir algunos aspectos
esenciales del diseo de la investigacin. Las
estadsticas y el diseo de la investigacin son temas
complementarios que deben ser entendidos juntos. A
veces, las dos materias se ensean juntas en un solo
curso (o cursos), pero ms a menudo se ensean
como requisitos previos.
Como no hay manera de secuenciar las ideas, lo que
vamos a hacer es introducir un esquema para disear
la investigacin.
Teora
La teora es una idea abstracta en la que
exponemos la naturaleza conceptual de la
relacin entre nuestras ideas de investigacin.
Por ejemplo, planteemos una preocupacin
social o de salud como una pregunta terica:
La riqueza produce mejor salud?
Hiptesis
Puesto que una teora no puede ser evaluada directamente,
debemos encontrar una manera de reexaminar empricamente la
teora para que pueda ser evaluada. Ese es el papel de la
hiptesis, una afirmacin que capta la naturaleza de la cuestin
terica de tal manera que puede ser verificada directamente.
La hiptesis sigue la afirmacin de la teora, pero est escrita de tal
manera que es "comprobable
Tanto las ciencias fsicas como las ciencias sociales usan los
mtodos que estoy describiendo para generar y verificar el
conocimiento.
El proceso de prueba terica mostrado en la Figura 6.1 es el
corazn de este proceso. Siguiendo el proceso, podemos apoyar o
refutar una posicin terica, pero nunca podemos "probarla"
directamente.
Hiptesis
Haymuchas hiptesis que se pueden generar para probar
cualquier teora ya que el mundo emprico no puede capturar
completamente la esencia del mundo conceptual abstracto.

Respecto a la declaracin terica anterior sobre la riqueza y la


salud: "Los trabajadores con mayores ingresos informan que tienen
mejor salud segn medidas estandarizadas de la salud."
Podis ver diferencia en el lenguaje entre la teora y la hiptesis?
La teora es abstracta; La salud y la riqueza son conceptos
reconocibles, pero tienen tanto significado que no pueden
entenderse aisladamente o en relacin entre s.
La hiptesis crea situaciones que permiten al investigador tomar
varios aspectos de los conceptos y describirlos de manera que
estos aspectos limitados puedan ser medidos y evaluados. Por lo
tanto, la teora es ms "general", mientras que las hiptesis son ms
"especficas".
Hiptesis
La teora no puede ser capturada por una sola
hiptesis. Por ejemplo, podra sugerir otra hiptesis que
trata de la misma pregunta general de investigacin:
"La riqueza combinada de una persona est
negativamente relacionada con el nmero de veces
que visita al mdico ".
Como puede ver, esta es otra reafirmacin de la
teora en un lenguaje que es verificable. En conjunto,
estas dos hiptesis definen la salud como un ndice de
encuesta y el nmero de visitas al mdico. Ambos
reflejan el significado conceptual de la salud, pero
aun juntos no pueden agotar el significado general
de salud.
Tipos de diseos de investigacin
Losdiseos de investigacin son simplemente la estructura
dentro de la cual un investigador lleva a cabo un anlisis
para probar una teora. Puede verse en la figura 6.1 que el
diseo de la investigacin sigue la hiptesis y permite al
investigador situar la hiptesis. Aunque hay muchas
posibilidades diferentes de probar hiptesis, podemos notar
tres:
Experimento
post facto - correlacional
post facto - comparativo
Experimentacin
Hay dos "clases" generales de diseos de investigacin:
experimental y no experimental (tambin conocido como "post
facto").
Los experimentales suceden cuando el investigador cambia
conscientemente los valores de una variable de estudio bajo
condiciones controladas y observa los efectos en una variable.
Los no experimentales o post facto son aquellos que implican medir
las relaciones entre variables utilizando datos que ya han sido
recolectados.
Los dos ejemplos de hiptesis que se mencion anteriormente para
la riqueza y la salud son realmente mejor entendidos a travs de
diseos no experimentales porque no podemos cambiar
fcilmente los valores de una variable para observar su efecto en
la otra.
Experimentacin
Un uso clsico del experimento es el "ensayo controlado aleatorio"
en el que se someten a prueba medicamentos o tratamientos
mdicos para determinar cules podran considerarse ms
eficaces o para determinar si pueden tener resultados diferentes.
En este caso, un grupo de personas se seleccionan al azar y se les
da diferentes medicamentos para determinar si uno es ms eficaz
para eliminar una cierta condicin mdica.
En este ejemplo, los elementos del experimento implican cambiar
los niveles de una variable de estudio (medicamento) para
observar los efectos sobre una variable de resultado (condicin
mdica X) . La seleccin aleatoria de los sujetos de estudio ayuda
a controlar otras influencias que pueden tener diferentes impactos
en los frmacos A y B.
Aleatorizacin
Los experimentadores utilizan mtodos de aleatorizacin
para asegurar la comparabilidad de los grupos
experimentales.
Por aleatorizacin, se refiere a seleccionar sujetos
aleatoriamente de una poblacin ms grande y asignarlos
aleatoriamente a diferentes condiciones.
Si cada sujeto tiene la misma posibilidad de ser elegido
para el experimento y una oportunidad igual de ser
asignado a una condicin de comparacin diferente,
entonces los grupos resultantes deben ser iguales;
Debera haber muy poco sesgo que normalmente influira
en algunos sujetos a escoger para recibir una condicin de
tratamiento sobre otra.
Grupos de Control y Tratamiento

Una forma de limitar las influencias de un factor sobre la variable


de estudio es creando un "grupo de control" que es tpicamente
un grupo similar en todos los sentidos a un "grupo de
tratamiento" (el grupo objetivo para el cambio), excepto para la
variable de investigacin de inters.
En nuestro ejemplo, podramos seleccionar aleatoriamente un
grupo de estudio de nuestra poblacin de estudio y luego
asignar aleatoriamente algunos de ellos para recibir el
medicamento A (grupo de tratamiento: un nuevo medicamento
para la condicin X) y otros de estos para recibir el
medicamento B (grupo de control: el Medicina existente para la
condicin X). Si los dos grupos muestran diferentes efectos en la
condicin X, los investigadores podran sealar A o B como
"causante" de los cambios.
Grupos de Control y Tratamiento
Como se puede imaginar, hay una serie de condiciones
potencialmente "confusas" o formas en que los dos grupos
no pueden ser llamados comparables. Tal vez el
experimentador no puede elegir los sujetos de manera
aleatoria y / o asignarlos al azar a diferentes condiciones de
la droga.
Si es as, entonces hay diferencias que estn "incorporadas"
al experimento: Fue el frmaco A ms efectivo que el
frmaco B porque el grupo de tratamiento tena ms
hombres que mujeres? Ms viejo que sujetos ms jvenes?
Haba sujetos de aptitudes "iguales", historias de salud y
tipos de personalidad representados en ambos grupos, por
ejemplo?
Variables
Las variables, por defnicin, son la cuantificacin de conceptos
(como la definicin operacional de "salud" utilizados en la
investigacin que pueden tomar diferentes valores (es decir,
variar). Por lo tanto, la salud es un conjunto cuantificado de
resultados de las pruebas que varan segn el sujeto individual.
Variables independientes
La
"variable independiente" se entiende como una variable
cuya medida no se relaciona o no depende de otras variables.
Encontextos no experimentales, se prefiere usar la designacin
"predictor variable en lugar de variable independiente, ya que
esto no evoca el lenguaje de la causalidad.
Variables
Los diseos no experimentales, como los que usan los datos de la encuesta, se
centran ms en identificar patrones de relacin entre variables que en
establecer la causalidad.
En estas situaciones, esta variable es un "predictor" que viene primero y luego se
analiza la influencia de otras variables. De la misma manera, se puede usar la
variable "resultado" para designar a la variable dependiente.
Una variable puede ser un predictor de un resultado sin suponer que es una
causa.
En los diseos experimentales, las variables de estudio independientes pueden
ser "manipuladas" o "no manipuladas" segn su naturaleza.
Las variables independientes manipuladas son aquellas que el experimentador
cambia o manipula conscientemente para crear las condiciones para observar
los efectos diferenciales de los grupos de tratamiento en la variable de
resultado. En nuestro ejemplo, "medicamentos" es la variable independiente
manipulada, ya que el investigador podra asignar a sujetos a dos niveles o
condiciones diferentes de esta variable: Medicamento A o B.
Variables
Las variables independientes no manipuladas son aquellas que
no pueden cambiar o no pueden ser manipuladas por el
investigador. Tpicamente, son caractersticas, rasgos o atributos
de individuos. Por ejemplo, el gnero o la edad pueden ser
variables independientes en un estudio, pero no pueden ser
cambiadas, solo medidas.
Cuando estos tipos de variables se utilizan en un estudio de
investigacin, el investigador no puede hacer conclusiones
causales.
Si se utilizan variables no manipuladas, por defnicin el diseo de
la investigacin no puede ser experimental. Por ejemplo, si el
investigador estaba interesado en los efectos del gnero, el
diseo de la investigacin slo puede agrupar a los sujetos por
su gnero ya designado.
Variables

Variables dependientes
Las
variables dependientes son aquellas que se
consideran los "receptores de la accin
Suvalor depende de (est vinculado a) una variable
existente anteriormente. Cuando las variables
independientes son causas, las variables dependientes
son "efectos" o resultados. Como se seal
anteriormente, en contextos no experimentales, se
puede pensar en ellos como "variables de resultado"
que estn vinculados a los predictores.
DISEOS DE INVESTIGACIN NO EXPERIMENTAL
o POST FACTO
El ejemplo de hiptesis que se present anteriormente ("Los trabajadores
con mayores ingresos informan mejor salud en las medidas estandarizadas
de la salud") es ms fcilmente considerado un diseo no experimental;
Probablemente se considera mejor un diseo correlacional post facto. Aqu,
simplemente estoy usando datos que ya existen - de ah post facto, que
significa "despus del hecho relacionamos salud e ingresos.
Un diseo post facto tambin puede comparar condiciones en lugar de
condiciones correlativas. El diseo post facto-comparativo busca entender
la diferencia. As, por ejemplo, podra comparar dos grupos ya existentes de
trabajadores designados como de ingresos altos o bajos para ver si tienen
calificaciones de medida de salud diferentes.
Estadsticamente, el investigador puede evaluar si existe una diferencia
entre las medias de los valores de medida de salud. Este diseo es post
facto, pero no es correlacional ya que buscamos evaluar la diferencia ms
que la asociacin.
Diseos de investigacin no experimental o
post facto
La naturaleza del diseo de la investigacin
Por ahora, basta con saber que hay diferentes maneras de evaluar teoras. Desarrollamos
hiptesis de acuerdo con la naturaleza de nuestros intereses e investigaciones, y por lo
tanto validamos o cuestionamos teoras mediante procesos empricos (estadsticos).
En resumen, cada diseo tiene fortalezas y limitaciones. El experimento puede ser una
forma poderosa de hacer "declaraciones causales" ya que, si slo una cosa cambia,
mientras que todo lo dems es similar entre los grupos que se estn probando, podemos
atribuir cualquier efecto o cambio en los resultados a lo que fue cambiado.
Utilizando el primer ejemplo nuevamente, si escogimos y asignamos a sujetos a diferentes
condiciones de frmacos utilizando medios aleatorios y si la nica diferencia entre los dos
grupos era el frmaco diferente recibido, entonces el investigador podra atribuir cualquier
diferencia resultante en el resultado X a los diferentes frmacos.
Los diseos post facto no pueden conducir a atribuciones causales. Dado que los
datos ya estn recogidos, una serie de influencias diferentes ya estn "contenidas en
los datos". En este caso, los dos grupos que comparamos tienen diferencias distintas
del inters de investigacin (exposicin a diferentes frmacos).
Diseos de investigacin no experimental o
post facto
La naturaleza del diseo de la investigacin
Por ahora, basta con saber que hay diferentes maneras de evaluar teoras. Desarrollamos
hiptesis de acuerdo con la naturaleza de nuestros intereses e investigaciones, y por lo
tanto validamos o cuestionamos teoras mediante procesos empricos (estadsticos).
En resumen, cada diseo tiene fortalezas y limitaciones. El experimento puede ser una
forma poderosa de hacer "declaraciones causales" ya que, si slo una cosa cambia,
mientras que todo lo dems es similar entre los grupos que se estn probando, podemos
atribuir cualquier efecto o cambio en los resultados a lo que fue cambiado.
Utilizando el primer ejemplo nuevamente, si escogimos y asignamos a sujetos a diferentes
condiciones de frmacos utilizando medios aleatorios y si la nica diferencia entre los dos
grupos era el frmaco diferente recibido, entonces el investigador podra atribuir cualquier
diferencia resultante en el resultado X a los diferentes frmacos.
Los diseos post facto no pueden conducir a atribuciones causales. Dado que los
datos ya estn recogidos, una serie de influencias diferentes ya estn "contenidas en
los datos". En este caso, los dos grupos que comparamos tienen diferencias distintas
del inters de investigacin (exposicin a diferentes frmacos).
Diseos de investigacin no experimental o
post facto
La naturaleza del diseo de la investigacin
Por ahora, basta con saber que hay diferentes maneras de evaluar teoras. Desarrollamos
hiptesis de acuerdo con la naturaleza de nuestros intereses e investigaciones, y por lo
tanto validamos o cuestionamos teoras mediante procesos empricos (estadsticos).
En resumen, cada diseo tiene fortalezas y limitaciones. El experimento puede ser una
forma poderosa de hacer "declaraciones causales" ya que, si slo una cosa cambia,
mientras que todo lo dems es similar entre los grupos que se estn probando, podemos
atribuir cualquier efecto o cambio en los resultados a lo que fue cambiado.
Utilizando el primer ejemplo nuevamente, si escogimos y asignamos a sujetos a diferentes
condiciones de frmacos utilizando medios aleatorios y si la nica diferencia entre los dos
grupos era el frmaco diferente recibido, entonces el investigador podra atribuir cualquier
diferencia resultante en el resultado X a los diferentes frmacos.
Los diseos post facto no pueden conducir a atribuciones causales. Dado que los
datos ya estn recogidos, una serie de influencias diferentes ya estn "contenidas en
los datos". En este caso, los dos grupos que comparamos tienen diferencias distintas
del inters de investigacin (exposicin a diferentes frmacos).
Muestreo

Por ahora, el muestreo se entiende generalmente como el proceso mediante el cual


un pequeo grupo de elementos se elige de un grupo ms grande (poblacin) de
modo que el grupo pequeo elegido es representativo del grupo ms grande. Se
piensa que las conclusiones del estudio caracterizan a toda la poblacin.
Como usted puede imaginar, el proceso de muestreo es vulnerable a problemas.
Elegir la muestra para que pueda ser representativo de toda la poblacin es casi
imposible.
Pero si el investigador escoge una muestra aleatoriamente, donde cada elemento
tiene una probabilidad igual de ser elegido, puede estar seguro de que tendremos la
muestra ms representativa. Lo que estamos diciendo aqu es que estamos usando un
proceso de muestreo probabilstico
Hay otros tipos de muestreo que reconocen la complejidad del proceso. El muestreo
aleatorio estratificado, por ejemplo, permite al investigador construir niveles o
categoras para que puedan tener en cuenta cada uno de los componentes
cruciales de una poblacin. Si nuestra poblacin tiene un nmero desigual de
hombres y mujeres, por ejemplo, podramos querer muestrear aleatoriamente dentro
de las categoras de sexo para asegurarnos de tener un grupo representativo de
muestras.
Muestreo

Lo que dificulta el muestreo es que a menudo no podemos


controlar ciertas caractersticas
A menudo, no tenemos la capacidad de utilizar los
procedimientos de muestreo probabilstico. Tal vez estamos
estudiando un fenmeno en el que es difcil o imposible
identificar a la poblacin de la que se muestre. En tales casos,
necesitamos usar cualquier procedimiento disponible.
Otro proceso de muestreo no representativo es el muestreo de
bola de nieve. A menudo, debido a la confidencialidad de los
datos o groupos difcil de indentificar, el investigador podra
obtener entrevistas de temas adicionales a partir de una
entrevista existente. Entonces, las entrevistas adicionales podran
descubrir otros sujetos potenciales, como una bola de nieve
recopilando el impulso rodando por una colina.
Estadsticas Inferenciales

Ahora que he cubierto algunos de los elementos esenciales del diseo de la


investigacin, podemos volver al tema de la estadstica inferencial. Los dos temas
estn muy entrelazados.
El principal requisito para entender las estadsticas inferenciales es aprender a pensar
abstractamente. Hemos tratado con estadsticas descriptivas, que, en cierto sentido,
son procedimientos para medir lo que ves. Debemos aprender a entender la
conexin entre los datos que vemos ante nosotros y el mundo estadstico que est
fuera y ms all de lo que vemos.
Una muestra de muchas muestras posibles
Tenemos que empezar a pensar en nuestros datos como una muestra que hemos
extrado de una poblacin ms grande en lugar de un conjunto de datos que es una
muestra en s mismo. O, dicho de otra manera, debemos pasar de medir las
distribuciones de las puntuaciones brutas a medir la probabilidad de distribuciones de
muestras .
Por ejemplo, para dilucidar si los ingresos afectan la salud, podemos usar
estadsticas inferenciales para ayudarnos a comprender si nuestros cambios
observados en un estudio muestral probablemente se aplican a la poblacin de
todos los sujetos.
Estadsticas Inferenciales
Estadsticas Inferenciales

Para propsitos de discusin, la Figura 6.3 muestra que si tuviramos


que crear una muestra cuatro veces, nuestras muestras caeran
dentro del rea grande cerca de la media y no en las colas. Si
seleccionramos 1000 muestras (o las puntuaciones de los
estudiantes en cada una de las 1000 clases), probablemente
observaramos la media de la mayora de las muestras alrededor de
la media de la poblacin, pero tambin varias en las colas. Esa es la
naturaleza de la distribucin normal.
Por supuesto, no necesitamos crear cuatro muestras para nuestro
estudio. El hecho es slo subrayar el hecho de que cuando creamos
muestras, es probable que vienen de la zona ms cerca de la media
que en las colas. Suponemos, al tomar una muestra, que representa
una poblacin procedente del rea cercana a la media. A pesar de
que nuestra media de la muestra no es probable que sea
exactamente la misma que la media de la poblacin, sin embargo,
probablemente ser cerca.
Estadsticas Inferenciales

Cuando realizamos un estudio de investigacin, normalmente


seleccionamos una muestra que tratamos de asegurar que sea
representativa de una poblacin de inters. La Figura 6.3
muestra que este proceso de muestreo, si es aleatorio, puede
resultar en un grupo de muestra extrado de una distribucin de
poblacin.
Hay cuatro muestras que se muestran en la Figura 6.3 para
demostrar que la mayora de las muestras sern seleccionadas
del rea cercana a la media de la poblacin si se usan
mtodos probabilsticos. Lo discutimos en el captulo 5, que trata
de la probabilidad y la curva normal. La mayor probabilidad en
la seleccin de la muestra es que provendr de la zona ms
unida a la media. Hay probabilidades de que la muestra se
pueda sacar de las colas, pero eso no es tan probable.
Estadsticas Inferenciales

Elerror de muestreo es la diferencia entre la muestra y la


poblacin. Siempre que tomamos una muestra, no es
probable que creemos un grupo pequeo con
exactamente la misma media y desviacin estndar que la
poblacin general.
Esto no hace que la muestra sea problemtica o poco
representativa a menos que sea muy diferente de la media
de la poblacin. Se espera algn error (diferencia entre la
muestra y la poblacin) en el muestreo. El alcance del error
es el objeto de la estadstica inferencial.
Teorema del lmite central

Supongamos que reunimos 1000 muestras de una gran cantidad de


estudiantes. Si usamos slo los medios de muestreo de cada muestra
para representar a todos sus grupos de muestra, podramos crear una
nueva distribucin compuesta slo por estos medios de muestra.
En tal proceso, la mayor parte de los medios de muestreo en esta nueva
"distribucin de muestreo" se situara cerca de la media de la poblacin
general y algunos se extenderan hacia las colas.
De hecho, la distribucin de muestreo de los medios sera normalmente
distribuida, y su media sera igual a la media de la poblacin. Los
investigadores y los estadsticos se refieren a este proceso como
resultado de las suposiciones del teorema del lmite central.
Este teorema indica que los medios de muestras repetidas tomadas de
una poblacin formarn una distribucin normal estndar incluso si la
poblacin no estaba distribuida normalmente.
Estadsticas Inferenciales
Teorema del lmite central

Como se puede ver en la figura 6.4, las cuatro muestras


hipotticas se toman de la poblacin. Y sus medios
individuales forman una distribucin separada llamada
distribucin de muestreo .
Puede verse en la figura 6.4 que los medios individuales, que
representan sus distribuciones de muestras (M1, M2, M3, M4),
estn prximos a la media de la poblacin en la nueva
distribucin. Podemos decir que el error de muestreo es
menor a medida que nos acercamos a la media
poblacional.
La
figura 6.4 muestra este proceso usando slo cuatro
muestras para la ilustracin.
Teorema del lmite central

Hay otras caractersticas importantes de la distribucin de muestreo


creada usando los medios de muestras repetidas.
1. La distribucin de la muestra ser distribuida normalmente.
2. La media de la distribucin muestral ser igual a la media
poblacional.
3. La desviacin estndar de la distribucin de muestreo ser
menor que la desviacin estndar de la poblacin, ya que solo
estamos usando las puntuaciones medias individuales de cada
distribucin.
La importancia de la distribucin muestral es que se distribuir
normalmente, incluso si la poblacin original no se distribuye
normalmente.
Teorema del lmite central

Puede ver esta caracterstica del teorema del lmite central en la


figura 6.5.
Dado que normalmente se distribuye, puede ver cmo una media
de una sola muestra se relaciona con todos los dems medios de
muestra posibles.
La pregunta importante es, qu tan lejos de la media puedo
seleccionar una muestra, y an asumir que es representativo de la
poblacin?
Esta es la cuestin operativa en el centro de la estadstica inferencial
y la razn por la que necesitamos prever la distribucin del muestreo.
A pesar de que en realidad nunca crearemos una distribucin de
muestreo mediante el muestreo repetido de una poblacin, las
caractersticas conocidas de la distribucin muestral nos ayudarn a
responder a la cuestin de la representatividad de los valores.
Teorema del lmite central
Teorema del lmite central

Puede ver esta caracterstica del teorema del lmite central en la


figura 6.5.
Dado que normalmente se distribuye, puede ver cmo una media
de una sola muestra se relaciona con todos los dems medios de
muestra posibles.
La pregunta importante es, qu tan lejos de la media puedo
seleccionar una muestra, y an asumir que es representativo de la
poblacin?
Esta es la cuestin operativa en el centro de la estadstica inferencial
y la razn por la que necesitamos prever la distribucin del muestreo.
A pesar de que en realidad nunca crearemos una distribucin de
muestreo mediante el muestreo repetido de una poblacin, las
caractersticas conocidas de la distribucin muestral nos ayudarn a
responder a la cuestin de la representatividad de los valores.
Teorema del lmite central

Puede ver esta caracterstica del teorema del lmite central en la


figura 6.5.
Dado que normalmente se distribuye, puede ver cmo una media
de una sola muestra se relaciona con todos los dems medios de
muestra posibles.
La pregunta importante es, qu tan lejos de la media puedo
seleccionar una muestra, y an asumir que es representativo de la
poblacin?
Esta es la cuestin operativa en el centro de la estadstica inferencial
y la razn por la que necesitamos prever la distribucin del muestreo.
A pesar de que en realidad nunca crearemos una distribucin de
muestreo mediante el muestreo repetido de una poblacin, las
caractersticas conocidas de la distribucin muestral nos ayudarn a
responder a la cuestin de la representatividad de los valores.
La distribucin de muestreo y la investigacin

Si se toma una muestra de una poblacin y se la utiliza para


reflejar las caractersticas de la poblacin mtodos
probabilsticos, entonces la muestra ser representativa de la
poblacin. Es decir, la media muestral probablemente no caer
lejos de la media de la poblacin.
En el ejemplo del examen AP, formamos la clase
(aleatoriamente si es posible!) Y luego utilizamos el nuevo
mtodo de enseanza durante un perodo de tiempo antes del
cual medimos el resultado del estudio Tienen nuestros
estudiantes un promedio de pruebas mayor o menos que los
estudiantes "normales" o sea aquellos que no estaban expuestos
al nuevo mtodo de enseanza?
La distribucin de muestreo y la investigacin

Puesto que estamos hipotetizando que el nuevo mtodo de


enseanza es til para el aprendizaje, anticipamos que las
calificaciones promedio de los estudiantes de AP en nuestro grupo
de muestra seran ms altas que las puntuaciones de la prueba AP
de la poblacin general de estudiantes. Es decir, a lo largo de la
duracin de la clase, el mtodo de enseanza resultara en un logro
ms alto (resultados de las pruebas) que en los estudiantes en otras
clases de AP. Si ahora comparamos nuestro promedio de logros de
clase con el logro promedio de la poblacin de estudiantes, podra
ser bastante mayor. Pero cunto ms alto tendra que ser para
concluir que el nuevo mtodo de enseanza tuvo un impacto
significativo en el aprendizaje de los estudiantes? Esta es la
importancia de la distribucin del muestreo.
En efecto, nuestro tratamiento puede haberse "alejado la media de
la muestra" de la poblacin, significando una cierta distancia como
resultado del tratamiento experimental.
La distribucin de muestreo y la investigacin

Qu tan lejos es lejos? Los estadsticos e investigadores han


asumido que si una media de muestra cae en las colas de una
distribucin, no es representativa; Pero qu tan lejos en las colas? El
consenso es generalmente el rea de exclusin del 5%, es decir, el
rea en las colas (ambos lados) que representa el extremo 5% del
rea bajo la distribucin normal estndar (es decir, el 2,5% a cada
lado).
Por lo tanto, vuelva a nuestro ejemplo. Si las puntuaciones de las
pruebas AP de nuestros estudiantes de la muestra son
sustancialmente ms altas que las de la poblacin, tal vez cayendo
en las colas de la distribucin de la poblacin, diramos que el nuevo
mtodo de enseanza "empuj" los resultados hacia los extremos, por
lo que nuestros estudiantes ya no son representativos de los
estudiantes en la poblacin.
La distribucin de muestreo y la investigacin

La figura 6.6 muestra cmo puede visualizar esto. La distribucin del muestreo se
obtiene (en teora) de la poblacin de todos los estudiantes. Despus del
experimento, las puntuaciones de los estudiantes (representadas por la media de
la muestra) estn ahora por encima de las puntuaciones de los otros estudiantes,
tal como se representa en la distribucin muestral (el valor medio de la muestra
est en la extrema derecha de la distribucin de todos los estudiantes) .
La distribucin de muestreo se convierte as en una especie de "regla" que
podemos usar para aplicar nuestros fndings. Se crea (tericamente) de acuerdo
con el teorema del lmite central y por lo tanto refleja una distribucin "perfecta":
una distribucin normal estndar.
En el ejemplo de la figura 6.6, diramos que el tratamiento cambi al grupo de tal
manera que ya no es igual al grupo de todos los dems estudiantes.
Otra manera de decir esto es que, despus del experimento, nuestra muestra de
muchas muestras posibles ahora no est en el rea de una muestra "normal".
Nuestra muestra cambiada ahora se movi hacia las colas, y podemos decir que
ahora es diferente de las muestras posibles que se podran crear.
La distribucin de muestreo y la investigacin
Poblaciones y muestras

Los parmetros se refieren a medidas de poblaciones enteras y


distribuciones de poblacin. Esto se distingue de las estadsticas,
que se refieren a las medidas de los datos de muestra tomadas
de las poblaciones. Debemos distinguir estas medidas ya que la
estadstica inferencial es bastante especfica sobre las medidas
disponibles para el anlisis. Una forma de distinguirlos es por sus
smbolos; Los parmetros de la poblacin son tpicamente
representados por smbolos griegos.
Muestra vs. Poblacin
SMBOLOS DE POBLACIN Y MUESTRA

M La media de la muestra.

DE La desviacin estndar de la muestra (asume que la muestra es su propia poblacin)

La letra griega 'Mu' es el smbolo de la media de la poblacin.

MM Este es el smbolo de la media de la distribucin muestral de los medios. Por lo tanto, es la media
de la distribucin de los medios, o la 'media de todos los medios posibles'.

x "Sigma X" es la Desviacin Estndar de todas las puntuaciones brutas de la poblacin. Esto difiere
de SD en que no se refiere a una muestra, sino a toda la poblacin de puntajes individuales.

M La desviacin estndar de la distribucin muestral de los medios; tambin llamado el Error


estndar de la media.
Poblaciones y muestras

El error estndar de la Media


Este es un nuevo trmino para una medida que ya hemos
discutido: la desviacin estndar de la distribucin muestral de
los medios. La designacin "error estndar de los medios" se
utiliza porque es mucho ms corto!
Ambos son simplemente maneras de decir que M es una
desviacin estndar de una distribucin normal estndar que
consiste en todos las medias de muestra posibles.
Poblaciones y muestras

El error estndar de la media es una desviacin estndar. Pero recuerde que es una
desviacin estndar de una distribucin que es "ms estrecha" que la desviacin estndar
de la poblacin, ya que slo usamos las puntuaciones medias de muestreo repetido para
hacerla.
Puede ver esto mirando nuevamente la Figura 6.4.
Poblaciones y muestras

Dado que el error estndar de las medias( M) es diferente de la


desviacin estndar de la poblacin (X), debemos ser capaces
de estimar su valor. Una forma de hacerlo es mediante la
siguiente frmula:

Utilizamos esta frmula ya que incluye el tamao de muestra


(N). El tamao de la muestra determinar en ltima instancia el
tamao del M puesto que el tamao del grupo se registra en los
medios de la muestra que lo componen.
Poblaciones y muestras

A medida que N aumenta, el M disminuir;


Cuando se divide un nmero por un nmero grande, el
resultado ser un nmero ms pequeo. Conceptualmente, sin
embargo, esto simplemente se refiere al hecho de que tamaos
de muestra ms grandes son mejores estimaciones y por lo tanto
la desviacin estndar de las medias de la muestra
probablemente ser menor.
La regla para recordar es M < X.
"Transformacin" de la media de la muestra
en la distribucin de muestreo
Recuerde que "error de muestreo" es la distancia de una media muestral de la media
poblacional.
Recuerde tambin que la distribucin muestral de los medios est perfectamente
distribuida y su media es igual a la media de la poblacin (MM = ).
Cuando medimos la media de la muestra (M) en la distribucin de muestreo como se
muestra en la figura 6.6, la distancia de nuestra media de la muestra de MM puede
expresarse como una "distancia estndar" al referirse a la desviacin estndar de esta
(perfecta) Distribucin ( M).
"Transformacin" de la media de la muestra
en la distribucin de muestreo
La distancia resultante es, por tanto, como una puntuacin z que se expresa en unidades de
desviacin estndar de la distribucin de los medios. Transformamos la media de la muestra en
un valor estandarizado en la distribucin de muestreo de los medios tal como lo hicimos
cuando creamos una puntuacin z.
Aqu est la frmula que utilizamos cuando estbamos tratando slo con las puntuaciones de
una sola muestra:

Podemos usar la misma frmula con algunos cambios para reflejar que estamos usando
poblacin en lugar de slo valores muestrales:

Compare las dos frmulas. Se parecen, porque hacen lo mismo. La


frmula de puntuacin z (arriba) se utiliza para transformar una
puntuacin bruta en una puntuacin estndar. Estos dos estn al
mismo nivel de distribucin.
Ejemplo de Transformacin

Tomemos un ejemplo usando nuestros puntajes hipotticos de AP.


Para los propsitos de este ejemplo, asuma que eleg una muestra de estudiantes
de AP al azar de todos los estudiantes de AP en las universidades de mi regin. Los
siguientes valores resultaron del estudio:
1. La puntuacin promedio AP de la poblacin estudiantil: = 48.00.
(Este valor hipottico representa la puntuacin promedio de la prueba AP para
los estudiantes de todas las universidades de la regin).
2. La desviacin estndar de la poblacin (X) de los valores de la puntuacin de
la prueba AP = 15.00. (Valor hipottico de la poblacin.)
3. La puntuacin media de la prueba AP para la muestra (N = 31): M = 53,68. (Este
valor de ejemplo se calcula y discute en captulos anteriores.)
4. La desviacin estndar de las puntuaciones de la prueba AP (DE) = 20.028. Este
valor no es necesario para este procedimiento ya que estamos usando la
desviacin estndar de poblacin () como nuestra comparacin.
5. El error estndar de la media (M) = 2,69
Ejemplo de Transformacin

5. El error estndar de la media (M) = 2,69


Ejemplo de Transformacin

Ahora debemos comparar estos resultados con la poblacin.


Por eso usamos la formula anterior:

Veamos algunos resultados y preguntmonos que es un Z =2.11?


Ejemplo de Transformacin y Resultados
La diferencia entre la media poblacional y muestral es de 5.68. Esto
significa que en promedio tienen una distancia de 5 a 6 puntos en las
pruebas.
Cuando dividimos esto por el error estndar (M) obtenemos una
puntuacin Z = 2.11
Si usamos la tabla o una funcin de Excel, esto significa que dentro de una
distribucin normal, tenemos un valor de 98.66%. Lo que implica que la
muestra tomada es muy atpica.
En trminos de probabilidad se aleja demasiado de la media poblacional.
O sea Z=2.11esta por encima de la rea de exclusin definida por el
extremo del 5% (o 2.5% si consideramos ambas colas).
Debido a que la muestra se encuentra por encima de la rea de exclusin
del 5%, podemos concluir que la muestra tomada esta muy encima del
promedio de notas de los colegios regionales. Y por implicacin significa
que el mtodo usado en este colegio empuj las notas fuera del
promedio.
Ejemplo de Transformacin y Resultados
La diferencia entre la media poblacional y muestral es de 5.68. Esto
significa que en promedio tienen una distancia de 5 a 6 puntos en las
pruebas.
Cuando dividimos esto por el error estndar (M) obtenemos una
puntuacin Z = 2.11
Si usamos la tabla o una funcin de Excel, esto significa que dentro de una
distribucin normal, tenemos un valor de 98.66%. Lo que implica que la
muestra tomada es muy atpica.
En trminos de probabilidad se aleja demasiado de la media poblacional.
O sea Z=2.11esta por encima de la rea de exclusin definida por el
extremo del 5% (o 2.5% si consideramos ambas colas).
Debido a que la muestra se encuentra por encima de la rea de exclusin
del 5%, podemos concluir que la muestra tomada esta muy encima del
promedio de notas de los colegios regionales. Y por implicacin significa
que el mtodo usado en este colegio empuj las notas fuera del
promedio.
Discusin
Tenemos que recordar que este resultado no podra ser generalizable
porque realsticamente no podra elegir una clase compuesta de
estudiantes elegidos al azar. Considere las siguientes observaciones:
Descubrimos un hecho que supusimos que sera cierto, dada
nuestra creencia en el nuevo mtodo de enseanza. La
investigacin real podra concluir lo contrario: que nuestro valor
promedio de AP de la muestra estaba significativamente por debajo
del valor medio de la poblacin. Por ejemplo, calcule el valor Z
suponiendo que el valor medio de la poblacin = 59.36 (todos los
dems valores permanezcan iguales).
Esto resultara en Z = -2.11. El valor an no sera tpico ya que caera
en la regin de exclusin del 5%, pero estara a la izquierda de la
distribucin, lo que significa que nuestros estudiantes se
desempearon mucho peor que los estudiantes de la poblacin. Los
investigadores deben ser conscientes de esta posibilidad.
Discusin
Para constituir un experimento, habra tenido que elegir al azar a
estudiantes de toda la poblacin de las universidades regionales y
luego inventar una forma de invitar a la participacin de los
estudiantes AP en la clase, convencer a mi universidad de pagar por
los estudiantes a asistir, asistan a clases y tomar el examen.
Los resultados de un estudio de este tipo no seran definitivos (o
causales), ya que no podra controlar todas las influencias externas
que afectaran el estudio.
Sin embargo, si se hace bien, el estudio podra sugerir "tendencias" en
los resultados utilizando este nuevo mtodo de enseanza. Antes de
implementar el mtodo de enseanza mgico en una escala ms
grande, podra buscar ms cautelosamente otros estudios que
influiran en mi resultado.
Z TEST

Felicitaciones!
Sin ser consciente de ello, acaba de realizar su primera prueba
estadstica inferencial, la prueba Z. Como puede ver, no es tan
difcil de entender. Simplemente transformamos una media de
muestra para que pudiera compararse con todos los medios de
muestra posibles. Al hacerlo, podemos ver cmo "cae" en una
distribucin normal estndar de valores y calcular una
probabilidad de que esta puntuacin se produzca por
casualidad. Si cae demasiado lejos en las colas (es decir, ms
all del rea extrema del 5%), podemos concluir que no es
representativa de la poblacin.
LA PRUEBA DE LA HIPOTESIS

Lo que hemos hecho es realizar una prueba de hiptesis. Este es


el proceso formal y lgico establecido para tomar una decisin
cientfica. Si nos fijamos en la figura 6.1, el paso ms bajo en el
proceso es apoyar o refutar una hiptesis e informar de ello a
una teora.
Si identificamos los pasos que utilizamos en nuestro ejemplo,
veremos que estos pasos forman el procedimiento general para
una prueba de hiptesis que seguiremos en todas las pruebas
estadsticas restantes (con algunas variaciones para cada
procedimiento). Aqu estn los pasos con nuestros resultados
(artificiales) aplicados para que pueda ver cmo funciona:
LA PRUEBA DE LA HIPOTESIS

1. La hiptesis nula o (H0): 1 =

Los investigadores comienzan por considerar una declaracin


que puede ser medida y verificada o refutada. Comienzan con
el supuesto de que no habr diferencia entre la media de la
muestra del estudio (1) y la media de la poblacin (). El
objetivo del proceso de investigacin es ver si esto es una
suposicin precisa o si nuestra muestra viola esa suposicin por
ser demasiado grande o demasiado pequea.
La hiptesis nula fue que una muestra de puntajes de
estudiantes de AP tendra el mismo puntaje de puntuacin
promedio AP que el de la poblacin que consta de estudiantes
de AP en universidades regionales.
LA PRUEBA DE LA HIPOTESIS

1. La hiptesis nula o (H0): 1 =

Los investigadores comienzan por considerar una declaracin


que puede ser medida y verificada o refutada. Comienzan con
el supuesto de que no habr diferencia entre la media de la
muestra del estudio (1) y la media de la poblacin (). El
objetivo del proceso de investigacin es ver si esto es una
suposicin precisa o si nuestra muestra viola esa suposicin por
ser demasiado grande o demasiado pequea.
La hiptesis nula fue que una muestra de puntajes de
estudiantes de AP tendra el mismo puntaje de puntuacin
promedio AP que el de la poblacin que consta de estudiantes
de AP en universidades regionales.
LA PRUEBA DE LA HIPOTESIS
2. La hiptesis alternativa o (HA): 1
Esta afirmacin se crea con el fin de presentar el
hallazgo que negara la hiptesis nula - por lo tanto, el
fnding alternativo. En nuestro estudio, propusimos que
una muestra de estudiantes mostraran valores de
puntaje de prueba de PA ms altos que la poblacin.
Tcnicamente, nuestra hiptesis alternativa permite
que las variables no sean iguales y, por tanto,
superiores o inferiores a los valores de la poblacin.
(Esto ayudara a dar cuenta de las salidas tanto
negativas como positivas de la media de la
poblacin).
LA PRUEBA DE LA HIPOTESIS
3. El valor crtico: 1,96 valores z (rea de exclusin del 5%)
Recordemos que necesitamos tener un punto de referencia para
ayudarnos a decidir si nuestros resultados reales calculados se
consideran tpicos o atpicos. En realidad, estamos utilizando este punto
de referencia para ayudarnos a decidir qu hiptesis (nula o
alternativa) es ms precisa. Como he comentado antes, para esta
situacin en particular los investigadores utilizan un punto de referencia
del 5%. Es decir, si una media de muestra calculada / transformada cae
en el rea de exclusin del 5% (el 2,5% en cada cola) de una
distribucin normal estndar, entonces se considerara atpica. En
trminos de probabilidad, esto representara una probabilidad de
ocurrencia de p <0.05 o p <0.025, ya sea positiva o negativa.
Dicho de otra manera, se considerara que no es probable que ocurra
por casualidad; Ms bien alguna razn que no sea el azar creara un fin
tan extremo.
LA PRUEBA DE LA HIPOTESIS

4. El valor calculado (2.11)


Estees el valor de prueba Z que calculamos a
partir de los valores que tenamos disponibles.
Representa los resultados de la frmula de prueba
Z que transform el valor de la muestra en una
puntuacin estndar para poder compararla con
otros posibles resultados de la muestra.
LA PRUEBA DE LA HIPOTESIS
5. Decisin estadstica: Rechazar la hiptesis nula?
Este paso nos pide comparar el valor calculado (paso 4) con el
valor de referencia (paso 3) para ver qu hiptesis (nula o
alternativa) es ms probable.
En nuestro estudio, los estudiantes de la muestra tuvieron
puntuaciones de puntuacin de AP mucho ms altas que las de
los estudiantes de la poblacin, se supone que son el resultado
del nuevo mtodo de enseanza.
Si simplemente hubiramos escogido una muestra de los
puntajes estudiantiles existentes por casualidad sin usar el nuevo
mtodo de enseanza, probablemente la media de la muestra
no hubiera sido tan extrema ya que la mayora de las
selecciones de azar estaran mucho ms cerca de la media de
la poblacin y no reflejaran los cambios debidos.
LA PRUEBA DE LA HIPOTESIS

Elvalor Z calculado "empuj" la media de prueba


AP de muestra en la cola derecha de la
distribucin. Dado este resultado, existira una
probabilidad extremadamente pequea (p
<0,01743) de un valor de prueba Z de que este
gran caer en las colas sea simplemente por
casualidad, y "rechazaramos la hiptesis nula".
Es decir, podramos concluir que la hiptesis nula
no es apoyada por nuestros hallazgos; La hiptesis
alternativa es apoyada por nuestros hallazgos.
LA PRUEBA DE LA HIPOTESIS
6. Interpretacin
Los investigadores deben tomar decisiones estadsticas a travs
de los pasos anteriores. Sin embargo, deben colocar las
palabras en el lenguaje de la pregunta para que tenga sentido
para la audiencia.
Obtuvimos una fuga atpica.
Podemos decir algo as como "Nuestro grupo muestral de
estudiantes (N = 31) tuvo un puntaje promedio de AP ms alto
(53.68) que la media de la poblacin de escuelas (48.00), como
lo demuestra la relacin Z (2.11, p <0.05 ).
(Reportar la p <0,05) simplemente es una afirmacin general de
que la probabilidad de que nuestra muestra tuviera una
probabilidad mucho menor de probabilidad, es decir, en el
extremo 5% de las colas de la distribucin.
LA PRUEBA DE LA HIPOTESIS
6. Interpretacin
Los investigadores deben tomar decisiones estadsticas a travs
de los pasos anteriores. Sin embargo, deben colocar las
palabras en el lenguaje de la pregunta para que tenga sentido
para la audiencia.
Obtuvimos una fuga atpica.
Podemos decir algo as como "Nuestro grupo muestral de
estudiantes (N = 31) tuvo un puntaje promedio de AP ms alto
(53.68) que la media de la poblacin de escuelas (48.00), como
lo demuestra la relacin Z (2.11, p <0.05 ).
(Reportar la p <0,05) simplemente es una afirmacin general de
que la probabilidad de que nuestra muestra tuviera una
probabilidad mucho menor de probabilidad, es decir, en el
extremo 5% de las colas de la distribucin.
SIGNIFICANCIA ESTADSTICA

En trminos de probabilidad, cualquier factor de


p <0,05 se considera "estadsticamente
significativo". Los investigadores y estadsticos
tienen una definicin especfica de significancia
estadstica: se refiere a la probabilidad de que
una observacin en una muestra est demasiado
lejos del parmetro de poblacin En este caso la
poblacin significa) por casualidad, pertenecer a
la misma poblacin. El rea de exclusin del 5%
se identifica tpicamente para definir significancia
estadstica
Significado prctico: tamao del efecto
Los investigadores y los estadsticos se han basado
ampliamente en significancia estadstica para ayudar
a tomar decisiones estadsticas. Usted puede ver
cmo este lenguaje permea gran parte de la literatura
de investigacin; Est incluso extendida entre los
practicantes y aquellos que no estn familiarizados
con los procedimientos estadsticos.
El nfasis en la estadstica y la investigacin ahora est
en el tamao del efecto, o que impacto" tiene un
factor, independientemente de su valor p estadstico.
Es decir, cunto "impacto" tiene una variable de
investigacin para mover un valor de muestra?
Significado prctico: tamao del efecto
Consideremos nuestro ejemplo de problema mostrado en la Figura 6.8.
Se realiz una prueba de significancia estadstica con estas
conclusiones y se lleg a la conclusin de que la media muestral de los
resultados de las pruebas de los estudiantes de AP estaba demasiado
lejos en las colas (positivas) de la distribucin de muestreo para ser
considerada como un riesgo casual.
La consideracin del tamao del efecto es una cuestin
completamente diferente. No se refiere a la probabilidad, sino ms
bien, qu tan lejos de la media de la poblacin se ha impulsado
nuestra media de la muestra como resultado de una proporcin ms
baja?
De acuerdo con la Figura 6.8, la media de la muestra ha sido empujada
muy lejos en la cola derecha de la distribucin de muestreo como
resultado de tener un valor ms alto que la poblacin - una distancia
de aproximadamente 2 y 11/100 desviaciones estndar!
Significado prctico: tamao del efecto
Consideremos nuestro ejemplo de problema mostrado en la Figura 6.8.
Se realiz una prueba de significancia estadstica con estas
conclusiones y se lleg a la conclusin de que la media muestral de los
resultados de las pruebas de los estudiantes de AP estaba demasiado
lejos en las colas (positivas) de la distribucin de muestreo para ser
considerada como un riesgo casual.
La consideracin del tamao del efecto es una cuestin
completamente diferente. No se refiere a la probabilidad, sino ms
bien, qu tan lejos de la media de la poblacin se ha impulsado
nuestra media de la muestra como resultado de una proporcin ms
baja?
De acuerdo con la Figura 6.8, la media de la muestra ha sido empujada
muy lejos en la cola derecha de la distribucin de muestreo como
resultado de tener un valor ms alto que la poblacin - una distancia
de aproximadamente 2 y 11/100 desviaciones estndar!
Significado prctico: tamao del efecto

Parautilizar la prueba Z, debe conocer los


parmetros de poblacin y las estadsticas de
muestra. Esto a menudo no es posible ya que se
sabe poco sobre la poblacin. En nuestro
ejemplo, asumimos que tenamos informacin
sobre la poblacin (media y desviacin estndar)
de todos los estudiantes de AP en el conjunto
poblacional de universidades regionales. No
tenamos datos sobre todas las escuelas en los
Estados Unidos, as que nuestra definicin de la
poblacin estaba restringida.
Problema 1
Segn un informe del Ministerio de Salud, en hospitales de corta estancia del gobierno
central (fiscales), la duracin media de la estada es de unos 4,8 das. La desviacin
estndar de la poblacin no est clara para la poblacin de estas instalaciones, pero
podemos utilizar el valor hipottico de 2.00. Un investigador propone comparar una
pequea muestra de hospitales locales/municipales con esta informacin general de la
poblacin, a pesar de que la descripcin del investigador de la muestra es nebulosa.
Aqu estn los datos del investigador:
1. El nmero das en el que la poblacin pasa en el hospital: = 4.8.
2. La desviacin estndar de la poblacin (X) de las estancias hospitalarias es de 2,00
(valor hipottico).
3. La duracin media de estancia para el conjunto de muestras de hospitales municipales
es de (N = 30): M = 5,60.
4. La desviacin estndar de las estancias en los hospitales de muestra (DE) = 2,80.
Utilizando esta informacin, realice una prueba Z para determinar si la duracin de la
estancia entre los pacientes en la muestra de hospitales municipales es representativa de
la duracin de la estancia entre los pacientes de la poblacin de hospitales fiscales.
Problema 1

Responda a las siguientes preguntas:


1. Cul es el error estndar de la media?
2. Calcule el valor Z
3. Realizar la prueba de hiptesis.
4. Interpretar los anlisis.
5. Discutir el tamao del efecto.
Problema 1

1.Respuesta: El error estndar de la media es


0.365. sta es la desviacin estndar de la
distribucin muestral de los medios:
Problema 1

2.Respuesta: El valor Z es 2.19. Esto representa el


nmero de desviaciones estndar de la media de
la muestra, se elimina de la media de la
poblacin en la distribucin muestral de las
medias.
Problema 1
3. Respuesta: La hiptesis nula (H0): 1 =
O sea que la media de muestra municipal tiene la misma media que la media de los
hospitales fiscales.
La hiptesis alternativa (HA): 1
O sea que la media de muestra municipal NO tiene la misma media que la media de los
hospitales fiscales.
El valor crtico: 1,96 valores z (rea de exclusin del 5%) Recuerde que si una relacin Z
calculada cae dentro del rea de exclusin del 5% (el 2,5% en cada cola) de una
distribucin normal estndar, entonces sera poco probable que ocurriera.
La relacin Z calculada = 2,19. El valor Z calculado se sita en el lado derecho de la
distribucin en el 5% del rea de exclusin.
Decisin estadstica: rechazar la hiptesis nula
El valor Z calculado cay en la regin de exclusin del 5%, indicando que la probabilidad
de que la longitud de la muestra de estancia sea tan grande por casualidad es menor
que 0,05 (p <0,05). Dado que rechazamos la hiptesis nula, suponemos que los hospitales
de muestra son diferentes de la poblacin de los hospitales.
Problema 1
4. Respuesta: Interpretacin
Sobre la base de una prueba Z (Z = 2,19, p <0,05), existen
diferencias estadsticamente significativas entre una muestra de
hospitales regionalmente distintos (N = 30) y la poblacin de
hospitales corta estancia (fiscales) en trminos de la duracin
de la estancia . Los hospitales locales reportan estadas
hospitalarias significativamente ms prolongadas (M = 5,60 das)
que la poblacin (M = 4,80 das).
5. Discutir el tamao del efecto.
Se rechaz la hiptesis nula con un valor Z de 2,19, lo que
sugiere que la media de los hospitales regionales fue superior a
dos desviaciones estndar ms all de la media de los
hospitales de poblacin.

Вам также может понравиться