Вы находитесь на странице: 1из 27

Static Calculator

Men principal

Statistics Calculator es un programa fcil de usar diseado para realizar una serie de
procedimientos estadsticos bsicos relacionados con distribuciones y probabilidades. La mayora
de los procedimientos se llaman inferenciales porque los datos de una muestra se utilizan para
inferir a una poblacin.

La barra de men de Statistic Calculator contiene ocho opciones. Estos representan los tipos
bsicos de operaciones que pueden ser realizadas por el software.

Distribuciones de salida Cuentas Porcentajes Medios de correlacin Muestreo Ayuda

El elemento de men Salir se utiliza para salir del software.

El elemento de men Distribuciones es el equivalente electrnico de las tablas de probabilidad.


Los algoritmos se incluyen para las distribuciones z, t, F y chi-cuadrado. Esta seleccin puede
usarse para encontrar probabilidades y valores crticos para las cuatro estadsticas.

La opcin de men Counts contiene rutinas para analizar una tabla de contingencia de conteos,
calcular la probabilidad exacta de Fisher para tablas de dos por dos, utilizar la distribucin
binomial para predecir la probabilidad de un resultado especificado y la distribucin de poisson
para probar la probabilidad de observar una Nmero de eventos especificado.

El parmetro Percentes se utiliza para comparar dos porcentajes. Se incluyen algoritmos para
comparar proporciones extradas de una o dos muestras. Tambin hay una opcin de men para
calcular intervalos de confianza alrededor de un porcentaje.

El elemento de men Medios se utiliza para calcular la media y la desviacin estndar de una
muestra, comparar dos medias entre s, calcular un intervalo de confianza en torno a una media,
comparar una media de muestra con una media de poblacin, comparar dos desviaciones
estndar entre s y Comparar tres o ms desviaciones estndar.

El elemento de men Correlacin se utiliza para calcular la correlacin y las estadsticas de


regresin lineal simple para los datos emparejados. Los algoritmos se incluyen para los datos
ordinales y de intervalo.

El elemento de men Muestreo se utiliza para determinar el tamao de muestra requerido para
un estudio. El software puede utilizarse para problemas que impliquen porcentajes y medios.

El elemento de men Ayuda se utiliza para obtener esta ayuda en lnea.


Interfaz de usuario

Calculadora de estadsticas tiene un "rellenar el formulario" interfaz de usuario. Despus de


seleccionar un tipo particular de prueba de significacin en el men, se mostrar un formulario.
Rellene el formulario y presione el botn Calcular para calcular la respuesta.

Al presionar el botn Salir de un formulario se cerrar el formulario y se borrarn los datos.

Se proporciona ayuda en lnea para todas las selecciones de men. La ayuda en lnea describe la
aplicacin de cada procedimiento estadstico. Tambin se incluyen ejemplos prcticos.

Para la mayora de pruebas de significacin, el resultado se copia automticamente al


portapapeles cuando hace clic en el botn Calcular, lo que le permite realizar una operacin de
pegar en su procesador de textos. El resultado suele ser en formato APA (American Psychological
Association), por lo que puede ser pegado directamente en un documento de investigacin. El
procedimiento sera abrir primero su procesador de textos. A continuacin, ejecute la Calculadora
de estadsticas. Seleccione la prueba, rellene el formulario y haga clic en el botn Calcular. Active
su procesador de textos haciendo clic en la barra de mens de Windows. Establezca el cursor
donde desee informar la estadstica y seleccione Editar, Pegar (o presione Ctrl V). El resultado del
formato APA se insertar en el texto.

Tambin puede copiar la imagen de la pantalla en el portapapeles pulsando las teclas Alt e
Imprimir pantalla juntas.

Frmulas

Las frmulas utilizadas en la Calculadora de estadsticas pueden encontrarse en casi cualquier libro
de estadsticas. El libro de texto escrito por el autor de la calculadora de estadsticas se llama
"Estadsticas de supervivencia". Contiene todas las frmulas con ejemplos trabajados. "Survival
Statistics" est disponible para su compra en el sitio web de StatPac:
http://www.statpac.com/statistics-book

La correccin de poblacin finita se incorpora en todas las frmulas relevantes. En un escenario de


investigacin tpico la poblacin es muy grande en comparacin con la muestra y la correccin es
innecesaria. Deje el tamao de la poblacin en blanco para ignorar la correccin. Sin embargo, si el
tamao de la muestra es ms del 10% del tamao de la poblacin, se debe especificar el tamao
de la poblacin.
Conceptos bsicos

Reconocimiento y definicin de problemas

Entendemos al mundo haciendo preguntas y buscando respuestas. Nuestra construccin de la


realidad depende de la naturaleza de nuestra investigacin.

Toda investigacin comienza con una pregunta. La curiosidad intelectual suele ser el fundamento
de la investigacin acadmica. Algunas preguntas no son probables. El ejemplo filosfico clsico es
preguntar, "Cuntos ngeles pueden bailar en la cabeza de un alfiler?" Si bien la pregunta puede
suscitar revelaciones profundas y pensadas, claramente no puede probarse con un experimento
emprico. Antes de Descartes, este es precisamente el tipo de pregunta que atraera la mente de
los hombres eruditos. Sus respuestas venan de dentro. El mtodo cientfico se opone a hacer
preguntas que no pueden ser probadas empricamente. Si los ngeles no pueden ser observados o
detectados, la pregunta se considera inapropiada para la investigacin acadmica.

Definir las metas y objetivos de un proyecto de investigacin es uno de los pasos ms importantes
en el proceso de investigacin. No subestime la importancia de este paso. Objetivos claramente
establecidos mantener un proyecto de investigacin centrado. El proceso de definicin de metas
generalmente comienza escribiendo los objetivos generales y generales del estudio. A medida que
el proceso contina, los objetivos se definen ms claramente y los temas de investigacin se
estrechan.

La investigacin exploratoria (por ejemplo, revisiones de literatura, conversaciones con personas y


grupos focales) va de la mano con el proceso de aclaracin de metas. La revisin de la literatura es
especialmente importante porque evita la necesidad de reinventar la rueda para cada nueva
pregunta de investigacin. Ms importante an, da a los investigadores la oportunidad de
construir sobre el trabajo de cada uno.

La pregunta de investigacin en s puede ser declarada como una hiptesis. Una hiptesis es
simplemente la creencia del investigador sobre un problema. Normalmente, un investigador
formula una opinin durante el proceso de revisin de la literatura. El proceso de revisin del
trabajo de otro estudiante a menudo aclara las cuestiones tericas asociadas con la pregunta de
investigacin. Tambin puede ayudar a dilucidar la importancia de los temas para la comunidad de
investigacin.

La hiptesis se convierte en una hiptesis nula para hacerla comprobable porque la nica manera
de probar una hiptesis es eliminar alternativas de la hiptesis. Las tcnicas estadsticas nos
permitirn rechazar o no rechazar una hiptesis nula, pero no nos proporcionan una manera de
aceptar una hiptesis. Por lo tanto, todas las pruebas de hiptesis son indirectas.

Creacin del diseo de la investigacin

Definir un problema de investigacin proporciona un formato para una investigacin ms


profunda. Un problema bien definido apunta a un mtodo de investigacin. No hay un mejor
mtodo de investigacin para todas las situaciones. Por el contrario, hay una amplia variedad de
tcnicas para el investigador para elegir. A menudo, la seleccin de una tcnica implica una serie
de compensaciones. Por ejemplo, a menudo hay un equilibrio entre el costo y la calidad de la
informacin obtenida. Las limitaciones de tiempo a veces obligan a un trade-off con el diseo
general de la investigacin. Las restricciones presupuestarias y temporales deben considerarse
siempre como parte del proceso de diseo.

Mtodos de investigacin

Hay tres mtodos bsicos de investigacin: 1) encuesta, 2) observacin, y 3) experimento. Cada


mtodo tiene sus ventajas y desventajas.

La encuesta es el mtodo ms comn de recoleccin de informacin en las ciencias sociales.


Puede ser una entrevista cara a cara, por telfono o por correo. Una entrevista personal es uno de
los mejores mtodos de obtener informacin personal, detallada o en profundidad. Por lo general,
implica un largo cuestionario que el entrevistador llena al hacer preguntas. Permite un extenso
sondeo por parte del entrevistador y da a los encuestados la capacidad de elaborar sus respuestas.
Las entrevistas telefnicas son similares a las entrevistas cara a cara. Son ms eficientes en
trminos de tiempo y costo, sin embargo, estn limitados en la cantidad de sondeo en
profundidad que se puede lograr, y la cantidad de tiempo que se puede asignar a la entrevista.
Una encuesta por correo es generalmente el mtodo de entrevista ms rentable. El investigador
puede obtener opiniones, pero tratar de sondar las opiniones de manera significativa es muy
difcil.

La investigacin de observacin monitorea las acciones de los encuestados sin interactuar


directamente con ellos. Ha sido utilizado durante muchos aos por A.C. Nielsen para vigilar los
hbitos de televisin. Los psiclogos suelen usar espejos unidireccionales para estudiar el
comportamiento. Los antroplogos y los cientficos sociales suelen estudiar comportamientos
societales y de grupo simplemente observndolos. La forma de investigacin de observacin de
ms rpido crecimiento ha sido posible gracias a los escneres de cdigo de barras en las cajas
registradoras, donde los hbitos de compra de los consumidores ahora pueden ser
automticamente monitoreados y resumidos.

En un experimento, el investigador cambia una o ms variables a lo largo de la investigacin.


Cuando todas las dems variables se mantienen constantes (excepto la que est siendo
manipulada), los cambios en la variable dependiente pueden explicarse por el cambio en la
variable independiente. Por lo general, es muy difcil controlar todas las variables del entorno. Por
lo tanto, los experimentos se limitan generalmente a los modelos de laboratorio donde el
investigador tiene ms control sobre todas las variables.
Muestreo

Corresponde al investigador definir claramente la poblacin objetivo. No hay reglas estrictas a


seguir, y el investigador debe confiar en la lgica y el juicio. La poblacin se define de acuerdo con
los objetivos del estudio.

A veces, toda la poblacin ser lo suficientemente pequea, y el investigador puede incluir a toda
la poblacin en el estudio. Este tipo de investigacin se denomina un estudio censal porque los
datos se recogen en cada miembro de la poblacin.

Por lo general, la poblacin es demasiado grande para que el investigador intente examinar a
todos sus miembros. Se puede utilizar una muestra pequea pero cuidadosamente seleccionada
para representar a la poblacin. La muestra refleja las caractersticas de la poblacin de la que se
extrae.

Los mtodos de muestreo se clasifican como probabilidad o no probabilidad. En las muestras de


probabilidad, cada miembro de la poblacin tiene una probabilidad no cero conocida de ser
seleccionado. Los mtodos de probabilidad incluyen muestreo aleatorio, muestreo sistemtico y
muestreo estratificado. En el muestreo no probabilstico, los miembros se seleccionan de la
poblacin de alguna manera no aleatoria. Estos incluyen muestreo de conveniencia, muestreo de
juicio, muestreo de cuota y muestreo de bola de nieve. La ventaja del muestreo probabilstico es
que se puede calcular el error de muestreo. El error de muestreo es el grado en que una muestra
puede diferir de la poblacin. Al inferir a la poblacin, los resultados se reportan ms o menos el
error de muestreo. En el muestreo no probabilstico, el grado en que la muestra difiere de la
poblacin sigue siendo desconocido.

El muestreo aleatorio es la forma ms pura de muestreo probabilstico. Cada miembro de la


poblacin tiene una oportunidad igual y conocida de ser seleccionado. Cuando hay poblaciones
muy grandes, a menudo es difcil o imposible identificar a cada miembro de la poblacin, por lo
que el grupo de sujetos disponibles se vuelve sesgado.

A menudo se utiliza el muestreo sistemtico en lugar del muestreo aleatorio. Tambin se llama
una tcnica de seleccin de Nth nombre. Una vez calculado el tamao de muestra requerido, se
selecciona cada Nth registro de una lista de miembros de la poblacin. Siempre y cuando la lista
no contenga ninguna orden oculta, este mtodo de muestreo es tan bueno como el mtodo de
muestreo aleatorio. Su nica ventaja sobre la tcnica de muestreo aleatorio es la simplicidad. El
muestreo sistemtico se utiliza con frecuencia para seleccionar un nmero determinado de
registros de un archivo de computadora.

El muestreo estratificado es un mtodo de probabilidad de uso comn que es superior al


muestreo aleatorio porque reduce el error de muestreo. Un estrato es un subconjunto de la
poblacin que comparte al menos una caracterstica comn. El investigador primero identifica los
estratos relevantes y su representacin real en la poblacin. El muestreo aleatorio se utiliza
entonces para seleccionar sujetos de cada estrato hasta que el nmero de sujetos en ese estrato
sea proporcional a su frecuencia en la poblacin. El muestreo estratificado suele utilizarse cuando
uno o ms de los estratos de la poblacin tienen una incidencia baja en relacin con los otros
estratos.

El muestreo de conveniencia se utiliza en la investigacin exploratoria en la que el investigador


est interesado en obtener una aproximacin barata de la verdad. Como su nombre indica, la
muestra se selecciona porque son convenientes. Este mtodo no probabilstico se utiliza a
menudo durante los esfuerzos de investigacin preliminares para obtener una estimacin bruta de
los resultados, sin incurrir en el costo o el tiempo necesario para seleccionar una muestra
aleatoria.

El muestreo por juicio es un mtodo comn no probabilstico. El investigador selecciona la


muestra basada en el juicio. Esto es generalmente y la extensin del muestreo de conveniencia.
Por ejemplo, un investigador puede decidir extraer toda la muestra de una ciudad
"representativa", aunque la poblacin incluya todas las ciudades. Cuando se utiliza este mtodo, el
investigador debe estar seguro de que la muestra elegida es verdaderamente representativa de
toda la poblacin.

El muestreo de cuotas es el equivalente no probabilstico del muestreo estratificado. Al igual que


el muestreo estratificado, el investigador identifica primero los estratos y sus proporciones tal
como estn representados en la poblacin. A continuacin, se utiliza el muestreo de conveniencia
o juicio para seleccionar el nmero requerido de sujetos de cada estrato. Esto difiere del muestreo
estratificado, donde los estratos se rellenan mediante muestreo aleatorio.

El muestreo de bola de nieve es un mtodo especial no probabilstico utilizado cuando la


caracterstica de muestra deseada es rara. Puede ser extremadamente difcil o costoso prohibir
localizar a los encuestados en estas situaciones. El muestreo de bolas de nieve depende de
referencias de sujetos iniciales para generar temas adicionales. Si bien esta tcnica puede reducir
drsticamente los costos de bsqueda, se produce a expensas de la introduccin de sesgo porque
la tcnica en s reduce la probabilidad de que la muestra represente una buena seccin transversal
de la poblacin.

Recopilacin de datos

Hay muy pocas reglas duras y rpidas para definir la tarea de recoleccin de datos. Cada proyecto
de investigacin utiliza una tcnica de recoleccin de datos adecuada a la metodologa de
investigacin en particular. Los dos objetivos principales para los estudios cuantitativos y
cualitativos son maximizar la respuesta y maximizar la precisin.

Cuando se utiliza un servicio externo de recoleccin de datos, los investigadores a menudo validan
el proceso de recopilacin de datos ponindose en contacto con un porcentaje de los encuestados
para verificar que realmente fueron entrevistados. La edicin y limpieza de datos implica el
proceso de detectar errores inadvertidos en los datos. Esto suele implicar el uso de una
computadora para buscar datos fuera de los lmites.
Los estudios cuantitativos emplean lgica deductiva, donde el investigador comienza con una
hiptesis, y luego recopila datos para confirmar o refutar la hiptesis. Los estudios cualitativos
utilizan la lgica inductiva, donde el investigador primero disea un estudio y luego desarrolla una
hiptesis o teora para explicar los resultados del anlisis.

El anlisis cuantitativo es generalmente rpido y barato. Una amplia variedad de tcnicas


estadsticas estn disponibles para el investigador. El software de computadora est fcilmente
disponible para proporcionar el anlisis multivariado bsico y avanzado. El investigador
simplemente sigue el proceso de anlisis preestablecido, sin tomar decisiones subjetivas sobre los
datos. Por esta razn, los estudios cuantitativos son generalmente ms fciles de ejecutar que los
estudios cualitativos.

Los estudios cualitativos casi siempre implican entrevistas en persona, por lo que son muy
laboriosos y costosos. Dependen en gran medida de la capacidad de un investigador para excluir
sesgos personales. La interpretacin de los datos cualitativos suele ser altamente subjetiva, y
diferentes investigadores pueden llegar a conclusiones diferentes de los mismos datos. Sin
embargo, el objetivo de la investigacin cualitativa es desarrollar una hiptesis - no probar uno.
Los estudios cualitativos tienen mrito en el sentido de que proporcionan amplias teoras
generales que pueden ser examinadas en futuras investigaciones.

Reporte de los resultados

La consideracin ms importante en la preparacin de cualquier informe de investigacin es la


naturaleza de la audiencia. El propsito es comunicar la informacin y, por lo tanto, el informe
debe prepararse especficamente para los lectores del informe. A veces el formato para el informe
se definir para el investigador (por ejemplo, una tesis o tesis), mientras que otras veces, el
investigador tendr plena latitud con respecto a la estructura del informe. Como mnimo, el
informe debe contener un resumen, una declaracin de problemas, una seccin de mtodos, una
seccin de resultados, una discusin de los resultados y una lista de referencias.

Validez

Validez se refiere a la exactitud o veracidad de una medicin. Estamos midiendo lo que creemos
que somos? Este es un concepto simple, pero en realidad, es extremadamente difcil determinar si
una medida es vlida.

La validez facial se basa nicamente en el juicio del investigador. Cada pregunta es examinada y
modificada hasta que el investigador est convencido de que es una medida exacta de la
construccin deseada. La determinacin de la validez de la cara se basa en la opinin subjetiva del
investigador.

La validez de contenido es similar a la validez de cara en que se basa en el juicio del investigador.
Sin embargo, cuando la validez de cara slo evala los tems individuales en un instrumento, la
validez de contenido va ms all en que intenta determinar si un instrumento proporciona la
cobertura adecuada de un tema. Las opiniones de expertos, las bsquedas de literatura y las
preguntas de pretest abiertas ayudan a establecer la validez del contenido.

La validez relacionada con el criterio puede ser predictiva o concurrente. Cuando se ha establecido
una relacin dependiente / independiente entre dos o ms variables, se puede evaluar la validez
de criterio. Se desarrolla un modelo matemtico para poder predecir la variable dependiente de la
(s) variable (s) independiente (es). La validez predictiva se refiere a la capacidad de una variable
independiente (o grupo de variables) para predecir un valor futuro de la variable dependiente. La
validez concurrente se refiere a la relacin entre dos o ms variables en el mismo punto en el
tiempo.

La validez constructiva se refiere a los fundamentos tericos subyacentes a una escala o medida
particular. Examina las teoras o construcciones subyacentes que explican un fenmeno. Esto
tambin es bastante subjetivo y depende en gran medida de la comprensin, opiniones y sesgos
del investigador.

Confiabilidad

La fiabilidad es sinnimo de repetibilidad. Se dice que una medicin que produce resultados
consistentes en el tiempo es confiable. Cuando una medida es propensa a errores aleatorios,
carece de fiabilidad. La fiabilidad de un instrumento pone un lmite superior en su validez. Una
medida que carezca de confiabilidad ser necesariamente invlida. Existen tres mtodos bsicos
para probar la fiabilidad: test-retest, forma equivalente y consistencia interna.

Se puede obtener una medida de fiabilidad de test-retest administrando el mismo instrumento al


mismo grupo de personas en dos momentos diferentes. El grado en el que ambas
administraciones estn de acuerdo es una medida de la fiabilidad del instrumento. Esta tcnica
para evaluar la fiabilidad sufre dos inconvenientes posibles. Primero, una persona puede haber
cambiado entre la primera y segunda medicin. En segundo lugar, la administracin inicial de un
instrumento podra por s misma inducir a una persona a responder de manera diferente en la
segunda administracin.

El segundo mtodo para determinar la fiabilidad se denomina tcnica de forma equivalente. El


investigador crea dos instrumentos diferentes diseados para medir construcciones idnticas. El
grado de correlacin entre los instrumentos es una medida de la fiabilidad de la forma
equivalente. La dificultad en el uso de este mtodo es que puede ser muy difcil (y / o
prohibitivamente costoso) para crear un instrumento totalmente equivalente.
Los mtodos ms populares de estimar la fiabilidad utilizan medidas de consistencia interna.
Cuando un instrumento incluye una serie de preguntas diseadas para examinar el mismo
constructo, las preguntas pueden dividirse arbitrariamente en dos grupos. La correlacin entre los
dos subconjuntos de preguntas se llama confiabilidad de la mitad dividida. El problema es que esta
medida de fiabilidad cambia dependiendo de cmo se dividen las preguntas. Una mejor
estadstica, conocida como alfa de Cronbach, se basa en la media (valor absoluto) correlacin de
intermedio para todos los posibles pares de variables. Proporciona una estimacin conservadora
de la fiabilidad, y generalmente representa el lmite inferior a la fiabilidad de una escala de
elementos. Para los datos nominales dicotmicos, se usa el KR-20 (Kuder-Richardson) en lugar del
alfa de Cronbach.

Error sistemtico y aleatorio

La mayor parte de la investigacin es un intento de entender y explicar la variabilidad. Cuando una


medicin carece de variabilidad, no se pueden realizar (o necesitar) pruebas estadsticas. La
variabilidad se refiere a la dispersin de las puntuaciones.

Idealmente, cuando un investigador encuentra diferencias entre los encuestados, se deben a una
verdadera diferencia en la variable que se mide. Sin embargo, la combinacin de errores
sistemticos y aleatorios puede diluir la precisin de una medida. El error sistemtico se introduce
a travs de un sesgo constante en una medicin. Por lo general, puede atribuirse a una falla en el
procedimiento de muestreo o en el diseo de un cuestionario. El error aleatorio no ocurre en
ningn patrn constante, y no es controlable por el investigador.

Formulacin de hiptesis a partir de preguntas de investigacin

Hay bsicamente dos tipos de preguntas de investigacin: comprobables y no comprobables.


Ninguno es mejor que el otro, y ambos tienen un lugar en la investigacin aplicada.

Ejemplos de preguntas no probables son:

Cmo se sienten los gerentes con respecto a la reorganizacin?

Qu es lo que los residentes sienten son los problemas ms importantes que enfrenta la
comunidad?

Las respuestas de los encuestados a estas preguntas podran resumirse en cuadros descriptivos y
los resultados podran ser sumamente valiosos para los administradores y planificadores. Los
investigadores de las empresas y las ciencias sociales a menudo hacen preguntas de investigacin
no comprobables. La deficiencia con este tipo de preguntas es que no proporcionan puntos de
corte objetivos para los tomadores de decisiones.
Con el fin de superar este problema, los investigadores a menudo buscan responder a una o ms
preguntas de investigacin comprobables. Casi todas las preguntas de investigacin comprobables
comienzan con una de las dos frases siguientes:

Hay una diferencia significativa entre ...?

Existe una relacin significativa entre ...?

Por ejemplo:

Existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin?

Existe una diferencia significativa entre los residentes blancos y los minoritarios con respecto a lo
que ellos sienten que son los problemas ms importantes que enfrenta la comunidad?

Una hiptesis de investigacin es una declaracin de opinin comprobable. Se crea a partir de la


pregunta de investigacin reemplazando las palabras "Hay" con las palabras "Hay", y tambin
reemplazar el signo de interrogacin por un punto. Las hiptesis para las dos preguntas de
investigacin de la muestra seran:

Existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin.

Hay una diferencia significativa entre los residentes blancos y minoritarios con respecto a lo que
ellos sienten son los problemas ms importantes que enfrenta la comunidad.

No es posible probar una hiptesis directamente. En su lugar, debe convertir la hiptesis en una
hiptesis nula. La hiptesis nula se crea a partir de la hiptesis aadiendo las palabras "no" o "no"
a la declaracin. Por ejemplo, las hiptesis nulas para los dos ejemplos seran:

No existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin.

No hay una diferencia significativa entre los residentes blancos y los minoritarios con respecto a lo
que ellos sienten son los problemas ms importantes que enfrenta la comunidad.

Todas las pruebas estadsticas se realizan sobre la hiptesis nula ... nunca la hiptesis. El resultado
de una prueba estadstica le permitir: 1) rechazar la hiptesis nula o 2) rechazar la hiptesis nula.
Nunca use las palabras "aceptar la hiptesis nula".

Errores de Tipo I y Tipo II

Hay dos tipos de errores de prueba de hiptesis. El primero se denomina error Tipo I. Este es un
error muy grave en el que rechaza errneamente la hiptesis nula. Supongamos que la hiptesis
nula es: Las administraciones diarias del frmaco ABC no ayudarn a los pacientes. Tambin
suponga que la droga ABC es realmente una droga muy mala y causa dao cerebral permanente a
personas mayores de 60 aos. En su investigacin, usted pide voluntarios, y toda la muestra es
menor de 60 aos de edad. La muestra parece mejorar y usted rechaza la hiptesis nula. Podra
haber consecuencias muy graves si usted comercializara este medicamento (basado en su
muestra). Los errores de tipo I suelen ser causados por problemas de muestreo.

Un error de tipo II es menos grave, en el que equivocadamente no se rechaza la hiptesis nula.


Supongamos que la droga ABC realmente no es daina y realmente ayuda a muchos pacientes,
pero varios de sus voluntarios desarrollan sntomas psicosomticos severos y persistentes. Es
probable que no comercializar el medicamento debido a la posibilidad de efectos secundarios de
larga duracin. Por lo general, las consecuencias de un error Tipo II sern menos graves que un
error Tipo I.

Tipos de datos

Uno de los conceptos ms importantes en las pruebas estadsticas es comprender los cuatro tipos
bsicos de datos: nominal, ordinal, intervalo y relacin. Los tipos de pruebas estadsticas que se
pueden realizar dependen del tipo de datos que tenga. Diferentes pruebas estadsticas se utilizan
para diferentes tipos de datos.

Los datos nominales y ordinales son no paramtricos (no continuos o categricos). Las escalas de
intervalo y de relacin se llaman paramtricas (continuas). Algunas pruebas estadsticas se llaman
pruebas paramtricas porque utilizan datos paramtricos. Otros se llaman pruebas no
paramtricas porque utilizan datos no paramtricos. Todas las pruebas estadsticas estn
diseadas para usarse con un tipo especfico de datos, y slo pueden realizarse cuando se dispone
de ese tipo de datos.

Ms:

Datos nominales

Los datos nominales se caracterizan por categoras de respuesta no ordenadas.

Ejemplos de datos nominales

Cul es tu sexo?

____ Hombre ____ Mujer

En qu programa ests?

___ Administracin / Gestin

___ Servicios de salud

___ Educacin

___ Servicios Humanos


Tienes seguro mdico?

___ S ___ No ___ No lo s

A qu escuela asisti?

___ Park Elementary

___ Lado oeste

___ Otro

Qu se debe hacer con el programa?

___ Cierre

___ Buscar fondos del gobierno

___ Realizar una recaudacin de fondos privados

___ Otro

En qu estado Vives? _________________________

Nota: Esta pregunta se llama una pregunta abierta porque requiere una respuesta literal. Aunque
las categoras (es decir, los estados) no se enumeran, la pregunta todava se considera nominal
porque los datos se pueden categorizar despus de que se recoja.

Cul de las siguientes carnes has comido en la ltima semana? (Marque todo lo que corresponda)

___ Hamburguesa ___ Tostada ___ Hgado

___ Perritos calientes ___ Bacon ___ Filete

___ Porkchops ___ Salchichas ___ Otro

Nota: Esta pregunta se llama un elemento de respuesta mltiple porque los encuestados pueden
comprobar ms de una categora. La respuesta mltiple simplemente significa que un encuestado
puede hacer ms de una respuesta a la misma pregunta. Los datos siguen siendo nominales
porque las respuestas son categoras no ordenadas.

Cules son los dos asuntos ms importantes que enfrenta nuestro pas hoy?

________________________ y ________________________

Nota: Esta pregunta es un elemento de respuesta mltiple abierto, ya que requiere dos respuestas
verbatim. Todava se considera datos nominales porque los problemas podran ser categorizados
despus de que se recolecten los datos.
Datos ordinales

Los datos ordinales se caracterizan por categoras de respuesta no ordenadas.

Ejemplos de datos ordinales

Cual es tu nivel ms alto de educacin?

___ La escuela primaria

___ Algn instituto

___ Graduado de preparatoria

___ Alguna educacin superior

___ Graduado de la Universidad

___ Grado avanzado

Cuntas cervezas has bebido en la ltima semana?

___ Ninguno ___ Uno a cinco ___ Seis a diez ___ Ms de diez

Cmo calificara su progreso?

___ Excelente

___ Bueno

___ Justa

___ Pobre

Cul ha sido la tendencia en su negocio durante el ltimo ao?

___ Decreciente ___ Estable ___ Aumentando

Por favor califique la calidad de esta conferencia?

___ Bajo medio alto

Utilice un crculo para indicar su nivel de acuerdo o desacuerdo con la siguiente declaracin: El
aborto debe ser una decisin entre una mujer y su mdico.

Fuertemente fuerte

De acuerdo De acuerdo Neutral En desacuerdo En desacuerdo

12345
Cul es su ingreso familiar anual?

___ Menos de $ 12,000

___ $ 12,000 a $ 23,999

___ $ 24,000 a $ 49,999

___ $ 50.000 a $ 74.999

___ $ 75,000 o ms

Datos de intervalo y de relacin

Los datos de intervalo y de relacin son tales que cada intervalo numrico representa una unidad
de medida. Las escalas de proporcin tambin tienen la propiedad de un "punto cero" absoluto.
Las preguntas de intervalo y escala de escala son preferibles en diseo de investigacin porque
ofrecen la mayor versatilidad en los tipos de anlisis que se pueden realizar.

Ejemplos de datos de intervalo y de relacin

Cual es tu edad? Unesdoc.unesco.org unesdoc.unesco.org

Cuntos hijos tiene? ________

Cul fue su puntaje SAT? ________

Cuntos aos de escuela has completado? Unesdoc.unesco.org unesdoc.unesco.org

Qu porcentaje de su tiempo de trabajo gasta ...? Unesdoc.unesco.org


unesdoc.unesco.orgCuntas sesiones de negociacin colectiva ha participado personalmente?
______

Cul es el tamao promedio de la clase en su escuela? ________

Cul fue el ingreso de su familia el ao pasado? _________

Cuntas unidades ha completado? (Crculo) 0 1 2 3

Cul fue su GPA como estudiante de pregrado? Unesdoc.unesco.org unesdoc.unesco.org

Cuntas veces has sido arrestado? Unesdoc.unesco.org unesdoc.unesco.org


Significado

Qu significa significado realmente?

Muchos investigadores se emocionan mucho cuando han descubierto un hallazgo "significativo",


sin realmente entender lo que significa. Cuando una estadstica es significativa, significa que est
muy seguro de que la estadstica es confiable. No significa que el hallazgo sea importante.

Por ejemplo, supongamos que damos a 1.000 personas un test de CI y le preguntamos si hay una
diferencia significativa entre las puntuaciones de hombres y mujeres. La puntuacin media para
los varones es 98 y la puntuacin media para las mujeres es de 100. Utilizamos una prueba t de
grupos independientes y encontramos que la diferencia es significativa al nivel de .001. La gran
pregunta es, "Y qu?". La diferencia entre 98 y 100 en una prueba de CI es una diferencia muy
pequea ... tan pequea, de hecho, que ni siquiera es importante.

Entonces por qu la estadstica t sali significativa? Porque haba un gran tamao de muestra.
Cuando se tiene un tamao de muestra grande, se detectarn diferencias muy pequeas como
significativas. Esto significa que usted est muy seguro de que la diferencia es real (es decir, no
ocurri por casualidad). No significa que la diferencia sea grande o importante. Si slo hubiramos
dado el test de CI a 10 personas en lugar de 1.000, la diferencia de dos puntos entre hombres y
mujeres no habra sido significativa.

La significancia es un trmino estadstico que indica cun seguro es que existe una diferencia o
relacin. Decir que una diferencia o relacin significativa existe slo dice la mitad de la historia.
Podemos estar muy seguros de que existe una relacin, pero es una relacin fuerte, moderada o
dbil? Despus de encontrar una relacin significativa, es importante evaluar su fuerza. Las
relaciones significativas pueden ser fuertes o dbiles. Las diferencias significativas pueden ser
grandes o pequeas. Slo depende del tamao de la muestra

Pruebas de una cola y dos colas

Un concepto importante en las pruebas de significacin es si se utiliza una prueba de una cola o de
dos colas de significacin. La respuesta es que depende de su hiptesis. Cuando su hiptesis de
investigacin indica (o implica) la direccin de la diferencia o relacin, entonces se utiliza una
probabilidad de una cola. Por ejemplo, una prueba de una cola se utilizara para probar estas
hiptesis nulas: Las mujeres no puntuacin significativamente mayor que los hombres en un test
de coeficiente intelectual. Trabajadores de cuello azul no tendrn una educacin
significativamente menor que los trabajadores de cuello blanco. Superman no es
significativamente ms fuerte que la persona promedio. En cada caso, la hiptesis nula
(indirectamente) predice la direccin de la diferencia esperada. Se utilizar una prueba de dos
colas para probar estas hiptesis nulas: No habr diferencia significativa en las puntuaciones de CI
entre hombres y mujeres. No habr diferencia significativa entre los trabajadores de cuello azul y
de cuello blanco. No hay diferencia significativa en la fuerza entre Superman y la persona
promedio.

Calculadora de estadsticas siempre informa la probabilidad de dos colas. Una probabilidad de una
cola es exactamente la mitad del valor de una probabilidad de dos colas. Por lo tanto, si usted
tiene una pregunta de una cola de investigacin, debe dividir la probabilidad dada por la
calculadora de estadsticas por dos.

Hay una controversia furiosa (durante los ltimos cien aos) sobre si es o no es apropiado usar una
prueba de una cola. La razn es que si ya sabes la direccin de la diferencia, por qu molestarse
en hacer cualquier prueba estadstica. La apuesta ms segura es declarar siempre sus hiptesis de
modo que las pruebas de dos colas sean apropiadas.

Procedimiento para pruebas de significacin

Siempre que realizamos una prueba de significacin, se trata de comparar un valor de prueba que
hemos calculado a algn valor crtico para la estadstica. No importa qu tipo de estadstica
estamos calculando (por ejemplo, un estadstico t, un estadstico de chi-cuadrado, una estadstica
F, etc.), el procedimiento para probar la significacin es el mismo.

1. Decida el nivel alfa crtico que usar (es decir, la tasa de error que est dispuesto a aceptar).

2. Realizar la investigacin.

3. Calcular la estadstica.

4. Comparar la estadstica con un valor crtico obtenido de una tabla o comparar la probabilidad
del estadstico con el nivel alfa crtico.

Si su estadstica es mayor que el valor crtico de la tabla o la probabilidad de la estadstica es


menor que el nivel crtico de alfa:

Su hallazgo es significativo.

Usted rechaza la hiptesis nula.

La probabilidad es pequea de que la diferencia o relacin ocurri

Por casualidad, yp es menor que el nivel alfa crtico (p <R).

Si su estadstica es menor que el valor crtico de la tabla o la probabilidad de la estadstica es


mayor que el nivel alfa crtico:

Su hallazgo no es significativo.

No puedes rechazar la hiptesis nula.

La probabilidad es alta de que la diferencia o relacin ocurri


Por casualidad, y p es mayor que el nivel alfa crtico (p> R).

El software de computadora moderno puede calcular probabilidades exactas para la mayora de


las estadsticas de la prueba. Cuando la Calculadora de Estadsticas (u otro software) le da una
probabilidad exacta, simplemente comprela con su nivel alfa crtico. Si la probabilidad exacta es
menor que el nivel alfa crtico, su hallazgo es significativo, y si la probabilidad exacta es mayor que
su nivel alfa crtico, su hallazgo no es significativo. El uso de una tabla no es necesario cuando se
tiene la probabilidad exacta de una estadstica.

Teorema de Bonferroni

El teorema de Bonferroni indica que a medida que se realiza un nmero creciente de pruebas
estadsticas, tambin aumenta la probabilidad de obtener un hallazgo significativo errneo (error
de tipo I). As, a medida que realizamos ms y ms pruebas estadsticas, cada vez es ms probable
que rechacemos falsamente una hiptesis nula (muy mala).

Por ejemplo, supongamos que nuestro nivel alfa crtico es .05. Si realizamos una prueba
estadstica, nuestra probabilidad de hacer una declaracin falsa es .05. Si tuviramos que realizar
100 pruebas estadsticas, e hicimos una declaracin sobre el resultado de cada prueba,
esperaramos que cinco de ellas estuvieran equivocadas (solo por casualidad). Esta es una
situacin bastante indeseable para los cientficos sociales.

El teorema de Bonferroni indica que necesitamos ajustar el nivel alfa crtico para compensar el
hecho de que estamos haciendo ms de una prueba. Para realizar el ajuste, tome el nivel alfa
crtico deseado (por ejemplo, .05) y divida el nmero de pruebas que se estn realizando, y use el
resultado como el nivel alfa crtico. Por ejemplo, supongamos que tuvimos una prueba con ocho
escalas, y planeamos comparar machos y hembras en cada una de las escalas usando una prueba t
de grupos independientes. Usaremos .00625 (.05 / 8) como el nivel alfa crtico para las ocho
pruebas.

El teorema de Bonferroni debe aplicarse cuando se realizan dos o ms pruebas que son del mismo
"tipo" y la misma "familia". El mismo "tipo" significa el mismo tipo de prueba estadstica. Por
ejemplo, si usted iba a hacer una prueba t, un ANOVA y una regresin, no hara el ajuste porque
las pruebas son todas diferentes. La misma "familia" es un concepto ms elusivo, y no hay reglas
duras y rpidas. "Familia" se refiere a una serie de pruebas estadsticas todas diseadas para
probar las mismas construcciones tericas (o muy estrechamente relacionadas). La conclusin es
que depende del investigador individual decidir qu constituye una "familia".

Algunas cosas son ms obvias que otras, por ejemplo, si realizas pruebas t que comparan a
hombres y mujeres con una serie de tems del cuestionario que forman parte de la misma escala,
probablemente aplicaras el ajuste dividiendo tu nivel alfa crtico Por el nmero de elementos de
la escala (es decir, el nmero de pruebas t que realiz en esa escala). Las probabilidades de las
pruebas se denominaran las tasas de error de la familia. Sin embargo, supongamos que usted
tiene una serie de preguntas independientes, cada una centrndose en una construccin
diferente, y desea comparar a los hombres y las mujeres sobre la forma en que respondieron a
cada pregunta. Aqu es donde toda la idea del ajuste de Bonferroni se hace filosfica. Si usted
afirma que cada prueba t que realiza es una prueba de una "mini" hiptesis nica, entonces usted
no usara el ajuste, porque ha definido cada pregunta como una "familia" diferente. En este caso,
la probabilidad se llamara una tasa de error de declaracin. Otro investigador podra llamar a todo
el cuestionario una "familia", y ella dividira el alfa crtico por el nmero total de tems del
cuestionario.

Por qu parar all? Desde la perspectiva de un estadstico, la situacin se vuelve an ms


compleja. Puesto que estn personalmente en el "negocio de las estadsticas", qu deberan
llamar una "familia"? Cuando un estadstico hace una prueba t para un cliente, tal vez debera
estar dividiendo el alfa crtico por el nmero total de pruebas t que ha hecho en su vida, ya que es
una manera de ver a su "familia". Por supuesto, esto resultara en un ajuste diferente para cada
estadstico - un interesante dilema.

En el mundo real, la mayora de los investigadores no utilizan el ajuste de Bonferroni porque rara
vez podran rechazar una hiptesis nula. Estaran tan preocupados por la posibilidad de hacer una
declaracin falsa, que pasaran por alto muchas diferencias y relaciones que realmente existen. La
"directiva principal" para la investigacin en ciencias sociales es descubrir las relaciones. Se podra
argumentar que es mejor arriesgarse a hacer algunas declaraciones errneas, que pasar por alto
las relaciones o diferencias que son claras o prominentes, pero no cumplen con el nivel crtico de
significacin alfa despus de aplicar el ajuste de Bonferroni.

Tendencia central

Las medidas ms conocidas de tendencia central son la media y la mediana. La media media se
obtiene sumando los valores para todos los casos y dividindolos por el nmero de casos. Por
ejemplo, para encontrar la edad media de todos tus amigos, agrega todas sus edades juntas y
divide por el nmero de amigos. El promedio medio puede presentar una imagen distorsionada de
tendencia central si la muestra est sesgada de alguna manera.

Por ejemplo, digamos que cinco personas toman una prueba. Las puntuaciones son 10, 12, 14, 18
y 94. (La ltima persona es un genio.) La media sera la suma de las puntuaciones 10 + 12 + 14 + 18
+ 94 dividida por 5. En este ejemplo, un Media de 29,6 no es una buena medida de lo bien que la
gente hizo en la prueba en general. Al analizar los datos, tenga cuidado de usar slo el promedio
cuando la muestra tiene unas puntuaciones muy altas o muy bajas. Estas puntuaciones tienden a
sesgar la forma de la distribucin y distorsionan la media.

Cuando se ha muestreado de la poblacin, la media de la muestra es tambin su mejor estimacin


de la media de la poblacin. La media real de la poblacin es desconocida, pero la media de la
muestra es una estimacin tan buena como podemos obtener.

La mediana proporciona una medida de tendencia central tal que la mitad de la muestra estar
por encima de ella y la mitad de la muestra estar por debajo de ella. Para distribuciones sesgadas
esto es una mejor medida de la tendencia central. En el ejemplo anterior, 14 sera la mediana para
la muestra de cinco personas. Si no hay un valor medio (es decir, hay un nmero par de puntos de
datos), la mediana es el valor a medio camino entre los dos valores medios.

La distribucin de muchas variables sigue a la de una curva en forma de campana. Esto se llama
una "distribucin normal". Se debe asumir que los datos son aproximadamente distribuidos
normalmente para que muchos anlisis estadsticos sean vlidos. Cuando una distribucin es
normal, la media y la mediana sern iguales entre s. Si no son iguales, la distribucin se
distorsiona de alguna manera.

Variabilidad

La variabilidad es sinnimo de diversidad. Cuanta ms diversidad haya en un conjunto de datos,


mayor ser la variabilidad. Una medida simple de la diversidad es el rango (valor mximo menos el
valor mnimo). El rango generalmente no es una buena medida de la variabilidad porque puede ser
severamente afectado por un solo valor muy bajo o alto en los datos. Un mejor mtodo para
describir la cantidad de variabilidad es hablar de la dispersin de las puntuaciones lejos de la
media.

La varianza y la desviacin estndar son estadsticas tiles que miden la dispersin de


puntuaciones alrededor de la media. La desviacin estndar es simplemente la raz cuadrada de la
varianza. Ambas estadsticas miden la cantidad de diversidad en los datos. Cuanto ms altas sean
las estadsticas, mayor ser la diversidad. En promedio, el 68 por ciento de todas las puntuaciones
en una muestra estar dentro de ms o menos una desviacin estndar de la media y el 95 por
ciento de todas las puntuaciones estarn dentro de dos desviaciones estndar de la media.

Hay dos frmulas para la varianza y la desviacin estndar de una muestra. Un conjunto de
frmulas calcula la varianza exacta y la desviacin estndar de la muestra. Las estadsticas se
llaman sesgadas, porque estn sesgadas a la muestra. Son la varianza exacta y la desviacin
estndar de la muestra, pero tienden a subestimar la varianza y la desviacin estndar de la
poblacin.

En general, nos preocupa ms describir la poblacin que la muestra. Nuestra intencin es usar la
muestra para describir a la poblacin. Las estimaciones no sesgadas deben utilizarse cuando el
muestreo de la poblacin y la inferencia de nuevo a la poblacin. Proporcionan la mejor
estimacin de la varianza y la desviacin estndar de la poblacin.

Error estandar de la media

El error estndar de la media se utiliza para estimar el rango dentro del cual esperamos que la
media caiga en muestras repetidas tomadas de la poblacin (es decir, intervalos de confianza). El
error estndar de la media es una estimacin de la desviacin estndar de las muestras repetidas.

La frmula para el error estndar de la media proporciona una estimacin exacta cuando la
muestra es muy pequea en comparacin con el tamao de la poblacin. En la investigacin de
mercado, esto suele ser el caso ya que las poblaciones son bastante grandes. Sin embargo, cuando
el tamao de la muestra representa una porcin sustancial de la poblacin, la frmula se vuelve
inexacta y debe corregirse. El factor de correccin de poblacin finito se utiliza para corregir la
estimacin del error estndar cuando la muestra es ms del diez por ciento de la poblacin.

Inferencias con tamaos de muestra pequeos

Cuando el tamao de la muestra es pequeo (menos de 30), el valor z para el rea bajo la curva
normal no es exacto. En lugar de un valor z, podemos usar un valor de t para derivar el rea bajo la
curva. De hecho, muchos investigadores siempre usan el valor t en lugar del valor z. La razn es
que los valores de t son ms precisos para tamaos de muestra pequeos, y son casi idnticos a
los valores de z para tamaos de muestra grandes. A diferencia del valor z, los valores de t
dependen del nmero de casos en la muestra. Dependiendo del tamao de la muestra, el valor t
cambiar.

Grados de libertad

Los grados de libertad literalmente se refieren al nmero de valores de datos que son libres de
variar.

Por ejemplo, supongamos que le digo que la media de una muestra es 10, y hay un total de tres
valores en la muestra. Resulta que si te digo dos de los valores, siempre ser capaz de calcular el
tercer valor. Si dos de los valores son 8 y 12, puede calcular que el tercer valor es 10 usando
lgebra simple.

(X + 8 + 12) / 3 = 10 x = 10

En otras palabras, si conoce la media, y todo menos un valor, puede calcular el valor que falta.
Todos los valores excepto uno son libres de variar. Un valor se establece una vez que se conocen
los dems. As, los grados de libertad son iguales a n-1.

Eleccin de una prueba de significacin

La eleccin de la prueba de significacin que utilice depende del tipo de datos que haya
recopilado. Utilice la siguiente referencia para ayudar a seleccionar una prueba estadstica
apropiada.

Para explorar la relacin entre dos variables categricas:

Ji cuadrado

Para explorar la relacin entre dos variables escalonadas ordinales:

Ji cuadrado

La correlacin de rangos de Spearman


Para comparar dos porcentajes:

Prueba t de una muestra entre porcentajes

Prueba t de dos muestras entre porcentajes

Para comparar dos promedios medios:

Parejas pares t-test entre los medios

T-test de grupos independientes entre medios

Para comparar tres o ms varianzas:

Anlisis de varianza de una sola va

Para explorar la relacin entre dos variables escalonadas o de proporcin en escala:

La correlacin producto-momento de Pearson

Explorar la relacin entre dos variables de escala o de proporcin escalonada usando una variable
para predecir la otra:

Regresin simple

Men Distribuciones

La seleccin del men Distribuciones se utiliza para calcular valores crticos y probabilidades para
varias distribuciones. Las distribuciones ms comunes son la distribucin z (normal), la distribucin
t, la distribucin F y la distribucin chi-cuadrada. En los ltimos 20 aos, las computadoras han
hecho fcil calcular las probabilidades exactas para las varias estadsticas. Antes de eso, los
investigadores utilizaron ampliamente libros que contenan tablas de probabilidad.

El men Distribuciones tiene cuatro selecciones:

Distribucin normal

La distribucin normal es la distribucin ms conocida y se refiere a menudo como la distribucin z


o la curva en forma de campana. Se utiliza cuando el tamao de la muestra es mayor que 30.
Cuando el tamao de la muestra es menor que 30, se utiliza la distribucin t en lugar de la
distribucin normal.

El men ofrece tres opciones: 1) probabilidad de un valor z, 2) crtica z para una probabilidad dada,
y 3) probabilidad de un rango definido.

Ms:

Probabilidad de un valor z
Cuando tiene un valor z (estandarizado) para una variable, puede determinar la probabilidad de
ese valor. El software es el equivalente electrnico de una tabla de probabilidad de distribucin
normal. Cuando se introduce un valor z, se calcular el rea bajo la curva normal. El rea no bajo la
curva se denomina regin de rechazo. Tambin se le llama probabilidad de dos colas porque se
excluyen las dos colas de la distribucin. La calculadora de estadsticas informa la probabilidad de
dos colas para el valor z. Se utiliza una probabilidad de una cola cuando su pregunta de
investigacin se refiere slo a la mitad de la distribucin. Su valor es exactamente la mitad de la
probabilidad de dos colas.

Ejemplo

Valor z: 1,96

-----------------------------------------

Probabilidad de dos colas = .0500

Z crtico para una probabilidad dada

Esta seleccin de men se utiliza para determinar el valor z crtico para una probabilidad dada.

Ejemplo

Una gran empresa dise una encuesta de pre-empleo para ser administrada a los empleados de
perspectiva. Los datos de referencia se establecieron administrando la encuesta a todos los
empleados actuales. Ahora quieren utilizar el instrumento para identificar a los solicitantes de
empleo que tienen calificaciones muy altas o muy bajas. La gerencia ha decidido que quiere
identificar a las personas que puntan en el 3% superior e inferior en comparacin con la norma.
Cuntas desviaciones estndar de la media se requieren para definir el 3% superior e inferior de
las puntuaciones?

El rea total de rechazo es del 6%. Esto incluye un 3% que obtuvo calificaciones muy altas y un 3%
que obtuvo calificaciones muy bajas. Por lo tanto, la probabilidad de dos colas es .06. El valor z
requerido para rechazar el 6% del rea bajo la curva es 1.881. Por lo tanto, los nuevos solicitantes
que puntuacin ms alta o ms baja que 1.881 desviaciones estndar de distancia de la media son
las personas que se identifican.

Probabilidad de dos colas: .06

---------------------------------

Valor z = 1.

Probabilidad de un rango definido

Conocer la media y la desviacin estndar de una muestra permite establecer el rea bajo la curva
para cualquier rango dado. Esta seleccin de men calcular la probabilidad de que la media de
una nueva muestra caiga entre dos valores especificados (es decir, entre los lmites de un rango
definido).

Ejemplo

Un fabricante puede encontrar que el nivel de emisin de un dispositivo es de 25,9 unidades con
una desviacin estndar de 2,7. La ley limita el nivel mximo de emisiones a 28,0 unidades. El
fabricante puede querer saber qu porcentaje de los nuevos dispositivos que salen de la lnea de
montaje tendr que ser rechazado porque exceden el lmite legal.

Media de muestra = 25,9

Desviacin estndar desigual = 2.7

Lmite inferior del rango = 0

Lmite superior del rango = 28.0

-------------------------------------------------- Unesdoc.unesco.org unesdoc.unesco.org

Probabilidad de un valor dentro del rango = .7817

Probabilidad de un valor fuera del rango = .2183

El rea bajo la curva es la suma del rea definida por el lmite inferior ms el rea definida por el
lmite superior.

El rea bajo la curva normal es la probabilidad de que las muestras adicionales caigan entre los
lmites inferior y superior. En este caso, el rea por encima del lmite superior es el rea de
rechazo (21,83% del producto sera rechazado).

Distribucin T

Los matemticos solan pensar que todas las distribuciones siguieron la curva en forma de
campana. A principios de 1900, un qumico irlands llamado Gosset, descubri que las
distribuciones eran mucho ms plana que la curva en forma de campana cuando se trabaja con
tamaos de muestra pequeos. De hecho, cuanto ms pequea sea la muestra, ms plana ser la
distribucin. La distribucin t se utiliza en lugar de la distribucin normal cuando el tamao de la
muestra es pequeo. A medida que el tamao de la muestra se aproxima a treinta, la distribucin
t se aproxima a la distribucin normal. Por lo tanto, la distribucin t se utiliza generalmente en
lugar de la distribucin z, porque es correcta tanto para muestras grandes como pequeas, donde
la distribucin z es correcta slo para muestras grandes.

El men ofrece tres opciones: 1) probabilidad de un valor t, 2) valor t crtico para una probabilidad
dada, y 3) probabilidad de un rango definido.

Ms:
Probabilidad de un valor t

Si tiene un valor t y los grados de libertad asociados con el valor, puede utilizar este programa para
calcular la probabilidad de dos colas de t. Es el equivalente de la tabla computarizada de los
valores de t.

Ejemplo

Valor de t: 2,228

Df: 10

------------------------------------

Probabilidad de dos colas = 0,050

Valor t crtico para una probabilidad dada

Este programa es el opuesto al programa anterior. Se utiliza si se desea saber qu valor t crtico se
requiere para alcanzar una probabilidad dada.

Ejemplo

Probabilidad de dos colas: .050

Grados de libertad: 10

-----------------------------------

Valor t = 2,228

Probabilidad de un rango definido

Conocer la media y la desviacin estndar de una muestra permite establecer el rea bajo la curva
para cualquier rango dado. Puede utilizar este programa para calcular la probabilidad de que la
media de una nueva muestra caiga entre dos valores.

Ejemplo

Una empresa hizo una encuesta de 20 personas que utilizaron su producto. La media de edad de la
muestra fue de 22,4 aos y la desviacin estndar imparcial fue de 3,1 aos. La compaa ahora
quiere hacer publicidad en una revista que tiene un pblico primario de personas que tienen entre
18 y 24 aos, por lo que necesitan saber qu porcentaje de sus clientes potenciales son entre 18 y
24 aos de edad?

Media de la muestra: 22,4

Desviacin estndar no imparcial: 3.1


Tamao de la muestra = 20

Lmite inferior del rango = 18

Lmite superior del rango = 24

-------------------------------------------------- Unesdoc.unesco.org unesdoc.unesco.org

Probabilidad de un valor dentro del rango = .608

Probabilidad de un valor fuera del rango = .392

Debido al pequeo tamao de la muestra, se utiliza la distribucin t en lugar de la distribucin z. El


rea bajo la curva representa la proporcin de clientes en la poblacin que se espera sea entre 18
y 24 aos de edad. En este ejemplo, se podra predecir que el 60,8% de sus clientes se espera que
sea entre 18 y 24 aos de edad, y el 39,2% estara fuera del rango. La empresa decidi no hacer
publicidad.

Distribucin F

La relacin F se utiliza para comparar las varianzas de dos o ms muestras o poblaciones. Puesto
que es una relacin (es decir, una fraccin), hay grados de libertad para el numerador y el
denominador. Esta seleccin de men puede utilizarse para calcular la probabilidad de una F -ratio
o para determinar el valor crtico de F para una probabilidad dada. Estas selecciones de men son
el equivalente de una tabla F.

Ms:

Probabilidad de una relacin F

Si tiene una relacin F y los grados de libertad asociados con el numerador y el denominador,
puede utilizar este programa para calcular la probabilidad.

Ejemplo

Relacin F: 2,774

Numerador grados de libertad: 20

Denominador grados de libertad: 10

----------------------------------------------

Probabilidad de dos colas = .0500

F crtica para una probabilidad dada


Si conoce el nivel crtico alfa y los grados de libertad asociados con el numerador y el
denominador, puede utilizar este programa para calcular la razn F.

Ejemplo

Probabilidad de dos colas = .0500

Numerador grados de libertad: 20

Denominador grados de libertad: 10

-----------------------------------------------

Relacin F: 2,774

Distribucin del Chi cuadrado

La estadstica de ji cuadrado se utiliza para comparar las frecuencias observadas en una tabla con
las frecuencias esperadas. Esta seleccin de men puede usarse para calcular la probabilidad de
un estadstico de chi cuadrado o para determinar el valor crtico de chi cuadrado para una
probabilidad dada. Esta seleccin de men es el equivalente de computadora de una tabla de chi-
cuadrado.

Ms:

Probabilidad de un estadstico chi-cuadrado

Si tiene un valor de chi-cuadrado y los grados de libertad asociados con el valor, puede utilizar este
programa para calcular la probabilidad de la estadstica chi-cuadrado. Es el equivalente de la tabla
computarizada de los valores de chi cuadrado.

Ejemplo

Valor del Chi cuadrado: 18.307

Grados de libertad: 10

------------------------------------

Probabilidad = .050

El chi cuadrado crtico para una probabilidad dada

Si usted tiene el nivel crtico de alfa y los grados de libertad, puede usar este programa para
calcular la probabilidad de la estadstica del chi-cuadrado. Es el equivalente de la tabla
computarizada de los valores de chi cuadrado.

Ejemplo
Probabilidad = .0500

Grados de libertad: 10

------------------------------------

Valor del Chi cuadrado: 18.307

Вам также может понравиться