Академический Документы
Профессиональный Документы
Культура Документы
Men principal
Statistics Calculator es un programa fcil de usar diseado para realizar una serie de
procedimientos estadsticos bsicos relacionados con distribuciones y probabilidades. La mayora
de los procedimientos se llaman inferenciales porque los datos de una muestra se utilizan para
inferir a una poblacin.
La barra de men de Statistic Calculator contiene ocho opciones. Estos representan los tipos
bsicos de operaciones que pueden ser realizadas por el software.
La opcin de men Counts contiene rutinas para analizar una tabla de contingencia de conteos,
calcular la probabilidad exacta de Fisher para tablas de dos por dos, utilizar la distribucin
binomial para predecir la probabilidad de un resultado especificado y la distribucin de poisson
para probar la probabilidad de observar una Nmero de eventos especificado.
El parmetro Percentes se utiliza para comparar dos porcentajes. Se incluyen algoritmos para
comparar proporciones extradas de una o dos muestras. Tambin hay una opcin de men para
calcular intervalos de confianza alrededor de un porcentaje.
El elemento de men Medios se utiliza para calcular la media y la desviacin estndar de una
muestra, comparar dos medias entre s, calcular un intervalo de confianza en torno a una media,
comparar una media de muestra con una media de poblacin, comparar dos desviaciones
estndar entre s y Comparar tres o ms desviaciones estndar.
El elemento de men Muestreo se utiliza para determinar el tamao de muestra requerido para
un estudio. El software puede utilizarse para problemas que impliquen porcentajes y medios.
Se proporciona ayuda en lnea para todas las selecciones de men. La ayuda en lnea describe la
aplicacin de cada procedimiento estadstico. Tambin se incluyen ejemplos prcticos.
Tambin puede copiar la imagen de la pantalla en el portapapeles pulsando las teclas Alt e
Imprimir pantalla juntas.
Frmulas
Las frmulas utilizadas en la Calculadora de estadsticas pueden encontrarse en casi cualquier libro
de estadsticas. El libro de texto escrito por el autor de la calculadora de estadsticas se llama
"Estadsticas de supervivencia". Contiene todas las frmulas con ejemplos trabajados. "Survival
Statistics" est disponible para su compra en el sitio web de StatPac:
http://www.statpac.com/statistics-book
Toda investigacin comienza con una pregunta. La curiosidad intelectual suele ser el fundamento
de la investigacin acadmica. Algunas preguntas no son probables. El ejemplo filosfico clsico es
preguntar, "Cuntos ngeles pueden bailar en la cabeza de un alfiler?" Si bien la pregunta puede
suscitar revelaciones profundas y pensadas, claramente no puede probarse con un experimento
emprico. Antes de Descartes, este es precisamente el tipo de pregunta que atraera la mente de
los hombres eruditos. Sus respuestas venan de dentro. El mtodo cientfico se opone a hacer
preguntas que no pueden ser probadas empricamente. Si los ngeles no pueden ser observados o
detectados, la pregunta se considera inapropiada para la investigacin acadmica.
Definir las metas y objetivos de un proyecto de investigacin es uno de los pasos ms importantes
en el proceso de investigacin. No subestime la importancia de este paso. Objetivos claramente
establecidos mantener un proyecto de investigacin centrado. El proceso de definicin de metas
generalmente comienza escribiendo los objetivos generales y generales del estudio. A medida que
el proceso contina, los objetivos se definen ms claramente y los temas de investigacin se
estrechan.
La pregunta de investigacin en s puede ser declarada como una hiptesis. Una hiptesis es
simplemente la creencia del investigador sobre un problema. Normalmente, un investigador
formula una opinin durante el proceso de revisin de la literatura. El proceso de revisin del
trabajo de otro estudiante a menudo aclara las cuestiones tericas asociadas con la pregunta de
investigacin. Tambin puede ayudar a dilucidar la importancia de los temas para la comunidad de
investigacin.
La hiptesis se convierte en una hiptesis nula para hacerla comprobable porque la nica manera
de probar una hiptesis es eliminar alternativas de la hiptesis. Las tcnicas estadsticas nos
permitirn rechazar o no rechazar una hiptesis nula, pero no nos proporcionan una manera de
aceptar una hiptesis. Por lo tanto, todas las pruebas de hiptesis son indirectas.
Mtodos de investigacin
A veces, toda la poblacin ser lo suficientemente pequea, y el investigador puede incluir a toda
la poblacin en el estudio. Este tipo de investigacin se denomina un estudio censal porque los
datos se recogen en cada miembro de la poblacin.
Por lo general, la poblacin es demasiado grande para que el investigador intente examinar a
todos sus miembros. Se puede utilizar una muestra pequea pero cuidadosamente seleccionada
para representar a la poblacin. La muestra refleja las caractersticas de la poblacin de la que se
extrae.
A menudo se utiliza el muestreo sistemtico en lugar del muestreo aleatorio. Tambin se llama
una tcnica de seleccin de Nth nombre. Una vez calculado el tamao de muestra requerido, se
selecciona cada Nth registro de una lista de miembros de la poblacin. Siempre y cuando la lista
no contenga ninguna orden oculta, este mtodo de muestreo es tan bueno como el mtodo de
muestreo aleatorio. Su nica ventaja sobre la tcnica de muestreo aleatorio es la simplicidad. El
muestreo sistemtico se utiliza con frecuencia para seleccionar un nmero determinado de
registros de un archivo de computadora.
Recopilacin de datos
Hay muy pocas reglas duras y rpidas para definir la tarea de recoleccin de datos. Cada proyecto
de investigacin utiliza una tcnica de recoleccin de datos adecuada a la metodologa de
investigacin en particular. Los dos objetivos principales para los estudios cuantitativos y
cualitativos son maximizar la respuesta y maximizar la precisin.
Cuando se utiliza un servicio externo de recoleccin de datos, los investigadores a menudo validan
el proceso de recopilacin de datos ponindose en contacto con un porcentaje de los encuestados
para verificar que realmente fueron entrevistados. La edicin y limpieza de datos implica el
proceso de detectar errores inadvertidos en los datos. Esto suele implicar el uso de una
computadora para buscar datos fuera de los lmites.
Los estudios cuantitativos emplean lgica deductiva, donde el investigador comienza con una
hiptesis, y luego recopila datos para confirmar o refutar la hiptesis. Los estudios cualitativos
utilizan la lgica inductiva, donde el investigador primero disea un estudio y luego desarrolla una
hiptesis o teora para explicar los resultados del anlisis.
Los estudios cualitativos casi siempre implican entrevistas en persona, por lo que son muy
laboriosos y costosos. Dependen en gran medida de la capacidad de un investigador para excluir
sesgos personales. La interpretacin de los datos cualitativos suele ser altamente subjetiva, y
diferentes investigadores pueden llegar a conclusiones diferentes de los mismos datos. Sin
embargo, el objetivo de la investigacin cualitativa es desarrollar una hiptesis - no probar uno.
Los estudios cualitativos tienen mrito en el sentido de que proporcionan amplias teoras
generales que pueden ser examinadas en futuras investigaciones.
Validez
Validez se refiere a la exactitud o veracidad de una medicin. Estamos midiendo lo que creemos
que somos? Este es un concepto simple, pero en realidad, es extremadamente difcil determinar si
una medida es vlida.
La validez facial se basa nicamente en el juicio del investigador. Cada pregunta es examinada y
modificada hasta que el investigador est convencido de que es una medida exacta de la
construccin deseada. La determinacin de la validez de la cara se basa en la opinin subjetiva del
investigador.
La validez de contenido es similar a la validez de cara en que se basa en el juicio del investigador.
Sin embargo, cuando la validez de cara slo evala los tems individuales en un instrumento, la
validez de contenido va ms all en que intenta determinar si un instrumento proporciona la
cobertura adecuada de un tema. Las opiniones de expertos, las bsquedas de literatura y las
preguntas de pretest abiertas ayudan a establecer la validez del contenido.
La validez relacionada con el criterio puede ser predictiva o concurrente. Cuando se ha establecido
una relacin dependiente / independiente entre dos o ms variables, se puede evaluar la validez
de criterio. Se desarrolla un modelo matemtico para poder predecir la variable dependiente de la
(s) variable (s) independiente (es). La validez predictiva se refiere a la capacidad de una variable
independiente (o grupo de variables) para predecir un valor futuro de la variable dependiente. La
validez concurrente se refiere a la relacin entre dos o ms variables en el mismo punto en el
tiempo.
La validez constructiva se refiere a los fundamentos tericos subyacentes a una escala o medida
particular. Examina las teoras o construcciones subyacentes que explican un fenmeno. Esto
tambin es bastante subjetivo y depende en gran medida de la comprensin, opiniones y sesgos
del investigador.
Confiabilidad
La fiabilidad es sinnimo de repetibilidad. Se dice que una medicin que produce resultados
consistentes en el tiempo es confiable. Cuando una medida es propensa a errores aleatorios,
carece de fiabilidad. La fiabilidad de un instrumento pone un lmite superior en su validez. Una
medida que carezca de confiabilidad ser necesariamente invlida. Existen tres mtodos bsicos
para probar la fiabilidad: test-retest, forma equivalente y consistencia interna.
Idealmente, cuando un investigador encuentra diferencias entre los encuestados, se deben a una
verdadera diferencia en la variable que se mide. Sin embargo, la combinacin de errores
sistemticos y aleatorios puede diluir la precisin de una medida. El error sistemtico se introduce
a travs de un sesgo constante en una medicin. Por lo general, puede atribuirse a una falla en el
procedimiento de muestreo o en el diseo de un cuestionario. El error aleatorio no ocurre en
ningn patrn constante, y no es controlable por el investigador.
Qu es lo que los residentes sienten son los problemas ms importantes que enfrenta la
comunidad?
Las respuestas de los encuestados a estas preguntas podran resumirse en cuadros descriptivos y
los resultados podran ser sumamente valiosos para los administradores y planificadores. Los
investigadores de las empresas y las ciencias sociales a menudo hacen preguntas de investigacin
no comprobables. La deficiencia con este tipo de preguntas es que no proporcionan puntos de
corte objetivos para los tomadores de decisiones.
Con el fin de superar este problema, los investigadores a menudo buscan responder a una o ms
preguntas de investigacin comprobables. Casi todas las preguntas de investigacin comprobables
comienzan con una de las dos frases siguientes:
Por ejemplo:
Existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin?
Existe una diferencia significativa entre los residentes blancos y los minoritarios con respecto a lo
que ellos sienten que son los problemas ms importantes que enfrenta la comunidad?
Existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin.
Hay una diferencia significativa entre los residentes blancos y minoritarios con respecto a lo que
ellos sienten son los problemas ms importantes que enfrenta la comunidad.
No es posible probar una hiptesis directamente. En su lugar, debe convertir la hiptesis en una
hiptesis nula. La hiptesis nula se crea a partir de la hiptesis aadiendo las palabras "no" o "no"
a la declaracin. Por ejemplo, las hiptesis nulas para los dos ejemplos seran:
No existe una relacin significativa entre la edad de los gerentes y sus actitudes hacia la
reorganizacin.
No hay una diferencia significativa entre los residentes blancos y los minoritarios con respecto a lo
que ellos sienten son los problemas ms importantes que enfrenta la comunidad.
Todas las pruebas estadsticas se realizan sobre la hiptesis nula ... nunca la hiptesis. El resultado
de una prueba estadstica le permitir: 1) rechazar la hiptesis nula o 2) rechazar la hiptesis nula.
Nunca use las palabras "aceptar la hiptesis nula".
Hay dos tipos de errores de prueba de hiptesis. El primero se denomina error Tipo I. Este es un
error muy grave en el que rechaza errneamente la hiptesis nula. Supongamos que la hiptesis
nula es: Las administraciones diarias del frmaco ABC no ayudarn a los pacientes. Tambin
suponga que la droga ABC es realmente una droga muy mala y causa dao cerebral permanente a
personas mayores de 60 aos. En su investigacin, usted pide voluntarios, y toda la muestra es
menor de 60 aos de edad. La muestra parece mejorar y usted rechaza la hiptesis nula. Podra
haber consecuencias muy graves si usted comercializara este medicamento (basado en su
muestra). Los errores de tipo I suelen ser causados por problemas de muestreo.
Tipos de datos
Uno de los conceptos ms importantes en las pruebas estadsticas es comprender los cuatro tipos
bsicos de datos: nominal, ordinal, intervalo y relacin. Los tipos de pruebas estadsticas que se
pueden realizar dependen del tipo de datos que tenga. Diferentes pruebas estadsticas se utilizan
para diferentes tipos de datos.
Los datos nominales y ordinales son no paramtricos (no continuos o categricos). Las escalas de
intervalo y de relacin se llaman paramtricas (continuas). Algunas pruebas estadsticas se llaman
pruebas paramtricas porque utilizan datos paramtricos. Otros se llaman pruebas no
paramtricas porque utilizan datos no paramtricos. Todas las pruebas estadsticas estn
diseadas para usarse con un tipo especfico de datos, y slo pueden realizarse cuando se dispone
de ese tipo de datos.
Ms:
Datos nominales
Cul es tu sexo?
En qu programa ests?
___ Educacin
A qu escuela asisti?
___ Otro
___ Cierre
___ Otro
Nota: Esta pregunta se llama una pregunta abierta porque requiere una respuesta literal. Aunque
las categoras (es decir, los estados) no se enumeran, la pregunta todava se considera nominal
porque los datos se pueden categorizar despus de que se recoja.
Cul de las siguientes carnes has comido en la ltima semana? (Marque todo lo que corresponda)
Nota: Esta pregunta se llama un elemento de respuesta mltiple porque los encuestados pueden
comprobar ms de una categora. La respuesta mltiple simplemente significa que un encuestado
puede hacer ms de una respuesta a la misma pregunta. Los datos siguen siendo nominales
porque las respuestas son categoras no ordenadas.
Cules son los dos asuntos ms importantes que enfrenta nuestro pas hoy?
________________________ y ________________________
Nota: Esta pregunta es un elemento de respuesta mltiple abierto, ya que requiere dos respuestas
verbatim. Todava se considera datos nominales porque los problemas podran ser categorizados
despus de que se recolecten los datos.
Datos ordinales
___ Ninguno ___ Uno a cinco ___ Seis a diez ___ Ms de diez
___ Excelente
___ Bueno
___ Justa
___ Pobre
Utilice un crculo para indicar su nivel de acuerdo o desacuerdo con la siguiente declaracin: El
aborto debe ser una decisin entre una mujer y su mdico.
Fuertemente fuerte
12345
Cul es su ingreso familiar anual?
___ $ 75,000 o ms
Los datos de intervalo y de relacin son tales que cada intervalo numrico representa una unidad
de medida. Las escalas de proporcin tambin tienen la propiedad de un "punto cero" absoluto.
Las preguntas de intervalo y escala de escala son preferibles en diseo de investigacin porque
ofrecen la mayor versatilidad en los tipos de anlisis que se pueden realizar.
Por ejemplo, supongamos que damos a 1.000 personas un test de CI y le preguntamos si hay una
diferencia significativa entre las puntuaciones de hombres y mujeres. La puntuacin media para
los varones es 98 y la puntuacin media para las mujeres es de 100. Utilizamos una prueba t de
grupos independientes y encontramos que la diferencia es significativa al nivel de .001. La gran
pregunta es, "Y qu?". La diferencia entre 98 y 100 en una prueba de CI es una diferencia muy
pequea ... tan pequea, de hecho, que ni siquiera es importante.
Entonces por qu la estadstica t sali significativa? Porque haba un gran tamao de muestra.
Cuando se tiene un tamao de muestra grande, se detectarn diferencias muy pequeas como
significativas. Esto significa que usted est muy seguro de que la diferencia es real (es decir, no
ocurri por casualidad). No significa que la diferencia sea grande o importante. Si slo hubiramos
dado el test de CI a 10 personas en lugar de 1.000, la diferencia de dos puntos entre hombres y
mujeres no habra sido significativa.
La significancia es un trmino estadstico que indica cun seguro es que existe una diferencia o
relacin. Decir que una diferencia o relacin significativa existe slo dice la mitad de la historia.
Podemos estar muy seguros de que existe una relacin, pero es una relacin fuerte, moderada o
dbil? Despus de encontrar una relacin significativa, es importante evaluar su fuerza. Las
relaciones significativas pueden ser fuertes o dbiles. Las diferencias significativas pueden ser
grandes o pequeas. Slo depende del tamao de la muestra
Un concepto importante en las pruebas de significacin es si se utiliza una prueba de una cola o de
dos colas de significacin. La respuesta es que depende de su hiptesis. Cuando su hiptesis de
investigacin indica (o implica) la direccin de la diferencia o relacin, entonces se utiliza una
probabilidad de una cola. Por ejemplo, una prueba de una cola se utilizara para probar estas
hiptesis nulas: Las mujeres no puntuacin significativamente mayor que los hombres en un test
de coeficiente intelectual. Trabajadores de cuello azul no tendrn una educacin
significativamente menor que los trabajadores de cuello blanco. Superman no es
significativamente ms fuerte que la persona promedio. En cada caso, la hiptesis nula
(indirectamente) predice la direccin de la diferencia esperada. Se utilizar una prueba de dos
colas para probar estas hiptesis nulas: No habr diferencia significativa en las puntuaciones de CI
entre hombres y mujeres. No habr diferencia significativa entre los trabajadores de cuello azul y
de cuello blanco. No hay diferencia significativa en la fuerza entre Superman y la persona
promedio.
Calculadora de estadsticas siempre informa la probabilidad de dos colas. Una probabilidad de una
cola es exactamente la mitad del valor de una probabilidad de dos colas. Por lo tanto, si usted
tiene una pregunta de una cola de investigacin, debe dividir la probabilidad dada por la
calculadora de estadsticas por dos.
Hay una controversia furiosa (durante los ltimos cien aos) sobre si es o no es apropiado usar una
prueba de una cola. La razn es que si ya sabes la direccin de la diferencia, por qu molestarse
en hacer cualquier prueba estadstica. La apuesta ms segura es declarar siempre sus hiptesis de
modo que las pruebas de dos colas sean apropiadas.
Siempre que realizamos una prueba de significacin, se trata de comparar un valor de prueba que
hemos calculado a algn valor crtico para la estadstica. No importa qu tipo de estadstica
estamos calculando (por ejemplo, un estadstico t, un estadstico de chi-cuadrado, una estadstica
F, etc.), el procedimiento para probar la significacin es el mismo.
1. Decida el nivel alfa crtico que usar (es decir, la tasa de error que est dispuesto a aceptar).
2. Realizar la investigacin.
3. Calcular la estadstica.
4. Comparar la estadstica con un valor crtico obtenido de una tabla o comparar la probabilidad
del estadstico con el nivel alfa crtico.
Su hallazgo es significativo.
Su hallazgo no es significativo.
Teorema de Bonferroni
El teorema de Bonferroni indica que a medida que se realiza un nmero creciente de pruebas
estadsticas, tambin aumenta la probabilidad de obtener un hallazgo significativo errneo (error
de tipo I). As, a medida que realizamos ms y ms pruebas estadsticas, cada vez es ms probable
que rechacemos falsamente una hiptesis nula (muy mala).
Por ejemplo, supongamos que nuestro nivel alfa crtico es .05. Si realizamos una prueba
estadstica, nuestra probabilidad de hacer una declaracin falsa es .05. Si tuviramos que realizar
100 pruebas estadsticas, e hicimos una declaracin sobre el resultado de cada prueba,
esperaramos que cinco de ellas estuvieran equivocadas (solo por casualidad). Esta es una
situacin bastante indeseable para los cientficos sociales.
El teorema de Bonferroni indica que necesitamos ajustar el nivel alfa crtico para compensar el
hecho de que estamos haciendo ms de una prueba. Para realizar el ajuste, tome el nivel alfa
crtico deseado (por ejemplo, .05) y divida el nmero de pruebas que se estn realizando, y use el
resultado como el nivel alfa crtico. Por ejemplo, supongamos que tuvimos una prueba con ocho
escalas, y planeamos comparar machos y hembras en cada una de las escalas usando una prueba t
de grupos independientes. Usaremos .00625 (.05 / 8) como el nivel alfa crtico para las ocho
pruebas.
El teorema de Bonferroni debe aplicarse cuando se realizan dos o ms pruebas que son del mismo
"tipo" y la misma "familia". El mismo "tipo" significa el mismo tipo de prueba estadstica. Por
ejemplo, si usted iba a hacer una prueba t, un ANOVA y una regresin, no hara el ajuste porque
las pruebas son todas diferentes. La misma "familia" es un concepto ms elusivo, y no hay reglas
duras y rpidas. "Familia" se refiere a una serie de pruebas estadsticas todas diseadas para
probar las mismas construcciones tericas (o muy estrechamente relacionadas). La conclusin es
que depende del investigador individual decidir qu constituye una "familia".
Algunas cosas son ms obvias que otras, por ejemplo, si realizas pruebas t que comparan a
hombres y mujeres con una serie de tems del cuestionario que forman parte de la misma escala,
probablemente aplicaras el ajuste dividiendo tu nivel alfa crtico Por el nmero de elementos de
la escala (es decir, el nmero de pruebas t que realiz en esa escala). Las probabilidades de las
pruebas se denominaran las tasas de error de la familia. Sin embargo, supongamos que usted
tiene una serie de preguntas independientes, cada una centrndose en una construccin
diferente, y desea comparar a los hombres y las mujeres sobre la forma en que respondieron a
cada pregunta. Aqu es donde toda la idea del ajuste de Bonferroni se hace filosfica. Si usted
afirma que cada prueba t que realiza es una prueba de una "mini" hiptesis nica, entonces usted
no usara el ajuste, porque ha definido cada pregunta como una "familia" diferente. En este caso,
la probabilidad se llamara una tasa de error de declaracin. Otro investigador podra llamar a todo
el cuestionario una "familia", y ella dividira el alfa crtico por el nmero total de tems del
cuestionario.
En el mundo real, la mayora de los investigadores no utilizan el ajuste de Bonferroni porque rara
vez podran rechazar una hiptesis nula. Estaran tan preocupados por la posibilidad de hacer una
declaracin falsa, que pasaran por alto muchas diferencias y relaciones que realmente existen. La
"directiva principal" para la investigacin en ciencias sociales es descubrir las relaciones. Se podra
argumentar que es mejor arriesgarse a hacer algunas declaraciones errneas, que pasar por alto
las relaciones o diferencias que son claras o prominentes, pero no cumplen con el nivel crtico de
significacin alfa despus de aplicar el ajuste de Bonferroni.
Tendencia central
Las medidas ms conocidas de tendencia central son la media y la mediana. La media media se
obtiene sumando los valores para todos los casos y dividindolos por el nmero de casos. Por
ejemplo, para encontrar la edad media de todos tus amigos, agrega todas sus edades juntas y
divide por el nmero de amigos. El promedio medio puede presentar una imagen distorsionada de
tendencia central si la muestra est sesgada de alguna manera.
Por ejemplo, digamos que cinco personas toman una prueba. Las puntuaciones son 10, 12, 14, 18
y 94. (La ltima persona es un genio.) La media sera la suma de las puntuaciones 10 + 12 + 14 + 18
+ 94 dividida por 5. En este ejemplo, un Media de 29,6 no es una buena medida de lo bien que la
gente hizo en la prueba en general. Al analizar los datos, tenga cuidado de usar slo el promedio
cuando la muestra tiene unas puntuaciones muy altas o muy bajas. Estas puntuaciones tienden a
sesgar la forma de la distribucin y distorsionan la media.
La mediana proporciona una medida de tendencia central tal que la mitad de la muestra estar
por encima de ella y la mitad de la muestra estar por debajo de ella. Para distribuciones sesgadas
esto es una mejor medida de la tendencia central. En el ejemplo anterior, 14 sera la mediana para
la muestra de cinco personas. Si no hay un valor medio (es decir, hay un nmero par de puntos de
datos), la mediana es el valor a medio camino entre los dos valores medios.
La distribucin de muchas variables sigue a la de una curva en forma de campana. Esto se llama
una "distribucin normal". Se debe asumir que los datos son aproximadamente distribuidos
normalmente para que muchos anlisis estadsticos sean vlidos. Cuando una distribucin es
normal, la media y la mediana sern iguales entre s. Si no son iguales, la distribucin se
distorsiona de alguna manera.
Variabilidad
Hay dos frmulas para la varianza y la desviacin estndar de una muestra. Un conjunto de
frmulas calcula la varianza exacta y la desviacin estndar de la muestra. Las estadsticas se
llaman sesgadas, porque estn sesgadas a la muestra. Son la varianza exacta y la desviacin
estndar de la muestra, pero tienden a subestimar la varianza y la desviacin estndar de la
poblacin.
En general, nos preocupa ms describir la poblacin que la muestra. Nuestra intencin es usar la
muestra para describir a la poblacin. Las estimaciones no sesgadas deben utilizarse cuando el
muestreo de la poblacin y la inferencia de nuevo a la poblacin. Proporcionan la mejor
estimacin de la varianza y la desviacin estndar de la poblacin.
El error estndar de la media se utiliza para estimar el rango dentro del cual esperamos que la
media caiga en muestras repetidas tomadas de la poblacin (es decir, intervalos de confianza). El
error estndar de la media es una estimacin de la desviacin estndar de las muestras repetidas.
La frmula para el error estndar de la media proporciona una estimacin exacta cuando la
muestra es muy pequea en comparacin con el tamao de la poblacin. En la investigacin de
mercado, esto suele ser el caso ya que las poblaciones son bastante grandes. Sin embargo, cuando
el tamao de la muestra representa una porcin sustancial de la poblacin, la frmula se vuelve
inexacta y debe corregirse. El factor de correccin de poblacin finito se utiliza para corregir la
estimacin del error estndar cuando la muestra es ms del diez por ciento de la poblacin.
Cuando el tamao de la muestra es pequeo (menos de 30), el valor z para el rea bajo la curva
normal no es exacto. En lugar de un valor z, podemos usar un valor de t para derivar el rea bajo la
curva. De hecho, muchos investigadores siempre usan el valor t en lugar del valor z. La razn es
que los valores de t son ms precisos para tamaos de muestra pequeos, y son casi idnticos a
los valores de z para tamaos de muestra grandes. A diferencia del valor z, los valores de t
dependen del nmero de casos en la muestra. Dependiendo del tamao de la muestra, el valor t
cambiar.
Grados de libertad
Los grados de libertad literalmente se refieren al nmero de valores de datos que son libres de
variar.
Por ejemplo, supongamos que le digo que la media de una muestra es 10, y hay un total de tres
valores en la muestra. Resulta que si te digo dos de los valores, siempre ser capaz de calcular el
tercer valor. Si dos de los valores son 8 y 12, puede calcular que el tercer valor es 10 usando
lgebra simple.
(X + 8 + 12) / 3 = 10 x = 10
En otras palabras, si conoce la media, y todo menos un valor, puede calcular el valor que falta.
Todos los valores excepto uno son libres de variar. Un valor se establece una vez que se conocen
los dems. As, los grados de libertad son iguales a n-1.
La eleccin de la prueba de significacin que utilice depende del tipo de datos que haya
recopilado. Utilice la siguiente referencia para ayudar a seleccionar una prueba estadstica
apropiada.
Ji cuadrado
Ji cuadrado
Explorar la relacin entre dos variables de escala o de proporcin escalonada usando una variable
para predecir la otra:
Regresin simple
Men Distribuciones
La seleccin del men Distribuciones se utiliza para calcular valores crticos y probabilidades para
varias distribuciones. Las distribuciones ms comunes son la distribucin z (normal), la distribucin
t, la distribucin F y la distribucin chi-cuadrada. En los ltimos 20 aos, las computadoras han
hecho fcil calcular las probabilidades exactas para las varias estadsticas. Antes de eso, los
investigadores utilizaron ampliamente libros que contenan tablas de probabilidad.
Distribucin normal
El men ofrece tres opciones: 1) probabilidad de un valor z, 2) crtica z para una probabilidad dada,
y 3) probabilidad de un rango definido.
Ms:
Probabilidad de un valor z
Cuando tiene un valor z (estandarizado) para una variable, puede determinar la probabilidad de
ese valor. El software es el equivalente electrnico de una tabla de probabilidad de distribucin
normal. Cuando se introduce un valor z, se calcular el rea bajo la curva normal. El rea no bajo la
curva se denomina regin de rechazo. Tambin se le llama probabilidad de dos colas porque se
excluyen las dos colas de la distribucin. La calculadora de estadsticas informa la probabilidad de
dos colas para el valor z. Se utiliza una probabilidad de una cola cuando su pregunta de
investigacin se refiere slo a la mitad de la distribucin. Su valor es exactamente la mitad de la
probabilidad de dos colas.
Ejemplo
Valor z: 1,96
-----------------------------------------
Esta seleccin de men se utiliza para determinar el valor z crtico para una probabilidad dada.
Ejemplo
Una gran empresa dise una encuesta de pre-empleo para ser administrada a los empleados de
perspectiva. Los datos de referencia se establecieron administrando la encuesta a todos los
empleados actuales. Ahora quieren utilizar el instrumento para identificar a los solicitantes de
empleo que tienen calificaciones muy altas o muy bajas. La gerencia ha decidido que quiere
identificar a las personas que puntan en el 3% superior e inferior en comparacin con la norma.
Cuntas desviaciones estndar de la media se requieren para definir el 3% superior e inferior de
las puntuaciones?
El rea total de rechazo es del 6%. Esto incluye un 3% que obtuvo calificaciones muy altas y un 3%
que obtuvo calificaciones muy bajas. Por lo tanto, la probabilidad de dos colas es .06. El valor z
requerido para rechazar el 6% del rea bajo la curva es 1.881. Por lo tanto, los nuevos solicitantes
que puntuacin ms alta o ms baja que 1.881 desviaciones estndar de distancia de la media son
las personas que se identifican.
---------------------------------
Valor z = 1.
Conocer la media y la desviacin estndar de una muestra permite establecer el rea bajo la curva
para cualquier rango dado. Esta seleccin de men calcular la probabilidad de que la media de
una nueva muestra caiga entre dos valores especificados (es decir, entre los lmites de un rango
definido).
Ejemplo
Un fabricante puede encontrar que el nivel de emisin de un dispositivo es de 25,9 unidades con
una desviacin estndar de 2,7. La ley limita el nivel mximo de emisiones a 28,0 unidades. El
fabricante puede querer saber qu porcentaje de los nuevos dispositivos que salen de la lnea de
montaje tendr que ser rechazado porque exceden el lmite legal.
El rea bajo la curva es la suma del rea definida por el lmite inferior ms el rea definida por el
lmite superior.
El rea bajo la curva normal es la probabilidad de que las muestras adicionales caigan entre los
lmites inferior y superior. En este caso, el rea por encima del lmite superior es el rea de
rechazo (21,83% del producto sera rechazado).
Distribucin T
Los matemticos solan pensar que todas las distribuciones siguieron la curva en forma de
campana. A principios de 1900, un qumico irlands llamado Gosset, descubri que las
distribuciones eran mucho ms plana que la curva en forma de campana cuando se trabaja con
tamaos de muestra pequeos. De hecho, cuanto ms pequea sea la muestra, ms plana ser la
distribucin. La distribucin t se utiliza en lugar de la distribucin normal cuando el tamao de la
muestra es pequeo. A medida que el tamao de la muestra se aproxima a treinta, la distribucin
t se aproxima a la distribucin normal. Por lo tanto, la distribucin t se utiliza generalmente en
lugar de la distribucin z, porque es correcta tanto para muestras grandes como pequeas, donde
la distribucin z es correcta slo para muestras grandes.
El men ofrece tres opciones: 1) probabilidad de un valor t, 2) valor t crtico para una probabilidad
dada, y 3) probabilidad de un rango definido.
Ms:
Probabilidad de un valor t
Si tiene un valor t y los grados de libertad asociados con el valor, puede utilizar este programa para
calcular la probabilidad de dos colas de t. Es el equivalente de la tabla computarizada de los
valores de t.
Ejemplo
Valor de t: 2,228
Df: 10
------------------------------------
Este programa es el opuesto al programa anterior. Se utiliza si se desea saber qu valor t crtico se
requiere para alcanzar una probabilidad dada.
Ejemplo
Grados de libertad: 10
-----------------------------------
Valor t = 2,228
Conocer la media y la desviacin estndar de una muestra permite establecer el rea bajo la curva
para cualquier rango dado. Puede utilizar este programa para calcular la probabilidad de que la
media de una nueva muestra caiga entre dos valores.
Ejemplo
Una empresa hizo una encuesta de 20 personas que utilizaron su producto. La media de edad de la
muestra fue de 22,4 aos y la desviacin estndar imparcial fue de 3,1 aos. La compaa ahora
quiere hacer publicidad en una revista que tiene un pblico primario de personas que tienen entre
18 y 24 aos, por lo que necesitan saber qu porcentaje de sus clientes potenciales son entre 18 y
24 aos de edad?
Distribucin F
La relacin F se utiliza para comparar las varianzas de dos o ms muestras o poblaciones. Puesto
que es una relacin (es decir, una fraccin), hay grados de libertad para el numerador y el
denominador. Esta seleccin de men puede utilizarse para calcular la probabilidad de una F -ratio
o para determinar el valor crtico de F para una probabilidad dada. Estas selecciones de men son
el equivalente de una tabla F.
Ms:
Si tiene una relacin F y los grados de libertad asociados con el numerador y el denominador,
puede utilizar este programa para calcular la probabilidad.
Ejemplo
Relacin F: 2,774
----------------------------------------------
Ejemplo
-----------------------------------------------
Relacin F: 2,774
La estadstica de ji cuadrado se utiliza para comparar las frecuencias observadas en una tabla con
las frecuencias esperadas. Esta seleccin de men puede usarse para calcular la probabilidad de
un estadstico de chi cuadrado o para determinar el valor crtico de chi cuadrado para una
probabilidad dada. Esta seleccin de men es el equivalente de computadora de una tabla de chi-
cuadrado.
Ms:
Si tiene un valor de chi-cuadrado y los grados de libertad asociados con el valor, puede utilizar este
programa para calcular la probabilidad de la estadstica chi-cuadrado. Es el equivalente de la tabla
computarizada de los valores de chi cuadrado.
Ejemplo
Grados de libertad: 10
------------------------------------
Probabilidad = .050
Si usted tiene el nivel crtico de alfa y los grados de libertad, puede usar este programa para
calcular la probabilidad de la estadstica del chi-cuadrado. Es el equivalente de la tabla
computarizada de los valores de chi cuadrado.
Ejemplo
Probabilidad = .0500
Grados de libertad: 10
------------------------------------