Академический Документы
Профессиональный Документы
Культура Документы
Sistemas de hipótesis
Las variables
La variable se aplica a un grupo de personas u objetos, los cuales pueden adquirir diversos
valores respecto a otra variable, por ejemplo, la inteligencia: las personas pueden clasificarse
de acuerdo a su inteligencia ya que no todas las personas poseen el mismo nivel de inteligencia,
varían en ello.
Otras variables, pueden ser la productividad de un determinado tipo de semilla. La rapidez con
que se ofrece un servicio (hay variables en todos los casos)
Las variables adquieren valores para la investigación científica, cuando pueden ser relacionadas
con otras (forma parte de una hipótesis de otra teoría), en este caso se les suele llamar
“constructos o construcciones hipotéticas”.
Las hipótesis
Las hipótesis nos indican lo que andamos buscado o tratando de probar, vienen a ser
suposiciones o conjeturas respecto a la solución de un problema, es decir que son creaciones
mentales construidas conscientemente, que no surgen de la espontaneidad, sino que se formulan
de acuerdo a criterios que permiten ser útiles al proceso de investigación. En nuestra vida
cotidiana constantemente estamos elaborando hipótesis a cerca de muchas cosas, la que inicia
estableciendo una pregunta de investigación por ejemplo ¿le gustare a Ana? Para luego formular
la hipótesis. A si:
1
Si inscribo dos asignaturas en el mismo horario, entonces mi rendimiento será eficiente.
Las hipótesis son una explicación tentativa que están formuladas como proposiciones. Después
investigamos si la hipótesis es aceptada o rechazada.
Las hipótesis proporcionan la guía, para el tipo de datos y técnicas necesarias para el análisis,
ello implica que las hipótesis deben de ser formuladas antes de iniciar la recopilación de los
datos del proyecto de investigación.
1. Deben estar relacionadas como relaciones si, entonces y deben ser expresadas de tal
manera que sus inferencias y relaciones al problema se puedan demostrar lógica y
empíricamente. El uso explícito de las palabras si, entonces no es necesariamente
requerido, ya que en la redacción de las hipótesis puede ir implícita dicha relación, así
por ejemplo “Proporcionar periódicamente cursos de reto alimentación a los maestros
de educación básica, conducirá a un mejor desempeño docente”. Puede notarse que la
hipótesis, que ya lleva implícita la relación si, entonces.
2. Deben de estar expuestas lo más sencillamente posible en términos de complejidad e
implicaciones como en términos de variables.
3. Se deben poder verificar o rechazar dentro de los límites de los recursos de la
investigación.
4. Deben de estar expuestas en forma tal, que dirijan la investigación. Las hipótesis bien
formuladas sugieren los datos apropiados y las técnicas analíticas que serán empleadas
5. Deben de proporcionar un nivel aceptable de confianza en los resultados, pero al mismo
tiempo deben economizar el uso de recursos de la investigación.
Clases de hipótesis
Existen una diversidad de formas de clasificar las hipótesis, nos centraremos un poco según el
número de variables y el tipo de relación que guardan entre ellas. A si témenos:
2
Relación: no existe
Términos lógicos: no existen
Estas hipótesis son simples afirmaciones que pueden comprobarse fácilmente, mediante una
estimación, puntual, basada en el análisis de una muestra representativa de esa población. Esto
no tiene mayor importancia, ya que es solo señalar la ocurrencia de eventos, sin explicar sus
causas; sin embargo, la estimación puntual puede dar pautas para la formular hipótesis que
expliquen las causas o la relación que tales eventos puedan tener dentro de la problemática
social.
Hipótesis descriptiva con dos o más por variables relacionadas en forma de asociación
Estas tipo de hipótesis se caracterizan por tener términos lógicos que relacionan las variables
independientes con la o las variables dependientes, ya sea en forma directa o inversa, sin
explicar la causa del grado de asociación. Retomando el ejemplo anterior tenemos que la
hipótesis puede ser:
A mayor inferencia del estudiante de la UPES, respecto a los problemas sociales de la realidad
nacional, menor participación política se da entre ellos
Entonces tenemos:
Observemos que la relación es puramente de asociación, ya que ambas variables pueden ser
causa o efecto, pues la hipótesis pudo haberse redactado de la siguiente manera: A menor
participación política de estudiantes de la UPES, mayor indiferencia estudiantil respecto a los
problemas de la realidad nacional.
En esta clase de hipótesis no se da la relación causal entre las variables, sino la relación es de
asociación a covarianza.
3
Si x = variable independiente
y = variable dependiente
Esta clase de hipótesis se puede probar mediante el coeficiente de correlación, probando luego
su nivel de significancia.
Se caracterizan por medir la intensidad de asociación entre las variables y permitir explicar y
predecir la variable dependiente en función de la variable independiente con determinados
márgenes de error. Esta cualidad hace posible estimar la variable dependiente, manipulando
adecuadamente la variable independiente (la causa); ya que la variable independiente ocurre
antes que variable dependiente (efecto).
La investigación causal requiere un conocimiento bastante amplio, por parte del investigador,
de las variables relevantes del problema y de la forma en que se influyen mutuamente. La
investigación causal tiene como objeto proporcionar evidencias suficientes sobre la existencia
de relaciones causales. Generalmente, esta clase de hipótesis se realiza por medio de diseños
experimentales.
Estas hipótesis son las que intervienen en el proceso estadístico para probarlas. General se
simbolizan por
4
H0: la nula o negativa
H1: la alternativa
La hipótesis nula H0 afirma que no existe diferencia entre el estadístico (valor muestral) y el
parámetro (valor poblacional); implica que cualquier diferencia entre estadístico y parámetro
puede deberse a fluctuaciones del muestreo. En el proceso de prueba se formula para ser
posiblemente rechazada.
H0: P = 0.32
De esta esta forma se dice que la prueba es unilateral. Si la pregunta en la hipótesis hubiera sido
probar la significancia de la diferencia, el planteamiento debería ser el siguiente:
H0: P = 0.32
H1: P ≠ 0.32
5
LA POBLACION Y MUESTRA
Existen autores que señalan el termino de universo como población. Según Rojas Soriano; es
el conjunto de elementos ( personas, documentos, instituciones, objetos) que posean aspectos
comunes susceptibles de investigarse, un mismo universo puede contener distintas poblaciones
según el objeto del estudio de que se trate. Por ejemplo el universo de los habitantes de la cuidad
de san salvador, puede estar constituida por difetes tipos de población: población mayor 21
anos, población obrera, población mujeres, etc.
El aspecto común de todas las poblaciones es el hecho de vivir en la cuidad de salvador, una
vez se ha definido cual será la unidad de análisis , se procede a delimitar la población que va
ser estudiada y sobre la cual se pretende generalizar los resultado. A si la población es el
conjunto de individuos, u objetos que poseen algunas cracteristicas comunes observables en un
lugar y en un momento determinado. Algunas características que se deben tomar encuenta al
seleccionar la población son:
1. Homogeneidad
Todos los miembros de la población deben tener las mismas características según las
variables que se vayan a considerar en el estudio o investigación
2. Tiempo
Se refiere al periodo tiempo donde se ubicara la población de interés. Determinar si el
estudio es del momento presente o si se va estudiar a una población de cinco años o si
si se van a entrevistar personas de diferentes generaciones.
3. Espacio
Se refierea a identicar el lugar donde se ubica la población de interés. un estudio no
puede ser muy abarcador por falta de tiempo y recursos hay que limitarlo a una área o
comunidad especifica
4. Cantidad
Se refiere al tamaño de la población. El tamaño de de la población es sumamente
importante porque de ella se determina o fecta al tamaño de la muestra que se vaya a
seleccionar, además la falta de recursos y tiempo también nos limita la extencion de la
población que se vaya a investigar
MUESTRA
Generalmente el investigador no trabaja con todos los elementos de la apoblacion que estudia
si no que con solo con una parte o fracción de ella; a veces por que es muy grande y es no es
fácil de abarcarla en su totalidad, por ello, se eljige una muestra representativa y los datos
obtenidos en ella se utilizan para realizar pronósticos en poblaciones futuras de las mismas
características
El muestreo es indispensable para la investigacion , ya que es imposible entrevistar a todos los
miembros de una población debido a problemas de tiempo, recursos y esfuerzo. Al seleccionar
6
una muetra, lo que se hace es estudiar un subconjunto de la población que es suficientemente
representativa de esta, para que luego pueda generalizarse con seguridad.
Ejemplo:
Tipos de muestras
El tamaño de la muestra depende de la precisión con la que el investigador desee llevar a cabo
su estudio, por lo general debe de usarse una muestra, tan grande como sea posible de acuerdo
a los recursos que haya disponible. Entre más grande es la muestra mayor es posibilidad de ser
más representativa de la población.
7
Muestras probabilistas
Las muestras probabilísticas son esenciales en los diseños de investigación por encuestas en las
que se pretende hacer estimaciones de variables en la población, estas variables se miden con
instrumentos de investigación y se analizan con pruebas estadísticas.
En este tipo muestra todos los elementos tienen la misma probabilidad de ser escogidos, se
obtienen definiendo las características de la población, el tamaño de la muestra y a través de
una selección aleatoria y/o mecánica de las unidades de análisis, imaginémonos el
procedimiento para obtener un número premiado en un sorteo de la lotería. Este número se va
formando en el momento del sorteo, a partir de las esferas con un digito que se van sacando
(después de devolverlas mecánicamente) hasta formar el número de manera que todos los
números tienen la misma posibilidad de ser elegidos. Estas muestras pueden ser; aleatoria
simple, aleatoria sistemática, aleatorio estratificado y por conglomerado.
Muestras no probabilístico
Están basadas en el juicio personal del investigador, es decir que la selección de los elementos
no depende de la probabilidad, si no de causas relacionadas con las características del
investigador o del que hace la muestra. Estas pueden ser muestreo dirigido o intencional,
muestreo deliberado o convencional y muestreo por cuotas.
Distribución normal es una función de probabilidad continua de las más importantes, siempre
es simétrica, gráficamente tiene la forma de campana
Antes de entrar en detalle respecto a este modelo matemático (la normal), se intentara dar una
respuesta intuitiva a lo que se entiende por comportamiento normal de una variable. La
importancia de eta distribución estriba en que una gran cantidad de variables tienen dicho
comportamiento: antropométricas, económicas, sociales, físicas, etc. por ejemplo, inteligencia,
talla, estatura, la vida útil de los productos, el peso de los productos enlatados, embotellados o
empacados, el tiempo que una persona tarda en trasladarse de un lugar a otro por una
determinada vía, etc.
8
Ejemplo la variable, QI, que es típicamente normal. En la siguiente grafica se muestra la
distribución de la inteligencia, con una media de 100 y una desviación de 20.
A……………………
B………………………....
C……………………………………
. . X
Podemos observar que las personas con un coeficiente de inteligencia QI de 100 son las que
más abundan, OA; personas con QI de 90 o 110, también son bastantes. OB, pero no como las
que están en el coeficiente promedio, la frecuencia está representada por OB. Los que tienen
un coeficiente de inteligencia de 40 o 160. Son pocos, puede leerse la frecuencia en OC; esto
quiere decir que los idiotas y los genios no abundan en el planeta ; por eso se oye decir a la
gente que los genios como tal o cual persona solo nacen cada cien años, asi como los centros
que atienden retrasados mentales y a genios son pocos.
No los concentraremos en la construcción de gráfica, sin embargo se hace necesario saber que
existen tablas especialmente construidas que dan las distintas ordenadas para ajustar una
distribución muestral.
Nos vamos detener un poco en las aéreas bajo la curva normal las cuales nos dan las
probabilidades de ocurrencia de valores que toma la variable continua X o las probabilidades
entre dos valores que toma la variable. La fórmula a utilizar es la siguiente:
𝑏
P(a<x<b) =∫𝑎 𝑓(𝑥)𝑑𝑥, fórmula que determina la probabilidad asociada con un intervalo
especifico; o sea que la probabilidad estará representada por el área entre dos valores de X.
𝑏
La expresión ∫𝑎 𝑓(𝑥)𝑑𝑥, se llama” integral definida” que es un número que mide el área bajo
la curva de la función 𝑓(𝑥). Esta área (que da la probabilidad) está acotada por X = a, a la
izquierda, y X = b, a la derecha, 𝑓(𝑥) por arriba Y el eje de las X por debajo. Por ejemplo,
utilizando la ecuación de la curva normal (forma general)
9
El valor de la integral definida en la formula 𝑓(𝑥)= 𝑓(𝑥)𝑑𝑥, es la medida del área entre a y b
en la gráfica siguiente.
a b X
El área que esta entre las líneas a y b, representa la medida de la probabilidad de que una
variable contínua toma un valor dentro del intervalo especificado. Omitiendo el rigorismo
matemático. Los valores que se calculan por estas fórmulas, será sustituido por el uso de tablas
donde aparecen las probabilidades con precisión de cuatro cifras decimales.
Para comprender como se usa la tabla de áreas bajo la curva normal, que aparecen más adelante,
es preciso que se comprenda que tenemos que expresarla en forma estandarizada; vale decir,
obtener la curva normal unidad o curva normal estándar; para evitar construir una tabla distinta
para cada distribución muestral con determinado valor medio y desviación típica o estándar
determinado: por ejemplo el área bajo la curva normal de una distribución con media de 1.65
metros y 0.06 mts, debe poseer alguna relación con el área bajo la curva normal de otra
distribución normal con media de 1.45 libras y desviación típica de 10 libras.
por ejemplo. Si la variable tiene comportamiento normal, se dan las siguientes relaciones,
aproximadamente:
10
A
𝜇 ± 1 σ = 68% X
-1𝝈 𝜇 1𝝈
𝜇 ± 2 σ = 95% X
-2𝝈 𝜇 2𝝈
𝜇 ± 3 σ = 100% X
-3𝝈 𝜇 3𝝈
11
Estas relaciones nos indican, que si a la media le sumamos y restamos una vez el valor de la
desviación típica, en esta región queda comprendido el 68% de los datos, si a la media le
sumamos y restamos dos desviaciones típicas, la región comprende aproximadamente el 95%,
y finalmente si sumamos y restamos 3 veces la desviación típica, prácticamente están
comprendidos la totalidad de los datos. El valor de la media aritmética o el tamaño de la
desviación típica no alteran estas relaciones.
La estadística no paramétrica es una rama de la estadística que estudia las pruebas y modelos
estadísticos cuya distribución subyacente no se ajusta a los llamados criterios paramétricos. Su
distribución no puede ser definida a priori, pues son los datos observados los que la determinan.
La utilización de estos métodos se hace recomendable cuando no se puede asumir que los datos
se ajusten a una distribución conocida, cuando el nivel de medida empleado no sea como
mínimo de intervalo, estas pruebas pueden ser: Prueba χ² de Pearson (prueba binomial), prueba
de Anderson – Darling (prueba de Cochran), prueba de Friedman (prueba de Kendall),
coeficiente de correlación de Spearman, tabla de contingencia, prueba de los rangos con signo
de Wilcoxon entre otras.
Nos detendremos un poco sobra la prueba estadística de χ², para esta prueba se emplea
frecuentemente como prueba de bondad de ajuste, sin embargo. En un plan experimental. En
el que se cuenta con un grupo muestral, con diversas subclases y las mediciones están en escala
nominal, resulta muy útil este procedimiento.
La eficacia de esta prueba está de acuerdo con el tamaño de la muestra, pues con un grado de
libertad, si hay dos subclases, algunos autores consideran que la prueba es insensible, no
obstante la información que aporta más de dos categorías es satisfactoria en función de la
fórmula:
Donde:
X2 = valor estadístico de ji cuadrada
fo = frecuencia observada
fe = frecuencia esperada.
La X2 se utiliza cuando:
12
Cuando se quieren comparar o contrastar hipótesis
Investigaciones de tipo social-muestras no representativas >5
Cuando se quiere establecer el nivel de confianza o significatividad en las
diferencias.
Cuando la muestra es selecionada no probabilísticamente
X2 permite establecer diferencias entre f ( frecuencia) y se utiliza solo en
escala nominal
Cuando la población es > a 5 y < a 20
Pasos:
Ejemplo:
Elección de la Prueba:
Planteamiento de la hipótesis
Nivel de significancia:
13
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
H0
Zona de rechazo:
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 18
fe = = =6
𝑐𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑎𝑠 3
fo = 18
fe = 6
gl = 3 -1 = 2
α = 0.045
Decisión.
14
En virtud de que la probabilidad obtenida al calcular el valor de X2 esta dentro de
la región de rechazo se acepta Ho y se rechza Ha
Entonces tenemos que 4.3 < 5.99 se acepta Ho, no hay diferencias significativas entre
el consumo de cigarros por causa del estrés.
Interpretación:
El consumo de cigarros por causa del estrés se puede considerar como efecto del
azar.
Las inferencias en cuanto a las medias son en general robustas, por lo que si el
tamaño de muestra es grande, los intervalos de confianza y contrastes basados en
la t de Student son aproximadamente válidos, con independencia de la verdadera
distribución de probabilidad de los datos; pero si ésta distribución no es normal, los
resultados de la estimación serán poco precisos.
15