Академический Документы
Профессиональный Документы
Культура Документы
2. En la formulacin de hiptesis
Cuando el investigador formula su hiptesis o enumera sus
objetivos se le exige q aqullas sean contrastables y los objetivos
comprobables. Para ello se requiere disponer de una serie de
instrumentos de recogida de datos qu nos ofrezcan informacin
clara sobre el problema cuya solucin se adelanta en la hiptesis.
Laestadstica nos permite conocer qu datos deben ser calculados,
qu anlisis son necesarios en ese problema.
Dependiendo de la hiptesis ser preciso recurrir a unas pruebas
estadsticas concretas. As si se plantea la existencia o no de
diferencias entre grupos, es preciso recurrir a pruebas de contraste
q nos permitan decidir sobre la significacin o no de esas
diferencias (pueden referirse a las medias, las varianzas, los
porcentajes, las relaciones, etc.
Si la hiptesis persigue establecer el valor predictivo de una
prueba sobre otra, nos referiremos a los valores que alcanzar la
correlacin medidos en tiempos diferentes (validez predictiva)
4. En la definicin de variables
En la investigacin socioeducativa la Estadstica se manifiesta en
la medicin de las variables que intervienen en el proceso. Tarea
que requiere la utilizacin de instrumentos fiables y vlidos que
proporcionen datos de calidad para tomar decisiones. La
estadstica nos garantiza la medida precisa de las variables. La
estadstica nos ayudar tambin a definir de forma operativa las
variables independientes, lo que nos indicar la forma en que se
debe proceder a su medida y valoracin.
En la definicin operativa de las variables la estadstica
desempea un cometido fundamental.
EL PAPEL DE LA ESTADISTICA EN LA
INVESTIGACION.
Antes de examinar la etapa descriptiva de la investigacin, nos convendr tener una idea
general de la estadstica y de cmo se emplea en la actividad cientfica, en la medida en que
se trata de una herramienta fundamental que la matemtica provee al investigador para
poder resumir y analizar gran cantidad de informacin.
Cuando, como en tales casos, hay que considerar una gran cantidad de datos, necesitaremos
una herramienta para poder organizarlos, analizarlos y finalmente sacar conclusiones sobre la
poblacin o el individuo de donde esos datos fueron extrados, y este instrumento se llama
estadstica. La utilidad de la estadstica, entonces, no apunta necesariamente al estudio de
muchos individuos (poblacin), sino fundamentalmente al estudio de muchos datos, sea
porque provengan de un solo sujeto o de muchos. No obstante en lo que sigue explicaremos
el trabajo ms usual de la estadstica en ciencias sociales: el estudio de poblaciones de
individuos.
La distincin entre individuo poblacin es importante porque a la estadstica que aqu vemos
no le interesa el individuo aislado sino el conjunto de la poblacin. Si al estadstico le interesa
que Juancito tiene cociente intelectual 110 es slo para llegar a saber que el promedio de
cocientes intelectuales de la poblacin es de 115 y que, entonces, Juancito est por debajo de
esa media.
La poblacin o universo, definible como el conjunto de todas las unidades de anlisis, puede
ser finita o infinita, segn tenga o no un nmero determinado de individuos: podemos
considerar infinito al conjunto de todos los individuos posibles segn su combinacin gentica.
La poblacin tambin puede ser real o potencial: una poblacin real es el conjunto de todos
los argentinos mayores de 18 aos y menores de 20, y poblacin potencial es por ejemplo el
conjunto de todas las personas que podran utilizar el servicio de psicopatologa de un
hospital.
a) Muestra y muestreo
Nos interesarn, entonces, las poblaciones. Pero aqu surge un problema: como
habitualmente las poblaciones son muy grandes (cuando no infinitas), no podemos obtener
los datos de todos los individuos, y entonces nos vemos obligados a seleccionar una parte de
esa poblacin, que se llama muestra. La muestra est as a mitad de camino entre el
individuo y la poblacin (aunque en ciertos casos una muestra puede estar constituda por un
solo individuo)
An as no hay un azar total, pues en la gua no figuran por ejemplo individuos de clase baja
(no tienen telfono), y si nos decidimos por una lista de empadronamiento para votar, all no
figurarn los extranjeros residentes. Un procedimiento bastante aleatorio, en cambio, consiste
en elegir un individuo por cada manzana.
Hay varias tcnicas para realizar muestreos probabilsticos, y todas se basan en la seleccin
de individuos al azar ya que es ste quien presuntamente garantiza la equiprobabilidad. El
muestreo puede ser: a) simple: partiendo de toda la poblacin se toman individuos al azar
segn diversos procedimientos; b) estratificado: previamente se seleccionan en la poblacin
estratos (por ejemplo clases sociales: alta, media y baja), y dentro de cada estrato se toman
individuos al azar segn el muestreo simple; c) por reas o conglomerados: se delimitan
previamente reas geogrficas (provincias, ciudades) y dentro de cada una de ellas se toman
individuos al azar segn el muestreo simple o estratificado.
Examinemos como ejemplo dos muestras diferentes, compuestas cada una por tres
individuos, y donde nos interesar describirlas considerando el factor cociente intelectual:
Ambas muestras tienen el mismo promedio y sin embargo, son dos muestras diferentes! Por
lo tanto, solamente un promedio no basta para describir e identificar adecuadamente una
muestra, y deberemos usar una segunda medida estadstica que nos permita conocer cun
lejos o cun cerca estn los individuos del promedio, o sea, su grado de dispersin. En el
ejemplo vemos que la muestra 1 es menos dispersa ya que los diferentes valores obtenidos
estn muy prximos al promedio, mientras que la muestra 2 es ms dispersa.
Recin cuando se han tomado ambas medidas podemos afirmar que hemos descripto
adecuadamente las muestras, con lo cual no queda posibilidad de confundirlas con otras. Y
an cuando dos muestras puedan ser distintas porque las componen diferentes individuos, si
tienen la misma media aritmtica y la misma dispersin las consideraremos iguales a los
efectos del anlisis estadstico.
Hasta aqu lo nico que hicimos fue describir una muestra, pero lo que a la estadstica le
interesa en ltima instancia es la poblacin, con lo cual debemos resolver una segunda
cuestin: la representatividad de la muestra. Es decir, interesa saber hasta qu punto las
medidas que describieron la muestra describen igualmente bien la poblacin de donde la
muestra fue extrada. Ms concretamente: el promedio 110 de la muestra podemos tambin
adscribrselo con confianza a la poblacin? Pasa lo mismo con la medida de dispersin?
Naturalmente que siempre habr un margen de error, pues si nos animramos a sacar el
promedio de la poblacin entera seguramente no sera exactamente igual al promedio de la
muestra. La cuestin entonces no reside en eliminar esta diferencia, pues es imposible, sino
en poder saber hasta qu punto dicha diferencia se debe solamente al azar. De comprobar
realmente esto, entonces la diferencia no es importante y conclumos que la muestra s es
representativa. Para poder hacer estas determinaciones nos bastar aqu con saber que la
estadstica ha diseado ciertas pruebas especiales, como por ejemplo las pruebas de
significacin. Son pruebas basadas en el clculo de probabilidades, ya que aqu lo que
debemos verificar es si lo concludo respecto de la muestra vale tambin para la poblacin y
con qu grado de probabilidad (pues hay grados de probabilidad aceptables y no aceptables).
Hay dos tipos de probabilidad: lgica e inductiva. a) Probabilidad lgica: si yo tengo un dado
perfectamente balanceado (o sea que las seis caras tienen la misma probabilidad de salir), no
necesitar arrojarlo para saber qu probabilidad tiene de salir el nmero 3. Como ya s que
tiene seis caras equiprobables, su probabilidad ser de uno sobre seis (p=1/6). b)
Probabilidad inductiva: puede ocurrir, sin embargo, que el dado no est balanceado, o que yo
no sepa si el nmero 3 figura en dos caras y el 5 en ninguna, etc., y slo s que tiene 6 caras.
A priori, o sea antes de arrojar los dados, en estos casos no puedo saber qu probabilidad
tiene el 3 de salir, debido a mi desconocimiento del dado. No obstante tengo un medio de
saberlo: arrojo el dado una gran cantidad de veces (cuantas ms veces mejor) y voy
anotando los nmeros que aparecieron. Si constato que el 3 sali en un 50% de los casos,
entonces puedo conclur que la probabilidad ser de tres sobre seis (p=3/6=1/2). Este dato
no me aclara definitivamente si el dado estaba desbalanceado o si en realidad en tres de sus
caras estaba el nmero 3; slo me sugiere la probabilidad de aparicin del nmero en
cuestin.
Las mismas consideraciones que hicimos con las caras de un dado tambin podemos hacerlas
con los naipes de un mazo y con los individuos de una poblacin. En estadstica, puesto que
generalmente desconocemos la naturaleza de la poblacin, el tipo de probabilidad empleado
es el inductivo.
En este contexto, qu sera lo deseable? Sera que no hubiera diferencia significativa entre la
muestra y la poblacin, y esta situacin deseable es lo que suele llamarse hiptesis nula(nula
porque suponemos que no hay diferencia significativa entre ambas cosas, con lo cual la
muestra pasa a ser representativa de la poblacin) (24).
Naturalmente que, como toda hiptesis, es una mera suposicin, y por lo tanto es algo que
debemos verificar mediante las mencionadas pruebas de significacin. Al aplicar estas
pruebas podemos cometer dos tipos de errores, opuestos entre s: a) Error Tipo I, o error del
desconfiado, y que consiste en creer que la muestra no es representativa cuando s lo es (o
sea rechazar la hiptesis nula cuando en realidad es verdadera); y b) Error Tipo II, o error del
ingenuo: creer que la muestra es representativa cuando en rigor no lo es (o sea aceptar la
hiptesis nula cuando en realidad es falsa). Para evitar ambos errores tomamos las dos
precauciones de las que habamos hablado: considerar un tamao adecuado de la muestra, y
tomar los individuos al azar.
Tampoco habra azar absoluto si quien arma la serie es una computadora, no slo porque
puede fallar el software (al fin y al cabo es el hombre quien la programa), sino tambin el
hardware (los circuitos electrnicos pueden sufrir algn desgaste, con lo que empieza a
aparecer alguna regularidad en la serie).
Por ltimo, no siempre debemos oponer casualidad con causalidad: la casualidad (o azar) no
implica necesariamente la ausencia de causas (corrientemente, la expresin ocurri por
casualidad suele significar ocurri sin ninguna causa o motivo). Si partimos de una
cosmovisin causalista, cosmovisin en la cual se basa habitualmente la ciencia, cuando
decimos que un determinado acontecimiento ocurri por azar queremos solamente decir que
est influenciado por una gran cantidad de factores causales, muchos de los cuales son
desconocidos para nosotros y sin que prevalezca ninguno en especial.
c) Etapas de la estadstica
Podemos resumir todo lo dicho indicando cules son las dos etapas de la investigacin
estadstica: a) la estadstica descriptiva, que busca seleccionar una muestra y luego
describirla adecuadamente mediante medidas de posicin y dispersin; b) la estadstica
inductiva o inferencial, que busca extender lcitamente nuestras conclusiones sobre la
muestra a toda la poblacin. Obviamente, el problema central de esta segunda etapa ser
saber hasta qu punto las medidas de la muestra describen tambin a la poblacin. Si
sabemos que la media de una muestra es 110, hasta qu punto esta media ser tambin
aplicable a la poblacin?
La estadstica descriptiva debe preocuparse de si la muestra est o no bien descripta a partir
de los datos de los individuos, mientras que la estadstica inductiva se preocupar de
establecer la representatividad de la muestra respecto de la poblacin. Ms generalmente, la
primera es eminentemente descriptiva y no ampla mayormente nuestro conocimiento: mas
bien lo resume mediante las medidas estadsticas. En cambio la segunda s ampla nuestro
conocimiento pues lo extiende (con cierto margen de error) a toda la poblacin. De aqu que
tenga un carcter predictivo, pues conociendo la muestra, puedo predecir hasta cierto punto
confiable cmo habr de ser la poblacin.