Вы находитесь на странице: 1из 8

El papel de la Estadstica en el proceso de investigacin

La Estadstica descriptiva aporta informacin q puede servir de


base para trabajos posteriores y anlisis ms complejos que entran
en el cometido de la Estadstica inferencial.

.1. En el problema de investigacin


Podemos afirmar que es la Estadstica la que nos permitir afirmar
que el problema cumple una condicin inexcusable en su
formulacin: que sea resoluble. Es decir, que con los datos que se
puedan recoger en un futuro sea posible alcanzar las respuestas
esperadas.

2. En la formulacin de hiptesis
Cuando el investigador formula su hiptesis o enumera sus
objetivos se le exige q aqullas sean contrastables y los objetivos
comprobables. Para ello se requiere disponer de una serie de
instrumentos de recogida de datos qu nos ofrezcan informacin
clara sobre el problema cuya solucin se adelanta en la hiptesis.
Laestadstica nos permite conocer qu datos deben ser calculados,
qu anlisis son necesarios en ese problema.
Dependiendo de la hiptesis ser preciso recurrir a unas pruebas
estadsticas concretas. As si se plantea la existencia o no de
diferencias entre grupos, es preciso recurrir a pruebas de contraste
q nos permitan decidir sobre la significacin o no de esas
diferencias (pueden referirse a las medias, las varianzas, los
porcentajes, las relaciones, etc.
Si la hiptesis persigue establecer el valor predictivo de una
prueba sobre otra, nos referiremos a los valores que alcanzar la
correlacin medidos en tiempos diferentes (validez predictiva)

3. En el control de variables extraas


Teniendo en cuenta que en la investigacin socioeducativa el
sujeto de estudio es la persona, ello limita el grado de control de
variables, por no poder realizarse un control estricto.
Formas de control en investigacin socioeducativa pueden ser
tomar unos determinados valores en la variable independiente,
formar parejas o bloques de sujetos que puntan de forma similar
en una prueba previa. En estos supuestos la estadstica nos aporta
los anlisis pertinentes para la seleccin de sujetos en funcin de
esas caractersticas de control.
En sntesis, garantizar el control en los procesos de investigacin
emprica supone que se aslan o minimizan los efectos de las
covariaciones y la influencia de las variables extraas que
pudieran llegar a ofrecer explicaciones alternativas a las buscadas
por el investigador.

4. En la definicin de variables
En la investigacin socioeducativa la Estadstica se manifiesta en
la medicin de las variables que intervienen en el proceso. Tarea
que requiere la utilizacin de instrumentos fiables y vlidos que
proporcionen datos de calidad para tomar decisiones. La
estadstica nos garantiza la medida precisa de las variables. La
estadstica nos ayudar tambin a definir de forma operativa las
variables independientes, lo que nos indicar la forma en que se
debe proceder a su medida y valoracin.
En la definicin operativa de las variables la estadstica
desempea un cometido fundamental.

5. En el contraste de hiptesis o comprobacin de objetivos


Este es uno de los momentos donde se pone de manifiesto de
forma explcita la utilizacin de la estadstica. En esta fase la
estadstica nos ayuda a resolver y analizar los datos recogidos en
la investigacin.
Alcanzar una solucin para el problema formulado inicialmente en
una investigacin socioeducativa requiere recurrir a la Estadstica.
La utilizacin de una prueba u otra queda en manos del
investigador pues no todas las pruebas sirven para todos los
cometidos.
Esta fase concluye con la obtencin del valor emprico del
estadstico correspondiente y que ha de ser interpretado por el
investigador.

.6. En la decisin estadstica


Se trata de interpretar los resultados obtenidos en la fase anterior.
En esta ltima fase de la investigacin la estadstica nos ofrece los
valores tericos o crticos de distribucin de cada uno de los
estadsticos y que vienen recogidos en tablas o bien se determinan
mediante el empleo de una serie de ecuaciones.
La regla genera asociada al contraste de hiptesis y la decisin
estadstica nos dice que cuando el valor emprico del estadstico es
mayor que el valor terico o crtico se rechaza la hiptesis de
nulidad (H0), ello supone aceptar que las diferencias encontradas
son estadsticamente significativas.
Esta fase es fundamental en el desarrollo de la investigacin
pedaggica emprica en el campo socioeducativo, pues nos
permite garantizar que los cambios producidos por la intervencin
del investigador sobre la variable independiente ha producido sus
frutos y podr ser recomendada en el futuro en contextos o
situaciones similares a la estudiada.

EL PAPEL DE LA ESTADISTICA EN LA
INVESTIGACION.

Antes de examinar la etapa descriptiva de la investigacin, nos convendr tener una idea
general de la estadstica y de cmo se emplea en la actividad cientfica, en la medida en que
se trata de una herramienta fundamental que la matemtica provee al investigador para
poder resumir y analizar gran cantidad de informacin.

Tanto en las investigaciones exploratorias como en las descriptivas y explicativas, el cientfico


no maneja un solo dato sino muchos, sea porque estudia muchos individuos (las edades de
todos los argentinos, o el cociente intelectual de todos los adolescentes de un colegio), sea
porque estudia un solo individuo sobre el cual se hacen muchas observaciones que
proporcionarn, entonces, muchos datos (las calificaciones que obtiene Juancito en las
distintas asignaturas y a travs de varios aos).

Cuando, como en tales casos, hay que considerar una gran cantidad de datos, necesitaremos
una herramienta para poder organizarlos, analizarlos y finalmente sacar conclusiones sobre la
poblacin o el individuo de donde esos datos fueron extrados, y este instrumento se llama
estadstica. La utilidad de la estadstica, entonces, no apunta necesariamente al estudio de
muchos individuos (poblacin), sino fundamentalmente al estudio de muchos datos, sea
porque provengan de un solo sujeto o de muchos. No obstante en lo que sigue explicaremos
el trabajo ms usual de la estadstica en ciencias sociales: el estudio de poblaciones de
individuos.

Todos sabemos la diferencia entre individuo y poblacin: una cosa es un argentino


determinado, y otra cosa el conjunto de los habitantes de ese pas. O tambin: una cosa es la
ciudad de Pars y otra el conjunto de todas las ciudades del mundo, lo que viene a mostrarnos
que lo que llamamos individuo es simplemente un elemento dentro de un todo (poblacin) y
que, para evitar malos entendidos, llamaremos genricamente unidades de anlisis. En
psicologa las unidades de anlisis pueden ser personas, en psicologa social grupos
pequeos, en sociologa sociedades o clases sociales, en demografa ciudades, en qumica
metales, en biologa ratas, etc.

La distincin entre individuo poblacin es importante porque a la estadstica que aqu vemos
no le interesa el individuo aislado sino el conjunto de la poblacin. Si al estadstico le interesa
que Juancito tiene cociente intelectual 110 es slo para llegar a saber que el promedio de
cocientes intelectuales de la poblacin es de 115 y que, entonces, Juancito est por debajo de
esa media.

La poblacin o universo, definible como el conjunto de todas las unidades de anlisis, puede
ser finita o infinita, segn tenga o no un nmero determinado de individuos: podemos
considerar infinito al conjunto de todos los individuos posibles segn su combinacin gentica.
La poblacin tambin puede ser real o potencial: una poblacin real es el conjunto de todos
los argentinos mayores de 18 aos y menores de 20, y poblacin potencial es por ejemplo el
conjunto de todas las personas que podran utilizar el servicio de psicopatologa de un
hospital.

a) Muestra y muestreo

Nos interesarn, entonces, las poblaciones. Pero aqu surge un problema: como
habitualmente las poblaciones son muy grandes (cuando no infinitas), no podemos obtener
los datos de todos los individuos, y entonces nos vemos obligados a seleccionar una parte de
esa poblacin, que se llama muestra. La muestra est as a mitad de camino entre el
individuo y la poblacin (aunque en ciertos casos una muestra puede estar constituda por un
solo individuo)

Obviamente, deberemos asegurarnos de que la muestra sea representativa de la poblacin: si


queremos tomar una muestra de los habitantes de una ciudad y slo seleccionamos veinte
enfermos mentales de un hospicio, esta muestra no representar adecuadamente a la
poblacin. En cambio si seleccionamos la misma cantidad de sujetos tomando uno de cada
100 de la gua telefnica aqu ya puedo empezar a pensar ms en la posibilidad de cierta
representatividad, pues estn tomados ms al azar.

An as no hay un azar total, pues en la gua no figuran por ejemplo individuos de clase baja
(no tienen telfono), y si nos decidimos por una lista de empadronamiento para votar, all no
figurarn los extranjeros residentes. Un procedimiento bastante aleatorio, en cambio, consiste
en elegir un individuo por cada manzana.

El tamao elegido para la muestra es tambin importante, y variar de acuerdo a cada


investigacin pudiendo ser el 5%, el 20%, etc., de la poblacin total. Suele ser difcil elegir el
tamao justo, ya que no se puede pecar por defecto (un solo individuo no representa a una
ciudad, an tomndolo al azar) o por exceso (una muestra que sea el 80% de la poblacin es
altamente confiable pero no econmica, ya que con menos esfuerzo y dinero puede obtenerse
una muestra considerablemente ms pequea sin que vare en forma significativa su grado de
representatividad).

El procedimiento por el cual seleccionamos una muestra se llama muestreo, y clsicamente se


los divide en probabilsticos y no probabilsticos. Lo esencial del muestreo probabilstico es
que cada individuo de la poblacin total tiene la misma o aproximadamente la misma
probabilidad de estar includo en la muestra. Si tomamos una muestra de los habitantes de
Londres considerando uno de cada 100 de un listado alfabtico, la probabilidad que tiene de
haber sido seleccionado el seor Smith es la misma que tiene el seor Brown o cualquier otro
(en este caso, la probabilidad del uno por ciento).

Hay varias tcnicas para realizar muestreos probabilsticos, y todas se basan en la seleccin
de individuos al azar ya que es ste quien presuntamente garantiza la equiprobabilidad. El
muestreo puede ser: a) simple: partiendo de toda la poblacin se toman individuos al azar
segn diversos procedimientos; b) estratificado: previamente se seleccionan en la poblacin
estratos (por ejemplo clases sociales: alta, media y baja), y dentro de cada estrato se toman
individuos al azar segn el muestreo simple; c) por reas o conglomerados: se delimitan
previamente reas geogrficas (provincias, ciudades) y dentro de cada una de ellas se toman
individuos al azar segn el muestreo simple o estratificado.

En el muestreo no probabilstico los individuos de la poblacin no tienen todos la misma


probabilidad de aparecer en la muestra, ya que aqu no hacemos una estricta seleccin al
azar sino que tomamos casos tpicos (que suponemos representativos de la media
poblacional) o casos en forma accidental (los que tenemos ms a mano), etc.

Una vez obtenida la muestra (preferiblemente mediante muestreo probabilstico), procedemos


ahora a hacer una descripcin de la muestra, para lo cual usaremos ciertas medidas
especiales diferentes a las medidas que usamos para medir individuos. Si queremos describir
sujetos individuales usaremos una medida individual: Juancito tiene cociente intelectual 110,
o Pedrito tiene poco inters en poltica, etc. Pero, si queremos describir una muestra
usaremos lo que se llama una medida estadstica. Por ejemplo, tal muestra se compone de
sujetos cuyo promedio de cocientes intelectuales es 120, o tal otra muestra tiene un 70% de
sujetos con poco inters en poltica, etc. Como vemos, estas medidas estadsticas son
verdaderas sntesis o resmenes de muchas medidas individuales, y un ejemplo tpico es la
media aritmtica, o sea, un simple promedio.

Examinemos como ejemplo dos muestras diferentes, compuestas cada una por tres
individuos, y donde nos interesar describirlas considerando el factor cociente intelectual:

Muestra 1) ----105------------110-------------115------------- (Promedio: 110)

Muestra 2) -----80--------------------110----------------------140---- (Promedio: 110)

Ambas muestras tienen el mismo promedio y sin embargo, son dos muestras diferentes! Por
lo tanto, solamente un promedio no basta para describir e identificar adecuadamente una
muestra, y deberemos usar una segunda medida estadstica que nos permita conocer cun
lejos o cun cerca estn los individuos del promedio, o sea, su grado de dispersin. En el
ejemplo vemos que la muestra 1 es menos dispersa ya que los diferentes valores obtenidos
estn muy prximos al promedio, mientras que la muestra 2 es ms dispersa.

Recin cuando se han tomado ambas medidas podemos afirmar que hemos descripto
adecuadamente las muestras, con lo cual no queda posibilidad de confundirlas con otras. Y
an cuando dos muestras puedan ser distintas porque las componen diferentes individuos, si
tienen la misma media aritmtica y la misma dispersin las consideraremos iguales a los
efectos del anlisis estadstico.

El primer tipo de medida estadstica se llama medida de posicin (o de tendencia central), y


nos est indicando alrededor de qu valor (en el ejemplo 110) giran todos los valores
individuales. El segundo tipo se llama medida de dispersin, y nos indica cun prximos o
alejados estn los distintos valores del promedio, o sea de la medida de posicin, de lo cual
se desprende que no podremos tomar una medida de dispersin sin antes haber tomado la
correspondiente medida de posicin. Un ejemplo de medida de dispersin es el desvo
standard, que conceptualmente es un promedio de las distancias de cada valor respecto de la
media.
b) Pruebas de significacin

Hasta aqu lo nico que hicimos fue describir una muestra, pero lo que a la estadstica le
interesa en ltima instancia es la poblacin, con lo cual debemos resolver una segunda
cuestin: la representatividad de la muestra. Es decir, interesa saber hasta qu punto las
medidas que describieron la muestra describen igualmente bien la poblacin de donde la
muestra fue extrada. Ms concretamente: el promedio 110 de la muestra podemos tambin
adscribrselo con confianza a la poblacin? Pasa lo mismo con la medida de dispersin?
Naturalmente que siempre habr un margen de error, pues si nos animramos a sacar el
promedio de la poblacin entera seguramente no sera exactamente igual al promedio de la
muestra. La cuestin entonces no reside en eliminar esta diferencia, pues es imposible, sino
en poder saber hasta qu punto dicha diferencia se debe solamente al azar. De comprobar
realmente esto, entonces la diferencia no es importante y conclumos que la muestra s es
representativa. Para poder hacer estas determinaciones nos bastar aqu con saber que la
estadstica ha diseado ciertas pruebas especiales, como por ejemplo las pruebas de
significacin. Son pruebas basadas en el clculo de probabilidades, ya que aqu lo que
debemos verificar es si lo concludo respecto de la muestra vale tambin para la poblacin y
con qu grado de probabilidad (pues hay grados de probabilidad aceptables y no aceptables).

Hay dos tipos de probabilidad: lgica e inductiva. a) Probabilidad lgica: si yo tengo un dado
perfectamente balanceado (o sea que las seis caras tienen la misma probabilidad de salir), no
necesitar arrojarlo para saber qu probabilidad tiene de salir el nmero 3. Como ya s que
tiene seis caras equiprobables, su probabilidad ser de uno sobre seis (p=1/6). b)
Probabilidad inductiva: puede ocurrir, sin embargo, que el dado no est balanceado, o que yo
no sepa si el nmero 3 figura en dos caras y el 5 en ninguna, etc., y slo s que tiene 6 caras.
A priori, o sea antes de arrojar los dados, en estos casos no puedo saber qu probabilidad
tiene el 3 de salir, debido a mi desconocimiento del dado. No obstante tengo un medio de
saberlo: arrojo el dado una gran cantidad de veces (cuantas ms veces mejor) y voy
anotando los nmeros que aparecieron. Si constato que el 3 sali en un 50% de los casos,
entonces puedo conclur que la probabilidad ser de tres sobre seis (p=3/6=1/2). Este dato
no me aclara definitivamente si el dado estaba desbalanceado o si en realidad en tres de sus
caras estaba el nmero 3; slo me sugiere la probabilidad de aparicin del nmero en
cuestin.

En suma: en la probabilidad lgica y debido a que conozco el dado, puedo calcular qu


probabilidad tiene de salir determinado nmero sin necesidad de hacer ninguna prueba. Es
una probabilidad deductiva, puesto que deduzco de los datos conocidos la probabilidad de
cada alternativa. En cambio en la probabilidad inductiva no conozco la naturaleza del dado, y
entonces slo puedo conclur la probabilidad de aparicin de un cierto nmero siguiendo un
razonamiento inductivo, vale decir, a partir de los casos observados que fui anotando.

Las mismas consideraciones que hicimos con las caras de un dado tambin podemos hacerlas
con los naipes de un mazo y con los individuos de una poblacin. En estadstica, puesto que
generalmente desconocemos la naturaleza de la poblacin, el tipo de probabilidad empleado
es el inductivo.

En este contexto, qu sera lo deseable? Sera que no hubiera diferencia significativa entre la
muestra y la poblacin, y esta situacin deseable es lo que suele llamarse hiptesis nula(nula
porque suponemos que no hay diferencia significativa entre ambas cosas, con lo cual la
muestra pasa a ser representativa de la poblacin) (24).

Naturalmente que, como toda hiptesis, es una mera suposicin, y por lo tanto es algo que
debemos verificar mediante las mencionadas pruebas de significacin. Al aplicar estas
pruebas podemos cometer dos tipos de errores, opuestos entre s: a) Error Tipo I, o error del
desconfiado, y que consiste en creer que la muestra no es representativa cuando s lo es (o
sea rechazar la hiptesis nula cuando en realidad es verdadera); y b) Error Tipo II, o error del
ingenuo: creer que la muestra es representativa cuando en rigor no lo es (o sea aceptar la
hiptesis nula cuando en realidad es falsa). Para evitar ambos errores tomamos las dos
precauciones de las que habamos hablado: considerar un tamao adecuado de la muestra, y
tomar los individuos al azar.

No sabemos si en realidad existe o no el azar, pero s podemos afirmar con bastante


seguridad que el hombre no puede producir azar absoluto. Si quisiramos colocar en una
serie nmeros al azar, tarde o temprano aparecera alguna regularidad que hemos incluido
inadvertidamente. Si pedimos a una persona que escriba una secuencia al azar de unos y
ceros, casi todos elegirn una secuencia que alterna con demasiada regularidad. Aunque
parezca paradjico, si los ceros y los unos se mezclan con excesiva uniformidad, deja de ser
azar (1). Adems, cuando pretendemos armar una serie al azar generalmente partimos del
prejuicio de que el azar tiene memoria, y consideramos que si sali tres veces un cero, la
probabilidad de que salga cero la cuarta vez disminuye mucho (y entonces ponemos un uno).
Pero esto es falso: una serie al azar puede incluir muchos ceros seguidos. Es el prejuicio del
jugador de quinielas que le juega al 7 porque simplemente hace mucho que no sale, y no
comprende que cualquier nmero en cualquier momento tiene la misma probabilidad de salir
que cualquier otro.

Tampoco habra azar absoluto si quien arma la serie es una computadora, no slo porque
puede fallar el software (al fin y al cabo es el hombre quien la programa), sino tambin el
hardware (los circuitos electrnicos pueden sufrir algn desgaste, con lo que empieza a
aparecer alguna regularidad en la serie).

Si bien el azar absoluto no existe, ni menos an en estadstica, su empleo resulta necesario


pues hace disminuir la probabilidad de la influencia de ciertas variables ms que de otras, o
sea, el azar procura que ninguna variable est ejerciendo influencia mucho ms que cualquier
otra. Si tomamos una muestra de la poblacin procuraremos siempre aleatoria, es decir, que
los individuos sean lo ms heterogneos en cuanto a edad, sexo, condicin social, salud
mental, etc. No podra tomar una muestra de la poblacin argentina si est constituida por
1000 mujeres solteras entre 40 y 50 aos y pretender, al mismo tiempo, que esa muestra sea
representativa de toda la poblacin (salvo que la nica poblacin que nos interese sea el
conjunto de todas las mujeres argentinas solteras entre 40 y 50 aos). El azar nos permite
asegurar, entonces, hasta cierto punto confiable, la equidad de los estudios estadsticos.

Por ltimo, no siempre debemos oponer casualidad con causalidad: la casualidad (o azar) no
implica necesariamente la ausencia de causas (corrientemente, la expresin ocurri por
casualidad suele significar ocurri sin ninguna causa o motivo). Si partimos de una
cosmovisin causalista, cosmovisin en la cual se basa habitualmente la ciencia, cuando
decimos que un determinado acontecimiento ocurri por azar queremos solamente decir que
est influenciado por una gran cantidad de factores causales, muchos de los cuales son
desconocidos para nosotros y sin que prevalezca ninguno en especial.

c) Etapas de la estadstica

Podemos resumir todo lo dicho indicando cules son las dos etapas de la investigacin
estadstica: a) la estadstica descriptiva, que busca seleccionar una muestra y luego
describirla adecuadamente mediante medidas de posicin y dispersin; b) la estadstica
inductiva o inferencial, que busca extender lcitamente nuestras conclusiones sobre la
muestra a toda la poblacin. Obviamente, el problema central de esta segunda etapa ser
saber hasta qu punto las medidas de la muestra describen tambin a la poblacin. Si
sabemos que la media de una muestra es 110, hasta qu punto esta media ser tambin
aplicable a la poblacin?
La estadstica descriptiva debe preocuparse de si la muestra est o no bien descripta a partir
de los datos de los individuos, mientras que la estadstica inductiva se preocupar de
establecer la representatividad de la muestra respecto de la poblacin. Ms generalmente, la
primera es eminentemente descriptiva y no ampla mayormente nuestro conocimiento: mas
bien lo resume mediante las medidas estadsticas. En cambio la segunda s ampla nuestro
conocimiento pues lo extiende (con cierto margen de error) a toda la poblacin. De aqu que
tenga un carcter predictivo, pues conociendo la muestra, puedo predecir hasta cierto punto
confiable cmo habr de ser la poblacin.

Вам также может понравиться