Вы находитесь на странице: 1из 38

1

Introduccin a una lectura crtica de trabajos de naturaleza


estadstica
Actividad Formativa Especfica
Doctorado en Derecho y Sociedad
Profesora. Dra. Sonia J. Romero Martnez

Contenidos
Parte I: Introduccin
1. Las ramas de la estadstica: descriptiva e inferencial
2. Definicin de trminos estadsticos bsicos
2.1 Poblacin y muestra
2.2 Cmo tomar una muestra representativa?
2.3 Parmetros y estadsticos

PARTE II: Elementos e interpretacin de la estadstica descriptiva


1. Tablas de frecuencias
2. Grficas estadsticas
2.1 Diagrama de barras
2.2 Histograma
2.3 Polgono de frecuencias
2.4 Polgono de frecuencias agrupadas
2.5 Diagrama de sectores o de pastel
2.6 Directrices generales para la elaboracin de grficas
3. Estadsticos descriptivos
3.1 Medidas de tendencia central
3.2 Medidas de dispersin o variabilidad
3.3 Medidas de posicin

PARTE III: Elementos e interpretacin de la inferencia estadstica


1. Pasos de un contraste de hiptesis
2. Las hiptesis estadsticas
3. Comprobacin de supuestos: Inferencia paramtrica y no paramtrica.
4. El estadstico de contraste:
5. La regla de decisin
6. El valor p
7. Errores estadsticos del contraste de hiptesis
8. Errores humanos en el proceso de toma de decisin
9. Estimacin del tamao del efecto

PARTE IV: Valoracin crtica del uso de la estadstica en la investigacin social


1. Eleccin de la tcnica estadstica apropiada segn las caractersticas de la investigacin
1.1 El tipo de diseo
1.2 El nivel de medida de las variables
1.3 Cumplimiento de los supuestos
1.4 La eleccin de la tcnica estadstica

2. Recomendaciones para mejorar el uso de la estadstica en la investigacin social


3. Lectura y valoracin crtica de trabajos de naturaleza estadstica

PARTE V: Bibliografa complementaria

Objetivos y Descripcin
Hay diversos tipos de investigacin en ciencias sociales y no en todos se utiliza la estadstica, sin
embargo, encontramos una gran cantidad de trabajos empricos que s hacen uso de la estadstica.
Es por este motivo que el objetivo de la presente accin formativa es introducir a los futuros
doctorandos en la lectura crtica de trabajos de naturaleza estadstica pues un adecuado anlisis,
revisin y evaluacin de la informacin disponible en los informes, artculos y trabajos de
investigacin permitirn al doctorando conocer las principales herramientas de anlisis estadstico
tanto a nivel descriptivo como inferencial, plantear hiptesis ms elaboradas, seleccionando los
diseos y tcnicas de anlisis estadstico ms apropiados, en el caso de que su investigacin sea de
naturaleza emprica.
Los objetivos especficos de esta accin formativa son: 1) conocer los principales elementos que le
permitirn al doctorando analizar trabajos de investigacin de naturaleza estadstica de forma
crtica, 2) aprender a valorar los usos y abusos que los investigadores realizan en las fases del
proceso de investigacin, especialmente en el uso de las tcnicas estadsticas y de su interpretacin
y 3) que los alumnos conozcan las principales tcnicas de anlisis estadstico y la forma correcta de
interpretarlas.
Los contenidos de esta actividad estn divididos en cinco partes: en la primera parte se realiza una
introduccin en la que se definen los trminos estadsticos bsicos y se presentan las dos ramas
principales de la estadstica. En esta parte tambin se aborda un tema muy importante para los
doctorandos que realizan estudios empricos: cmo seleccinar una muestra representativa de la
poblacin?.
En la segunda parte se explican los elementos para ejecutar, interpretar y analizar trabajos de
naturaleza descriptiva. As mismo, en la tercera parte se presentan los elementos que permiten
ejecutar, interpretar y analizar trabajos de naturaleza inferencial.
En la cuarta parte se presenta un tema escencial para las personas que realizan una tesis doctoral:
cmo seleccionar la tcnica estaditica ms apropiada de acuerdo a los datos disponibles?.
Tambin se discuten algunos de los errores ms comunes en la aplicacin de las tcnicas
estadsticas en la investigacin social y se ofrecen algunas recomendaciones para llevar a buen
trmino la aplicacin de la estadstica en la investigacin.
En la quinta parte se presenta la bibliografa bsica para que el estudiante pueda profundizar en los
temas que sean de su inters de acuerdo a las caractersticas de su tesis.
La actividad evaluable asociada a esta accin formativa consistir en un cuestionario de
autocomprobacin de conocimeientos de 10 preguntas en el que los doctorandos realizarn una
autoevaluacin de su aprendizaje en esta accin formativa.
Se propone tambin una actividad complementaria completamente voluntaria y no evaluable para
realizar en MYSTAT (software estadstico)

Parte I: Introduccin
La estadstica es una rama derivada de las matemticas que se refiere a la recoleccin, organizacin,
anlisis e interpretacin de datos y es una herramienta que permite al investigador sacar
conclusiones legtimas y tomar decisiones razonables basadas en el anlisis de la informacin o de
los datos.
El trmino estadstica proviene de la palabra italiana statista o persona que trata asuntos de Estado.
La estadstica est jugando un papel cada vez ms importante en casi todas las facetas del
comportamiento humano. La influencia de la estadstica se ha extendido cada vez ms a las
denominadas ciencias del comportamiento, como el derecho, ciencias polticas, ciencias del trabajo,
psicologa y sociologa, convirtindose en una herramienta fundamental para el tratamiento de datos
en investigaciones aplicadas y para el desarrollo de instrumentos de medida (cuestionarios, test,
inventarios...). La estadstica es el resultado de la confluencia de dos disciplinas independientes: el
clculo de probabilidades, que nace como aproximacin matemtica a los juegos de azar, y la
estadstica o ciencia del Estado, dedicada a llevar registros ordenados (conteos, tablas, censos, etc.)
de los datos del Estado. Se puede definir la estadstica como una herramienta de la ciencia que
recoge, ordena y analiza datos de una muestra extrada de una poblacin y que, a partir de esa
muestra, valindose del clculo de probabilidades, se encarga de hacer inferencias acerca de la
poblacin (Amn, 1979).
1. Las ramas de la estadstica: descriptiva e inferencial
Comnmente se distinguen dos ramas principales en la estadstica:
Estadstica descriptiva. Consta de una serie de procedimientos para organizar y sintetizar
informacin contenida en un conjunto de datos; en otras palabras, es la parte de la estadstica que se
ocupa de analizar o caracterizar un grupo dado sin sacar conclusiones y generalizaciones sobre la
poblacin.
Estadstica inferencial. Incluye una serie de estrategias que permiten generalizar, inferir o deducir
las propiedades de un grupo de datos (llamado muestra) al conjunto total de datos (poblacin) a los
que representan. Sirve para extraer conclusiones que van ms all de la descripcin de los datos.
Para poder realizar esta generalizacin, es imprescindible que el conjunto de datos utilizados para
obtener informacin (muestra) sea representativo del conjunto total de datos (poblacin) sobre el
que deseamos realizar la inferencia; esto se consigue mediante tcnicas de muestreo, las cuales
tambin pertenecen al mbito de la estadstica.
2. Definicin de trminos estadsticos bsicos
2.1. Poblacin y muestra
Cuando se recogen datos acerca de un determinado grupo de individuos u objetos, sean alturas o
pesos de estudiantes universitarios, desempeo y motivacin en el trabajo, rendimiento acadmico
de estudiantes de la ESO, calidad de los establecimientos hoteleros, distribucin por delitos de los
presos en las crceles, etc., suele ser imposible, o muy poco prctico, observar todo el grupo,
especialmente si dicho grupo es muy grande. En lugar de examinar todo el grupo, llamado
poblacin o universo, se examina una pequea parte, llamada muestra. As, por ejemplo,
constituiran una poblacin los universitarios espaoles, los estudiantes de la ESO, los hoteles

5
espaoles o las crceles espaolas. En cambio, constituiran una muestra de las poblaciones
anteriormente descritas 300 universitarios espaoles, 150 alumnos de la ESO, 39 hoteles y 6
crceles.
Una poblacin se puede definir como un grupo que comparte una caracterstica determinada de
inters. Es el universo de objetos o sujetos que sern estudiados; adems, puede ser finita o infinita.
Por ejemplo, los alumnos que estudian la ESO en la comunidad de Madrid, los nios invidentes
espaoles, los hoteles de la comunidad valenciana y las crceles madrileas son casos de
poblaciones finitas, ya que los elementos pertenecientes a ellas se pueden contar, obteniendo un
nmero finito. Sin embargo, el nmero de lanzamientos posibles de un dado, el conjunto de los
nmeros pares o el tiempo de reaccin ante determinadas situaciones son casos de poblaciones
infinitas, puesto que tericamente no tienen lmite y por muchas observaciones que realicemos
siempre podramos recolectar alguna ms.
La mayor parte de las poblaciones de inters en las ciencias del comportamiento son finitas, al
tratarse generalmente de grupos humanos, pero comnmente son tan numerosas que a la hora de
hacer inferencias acerca de ellas se pueden considerar infinitas a efectos prcticos (por ejemplo, la
poblacin de un sondeo sobre la intencin de voto).
Una muestra se puede definir como un subconjunto de elementos de una poblacin que permite al
investigador obtener una serie de datos para ordenar, simplificar, describir y realizar inferencias (o
extraer conclusiones ms generales sobre el comportamiento de la poblacin). El objetivo
fundamental de un anlisis estadstico es describir (estadstica descriptiva) o generalizar (estadstica
inferencial) los comportamientos de una poblacin de inters mediante lo que se puede encontrar en
la muestra. Por ejemplo, se pueden sacar conclusiones sobre los niveles de productividad de una
empresa con base en una pequea muestra de empleados que sea representativa del total de la
poblacin. Lo ms importante para caracterizar, inferir o extraer conclusiones es que las muestras
sean representativas. Por ejemplo, si se desea realizar una encuesta sobre la intencin de voto, hay
que tener en cuenta todas las regiones que pueden votar. Est claro que si se realiza la encuesta en
determinadas comunidades con mayor favoritismo hacia algn partido poltico, la encuesta estar
sesgada y cualquier descripcin y generalizacin ser poco fiable.
Para garantizar la representatividad de la muestra, en la estadstica hay procedimientos de clculo
para la eleccin de la misma que varan dependiendo de que la poblacin sea finita o infinita, pero
que a medida que se va incrementando el tamao de las poblaciones finitas el uso de uno u otro
procedimiento resulta indiferente, puesto que dan resultados cada vez ms parecidos.
2.2 Cmo tomar una muestra representativa?
Uno de los mtodos ms usuales, y a la vez ms sencillos, de tomar una muestra representativa es el
denominado muestreo aleatorio simple. Este tipo de muestreo se caracteriza porque cada elemento
de la poblacin tiene la misma probabilidad de ser elegido y porque los elementos se seleccionan
uno a uno con reposicin; en otras palabras, la poblacin permanece idntica en todas las
extracciones. Para elegir una muestra aleatoria simple de una poblacin finita, se suelen utilizar los
nmeros aleatorios. El procedimiento tiene tres pasos:
Se asigna a cada elemento de la poblacin (N) un nmero aleatorio.
Se ordenan los elementos de la poblacin de mayor a menor de acuerdo al
nmero aleatorio asignado.
Se eligen los n primeros (o ltimos) elementos que conformarn la muestra.

6
El muestreo aleatorio simple y el sistemtico se utilizan cuando los elementos de la poblacin son
homogneos respecto a la variable que se pretende medir, sin embargo, cuando existen
subpoblaciones, o cuando los elementos sean heterogneos en la variable a estudiar, se puede elegir
una muestra de acuerdo a las subpoblaciones. Por ejemplo, si interesa medir la opinin de un
conjunto de turistas con respecto a los hoteles de las costas espaolas, podra ser interesante
seleccionarlos en razn a su profesin, sexo, edad, composicin familiar, etc. La muestra se toma de
manera que tenga una composicin anloga a la poblacin.
Podemos, entonces, definir el muestreo estratificado como aquel en el que los elementos de la
poblacin se dividen en clases o estratos. La muestra se selecciona asignando mediante algn
criterio un nmero de miembros a cada estrato y se eligen despus por muestreo aleatorio simple los
elementos que forman la muestra dentro de cada estrato.
Cuando no se dispone de un listado con los elementos que componen la poblacin o de los posibles
estratos, no es posible realizar los procedimientos anteriormente descritos. Por ejemplo, si se quiere
realizar un estudio con las opiniones y preferencias de los turistas, se necesitara un listado con
todos los turistas que han venido a Espaa con sus nombres y telfonos. Dicha informacin puede
ser muy costosa y difcil de conseguir; sin embargo, podramos tener a los turistas organizados por:
Ao en que visitaron el pas.
Comunidades autnomas que visitaron.
Ciudades que visitaron.
Tipo de establecimiento hotelero.
Para la primera etapa, solo necesitamos definir el ao o meses de estudio; en la segunda,
necesitaremos la lista de comunidades autnomas; para las comunidades seleccionadas se requiere,
entonces, una lista de ciudades o pueblos que la componen, para la tercera etapa; en las localidades
seleccionadas, necesitaramos la lista de los hoteles, siendo factible realizar un muestreo.
Se llaman conglomerados a esas unidades amplias en las que se dividen y clasifican los elementos
de la poblacin. En cada etapa del muestreo, en lugar de seleccionar individuos, se seleccionan
conglomerados. Las unidades se pueden agrupar en el espacio (como en el caso de las ciudades) o
en el tiempo (como en el caso de los aos o meses que seleccionamos para el estudio).
Los conglomerados deben ser heterogneos, porque si solo se analizan algunos de ellos (dejando
fuera alguno que sea importante), la muestra final puede no ser representativa de la poblacin.
Segn Pea y Romo (2003), los estratos deben ser internamente tan homogneos como sea posible
y tan diferentes entre s como se pueda, mientras que, por el contrario, los conglomerados deben ser
tan heterogneos internamente como lo sea la poblacin y tan homogneos entre s como sea
posible.
Cuando la poblacin es muy compleja, se combinan las ideas de estratificacin con las de
conglomerado y se realizan muestreos polietpicos o mixtos. En un primer momento, se seleccionan
los conglomerados y, luego, se estratifican. Continuando con nuestro ejemplo, para estudiar la
opinin de los turistas, se pueden dividir en comunidades (homogneas internamente, pero que
pueden ser muy heterogneas entre s), llamadas unidades primarias, y clasificar estas unidades
primarias en estratos homogneos, por ejemplo, respecto a composicin demogrfica, renta,
atractivos tursticos, etc. Las unidades primarias se dividen en unidades secundarias, por ejemplo,
pueblos, ciudades, o, incluso, barrios; y, por ltimo, las unidades secundarias se dividen en unidades
finales, que son, en este caso, los hoteles.

7
La muestra se toma, entonces, en tres etapas:
Se selecciona una muestra estratificada de unidades primarias, y se toman varias unidades
primarias dentro de cada estrato.
Se eligen por muestreo aleatorio simple varias unidades secundarias dentro de las unidades
primarias.
Se seleccionan por azar una o varias unidades finales en cada unidad secundaria.
Finalmente, cuando no es posible realizar la estratificacin o esta resulta muy costosa, se puede
realizar un muestreo por cuotas. Por ejemplo, si se desea estudiar las opiniones sobre el aborto y se
conoce que la edad y el sexo pueden influir, se debera tener en cuenta estratos con respecto a estas
dos variables. Sin embargo, esto requerira una lista de personas de la poblacin que incluya el sexo
y la edad, y esto puede ser difcil de conseguir. En este caso, si se dispone de informacin sobre la
proporcin de cada sexo y de la distribucin de la edad en la poblacin, se pueden fijar cuotas de
hombres y mujeres por grupos de edad y elegir los elementos de la poblacin con base en dichas
cuotas.
Existen otro tipo de muestras utilizados muy frecuentemente en la investigacin emprica en las
cuales no podemos garantizar la representatividad de la poblacin, se trata de las muestras NO
PROBABILISTICAS, es decir, muestras que seleccionamos porque nos conviene, por ejemplo, por
la cercana o disponibilidad de los participantes. Estas muestras se llaman muestras de
conveniencia, a propsito o bola de nueve. Estas muestras se pueden utilizar sin ningn
problema en investigaciones exploratorias o descriptivas en las que no se pretende realizar
generalizaciones o conclusiones sobre el comportamiento de la poblacin, sin embargo, no se
pueden utilizar en el contexto de la estadstica inferencial o cuando pretendemos probar alguna
hiptesis.
2.3 Parmetros y estadsticos
Las poblaciones pueden caracterizarse a partir de unos valores denominados parmetros. Como
normalmente los parmetros son desconocidos, ya hemos visto que una de las tareas de la
estadstica es la de hacer conjeturas lo ms acertadas posibles acerca de esas cantidades. Para ello,
se utilizan cantidades anlogas obtenidas a partir de las muestras que se denominan estadsticos. Por
tanto, podemos decir que un parmetro es una propiedad descriptiva de una poblacin, mientras que
un estadstico es una propiedad descriptiva de una muestra.
Por ejemplo, el estrs medio de todos los trabajadores o el tiempo medio que invierte un sujeto en
todas las realizaciones de una tarea son ejemplos de parmetros. Como estas cantidades son
desconocidas, normalmente hacemos conjeturas sobre ellas a partir de cantidades similares
obtenidas de una muestra. Entonces, si consideramos una muestra de 40 individuos trabajadores y
calculamos el estrs medio de dicha muestra antes de aplicar un determinado tratamiento, es posible
que no coincida completamente con el estrs medio de la poblacin de personas trabajadoras, pero
si la muestra es suficientemente representativa, probablemente la media poblacional no diferir
mucho de la media muestral o estadstico.
Es importante anotar que los smbolos que se utilizan para los estadsticos son letras latinas,
mientras que los parmetros se simbolizan con letras griegas. Por ejemplo, estadsticos como la
media de la muestra, la desviacin estndar y la proporcin muestral (, s, p) son estimadores
puntuales de los correspondientes parmetros poblacionales (, , ).

PARTE II: Elementos e interpretacin de la estadstica descriptiva


El primer paso cuando se cuenta con datos provenientes de una muestra es organizarlos y
describirlos. Para organizar y resumir grandes volmenes de datos podemos utilizar: a) las tablas de
frecuencias, b) estadsticos descriptivos o c) grficos estadsticos, a continuacin veremos con
detalle cada uno de estos elementos.
1. Tablas de frecuencias
La distribucin de frecuencias es la organizacin de los datos en tablas, que nos permite:
Organizar y describir los datos de forma racional y directa.
Obtener informacin necesaria para hacer representaciones grficas.
Resumir la informacin para facilitar los clculos de los estadsticos muestrales.
En adelante, representaremos con una x la variable con la que trabajamos, que puede tomar (x 1, x2,
x3) valores distintos y que, de forma general, la representamos como xi con i = 1, 2, 3; cada uno
de los valores puede aparecer repetido ms de una vez en los n elementos que componen la muestra.
Por ejemplo, si consideramos una muestra de 20 trabajadores espaoles y analizamos el nmero de
hijos (variable objeto de estudio) que tiene cada uno de ellos: 0, 1, 2, 3, 4 (valores que toma la
variable objeto de estudio), es muy posible que algunas familias tengan el mismo nmero de hijos,
lo que significa que algn o algunos valores de la variable analizada se repiten.
En una distribucin de frecuencias, aparecen los siguientes elementos:
Frecuencia absoluta de un valor xi, que simbolizaremos con ni, y que corresponde al nmero de
veces que se repite el valor xi en la muestra.
Frecuencia relativa de un valor xi, que simbolizaremos con fi, y que corresponde al cociente entre
la frecuencia absoluta de ese valor y el tamao de la muestra, es decir, f i = ni/n; en otras palabras, la
frecuencia relativa equivale a la proporcin y, por lo tanto, asume valores entre 0 y 1.
Frecuencia absoluta acumulada de un valor xi, que simbolizaremos con Ni, y que corresponde al
nmero de veces que se repite en la muestra ese valor x i o cualquier otro valor inferior. Su valor
mximo es n o el nmero total de datos que se tienen.
Frecuencia relativa acumulada de un valor xi, que simbolizaremos con Fi, y que corresponde al
cociente entre su frecuencia absoluta acumulada y el tamao de la muestra, esto es, F i = Ni/n, y cuyo
valor mximo es 1.
Como ya se ha dicho, una distribucin de frecuencias se organiza en forma de tabla, en cuya
cabecera pueden aparecer todos o algunos de los elementos que acabamos de definir, aunque hay
uno, las frecuencias absolutas, que aparece siempre. Por supuesto, los elementos acumulados (tanto
la frecuencia absoluta acumulada como la relativa acumulada) no son posibles en variables
cualitativas; su definicin solo puede aplicarse a variables en las que los nmeros empleados para
representar las modalidades implican magnitudes, mientras que no pueden aplicarse cuando esos
nmeros son etiquetas de las modalidades.
En una distribucin de frecuencias completa, aparece, en primer lugar, una columna con los valores
que adopta la variable, creciendo de arriba abajo. A continuacin de estos valores de la variable,
aparecen los cuatro elementos que acabamos de definir si se trata de una variable cuantitativa,
mientras que si se trata de una variable cualitativa o nominal, solo aparecern los dos primeros (la
frecuencia absoluta de un valor y la frecuencia relativa de dicho valor).

9
Ejemplo 1
Consideremos una poblacin de empleados de una empresa de 1.500 trabajadores y una muestra de
20 trabajadores pertenecientes a dicha poblacin, en la que se cuenta el grado de motivacin
expresado en una escala de 0-4 (donde 0 corresponde a totalmente desmotivado; 1, poco
motivado; 2, medianamente motivado; 3, muy motivado; y 4,totalmente motivado). Los
resultados obtenidos en esta medicin son los siguientes:
2, 1, 0, 3, 2, 2, 3, 1, 1, 0, 1, 2, 1, 2, 0, 2, 4, 2, 3 y 1
A partir de ellos, se va a construir la tabla de frecuencias siguiendo los pasos anteriormente
descritos:
a) Para construir la columna de frecuencias absolutas, contamos el nmero de veces que se repite
cada valor. Si el nmero de valores es muy grande y estamos haciendo manualmente el conteo,
conviene ir haciendo marcas por cada valor para contarlas al final. Una forma de comprobar que no
hemos cometido errores es asegurarnos de que la suma de las frecuencias absolutas es igual al
nmero de respuestas obtenidas, que, en este caso, son 20. Como los anlisis estadsticos suelen
realizarse sobre grandes volmenes de datos, es aconsejable realizar las distribuciones de
frecuencias con la ayuda de software estadstico especializado, como MYSTAT, SPSS, Excel, etc.
b) Para calcular la columna de frecuencias relativas (o proporciones), dividimos cada frecuencia
absoluta por n. Para detectar posibles errores en el clculo, aqu tambin podemos comprobar que la
suma de las frecuencias relativas calculadas ha de ser igual a 1.
c) Las frecuencias absolutas acumuladas se obtienen sumando para cada valor su frecuencia
absoluta ms la absoluta acumulada del valor anterior. De nuevo comprobamos errores verificando
que la frecuencia absoluta acumulada de mayor valor sea igual a n.
d) Finalmente, para obtener las frecuencias relativas acumuladas, dividimos cada frecuencia
absoluta acumulada obtenida en el paso c) entre n. La comprobacin en este caso se refiere a que el
valor mayor de esta frecuencia debe ser igual a la unidad. Podemos observar la tabla resultante a
continuacin:

A partir de una tabla de distribucin de frecuencias, como la presentada en el ejemplo 1, es posible


extraer de forma inmediata algunas informaciones. Por ejemplo, observando las frecuencias
absolutas, comprobamos que la mayora de los trabajadores se encuentran en la categora 2
medianamente motivado, que las categoras extremas totalmente motivado o totalmente
desmotivado no son muy frecuentes, especialmente la de totalmente motivado, que es la menos
frecuente de todas. Otro dato que puede extraerse de la tabla es que el 80% de los empleados se

10
encuentra igual o por debajo de la categora 2 medianamente motivado; en otras palabras, la
mayora de los empleados tiene mediana, baja o muy baja motivacin.
2. Grficas estadsticas
A partir de las distribuciones de frecuencias, se pueden construir representaciones grficas cuya
funcin es resumir informacin y presentarla de forma visual. Existen representaciones grficas de
muchos tipos, pero las ms frecuentes son las siguientes:
2.1 Diagrama de barras
Se puede emplear tanto con variables nominales como con variables cuantitativas discretas. En el
eje de abscisas se sitan las modalidades (o los nmeros que las representan) y en el eje de
ordenadas, las frecuencias (que pueden ser absolutas o relativas y si es una variable cuantitativa,
tambin pueden ser acumuladas). Sobre cada valor de la variable, se levanta una barra perpendicular
cuya altura debe ser igual a la frecuencia.
Adems, la suma de las longitudes de las barras debe ser igual a 1 si las frecuencias representadas
son relativas o a n si las frecuencias representadas son absolutas. En el ejemplo 2, se presenta el
diagrama de barras (realizado en MYSTAT) correspondiente a la frecuencia de bebs nacidos en un
hospital en cada mes del 2011. Como se puede apreciar, el mes es una variable nominal en la que
los nmeros (1 al 12) representan las modalidades que asume la variable (enero, febrero, marzo).
En dicha figura, en el eje Y, se han representado las frecuencias absolutas.
Ejemplo 2. Distribucin de frecuencias del nmero de bebs nacidos en un hospital durante los 12
meses del ao 2013
Enero .............. 66
Febrero ........... 63
Marzo ............. 64
Abril ............... 48

Mayo .............. 64
Junio ............... 74
Julio ................ 70
Agosto ............ 59

Septiembre .... 54
Octubre .......... 51
Noviembre .... 45
Diciembre ...... 42

Para hacer este diagrama de barras en MYSTAT, entramos a la


opcin file-opendata y seleccionamos la base de datos births.
En el men graph, seleccionamos la opcin bar chart; en el eje
X, introducimos los meses del ao (variable month) y en el eje
Y, las frecuencias (variable frequency). En el diagrama,
podemos ver que la mayora de los nacimientos se producen
en los meses centrales del ao.

2.2 Histograma
Es la representacin grfica apropiada para una variable continua cuando los datos estn agrupados
en intervalos. En el eje de abscisas, se ponen los lmites exactos de los intervalos y en el eje de
ordenadas, las frecuencias. Sobre cada intervalo, se levanta un rectngulo cuya rea sea igual a la

11
frecuencia. Si la base del rectngulo es la amplitud del intervalo, la altura es el cociente entre el rea
y la amplitud (recuerde que el rea de un rectngulo es igual a la base por la altura). En el ejemplo
3, se presenta el histograma (realizado en MYSTAT) correspondiente a la distribucin de
frecuencias agrupadas de la edad en la que un grupo de 58 reclusos de una crcel cometi su primer
delito.
Ejemplo 3. Distribucin de frecuencias agrupadas de la edad en la que un grupo de reclusos
cometi su primer delito
Histograma
Para hacer este diagrama en MYSTAT, entramos a la
opcin file-newdata e introducimos en una columna las
edades en las que cada uno de los 58 presos cometi su
primer delito:
42, 44, 36, 25, 19, 22, 33, 26, 33,
21, 31, 23, 25, 25, 24, 28, 23, 34, 42,
23, 34, 33, 31, 36, 33, 26, 28, 32, 13,
16, 31, 29, 19, 11, 19, 27, 21, 24, 21,
24, 19, 23, 24, 13, 22, 14, 15, 27, 12,
12, 19, 16, 15, 22, 17, 25, 17, y 22.
En el men graph, seleccionamos la opcin histogram;
en el eje X, introducimos la variable edad que acabamos
de crear y seleccionamos OK.
En el diagrama, podemos ver que la mayora de los presos cometieron su primer delito entre los 20
y los 25 aos. A la derecha del eje Y, tenemos representada la proporcin, es decir, la columna de
frecuencias relativas (fi).
2.3 Polgono de frecuencias
Si la variable es discreta, el polgono de frecuencias es el grfico que resulta de unir los extremos
superiores de las barras del diagrama de barras. Cuando la variable es continua el polgono de
frecuencias es el grfico que resulta de unir los puntos medios de las barras superiores de los
rectngulos del histograma correspondiente.
Con los mismos datos del ejemplo 2, se construye el siguiente
polgono de frecuencias. Para hacer este diagrama en
MYSTAT, entramos al men graph y seleccionamos la opcin
histogram; en el eje X, introducimos la variable edad y abajo,
en el recuadro type of display, seleccionamos la opcin
frequency polygon y luego OK. Obtenemos la figura de la
derecha. En el diagrama, podemos ver nuevamente que la
mayora de los presos cometieron su primer delito entre los 20
y los 25 aos.

12
2.4 Polgono de frecuencias acumuladas
Cuando la variable es continua, se puede realizar la representacin grfica de la distribucin de
frecuencias acumuladas y esta se denomina polgono de frecuencias acumuladas. En el eje X, se
representan los lmites inferiores de los intervalos; se suele aadir un intervalo inferior cuya
frecuencia ser nula. En el eje Y, se ponen las frecuencias acumuladas, absolutas o relativas. Sobre
cada lmite, se levanta una lnea cuya longitud debe ser igual a la frecuencia acumulada y se unen
los extremos de dichas lneas. En el eje Y, tambin se suelen representar los porcentajes. Dicha
representacin suele ser muy apropiada, pues nos permite conocer directamente qu porcentaje de
casos se encuentra por debajo de dicho valor, constituyendo una representacin grfica de los
percentiles.
Ejemplo 4
Con los mismos datos de los ejemplos 2 y 3, se construye el siguiente polgono de frecuencias
relativas acumuladas expresadas en porcentajes. Para hacer este diagrama en MYSTAT, debemos
introducir en la base de datos los lmites inferiores de los intervalos y los porcentajes acumulados
que se presentan en la tabla. Luego entramos al men graph y seleccionamos la opcin line chart; en
el eje X, introducimos la variable con el lmite inferior de la edad y en el Y, los porcentajes. De esta
forma, obtenemos la siguiente figura, en la que podemos ver, entre otras cosas, que
aproximadamente la mitad (50%) de los presos ha cometido su primer delito antes de los 25 aos:

2.5 Diagrama de sectores o de pastel


Se utiliza con variables cualitativas y es una representacin en forma de crculo en la que este es
dividido en secciones (sectores) cuya superficie es proporcional a la frecuencia (o porcentaje) de la
modalidad correspondiente.
Ejemplo 5
Realizaremos un par de diagramas de pastel utilizando una base de datos de una investigacin sobre
accidentes de automvil. Para hacer estos dos diagramas en MYSTAT, entramos a la opcin fileopen-data y seleccionamos la base de datos accident. En el men graph, seleccionamos la opcin
pie chart. En el men main, pasamos a la derecha la variable que se quiere diagramar, en el primer
caso, Driver$, para saber qu porcentaje de los accidentados ha bebido alcohol, y en el segundo

13
caso, la variable Seatbelt$, para saber si tenan o no puesto el cinturn de seguridad. Finalmente, en
el men options, seleccionamos label the value of each slice, para que nos ponga las etiquetas y
porcentajes correspondientes a cada modalidad. Al terminar, tendremos la figuras que se presentan a
continuacin y en ellas podemos observar, entre otras cosas que casi la mitad de las personas
accidentadas haba bebido y que ms de la mitad (51,6%) no llevaba puesto el cinturn de
seguridad.

2.6 Directrices generales para la elaboracin de grficas estadsticas


Aunque las representaciones grficas de los datos incluidos en una distribucin de frecuencias
pueden realizarse de muy distintas formas, vamos a establecer algunas directrices a seguir para
unificar criterios y realizarlas, siempre que sea posible, de la misma forma:
En el eje de abscisas, colocamos los valores de la variable y en el de ordenadas, las frecuencias
(absolutas o relativas, simples o acumuladas).
La interseccin de los dos ejes es el origen, de modo que, en el eje de abscisas, las puntuaciones
ms bajas estarn a la izquierda y las ms altas, a la derecha; en el de ordenadas, los valores
pequeos estarn abajo y los altos, arriba.
Si el valor mnimo del eje de abscisas es mayor que 0, se debe cortar la lnea para simbolizar que
hay valores entre el 0 y el primer valor representado.
Conviene incluir en cada grfico toda la informacin posible para evitar ambigedades y facilitar
su interpretacin por otras personas o por nosotros mismos al cabo del tiempo (nombre de la
variable en el eje de abscisas, tipo de frecuencia junto al eje de ordenadas, grupo al que corresponde
cada grfica cuando se han representado dos o ms grupos conjuntamente, etc.).
Cuando en un mismo grfico se representan dos o ms grupos simultneamente y estos son de
tamaos considerablemente distintos, se deben utilizar frecuencias relativas.

14
3. Estadsticos descriptivos
Los estadsticos que se utilizan para la descripcin de datos cuantitativos pueden ser de tres tipos:
medidas de tendencia central, medidas de dispersin y medidas de posicin, a continuacin veremos
las principales medidas de cada tipo
3.1 Medidas de Tendencia Central.
Se trata de medidas que resumen, concentran o centralizan la informacin de los datos en un
nmero que los representa lo mejor posible. Principalmente son tres:
Media aritmtica o promedio que corresponde a la suma de los datos dividida por el nmero
total de datos.

Supongamos que un grupo de 10 alumnos de estadstica obtienen las siguientes notas: 7, 8, 8, 7, 3,


1, 6, 9, 3, 8. La media del curso es 6: (7+8+8+7+3+1+6+9+3+8/10 = 6). Una de las propiedades de
la media es que se deja afectar por valores extremos, por eso, cuando existen datos con mucha
dispersin, como en el ejemplo, se suele complementar con otras medidas de tendencia central
como la mediana, que veremos a continuacin.
Mediana. Otra opcin para representar la tendencia central de un conjunto de valores es tomar la
puntuacin que es superada por la mitad de las observaciones, pero no por la otra mitad; en otras
palabras, la puntuacin que divide exactamente por la mitad a la muestra estudiada. Este ndice se
llama mediana, y se suele representar por Mdn.
En el caso del ejemplo anterior, lo primero que debemos hacer para calcular la mediana es ordenar
las notas de menor a mayor:
1, 3, 3, 6, 7, 7, 8, 8, 8, 9
En este caso, como n es un nmero par, se toma como mediana la media aritmtica de los dos
valores centrales, como ambos son 7, Mdn = 7. A travs de la mediana podemos hacer
interpretaciones como: el 50% de los alumnos del curso de estadstica han obtenido notas por
encima de 7. Como vemos, la media es mas baja que la mediana, y si solo reportamos la media
puede resultar engaoso.
Moda. La media y la mediana son medidas que se utilizan cuando los datos son cuantitativos, y
como mnimo, ordinales. Sin embargo, cuando los datos son de naturaleza cualitativa o nominal, no
tiene ningn sentido calcular estas dos medidas, por eso, en su lugar se puede resumir la tendencia
central de los datos utilizando la moda. La moda es el valor de la variable al que corresponde la
mayor frecuencia. En el caso del ejemplo de las notas del curso de estadstica la moda sera 8 pues
es el valor que ms veces se repite (frecuencia ms alta).

15
1, 3, 3, 6, 7, 7, 8, 8, 8, 9
El ejemplo nos ha permitido observar que dependiendo de la medida de tendencia central que
estemos utilizando obtenemos valores diferentes, especialmente cuando los datos son muy
dispersos, no es lo mismo decir que el promedio de un curso ha sido 6 a que la mediana es 7 y la
moda es 8, una unidad de diferencia es un valor considerable, es por ello que, al realizar una
descripcin de datos tambin es necesario tener en cuenta la dispersin de la distribucin, y
precisamente de estas medidas vamos a hablar a continuacin.
3.2 Medidas de Dispersin o Variabilidad
Las medidas de dispersin son estadsticos que permiten al investigador conocer la variabilidad de
los datos con respecto a una medida de tendencia central, generalmente la media. Como se ha dicho
anteriormente los conjuntos de datos no deben describirse solo mediante medidas de tendencia
central, puesto que dos conjuntos de puntuaciones pueden tener la misma media y, sin embargo, ser
muy distintos. Imaginemos el caso de una fiesta en la que la edad promedio es 29 aos. Al escuchar
dicha afirmacin, se puede pensar que los asistentes a la fiesta son personas jvenes (alrededor de
los 30 aos), sin embargo, esta es una conclusin errnea, pues puede tratarse de un abuelo de 80
aos y sus dos nietos de 3 y 4 aos (la media es, efectivamente, 29). Para obtener una visin
completa y comprensiva de los datos, hay que complementar las medidas de tendencia central con
las de otras propiedades de los mismos. Una de las propiedades ms importantes de los conjuntos de
datos es el grado en que estos se parecen o se diferencian entre s. Esta propiedad se denomina
variabilidad y es diferente de la tendencia central.
Aunque hay muchos procedimientos para cuantificar la variabilidad, los ms importantes son la
varianza y la desviacin tpica, tipo o estndar.

Varianza y desviacin tpica

Una idea que se ha demostrado til a la hora de cuantificar la variabilidad es la de trabajar con las
distancias desde los valores hasta algn valor central (comnmente la media aritmtica) y basar la
medicin de la dispersin en algn tipo de separacin promedio hasta ese valor.
Supongamos otro ejemplo, el nmero de veces que 5 pacientes, divididos en dos grupos segn el
tratamiento recibido, sufren insomnio a la semana.
Primer grupo: 4, 3, 2, 1, 0.
Segundo grupo: 3, 2, 2, 2, 1.
En los dos grupos la media aritmtica es 2, pero el segundo grupo es ms homogneo que el
primero, por lo cual la media puede ser ms representativa para este grupo. En el ejemplo
mencionado anteriormente se puede ver que los datos del primer grupo estn, en general, ms
alejados de su media que los del segundo grupo con respecto a la suya. Este hecho puede
objetivarse calculando esas distancias y para ello obtenemos las diferencias entre cada observacin
y su media:
Primer grupo: 2, 1, 0, 1, 2.
Segundo grupo: 1, 0, 0, 0, 1.

16
El mayor grado de concentracin de los valores del segundo grupo sobre su media se manifiesta en
que estas distancias son menores en general, sin embargo, tambin es importante recordar que una
de las propiedades de la media aritmtica es que la diferencia de los valores de una distribucin
respecto a su media aritmtica es igual a cero y, por tanto, tambin lo es su media. Para solventar
este problema, se pueden adoptar diversas soluciones, como, por ejemplo, tomar esas distancias en
valor absoluto o basar el ndice en los cuadrados de esas distancias. En cualquiera de los dos casos,
el sumatorio de las cantidades as transformadas ya no es necesariamente 0, mientras que mantiene
su propiedad de ser sensible al grado de concentracin de los valores entorno a su media.
La solucin basada en los valores absolutos no ha demostrado ser muy til, mientras que la otra
solucin s; por ello, vamos a concentrarnos en sta. Tal y como hemos avanzado, una solucin al
problema de que las distancias respecto a la media sumen 0 consiste en elevar al cuadrado esas
distancias antes de hallar su promedio, dado que los cuadrados son siempre positivos. El ndice
basado en esta idea se llama varianza y se calcula de la siguiente forma:

Cuando se quiere describir el grado de variabilidad de un grupo de valores, basta con obtener este
ndice. As, en el ejemplo anterior, los valores del primer grupo eran 4, 3, 2, 1, 0 y su media
aritmtica era igual a 2. Las distancias con respecto a la media eran 2, 1, 0, 1 y 2. El promedio
de los cuadrados de estas cantidades es la varianza de las observaciones:

La pregunta que surge en este punto es si ese valor 2 indica un grado de variabilidad pequeo,
mediano o grande, es decir, la cuestin que puede surgir es la de cmo valorar el grado de
variabilidad cuantificado mediante este ndice. En realidad no tiene mucho sentido hablar de niveles
altos o bajos de dispersin en trminos absolutos, sino, en todo caso, en trminos comparativos.
Dado que valores de la varianza pueden ser normales en ciertas variables y poblaciones podran
parecer muy grandes en otros casos, no tiene sentido comparar varianzas halladas sobre variables
distintas. La varianza sirve para comparar el grado de dispersin existente entre dos o ms
conjuntos de datos asociados a una misma variable, llegando a conclusiones como la siguiente: la
poblacin de hombres presenta una mayor variabilidad en su estatura que la poblacin de mujeres,
que es ms homognea en esta caracterstica. Efectivamente, este ndice es sensible a los distintos
grados de concentracin en torno al valor medio, y esto podemos constatarlo al calcular la varianza
de los valores del segundo grupo del ejemplo:

A partir de sus varianzas, concluimos que el primer grupo tiene una mayor variabilidad, una mayor
dispersin o que es ms heterogneo que el segundo, dado que su varianza es mayor.

17
Al estudiar por primera vez la varianza, es frecuente que las personas encuentren dificultades para
interpretar los valores obtenidos. As como encuentran natural que la media de los valores del
primer grupo es 2, puesto que es un valor intermedio que podra representar bien la magnitud
general de los datos, por el contrario, el valor 0,4 no parece un nmero claramente relacionado con
los valores de la muestra. Esto se debe a que se utiliz el cuadrado de las diferencias, lo que suele
inflar o reducir el valor de la varianza. Por ello es frecuente que, con el objeto de retomar las
unidades originales de esas distancias, se obtenga la raz cuadrada de la varianza y se use dicha raz
como medida de dispersin o variabilidad. Al ndice as hallado se le llama desviacin tpica, se
representa por sx y se define como la raz cuadrada de la varianza:

En los dos grupos de valores del ejemplo, las desviaciones tpicas seran, 0,41 y 0,63
respectivamente, estos valores guardan ms relacin con la escala de los datos. La desviacin tpica
es un mejor descriptor de la variabilidad, aunque la varianza tenga algunas notables propiedades
matemticas que la hacen idnea para basar en ella los anlisis estadsticos complejos.
Otras medidas de dispersin o variabilidad
Otras medidas de dispersin que pueden ser tiles en la investigacin cientfica son las siguientes:

Rango o recorrido

Es una medida de dispersin que no involucra la media, pues se calcula como el mayor valor de la
distribucin menos el menor valor. Cuanto mayor es el rango de una distribucin, mayor es la
variabilidad de la variable estudiada y, por tanto, mayor es su dispersin. Esta medida proporciona
informacin sobre la variabilidad inicial de la variable estudiada, sin embargo, el rango puede ser
una medida engaosa si hay valores extremos en la distribucin. La expresin del rango es:
R = Xmax. Xmin.

Coeficiente de apertura o de disparidad

Es una medida de dispersin relativa que establece relacin entre el mayor y el menor valor de la
distribucin. El coeficiente de apertura es el cociente entre el valor mximo y mnimo de la
distribucin, como se puede ver en la siguiente expresin:
CA = Xmax./Xmin.

Rango o recorrido intercuartil

Es una medida de dispersin que corresponde a la diferencia entre el tercer y el primer cuartil de la
distribucin analizada, como se puede ver en la siguiente expresin:

18
RI = Q3 Q1

Rango o recorrido semi-intercuartil

Como el rango puede conducir a engao si hay valores extremos en la distribucin. El rango semiintercuartil busca corregir este problema dividiendo el rango intercuartil en 2, mediante la siguiente
expresin:
RSI = (Q3 Q1)/2

Rango percentil 10-90

Se define como la diferencia entre el percentil 90 y el 10. Los cuartiles y percentiles son medidas de
posicin que veremos a continuacin.
3.3 Medidas de posicin.
Las medidas posicionales sirven para hacer valoraciones relativas de la posicin de un dato o de un
individuo en una variable. Son estadsticos diseados especialmente para revelar la situacin de un
dato respecto a la distibucin, utilizando ste como marco de referencia. En los epgrafes siguientes,
describiremos las medidas de posicin ms generales y expondremos sus caractersticas.

Percentiles

Los percentiles son 99 valores de la variable que dividen a la distribucin en 100 secciones; cada
una contiene una centsima parte de las observaciones. Un percentil se interpreta como el
porcentaje de casos que caen o estn por debajo de un valor especfico de x, as, por ejemplo, en el
caso de la puntuacin de una persona en un test, se simboliza mediante P28 a la puntuacin que deja
por debajo de s al 28% de las observaciones y que es superada por el 72%. Si disponemos de esos
99 valores, podremos hacer valoraciones relativas de las puntuaciones individuales. Por ejemplo, si
un individuo obtiene la puntuacin 35 y sabemos que P90 = 35, quiere decir que la puntuacin de
ese sujeto coincide con la del percentil 90 y, por tanto, supera al 90% de las observaciones del grupo
de referencia, mientras que es superada solamente por el 10%, entonces se trata de un examinado
con un nivel de ejecucin muy alto en el test.

Cuartiles

Los cuartiles son cuantiles que dividen una distribucin en 4 grupos de igual tamao (es decir, 25%
de los casos en cada grupo). Cuando una distribucin tiene un amplio rango de puntuaciones, los
cuartiles se obtienen con facilidad a partir de las distribuciones de frecuencias acumuladas que
incluyen los porcentajes acumulados. El primer cuartil (Q1) corresponde al P25, el segundo cuartil
(Q2) corresponde al P50, el tercer cuartil (Q3) corresponde al P75, el cuarto es el valor mayor de la
distribucin por debajo del cual est el 100% de las observaciones.

Deciles

Los deciles son 9 valores de la variable que dividen la distribucin en 10 partes iguales. Cada parte
es un dcimo o un 10% del total. Por ejemplo, D1 es el decil 1, y equivale al punto de la
distribucin por debajo del cual est el 10% de las observaciones; D2 es el decil 2, es decir, el valor
de la variable por debajo del cual se encuentra el 20% de los datos, y as sucesivamente.

19

Los pasos para calcular los percentiles son:


Ordenar las puntuaciones.
Calcular la proporcin y porcentaje de casos con puntuaciones iguales o menores que el caso de
inters.
Indicar el percentil en puntuaciones enteras.
Recordar que los percentiles se obtienen fcilmente de una distribucin de porcentajes acumulada y
son calculados por cualquier paquete de procesamiento estadstico y que el percentil 50 corresponde
a la mediada de la distribucin pues es el valor que deja por debajo el 50% de los valores.

20

PARTE III: Elementos e interpretacin de la inferencia estadstica


Hemos visto en la introduccin de este seminario que el objetivo de la estadstica inferencial es
extraer conclusiones de tipo general a partir de los datos particulares; en otras palabras, permite
hacer inferencias del comportamiento de una poblacin a partir de una muestra que la representa. La
inferencia estadstica tiene dos grandes ramas: el contraste de hiptesis y la estimacin de
parmetros. El contraste de hiptesis nos permite decidir si una proposicin acerca de una poblacin
puede ser mantenida o debe ser rechazada. El contraste de hiptesis tambin se suele llamar prueba
de significacin o prueba estadstica. El objetivo de la estimacin de parmetros es obtener una
aproximacin al valor de cierto parmetro de la poblacin mientras que el de la prueba de hiptesis
es decidir si una afirmacin acerca de una caracterstica de la poblacin es verdadera.
1. Pasos de un contraste de hiptesis
El primer paso del proceso de verificacin de una hiptesis consiste en formular estadsticamente la
hiptesis cientfica que se desea contrastar. Por ejemplo, la hiptesis cientfica: los varones y las
mujeres no difieren en inteligencia puede formularse en trminos estadsticos de la siguiente
manera:
v = m
Que equivale a afrimar que la inteligencia media de los varones ( v) es igual a la de las mujeres (m)
Es importante recordar que los valores o parametros poblacionales se denotan siempre con letras
griegas y los estadsticos muestrales con letras latinas. Como se puede ver las hiptesis estadsticas
siempre se deben realizar a nivel poblacional, pues lo que se pretende a travs de la inferencia
estadstica es precisamente generalizar a toda la poblacin un resultado encontrado con una muestra
representativa de dicha poblacin.
El segundo paso consiste en buscar evidencia emprica que informe si la hiptesis es sostenible o
no. Una hiptesis ser compatible con los datos empricos cuando a partir de ella se puede deducir
un resultado muestral (un estadstico) con un nivel aceptable de precisin. En el ejemplo dado se
espera que si extraemos una muestra aleatoria y significativa de varones y mujeres, las medias
muestrales sern similares. La discrepancia entre la afirmacin propuesta en la hiptesis y el
resultado muestral puede indicar dos cosas: o bien la hiptesis no es correcta o han ocurrido
fluctuaciones en los datos debidas al azar.
El tercer paso es verificar los supuestos, que son una serie de afirmaciones sobre la forma de la
distribucin de la muestra y de la poblacin que se deben cumplir para que el contraste de hiptesis
sea correcto. El cuarto paso es aplicar un estadstico de contraste que tenga una distribucin de
probabilidad conocida y que proporcione informacin relevante sobre la hiptesis que se pretende
probar. El ltimo paso del proceso es tener una regla de decisin en trminos de probabilidad para
establecer si la hiptesis planteada es incorrecta o si, por el contrario, es compatible con los datos
observados. A continuacin veremos detalladamente cada uno de estos pasos:
2. Las hiptesis estadsticas
Una hiptesis estadstica es una afirmacin sobre una o ms distribuciones de probabilidad o sobre
el valor de uno o ms parmetros de esas distribuciones y se suelen representar por la letra H
seguida de una afirmacin que le da contenido a la hiptesis, por ejemplo:

21
H: la variable xi se distribuye normalmente
H: v = m
H: 30
Por lo general la hiptesis estadstica surge de una hiptesis cientfica, pero la segunda se refiere a
algn aspecto de la realidad, mientras que la primera se refiere a una distribucin de probabilidad o
a las caractersticas de un parmetro. Todo contraste de hiptesis se basa en la formulacin de dos
hiptesis: la hiptesis nula representada por H 0 y la hiptesis alternativa representada por H 1. La
hiptesis nula (H0) es la que se somete a contraste. Consiste en una afirmacin concreta sobre la
forma de la distribucin de probabilidad o sobre el valor de algunos de los parmetros de la
distribucin de la variable de estudio, por ejemplo:
H0: la variable xi se distribuye normalmente
H0: v = m o la media de varones es igual a la de mujeres (por ejemplo, la inteligencia).
H0: = 0 o la correlacin entre dos variables es igual a 0 (por ejemplo, entre el rendimiento
acadmico y las horas de estudio).
La hiptesis alternativa (H1) es la negacin de la nula. H1 incluye todo lo que H0 excluye. H0 suele
ser exacta (un parmetro igual a un determinado valor), H1 suele ser inexacta (distinta, mayor que...,
menor que...). Las H1 correspondientes a las hiptesis ejemplificadas anteriormente son:
H1: la variable xi no se distribuye normalmente.
H1: v m o la media de varones no es igual a la de mujeres.
H1: 0 o la correlacin entre dos variables es distinta de 0.
Las hiptesis nula y alternativa suelen plantearse como hiptesis rivales. Son exhaustivas y
mutuamente excluyentes, lo que implica que si una es verdadera, la otra es falsa.
3. Comprobacin de supuestos: Inferencia paramtrica y no paramtrica.
Las tcnicas de inferencia estaditica se clasifican en paramtricas y no paramtricas. Para que las
tcnicas paramtricas arrojen resultados fiables y vlidos es necesario que cumplan una serie de
requisitos llamados supuestos. Algunos de los ms comunes son: la normalidad, mediante el cual
se requiere que las puntuaciones de la(s) variable(s) dependiente(s) tenga una distribucin normal;
la homocedasticidad u homogeneidad de las varianzas poblacionales que se refiere a que los
grupos que conforman las condiciones de la variable independiente tengan varianzas homogneas;
la independencia de las observaciones y que la variable dependiente est medida a nivel de escala
de intervalo.
Para evaluar los supuestos debemos utilizar pruebas de hiptesis estadsticas especficas para cada
supuesto, en el caso de la normalidad podemos usar la prueba de Shapiro-Wilk y la de SmirnovKolmogorov, adems del anlisis descriptivo de la distribucin muestral como las medidas de
curtosis y simetria y el uso de histogramas y diagramas de caja o boxplot para detectar casos
atpicos. Para evaluar la homocedasticidad se suele utilizar el test de Levene y para evaluar el
supuesto de la independencia entre observaciones resulta til la prueba de Rachas.
El incumplimiento de uno o ms de estos supuestos afecta la validez de la conclusin estadstica
pues puede hacer que la distribucin muestral cambie y se modifiquen los elementos de la regla de
decisin que veremos ms adelante, especficamente el llamado valor p que como veremos a

22
continuacin es un elemento fundamental de las pruebas de hiptesis. Las pruebas paramtricas ms
comunes en la investigacin en ciencias sociales son la t de Student, la razn F del anlisis de
varianza (ANOVA) y el coeficiente de correlacin r de Pearson
Las pruebas estadsticas no paramtricas son adecuadas cuando no se cumplen los supuestos de las
pruebas paramtricas, por ejemplo, si los datos no estn en escala de intervalo o si la distribucin es
asimtrica (no se distribuye normalmente). Si utilizamos tamaos de muestra grande es ms
probable que la distribucin se distribuya normalmente, por eso cuando la muestra es pequea se
suelen aconsejar ms las tcnicas no paramtricas, pues a pesar de que tienen menor potencia
estadstica para detectar si existe realmente el efecto tienen la ventaja de que no requieren el
cumplimiento de los supuestos. Existe una gran variedad de pruebas no paramtricas tanto para el
anlisis de variables cuantitativas como para variables cualitativas.
4. El estadstico de contraste:
El tercer paso para realizar una prueba de hiptesis es calcular el estadstico de contraste. Dicho
estadstico es un resultado muestral que cumple la doble condicin de proporcionar informacin
emprica relevante sobre la afirmacin propuesta en la hiptesis nula y adems debe poseer una
distribucin de probabilidad conocida. Por ejemplo, en el caso de la comparacin del nivel de
inteligencia entre varones y mujeres, usaremos un estadstico llamado prueba t de Student, que
cumple los dos requisitos del estadstico de contraste. Ya se ha abordado la importancia de
seleccionar el estadstico de contraste apropiado por lo que no nos extenderemos ms en este tema.
5. La regla de decisin
El cuarto paso de un contraste de hiptesis es tomar una decisin sobre la aceptacin o el rechazo de
la hiptesis nula, este es el paso ms importante de una prueba de hiptesis y en el que ms
debemos fijarnos al realizar una lectura crtica de los trabajos estadsticos de orientacin inferencial.
La decisin no puede ser arbitraria, por el contrario, debe seguir un criterio estadstico. La regla de
decisin es el criterio que vamos a utilizar para decidir si la hiptesis nula debe ser o no rechazada.
Dicho criterio de decisin se basa en la particin de la distribucin de probabilidad del estadstico
de contraste en dos zonas mutuamente excluyentes: la zona de rechazo y la zona de aceptacin.
La zona de rechazo, tambin llamada zona crtica, es el rea de la distribucin de probabilidad del
estadstico de contraste que corresponde a valores que se encuentran tan alejados de la afirmacin
establecida en la hiptesis nula que es muy poco probable que ocurran si H 0 fuese verdadera. Su
probabilidad se llama , que es un valor denominado nivel de significacin estadstica o nivel de
riesgo.
El nivel es definido por el investigador, ya que corresponde al nivel de riesgo que est dispuesto a
tolerar en la decisin que se tome. Un nivel comnmente utilizado es = 0,05, ya que corresponde a
un 5% de error en el rechazo o aceptacin de la hiptesis nula (H 0), que es un nivel de riesgo
tolerable en la mayora de los casos.
La zona de aceptacin es el rea de la distribucin de probabilidad del estadstico que corresponde
a valores del estadstico de contraste prximos a la afirmacin establecida en la hiptesis nula. Es,
por tanto, el rea correspondiente a los valores del estadstico de contraste que es probable que
ocurran si H0 es verdadera. Su probabilidad es 1 , valor al que se suele llamar nivel de
confianza. Un nivel de confianza comnmente utilizado en la investigacin social es 1 = 1

23
0,05 = 0,95, ya que corresponde a un 95% de certeza en el rechazo o aceptacin de la H 0, que es un
nivel adecuado en la mayora de los casos. El tamao de las zonas de rechazo o aceptacin se
determina fijando el valor de .
Dependiendo de cmo se formule la hiptesis alternativa o de investigacin (H 1), los contrastes de
hiptesis pueden ser unilaterales o bilaterales y el criterio para el rechazo de la hiptesis nula
tambin cambia.
Un contraste bilateral es aquel que prueba si la igualdad o diferencia de los estadsticos y su zona
crtica se encuentra repartida a partes iguales entre las dos colas de la distribucin de probabilidad.
Por lo tanto, se toma la decisin de rechazar la hiptesis nula si el estadstico de contraste cae en la
zona crtica o de rechazo, es decir, si el estadstico toma un valor mayor que el percentil 100x(1
/2) de la distribucin estadstica.
Un ejemplo de contraste bilateral es:
H0: 1 = 2 = ... = j. Las j medias poblacionales son iguales.
H1: j j'. No todas las medias son iguales, hay al menos una media que difiere de otra.
En un contraste unilateral se prueba si el valor del estadstico es mayor o menor que un valor
determinado y su zona crtica se encuentra a la derecha o a la izquierda de la distribucin de
probabilidad del estadstico dependiendo del tipo de contraste. Por lo tanto, en los contrastes
unilaterales, la zona crtica se encuentra en una de las dos colas de la distribucin de probabilidad.
Un contraste unilateral derecho es el que se aprecia en el siguiente ejemplo, en el
que la variable medida puede ser la edad:
H0: 30 (la media de la edad es menor o igual a 30 aos).
H1: > 30 (la media de la edad es mayor a 30 aos).
Cuando la hiptesis es unilateral derecha, se toma la decisin de rechazar la hiptesis nula si el
estadstico de contraste cae en la zona crtica que, en este tipo de hiptesis, est en la cola derecha
de la distribucin, es decir, si el estadstico toma un valor mayor que el percentil 100x(1 )
Un contraste unilateral izquierdo se observa en el siguiente ejemplo:
H0: 30.
H1: < 30.
En el contraste unilateral izquierdo, se toma la decisin de rechazar la hiptesis nula si el estadstico
de contraste cae en la zona crtica que est en la cola izquierda de la distribucin de probabilidad del
estadstico, es decir, si el estadstico toma un valor menor que el percentil 100x()
6. El valor p
Actualmente, para que el proceso de decisin sea ms sencillo y no sea necesario consultar tablas
con los percentiles de las distribuciones estadsticas se utiliza el valor p o valor de probabilidad
vinculado a la prueba estadstica. El valor p es el nivel de significacin ms pequeo que conduce al
rechazo de la hiptesis nula, por ello, cuanto ms pequeo sea el valor p mayor evidencia tenemos
de que la hiptesis nula es falsa. Si el valor p es inferior o igual al nivel de significacin estadstica
o alfa establecido a priori podemos rechazar la H0 .

24
Si el valor p es menor que:
0,10, se tiene regular evidencia de que H0 es falsa
0,05, se tiene fuerte evidencia de que H0 es falsa
0,01, se tiene muy fuerte evidencia de que H0 es falsa
0,001, se tiene evidencia extremadamente fuerte de que H0 es falsa
7. Errores estadsticos del contraste de hiptesis
Si solo se dispone de una muestra de la poblacin, entonces el parmetro poblacional no se
conocer con exactitud, nicamente tendremos una aproximacin a l. Por consiguiente, no se
puede saber con seguridad si la hiptesis nula es cierta falsa. Por tanto, cualquier regla de decisin
adoptada tiene cierta probabilidad de llegar a una conclusin errnea sobre el parmetro poblacional
de inters. Existen dos tipos de errores estadsitcos que son inherentes al proceso de contraste de
hiptesis.

Error tipo I. Consiste en rechazar la hiptesis nula (H0) cuando realmente es cierta.
Error tipo II. Consiste en aceptar la hiptesis nula (H0) cuando realmente es falsa.

Hemos visto que, segn la regla de decisin, la probabilidad de cometer el error de tipo I es
equivalente a , es decir, la probabilidad de rechazar la hiptesis nula cuando es cierta es ; es por
ello que se llama tambin nivel de significacin del contraste.
Es importante notar que es una probabilidad condicional; es la probabilidad de rechazar la
hiptesis nula dado que es cierta.
P(Rechazar H0 | H0 es cierta) =
Puesto que la hiptesis nula tiene que ser aceptada o rechazada, la probabilidad de aceptar la
hiptesis nula cuando es cierta es (1 ), es decir:
P(Aceptar H0 | H0 es cierta) = 1
Recurdese que 1 es el nivel de certeza.
Por otro lado, la probabilidad de cometer el error de tipo II se llama , es decir, la probabilidad de
aceptar una hiptesis nula falsa se denota por . Tambin puede verse como:
P(Aceptar H0 | H0 es falsa) =
Entonces, la probabilidad de rechazar una hiptesis nula falsa es (1 ), y se denomina potencia
estadstica del contraste. Visto como una probabilidad condicional:
P(Rechazar H0 | H0 es falsa) = 1
Idealmente, las probabilidades de los dos tipos de error deberan ser 0 o lo ms pequeas posible.
Sin embargo, hay una clara compensacin entre las dos. Cuando se ha tomado una muestra,
cualquier modificacin de la regla de decisin que haga menos probable rechazar una hiptesis nula
cierta, inevitablemente, se traducir en mayor probabilidad de aceptar esta hiptesis cuando es falsa.
En otras palabras, cuando decrece, aumenta, y viceversa.

25
En general, cuando se planifica una investigacin para obtener unas conclusiones estadsticas
vlidas, el valor mximo de se sita en 0.2, buscando una potencia estadstica de 0.8 (Hallahan y
Rosenthal, 1996). Sin embargo a diferencia de lo que ocurre con el valor de que es definido
previamente por el investigador, el investigador no tiene control de lo que sucede con el (o con la
potencia estadstica) hasta que ejecuta la prueba estadstica y slo puede planificarlo en funcin de
otros elementos que se abordarn ms adelante como el tamao del efecto y el nmero de
observaciones que afectan la potencia a posteriori, es decir cuando ya se ha realizado el anlisis
de los datos.
8. Errores humanos en el proceso de toma de decisin
Hasta este punto se ha presentado el procedimiento comnmente usado para la inferencia
estadstica, sin embargo, son diversos los errores que pueden cometer los investigadores a la hora de
valorar y analizar estos resultados, el factor humano se convierte, entonces, en una pieza clave en la
correcta interpretacin de las pruebas de hiptesis estadsticas (Oakes, 1996; Frias-Navarro,
Pascual, 2010). Siguiendo a los dos autores citados se mencionarn a continuacin algunas de las
creencias errneas ms comunes entre los investigadores y porfesionales:
Creencia errnea 1: el valor p es el valor de alpha. Existe una gran confusin entre estos dos
valores, sin embargo son claramente diferentes, el valor p, al ser la probabilidad del resultado
obtenido con la prueba estadstica asumiendo que H0 es cierta, se calcula a posteriori, es decir
cuando ya se ha hecho la prueba de hiptesis, por el contrario el valor o error de tipo I se fija a
priori y se planifica en funcin del diseo de investigacin y precisamente es el que se compara con
el valor p para tomar la decisin estadstica. Como el valor p es una probabilidad y tiene cierto
grado de error, mediante su comparacin con lo que hacemos es controlar el margen de error, es
decir, si p < rechazamos la Ho con un margen de error o equivocacin equivalente al valor
que hemos seleccionado.
Creencia errnea 2: el valor p > implica que la Ho es cierta. De la misma forma que un
resultado estadsticamente significativo no implica que la H 0 sea falsa, un resultado no significativo
no implica que la Ho sea cierta. Cuando se encuentra que p > lo nico que se puede concluir es
que no existe evidencia estadstica suficiente para rechazar la H 0 y por tanto los datos no son
concluyentes, no se puede concluir que no hay una relacin entre variables o que no existe un
efecto.
Creencia errnea 3: el valor p seala la importancia del efecto. El valor p no seala la magnitud
del efecto deseado. Para obtener esta informacin es necesario calcular algn estadstico del tamao
del efecto. Obtener un resultado estadsticamente significativo solo indica que la H 0 es poco
plausible pero no indica nada sobre la magnitud del efecto ni sobre la importancia de las diferencias
encontradas.
Creencia errnea 4: el valor p: excesiva confianza en la significacin estadstica. Un error
bastante comn en los investigadores es la creencia en que el rechazo de la H 0 (producido por el
valor p) implica la aceptacin de la hiptesis alternativa, y en consecuencia el efecto o diferencia
encontrada se suele atribuir a una de las posibles hiptesis sustantivas (su hiptesis de
investigacin). Asumir que el efecto o las diferencias encontradas estn provocadas por la hiptesis
de investigacin es un error de excesiva confianza en la decisin estadstica tomada y adems de la
significacin estadstica hay que tener en cuenta otros factores como el diseo de la investigacin,
especficamente dentro del diseo encontramos tres factores fundamentales que afectan la
significacin estadstica: a) el tamao del efecto, b) la variabilidad de los datos y c) el tamao de la

26
muestra. El valor p ser ms pequeo a medida que el tamao del efecto y de la muestra es mayor,
por tanto, para un determinado tamao del efecto el valor p es un reflejo del tamao de la muestra,
de esta manera se puede obtener un efecto estadsticamente significativo con muestras grandes a no
ser que el tamao del efecto sea 0.
Otro importante factor a tener en cuenta a la hora de valorar la significacin estadstica es la falta de
plausibilidad de la hiptesis nula que suele ser muy frecuente en las ciencias sociales. Recordemos
que la H0 slo tiene un valor asociado, el cero, mientras que la hiptesis alternativa se vincula con
una amplia cantidad de valores, la probabilidad de que un tratamiento tenga un efecto exactamente
de 0 es muy pequea haciendo que la H0 sea poco plausible.
Una de las opciones para solucionar los problemas anteriormente mencionados es plantear la prueba
de significacin estadstica junto con el tamao del efecto y sus intervalos de confianza; tambin
disear los estudios con rigor metodolgico, con un muestreo adecuado, con una planificacin de la
potencia estadstica y con una eleccin apropiada del diseo. Otras estrategias adems de las ya
mencionadas al procedimiento clsico de significacin estadstica es el uso de grficos para
representar los datos, informar los valores exactos de p, estimacin de intervalos de confianza para
los estadsticos, comprobar modelos alternativos, usar el meta-anlisis y hacer test de ajuste
aproximado. A continuacin profundizaremos en el aspecto ms importante que es la estimacin del
tamao del efecto y sus intervalos.
9. Estimacin del tamao del efecto
El tamao del efecto es el nombre dado a un conjunto de ndices cuantitativos que cuantifican la
magnitud de la diferencia entre grupos o la relacin entre variables, en otras palabras, proporcionan
informacin sobre el grado en que los resultados de la muestra difieren en la hiptesis nula; estas
medida puede ser estandarizada o no estandarizada. Cuando se trabaja con ndices estandarizados es
posible comparar tamaos del efecto obtenidos en diferentes investigaciones, es por eso que su
presentacin en los informes cientficos en conjunto con el intervalo de confianza resulta de suma
utilidad para el investigador, que puede comparar los tamaos de efecto obtenidos en su
investigacin con estudios previos del mismo tema, un valor del efecto pequeo puede resultar
importante en un contexto en el que otros investigadores han obtenido tambin tamaos de efecto
pequeos. Debido a esta caracterstica los estadsticos del tamao de efecto son los que se utilizan
para las investigaciones primarias (o individuales) en un estudio de meta-anlisis en el que se
busca encontrar el tamao de efecto medio de diversas investigaciones de un mismo tema.
El tamao del efecto se puede usar para comunicar informacin en un trabajo individual sobre la
magnitud del efecto encontrado permitiendo su comparacin con otros trabajos similares, permitir
los anlisis de potencia estadstica a priori y estimar el tamao de la muestra para lograr un nivel
aceptable de potencia estadstica y tambin para integrar los resultados de los estudios en un trabajo
de meta-anlisis o revisin sistemtica cuantitativa identificando el tamao medio del efecto.
El tamao del efecto estima un parmetro independiente del tamao de la muestra y existe un
amplio nmero de ndices del tamao del efecto, las tres familias principales de tems son: a)
ndices basados en la diferencia estandarizada de medias, donde el tamao del efecto seala el grado
de la diferencia estandarizada entre dos medias, ejemplos de este tipo de ndices son la d de Cohen
(1988), g de Hedges (1982) y delta de Glass (1976); b) ndices basados en el coeficiente de
correlacin en donde el tamao del efecto expresa el grado de asociacin entre dos variables,
ejemplos de este tipo de ndices son la r de Pearson, el coeficiente de correlacin Phi, el coeficiente
de correlacin biserial puntial rbp, esta familia incluye tambin los ndices de tamao del efecto que

27
expresan la proporcin de varianza explicada como el cuadrado de la correlacin vinculado al
coeficiente de deteminacin R2 en el anlisis de regresin y a la proporcin de varianza explicada
en el ANOVA, conocidas como 2 (eta al cuadrado), 2p (eta al cuadrado parcial), 2 (omega
cuadrado) y la correlacin intraclase I; c) ndices de riesgo para tablas de contingencia 2x2 con
resultados dicotmicos como el riesgo relativo, los Odds Ratio donde se estima la proporcin de
sujetos que experimentan un determinado resultado y en estudios de supervivencia el determinado
Hazard Ratio (HR razn de riesgos).

28

PARTE IV: Valoracin crtica del uso de la estadstica en la investigacin social


1. Eleccin de la tcnica estadstica apropiada segn las caractersticas de la investigacin
Para seleccionar la tcnica estadstica ms adecuada es necesario considerar varias caractersticas de
la investigacin, pero es de especial importancia considerar el tipo de diseo que se ha empleado
para comprobar las hiptesis, el nivel de medida de las variables y el cumplimiento de los
supuestos.
1.1 El tipo de diseo
Comenzaremos con algunas breves consideraciones sobre el diseo de investigacin, para que el
lector pueda conocer las diferentes estrategias que pueden ser aplicadas en funcin de la hiptesis
de trabajo, sin embargo, no es nuestro objetivo profundizar en este amplio tema. Los elementos
implicados en el diseo son: a) la estrategia de comparacin de grupos, b) la tcnica de control
utilizada, c) el nmero de factores o niveles de la variable independiente y d) el nmero de variables
dependientes. La clasificacin ms general de los diseos de investigacin distingue entre diseos
intra-sujetos, entre-sujetos y diseos mixtos. Los diseos entre-sujetos se caracterizan por
observar o medir diferentes unidades experimentales en diferentes condiciones de tratamiento o
grupo aplicando una sola medicin para cada unidad, tambin se conoce como diseo transversal o
de medidas independientes. Los diseos intra-sujetos se caracterizan porque todas las condiciones
experimentales reciben todas las condiciones de tratamiento y por lo tanto son medidas
repetidamente en el mismo sujeto, por eso tambin se conoce como diseo de medidas repetidas o
diseo longitudinal.
En los diseos entre-sujetos los efectos del tratamiento (o variable independiente) se estiman
comparando las diferencias entre los grupos (o unidades) que han recibido los tratamientos
diferentes. En los diseos intra-sujeto los efectos del tratamiento se estiman realizando
comparaciones sobre un mismo sujeto a travs de las diferentes mediciones a lo largo del tiempo.
Los diseos mixtos consisten en una combinacin de factores entre e intra sujeto en un mismo
diseo de investigacin.
De acuerdo a la forma como se configuran los grupos para aplicar los tratamientos los diseos
pueden ser completamente aleatorios o con restricciones a la aleatorizacin, esto ltimo supone
que hay algn factor o tratamiento que no se ha asignado al azar o algn criterio que impide la
asignacin aleatoria directa de los tratamientos (por ejemplo, en el caso de los cuasi-experimentos).
La asignacin puede ser tambin totalmente no aleatoria como sucede en la metodologa no
experimental.
En funcin del nmero de variables dependientes o variables medidas incluidas en el diseo
podemos hablar de anlisis univariado (una sola variable dependiente) o multivariado (dos o ms
variables dependientes). Asi mismo, de acuerdo al nmero de variables independientes incluidos en
el diseo podemos hablar de diseos unifactoriales o factoriales cuando incluyen dos o ms
variables independientes.
Los diseos completos son aquellos que incluyen todas las posibles combinaciones de niveles de
las variables independientes, por ejemplo, en un diseo 2x2 existen 4 condiciones o tratamientos,
por ejemplo la variable independiente A con dos niveles (A1 y A2) combinado con la variable
independiente B con los niveles (B1 y B2) produce 4 condiciones experimentales (A1B1, A1B2,
A2B1, A2B2). Los diseos pueden ser incompletos cuando no se incluye alguna de las

29
combinaciones en la investigacin. Un diseo es equilibrado o balanceado cuando el nmero de
observaciones es el mismo para cada condicin y no equilibrado o no balanceado cuando esto no
ocurre.
1.2 El nivel de medida de las variables
El objetivo de la estadstica es analizar informacin emprica. Dicha informacin se conoce como
dato. Un dato puede ser un nmero (si la variable es cuantitativa) o una modalidad (si la variable es
cualitativa). Para analizar datos cualitativos, se suelen asignar nmeros a las caractersticas de las
personas u objetos que se desean estudiar, sin embargo, estos nmeros no implican cantidad,
simplemente son etiquetas asignadas a las categoras o modalidades de las variables que se estn
analizando. Entonces, podemos decir que una variable es cuantitativa cuando puede ser expresada
de forma numrica, y esos nmeros representan cantidades, por ejemplo, el peso, la estatura, el
salario o el nmero de hoteles en una poblacin. Por su parte, una variable es cualitativa (o
categrica) cuando los niveles que puede asumir son categoras o nmeros que no indican cantidad,
sino la pertenencia a una modalidad, por ejemplo, color de ojos, sexo, nacionalidad, religin o
estado civil.
Por su parte, las variables cuantitativas se pueden dividir, a su vez, en dos: variables continuas y
discretas. Las variables continuas son producto de la medicin y contienen cifras decimales,
mientras que las variables discretas son el resultado de conteos y solo asumen valores enteros (Pea
y Romo, 2003). Ejemplos de variables continuas son el peso, la estatura, la velocidad o el tiempo,
mientras que el nmero de hijos en una familia o el nmero de hoteles en una poblacin son
variables discretas.
Hemos visto que los objetos y sujetos manifiestan caractersticas segn diversas modalidades, que
llamaremos niveles de las variables, que no son ms que los valores que puede asumir cada
variable. Por ejemplo, las personas manifiestan la caracterstica sexo segn dos modalidades
(niveles): hombre y mujer; la caracterstica religin segn muchos niveles: catlico, protestante,
budista, musulmn, etc.; finalmente, la caracterstica peso en los seres humanos posee infinitos
niveles, ya que entre dos modalidades, por prximas que se encuentren, siempre son posibles otras
modalidades intermedias. Por tanto, podemos definir una medida como la atribucin de nmeros a
las modalidades o el establecimiento de niveles para las variables segn ciertas reglas, el conjunto
de medidas con sus modalidades se llama escala. A continuacin, se presentarn las caractersticas
fundamentales de un sistema de clasificacin de variables en cuatro escalas de medida que es el ms
utilizado en ciencias sociales y que fueron definidas inicialmente por Stevens (1946, 1951).

Escala nominal: Consiste en clasificar en categoras a los sujetos u objetos que se desea medir, de
modo que los sujetos clasificados en determinada categora sean iguales respecto a la propiedad que
se est midiendo. En otras palabras, las observaciones incluidas en la misma clase son consideradas
como cualitativamente iguales y las que se incluyen en clases diferentes son consideradas como
cualitativamente diferentes, y se utiliza una clase por cada nivel de la variable que se est
estudiando. Un ejemplo de variable medida en esta escala es el color de ojos (azul, verde, negro...).
Escala ordinal: La medida ordinal permite asignar a los sujetos u objetos medidos un nmero que
posibilite ordenarlos segn la cantidad de variable que poseen. Adems de poseer la relacin de
igualdad-desigualdad propia de la escala nominal, los nmeros asignados permiten afirmar que un
elemento medido es mayor o menor que otro. Un ejemplo de variable medida en esta escala es el
nivel educativo (primaria, secundaria, bachillerato, universidad...)

30
Escala de intervalo: En la medida de intervalo, adems de poder decirse que un sujeto u objeto
posee ms o menos cantidad de variable que otro, tambin es posible determinar la magnitud de la
diferencia existente entre los elementos medidos. En otras palabras, se puede conocer la cantidad de
variable en la que difieren dos sujetos u objetos. En esta escala, se define una unidad de medida y se
asigna a cada elemento medido un nmero indicativo de la cantidad de variable que posee en
trminos de la unidad de medida establecida. Un ejemplo de esta escala es la puntuacin en una
prueba de conocimientos (1, 2, 3, 4...).
Escala de razn: La medida de razn aade a la de intervalo la presencia de un 0 absoluto, que
indica la ausencia total de la cantidad medida. El 0 pasa de ser un punto arbitrario de la escala a ser
un punto fijo que indica que no existe cantidad ninguna de variable. Al igual que en la escala de
intervalo, las diferencias entre los objetos medidos son constantes (existiendo una unidad de
medida), pero, adems, la presencia del 0 absoluto permite afirmar que un objeto posee el doble o el
triple de cantidad que otro. La variable velocidad es un ejemplo tpico de este tipo de escalas.
1.3 Cumplimiento de los supuestos

Los supuestos se utilizan en el contexto de la inferencia estadstica, por ello no vamos a profundizar
en ellos en este momento, sin embargo, como resulta crucial verificarlos antes de utilizar una
prueba estadstica y con base a ellos decidir si utilizamos tcnicas paramtricas (cumplimiento
estricto de supuestos) o no paramtricas (cuando no se cumplen los supuestos); los vamos a
mencionar a continuacin brevemente. Los supuestos son afirmaciones que necesitamos establecer
(sobre la poblacin de partida y sobre la muestra utilizada) para conseguir determinar la distribucin
de probabilidad en la que se basar nuestra decisin sobre la hiptesis nula, estas restricciones
cambian segn la prueba estadstica que estemos utilizando como ya se ha dicho es muy importante
verificar su cumplimiento antes de tomar decisiones con base en los resultados obtenidos. Algunos
son ms restrictivos que otros y es importante tener en cuenta que el incumplimiento de uno o
varios supuestos puede invalidar el contraste y conducirnos a una decisin equivocada.
1.4 La eleccin de la tcnica estadstica
Ya hemos visto los elementos que son importantes a la hora de seleccionar una tcnica estadstica, a
continuacin se presentan algunos ejemplos de tcnicas estadsticas que se pueden utilizar segn las
caractersticas de la investigacin (diseo, nivel de medida de las variables y supuestos). La Tabla
A1 presenta tcnicas descriptivas univariantes, la tabla A2 algunas medidas de asociacin entre
variables cualitativas, la tabla A3 presenta los estadsticos que sirven para relacionar variables
cuantitativas, la Tabla A4 las pruebas paramtricas de comparacin de grupos en diseos
unifactoriales (intra y entre sujetos), la Tabla A5 presenta las tcnicas paramtricas para utilizar en
diseos factoriales (intra y entre sujetos), finalmente la Tabla A6 presneta algunas tcnicas no
parametricas ms utilizadas para la comparacin de grupos. Las tablas han sido retomadas del
manual de Anlisis de Datos y Diseo en Psicologa de los autores Martnez-Arias y Chacn (2011)
Como conclusin de este epgrafe podemos decir que la eleccin de la tcnica estadstica ms
apropiada es un proceso complejo que requiere verificar y comprobar diversas caractersticas de la
investigacin y que comnmente suele ocasionar errores que solemos encontrar cuando realizamos
una lectura crtica de los trabajos y artculos de naturaleza estadstica.

31

32

33

34

2. Recomendaciones para mejorar el uso de la estadstica en la investigacin socia


En la actualidad muchos investigadores se estn replanteando el uso de la estadstica en la
investigacin. Uno de los primeros fue Cohen (1994), quien ha concluido que la interpretacin
errnea del nivel de significacin est muy extendida por lo tanto ha sugerido hacer un uso mayor
del anlisis exploratorio de datos, as como proporcionar intervalos de confianza, junto con los
contrastes de hiptesis. Este autor tambin recomienda utilizar el meta-anlisis y replicar las
investigaciones, pues afirma que con los resultados de slo una investigacin sobre un tema, no se
puede ser concluyente. Por su parte, una de las sociedades americanas con mayor importancia en la
regulacin de la investigacin en ciencias sociales, la American Psychological Association (APA),
cre una comisin especfica: The Task Force on Statistical Inference. Los resultados de esta
comisin (Wilkinson, 1999) sugieren a los investigadores:

35
a) Describir adecuadamente los datos, incluyendo las omisiones o no respuestas y asegurarse que
los resultados estadsticamente significativos no se producen debido a anomalas o valores atpicos
o a problemas en la seleccin de los datos
b) Se recomienda las estimaciones de los efectos y los intervalos de confianza y no usar la
expresin aceptar la hiptesis nula
c) Se deben usar procedimientos especficos para comparaciones mltiples (por ejemplo el test de
Tukey en Anlisis de varianza) para tratar las situaciones en que se deben hacer varias
comparaciones en la misma muestra.
d) Se debe proporcionar informacin sobre la potencia adems de informacin sobre el tamao de la
muestra.
e) Definir con claridad la poblacin y la muestra, as como el procedimiento de muestreo o la
forma de asignar sujetos a los tratamientos. Tambin se recomienda controlar las variables
relevantes cuando no ha habido diseo aleatorio.
3. Lectura y valoracin crtica de trabajos de naturaleza estadstica
Ya hemos afirmado que la lectura crtica de los informes de investigacin, objeto del presente
seminario, es una herramienta esencial no solo para la realizacin ms adecuada del trabajo
particular de cada investigador, sino tambin para el avance de la ciencia en general. La
transparencia en los resultados y la correcta estructuracin del trabajo son dos aspectos
fundamentales para valorar la evidencia aportada en cada estudio. Resulta fundamental fomentar el
pensamiento meta-analtico en los investigadores mediante el que se procura comparar los
resultados de la propia investigacin con otros trabajos del mismo tema. Los sesgos en la
estimacin de los efectos, su omisin o la exageracin de resultados estadsticamente significativos
sin valorar su utilidad prctica puede conducir a que la calidad de los informes de investigacin no
es la adecuada y si el investigador no sabe analizarlo de forma crtica se puede generar conclusin e
invalidez de los hallazgos, o puede conducir a conducir nuevas investigaciones mal fundamentadas.
Hemos visto que el primer paso para realizar un trabajo doctoral es la lectura crtica de diversos
trabajos relacionados con la temtica a tratar, sin embargo, generalmente el volumen de trabajos
empricos reportados o publicados es tan elevado que es prcticamente imposible que un
investigador logre leer en profundidad todos los trabajos que encuentra sobre su tema de trabajo. El
objetivo de este seminario es que el doctorando adquiera las capacidadpara destacar en su bsqueda
bibliogrfica aquellos trabajos que tengan la mayor claridad metodolgica y que propendan por una
mayor evidencia de validez de sus resultados.
Dada la necesidad de fomentar en los investigadores la lectura crtica de los trabajos empricos de
naturaleza estadstica y tambin como gua prctica para los investigadores que escriben artculos,
diversas instituciones y revistas (APA, 2008; PRISMA group, 2009; STARD group, 2005;
CONSORT group, 2010, entre otras) han desarrollado listados de comprobacin que buscan ayudar
a que los investigadores planifiquen y chequeen todos aquellos elementos que podran afectar la
calidad y validez de los hallazgos a continuacin, aunque la mayora de los listados han sido
generados en el mbito de las Ciencias de la Salud, a continuacin se mencionarn algunos de ellos
puesto que pueden ser de utilidad para otros mbitos de investigacin cientfica:

36
CONSORT, 2010 (Consolidated Standards for Reporting Trials): consta de 25 tems dirigidos a
la evaluacin de ensayos clnicos aleatorios. Se puede descargar el listado de comprobacin en
http://www.consort-statement.org/consort-statement/
MOOSE, 2000 (Meta-Analysis of Observational Studies in Epidemiology): consta de 35 items
que sirven para revisar meta-anlisis de estudios observacionales. Las directrices se pueden
descargar en: http://onlinelibrary.wiley.com/doi/10.1002/9780470754887.app2/pdf
PRISMA, 2009 (Preferred Reporting Items for Systematic Reviewand Meta-Analyses): Consta
de 27 items que sirven para revisar meta-anlisis. Se puede descargar el listado de comprobacin
en: http://www.prisma-statement.org/2.1.2%20-%20PRISMA%202009%20Checklist.pdf
STARD, 2001 (Standars for Reporting of Diagnostic Accuracy, 2001): consta de 25 items y se
utiliza para valorar la precisin de las pruebas diagnsticas, se puede descargar el listado de
comprobacin en: http://www.stard-statement.org/
STROBE, 2008 (Strengthening the Reporting of Observational Studies in Epidemiology):
consta de 22 items que permiten revisar diseos de cohortes, de casos y controles y transversales. Se
pueden descargar varios listados de comprobacin segn el tipo de diseo en:
http://www.strobe-statement.org/index.php?id=available-checklists
TREND, 2004 (Transparent Reporting of Evaluations with Nonrandomized Designs): consta
de 22 items que permiten valorar diseos no experimentales. e puede descargar el listado de
comprobacin en: http://www.cdc.gov/trendstatement/

37

PARTE V: Bibliografa complementaria


American Psychological Association (APA, 1996). Task Force on Statistical Inference Report.
Washington, D.C: APA.
Amn, J. (1979). Estadstica descriptiva. Madrid: Pirmide.
Balluerka, N. (1999). Planificacin de la investigacin: la validez del diseo. Salamanca: Amar
Balluerka, N., Gmez, J., & Hidalgo, D. (2005). The controversy over null hypotesis significance
test revisited. Methodology: European Journal of Research Methods for the Behavioral and
Social Sciences, 1 55-70
Batanero, C. (2000). Controversies around the role of statistical test in experimental research.
Mathematical Thinking and Learning, 2, 75-98
Batanero, C. (1999). Hacia dnde va la educacin estadstica? Biaix, 5, 2-3
Cook, T.D. & Campbell, D.T. (1979). Quasi-experimentation: Design and analysis issues for field
settings. Boston: Houghton Mifflin
Cumming, G. (2012). Understanding the new statistics: Effect sizes, confidence intervals, and
meta-analysis. New York: Routledge.
Cumming, G., Williams, J. & Fidler, F. (2004). Replication and researchers' understanding of
confidence intervals and standard error bars. Understanding statistics, 3, 299-311
Daz, M.C., Batanero, C. & Wilhelmi, M.R. (2008). Errores frecuentes en el anlisis de datos de
educacin y psicologa. Publicaciones, 35, 109-123
Daz, M.C., y de la Fuente, I (2004). Controversias en el uso de la inferencia en la investigacin
experimental, metodologa de las ciencias del comportamiento, edicin especial 2004, 161-167
Ellis, P.D. (2010). The essential guide to effect sizes. Statistical power, meta-analysis and the
interpretation of research results. Cambridge, UK: Cambridge University Press
Falk, R. (1986).Missconceptions of statistical significance. Journal of Structural Learning, 9, 83-96
Fidler, F., & Cumming, G. (2013). Effect size estimation and confidence intervals. In J. A. Schinka
& W. F. Velicer (Eds.) Handbook of psychology. Vol. 2: Research methods in psychology (2nd
ed.) (pp. 142-163). Hoboken, NJ: Wiley.
Frias-Navarro, D. (2011). Tcnica estadstica y diseo de investigacin. Valencia: Palmero
Ediciones
Garfield, J. B. (2003). Assessing statistical reasoning. Statistics Education Research Journal, 2, 2238
Glass, G. V., McGaw, B., & Smith, M.L. (1981). Meta-analysis in social research. Newbury Park,

38
CA: Sage.
Hernandez, R., Fernandez, C. y Baptista,P. (2007). Fundamentos de metodologa de la
investigacin educativa. Madrid: McGraw-Hill
Holland, P.D. (1986). Statistics and causal inference. Journal of American Statistical Association,
81, 945-970
Judd, C.M. & Kenny, D.A. (1981). Estimating the effects of social intervention. Cambridge:
Cambridge University Press
Kirk, R.E. (2001). Promoting good statistical practices: Some suggestions. Educational and
Psychological Measurement, 61, 213-218
Len, O.G. y Montero, I. (2004). Mtodos de investigacin en psicologa y educacin, 3. ed.,
Madrid: McGraw-Hill.
Martnez-Arias, R. y Chacn, J. (2011). Anlisis de datos y diseo en Psicologa. Madrid: UDIMA
Monterde i Bort, H., Frias-Navarro, D., & Pascual, J. (2010). Uses and abuses of statistical
significance test and other statistical resourses: A comparative study. European Journal of
Psychology of Education, 25, 429-447
Pea, D. y Romo, J. (2003). Introduccin a la estadstica para las ciencias sociales. Madrid:
McGraw-Hill.
Ritchey, F.J. (2008). Estadstica para las ciencias sociales. Madrid: McGraw-Hill,
Romero, S.J y Ordez, X. (2011). Estadstica descriptiva e inferencial. Madrid: UDIMA.
Snchez-Meca, J., Marn-Martnez, F. & Lpez-Lpez, J.A. (2011). Meta-anlisis e intervencin
psicosocial basada en la evidencia. Intervencin psicosocial, 20(1), 95-107
Wild, C.J. & Pfannkuch, M. (1999). Statistical thinking in empirical enquiry. International
Statistical Review, 67, 223-265

Вам также может понравиться