Академический Документы
Профессиональный Документы
Культура Документы
A. Concepto de Estadística.
En cambio, la Estadística entendida como ciencia tiene un origen más reciente y el gran
desarrollo de la misma ha tenido lugar, fundamentalmente, a lo largo del siglo XX. Como
ciencia, la Estadística está formada por el conjunto de métodos y técnicas que permiten la
obtención, organización, síntesis, descripción e interpretación de los datos para la toma
de decisiones en ambiente de incertidumbre. Ese objetivo que persigue la Estadística con
la organización y síntesis de los datos tiene su razón de ser en el hecho de que la misma
se preocupa del estudio de los que podemos denominar como fenómenos de masas. Es
decir, la Estadística no está interesada en el estudio de datos aislados, pues si la
información es escasa no tiene sentido plantearse problemas de organización ni de
síntesis. Así, si se estudian los gastos en publicidad de las empresas de una determinada
rama de actividad y se tiene información para solo dos empresas, entonces, con esos dos
datos no ha lugar plantearse si los mismos han de presentarse mediante una tabla o un
gráfico o si deben resumirse mediante un promedio. Esa escasez de información no
debiera ser nunca objeto de análisis estadístico, pues la descripción de la misma es
irrelevante y a partir de ella poco se puede decir en relación con los gastos en publicidad
de todas las empresas.
1
En el párrafo anterior han aparecido, no por casualidad, tres términos que nos van a
permitir desdoblar a la Estadística en dos ramas principales. Esos términos son: describir,
probabilidad y toma de decisiones con incertidumbre. El primero de ellos da lugar a lo que
se conoce como Estadística Descriptiva. Esta rama es la más antigua de la Estadística y
su objeto es el análisis de los datos para descubrir o describir las posibles regularidades
que presenten. Paralelamente, aunque con posterioridad, se desarrolló la Teoría de la
Probabilidad. La unión ambas ha dado lugar a lo que se conoce como Estadística
Matemática o Inferencia Estadística. El instrumental propio de esta rama es el que nos
permite tomar decisiones en ambiente de incertidumbre. Se trata de decisiones basadas
en la información que suministran los datos y que permiten generalizar los resultados
obtenidos.
La observación estadística.
Ahora bien, una vez que se tiene claro que el objeto de la Estadística es la observación y
estudio de las poblaciones, la siguiente cuestión que puede plantearse es como ha de
realizarse esa observación. La misma puede ser exhaustiva o parcial. Las dos formas
tienen ventajas e inconvenientes. En el caso de la observación exhaustiva o total, y si se
asume que no hay errores de medida entonces, lo que se consigue es eliminar la
incertidumbre.
2
categorías distintas. Por un lado está la subpoblación y por otro la muestra. Con la
primera lo que se hace es observar a un conjunto de entes o elementos de la población
que guardan entre si una cierta característica y que los diferencia de los demás. Así,
siguiendo con el ejemplo anterior, los electores que no han votado antes porque en las
elecciones anteriores no tenían la edad mínima exigida constituyen una subpoblación. Al
proceder de esta forma se consigue realizar una operación estadística en menos tiempo y
a menor coste pero, en cambio, la incertidumbre acerca de la intención de voto del
electorado es enorme, pues esa subpoblación no representa en absoluto a toda la
población. Su intención de voto no tiene por qué coincidir con la de los demás electores.
La segunda opción de la observación parcial consiste en tomar una muestra. En este caso
se observará también un subconjunto de elementos de la población. Pero ahora, a
diferencia de lo que ocurría con la subpoblación, los elementos de la muestra no guardan
ninguna característica especial que los diferencie de los demás. Al contrario, con una
muestra lo que se pretende es representar a toda la población. Podríamos decir que la
muestra es una población de tamaño reducido.
3
En segundo lugar está el tema de los costes monetarios, que en la observación parcial
son más reducidos que en el caso de la exhaustiva.
Finalmente, la observación parcial presenta también la ventaja de que reduce las pruebas
destructivas. Imaginemos que nos encontramos frente a un estudio de control de la
calidad de la producción de una empresa que se dedica a la fabricación de vigas de
hormigón para obras civiles. Esas vigas habrán de someterse a presiones altas para
conocer su resistencia a la ruptura. Pero si somete toda la producción a este tipo de
pruebas destructivas entonces no hay producción. Bastaría en este caso con seleccionar
una muestra y, aplicarle ese tipo de pruebas a los elementos de la misma, para tener una
idea razonable de cuál es la resistencia a la ruptura de las vigas producidas por la
empresa.
Referencia:
4
B. El Papel del Análisis de Datos en la Investigación Educativa
Introducción
5
Dentro del Análisis Estadístico de Datos se observan dos corrientes:
Las características propias que definen el concepto de Análisis Estadístico de Datos son:
Por tanto el Análisis Estadístico de Datos no se limita sólo a su tratamiento sino que se
extiende a tareas previas y posteriores a esta fase. También puede ocuparse de la
recogida de datos (referido a las técnicas y métodos de muestreo y a la evaluación de la
calidad de los instrumentos que se diseñan para la recogida de datos) y la interpretación
de los resultados (afirmaciones que se realizan como consecuencia de la aplicación de
métodos estadísticos: descripción, reducción, generalización).
Los rasgos más relevantes que llevan a definir el Análisis Estadístico de Datos:
6
sobre las realidades educativas, a la toma de decisiones y a la mejora de la práctica
desarrollada por los profesionales de la educación.
7
mientras que si se limita al estudio de una muestra, se habrá de recurrir a la estadística
inferencial.
Se define problema como una laguna en el conocimiento (un interrogante) para la cual no
se tiene solución aceptable. El problema ha de ser relevante y verificable empíricamente y
se debe formular de manera clara y breve. En este sentido, es muy importante la
resolubilidad del problema de investigación, aspecto que en ocasiones sólo queda
garantizado si se cuenta con técnicas estadísticas adecuadas y potentes, capaces de
abordar los interrogantes de partida. Por ejemplo, el planteamiento de problemas que
supongan comparaciones entre múltiples grupos no podría hacerse sin contar con
técnicas como el análisis de la varianza; un gran número de problemas de investigación
en los que se incluyen múltiples dimensiones o variables simultáneamente no han llegado
a ser estudiados hasta que no se ha contado con técnicas de análisis multivariante que
permiten abordar su estudio.
2. Diseño de investigación
8
Por otro lado, la recogida de datos es una tarea para la que aparentemente las técnicas
estadísticas parecen no jugar un papel relevante. Sin embargo, el Análisis Estadístico de
Datos tiene un lugar especial en la construcción y validación de instrumentos que se
utilizan para la recogida de datos. Por ejemplo, la determinación de la fiabilidad y validez
de algunos instrumentos se apoya directamente en coeficientes de correlación, o la
aplicación de técnicas de análisis de componentes principales o análisis factorial permite
explorar la dimensionalidad de los instrumentos.
3. Análisis de Datos
El procedimiento de Análisis suele comenzar con una depuración de los datos para tratar
de eliminar o corregir los posibles errores que se hayan cometido en la fase de registro o
codificación de la información recogida. Una segunda fase es la descripción de las
variables que entrarán a formar parte del estudio, teniendo en cuenta el enfoque del que
partimos (univariante, multivariante o aplicación de técnicas inferenciales).
• Análisis Cualitativo, que expresa, ordena, describe, interpreta los datos mediante
conceptos, razonamientos y palabras, y
• Análisis Cuantitativo, en el que se recurre a conceptos y razonamientos que se
apoyan en números y estructuras matemáticas.
9
Aplicar técnicas de Análisis Estadístico nos lleva de manera directa a la obtención de
conclusiones, las cuales estarán, de alguna forma predeterminadas por el tipo de técnicas
que usemos.
Estas conclusiones, al igual que todo el proceso de investigación, deben contar con la
inclusión de resultados estadísticos. De esta manera, el Análisis Estadístico de Datos está
presente en la fase de redacción del informe de investigación. Para ilustrar tales
conclusiones se utilizarán cuadros, tablas y gráficos, que recogerán medias, porcentajes,
coordenadas, correlaciones, o cualquier otro tipo de estadísticos necesarios para ilustrar
de manera adecuada la investigación realizada.
Los principales campos en que se estructura el Análisis Estadístico de Datos, y sobre todo
el que habitualmente se aplica en el campo de las Ciencias de la Educación, se pueden
distinguir entre:
Estadística univariada.
Bivariada.
Multivariada.
10
importante que se resalte la correcta utilización de los mismos y la coherencia y lógica
del investigador en tales procesos. Es fundamental que la informática siempre
responda al problema de investigador y objetivos planteados, y no sustituya al
analista.
De todas las funciones que el computador puede cubrir en la investigación educativa,
es quizá la del Análisis de Datos la que con mayor claridad puede haberse beneficiado
de este tipo de herramientas. El computador ha venido a revolucionar este campo,
permitiendo la aplicación de complejos procedimientos de análisis y, de alguna
manera, simplificándolos.
Si el impacto de la informática en el campo de la investigación educativa ha sido
considerable, en el caso del Análisis de Datos esta afirmación cobra pleno sentido. El
Análisis de Datos "ha recibido un impulso revolucionario con la generalización del uso
de los computadores", hasta tal punto que hoy es difícil concebir este proceso
desligado de la utilización de tales máquinas. Algunas de las ventajas y posibilidades
que lleva consigo el uso de la informática en el Análisis Estadístico de Datos son:
11
considerar un esfuerzo adicional para el investigador, además de la dificultad que
entrañaba un análisis.
o Otra de las posibilidades que abrió la informática fue el tratamiento conjunto de
múltiples variables y, por ende, el desarrollo de análisis multivariante, en los que se
observaba una creciente complejidad estadística.
o La triangulación multimétodos y el manejo de grandes muestras y elevado número
de variables contribuye al aumento de la fiabilidad y validez de los estudios y, por
ende, su poder de generalizar los resultados.
1. Concepto de medida
2. Niveles de medida
a) Nivel nominal.
12
El nivel nominal de medición consiste en asignar números que hacen la función de meros
nombres o etiquetas.
Si se emplea un nivel de medida nominal lo único que se puede inferir es que los objetos
difieren entre sí respecto del atributo medido, aunque ello no implica ninguna otra
propiedad.
b) Nivel ordinal.
El nivel ordinal de medida supone que se puede establecer una ordenación, creciente o
decreciente, con los objetos o hechos que se miden.
Con un nivel de medida ordinal se puede establecer sin dificultad que algo es diferente de
algo, y que es mayor o menor, pero no cuánto mayor o menor.
c) Nivel de intervalo
Una medición a nivel de intervalo posee las características de los dos niveles anteriores,
por lo que se puede establecer diferencias entre objetos, determinar una ordenación entre
ellos y además, conocer en qué cuantía unos objetos son mayores o menores que otros.
Además de las propiedades de los niveles anteriores, en las medidas en escala de razón
puede afirmarse que el valor cero indica ausencia total del rasgo medido.
Una constante es una característica que se manifiesta de manera similar en todos los
objetos o individuos sobre los que se realiza la medición. Es decir, presenta un único valor
posible.
13
Una variable es una característica que puede manifestarse de manera diferente en un
grupo de objetos o individuos sobre los que se realiza la medición. Cada uno de los
valores asumidos es una modalidad.
Cuando el número de modalidades bajo el que se mide una variable es muy grande, las
modalidades pueden ser agrupadas en clases. De esta manera, se pasa de un número
amplio de modalidades a un número mucho más reducido de clases. Al definir clases,
deben respetarse al menos dos criterios:
1. Las clases deben ser mutuamente exclusivas. Es decir, una modalidad no puede
formar parte de dos clases; quedará incluida en sólo una clase.
2. Las clases deben ser exhaustivas. La definición de clases debe cubrir todas las
modalidades, de forma que ninguna modalidad quede sin pertenecer a alguna clase.
Las técnicas más habituales para ordenar, clasificar y presentar datos son las
distribuciones de frecuencias.
14
2. Distribución de frecuencias agrupadas
1. Diagrama de Barras
Consiste en indicar por medio de una barra o rectángulo las frecuencias correspondientes
a cada modalidad o clase de modalidades. Las alturas de las barras son proporcionales a
las frecuencias alcanzadas, con independencia de que se trate de frecuencias absolutas o
relativas.
2. Histograma
Cuando la variable a representar está medida en una escala de intervalos, en lugar del
diagrama de barras se recurre al histograma. Este es similar al diagrama de barras, pero
15
la base de cada rectángulo coincide con los límites reales del intervalo y el orden de
presentación de las modalidades en el eje de abscisas no es arbitrario. El histograma
puede construirse para frecuencias absolutas o relativas, tanto si son individuales como
acumuladas; también puede ser construido para representar frecuencias (también
porcentajes) o frecuencias acumuladas.
3. Polígono de Frecuencias
Consiste en una línea poligonal que une el punto medio de cada intervalo, tomado a una
altura que resulta proporcional a la frecuencia alcanzada en el intervalo. La línea obtenida
de este modo cierra el polígono al ser unida a los puntos medios del intervalo anterior y
posterior sobre el eje de abscisas Puede construirse a partir del histograma.
Es una línea poligonal mediante la cual se representan las frecuencias que acumulan los
intervalos. Se construye cómodamente sobre el polígono de frecuencias acumuladas,
uniendo el vértice inferior izquierdo de cada intervalo con su vértice superior derecho.
Problemas
• Problema 1
Se han recogido los siguientes datos, correspondientes a las puntuaciones obtenidas por
25 alumnos en un test de inteligencia. Organizarlos en una distribución de frecuencias sin
agrupar en intervalos.
16
105, 99, 109, 100, 94, 100, 97, 120, 99, 107, 96, 107, 100, 109, 105, 97, 100, 105, 96, 99,
100, 97, 105, 107, 99.
• Solución
Para realizar la distribución de frecuencias se debe, en primer lugar, ordenar los datos (de
mayor a menor o de menor a mayor), representarlos en una tabla y realizar el recuento
correspondiente a cada uno de los valores (las "marcas" facilitan dicha labor), tal y como
se expresa en la tabla siguiente:
• Problema 2
3, 6, 7, 9, 9, 12, 12, 13, 13, 14, 14, 15, 15, 16, 16, 20, 20, 20, 20, 20, 22, 23, 24, 24, 24,
25, 25, 28, 35, 37.
• Solución
En primer lugar, se calcula la amplitud total para la serie de puntuaciones con las que se
va a trabajar.
17
A continuación se determina el número de intervalos necesarios. Teniendo en cuenta que
la amplitud del intervalo debe ser igual a 5, de acuerdo a lo indicado en el enunciado del
problema, el número de intervalos vendrá dado por el cuociente entre la amplitud total y la
de cada intervalo: 37/5 = 7.4.
Este valor indica que se necesitan un número superior a 7 intervalos para distribuir todas
las puntuaciones en intervalos de amplitud 5. El número de intervalos mínimo necesario
sería 8. Una vez construidos los intervalos, se determina la frecuencia absoluta individual
(f) en cada uno de ellos, la proporción (p), el porcentaje (P) y los correspondientes valores
acumulados para todos ellos (fa, pa y Pa).
Intervalos Marcas f p P fa pa Pa
1-5 / 1,00 0.033 3.33 1 0.333 33.33
6 - 10 //// 4,00 0.133 13.33 5 0.167 16.67
11 - 15 ///// /// 8,00 0.267 26.67 13 0.433 43.33
16 - 20 ///// // 7,00 0.233 23.33 20 0.667 66.67
21 - 25 ///// // 7,00 0.233 23.33 27 0.900 90.00
26 - 30 / 1,00 0.033 3.33 28 0.933 93.33
31 - 35 / 1,00 0.033 3.33 29 0.967 96.67
36 - 40 / 1,00 0.033 3.33 30 1,00 100,00
No obstante, se podría haber organizado los datos comenzando el primer intervalo con un
límite aparente inferior distinto (por ejemplo, 2 o 3). En ese caso, la distribución resultante
diferirá algo de la aquí construida.
• Problema 3
• Solución
18
En este caso la superficie del círculo
(360o) se reparte proporcionalmente a
las frecuencias de cada categoría. Los
profesores definitivos ocuparán un
sector circular que representa el 48.39%
de los 360o, es decir, 360 x 48.39/100 =
174o que suponen algo menos de un
ángulo llano. Los profesores
provisionales estarán representados por
un sector de 360 x 3226/100 = 116 o, es
decir, algo más que un ángulo recto. Cálculos análogos determinan un sector circular de
47o para los profesores en comisión de servicios y 23o para los interinos.
• Problema 4
Representar mediante un histograma las edades (en meses) de los 60 alumnos del
segundo año de Educación Básica de un Centro para Adultos, cuya distribución de
frecuencias es la siguiente:
Edades Nº Alumnos
55 - 59 16
50 - 54 10
45 - 49 8
40 - 44 7
35 - 39 8
30 - 34 6
25 - 29 5
• Solución
El histograma es similar a un
diagrama de barras en el que
dichas barras se levantan
19
sobre los límites reales de los intervalos, apareciendo, por tanto, unidas lateralmente entre
sí.
• Problema 5
C.I. Nº Alumnos
Representar en un polígono de frecuencias los 116 - 120 1
siguientes datos, correspondientes a los C.I. de un
111 - 115 3
grupo de 25 alumnos de un curso de Educación Básica.
106 - 110 7
101 - 105 11
96 - 100 2
91 - 95 1
• Solución
• Problema 6
• Solución
20
El polígono de frecuencias acumuladas se construye de forma muy parecida al polígono
de frecuencias, con la diferencia de que aquí la altura viene dada por las frecuencias
acumuladas (frecuencia de cada intervalo más frecuencias de los intervalos anteriores).
Además, la línea comienza en el eje de abscisas en el límite inferior real del primer
intervalo, y une los puntos situados sobre cada límite superior real, a una altura igual a la
frecuencia acumulada en cada intervalo.
Cálculo:
donde: donde:
· Xi es cada puntuación · Xi es el punto medio de cada intervalo
21
· n es el número de casos · fi es la frecuencia de cada intervalo
· r es el número de intervalos
· n es el número de casos
Propiedades
Es decir, si entonces
Dados r grupos con n1, n2, ..., nr casos y sus respectivas medias, la media global se
obtiene ponderando dichas medias.
Cálculo:
22
Se ordenan los datos de menor a
mayor.
· n es el número de casos
Propiedades.
• Es menos sensible que la media a variaciones de las puntuaciones. Podría ocurrir que
la modificación de un valor no altera la mediana
• La mediana puede calcularse cuando se han medido las variables en escala ordinal o
superior.
Cálculo
23
para dos o más valores, éstos donde:
constituyen modas. El grupo puede · Li es el límite inferior del intervalo modal
ser bimodal o multimodal. (que contiene a la moda).
· · Si dos valores adyacentes · I es la amplitud de los intervalos.
alcanzan la máxima frecuencia, la · d1 es la diferencia entre las frecuencias del
moda es el promedio de ambos. intervalo modal y el intervalo inferior.
· d2 es la diferencia entre las frecuencias del
intervalo modal y el intervalo inmediato
superior.
Propiedades
2. Medidas de posición
a) Percentiles: Son los 99 valores que dividen en cien partes iguales a una serie de
puntuaciones ordenadas, de forma que el percentil Pm deja por debajo de sí el m por
ciento de las puntuaciones del grupo.
Cálculo
Donde:
24
Li es el límite inferior del intervalo crítico (que contiene a Pm)
I es la amplitud de los intervalos
fi es la frecuencia absoluta en el intervalo crítico
n es el número de casos
fa es la frecuencia acumulada en el intervalo anterior al intervalo crítico
La expresión (m·n)/100 representa el número de puntuaciones que quedarían por
debajo del percentil m en la distribución estudiada. El intervalo crítico es precisamente
aquél donde la frecuencia acumulada alcanza o supera ese número de puntuaciones.
b) Deciles: Son los 9 valores que dividen en diez partes iguales a una serie de
puntuaciones ordenadas, de forma que el decil Dm deja por debajo de sí a m décimas
partes del total de puntuaciones del grupo.
Cálculo
c) Cuartiles: Son los 3 valores que dividen en cuatro partes iguales a una serie de
puntuaciones ordenadas, de manera que el cuartil Qm deja por debajo de sí m cuartas
partes del total de puntuaciones del grupo.
Cálculo
3. Medidas de dispersión
25
Rango excluyente: diferencia entre la mayor y la menor de las puntuaciones.
Rango incluyente: diferencia entre la mayor y la menor de las puntuaciones incrementada
en la unidad de medida. Este suele ser el más utilizado.
El rango es la más imperfecta de las medidas de dispersión, pues sólo tiene en cuenta las
puntuaciones extremas.
b) Desviación media: Es la media del valor absoluto de las diferencias de todas las
puntuaciones respecto a la media aritmética.
Cálculo:
donde: donde:
· Xi es cada puntuación · Xi es el punto medio de cada intervalo
· es la media · es la media
· n es el número de casos · fi es la frecuencia de cada intervalo
· r es el número de intervalos
· n es el número de casos
c1) Varianza: La varianza es el promedio del cuadrado de las diferencias de todas las
puntuaciones respecto a la media aritmética.
Cálculo:
Podemos proponer dos fórmulas equivalentes, tanto para datos sin agrupar como para
datos agrupados por intervalos.
26
En el ámbito de la estadística inferencial, se utiliza una expresión de la varianza obtenida
recogiendo en el denominador el factor n-1. A esta varianza se le denomina varianza
insesgada.
c2) Desviación típica: Se define como la raíz cuadrada de la varianza, tomada con
signo positivo.
Se obtiene a partir del número de veces que la desviación típica contiene a la media.
27
e) Amplitud Semi-intercuartílica: Se define como la mitad de la distancia entre el
primer y el tercer cuartil. Puede ser calculada cuando se ha medido la variable en
escala ordinal o superior.
Problemas
• Problema 1
Intervalos f
91 - 100 2
81 - 90 0
71 - 80 3
61 - 70 6
51 - 60 7
41 - 50 9
31 - 40 4
21 - 30 5
11 - 20 1
1 - 10 1
• Problema 2
Las puntuaciones obtenidas por 59 alumnos en una prueba de diagnóstico en lectura son
las que se recogen en la tabla siguiente.
28
b) ¿Qué percentil corresponde a una alumna que ha obtenido una puntuación directa de
40 puntos? ¿Y a un alumno que obtuvo 34 puntos?
Intervalos F fa
47 - 49 4 59
44 - 46 7 55
41 - 43 4 48
38 - 40 8 44
35 - 37 4 36
32 - 34 1 32
29 - 31 5 31
26 - 28 6 26
23 - 25 6 20
20 - 22 4 14
17 - 19 3 10
14 - 16 2 7
11 - 13 2 5
8 - 10 2 3
5-7 0 1
2-4 1 1
• Problema 3
Los 25 niños de un aula de Educación Parvularia han sido evaluados para determinar el
nivel que presentan en ciertas variables relevantes para el aprendizaje de las
matemáticas. Teniendo en cuenta que los resultados obtenidos en una prueba de
discriminación de formas son los que aparecen a continuación, determina la tendencia
central del grupo mediante la media, la mediana y la moda, así como el grado de
dispersión que presentan las puntuaciones, expresado a partir de su rango y su
desviación típica.
27, 35, 40, 26, 32, 31, 35, 28, 29, 25, 36, 31, 27, 29, 25, 32, 34, 28, 33, 35, 29, 30, 39, 27,
25.
• Problema 4
29
I fi
19 - 21 5
16 - 18 9
13 - 15 12
10 - 12 25
7-9 13
4-6 4
1-3 2
• Problema 5
Aptitud fi
125-129 7
120-124 8
115-119 12
110-114 20
105-109 27
100-104 41
95-99 32
90-94 30
85-89 11
80-84 2
• Solución Problema 1
30
a) La moda, valor más sencillo de calcular, es la puntuación con frecuencia máxima o
puntuación que más se repite. Al estar los datos agrupados en intervalos, la moda será el
punto medio del intervalo con frecuencia máxima, es decir Mo = 45.5.
Para calcular la media aritmética necesitamos los puntos medios de los intervalos y los
productos de dichos puntos medios por las frecuencias. Dichos cálculos se expresan en la
tabla que mostramos seguidamente.
Intervalos f Xi fiXi
91 - 100 2 95.5 191
81 - 90 0 85.5 0
71 - 80 3 75.5 226.5
61 - 70 6 65.5 393
51 - 60 7 55.5 388.5
41 - 50 9 45.5 409.5
31 - 40 4 35.5 142
21 - 30 5 25.5 127.5
11 - 20 1 15.5 15.5
1 - 10 1 5.5 5.5
n = 38 1899
La mediana es la puntuación que deja por encima y por debajo de sí el 50% de los casos.
Como tenemos 38 sujetos, la mediana será la puntuación que deje por encima y por
debajo de = 19 sujetos. Su fórmula de cálculo, para datos agrupados en intervalos, es la
siguiente:
Como n/2=38/2=19 es una frecuencia acumulada que se alcanza dentro del intervalo 41-
50 (intervalo crítico), sustituyendo en la fórmula anterior los valores del límite inferior de
ese intervalo (Linfer), la amplitud de los intervalos (I), la frecuencia en el intervalo crítico (f i)
y la frecuencia acumulada en el intervalo anterior al crítico (fa) tendremos
31
b) Las puntuaciones que dejan por debajo de sí el 25 y el 75% de los casos se conocen
con el nombre de cuartil 1 (Q 1) y cuartil 3 (Q 3), respectivamente. Dichas puntuaciones se
corresponden, igualmente, con los percentiles 25 y 75. Su cálculo viene dado por la
fórmula
• Solución Problema 2
32
b) Se trata del problema inverso al apartado anterior, que podemos resolver aplicando la
misma fórmula. El valor que buscamos no es, como ocurría anteriormente, Pm sino el valor
m.
• Solución Problema 3
El cálculo de la media aritmética resulta sencillo teniendo en cuenta los cálculos previos:
33
La mediana es la puntuación que ocupa el lugar central. Puesto que contamos con 25
puntuaciones, la mediana será el valor que ocupe el lugar 13 (deja 12 por debajo y 12 por
encima), es decir Md=30.
La moda es la puntuación o puntuaciones que más se repiten (las que tienen mayor
frecuencia). En este caso, la distribución es multimodal, contando con cuatro modas que
son 25, 27, 29 y 35.
• Solución Problema 4
En la tabla siguiente se incluyen los cálculos previos para hallar las medidas de
variabilidad solicitadas. En la primera columna se presentan los intervalos, en la segunda
las frecuencias, en la tercera los puntos medios de cada uno de los intervalos, en la
cuarta el producto de los puntos medios de cada uno de los intervalos por su frecuencia,
en la quinta las diferencias en valor absoluto de cada punto medio de los intervalos con
respecto a la media aritmética (x, por tanto, representa puntuaciones diferenciales), en la
sexta la columna anterior multiplicada por la frecuencia de cada intervalo, en la séptima
los valores de los puntos medios de cada uno de los intervalos elevados al cuadrado y, en
la octava y última el valor de la columna anterior multiplicado por la frecuencia de cada
intervalo.
34
A.T = 21 -1 +1 = 21 (o bien, 21.5-0.5 = 21)
• Solución Problema 5
35
Por debajo de la puntuación 105.5 quedan el 63.89% de los sujetos.
c) Amplitud semi-intercuartil.
Para calcular cada uno de los cuartiles debemos previamente determinar el intervalo en el
que se encuentran.
Una puntuación directa es la que se asigna a cada individuo como resultado de una
medición; por ejemplo la nota de un examen, el número de agresiones mensuales de
cada alumno(a) a sus compañeros.
36
Las puntuaciones transformadas son las que se derivan de las puntuaciones directas por
combinación lineal. Por ejemplo, medimos la velocidad y la comprensión lectora a través
de dos pruebas de las cuáles obtenemos dos puntuaciones directas; a través de estas
dos puntuaciones nos interesa conocer la eficiencia lectora. En este caso, la eficiencia
lectora es una puntuación transformada, o una variable de transformación.
a) Puntuaciones Diferenciales
xi = X i - X
Ejemplo
Un grupo de 8 estudiantes que rinden examen de análisis de datos han obtenido las
siguientes puntuaciones: 7, 3, 2.5, 9, 2, 8.5, 5 y 3. Calcular las puntuaciones diferenciales
para cada uno de los(as) alumnos(as).
Solución: Se debe calcular la media de las puntuaciones, a partir de ese valor, podremos
determinar las puntuaciones diferenciales restando la media a la puntuación directa.
Xi xi
7 Cálculo de la media 2
37
3 -2
2,5 -2,5
9 4
2 -3
8,5 3,5
5 0
3 -2
b) Puntuaciones típicas
La media de las puntuaciones típicas vale 0 y la desviación típica es igual a 1. Por tanto,
cuando hablamos de tipificar los valores de una variable, significa que debemos
transformarlos en puntuaciones z.
Ejemplo:
Solución:
1º) determinar el valor de la desviación típica del grupo
�( x - x )
2
�( x - x ) = �x
2
= 55,5 i 55,5
i i s= = = 2, 63
n 8
2º) Luego, se divide cada una de las puntuaciones diferenciales por la desviación típica
Xi xi xi2 zi
7 2 4 0,76
3 -2 4 -0,76
2,5 -2,5 6,25 -0,95
2 -3 9 -1,14
9 4 1,6 1,53
38
8,5 3,5 12,25 1,33
5 0 0 0
3 -2 4 -0,76
Las puntuaciones típicas permiten establecer comparaciones entre distintas variables. Sin
embargo el inconveniente de las puntuaciones típicas es que suelen ser negativas y
pueden presentar cifras decimales. Contamos solamente con siete puntuaciones enteras
posibles (-3, -2, -1, 0, 1, 2, 3), ya que la mayoría de las observaciones suelen quedar
incluidas entre tres desviaciones típicas a la derecha de la media y tres a la izquierda.
Tanto los signos negativos como las cifras decimales y los redondeos pueden ocasionar
errores de cálculo. Para evitar esto, podríamos multiplicar las puntuaciones z por una
constante S determinada y para evitar los valores negativos, sumar una constante J.
D = J + Sz
Entre las más usadas se encuentran el caso concreto de las puntuaciones T, que tienen
como media 50 y como desviación típica 10.
T = 50 + 10z
CI = 100 + 15z
Otra de las puntuaciones típicas que se suele utilizar en educación son los eneatipos o
estaninos, que son puntuaciones de media 5 y de desviación típica 2.
E = 5 + 2z
39
Ejemplo: Supongamos que un sujeto obtiene en una prueba de inteligencia una
puntuación directa de 70 puntos. Sabiendo que la media del grupo de referencia es 63,04
y su desviación típica 10,8, podremos transformar la puntuación directa en una puntuación
típica z= 0,64.
T = 50 + 10 (0,64) = 56,4
C.I. = 10 + 15 (0,64) = 109,6
E = 5 + 2 (0,64) = 6,28
2. La curva normal
μ = media
σ = desviación típica
40
Se utilizan μ y σ, en lugar de X y s, porque hablamos de un modelo teórico.
N = número de casos, lo que significa que el área total bajo la curva es N.
2
1 �X - m �
1 - � �
f ( x) = e 2� s �
2ps
Se dice que una variable aleatoria continua tiene distribución normal tipificada X ~ N (0,1),
si su función de densidad tiene la siguiente forma:
1 - 12 x2
f ( x) = e
2p
La curva normal tipificada o reducida es, por tanto, la que opera con puntuaciones z, es
un caso especial de distribución normal que tiene de media cero y de desviación típica
uno. Tiene múltiples aplicaciones y su uso es frecuente en investigación educativa.
Al observar una variable tipificada que se distribuye normalmente, puede observarse que
la mayor parte de las puntuaciones se encuentran comprendidas entre los valores que
van de -3 a +3 (figura 2)
41
Figura 2: Curva Normal para Puntuaciones z
Para muchos propósitos es necesario conocer la proporción del área bajo la curva normal
entre las ordenadas de diferentes puntos sobre la línea de base. Podemos desear
conocer:
La proporción del área bajo la curva entre la ordenada de la media y cualquier punto
específico que se encuentre por encima o por debajo de la media.
La proporción del área total por encima o por debajo de la ordenada de cualquier
punto sobre la línea base.
La proporción del área que se encuentra entre las ordenadas de dos puntos
cualesquiera sobre la línea base.
Mediante la tabla de la Ley Normal pueden calcularse las áreas entre dos puntos. Por
tanto, pueden resolverse cualquiera de las tres situaciones anteriores. A continuación se
desarrollan algunos ejemplos teniendo en cuenta las siguientes consideraciones:
Ejemplo
42
Se ha utilizado el test de inteligencia D-48 a un grupo de sujetos y se ha obtenido una
distribución normal de media 28 y desviación típica 5.
Caso 1: ¿Qué porcentaje de sujetos han obtenido una puntuación superior a 36?
1-0,34458 = 0,65542
43
El porcentaje de sujetos que ha obtenido puntuaciones inferiores a 30 es del 65,54%.
Caso 3: ¿Qué probabilidad existe de que al elegir un individuo al azar esté comprendido
entre 25 y 35?
0,3446-0,0359 = 0,3087
44
Lo cual supone un 30,87% de alumnos comprendidos entre ambas puntuaciones.
Bibliografía
Gil, J., Diego, J., García, E., & Rodríguez, G. (1997). Estadística básica aplicada a las
ciencias de la educación. Sevilla: Kronos.
GIL, J., Diego, J., García, E., & Rodríguez, G. (1997). Problemas de estadística
aplicada a las ciencias de la educación. Sevilla: Kronos.
45