Вы находитесь на странице: 1из 132

LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

LGE

ESPACIO CURRICULAR
METODOLOGA Y ESTADSTICA
APLICADA A LA EDUCACIN

Autores:
Dra.MartaGracieladelVallePece
Mg.Ing.MargaritaJurezdeGalndez
Mg.Lic.MaraMercedesSimonetti

1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

PROGRAMA DE ESPACIO CURRICULAR


UNIDAD I: Estadstica
Concepto. Etapas en el trabajo estadstico. Estadstica Descriptiva e
Inferencial. Variable: concepto. Clasificacin de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso comn: de escolarizacin, de analfabetismo, de desgranamiento, de
retencin.

UNIDAD II: Presentacin de dat os est adsticos.


Partes funcionales y construccin de tablas estadsticas. Elementos
estructurales de las tablas. Tablas simples, cruzadas. Anlisis de tablas
estadsticas. Tcnicas de representaciones grficas. Reglas de
construccin. Grficos segn los distintos tipos de variables.

UNIDAD III: Medidas de resumen.


Medidas de tendencia central. Media aritmtica, mediana y moda.
Comparacin de media, mediana y moda. Distribuciones simtricas y
asimtricas. Medidas de dispersin. Rango, variancia y desviacin
estndar y desviacin mediana. Coeficiente de variacin. Medidas de
localizacin. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones element ales de probabilidad. Inferencia


estadstica.
Experimentos aleatorios: conceptos bsicos. Probabilidad clsica,
frecuencial y axiomtica. Teorema de la suma y del producto de
probabilidades.
Tabla de contingencia. Clculo de probabilidades.
Distribucin de probabilidades de variables aleatorias discretas:
Uniforme y Binomial.
Clculo de probabilidad en variables aleatorias continuas: distribucin
normal y distribucin normal estndar.
Poblacin. Definicin de muestra aleatoria. Diseos de muestreo.
Muestreo al azar simple. Muestreo sistemtico. Muestreo por estratos.
Muestreo por conglomerados. Concepto.
Estimacin puntual y por Intervalos de confianza para muestras
grandes en el Muestreo al Azar Simple.

2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

UN I DADESI yI I

INTRODUCCIN

La palabra Estadstica proviene del latn status (estado).


Precisamente la primera aplicacin de la estadstica consisti en la
recopilacin de datos y la construccin de grficos para describir el estado
de un pas. Con el correr del tiempo esta herramienta fue evolucionando
hasta que en la actualidad podramos decir que no hay aspectos de la vida
cotidiana donde no se aplique la Estadstica. Hogares, gobiernos y
negocios se apoyan en datos estadsticos para dirigir sus acciones.

El objetivo que se persigue con este mdulo es proporcionar al


docente herramientas y tcnicas para obtener datos, procesarlos para
obtener informacin que sirva para la interpretacin correcta de
fenmenos que se producen en su mbito de trabajo.

ESTADSTICA. CONCEPTOS.

La Est adst ica es una coleccin de mtodos para planear


experimentos, obtener datos, y despus organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola, 2004).

Otra definicin considera a la Estadstica como una disciplina


perteneciente a la Matemtica Aplicada que se dedica al estudio
cuantitativo de fenmenos colectivos. Proporciona los mtodos para:

La recoleccin de datos
Su ordenamiento, resumen y presentacin,
Su anlisis e interpretacin y
Posterior enunciado de conclusiones.

Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadstico.

La primera etapa tiene como objetivo recolectar datos proveniente de


medicin, conteo u observacin efectuado sobre el material objeto de
estudio en base a un plan formulado segn los principios del diseo
experimental y las tcnicas de muestreo.

3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

La segunda etapa consiste en ordenar los datos en tablas estadsticas,


presentarlos mediante grficos y diagramas y resumirlos a travs del
clculo de promedios, porcentajes e ndices.

En la tercera etapa se analizan los resultados obtenidos en la etapa


anterior, y comienzan a distinguirse las caractersticas del fenmeno, lo
que permite utilizar diferentes mtodos para analizarlos e interpretarlos.

En la ltima etapa se debe concluir acerca del estudio realizado.

Si las conclusiones, se refieren exclusivamente a los datos de los que


se dispone (una parte de la poblacin que se desea estudiar), se dice que
la Esta dsti ca es Descriptiva .

Si por el contrario, las conclusiones van ms all de los datos que se


dispone y se refieren a un conjunto mayor (poblacin), del cual se
extrajeron, se dice que la Esta d stica es Inf erencial las conclusiones
van de lo particular (muestra) a lo general (la poblacin).Esta se basa en el
estudio de la teora de probabilidades que nos permite medir el error de
nuestras afirmaciones.

Las est adsticas (en plural) se obtienen como resultado del trabajo
estadstico y estn constituidas por porcentajes, promedios, tablas,
grficos y otros elementos que describen un fenmeno y ayudan a su
comprensin (Ej.: estadsticas demogrficas, estadsticas del ftbol,
estadsticas de accidentes de trnsito, estadsticas universitarias, etc.).

Es necesario definir algunos conceptos importantes: por ejemplo

Poblacin. Se define poblacin como el conjunto de individuos u


objetos que comparten una caracterstica comn, en la
que el investigador est interesado.

Muestra. Es un subconjunto de la poblacin. Debe ser


representativa, es decir se deben mantener las mismas
caractersticas de la poblacin en estudio.

Una poblacin puede ser finita o infinita.

Poblacin finita Una poblacin finita es aquella que puede ser


fsicamente listada

Poblacin infinita. Una poblacin es infinita, cuando en la prctica


no puede ser fsicamente listada

4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Ejempl o. Una poblacin puede ser definida como los alumnos de la


escuela San Francisco. Los alumnos pueden ser listados e
individualizados a travs de los registros ulicos. Es un ejemplo de
pobl a cin f inita .

Personas portadoras de SIDA en Santiago del Estero,


constituyen un ejemplo de pobl a cin i nfinita .

Unidad de observacin: es aqulla sobre la cual se efectan las


mediciones u observaciones. La unidad de
observacin puede ser una persona, una familia, una
planta, una parcela, etc.

Dat o: es el valor que se obtiene de la medicin, observacin o conteo


efectuada en la unidad de observacin o unidad de
muestreo.

Por ejemplo si el objetivo de una investigacin es el rendimiento


de los alumnos, la unidad de observacin es el alumno.

El nmero de materias rendidas contadas en un alumno es el


dato.

El conjunto de datos obtenidos de cada unidad de observacin


constituir la base para el anlisis estadstico del rendimiento de los
alumnos de la escuela San Francisco.

Va ri a bles. Concepto y ti pos.

Variable. Una variable es cualquier caracterstica que vara de una


unidad de muestreo a otra en la poblacin o en la
muestra

Ejempl o 1: Supngase que interesa conocer la salud de los alumnos,


entonces la variable a observa r en cada alumno ser el esta do de sa l ud,
el que podr asumir dos valores: sano o enfermo.

Ejempl o 2: Si interesa saber el nmero de herma nos que posee


ca da a lumno, se tendr valores que van desde 0(ningn hermano), 1, 2...,n
y se deber contar cuantos hermanos posee cada alumno.

5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Ejempl o 3: Si el objetivo de un estudio fuera la ta lla alcanzada por


alumnos, se debe medir la variable altura la que, expresada en metros
podr tener valores mayores a 1 metro.

En los tres ejemplos anteriores, el nombre de la variable y la forma


de obtener sus valores est resaltado en negrita. En el primer ejemplo, los
valores que puede asumir la variable son calidades, por lo que se dice que
la variable es cualitat iva. Las calidades o categoras pueden ser naturales
como al definir la variable sexo, o arbitrarias como la clasificacin de
alturas en bajas, medianas y altas.

Por el contrario, en los otros dos ejemplos los valores que asumen
las variables pueden expresarse mediante nmeros, por lo que las dos
ltimas variables son cuant it ativas. En el caso de nmero de hermanos,
la variable toma slo determinados valores en el intervalo que va de cero a
n por lo que se la denomina variable cuantitat iva discreta o
discontinua cuando la variable toma los infinitos valores dentro del
intervalo se dice que la variable es cuantitat iv a continua

Otra forma de clasificacin de las variables es mediante el empleo de


cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn.
Cuando se manejan datos reales el nivel de medicin es importante ya que
orienta sobre el procedimiento estadstico a utilizar.

Un nivel de medicin es nominal cuando los valores de variables


son nombres, etiquetas o categoras y no se puede establecer un orden
entre ellos.

Ejempl o: colores de ojos, estado de salud, lugar de nacimiento de un


alumno. Aunque las ciudades pueden ser ordenadas segn su tamao,
densidad poblacional, grado de contaminacin del aire, etc., en general, la
variable lugar de nacimiento no tiene un orden establecido

Con estos datos no es posible realizar clculos. A veces se asignan


nmeros a las diferentes categoras a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada ms que una
codificacin y tales nmeros no tienen significado computacional.

Un nivel de medicin es ordinal cuando se puede establecer un


orden entre las categoras de la variable. Ejemplo: mximo nivel de
instruccin alcanzado por los padres de los alumnos: analfabeto, primario,
secundario, terciario, universitario.

6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Lo nico que podemos decir es que el nivel de instruccin


secundario es mayor que el primario y que el universitario es mayor que el
primario, secundario o terciario, pero no podemos decir cuanto mayor es
una categora de la variable respecto a la otra.

Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.

Si bien se podra hacer la diferencia entre 21=1 y 43=1, este


resultado 1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.

Otro niv el de medicin es el de int erv alo. En este nivel la


diferencia entre dos valores de datos tiene un significado. En este nivel no
hay un cero natural, donde nada de la cantidad est presente. El valor del
cero es convencional

Ejempl o: La variable Temperatura est medida en escala de intervalo. Un


termmetro por ejemplo, mide la temperatura en grados que son del mismo
tamao en cualquier punto de la escala. Aqu no existe un punto de partida
natural, el valor 0 es arbitrario y no representa la ausencia total de calor.
La diferencia entre 20C y 21C es la misma que entre 12C y 13C Se
pueden realizar operaciones de suma y resta pero no cociente entre valores.

Por ltimo el nivel de medicin de razn o cociente aunque se


parece al nivel de medicin de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad est presente). Para
los valores en este nivel tanto las diferencias como los cocientes tienen
significado. En este nivel se pueden realizar todas las operaciones.
Ejemplo: Los precios de los libros de texto (0$ representa ningn costo y
un precio de $60 es dos veces ms costoso que uno de $30).

7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Datos

Variable Variable
Categricao numricao
cualitativa cuantitativa

Escala Escala Escalade Escalade


nominal ordinal intervalo razn
minal

Seri es de datos. Series si mples

El conjunto de valores de una variable constituye una serie de datos.


Se presentan a continuacin series de datos referidas a los tres ejemplos
que se dieron para ilustrar tipos de variables:

Ejemplo 1: En el ao 2004, se examinan 30 alumnos de un Curso


de EGB1 de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).

Generalmente las variables se designan con las ltimas letras del


abecedario en mayscula por ej. X y los valores que toma la variable con x
minscula incluso se coloca x i donde el subndice i indica el nmero de
individuo observado de ste modo las 30 observaciones son:

x i : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S, S,
S, S, S, S.

El subndice i vara de 1 a 30. As, x1 = S x7 = S X14 = E . . . x30 =S.

Ejempl o 2: Un maestro de la Escuela San Martn interroga a sus 30


alumnos de primer grado de EGB1 sobre el nmero de hermanos que
poseen.
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.

8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

El subndice i va desde 1 a 30 y entonces x1 = 4 x5 = 0 x12 = 5 . .


x30 =0.

Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de Seccin


Maternal de la Escuela San Francisco la que expresada en cm es la
siguiente:

xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,86,78,
74.

Ahora i va desde 1 a 25, entonces x1 = 70 x2 = 75 . . .


x25 =74.

Los datos en brut o, t al cual fueron obt enidos, sin agrupar


const it uyen una serie simple.

Tablas y grficos

Orga ni za ci n de datos ca tegricos o cua litativos.

Cuando la masa de datos obtenidos es muy grande y stos estn


desordenados, no dan informacin alguna conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadsticas, que deben
confeccionarse de tal modo que los datos resulten fciles de ser ledos e
interpretados. Con los datos del ejemplo 1 se puede construir una tabla de
frecuencias.

Tabla de frecuencias. Una tabla de frecuencias para variable cualitativa,


es una tabla que asocia cada categora de la variable con el
nmero de veces que se repite la categora.

Tabla 1. Alumnos de un curso EGB1, de la Escuela San Francisco, segn


estado de salud. Ao 2004.

i Categoras:xi Frecuencias: fi
(Estado de salud) (n de alumnos)
1 Sano 24
2 Enfermo 6
Total 30
Fuente: Datos ficticios

9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Frecuencia absoluta: Es el n de veces que se repite cada categora de la


variable. Se la simboliza con fi.

La suma de las frecuencias absolutas, es igual al n total de observaciones,

fi
en ste caso 30 ( =1 =30). Ntese que i ahora se refiere a las
i

categoras, x1 = Sano, f1 = 24 x2 = Enfermo, f2= 6.

La tabla de frecuencias, es la ms sencilla de las tablas y es una


tabla de simple entrada pues los individuos se clasifican segn una nica
variable, estado de salud en el ejemplo
.
Los datos organizados en tabla de simple entrada para variable
cualit ativa, pueden presentarse mediante grficos, que tiene la finalidad
de que la informacin entre por los ojos. El grfico que puede usarse en
ste caso es el grfico de barras.

Grfico 1a. Alumnos de un curso EGB1, de la Escuela San Francisco,


segn estado de salud. Ao 2004.

30
25
Ndealumnos

20

15
10
5
0
Sanos Enfermos
Estadodesalud

Fuente: Datos ficticios


.
Para su construccin se utiliza el sistema de coordenadas
ortogonales. Sobre el eje horizontal se colocan las distintas categoras de la
variable en estudio (estado de salud) y sobre el eje vertical con una escala
adecuada, se representan las frecuencias. Se dibujan barras de ancho

1 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categora. Es
conveniente que la separacin entre las barras sea menor que el ancho de
las mismas.

El ancho de las barras debe elegirse teniendo en cuenta el espacio


disponible, el nmero de categoras de la variable a representar y la altura
que les corresponde, con el objeto de obtener un grfico proporcionado.
Las barras pueden dibujarse en sentido vertical u horizontal.

Grfico 1b. Alumnos de un curso EGB1, de la Escuela. San Francisco,


segn estado de salud. Ao 2004
Estadodesalud

Enfermos

Sanos

0 5 10 15 20 25 30
Ndealumnos

Fuente: Datos ficticios

En algunos trabajos es necesario calcular frecuencias relativas.

Frecuencia relativa de una categora es la proporcin de veces que ocurre


dicha categora.

Se obtiene dividiendo la frecuencia absoluta de cada categora entre la


suma de las frecuencias de todas las categoras. La suma en ste caso es
f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo que
se denomina sumatoria, as
i = 2

i
= 1
fi = f 1 + f 2 = 24 + 6 = 30

1 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

a la frecuencia relativa de la clase isima se la simboliza con fri y se la


calcula de la siguiente manera:

fi
fri =
fi
La suma de las frecuencias relativas es siempre igual a 1.


i
fri =1
=1

Si se multiplica las frecuencias relativas por 100 se obtienen porcent ajes.


En ste ejemplo sera:

Tabla 2. Alumnos de un curso EGB1, de la Escuela. San Francisco, segn


estado de salud. Ao 2004.

i xi fi f ri Porcentajes:
(Estado de salud) %
1 Sano 24 24/30=0,80 80

2 Enfermo 6 6/30=0,20 20

Total 30 1.00 100


Fuente: Datos ficticios

Se pueden representar los datos de la tabla 2 mediante un grfico de


barras, slo que en el eje vertical van los porcentajes.

Grfico 2. Alumnos de un curso EGB1, de la Escuela San Francisco,


segn estado de salud. Ao 2004.

% 100
80
60
40
20
0
sanos enfermos
Estadodesalud

Fuente: Datos ficticios

1 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Otro grfico adecuado para representar series de frecuencias de


variable cualitativa es el grfico de sectores circulares, llamado grfico
de tortas o pie charts .

Tabla 3. Alumnos de un curso EGB1, de la Escuela San Francisco, segn


sexo. Ao 2004

Sexo fi f ri 360xf ri
(n de
alumnos)
Varones 15 0,38 137
Mujeres 25 0,62 223
Total 40 1,00 360
Fuente: Datos ficticios

Se elige un radio por ej 3cm (el valor del radio se elige segn el espacio que
se disponga para el grfico) y se grafica un crculo. La superficie de dicho
crculo representa el total de alumnos (40), en consecuencia, le
corresponde un ngulo de 360. Se puede discriminar mediante sectores
circulares la porcin que corresponde a las mujeres y a los varones. Los
grados correspondientes a los sectores se obtienen multiplicando la
frecuencia relativa por 360.

Grfico 3. Alumnos de un curso EGB1, de la Escuela. San Francisco,


segn sexo. Ao 2004

Varones
Mujeres

38%

62%

Fuente: Datos ficticios

1 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Va ri a bles cua ntitativa s.


Ejemplo: N de hermanos que tienen los alumnos de primer grado de
EGB1 de la escuela San Martn
Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0

Para el caso de v ariables cuantitat ivas discretas, la tabla de


frecuencias se construye de la siguiente manera: se ubica el valor mayor y
el menor valor de la variable (en el ejemplo 2 del n de hermanos por
alumno, el menor valor es cero y el valor mayor 6), se colocan todos los
valores correspondientes en la primera columna de la tabla, y luego se
cuentan las veces que se presentan dichos valores. La tabla resultante es:

Tabla 5. Alumnos de primer grado de EGB1 de la escuela San Martn


segn N de hermanos

Xi fi Fi fr %
0 5 5 0,17 17
1 5 10 0,17 17
2 6 16 0,20 20
3 3 19 0,10 10
4 4 23 0,13 13
5 3 26 0,10 10
6 4 30 0,13 13
Total 30 1,0 100
Fuente: Datos ficticios

La diferencia que existe entre cada clase es constante e igual a 1.

Adems de las frecuencias relativas (cuyo clculo se explic en


prrafos anteriores) aqu se puede calcular tambin las frecuencias
acumuladas Fi. La frecuencia acumulada de una clase se obtiene
sumndole a la frecuencia de la clase, la frecuencia de las clases
anteriores.

F (0)=5
F (1)=5+5=10
F (2)=5+5+6=16 = Fi (1)+6

La tabla de frecuencias para variables cuantitativas discretas se


representa mediante un grfico de bastones. En la abscisa se colocan los
valores de la variable y se levanta para cada uno de ellos una lnea de
altura igual a su frecuencia.

1 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 4. Alumnos de primer grado de EGB1 de la escuela San


Martn segn N de hermanos
6

4
frecuencia

0
0 1 2 3 4 5 6
Nmerodehermanos

Fuente: Datos ficticios

Int erpretacin:
El nmero 6 en la columna de fi significa que 6 alumnos tienen 2
hermanos
El nmero 19 en la columna Fi significa que 19 alumnos tienen 3
hermanos o menos
El nmero 20 en la columna de porcentajes significa que el 20% de los
alumnos tienen 2 hermanos

Para el caso de variables cuantit ativas continuas como los datos


del ejemplo 3 (altura en cm. de 25 alumnos de una seccin maternal de la
Escuela San Francisco) que fueron obtenidos por medicin, se recomienda
construir intervalos de clase, cuya amplitud depende de la cantidad de
intervalos que se deseen construir y la cantidad de datos que posee la serie
simple. Es recomendable que los intervalos de clases sean iguales, es decir
que la amplitud de los mismos (a) sea constante. La tcnica a emplear para
el agrupamiento de una serie simple de variable cuantitativa continua es
sencilla.

1 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85, 79,
78, 95, 99, 97, 84, 86, 78, 74

1. Se ubica el valor mayor que toma la variable (99 cm) y el valor menor
(70 cm).

2. Se obtiene la diferencia, la que se denomina Rango o amplitud de


variacin y se designa con la letra R.

R=xmax - xmin = 99- 70= 29


3. El nmero de intervalos aproximado se puede calcular con la siguiente
frmula:
log(n+ 1)
nde intervalos=
log(2)
dnde n: n de valores de la serie o tamao de la muestra
log: logaritmo decimal

log(25+ 1)
n deinterv.= = 4.7004 5intervalos
log(2)

Cuando en la variable que se estudia existen intervalos predeterminados,


el nmero de clases o intervalos depender de la amplitud que se usa
habitualmente.

4. El rango se divide entre el n de clases o intervalos de clases, 5 para


ste ejemplo, (se recomienda que el nmero de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
informacin y en el segundo no se cumple con el objetivo del
agrupamiento) obtenindose una idea aproximada de la longitud o
amplitud del intervalo de clase.

Rango 29
a= = = 5.8@ 6
n deintervalos 5

ste valor de amplitud es orientativo, por lo que se decide tomar una


amplitud de intervalo 5 cm para facilitar el agrupamiento.

5. Se delimitan las clases buscando preferentemente valores enteros para


sus lmites. Se debe elegir el lmite inferior del 1er intervalo de tal manera
que contenga al menor valor de la serie (70 cm). La eleccin recae en el 70.
El lmite superior del 1er intervalo, se obtiene sumando al Li la amplitud.

1 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Li del 1er intervalo = 70


Ls del 1er intervalo = Li + a= 70 + 5 = 75

El lmite inferior del 2do intervalo debe coincidir con el lmite superior
del primer intervalo.

Li del 2do intervalo = 75


Ls del 2do intervalo Li + a= 75+ 5 = 80

El lmite inferior del 3er intervalo debe coincidir con el lmite


superior del 2do intervalo, y as sucesivamente, hasta que el lmite superior
del ltimo intervalo, contenga el valor observado ms alto de la variable.

6. Una vez formadas las clases se procede al conteo, que consiste en


determinar el n de observaciones (frecuencias) de cada clase. Una manera
sencilla de hacerlo es leyendo la serie simple y ubicando mediante marcas
cada valor de la variable en su clase correspondiente. De sta manera
cuando se termine de pasar lista a la serie simple, el agrupamiento ha
sido efectuado.

Tabla 6. Alumnos de Seccin maternal de la escuela San Francisco segn


su altura.
Intervalo de clase xi fi fri
(altura en cm) (marca de clase)
70 a 75 72.5 4 0.16
75 a 80 77.5 5 0.20
80 a 85 82.5 4 0.16
85 a 90 87.5 5 0.20
90 a 95 92.5 1 0.04
95 a 100 97.5 6 0.24
Total 25 1.00
Fuente: Datos ficticios

Un problema que se puede presentar es el siguiente: si un valor de la


variable coincide con uno de los lmites del intervalo, por ejemplo la altura
95 cm dnde se lo ubica? en el quinto o en el sexto intervalo de clase?
La respuesta es: puede ubicarlo en cualquiera de los intervalos, pero si se
elige un criterio se lo debe respetar hasta el final del agrupamiento. En
ste ejemplo al n 95 se lo ubica en el 6 intervalo, de la misma manera,
cuando aparezca por ejemplo un valor 85, debe ser anotado como
perteneciente al intervalo en el que el n 85 se encuentra como lmite
inferior. El intervalo de clase es cerrado en el lmite inferior y abierto en el
superior. Esto se indica de la siguiente forma [7580) los valores del
intervalo van desde 75 a 79,9999.

1 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

7. Se agrega una tercera columna, titulada marca de clase o punto


medio de clase que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula as:

Li1 + Ls1
70+ 75
x1 = = = 72,5
2 2
Li + Ls2 75+ 80
x2 = 2 = = 77,5
2 2

Tambin se puede calcular de la siguiente manera

x2 = x1 + a = 72,5+ 5= 77,5

Al efectuar el agrupamiento, se pierde detalle de la informacin ya


que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, slo se sabe ahora que se encuentran entre 70 y 75. Por eso, en caso
de ser necesario asignar un valor a cada uno de ellos, como es en el
clculo de la media aritmtica a partir de la tabla de frecuencias, se opta
por pensar que todos tienen igual valor, que es el correspondiente al punto
medio de clase.

Un grfico adecuado para representar una serie de frecuencias de


variable cuantitativa continua es el hist ograma (grfico n 5). Su
construccin es fcil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las frecuencias
(fi) y en el de las abscisas (horizontal), la variable segn la cual se efectu
la clasificacin (altura). Consiste en rectngulos adyacentes (uno por cada
clase) con bases materializadas por la amplitud de clases (5 cm). La altura
est dada por la frecuencia correspondiente a la clase. Cuando las clases
son iguales, el rea del histograma es proporcional a la frecuencia total.

1 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 5.Alumnos de Seccin maternal de la escuela San Francisco segn


su altura

7
6
5
4
Nalum.

3
2
1
0
70 75 80 85 90 95 100

Altura(cm)

Fuente: Datos ficticios

Otro grfico adecuado para representar la serie de frecuencias de


variable cuantitativa continua es el polgono de frecuencias (grfico 6).
Se emplea para su realizacin el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.

La construccin es sencilla, se marcan tantos puntos como pares de


valores (xi,fi) o sea marcas de clase, frecuencias haya en la tabla. En la
tabla N 6 vemos que hay 6 pares de valores el primer par tiene abscisa
72,5 y ordenada 4 y as sucesivamente hasta marcar el sexto par. Luego se
unen los puntos mediante trazos rectos. Algunos autores, en su afn de
mantener la proporcionalidad entre la superficie y la frecuencia aconsejan
cerrar el polgono de frecuencias uniendo el primer punto con la marca de
clase inmediata anterior y el ltimo punto con la inmediata superior en
stos dos casos la unin de los puntos se realiza con trazos cortados.

La principal ventaja de los polgonos de frecuencias consiste en que


ellos permiten dibujar en el mismo sistema de eje dos o ms polgonos
correspondientes a series diferentes que tengan similar posicin sobre el
eje de las x, as se puede compararlos, lo cual resulta engorroso efectuar
con los histogramas a causa de la superposicin de las superficies de los
rectngulos.

1 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 6.Alumnos de Seccin maternal de la escuela San Francisco segn


su altura

6
Ndealum nos

0
65 70 75 80 85 90 95 100 105
Altura(cm)

Fuente: Datos ficticios

Como cada miembro de una poblacin presenta diversas


caractersticas, se puede necesitar clasificarlos de acuerdo a dos de ellas.
Cuando el nmero de individuos medidos es pequeo, se enumeran todos
los pares de observaciones, si alguno de ellos aparece dos veces, se lo
repite y la presentacin suele hacerse de modo que una de las dos
variables est ordenada.

Tabla 9. Alumnos de una escuela segn su peso y altura.


Peso 39 40 41 42 43 43 44 45 50 52
(kg)
Alt (m) 1,27 1,30 1,30 1,31 1,34 1,35 1,37 1,39 1,45 1,49
Fuente: Datos ficticios

Para representar estos datos que corresponden a dos variables


cuantitativas continuas se utilizan los g rf icos de dispersin o scatter
plot , que se construye de la siguiente manera: se coloca una de las
variables en las abscisas o eje horizontal, por ejemplo la altura y la otra
variable, el peso, en el eje vertical, con sus escalas correspondientes, luego
se marcan tantos puntos como pares de valores (xi, yi) se tengan.

2 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 7. Alumnos de una escuela segn su peso y altura


1,55

1,5

1,45
Al tura(m)

1,4

1,35

1,3

1,25
35 40 45 50 55
Peso(kg)
Fuente: Datos ficticios

ste grfico sirve para mostrar la relacin entre las dos variables y
se usa cuando para el mismo valor de xi se tiene diferentes valores de yi. Si
esto no ocurre puede utilizarse el grfico lineal, que se construye de igual
manera que el anterior, con la nica diferencia que se unen los puntos.
ste grfico, se suele emplear, especialmente, en los casos donde la
variable que se representa en el eje horizontal es el tiempo. De ste modo
se puede ver la evolucin de la otra variable en el perodo considerado.
Pueden representar simultneamente en el mismo grfico dos o ms
variables, como se observar al representar grficamente los datos de la
tabla N 10

Tabla 10. Inasistencias mensuales de alumnos de Segundo grado A de


EGB1 de la Escuela San Martn segn sexo

Meses N de inasist.
Mujeres Varones
Marzo 3 4
Abril 5 7
Mayo 2 4
Junio 6 5
Julio 8 8
Agosto 4 5
Sept. 3 4
Octubre 4 3
Noviem. 5 2
Diciem. 1 6
Fuente: Datos ficticios

2 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 8. Inasistencias mensuales de alumnos de Segundo grado A de


EGB1 de la Escuela San Martn segn sexo

9
Mujeres
8 Varones

7
Ndeinas is tenc ias

0
M A M J J A S O N D
Meses

Fuente: Datos ficticios

Cuando los pares de valores son muy numerosos, las tablas se


presentan segn lo muestra la tabla 11 en ste caso se dice que las tablas
son de doble entrada pues son dos las variables de clasificacin.

Tabla 11. Alumnos de la escuela N 42 segn ocupacin de la madre y


lugar de residencia.

Ocupacin Barrios Total


de la
Madre A B C
A. de casa 400 500 200 1100
Profesional 200 200 50 450
Empleada 300 400 100 800
Total 900 1100 350 2350
Fuente: Datos ficticios

En este ejemplo cada alumno se caracteriza segn la variable


Ocupacin de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).

2 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Los valores que se encuentran en la celda son frecuencias, es decir


representan la cantidad de alumnos que comparten las dos caractersticas.

Las partes de una tabla son:

La ma triz , formada por la primera fila, lleva los encabezamientos de las


columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

La informacin proporcionada por los valores de las celdas se completa


con la suministrada por los encabezamientos de las filas y columnas en
las celdas se encuentra la frecuencia, es decir la cantidad de elementos o
individuos que poseen las dos caractersticas.

Por ejemplo el 100 de la ltima celda significa que en esa escuela hay
100 alumnos que viven en el Barrio C y cuyas madres son empleadas.

El grfico que se utiliza para representar ste tipo de tablas es el


grf ico de barra s compuesta s (grfico 9) y el grfi co de barra s
a grupa da s (grfico 10).

Grfi co de barra s compuesta s

La construccin del grfico de barras compuestas es sencilla. Se


comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se procede
de la siguiente manera: se marca una barra de altura 900, en ella se indica
la subdivisin que corresponde a alumnos cuyas madres son amas de casa
con el valor 400 para marcar el n de alumnos que es 200, se marca
400+200=600 en el eje vertical lo que queda corresponde n de alumnos
cuyas madres son empleadas. De igual manera se procede con los barrios
B y C.

2 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Grfico 9. Alumnos de la escuela N 42 segn ocupacin de la madre y


lugar de residencia
1200
Empleada
Profesional
1000
Ndealumnos A.decasa

800

600

400

200

0
A B C

Lu gar de r e sid en cia

Fuente: Datos ficticios


Grfi co de barra s a grupa da s

Sirven para representar fenmenos similares a los que originan


barras compuestas. La diferencia con stas estriba en que, para cada valor
de la variable independiente x en ste ejemplo lugar de residencia, se
dibujan grupo de barras . El nmero de barras en cada grupo es el del
nmero de categoras de la segunda variable, en este ejemplo ocupacin de
las madres.

Grfico 10. Alumnos de la escuela N 42 segn ocupacin de la madre y


lugar de residencia
600
A.decasa
Prof esional
500
Empleada
Ndealumnos

400

300

200

100

0
A B C

Lu gar de r e sid en cia

Fuente: Datos fict ic ios

2 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Otro tipo de grficos son los grficos de figuras o pictogramas. Son


los ms indicados para publicaciones de divulgacin popular , por su fcil e
inmediata interpretacin. Consisten en dibujos esquemticos y
relacionados con el fenmeno a representar. Cada figura es equivalente a
una cantidad determinada, preferentemente entera, de unidades de la
variable dependiente y el nmero de unidades no su tamao, es
proporcional a la magnitud a representar.

Cart ogramas: Se emplean cuando es importante sealar la


distribucin geogrfica de un determinado acontecimiento, razn por la
cual se construyen sobre planos o mapas.

Cart ogramas de sealizacin (Grfico 11): Sirven para indicar la


distribucin de una variable cualitativa sobre una base geogrfica.
Mediante figuras, colores o diferentes rayados se seala que hay en
lugares determinados.

Grfico 11. Qu es lo que caracteriza a cada provincia argentina.

Fuente: Pensando en Plural. Divisin de educacin tributaria. AFIP. Mayo 2005.


ISBN N987910126X

2 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

En este mapa, se observa lo que caracteriza a cada provincia


argentina. Por ejemplo en Santiago del Estero las aguas termales en La
Pampa la produccin de trigo, etc...

Cart ogramas de densidad: adems de indicar que hay y dnde, de


ellos se puede obtener la informacin de cunto hay. Mediante diferente
rayado o colores y tambin utilizando barras sobre la base geogrfica, se
puede expresar la cuanta del fenmeno como as tambin su ubicacin.
Suelen utilizarse pictogramas, grficos de lneas, en general cualquiera de
los descriptos, sobre el mapa o plano.

Resumiendo: los datos se ordenan, clasifican y presentan en formas


de tablas. Las tablas pueden de ser de simple entrada(cuando los
individuos se clasifican segn una variable), de doble entrada(cuando los
individuos se clasifican segn dos caractersticas) y de triple o ms
entradas (cuando se clasifican los datos segn tres o ms variables).Las
tablas se complican a medida que se agregan ms variables, por lo tanto
es preferible varias tablas sencillas a una complicada.

Toda tabla debe llevar ttulo, el cul debe responder a las preguntas
Segn?, Qu?, Cundo? y Dnde?.

No se debe olvidar la fuente de datos que indica de donde proviene la


informacin.

Se debe incluir los totales.

En caso de expresar los datos en porcentajes, deben indicarse los


totales de los cuales provienen.

Con respecto a los grficos, stos constituyen una de las formas ms


tiles de presentacin de datos estadsticos. Su importancia reside en las
mltiples formas que pueden adoptar, lo que permite su aplicacin a una
amplia gama de finalidades: didcticas, de investigacin, etc. Sirven para
mostrar la relacin entre una o ms variables. La variedad de tipo de
representaciones grficas exige una cautelosa eleccin de acuerdo a su
finalidad. La seleccin de la presentacin grfica debe, por lo tanto tener
los siguientes aspectos:

Tipo de anlisis estadstico, caractersticas y nmero de los


fenmenos o variables a representar y pblico al que va dirigido.

2 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Recomendaciones para la construccin correcta de un grfico.

Una vez elegido el tipo de grfico adecuado, es conveniente no


descuidar las siguientes consideraciones:

Decidir cul de las variables es la independiente x y cul la


dependiente y.
La representacin grfica debe ser sencilla, simple y explicarse
por s misma.
Ttulo se coloca encabezando el grfico y debe responder a las
preguntas qu, segn, cundo, dnde?.
Fuente de datos. Se coloca al pie del grfico.
Escalas se elige de tal modo que no alteren la objetividad de la
representacin, hecho ste muy utilizado para fines publicitarios
donde es comn ver escalas construidas con el propsito de
alterar el fenmeno exagerando ventajas y enmascarando la
realidad, o lo que es peor an eliminando la graduacin de los
ejes, evitando de sta forma todo patrn de comparacin. Las
escalas deben construirse buscando obtener como resultado un
dibujo armnico y proporcionado.
Debe nominarse los ejes de modo tal que no quede duda alguna
acerca de las variables que en ellos se representan.
No olvidar el corte de ejes en caso de ser necesario. ste debe
efectuarse entre el 0 y el valor mnimo a representar.
Aclaracin de las unidades de representacin.
Las referencias sern colocadas al pie o al costado del grfico.
En caso de usarse abreviaturas, stas sern aclaradas con la
debida extensin, en el rengln siguiente al correspondiente a
las fuentes.
En lo posible acompaar los grficos con las tablas estadsticas
que lo originen.
Si el tra ba jo lo requiere y es necesario expresar al gunos
va l ores en %, deben consignarse la s cifra s de la s cual es
provienen stos porcenta jes.

2 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

NDICES

El ndice es un indicador til tanto para fijar situaciones como para


hacer un diagnstico. Cuando interesa comparar los valores de una
caracterstica de la educacin (matrcula, asistencia de alumnos, nmero
de profesores, etc...) en el tiempo o en el espacio, ya sea comparando dos
valores entre s o todos con uno de ellos se puede realizar un cociente cuyo
resultado se denomina ndice simple.

Ejemplo: Se desea comparar la matrcula escolar de una escuela en el ao


2004 con la matrcula en el ao 1994. Si la primera es de 4000 alumnos y
la de 1994 es de 2000, el Indice ser:

4000
I2004/1994= = 2
2000

Lo que indica que la matrcula en el ao 2004 es el doble que la


matrcula de 10 aos atrs, en esa escuela.

El valor que va en el denominador se llama ba se .

El Indice del ao base es 1:


2000
I1994/1994= 2000 =1

Con frecuencia se multiplica por 100 los ndices con lo que entonces
los ndices son los porcentajes correspondientes siendo 100 el porcentaje
del ndice base.

Los ndices ms comunes utiliz ados en educacin son:

Razn de alumnos mat riculados en las escuelas con respecto a la


poblacin en edad escolar.

N alumnos matriculados
I=
Poblacinenedad escolar

2 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Ejemplo: En el ao 2001, en la localidad de La Banda segn el INDEC, la


poblacin en edad escolar fue de 88735 y los alumnos matriculados fue de
32613. La razn de alumnos matriculados es entonces en ese ao de:

32613
I= =0.37
88735

Es decir que solo el 37% del total de la poblacin en edad escolar asiste a
la escuela.

Alumnos por maestro en las escuelas primarias.

N alumnos
I=
Nmaestros

Ejemplo: Si el total de alumnos de una escuela es de 1000 y el plantel


docente informa que hay 40 maestros( Datos ficticios), la razn alumnos
por maestro es:

1000
I= =25
40

Es decir que en esa escuela hay 25 alumnos por cada maestro.

Porcentaje de poblacin analfabeta de 15 aos y ms.

N analfabetos.de
15aos y ms
I= *100
Poblacinde15aos y ms

Ejemplo: En la provincia de Santiago del Estero segn el INDEC, en el ao


2001 el total de poblacin de 15 aos y ms fue de 571546 personas. De
ellas, 31625 no tenan ninguna instruccin.

El Porcentaje de poblacin analfabeta para la provincia es entonces,

31625
I= *100= 5.53%
571546

2 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Tasa de ausentismo de docent es


Es el porcentaje de ausentismo de docentes en un perodo de tiempo
determinado.

Ndedasdeausenciadetodos losdocentesenunperodo
Ta= *100
Ndedasdeclasedetodoslosdocenteseneseperodo

Ejemplo: Si en una escuela hay una planta docente de 115 personas y el


total de inasistencias de los docentes(por diversas causas) en el ao es de
3101das, la Tasa de ausentismo se calcula como sigue(considere que los
das de clase en el ao son 180):
3101
Ta= *100=14.98%
115*180

Tasa de desgranamiento
Es la proporcin de alumnos ingresados al primer grado (o curso) que no
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el perodo establecido.

Ndealumnosquenoculminaronsusestudiosenel perodoestablecido
Td = *100
Ndealumnosmatriculadosaliniciodel perodo

Ejemplo: Si en el estudio de la cohorte 19741980 el nmero de alumnos


matriculados en la Argentina en la escuela primaria al inicio del perodo es
de 729048 y los que no culminaron sus estudios es de 337292 (Fuente:
Estado, sociedad y educacin en la Argentina de fin de siglo. D. Filmus. TroquilBs.As.
1996Pg.87.Citado por Lic,. Julio Zurita: Gua de actividades de la asignatura:
Introduccin a la Estadstica Educativa. Escuela para la Innovacin Educativa. UNSE.
Ao 1999)

la Tasa de desgranamiento es: 337292


Td= 729048 = 0.46

Es decir que en ese perodo hay un desgranamiento del 46%.


El 46% de los alumnos matriculados al inicio del perodo no culminaron
sus estudios al final del mismo.

3 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Tasa de retencin de la cohort e


Es la proporcin de alumnos ingresados al primer grado (o curso) que
lograron culminar todos los grados (o cursos) correspondientes al nivel, en
el perodo establecido.

Ndealumnosqueculminaronsusestudiosenel perodoestablecido
Tr = *100
N dealumnosmatriculadosaliniciodel perodo

Ejemplo: Si en el mismo perodo considerado en el ejercicio anterior


terminan el 7 grado 391756 alumnos de los 729048 matriculados, la Tasa
de retencin ser:

391756
= 0.5374
Tr=729048

Es decir que la Tasa de retencin es aproximadamente del 54%.


El 54% de los alumnos matriculados al inicio del perodo culminaron
sus estudios al final del mismo.

Tasa de escolarizacin
Proporcin de la poblacin en edad escolar que est efectivamente
escolarizada

Ndealumnosmatriculados
Ez = *100
Poblacinenedad escolar

Ejemplo: La poblacin de 5 aos y ms para Sgo. del Estero en el 2001


segn el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.

La Tasa de escolarizacin es:


237708
I= *100= 33.63%
706794
Es decir que el 33.63% de la poblacin en edad escolar asiste a la escuela.

3 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

GUA DE EJERCITACIN

Actividad 1
Clasifique en base al siguiente listado las variables socio educativas, en
cualitativas nominales u ordinales y cuantitativas discretas o continuas

Variable Tipo
1 Religin

2 N de alumnos promocionados por


curso

3 Barrios

4 Nivel de educacin alcanzado por el


tutor

5 Edad de los alumnos

6 Sexo

7 N de inasistencias mensuales

8 Altura de los alumnos

9 Lugar de nacimiento

10 Peso de los alumnos

11 Horas de estudio diario

12 N de materias que cursan

13 N de hermanos que tiene cada


alumno

14 Grado de satisfaccin por la


asignatura

15 Superficie construda por escuela

16 N de escuelas por Departamento

17 Categoras de escuela

3 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 2

Los siguientes datos corresponden a N de inasistencias de los


alumnos de un curso correspondientes al primer cuatrimestre

xi : 8 5 3 4 2 5 4 4 10 6
6 7 5 5 3 9 7 2 6 4
9 4 5 0 8 6 5 1 1 4
5 7 2 7 6 4 9 4 5 3

a) Que indica el subndice i?


b) Cul es la variable que se estudia?. Clasifquela.
c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
Cmo construye el mismo?
d) Incluya en la tabla: frecuencias acumuladas, frecuencias relativas,
porcentaje y porcentaje acumulado correspondiente a cada valor de
la variable.
e) Presente los resultados con el grfico apropiado.

Actividad 3
En un curso de 50 alumnos de un establecimiento de la Capital del a
Pcia. De Sgo. Del Estero, se emple la tcnica de profundizacin de temas
por grupo en el desarrollo de contenidos tericos. Se distribuy un
cuestionario con la finalidad de determinar la actitud de los mismos ante
esta modalidad de estudio. Una de las preguntas estaba referida al grado
de conformidad sobre el desarrollo de los contenidos tericos.

Los resultados obtenidos fueron los siguientes:


xi :
MC MD C I C MC D D MC MC
I MC I MC D MC MD C D C
MC D MC D MC D MD I C C
C MD MC I C MC MC D C MC
C MC D MD MC I D MC I MC

Donde:
MC: muy conforme
C: conforme
I: indiferente
D: disconforme
MD: Muy disconforme

3 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

a) Indique el tamao de la muestra


b) Ud. debe representar al establecimiento en una reunin de
profesores en la que participan distintos Colegios de la Capital.
Como presentara la opinin del alumnado?
c) Que ttulo colocara a la presentacin?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un grfico de barras simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso de
respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos

Actividad 4
En un estudio realizado en el Instituto Santo Toms de Aquino para
determinar la zona de influencia del mismo segn el lugar de residencia de
los alumnos, los resultados obtenidos fueron los siguientes:

Alumnos del Instituto Santo Toms de Aquino segn el barrio en el que


residen.

Barrios Nmero de alumnos


Barrio Belgrano 300
Barrio Cabildo 150
Barrio Contreras 30
Barrio Ejrcito Argentino 20
Total 500
Fuente: Datos ficticios

a) Que representa el nmero 500?


b) Cul es la variable de clasificacin? Indique de que tipo de variable
se trata.
c) Obtenga frecuencias relativas y los porcentajes correspondientes.
d) Determine si corresponde calcular frecuencias acumulada.
e) Realice grfico de tortas.
f) Qu otro grfico puede emplear para representar estos datos?

3 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 5
Los siguientes datos corresponden a la edad de los tutores de alumnos que
concurren al EGB de un establecimiento escolar
xi :
44 30 45 48 31 45 33 35 54 44
45 47 38 56 29 43 43 62 60 30
52 36 45 31 31 32 34 32 54 55
55 46 61 39 43 38 47 45 38 37
63 49 34 48 34 64 44 47 36 60
50 52 37 41 29 37 49 37 39 56
39 46 46 31 60 29 53 40 41 58

Presentar los datos :


a) En una tabla con un nmero aproximado de intervalos de clase.
b) En una tabla con 5 intervalos
c) Que grficos utilizara para representar los datos contenidos en
estas tablas?
d) Con la tabla presentada en el item b, realice un histograma.
e) Con la tabla presentada en el item a, realice un polgono de
frecuencias.

Actividad 6
Los siguientes datos corresponden a alumnos analfabetos por
Departamento en la Pcia. de Santiago del Estero, discriminados por sexo.
Ao 2001
Departamento Total Sexo
Varones Mujeres
Capital 4587 2299 2288
Banda 4752 2461 2291
Ro Hondo 3473 1960 1513
Robles 2116 1166 950

FUENTE: INDEC. Censo Nacional de Poblacin, Hogares y Viviendas. 2001.

En base a los datos proporcionados en la tabla anterior realice:


a) Grfico de barras simples que muestre el nmero total de alumnos
analfabetos por Departamento. Que otro tipo de grfico podra
utilizar en la representacin?
b) Grfico de tortas que muestre el nmero de alumnos analfabetos
discriminados por sexo para el Departamento Robles.
c) Realice un grfico de barras agrupadas por Departamento

3 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

d) Realice un grfico de barras porcentuales por Departamento


discriminando dentro de cada una de ellas los porcentajes de
varones y mujeres analfabetos.

Actividad 7

Utilice un grfico lineal para mostrar la evolucin de egresados del


Polimodal
Ao N de
egresados
1980 233
1985 278
1990 321
1995 375
2000 391
FUENTE: Datos ficticios

Actividad 8
En base a los datos de la siguiente tabla:

Poblacin en edad escolar, N de alumnos matriculados y N de maestros


correspondiente a cuatro lugares de la Repblica Argentina.

Lugar Poblacin en N de N de N de
edad escolar alumnos alumnos no maestros
matriculados matriculados
A 300000 248.000 7.000
B 150000 106.000 4.000
C 25000 24.000 1.200
D 160000 142.000 4.750
Fuente: Datos Ficticios

Calcular para cada lugar:


a) Proporcin de alumnos matriculados
b) N de alumnos por maestro
c) Tasa de escolarizacin
d) Nmero de alumnos No matriculados
e) Porcentaje de alumnos No matriculados

3 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 9
Dada la siguiente tabla, calcule la retencin y el desgranamiento de cada
cohorte y en base a los resultados realice el anlisis correspondiente

Retencin y Desgranamiento de la Escuela Primaria. Su evolucin en 3


ciclos escolares del perodo 19641980

Ciclo Escolar Alumnos matriculados


1er Grado 7 Grado
1964 1970 723.264 321.940
1969 1975 751.049 375.723
1974 1980 729.048 391.756

Fuente: Estado, sociedad y educacin en la Argentina de fin de siglo. D. Filmus. Troquil


Bs.As.1996Pg.87.Citado por Lic,. Julio Zurita: Gua de actividades de la asignatura:
Introduccin a la Estadstica Educativa. Escuela para la Innovacin Educativa. UNSE.
Ao

a) Calcule la tasa de desgranamiento


b) Calcule la tasa de retencin
c) Interprete los resultados obtenidos

Actividad 10
La siguiente tabla fue extrada del Censo Nacional de Poblacin, Hogares y
Vivienda . 2001.

Poblacin de 10 aos y ms de departamentos de Santiago del Estero, por


condicin de alfabetismo y sexo. Ao 2001.

Provincia Poblacin Condicin de alfabetismo


de 10 aos Alfabetos Analfabetos
y ms Total Varones Mujeres Total Varones Mujeres
Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685
Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288
Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291
Ro 38.435 34.962 17.361 17.601 3.473 1.960 1.513
Hondo
Copo 19.241 17.264 9.156 8.108 1.977 948 1.029

a) Calcular la tasa de analfabetismo de los distintos Departamentos que se


muestran en la Tabla.
b) Cul es el porcentaje de poblacin de ms de 10 aos sabiendo que la
poblacin total de Santiago del Estero, segn el Censo del ao 2001 es de
804.457 ?

3 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

c) Cul es la tasa de analfabetismo de las mujeres en los distintos


departamentos?
d) Calcule la tasa de analfabetismo correspondiente a los varones de los
distintos departamentos.

3 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

UN I DA DI I I

MEDIDAS DE POSICIN Y DISPERSIN

INTRODUCCIN

En todo trabajo estadstico luego de recolectar los datos, ordenarlos,


agruparlos en tablas y presentarlos grficamente, es preciso extraer alguna
informacin que caracterice a la poblacin de la cual se los extrajo.

Por ello, el objetivo de ste captulo es interiorizarlos acerca de las


medidas de posicin y variacin ms utilizadas para caracterizar a la
poblacin en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultados a travs del pensamiento crtico.

Los mtodos de ste captulo suelen denominarse mtodos de


estadstica descriptiva, porque su objetivo es resumir o describir las
caractersticas importantes de un conjunto de datos. stas caractersticas
se refieren al centro, variacin, distribucin, datos distantes y cambios a
travs del tiempo.

1. Medida s de posicin

Supongamos que una directora est preocupada por las notas


obtenidas en las pruebas de Matemticas. Lo primero que se le ocurrir es
tener una idea de si las notas de una muestra de alumnos se ubican cerca
de la calificacin cinco o cerca de la calificacin nueve. Necesita resumir
los datos y calcular alguna medida que sirva para que, con un nico valor
sencillo y representativo pueda establecer si los alumnos se posicionan
cerca de una calificacin de 5 puntos o si por el contrario se posicionan
cerca de la calificacin de nueve puntos a estas medidas se las denominan
Medidas de Posicin, y si adems indican el centro de se conjunto de
valores, se denominan Medidas de posicin y tendencia central.

Se conocen varias formas de determinar el centro de un conjunto de


datos. A continuacin, se indicarn tres que son las ms comnmente
utilizadas: media, mediana y modo.

3 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1.1. Media aritmt ica

La media (aritmtica) es la medida de posicin y tendencia central ms


empleada para describir los datos constituye lo que la mayora de la gente
denomina promedio. Es quizs la ms conocida y usada.

La media aritmtica en una serie simple de datos, se la obtiene al dividir la


suma de todos los valores de la variable entre la cantidad de valores
sumados. A la media aritmtica se la representa con x:

a)Clculo de las media aritmtica en series simples

Ejempl o 1
Se registr los das de inasistencias en un ao, de una muestra de cinco
alumnos del primer ciclo del EGB y se desea averiguar cul es el promedio
de inasistencias de esa muestra. La variable en estudios es:

X = n de inasistencias de los alumnos


Los valores de la variable son:
xi : 0 16 12 5 7
5

0+ 16+ 12+ 5+ 7 x1 + x2 + x3 + x4 + x5

i
xi
=1
x = = =
5 5 5 ,
y su frmula de clculo es la siguiente
n


i
xi
=1
x=
n 2.1

En la frmula se utiliza la letra griega (sigma mayscula) que indica


que los valores de la variable deben sumarse.
El smbolo n denota el tamao de la muestra, que es el nmero de
alumnos observados.

Cuando los datos provienen de una muestra el smbolo de la media


aritmtica es x(se denomina x barra) si se calcula la media aritmtica
con los datos de toda la poblacin se simboliza con
N


i
=1
xi
m =
N 2.2

4 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

denota la sumatoria del conjunto de valores.


xi expresan los diferentes valores que toma la variable.
n tamao de la muestra, cantidad de valores observados
N tamao de la poblacin

Como nuestros datos constituyen una muestra para calcular la


media utilizamos la frmula 2.1


i
=1
xi
0+ 16+ 12+ 5+ 7 40
x= = = = 8
5 5 5

Int erpretacin: Los alumnos tienen en promedio 8 inasistencias por ao.

Algunas propiedades de la media aritmtica

1La media aritmtica es reproductora del total.

2 Si llamamos desvo a la diferencia entre un valor y la media aritmtica

(di) = (xi - x)= 0


x i di = xi - x
0 0 8 =8
5 5 8 =3
7 7 8 =1
12 12 8 = 4
16 16 8 = 8
Total 0

Una desventaja de la media es su sensibilidad a valores extremos, de modo


que un valor excepcional puede afectarla de una manera drstica, en este
caso no representa en forma adecuada al centro de dicho conjunto y tiende
a dirigirse a ese valor extremo.

Si por equivocacin al pasar los datos en el ejemplo de las inasistencias de


los 5 alumnos colocamos 66 en vez de 16:

Ejempl o 2
X = inasistencias de alumnos
xi : 0 66 12 5 7

4 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

La inasistencia promedio toma el valor 18, alejndose el promedio


hacia al valor extremo 66.


i
=1
xi
0+ 66+ 12+ 5+ 7 90
x == = = = 18
5 5 5

La media aritmtica no representa el centro del conjunto de datos.


Este problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.

La medi a aritmtica se puede cal cula r cua ndo los val ores de
la s varia bles son cua ntitativos ta nto conti nuos como discretos.

1. 2 Mediana.

La mediana (de un conjunto de datos):es una medida de tendencia


central que divide a la serie ordenada de datos en dos partes iguales, de tal
forma que el 50% de los datos son menores o iguales a la mediana y el otro
50% mayores o iguales a ella. La mediana se designa con Me.

a) Clculo de la mediana en series simples

Ejempl o 3
Se va n a consi derar dos ca sos: cua ndo el ta ma o de la
muestra es i mpar y cua ndo n es par

Se desea determinar el valor mediano de las inasistencias de los alumnos
del ejemplo 2,
El tamao de la muestra, n es impar.

X: inasistencias de alumnos
xi : 0 66 12 5 7

Para su clculo debemos ordenar primero los datos en forma


ascendente o descendente.

Si el nmero de observaciones es impar, la mediana es el valor de la


variable que se localiza exactamente en la mitad de la lista.

En caso de que el nmero de observaciones fuera par, el valor de la

4 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

mediana se obtiene promediando los dos valores centrales.

Esos valores centrales se posicionan en el lugar


n+1
2

Solucin. Primero se ordenan los datos

0 5 7 12 66.

La muestra posee tamao impar n = 5 y el valor mediano est posicionado


en el lugar
5 + 1 6
= = 3
2 2

, o sea que el valor de la mediana es el valor de la variable ubicado en el 3


lugar.

0 5 7 12 66.

Me = 7 inasistencias

Int erpretacin: el 50% de los alumnos tiene inasistencia menores o


iguales a 7.

Ejempl o 4
En el caso de que n sea par
Supongamos que contamos las inasistencias de 6 alumnos.
X = inasistencias de alumnos
xi : 0 66 12 5 710

Solucin. Primero se ordenan los datos


0 5 7 10 12 66.

Las muestra posee tamao par n = 6,


6 + 1 7
= = 3,5
Posicin de los valores centrales 2 2

Los valores centrales ocupan el tercer y cuarto lugar, la mediana se


obtiene como el promedio de los dos valores centrales:

4 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

0 5 7 10 12 66

7 + 10
Me = = 8,5 8
2
Int erpretacin: el 50% de los alumnos tienen inasistencias menores o
iguales a 8.

Deben quedar claro dos conceptos:

Primero: La mediana no se ve influenciada por los valores extremos, ya


que en su clculo interviene el orden y no la magnitud de los valores.

Segundo: la media aritmtica es sensible a valores extremos.

La medi a na se puede determinar para va ria bles cua ntitati va s


continua s discreta s y para varia bles cua litati va s que se miden en
esca l a ordi nal.

1. 3. Modo.

El Modo es el valor de la variable que ocurre con mayor frecuencia.


Se designa frecuentemente como Mo.

Se debe hacer notar aqu que el Mo es un valor de variable y la


frecuencia de este valor sugiere su importancia estadstica.

Cuando dos valores ocurren con la misma frecuencia y sta es la


ms alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.

Cuando ms de dos valores ocurren con la misma frecuencia y sta


es la ms alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.

Cuando ningn valor se repite, se dice que no hay moda.

Ejempl o 5 .
Calcule las modas para los siguientes conjuntos de datos:

Serie A: 4,5 7,6 2,8 4,5 3,6 2,6


Serie B: 4 5 3 4 6 8 5
Serie C: 27 27 27 55 55 55 88 88 99
Serie D: 1 2 3 6 7 8 9 10

4 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Solucin:
En l a seri e A. El nmero 4,5 es la moda pues es el valor que ocurre con
mayor frecuencia(2 veces).
En l a seri e B. Los nmeros 4 y 5 son modas, ya que ambos ocurren con
la frecuencia ms alta (2 veces).
En l a serie C. Los nmeros 27 y 55 son modas, ya que ambos ocurren
con la frecuencia ms alta (3 veces).
En l a seri e D. No hay moda, ya que ningn valor se repite.

En reali da d, l a moda no se utiliza mucho con da tos numricos.


Sin embargo, entre l a s di stinta s medi da s de tendencia central que
consi dera mos, la moda es la ni ca que puede usarse cua ndo se trata
de va ri a bles cualitativa s nominal es.

Ejempl o 6 .
Una encuesta efectuada a estudiantes mostr que el 84 tiene
aparato de televisin 76 videocasetera 39 videojuegos y el 35 reproductor
de DVD. En tanto que el televisor es el aparato ms frecuente, es posible
afirmar que la moda es el televisor.

No podemos calcular una media o mediana para datos como stos,


cualitativos a nivel nominal.

3. Clculo de las medidas de posicin en series de frecuencias

Veremos como se calculan la medidas de posicin y tendencia central


cuando los datos estn agrupados en una serie de frecuencias.

3.1. Variables agrupadas en serie de frecuencias simple

3.1.a. Media aritmtica.


Como en una serie de frecuencias, fi nos indica las veces que se repite el
valor de la variable, debemos considerarlas en el clculo de la media
aritmtica.

4 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Ejemplo 7
Una maestra esta interesada en conocer el nmero promedio de hermanos
de su alumnos. Para ello tom de una muestra de 25 alumnos.

Tabla 1. Alumnos de tercer ao de polimodal de la Escuela Sarmiento


clasificados segn el nmero de hermanos

N de hermanos N de alumnos
(x i) (fi)
0 1
1 9
2 7
3 5
4 3
Total 25
Fuente: Datos ficticios

Si aplicamos la frmula 2.1, deberamos sumar 1 vez cero, nueve


veces 1 y as sucesivamente hasta sumar 3 veces 4 y dividir esa suma
entre 25 que es el tamao de la muestra.

xi: n de hermanos
fi : nmero de alumnos que poseen xi hermanos

25


i
=1
xi
0+ 1...+ 1+ 2...+ 3...+ 4...+ 4 50
x == = = = 2
25 25 25

Pero, este clculo se podra realizar en forma ms simple y es


obtener esa misma suma reemplazndola por la multiplicacin. Utilizando
la frecuencia fi que indica las veces que se repite el valor de la variable xi.

xi f1 + x2 f2 + ...+ x5 f5
x =
f1 + f2 + ...+ f5

ahora expresando literalmente la frmula de la media aritmtica tenemos

n
1
x= xi fi
n i=1

Este promedio se conoce como media aritmtica ponderada. Para


poder calcular la media aritmtica ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna

4 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

auxiliar que facilitar el clculo de la media.

Tabla 2. Alumnos de tercer ao de polimodal de la Escuela Sarmiento


clasificados segn el nmero de hermanos

N de hermanos N de alumnos xi*fi


(xi) (fi)
0 1 0
1 9 9
2 7 14
3 5 15
4 3 12
Total 25 50
Fuente: Datos ficticios

x =
1 n

xi fi .
= 1 50= 2
25
n i=1

Podemos concluir diciendo que los alumnos de tercer ao de


polimodal de la Escuela Sarmiento en promedio poseen 2 hermanos.

3.1.b. Mediana

Una maestra esta interesada en conocer la mediana del nmero de


hermanos de una muestra de 44 alumnos que concurren a una escuela
rural.

Tabla 3. Alumnos de una Escuela rural clasificados segn el nmero de


hermanos

N de hermanos N de alumnos
(x i) (frecuencia, fi)

2 5
3 5
4 30
5 4
Total 44
Fuente: Datos ficticios

En esta serie de frecuencias de variable cuantitativa discreta, los


datos ya estn ordenados, por lo que solo resta encontrar el valor central,
cuya posicin se encuentra en el lugar

n+1 44+ 1 45
= = = 22,5
2 2 2

4 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

O sea el valor mediano ser el promedio de los valores de la variable


ubicados en el lugar 22 y 23. Para ello se deben seguir los siguientes
pasos:

1.Calcular las frecuencias acumuladas correspondientes a cada valor de


la variable.

2.Calcular el orden de localizacin de la mediana efectuando el cociente

n+1 44+ 1 45
= = = 22,5
2 2 2

donde n = tamao de la muestra

Tabla 4. Alumnos de una Escuela rural clasificados segn el nmero de


hermanos
N de hermanos N de alumnos Frecuencias
(x i) (frecuencia, fi) acumulada (Fi)

2 5 5
3 5 10
4 30 40
5 4 44
Total 44
Fuente: Datos ficticios

Como el valor de la mediana se encuentra entre la posicin 22 y la


posicin 23, se busca en la columna de frecuencias acumuladas, el menor
valor que contiene a 22 (es 40), al que corresponde el valor de variable 4 y
el menor valor que contiene a 23 (es 40), al que corresponde el valor de
variable 4.

Por lo que el valor mediano es el promedio de los dos valores


centrales.
4 + 4
Me = = 4
2
Int erpretacin: el 50 % de los alumnos de escuelas rurales, tienen 4
hermanos o menos.

4 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3.1.c. Moda

Ejemplo: Calcular el valor ms frecuente del nmero de hermanos de los


alumnos de tercer ao de polimodal de la Escuela Sarmiento (Tabla 2).

Solucin: La variable que se estudia es una variable cuantitativa discreta.


Se busca en la columna fi el valor ms alto, en este ejemplo es 9.
El valor de la moda es el valor de la variable que tiene frecuencia 9, es
decir

Mo = 1

Int erpretacin: La mayora de los alumnos de tercer ao de polimodal de


la Escuela Sarmiento. poseen un hermano .

3.2. Variable agrupada en serie de frecuencias con intervalos de clase,


para variable aleat oria cont inua

3.2.a. Media aritmtica.

Ejemplo

Para realizar un estudio sobre la nutricin de la poblacin infantil


que concurre a la escuela en una localidad rural, se consultaron los pesos,
en kilogramos, de los 50 alumnos de la escuela, los que se muestran en la
Tabla 4. Los datos se agruparon en intervalos de amplitud 2 kg. y con
lmite superior abierto. Determine el valor promedio del peso de los
alumnos.

Solucin

1. Se calcula las marcas de clase

Al organizar de esta forma los datos, se pierde informacin, pues la


tabla indica, por ejemplo que hay 12 alumnos que pesan entre 38 kg y 40
kg, pero no cuanto pesan cada uno. Ahora debemos encontrar un nico
valor que represente o resuma a todos los valores del intervalo: ese valor es
el promedio o media aritmtica de los lmites del intervalo y se denomina
punto medio de la clase o marca de clase. Este valor representar el
valor xi de la frmula de la media.

4 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

38+ 40
x1 = = 39
2
40+ 42
x2 = = 41= xi + a = 39+ 2= 41
2

Se introduce una nueva columna en la tabla que la denominaremos xi

Tabla 4. Peso de los alumnos de una escuela rural

Intervalo N de alumnos Marca de clase x i * fi


(kg) fi xi

38 a 40 12 39 468
40 a 42 19 41 779
42 a 44 7 43 301
44 a 46 6 45 270
46 a 48 6 47 282
Total 50 2100
Fuente: Datos ficticios

La frmula para encontrar la media en serie de frecuencias es

n
1
x = xi fi
n i =1

Pero en este caso xi representa a la marca de clase


n=tamao de la muestra=
fi

Ahora ya estamos en condiciones de aplicar la frmula para el


clculo de la media aritmtica, por ello agregamos una columna que es el
producto de cada marca de clase por su frecuencia (xi*fi).

n
1 1
x= xi fi = 50*2100= 42kg
n i =1

Interpret acin: Los alumnos pesan en promedio 42 kg.

5 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3.2.b. Mediana

Ejemplo
Se desea conocer el peso mediano de los 50 alumnos de una escuela
rural (Tabla 4). El clculo de la mediana en serie de frecuencias para
variable cuantitativa continua se efecta utilizando la siguiente frmula

fi - F

ant Me
Me= Linf + 2 *a
fMe

Linf: lmite inferior de la clase mediana


fi
2 : Suma de la frecuencia entre 2
F ant Me
: frecuencia acumulada anterior a la clase mediana
fMe : frecuencia absoluta de la clase mediana
a: amplitud del intervalo a = Lsup Linf

Peso de los alumnos de una escuela rural


Intervalo N de alumnos
(kg) fi

38 a 40 12
40 a 42 19
42 a 44 7
44 a 46 6
46 a 48 6
Total 50
Fuente: Datos ficticios
Solucin
1En la tabla se agrega una columna para valores de frecuencias
acumuladas.

Peso de los alumnos de una escuela rural


Intervalo (kg) N de alumnos fi Fi
38 a 40 12 12
40 a 42 19 31
42 a 44 7 38
44 a 46 6 44
46 a 48 6 50
Total 50

5 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Fuente: Datos ficticios


2 Se calcula
fi
2

El tamao de la muestra se divide entre 2 porque la Mediana es el valor


de la variable que divide la serie ordenada de datos en 2 partes iguales.

fi = 50 = 25
2 2

3 Se busca en la columna Fi el menor valor que contiene a 25. En este


ejemplo el valor que corresponde es 31. Se seala la clase mediana y se
aplica la frmula.
fi - F

ant Me
Me= Linf + 2 *a
fMe

50
- 12
2 25- 12 13*2
Me=40 + *2= 40+ *2= 40+ = 40+ 1,37= 41,37
19 19 19

Int erpretacin:
El 50% de los alumnos pesan 41,37 kg o menos.

3.2.c. Moda
Ejemplo
Se desea conocer el peso ms frecuente de los 50 alumnos. El clculo del
modo en serie de frecuencias para variable cuantitativa continua se realiza
utilizando la siguiente frmula

D1
Mo= Linf Mo + *a
D1 + D2

Donde:
D1 = fMo - fanterior alaclase Modal
D 2= fMo - fposterior alaclase Modal
a: amplitud del intervalo

5 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Solucin
En la columna fi se busca el valor ms alto, en nuestro ejemplo 19,
se seala la fila, ella constituye la clase modal.
Se calcula:

D1 =19- 12= 7

D2 =19- 7= 12

a = 42 40 = 2

Se aplica la frmula

7 7 14
Mo= 40 + *2= 40+ *2= 40+ = 40,74kg
12+ 7 19 19

Int erpretacin: el peso ms frecuente del grupo de alumnos es de 40,74


kg

Relacin entre media, mediana y modo

Cuando la media, la mediana y el modo coinciden, la serie de datos


presenta una distribucin simtrica unimodal.

m=Me=Mo

Cuando esa coincidencia no existe, se dice que la distribucin


unimodal es asimtrica.

La asimetra es positiva cuando la media es mayor que la mediana y


la mediana mayor que el modo, en ste caso vemos que la media aritmtica
se dirige hacia el o los valores extremadamente grandes

5 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Mo<Me<m
La distribucin presenta asimetra negativa cuando la media es
menor que la mediana y la mediana menor que el modo en ste caso
vemos que la media aritmtica se dirige hacia el o los valores
extremadamente pequeos.

m<Me<Mo

La distancia entre la media aritmtica y el modo podra usarse como una


medida de asimetra (YaLun Chou, 1990).

Asimetra = media modo

Cunto mayor es esta distancia, negativa o positiva, tanto ms asimtrica


es la distribucin

4 Medidas de localizacin

Son Medidas de Posicin que dividen los valores ordenados de una serie en
cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.

4.1 Cua rtil es

Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie ordenada
en cuatro partes iguales.
Por debajo del primero quedan el 25% de los datos por debajo del segundo
el 50% de los mismos y por debajo del tercero el 75%. El segundo cuartil
coincide con la Mediana.

5 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.2 Deciles
Los Deciles son nueve valores de la variable y dividen a la serie ordenada
de datos en 10 partes iguales, el decil 5 coincide con la Mediana, es decir
el 50% de los valores son menores o iguales al D5.

4.3 Percentil es
Los percentiles son 99 valores de la variable, que dividen al conjunto de
datos (ordenados de menor a mayor) en cien partes iguales el percentil 50
coincide con la mediana. Los percentiles se designan con la letra Pi, el
subndice i, vara de 1 a 99, indicando el valor del percentil, que se desea
calcular.

Clculo de percent iles:

Forma analtica

Para calcular los percentiles de una distribucin de frecuencias se procede


del mismo modo que en el caso de la mediana, salvo que ahora dividiremos

n= fi
al tamao de la muestra en cien partes iguales, en vez de dos.

Ejempl o
Se desea conocer P20 de licencia en las escuelas del centro de la ciudad de
Santiago del Estero en el ao 2004.

Tabla 5. Das de inasistencia de los docentes de escuelas de la capital de


Santiago del Estero en el perodo escolar 2004.

Intervalo de clase N de docentes Fi


(das de licencia) (fi)
0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530
Fuente: Datos ficticios

5 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

El clculo de percentiles para variables agrupadas en serie de


frecuencias con intervalos de clase, se efecta utilizando la siguiente
frmula:

i fi
- Fant Pi
Pi = Linf + 100 *a
fPi

L inf : Lmite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca

FantPi: frecuencia acumulada anterior a la clase donde se encuentra el


Percentil i

f Pi :frecuencia absoluta de la clase donde se encuentra el Pi

a: amplitud del intervalo a =Lsup Linf

Solucin
Clculo del percentil 20

Pasos
1. Se agrega una columna de frecuencias acumuladas (Fi)

2. Se calcula

i fi 20*530
= = 106
100 100

3. Se ubica en la columna Fi el menor valor que contiene a 106, en


nuestro ejemplo 150. La clase que tiene una Fi= 150 es la clase que
contiene al Percentil buscado

4. Se calcula a: Lsup Linf = 3020=10


5. Se aplica la frmula

106- 90 16*10
P20 = 20+ *10= 20+ = 22,67 23das
60 60

5 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Int erpretacin
P20 = 23 das

El 20 % de los docentes toman 23 das de licencia o menos

Rango percentil

Forma analtica

Se puede presentar, el problema inverso, es decir, conocer cuntos


docentes toman 52 das de licencia o menos, es decir nos dan como dato
un valor de la variable y nos preguntan que percentil le corresponde a este
procedimiento se lo denomina calcular el Rango percentil.

Es decir el rango percentil de un valor dado es el porcentaje de valores


comprendidos debajo del valor solicitado.

Ejemplo:
Calcular el rango percentil que le corresponde a 52 das de licencia de los
docentes de las escuelas de la ciudad de Santiago del Estero

Repetimos la tabla 5 para visualizar mejor el clculo

Das de inasistencia de los docentes de escuelas de la capital de Santiago


del Estero en el perodo escolar 2004.

Intervalo de clase N de docentes Fi


(das de licencia) (fi)
0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530
Fuente: Datos ficticios

Solucin
1. Ubicamos en la tabla el intervalo de clase donde se encuentra el valor
52 es el intervalo que va de 50 a 60.

2. Se calcula la Frecuencia acumulada que le correspondera al valor 52

5 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

con la siguiente frmula


(xi - Linf )
F (xi)= * finterv + FClase anterior
a

Donde:
F(xi)= frecuencia acumulada correspondiente al valor que se busca
Linf Lmite inferior del intervalo de clase donde se encuentra xi
finterv Frecuencia absoluta del intervalo donde se encuentra xi
a amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo donde


se encuentra xi

(52- 50) 2*100


F(52)= *100+ 310= + 310= 330
10 10

3. Se calcula ahora el rango percentil con la siguiente frmula

F( xi)
Rp = *100
fi
330
Rp = *100= 62.26% 62%
530

Int erpretacin:
Xi= 52 das
Pi= 52

El 62% de los docentes toman 52 das de licencia o menos.

(Clculo grfico de percentiles y rango percentil

Ejemplo
Calcular grficamente el percentil 20

Solucin
Se debe construir un grfico de lneas los pares de valores a graficar
corresponden al lmite superior del intervalo con el porcentaje acumulado
correspondiente a dicha clase.
1. Calcular porcentaje acumulados. Para ello se necesita calcular:
a) frecuencia relativa para cada intervalo

5 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

b) porcentaje
c) porcentaje acumulado
2. Se grafica un polgono (Lsup %acum.). El grfico que se obtiene se
denomina ojiva.

Das de inasistencia de los docentes de escuelas de la capital de Santiago


del Estero en el perodo escolar 2004.

Interv alo de c lase N de doce nte s f ri Porcentaje Porcentaje


(das de lice ncia) (f i) f ri*100 acumulado
0 a 10 30 0,0566 5,67= 6 6
10 a 20 60 0,1132 11,32 = 11 17
20 a 30 60 0,1132 11,32 = 11 28
30 a 40 70 0,1321 13,21 = 13 41
40 a 50 90 0,1698 16,98 = 17 58
50 a 60 100 0,1887 18,87 = 19 77
60 a 70 60 0,1132 11,32 = 11 88
70 a 80 40 0,0755 7,55 = 8 96
80 a 90 10 0,0189 1,89 = 2 98
90 a 100 10 0,0189 1,89 = 2 100
Total 530 100

100

90
80
70

60
%

50

40

30

20
10

0
0 10 20 30 40 50 60 70 80 90 100

Das

5.Si deseamos calcular el valor que corresponde al percentil 20. Se ubica


el valor 20 en el eje vertical y se traza una paralela al eje horizontal hasta
la curva y luego se traza una vertical hasta encontrar el valor de das
correspondiente, el que aproximadamente es 23.

Int erpretacin:
El 20 % los docentes incurren en 23 das de licencia o menos

5 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

6.Si deseamos conocer cual es el rango percent il que corresponde a 52


das, ubicamos ese valor en el eje horizontal y trazamos una paralela al eje
vertical hasta la curva y desde all una paralela al eje horizontal, leemos en
el eje vertical el valor correspondiente al rango percentil (aproximadamente
60).

100

90
80
70

60
%

50

40

30

20
10

0
0 10 20 30 40 50 60 70 80 90 100

Das

Los valores correctos se obtienen utilizando las frmulas presentadas


anteriormente.

MEDIDAS DE VARIABILIDAD O DISPERSIN

Las Medidas de Posicin no son suficientes por si solas para


describir el conjunto de datos es necesario tener adems una idea de como
se distribuyen los datos alrededor del centro de la distribucin. Para eso
surgen las Medidas de Dispersin o variabilidad.

6 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1.Medidas de variabilidad en series simple. Su clculo

1.1. RANGO
Es llamado tambin amplitud total de variacin de la variable. Se lo
obtiene como la diferencia entre el valor mximo y mnimo de la variable.

Distribucin A: 1 5 5 5 5 5 5 5 5 9

Distribucin B: 1 1 2 4 5 6 7 7 8 9

RA=91=8
RB=91=8

En este caso el valor del rango es el mismo, a pesar de que notamos


que la variabilidad de las dos distribuciones es diferente.

La desventaja de esta medida es que solo considera los valores


extremos sin tener en cuenta el comportamiento del resto de las
observaciones. Por lo que observamos que a pesar de tener variabilidades
diferentes las dos distribuciones, el rango no la capta.

Para solucionar este problema surgen otras medidas de variabilidad


como el desvo medio.

Cmo se puede medir la variabilidad de un conjunto de datos? Si por


variabilidad se entiende el grado en que los valores de la distribucin
difieren de la media y entre si, entonces la desviacin promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad:

(xi - x)
n

Se denomina desvo a la diferencia entre cada valor de la variabley


su medio.

Cuando el valor de la variable es mayor que el valor medio el desvio


es positivo cuando el valor de la variable es menor que el valor promedio
los desvos son negativos.

Pero por propiedades de la media sabemos que la suma de los


desvos de los valores respecto a la media es siempre es cero, pues las
desviaciones positivas respecto a la media, anulan siempre a las

6 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

desviaciones negativas, con lo que resulta siempre una suma igual a cero y
por ende el valor promedio.

Como esta medida de variabilidad parece razonable, debemos


redefinir nuestra medida para evitar los valores negativos. Una manera de
hacerlo es considerar el valor absoluto de los desvos la medida que se
obtiene se denomina:

1.2.DESVIO MEDIO: Se define como el promedio del valor absoluto de los


desvos se designa con DM.

DM =
di = xi - x
n n

Tabla 6: Distribucin de puntajes de un grupo de alumnos


xi xi -x di
d i =
1 4 4
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 4
xi = 50 (di)= 0 di = 8
x=5 8
DM = = 0,8
10
Fuente: Datos ficticios

Pero generalmente no se puede operar fcilmente cuando se trabaja


con valor absoluto, por eso se considera una segunda forma de modificar
esos signos negativos y consiste en elevar los desvos al cuadrado, lo que
dar desvos al cuadrado positivos. Esta nueva medida de variabilidad se
denomina varianza.

1.3. Varianza es el promedio de los desvos al cuadrado y se designa con


S2 cuando se trata de una muestra y es un mejor estimador de
2
la varianza poblacional(s ) cuando la suma de los desvos al
cuadrado se divide entre el tamao de la muestra menos 1
por ello para una muestra la frmula es:

6 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

(xi - x)2

S2 = i
=1 Variancia de una muestra, para series simples
n- 1
n

( xi - m ) 2

s 2 = i
=1 Variancia poblacional
N

Cuntos ms tiendan los valores a diferir de la media, mayor ser la


varianza. El valor numrico de la varianza de una distribucin depende de
la unidad de medida que se utilice. Por consiguiente, cuando se compara
la varianza de dos o ms distribuciones, hay que estar seguro que la
unidad de medida empleada es igual en todas las distribuciones. En el
ejemplo de la Tabla 7:

Distribucin de puntajes de un grupo de alumnos

xi
di=
xi - x (
d12 = xi - x )2

1 4 16
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 16
(d i)= 0 (xi - x) = 32
2
xi = 50

x=5 32
S2 = = 3,56
9
Fuente: Datos ficticios

(xi - x)2

32
S2 = i
=1
= = 3,56
n- 1 9

6 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Otra desventaja es que la varianza se expresa, en unidades al


cuadrado y no en trmino de las unidades originales de medicin, lo que
hace difcil la tarea de relacionar en forma significativa el valor de la
varianza con el conjunto original de datos.

Por eso es conveniente, considerar una medida de variabilidad que


se exprese en unidades originales. Esta nueva medida denominada
desviacin estndar se obtiene al extraer a la varianza la raz cuadrada.

1.4.Desv iacin est ndar muestral

(xi - x) 2

i
=1
S =
n- 1

(xi- x) 2

32
i
=1
S = = = 3,56 = 1,89
n- 1 9

Desviacin estndar poblacional

( xi -m ) 2

i =1
s =
N

Nos debe quedar claro que la desviacin estndar mide la variacin


entre los valores. Los valores cercanos producirn una desviacin estndar
pequea, mientras que los valores dispersos producirn una desviacin
estndar ms grande.

2.Medidas de variabilidad en series de frecuencia simple. Su clculo

Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos

6 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Tabla N 7. Inasistencias de 32 alumnos

N de inasistencias N de alumnos
(x i) (fi)
11 12
12 9
14 5
15 4
23 2
Total 32

FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se calcula:

2.1 Rango= Valor mximo Valor mnimo + 1

Rango=R = 23 11+1=13 inasistencia

2.2 Desv o medio en serie de frecuencia simple

di * fi xi - x *fi
DM =
fi fi
Clculo:
1) Se calcula la media aritmtica
2) Se calcula los desvos
3) Se obtiene el valor absoluto y se lo multiplica por su frecuencia
4) Se aplica la frmula

Inasistencias de 32 alumnos
N de inasistencias N de alumnos x i*fi di = xi - x d1 di * fi
(x i) (fi)
11 12 132 2 2 24
12 9 108 1 1 9
14 5 70 1 1 5
15 4 60 2 2 8
23 2 46 10 10 20
32 416 66

x= xi * fi = 416 = 13
fi 32

6 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

DM = di * fi = 66 = 2,06
fi 32
2.3. Varianza en serie de frecuencia simple

n n

(xi- x) 2
fi (xi- x) fi
2

S2 = i
=1
= i=1

n- 1 fi - 1
1) Se calcula la media aritmtica
2) Se calcula los desvos
3) Se elevan los desvos al cuadrado
4) Se multiplica cada desvo al cuadrado por su frecuencia
5) Se aplica la frmula

Inasistencias de 32 alumnos
N de inasistencias N de alumnos x i*fi di = xi - x di2 di2 * fi
(x i) (fi)
11 12 132 2 4 48
12 9 108 1 1 9
14 5 70 1 1 5
15 4 60 2 4 16
23 2 46 10 100 200
32 416 278
FUENTE: Datos ficticios

(xi - x) fi 2

278 278
S2 = i
=1
= = = 8,97das2
n- 1 32- 1 31

2.4 Desviacin estndar en serie de frecuencia simple

n n

(x - x) * f (xi- x) * fi
2 2
i i
i=1
i
=1
S= =
n- 1 fi - 1
n

(xi - x) * fi
2

278 278
i
=1
S = = = = 8,97 = 2,99
n- 1 32- 1 31

6 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3. Medida de variabilidad en serie de frecuencias con int erv alos de


clase

Los siguientes datos corresponden a edades de los alumnos de los 2 ciclos


de EGB.

Tabla N9. Edades de los alumnos de segundo ciclo del EGB

Clases de Marca de fi x i*fi di =(xi - x) d1 d1


edad en ao clase (xi) *fi
6 a 8 7 4 28 4 4 16
8 a 10 9 8 72 2 2 16
10 a 12 11 11 121 0 0 0
12 a 14 13 12 156 2 2 24
14 a 16 15 2 30 4 4 8
Total 37 407 64
Fuente: Datos ficticios

3.1.Rango
L.superior de la ltima clase L.inferior de la primera clase. Como los
lmites superiores de las clases son abiertos, es decir no toma el valor 16,
debemos colocar el valor 15,99

R = 15,99 6 = 9,99 aos

1) Se calculan las marcas de clase y luego la media aritmtica


2) Se calcula los desvos
3) Se elevan los desvos al cuadrado
4) Se multiplica cada desvo al cuadrado por su frecuencia
5) Se aplica la frmula

3.2. Desvo medio en serie de frecuencia de intervalos

DM =
di * fi = 64 = 1.73
fi 37
1) Se calculan las marcas de clase y luego la media aritmtica

6 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

x= xi * fi = 407 = 11
fi 37
2) Se calcula los desvos
3) Se obtiene el valor absoluto de los desvos
4) Se multiplica cada desvo absoluto por su frecuencia, se suma
5) Se aplica la frmula

3.3. Variancia serie de frecuencia con intervalos de clase

1) Se calculan las marcas de clase y luego la media aritmtica


2) Se calculan los desvos
3) Se elevan los desvos al cuadrado
4) Se multiplica cada desvo al cuadrado por su frecuencia
5) Se aplica la frmula

Edades de los alumnos de segundo ciclo del EGB

Clases de Marca de fi x i*fi di =(xi - x) di2 di2*fi


edad en ao clase (xi)
6 a 8 7 4 28 4 16 64
8 a 10 9 8 72 2 4 32
10 a 12 11 11 121 0 0 0
12 a 14 13 12 156 2 4 48
14 a 16 15 2 30 4 16 32
Total 37 407 176
Fuente: Datos ficticios

Varianza en serie de frecuencias con intervalos de clase, la nica


diferencia con las frmulas para serie de frecuencias simples es que xi,
representa el punto medio de la clase o marca de clase

(xi - x) fi
2

176 176
i
S2 = =1
= = = 4,89aos2
n- 1 37- 1 36

6 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3.4 Desv iacin estndar en serie de frecuencias con intervalos de clase.

(xi - x) * fi

2

176 176
i
=1
S = = = = 4,89 = 2,21aos
n- 1 37- 1 36

COEFICIENTE DE VARIACIN

Las cuatro medidas de variabilidad enunciadas precedentemente son


medidas de variabilidad absoluta. El coeficiente de variacin es una
medida de variabilidad relativa.

Expresa la desviacin estndar como un porcentaje de la media. Es


una medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o ms distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.

Coeficiente de variacin muestral C.V S


.= 100
x

Ejemplo
Decir cual de las siguientes distribuciones es ms variable:

xi: peso de los alumnos de nivel inicial (kg)


34 29 28 31 40

yi: altura de los alumnos de nivel inicial (m)


1,24 1,54 1,38 1,37 1,56

x=32,4 kg Sx=4,83kg
y=1,42 m Sy=0,13m

No podemos decir que la variabilidad en peso es mayor que la


variabilidad en altura, ya que las variables estn medidas en distintas
unidades, para poder compararlas la debemos expresar como porcentaje
de sus medias

6 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

CVx=(4,83/32,4)*100=14,91%

CVy=(0,13/1,42)*100=9,15%

Conclusin: los alumnos tienen menor variabilidad en altura que en peso.

Uso de la ca lcul a dora cientfi ca para el c lculo de Medi da s de


Posi cin y Di spersin Cal cul a dora s Casio model o f x82W.
Seguir la s si guientes i nstrucciones:

Debe procurar que la calculadora se encuentre en disposicin para


efectuar clculos estadsticos. Para ello apriete mode 2. En la parte
superior de la pantalla aparece la notacin SD.

Debe cerciorarse de que no hay nada acumulado en la memoria.


Para ello pulse SHIFT AC = y en su pantalla aparece el nmero cero. Se
est ahora en condiciones de introducir los datos.

Por ejemplo para serie simple: xi: 1 2 3 4 5

Marque el n 1 y luego la tecla M+

Marque el n 2 y luego la tecla M+

Marque el n 3 y luego la tecla M+

As sucesivamente hasta haber cargado todos los datos.

Para cerciorarse de la cantidad de datos introducidos

Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete


ahora = y aparecer el 5, pues Ud. introdujo los 5 valores.
Para obtener la media aritmtica pulse SHIFT y la tecla 1, en la pantalla

aparece x apriete = y en su pantalla aparece el valor 3 que es el valor de


la media.

Para obtener la desviacin estndar marque SHIFT y la tecla 3, aparece en

su pantalla
s n-1 presione = y en su pantalla aparecer el valor 1,58

Si aprieta ahora la tecla x2 obtendr 2,50 que es el valor de la

7 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

varianza muestral S2

Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.

Para el caso de que la serie sea de frecuencia simple

Se coloca la mquina en modo estadstica Mode 2

Presione SHIFT AC = ya tiene la memoria limpia.

Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma.


Aparece en la pantalla x i ahora introduzca el valor de fi y una vez que
tenga en la pantalla x i f i recin apriete M+ contine as hasta introducir
todos los valores de su serie, para el clculo de la media, desviacin
estndar y varianza se procede luego apretando las teclas indicadas
anteriormente.

Cuando se trabaja con todos los datos de una poblacin para el


clculo de la desviacin estndar se aprieta SHIFT y la tecla 2

GUA DE EJERCITACIN

Actividad 1

a) Los siguientes son pesos individuales de 10 alumnos de primer ao de


EGB:
30, 32, 30.5, 31, 33, 31, 32.9, 34, 34.6, 35

b) En la etapa de diagnstico destinada a implementar un Plan de Salud


Bucal en alumnos de EGB, en una escuela el odontlogo determin el
nmero de caries que presentaba cada alumno. Los siguientes son nmero
de caries que presentaban 9 de dichos alumnos:

7 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

2, 4, 0, 2, 3, 5, 1, 2, 2

c) En un curso se tom ocho alumnos al azar y se les pregunt cul era el


salario que perciba mensualmente su padre. Ellos son los siguientes:
3000, 1000, 570, 400, 600, 1500, 500, 570

1. En cada caso determine y clasifique el tipo de variable que se


considera.

2. Cmo se denomina en cada caso el conjunto de datos obtenidos para


la variable que se estudia?

3. Determine en cada uno de los incisos a, b y c, la Media Aritmtica,


Mediana y Modo.

4. En cul de los casos arriba detallados la media no es una Medida de


Posicin adecuada?

Actividad 2

a) En cada una de las series de datos de la Actividad 1, calcule Rango,


Desviacin Media, Desviacin estndar y Coeficiente de Variacin.
b) Si Ud. quiere comparar la variabilidad de los datos de cada una de las
series presentadas en la Actividad 1, cul medida de dispersin empleara?

7 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 3

Para realizar una evaluacin del Nmero de puntos obtenidos en una


Prueba de Matemticas realizada a los 30 alumnos de 6 de EGB, se
orden dicha variable en la siguiente serie de frecuencias:

N de puntos 0 1 2 3 4 5 6 7 8 9 10
xi
N de alumnos 0 1 0 4 3 8 6 4 1 2 1
fi

a) Calcule Media, Mediana y Modo.

b) Determine Desviacin Estndar, Varianza y Coeficiente de Variacin.

c) Indique si la distribucin que se analiza es simtrica o no. En caso de


ser asimtrica, indique que tipo de asimetra presenta.

d) A los fines de la evaluacin, cul de las tres Medidas de Posicin sera


ms correcta utilizar?

Actividad 4

Los siguientes datos corresponden a Tipo de Deportes que prefieren


los alumnos de una escuela.

Tipo de deportes N de alumnos


fi
Basquet 220
Ftbol 500
Pelota al cesto 180
Hockey 100
Total 1000

a) Indique qu tipo de variable es.


b) Determine la Medida de Posicin que corresponda a este caso.

7 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 5

Las alturas de alumnos de un curso de Polimodal en una escuela se


muestran en la siguiente Tabla:

altura fi
(m)
1.101.15 3
1.151.20 4
1.201.25 6
1.251.30 5
1.301.35 9
1.351.40 9
1.401.45 6
1.451.50 2
1.501.55 1
1.551.60 1
1.601.65 1

a) Qu tipo de variable se considera?

b) Encuentre frecuencias acumuladas, porcentajes y porcentajes


acumulados.

c) Encuentre Media Aritmtica, Mediana y Modo.

d) Calcule Desviacin estndar y Coeficiente de variacin.

e) Realice el grfico de la distribucin porcentual acumulada.

f) Determine grfica y analticamente el rango percentil para las siguientes


alturas:
1.18, 1.47, 1.56, 1.62.

g) Determine grfica y analticamente las alturas correspondientes a los


percentiles:
10, 25, 50, 75

7 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

UNI DA DI V

PROBABILIDADES Y DISTRIBUCIONES DE
PROBABILIDADES INFERENCIA ESTADSTICA

1. INTRODUCCIN

La teora de probabilidad tiene sus orgenes en la teora de la


casualidad. Histricamente, la teora de la Probabilidad comenz con el
estudio de los juegos de azar, tales como la ruleta y las cartas.

La teora de la Probabilidad no es tan extraa como pudiera


pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia
emitimos juicios probabilsticos, aunque a menudo no lo reconocemos
como tales.

Por ejemplo, supongamos que, por razones diferentes, usted no est


preparado para la clase de hoy. Seriamente usted considera faltar a clase.
Qu factores influirn en su decisin? Obviamente una consideracin
ser la probabilidad de que el profesor descubra su falta de preparacin. Si
el riesgo es alto, usted decide no ir a clase. Veamos, hay dos alternativas
posibles:

1. Su falta de preparacin ser descubierta.


2. Su falta de preparacin no ser descubierta.

Hay incertidumbre en esta situacin porque hay ms de una


alternativa posible. Su decisin de asistir a clase, depender del grado de
certeza asociado con cada una de estas alternativas. As, si usted est
bastante seguro de que prevalezca la primera alternativa, usted decidir no
ir a clase.

Supngase que su profesor con frecuencia pide a los estudiantes que


participen en clase activamente. De hecho, usted ha notado que la mayora
de los estudiantes son interrogados en cada sesin de clase. Este es un
ejemplo en el cual hay un alto grado de certeza asociada con la primera
alternativa. Dicho de esta manera, la probabilidad del primero es mayor
que la del segundo. Por consiguiente usted decide no ir a clase. Usted ha
tomado una decisin con base en un empleo intuitivo, de la probabilidad.

Antes de estudiar la teora de la probabilidad, es conveniente


comprender bien uno de los conceptos ms importantes de la Inferencia
Estadstica: el concepto de a zar

7 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

2. EL CONCEPT O DE AZAR

Definimos una poblacin como el conjunto completo de individuos,


objetos o medidas que tienen alguna caracterstica comn observable. Muy
rara vez se puede estudiar una poblacin. Seleccionamos muestras de una
poblacin con la esperanza de que los estadsticos de la muestra nos
permitan calcular los parmetros de la poblacin. Para obtener una
correspondencia entre un estadstico y un parmetro, la muestra debe
representar una seleccin aleatoria de la poblacin. Una forma de obtener
una muestra aleatoria, es mediante el Muestreo al Azar Simple, de tal
manera que cada individuo , objeto o medida tenga igual probabilidad de
ser seleccionado. Una caracterstica sobre los sucesos aleatorios, es que
ningn suceso tiene efecto predecible sobre el siguiente. Podremos
comprender ms clara y fcilmente el concepto de azar en relacin con los
juegos de azar, si suponemos que se juegan limpiamente. Conocer el
resultado del lanzamiento de una moneda al aire, del lanzamiento de un
dado, del resultado de un juego de ruleta, no nos ayudar en absoluto en
la prediccin de los resultados por venir. Esta caracterstica de los sucesos
al azar se conoce como i ndependenci a . Si la independencia existe,
podemos hablar de sucesos realmente al azar.

La segunda caracterstica importante del azar es que cuando la


muestra se extrae de una poblacin, cada elemento debe tener una
probabilidad igual de seleccin. As, si nuestra seleccin o modo de
seleccin favorece ciertos sucesos o ciertas colecciones de sucesos, no
podemos afirmar que los resultados son al azar.

3. PROBABILIDAD Y ESTADSTICA

La Estadstica Descriptiva, hace referencia a los datos que se tienen


en la mano. Cuando se quiere ir ms all de los datos disponibles, es
necesario inferir o sea utilizar la Estadstica Inferencial. Como ella infiere
el todo (poblacin) a partir de la informacin que da una parte de ese todo
(muestra), el conocimiento que adquiere es incompleto y por lo tanto no
totalmente cierto es decir, se debe trabajar con probabilidades. Por ello,
antes de estudiar las aplicaciones de la Estadstica Inferencial es necesario
estudiar probabilidades.

7 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4. TEORAS DE PROBABILIDAD

Se puede considerar la probabilidad como la teora que tiene que ver


con los posibles resultados de los experimentos. Estos deben ser
potencialmente repetitivos, es decir, debemos ser capaces de reproducirlos
bajo condiciones similares. Debe ser posible enumerar cada resultado que
pueda ocurrir, y debemos ser capaces de establecer las frecuencias
relativas de estos resultados.

Se distingue el enfoque clsico , frecuencial y axiomtico de la teora


de probabilidad.

4.1.EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL. EVENTOS.

El lanzamiento de un dado, o de una moneda, la extraccin de un


naipe de la baraja, de las bolillas de la lotera son experiencias aleatorias,
pues sus resultados dependen del azar. Tambin son aleatorios: el tiempo
de espera de una persona en la parada del autobs, sexo de los hijos en
un matrimonio, el nmero de hijos que tendr un matrimonio, etc.

Los primeros (lanzamiento, extracciones) son fciles de seguir, pues


se pueden repetir tantas veces como se quiera de forma rpida. A partir de
ellos se obtienen leyes que rigen los fenmenos aleatorios y se aplican al
estudio de situaciones aleatorias.

Conceptos necesarios para definir probabilidades

Experimentos aleat orios: son aquellos que, repetidos bajo idnticas


condiciones, no arrojan un nico resultado sino un conjunto de
ellos.
Ejemplos: Arrojar un dado
Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un


experimento aleatorio y se denota con M.

Ejemplos.
Para el caso de arrojar un dado, el espacio muestral resultante
es:

7 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

M= {1,23
, ,4,5,6}
Para el caso de arrojar una moneda, el espacio muestral
resultante es:

M={C, S}

Para el caso de arrojar una moneda y un dado


simultneamente ,el espacio muestral resultante es:

M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)

Event o simple .Es cada uno de los resultados de un experimento aleatorio


que no puede desglosarse en componentes ms simples. Se
designan con la letra minscula.

Ejemplos
Para el caso de arrojar un dado. Obtener el nmero 1, es un
evento simple, lo mismo ocurre con los nmeros restantes
e={1}
e={2}
Para el experimento aleatorio arrojar una moneda al aire, los
evento simples son
e={c}
e={s}

Event o compuest o. Es un subconjunto del Espacio Muestral. Es el


resultado de la unin de eventos simples. Se lo representa con letra
mayscula.
Para el caso de arrojar un dado. El espacio muestral es
M= {1,23
, ,4,5,6}
Obtener nmero par, es el resultado de la unin de los
eventos simples 2, 4, 6, y constituyen un subconjunto del
espacio muestral.
P={2, 4, 6}

Obtener nmero impar


I={3, 5, 7}

Obtener un nmero menor que 4


A={1, 2,3}

Suceso seguro: es el conjunto total M(espacio muestral).

7 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Suceso imposible: es el conjunto vaco.

Opera ciones con sucesos

En las aplicaciones de la teora de probabilidades trataremos


muchas veces con eventos relacionados entre s, ms que con un solo
evento. Por esta razn consideraremos ahora un experimento aleatorio
arbitrario, con su espacio muestral correspondiente M, y cualesquiera dos
eventos A y B en el experimento. Entonces:

*Union de Eventos A B ( A unin B , A o B ) representa el evento que


ocurre si, y solo si ocurre A u ocurre B o ambos ( Una notacin ms
antigua que representa a A B es A + B, y el nombre
correspondiente es suma de dos eventos)

*Interseccin de Event os. A B ( A interseccin B A y B ) representa


el evento que ocurre si, y solo si, ocurren A y B simultneamente,
esto es, si ocurren en la misma ejecucin del experimento en
consideracin.

Event os mutuament e exclusivos. Son los eventos que no ocurren


simultneamente. Este caso se representa solamente cuando
A B = , el evento vaco, de tal manera que A y B no tienen puntos en
comn.
*. El evento A es el complemento del evento A con respecto al espacio
muestral M y contiene a todos los resultados de M que no se encuentran
en A.
Ejemplo Para el caso del arrojar una dado, el espacio muestral es
M= {1,23
, ,4,5,6}

Evento A obtener un n par

A={2, 4, 6}

A={1, 3, 5 }

Ejemplo:

Un experimento consiste en tirar un dado y observar el nmero de


puntos que aparece en la cara superior. El espacio muestral se puede

7 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

describir fcilmente, ya que es finito. Las posibilidades para el dado son


seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:

M = {1, 2, 3,4, 5, 6}

b) Describir los siguientes eventos:


A:
A: Sa
Salle
e un
un nu
numme
erro
o pa
parr..
B:
B: Sa
Salle
e un
un n
nm
meerro
o im
imp paarr..
C:
C: Sa
Salle
e un
un n
nmme
erro
o me
men noorr qu
que
e 4
D:
D: Sa
Salle
e un
un n
nmme
erro
o ma
may yoorr qu
que
e 3.
3.
E:
E: Sa
Salle
e un
un n
nmme
erro
o im
imppa arr o ma
may yoorr qu
quee 3.
3.
F.
F. Sa
Salle
e un
un n
nm
meerro
o pa
parr y memen noorr qu
que e 4.
4.
G:
G: Sa
Salle
e un
un n
nmme
erro
o pa
parr y unun im
imp paarr..
So
Sollu
uc
cii
n
n

v El evento:Sale un nmero par , est representado por la


letra A, su descripcin puede realizarse mediante el
siguiente conjunto :

A = {246
, , },

v El evento Sale un nmero impar , est representado por


la letra B, su descripcin puede realizarse mediante el
siguiente conjunto :

B = { 1 , 3 , 5 }.

v El evento Sale un nmero menor que 4 , est


representado por la letra C, su descripcin puede realizarse
mediante el siguiente conjunto :

C= 1 , 2 , 3

v El evento Sale un nmero mayor que 3, est


representado por la letra D, su descripcin puede realizarse
mediante el siguiente conjunto :

D= 4 , 5 , 6

v El evento Sale un nmero impar o mayor que 3, se


representa por la letra E, est formado por todos los
resultado de B o de D o de ambos. Este evento recibe el
nombre de unin de B y D, se denota por B D y su

8 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

descripcin puede realizarse mediante el siguiente


conjunto:

B D = E =1 , 3 , 4 , 5 , 6

v El evento Sale un nmero par y menor que 4, se


representa por la letra F, est formado por los resultados
comunes tanto a A como a C. Este evento recibe el nombre
de interseccin de A y C, se denota por A C y su
descripcin puede realizarse mediante el siguiente conjunto
:

A C = F = 2

v El evento Sale Un nmero par y un nmero impar, se


representa mediante la letra G, est formado por la
interseccin de los eventos A y B, estos eventos no tienen
nada en comn, por lo tanto la interseccin de ellos es
vaca. A y B son mutuament e excluyentes o disjuntos..

A B = G = =

4.2. DEFINICIN CLSICA DE PROBABILIDAD (PROBABILIDAD A


PRIORI)

Supngase que queremos conocer la probabilidad de que una


moneda caiga con la cara hacia arriba. Como hay solo dos posibles
resultados (cara o seca) adoptamos una situacin ideal en la cual
esperamos que cada resultado tenga igual probabilidad de ocurrir. As, la
1
probabilidad de que se presente una cara, P ( C) = 2

Definicin :La probabilidad de un evento A en un experimento aleatorio


est dado por: el cociente entre el nmero de casos favorables y el nmero
de casos igualmente posibles

Ndecasos favorables a A
P ( A)=
N total decasos igualmente posibles

Por ejemplo, la probabilidad de extraer el as de espada de una baraja


ordinaria de 52 cartas es 1/52.

8 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Pero la probabilidad de sacar un as de espada rojo es cero


(puesto que no hay figuras de espadas rojas en la baraja) no hay
sucesos posibles que favorezcan este resultado.

Si los ev entos son mut uamente excluyentes (esto es, si los dos
eventos no pueden ocurrir simultneamente), pues A B = , la
P ( ) = 0

4.3. DEFINICIN DE PROBABILIDAD FRECUENCIAL


(PROBABILIDAD A POSTERIORI)

Las probabilidades se aproximan despus de realizar la experiencia.


Por ejemplo, para saber cul es la probabilidad de obtener el as con un
dado determinado, se arroja el dado 600 veces en las cuales se obtienen
113 veces un as.

La probabilidad de obtener un as con ese dado es estimada por la


frecuencia relativa = 113/600 = 0.1883.

Realice ( u observe) un procedimiento un gran nmero de veces y


cuente las ocasiones que el suceso A ocurre en realidad. Con base en estos
resultados reales, P(As) se estima de la siguiente forma :
f(As)
P(As) = fr(As)
f

4.4. AXIOMAS DE PROBABILIDAD

1. Si E es un evento cualquiera en un espacio muestral M , entonces

0 P ( E )1
La probabilidad de un suceso vara entre 0 y 1.

2. Al espacio muestral M completo le corresponde

P(M)=1

3. Si A y B son eventos mutuamente exclusivos, entonces se cumple

P(AB)=P(A)+P(B)

8 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por

3* . Si E1 , E 2 , . . . . son eventos mutuamente exclusivos, entonces


tenemos que

P (E1 E 2 . . . ) = P ( E1 ) + P ( E 2 ) + ........

4.5. PROPIEDADES:

1. Si es el conjunto vacio, entonces P ( ) = 0 . Imposibilidad

Por ejemplo, la probabilidad de extraer el as de espada de una baraja


ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar un as de
espada rojo es cero (puesto que no hay figuras de espadas rojas en la
baraja).no hay sucesos posibles que favorezcan este resultado.

2. Si E c es el complemento de un evento E , entonces

P (E c ) = 1 P( E )

3. Si A B , entonces P ( A ) menor o igual a P ( B ).

v La probabilidad de que ocurra el evento A , es decir que al


lanzar un dado salga un nmero par , se calcula como
P(A) =3/6 = 1/2
donde:
el nmero de resultados favorables es 6, ya que A = 2, 4, 6 ,
tiene 3 elementos.
el nmero total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5, 6}
tiene 6 elementos.

v La probabilidad de que ocurra el evento B, es decir que al


lanzar un dado salga un nmero impar , se calcula como
P(B) =3/6 = 1/2
donde:
el nmero de resultados favorables es 6, ya que B = 1,3,5 ,
tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1 ,2 ,3, 4, 5 , 6}
tiene 6 elementos.

8 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

v La probabilidad de que ocurra el evento C, es decir que al


lanzar un dado salga un nmero menor que 4 , se calcula
como
P(C) =3/6 = 1/2
donde:
el nmero de resultados favorables es 6, ya que C= 1 ,2, 3 ,
tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 , 6}
tiene 6 elementos.

v La probabilidad de que ocurra el evento D, es decir que al


lanzar un dado salga un nmero mayor que 3 , se calcula
como
P(D) =3/6 = 1/2
donde:
el nmero de resultados favorables es 6, ya que D= 4, 5, 6 ,
tiene 3 elementos.
el nmero total de resultados es 6, ya que M = {1 , 2,3 , 4, 5 , 6}
tiene 6 elementos.

v La probabilidad de que ocurra el evento E, es decir que al


lanzar un dado salga un nmero impar o mayor que 3 , se
calcula como
P(E) =5 / 6
donde:
el nmero de resultados favorables es 5,ya que E=1,3,4,5,6 ,
tiene 5 elementos.
el nmero total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5, 6}
tiene 6 elementos.

v La probabilidad de que ocurra el evento F, es decir que al


tirar un dado salga un nmero par y menor que 4 , se
calcula como
P(F) =1 / 6
donde:
el nmero de resultados favorables es 1, ya que F = 2 , tiene 1
elemento.
el nmero total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6}
tiene 6 elementos.

v La probabilidad de que ocurra el evento G, esta formado


por la interseccin de los eventos A y B que son

8 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

mut uamente excluy entes, decir que al lanzar un dado ,


un nmero impar y par , es cero, ya que es imposible de
que ocurra dicho evento. La probabilidad del evento nulo o
vacio siempre es 0.se calcula como
P(G) = P ( ) = 0
donde:
el nmero de resultados favorables es vacio, ya que G = .
el nmero total de resultados es 6, ya que M = {1, 2, 3, 4 , 5 , 6}
tiene 6 elementos.

4.5.TEOREMA DE LA SUMA DE PROBABILIDADES

Sean A y B dos eventos del espacio muestral M generado por un


experimento aleatorio. El teorema de la suma de probabilidades dice
que la probabilidad de la unin de A y B es la suma de las
probabilidades menos la probabilidad de la interseccin. En smbolos:

Sean A y B M entonces
P(AB)=P(A)+P(B) P(AB)

Si los eventos son mutuamente excluyentes, el ltimo trmino


desaparece, pues A B = y P ( ) = 0
P(AB)=P(A)+P(B)

En el ejemplo, calcule la probabilidad del evento sale cara o sale


un nmero par correspondiente al experimento de lanzar
simultneamente un dado y una moneda, utilizando el teorema de la
suma de probabilidades.

El espacio muestral M={(1,c) (1,s) (2,c) (2,s) (3,c) (3,s) (4,c) (4,s)
(5,c) (5,s) (6,c) (6,s)

c: salga cara
P: salga nmero par

P(CP)=P(C)+P(P) P(CP)
6 6 3 9 3
+ - = = = 0,75
P (C P )=12 12 12 12 4

8 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.6. PROBABILIDAD CONDICIONAL

Muchas veces necesitamos encontrar la probabilidad de un evento B


si se sabe que ha ocurrido un evento A. Esta probabilidad se llama
probabilidad condicional de B dado A, y se representa como P ( B / A ) .
En este caso A sirve como un espacio muestral nuevo ( reducido ) , y la
probabilidad es la fraccin de P( A) que corresponde a A B. As que

P ( A B)
P(B/A) = P( A)
Del mismo modo, la probabilidad condicional de A dado B es

P ( A B)
P ( A/B) = P(B)

. Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un nmero menor que 4 dado que


apareci un nmero mayor que 3

b) halle la probabilidad de que aparezca un nmero impar dado que


apareci un nmero mayor que 3

Solucin :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha


ocurrido el evento D , se define como
P ( C / D ) = P ( C D ) / P( D )

En este caso M = 1 , 2 , 3 , 4 , 5 , 6

C = 1 , 2 , 3 , D = 4 , 5 , 6 , P( D ) = 3 / 6 = 1 /2 , P( C ) = 0

P(C/D)= 0/ =0

b) P ( B / D) es la probabilidad condicional de que aparezca un nmero


impar dado que apareci un nmero mayor que 3.

P( D )= 3 / 6 = 1 / 2 P ( B D ) = 1/6

P ( B / D = P( B D ) / P( D ) = 1/6 / 12 = 1/3

8 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES

En ocasiones, nos encontramos con la necesidad de determinar la


probabilidad de ocurrencia simultnea de dos o mas eventos. Para obtener
este resultado, deberemos aplicar la regla de multiplicacin

Regla de la Multiplicacin : Si A y B son eventos conteni dos en un


espa cio muestral M , y P ( A ) > 0 y P ( B ) > 0, entonces se cumple
que

P ( A y B ) = P(AB) = P(A) P(B /A) = P ( B ) P ( A


/B)

Cuando los eventos son independientes: En el caso especial en el que la


ocurrencia de A no est en absoluto relacionada con la ocurrencia de B y
viceversa , se dice que los sucesos son independientes. La independencia
se representa simblicamente por

P ( B/ A ) = P(B) y P (A /B)=P(A).

Cuando los event os son independient es la regla de la multiplicacin se


simplifica a : Si A y B son eventos contenidos en un espacio muestral M y
P(A)> 0 y P(B)> 0, entonces La probabilidad de la interseccin es el
producto de las probabilidades :

P ( A y B ) = P(AB) = P(A) P(B)

En el ejemplo del dado : son A y C independientes?


Si la probabilidad del resultado A no depende de la ocurrencia de un
segundo evento C ( o viceversa) se dice que A y C son eventos
independientes. En trminos de probabilidad se expresa que A y C son
eventos independientes si

P ( A / C ) = P ( A ) bien P ( C / A ) = P ( C )
En este caso A y C no son eventos independientes ( se denominan
dependientes), debido a que

8 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Si al lanzar un dado

M:{1,2,3,4,5,6}

A: nmero par
B: numero impar

P (A)= 3
6

P (C)= 3
6

P (A C)=
1
6

1
6 1
P (A/C): 3 3
6

3 1
P(A)=
6 2

P ( A / C ) = 1 / 3 que no es igual a P ( A ) = 1 / 2 ,
Y

P ( C / A ) = 1/3 que no es igual a P ( C ) = 1/2

Debemos notar que los sucesos mutuamente exclusivos no son nunca in


dependientes, puesto que la ocurrencia de uno niega la posibilidad de
ocurrencia del segundo. Entonces :
P( A/ B ) = P( B/ A) = 0

Muestreo con y sin reemplazo

Hay dos maneras de extraer objetos para obtener una muestra de


un conjunto dado de objetos, conocido como muestreo de una poblacin
estas son las siguientes.

8 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1. Muestreo con reemplazo significa que el objeto que se extrajo al azar


se coloca de nuevo en el conjunto dado, se mezcla completamente y se
precede a extraer al azar el siguiente objeto.

2. Muestreo sin reemplaz o significa que el objeto que se extrajo se deja


aparte y no se lo introduce nuevamente.

Ejemplo

Una caja contiene 10 cuadernos, de los cuales 3 estn con fallas.


Dos cuadernos se extraen al azar sin reemplazo. Encontrar la
probabilidad del evento tal que ninguno de los 2 cuadernos tenga fallas.
Solucin:
Consideremos los eventos

A : El primer cuaderno extrado no tiene fallas.


B: El segundo cuaderno extrado no tiene fallas.

Es claro que P ( A ) = 7/10, ya que 7 de los 10 cuadernos no son


defectuosos y estamos muestreando aleatoriamente, por lo cual cada
cuaderno tiene la misma probabilidad ( 1/10 ) de ser escogido.

Si A ocurre, entonces quedan 9 cuadernos en la caja, 3 de los cuales


tienen fallas, por lo que

P ( B / A )= = 6 / 9 = 2 / 3

Y por el teorema de la multiplicacin, la respuesta es

P ( A B ) = 7 /10 . 2 / 3 = 0,47

Ejemplo

Si se seleccionan dos cartas de un paquete de naipes bien barajado,


cul es la probabilidad de que ambas sean reinas?.

Solucin
Hay dos maneras de seleccionar las cartas: 1) Se puede seleccionar
una carta, reponerla en la baraja , barajar y extraer una segunda
carta. (Muestreo con reemplazo). 2) Se pueden seleccionar las dos
cartas consecutivamente sin reemplazar la primera en la baraja
(Muestreo sin reemplazo)

8 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1. Sea A el suceso de una reina en la primera extraccin, y B el


suceso de una reina en la segunda extraccin. Cuando el muestreo
es con reemplazo, la probabilidad de extraer una reina permanece
igual en las dos extracciones. As, puesto que

P ( A / B ) = P ( A ) y P ( B / A ) = P ( B ) , as dos extracciones son


independientes, por lo tanto

P ( A B ) = P ( A ) . P ( B ) = 1/13 . 1/13 = 1 / 69

2. Cuando se emplea el muestreo sin reemplazo la probabilidad de


obtener una reina en la segunda extraccin se reduce siempre que la
primera carta seleccionada haya sido una reina. En otras palabras ,
cuando P ( B / A ) P ( B ) o P ( A / B ) P ( A ) , los sucesos no son
independientes.. La probabilidad de extraer una reina en el segundo
intento es 3 / 51. Empleando la frmula correspondiente,
encontramos que la probabilidad de seleccionar dos reinas en
extracciones consecutivas procedentes de una baraja sin reemplazo ,
es :

P ( A B ) = P ( A ) . P ( B / A ) = 1 / 13 . 3 / 51 = 1 / 221

Se debe notar que la diferencia entre ambos muestreos es despreciable


cuando la poblacin es grande en relacin con el tamao de la muestra.

Ejemplo: Para un estudio, se obtiene una muestra de alumnos de


una escuela y se los clasifica segn lugar de residencia y el medio de
transporte que utilizan para llegar a la misma, obtenindose los
siguientes resultados:

Lugar de residencia Medio para llegar a la e sc uela Total


Caminado Bicicleta mnibus
Barrio A 100 20 50 170
Barrio B 50 20 30 100
Barrio C 30 10 5 45
Total 180 50 85 315

Suponga que se selecciona un alumno al azar de este grupo. Obtenga


las probabilidades siguientes

Que el alumno resida en el barrio A

9 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

170
P( A)=
=
315 0.5397
Que el alumno resida en el barrio A o en el B
170 100 270
+ = = 0.8571
P(AB)=P(A)+P(B)=315 315 315
Que el alumno no sea del Barrio A
315- 170 145
P( A)= = 0.4603
315 =315
Que el alumno sea del Barrio A y vaya caminando a la escuela
100
P(AC)=315=0.3175
Probabilidad que el alumno vaya en mnibus a la escuela dado que
vive en el barrio B
30
P( BI O) 315 30
= = = 0,3
P(B) 100 100
P(B/O)= 315
Probabilidad que el alumno vaya en mnibus a la escuela o viva en
el barrio B
85 100 30 155
+ - =
P(OB)=P(O)+P(B) P(OB)=315 315 315 315=0.4921

9 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

5. DISTRIBUCIN DE PROBABILIDAD

Una distribucin de probabilidad no es ms que, como su nombre lo


indica, la asignacin a cada evento posible, de un experimento, de la
probabilidad que le corresponde.

Definicin. Cualquier regla o mecanismo que sirva para determinar

P( X = x) , probabilidad de que la variable aleatoria X tome cada


uno de los valores posibles x , se denomina una Di stribucin
de Proba bilida d

Existen dos tipos de distribuciones que son importantes en las


aplicaciones prcticas, a saber: las distribuciones discretas y las
continuas. Una distribucin discreta surge al contar ( por ejemplo, obtener
un 6 y un 4 al lanzar dos dados , o bien sacar un rey al extraer una carta
de la baraja espaola). Una distribucin continua aparecer si se mide (
por ejemplo altura de los alumnos y alumnas de la clase).

Entre todas las distribuciones discretas, la Distribucin Binomial es


la ms sencilla. Entre las distribuciones continuas veremos la Distribucin
Normal.

5.1. VARIABLE ALEATORIA

Una variable aleatoria X es una funcin cuyos valores son nmeros


reales y dependen del azar .

5.2.DIST RIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA DISCRETA
La siguiente es la distribucin de la variable aleatoria
Xi = n de puntos obtenidos al arrojar un dado perfecto , o sea que todas
sus caras son igualmente posibles:

xi 1 2 3 4 5 6 Total
P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1

Obsrvese que se cumplen dos condiciones que son necesarias para


que un conjunto de pares ordenados (x,y) sea considerada una
distribucin de probabilidades:

9 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1) Para cada valor de x le corresponde un nico valor de y que es un


valor de probabilidad (no negativo y menor o igual a 1),
P( xi)
2) M =1
3) Esta distribucin recibe el nombre de uniforme, es una distribucin
de variable aleatoria discontinua y sus parmetros son los valores
mnimo (a) y mximo (b) que puede tomar x. Esto se indica como
X ~ U (a, b).

5.2.1. DISTRIBUCIN BINOMIAL.

La variable X toma los valores 0, 1, 2, 3, ... , n. (donde n es finito y bien


determinado). Se puede considerar que la Distribucin Binomial es la
repeticin de n pruebas independientes (por ejemplo tomar 4 pruebas en
un ao). La funcin de probabilidades es:

P (x) = Cnx pxqn- x ,


x
donde Cn son las combinaciones de n elementos tomadas de a x,
p= probabilidad de xito en una sola prueba,
q = 1 p = probabilidad de fracaso.

x
La combinaciones se calculan como sigue: Cn = (n.(n1). (n2)...(n
x+1))/x!

Los parmetros que definen a la distribucin Binomial son n y p

Las dos caractersticas necesarias de una distribucin de probabilidad


consisten en que cada valor de P ( X = xn , p ) tiene que ser mayor o
igual a 0 y que la suma de todos los valores de P ( X = x n , p ) debe ser
igual a 1.

Ejemplo :Cuando se recibe un envo de lpices en la escuela, se


seleccionan de manera aleatoria, 15 unidades con el propsito de
verificar el porcentaje de unidades defectuosas en el envo. Con base
en informacin pasada, la probabilidad de tener una unidad
defectuosa es de 0.05. La directora ha decidido no recibir el envo
cada vez que una muestra de 15 unidades tenga dos o ms
defectuosas. Cul es la probabilidad de que, se rechace el envo?

9 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Solucin
El modelo de distribucin apropiado para esta situacin es la distribucin
binomial, se puede suponer que las 15 unidades que se seleccionan al da,
constituyen un conjunto de ensayos independientes de manera tal que la
probabilidad de tener una unidad defectuosa es de 0.05 entre ensayos.
Definimos a la variable aleatoria X : nmero de unidades defectuosas
que se encuentran entre las 15 unidades seleccionadas. El evento se
definir como A : unidad defectuosa.

La probabilidad de A es
P(A) = 0,05
El nmero de ensayos n = 15
La probabilidad de que el envo no se reciba, es igual a la
probabilidad de que X sea igual o mayor que dos:
P(X 2) = 1 P(X < 2) = 1 [P(X = 0) + P(X = 1)]

15!
(0,05)0(1-0,05)15-0
P(0 15, 0,05) = 0!(150)!
= 1(0,95)15 = 0.4631

15!
(0,05)1(1-0,05)15-1
P(1 15, 0,05) = 1!(151)! =
= 15(0,05)(0,95)14 = 0,3658

P(X 2 15, 0,05) = 1 P(X < 2) =


=1 (0,4631 + 0,3658) = 1 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envo sea rechazado es de 0,1711.

La distribucin binomial es realmente una familia de distribuciones,


puesto que para cada valor diferente de n y p , que se denominan
parmetros de la distribucin binomial, se puede definir una distribucin
diferente. Sin tener en cuenta el valor de n , la distribucin es simtrica
cuando p = 0,5. Cuando p es mayor que 0,5, la distribucin es asimtrica
y su mximo se encuentra a la derecha del centro. Cuando p es menor que
0,5, la distribucin es asimtrica y su mximo se encuentra a la izquierda
del centro.

9 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Tablas de la Distribucin Binomial El clculo de las probabilidades


binomiales mediante la ecuacin anterior puede resultar laborioso cuando
n es grande .Afortunadamente hay tablas de probabilidades binomiales y
entonces no es necesario el uso directo de la ecuacin. Solamente
necesitamos utilizar una tabla con los valores dados de n , p y x para
obtener la probabilidad deseada

Para explicar el uso de la Tabla consideremos nuevamente el


ejemplo en el cul desebamos conocer: La probabilidad de que la
direccin rechace el envo es igual a la probabilidad de que X sea igual o
mayor que dos : para hallar esta probabilidad en la tabla ,localizamos
primero n = 15 ,luego la columna de p = 0,05 y finalmente para x ,las filas
marcadas con un 0 y un 1

P(X 2 15 , 005) = 1 P(X < 2) = 1 [P(X = 0) + P(X = 1)] = 1 [0.463 +


0.366] = 0.171

p
n x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x
13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1
2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3
4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4
5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5
6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6
7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7
8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8
9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9
10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10
11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11
12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13

14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1
2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3
4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4
5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5
6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6
7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7
8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8
9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9
10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10

9 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11


12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12
13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14

15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2
3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3
4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4
5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5
6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6
7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7
8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8
9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9
10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10
11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11
12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12
13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15

5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA CONTINUA

En estas distribuciones no es posible calcular la probabilidad en


puntos sino que hay que hacerlo en intervalos. Recurdese que en las
variables discontinuas las probabilidades de intervalos se obtenan
sumando las probabilidades que corresponden a cada punto o valor de la
variable. En variables continuas, los valores que puede tomar la variable
son infinitos por lo que es necesario hacer una suma infinita es decir una
integral. En las variables continuas, la probabilidad de un intervalo se
obtiene integrando la funcin de densidad.

Ejemplo: la distribucin rectangular X ~ R (0,2).


Esta es una distribucin rectangular (todos sus puntos tienen igual
densidad de probabilidad) que se extiende desde 0 a 2. El grfico de su
funcin de densidad es el siguiente:

9 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

en el que se puede observar que la funcin de densidad


f(x) = 1/2
La probabilidad de encontrar valores de variables entre 1 y 2 se encuentra
integrando la funcin de densidad entre esos lmites.
La integral entre esos lmites corresponde al rea bajo de la curva entre los
mismos.

5.3.1.LA DISTRIBUCIN NORMAL

Si una variable es continua, vara desde - hasta + y su


funcin de densidad es:
2
1 x - m
1 -
f(x) = e 2 s

s 2p ,
se dice que x tiene distribucin normal con parmetros m y s (media
aritmtica y desviacin estndar). Esto se simboliza como sigue :
X ~ N ( m , s )

9 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Su grfica es la siguiente:
0,40

0,30
f(x)

0,20

0,10

0,00
4 6 8 10 12 14
x

La distribucin normal presenta las siguientes caractersticas:

1) Presenta un mximo en x = m , por lo tanto Mo = m

2) Es simtrica y su eje de simetra es f(m ) , por lo que se deduce que Md =


m = Mo.

3) Tiene dos puntos de inflexin ubicados en x = m s

4) Toda transformacin lineal de x da otra distribucin normal.

5) Algunos sectores usados de la funcin son:

x = m s corresponde aproximadamente al 68 % central


x = m 2 s corresponde aproximadamente al 95 % central
x = m 3 s corresponde aproximadamente al 99 % central

6) f(x) se acerca asintticamente al eje x o sea que f(x) > 0.

f(x)dx = 1
1) Por ser funcin de densidad, el rea bajo de la curva es -

Para calcular la probabilidad de un intervalo en la distribucin normal,


por tratarse de una variable continua, debe hacerse mediante la

9 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

integracin de la funcin de densidad, lo cual equivale a calcular el rea


bajo de la curva. Considrese por ejemplo que la altura de los alumnos de
la escuela tiene distribucin normal con media m = 1,6 m y desviacin
estndar s = 0,1 m. La probabilidad de que al seleccionar un alumno al
azar, posea altura comprendida entre 1,5 y 1,65 (P(1,5<x<1,65)) se obtiene
integrando la funcin de densidad f(x), (en la cual se debe reemplazar los
valores correspondientes de m y s por 1,6 y 0,1 respectivamente) entre los
lmites 1,5 y 1,65.

La di stribuci n normal est ndar


Usando la propiedad que dice que la transformacin lineal
x m
z =
s conduce a una distribucin tambin normal, cuyos
parmetros son m z = Oy sz = 1, se obtiene una nueva distribucin que se
conoce con el nombre de distribucin normal est ndar o normal 0,1 y
se la describe como

Z ~ N(0,1) cuya representacin grfica es la siguiente:

5 3 0 3 5
z

9 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Ta bla s de l a di stribuci n normal

El clculo de probabilidades en la normal involucra el clculo de


integrales que son muy engorrosas de resolver manualmente. Por ello, las
integrales estn tabuladas para una distribucin normal que es la
estndar.
Vamos a aprender el uso de tablas de una cola

Tabla de 1 cola

En ella, los valores de probabilidad se encuentran en el cuerpo de la


tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En esta
tabla es importante considerar el signo de z.

Como su nombre lo indica, para el valor de z considerado, da el valor del


rea bajo de la curva desde menos infinito hasta z. Por ejemplo si z = 2.1
la tabla da P(z < 2.1) = 0.0179.

Ejemplo :
Una poblacin de pesos de alumnos en gr tiene distribucin normal con
media y desviacin estndar ( m y s ) de 50 y 5 Kg. respectivamente. Cul
es la probabilidad de

que los alumnos pesen menos de 55 kg


En smbolos, la probabilidad buscada es P(x 55)

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estndar. Esto se consigue mediante el
siguiente cambio de variable:

x m
z =
s en este caso x = 55 , m = 50 ys = 5 por lo que

z = (55 50)/5 = 1.

P(x 55) = P(z 1) = 0,8413

Cuando se busca una valor por menor, la probabilidad se


obtiene directamente en la tabla.

que los alumnos pesen ms de 57,75 kg


En smbolos, la probabilidad buscada es P(x 57,75)

1 0 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estndar. Esto se consigue mediante el
siguiente cambio de variable:

x m
z =
s en este caso x = 57.75 , m = 50 ys = 5 por lo que

z = (57,75 50)/5 = 7,7/5 = 1,54.

P(x 57,75)= P(z 1,54) = 1 P(z 1,54)=10,9382=0,0618

z .00 .01 .02 .03 .04


1.0 0.841 0.843 0.846 0.8485 0.850
3 8 1 8
1.1 0.864 0.866 0.868 0.8708 0.872
3 5 6 9
1.2 0.884 0.886 0.888 0.8907 0.892
9 9 8 5
1.3 0.903 0.904 0.906 0.9082 0.909
2 9 6 9
1.4 0.919 0.920 0.922 0.9236 0.925
2 7 2 1
1.5 0.933 0.934 0.935 0.9370 0.938
2 5 7 2
1.6 0.945 0.946 0.947 0.9484 0.949
2 3 4 5
1.7 0.955 0.956 0.957 0.9582 0.959
4 4 3 1
1.8 0.964 0.964 0.965 0.9664 0.967
1 9 6 1
1.9 0.971 0.971 0.972 0.9732 0.973
3 9 6 8
2.0 0.977 0.977 0.978 0.9788 0.979
2 8 3 3
2.1 0.982 0.982 0.983 0.9834 0.983
1 6 0 8
2.2 0.986 0.986 0.986 0.9871 0.987
1 4 8 5

1 0 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

que los alumnos pesen entre de 52,75 kg y 60 kg


En smbolos, la probabilidad buscada es P(52,75 x 60)
Para solucionar esto es necesario pasar de la normal que nos
interesa a la normal estndar. Esto se consigue mediante el

xm
z=
siguiente cambio de variable s , se buscan dos valores de
z, primero para el valor mayor de x, luego para el menor

6050 10 52,7550 2,75


z2 = = = 2 z1= = = 0,55
5 5 5 5

Se buscan los valores en la tabla para z=2 P(z 2)=0,9861


Se buscan los valores en la tabla para z=0,55 P(z 0,55)=0,7088

Luego se restan los valores


P(52,75 x 60)= P(0,55 z 2)=0,98610,7088=0,2773

Los valores de z a ms usados y que determinan intervalos


centrales (1a) son:
z =1,64
0,10 para el 90 % central
z0,05 =1,96
para el 95% central
z =2,58
0,01 para el 99% central

Ejemplo

En la poblacin de pesos X ~ N(50 5) cul es el intervalo que


corresponde al 95 % central de la poblacin?

En la distribucin de z, el 95 % central de la poblacin corresponde al


intervalo que va desde 1.96 a +1.96, o sea 1.96. Es muy simple, si se
desea que en el centro est el 95 % o, en tanto por uno, 0.95, entonces en
z =1,96
las colas debe quedar el 0.05. el valor que corresponde 0,05 .

Ya se determin el intervalo en z, cmo se pasa a la normal con media 50


y desviacin estndar 5? Se debe hacer el cambio inverso de variable:

x m
z = entonces x = m z s
s .

1 0 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Para indicar que el intervalo corresponde a un porcentaje central


determinado se acostumbra a llamar a a lo que queda en las colas.

x = m z a s
Volviendo entonces al ejemplo, por ser z a = 1.96, el intervalo que
corresponde al 95 % central de la poblacin de pesos de los alumnos es:

x = 50 1.96 5 = 50 9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a 59,80 kg.

1 0 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

GUA DE EJERCITACIN

Actividad 1

El Director de una escuela debe establecer turnos para que el


establecimiento siempre tenga dos administrativos durante el mes de
enero. Para ello de los cinco empleados que dispone (A, B, C, D, E) debe
formar grupos de dos seleccionados al azar, sin reemplazo.
Describa el espacio muestral de este experimento aleatorio.

Actividad 2

a) Cmo sera el espacio muestral en la actividad anterior si el muestreo


fuera con reemplazo?
b) Cul es la forma correcta de efectuar este experimento, para que el
Director del establecimiento siempre tenga dos administrativos en el
mes de enero?

Actividad 3

D dos ejemplos de sucesos seguros y dos de sucesos imposibles.

Actividad 4
En el experimento aleatorio de la Actividad N1,
a) Cuntos grupos de dos personas se formaron?
b) En cuntos est A?
c) En cuntos est B?
d) En cuntos estn A y B?
e) En cuntos no ha sido seleccionado C?
f) En cuntos han sido seleccionados A B C?
g) Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para estudio a alumnos de EGB, realiza
la seleccin de los mismos para dos Becas de distinto origen de fondos los
resultados posibles son Seleccionado (S) o No Seleccionado (NS). El
experimento consiste en tomar al azar un alumno y observar el resultado
en las dos selecciones.
a) Describa el espacio muestral de este experimento (suponga que todos
los alumnos han estado inscriptos en las dos Becas)
b) Cul es la probabilidad de que el alumno haya sido seleccionado en
las dos Becas?

1 0 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

c) Cul es la probabilidad que el alumno no haya sido seleccionado


ninguna de las dos Becas?
d) Cul es la probabilidad que el alumno haya sido seleccionado en una
Beca por lo menos?
e) Cul es la probabilidad que el alumno haya sido seleccionado a lo
sumo en una Beca?

Actividad 6

Cada uno de los items siguientes representan las probabilidades de cada


uno de tres eventos simples.
Marque el item correcto, justificando al mismo tiempo su respuesta.

a) P(E1) = 0.8 P(E2) = 0.3 P(E3) = 0.1

b) P(E1) = 0.3 P(E2) = 0.2 P(E3) = 0.5

c) P(E1) = 0.6 P(E2) = 0.2 P(E3) = 0.2

d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6

Actividad 7

En una encuesta realizada a 90 alumnos que egresan del Polimodal en un


establecimiento educativo, se les preguntaba sobre el nivel de instruccin
alcanzado por los padres y si seguiran estudiando o no una carrera
superior. El resultado de la encuesta figura en la tabla siguiente:

Nivel de educacin Seguirn Total


de los padres estudiando?
Si No
Superior 20 10 30
Secundario 30 10 40
Primario 15 5 20
Total 65 25 90

Si se selecciona un alumno al azar, cul es la probabilidad de:


a) Qu el alumno tenga padres con educacin superior?
b) Qu el alumno siga estudiando?
c) Qu el alumno siga estudiando y tenga padres con educacin
primaria?
d) Qu el alumno tenga padres con educacin superior o secundaria?
e) Qu el alumno tenga padres que no posean educacin superior?

1 0 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

f) Qu el alumno siga estudiando dado que posee padres con educacin


primaria?
g) Qu el alumno no siga estudiando dado que posee padres con
educacin secundaria?
h) El evento que siga estudiando es independiente del nivel de educacin
Superior alcanzado por los padres?

Actividad 8

En un examen de 10 bolillas un alumno no sabe dos de ellas. Cul es la


probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9

Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o Falso(F).
a) Cul es la probabilidad de que acierte en las dos?
b) Cul es la probabilidad de que acierte por lo menos en una?
c) Cul es la probabilidad de que a las dos las conteste incorrectamente?

Actividad 10

En una escuela hay tres Profesores de Educacin Fsica. La probabilidad


de que no asistan a clase cada uno de ellos es de 0.05. Cul es la
probabilidad de que un da cualquiera falten los tres juntos?

Actividad 11

En un anlisis realizado por el Director de un establecimiento educativo,


se determin que de los alumnos ingresantes en EGB en una cohorte, solo
el 70% (en promedio) complet el polimodal. De ellos solo el 15% lo hizo en
el mismo establecimiento. Cul es la probabilidad de que un nuevo
alumno ingresante en EGB termine el Polimodal en la misma escuela?

Actividad 12

La probabilidad de que a un alumno le interese Matemticas en un curso


es de 0.1. Si se toman 3 alumnos de dicho curso al azar:
Cul es la probabilidad de que:
a) No le agrade a ninguno Matemticas?
b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como mximo a 2 alumnos?

1 0 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Actividad 13

La probabilidad de que un alumno apruebe una Prueba Integradora de


conocimientos de Matemtica en el ltimo ao del Polimodal es de 0.25. Si
se seleccionan al azar 10 alumnos de un curso:
a) Cul es la probabilidad de que 5 alumnos aprueben?
b) Cul es la probabilidad de que no apruebe ningn alumno?
c) Cul es la probabilidad de que todos aprueben?
d) Cul es la probabilidad de que aprueben como mnimo 5 alumnos?
e) Cul es la probabilidad de que como mximo aprueben 5 alumnos?

Actividad 14

La probabilidad de que la ltima semana de clase los alumnos que egresan


cometan un acto de indisciplina serio es de 0.004. De 300 alumnos que
terminan este ao:
Cul es la probabilidad de que:
a) 8 alumnos terminen sus estudios con una sancin por este acto de
indisciplina?
b) De qu ms de 5 alumnos terminen sus estudios con una sancin por
este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sancin por este
acto de indisciplina?
d) De qu ningn alumno cometa un acto de indisciplina serio?

Actividad 15

Los pesos de los alumnos de un curso de EGB se distribuyen normalmente


con m = 48 kg y s = 2 kg.
a) Obtenga los pesos estndar correspondientes a:
43 kg 44.5 kg 46 kg 49.5 kg 50 kg
b) Cul es la probabilidad de que un alumno tenga un peso menor a 44.5
kg?
c) Cul es la probabilidad de que un alumno tenga un peso mayor a 46
kg?
d) Cul es la probabilidad de que un alumno tenga un peso entre 44.5
kg y 49.5 kg?
e) Cul es la probabilidad de que un alumno tenga un peso de por lo
menos 46 kg?
f) Obtenga el Rango Percentil correspondiente a los pesos del item a).
Interprete que significa cada uno de ellos.
g) Si el nmero de alumnos a los que se ha medido el peso en ese curso
fuera de 200, cuntos alumnos tendrn un peso inferior a la media?.
Cuntos alumnos tendrn un peso superior a 52 kg?

1 0 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

h) Qu porcentaje de alumnos tienen un peso comprendido entre 45 kg y


47 kg?

Actividad 16

Los puntajes promedio con su correspondiente desviacin estndar,


obtenidos por los alumnos del ltimo curso de Polimodal en una escuela
en los exmenes finales de una asignatura son los siguientes:

CURSO m s
A 5.9 1.5
B 6.75 1

Se supone que los puntajes se distribuyen normalmente:


a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B
igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en
los dos cursos?. Justifique su respuesta.
b) Qu porcentaje de alumnos obtuvieron ms de 5 puntos en cada
curso? Analice en base a esto el rendimiento de cada curso.
c) Qu porcentaje de alumnos obtuvieron ms de 7 puntos en cada
curso?
d) Qu porcentaje de alumnos obtuvieron menos de 4 puntos en cada
curso?
e) En base a estos resultados qu conclusin puede enunciar?

1 0 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

UNI DA DV

INFERENCIA ESTADSTICA

1. INTRODUCCIN

En captulos anteriores se vi:

Est adst ica Descriptiva : Su objetivo es la recoleccin y reduccin de


datos . Se estudian tcnicas para presentar los datos de una forma mas
comprensible y as poder visualizar propiedades de los mismos.

Clculo de Probabilidades :La razn de su estudio es que la Estadstica


incluye la toma de decisiones en presencia de incertidumbre. Estas
decisiones tomadas se basan en probabilidades. Aqu conocemos ( o
suponemos conocido) por completo el modelo probabilstico que usamos,
es decir, la poblacin a estudiar la podemos representar por una variable
aleatoria X

Recordemos que una poblacin est constituida por todos los


elementos que poseen unos caracteres por cuyo estudio estamos
interesados. Una muestra, en cambio, es una parte de los elementos de la
poblacin pero esta parte ha de ser representativa del total.

Cuando el estadstico puede observar todos los elementos de la


poblacin ( observacin exhaustiva) , entonces su tarea se reduce a
describir las caractersticas y regularidades de la poblacin. Pero si la
observacin no puede ser exhaustiva, entonces aquellas caractersticas
hay que estudiarlas a travs de una muestra representativa.

Hay que distinguir entre poblaciones finitas y poblaciones infinitas.


Se dice que una poblacin es finita si tiene un nmero limitado de
sucesos o unidades elementales. Ejemplo de poblacin finita son, en un
ao dado los salarios recibidos por todos los docentes de un Colegio, los
ttulos recibidos por todos los estudiantes de un pas. Mientras el nmero
total de observaciones posibles sea limitado, se trata de una poblacin
finita.

1 0 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

En cambio, una poblacin infinita es la que, consiste en un


nmero infinitamente grande de observaciones. Por lo menos es teora ,
no hay lmite alguno al nmero de unidades que puede abarcar. Por
ejemplo, los resultados obtenidos al jugar dos dados constituyen una
poblacin infinita , lo mismo que los pesos al nacer de todos los seres
humanos.. Una poblacin infinita puede ser siempre generada a partir
de un conjunto finito de valores o unidades si el muestreo se hace con
reemplazo.

2. INFERENCIA ESTADSTICA

Definicin: La Inferencia Est adstica es el


procedimiento por medio del cual se llega a
inferencias acerca de una poblacin mediante
los resultados que se obtienen a part ir de una
muestra extrada de esa poblacin.

El objetivo principal de la Est adst ica Inferencial es la esti ma cin


, esto es que mediante el estudio de una muestra aleatoria seleccionada de
una poblacin se quiere generalizar las conclusiones al total de la misma.

Defi nicin de muestra alea tori a

Todo conjunto de n unidades de observacin elementales tomadas


de una poblacin dada, se puede considerar como una muestra de tamao
n. Pero el tipo de muestra que aqu interesa es el de muestra aleatoria
Una muestra aleatoria se puede tomar con o sin reemplazo. Si la muestra
se toma con reemplazo, de una poblacin , finita o infinita , la unidad
tomada se vuelve a dejar en la poblacin y el nmero de unidades
disponibles para seguir la operacin no se afecta. Esto tambien es cierto
cuando la muestra se toma de una poblacin infinita sin reemplazo, es
decir, cuando la unidad escogida no se vuelve a la poblacin. Cuando se
toma un elemento, sin reemplazar, de una poblacin finita, el nmero de
unidades que quedan tras cada unidad que se saca se reduce en una
unidad, y en consecuencia la probabilidad de sacar cualquier unidad
restante en operaciones sucesivas se aumenta.

Es necesario formular nuestro concepto en forma precisa. Por


definicin, una muestra debe tener ciertas propiedades como sigue:

Se supone que las muestras dan informacin acerca de la poblacin


a que corresponde, ya que por lo general es demasiado costoso, requiere

1 1 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

demasiado tiempo, o es imposible observar o medir todos los objetos


pertenecientes a la poblacin.. La muestra debe ser una seleccin
aleat oria . Es decir, cada elemento de la poblacin debe tener una
probabilidad conocida de ser extrado, esto es, de ser tomado en la
muestra el caso mas sencillo y ms comn es en donde la probabilidad es
la misma para todos los elementos de la poblacin , y solo si se satisface
este requisito ( al menos aproximadamente) , los mtodos estadsticos
darn resultados razonables y tiles.

Adems, es necesario que las n ejecuciones del experimento


aleatorio con el que obtenemos n valores de la muestra sean
independientes, esto es, el resultado de una ejecucin no debe influir en
las otras ejecuciones. Esto equivales a decir que la probabilidad de que
cualquier miembro de la poblacin aparezca en una muestra, no depende
de la aparicin o no aparicin de los otros miembros de la poblacin en la
muestra.

Hay que tener presente que el conocimiento de las caractersticas de


una poblacin, salvo algunas excepciones, no puede conseguirse con toda
exactitud mediante una muestra. Si se tiene una poblacin humana y
suponemos que no existen errores de observacin, la nica manera de
obtener exactamente la estatura media, el porcentaje de analfabetos, , etc.
, en dicha poblacin es observando todos los elementos de ella. Pero si esta
observacin exhaustiva no es posible y se utiliza como medio supletorio
una muestra, entonces lo nico que puede obtenerse, salvo en algunos
casos particulares, son estimaciones de aquellas caractersticas.

El problema de la Inf erencia Esta dstica se acostumbra a enfocar


de dos maneras distintas. Partiendo del hecho cierto de que una muestra,
en ge neral, no da una informacin exacta de las caractersticas de la
poblacin que deseamos estudiar, puede procederse asi:

1 Utilizar la muestra para estimar dichas


caractersticas. Este enfoque origina la Teora de la
Esti ma cin , mediante la cual se da solucin a los
problemas especficos que se plantean.

2 Emitir hiptesis sobre aquellas caractersticas


tomando como base la experiencia, otras informaciones
o incluso el presentimiento o la corazonada. Una
hiptesis as formulada tiene, evidentemente, poco valor
cientfico. Este valor se adquiere tomando una muestra
de la poblacin y utilizndola para verificar o contrastar

1 1 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

la hiptesis., Este enfoque da lugar a la Teor a de la


Verifi ca ci n o Contra sta cin de hiptesis.

Para distinguir claramente entre ambas , considrense los


siguientes ejemplos . Un candidato para un puesto pblico desea estimar
la proporcin real de votantes que lo apoyan mediante la obtencin de las
opiniones de una muestra aleatoria de 100 votantes. La fraccin de ellos
que lo apoye puede utilizarse como una estimacin de la proporcin real de
la poblacin total de votantes. Este problema pertenece al rea de
estimacin.

Ahora considrese el caso en el cual una Profesora se interesa en


determinar si el sistema nuevo de evaluacin( A ) implementado por el
Colegio es mejor que el sistema anterior de evaluacin ( B ). Esta Profesora
podra suponer que el sistema A es mejor al sistema B y , despus de
realizar las pruebas apropiadas , aceptar o rechazar esta hiptesis .En este
ejemplo se intenta tomar una decisin correcta respecto a la hiptesis
preestablecida.( La prueba de hiptesis no se ver en el desarrollo de esta
Asignatura ).

3. DISEOS DE MUESTREO

La operacin de tomar una muestra de una poblacin se denomina


muestreo y los mtodos de muestreo que se utilicen deben garantizar
aquella representatividad para que pueda hablarse correctamente de una
muestra estadstica.

Si se desea conocer, por ejemplo, el consumo medio de protenas por


alumno y dia en una ciudad y tomamos para ello un grupo de familias
integrado por la de mas alto nivel de vida, se concluir que ese grupo no es
representativo del total de familias de la ciudad.. Por tanto, el consumo
medio que se obtenga del citado grupo no es una buena estimacin porque
entraa un error de un tipo distinto del que cabe esperar en una muestra
representativa.

Conviene distinguir entre dos clases de error. De una parte existen


los errores muestrales, que son aquellos que estn latentes en toda
muestra representativa, pues aun sindolo no proporciona , salvo raras
excepciones, una medida exacta de las caractersticas de la poblacin por
ello hay que contar siempre con los errores muestrales o errores de
muestreo.

1 1 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Y por otra parte estn los sesg os, bajo cuya denominacin se
incluyen algunos errores especficos de las muestras como los debidos a su
falta de representatividad, y otros que son comunes a toda investigacin
estadstica, tanto si es exhaustiva como si no lo es. A este ltimo grupo
pertenecen los errores de observa ci n , los originados por definiciones
defectuoasas de los elementos de la poblacin, de los caracteres a
investigar , los debidos a respuestas o medidas mal efectuadas , a
frmulas inadecuadas, a clculos equivocados, etc.

Ejemplo :Supongamos que deseamos tomar una muestra de 100


estudiantes de un Colegio para conocer la opinin del alumnado respecto a
la adecuacin de las evaluaciones. Un posible mtodo es situarse a las
nueve de la maana en una entrada del Colegio y preguntar a los 100
primeros alumnos que aparezcan. Con este procedimiento los alumnos que
solo tienen clase por la tarde no estarn representaos en la muestra.
Adems, estarn muy poco o nada representados los estudiantes que no
tengan clase a primera hora o los que tenindola no acudan
habitualmente.

Cuando algunos miembros de la poblacin tienen una probabilidad


ms alta que los otros de estar representados en una muestra se dice que
existe un sesgo de seleccin y la muestra puede no ser representativa de
la poblacin. Por ejemplo, si existen diferencias marcadas de opinin entre
los alumnos nuevos y los veteranos, y la muestra slo incluye a los
veteranos, tendr un sesgo de seleccin.Una forma de evitar este sesgo es
tomar la muestra mediante un procedimiento de seleccin objetivo que
garantice a todos los elementos de la poblacin la misma oportunidad de
aparecer en la muestra.

El mtodo anterior presenta adems el riesgo de un sesgo adicional:


el sesgo por no respuesta. Si los estudiantes que no responden son los
ms disconformes con las evaluaciones, la muestra contendr una
proporcin menor de estudiantes de estas categoras y, de nuevo, puede
no ser representativa de la poblacin que tratamos de investigar. El sesgo
de no respuesta no puede evitarse con certeza pero deben tomarse
precauciones para prevenir que ocurra.

3.1. MUESTREO AL AZAR SIMPLE

El muestreo aleatorio simple est fundamentado en el puro azar. Se


puede decir que es un muestreo en el que si se saca al azar una muestra
de n unidades, toda posible muestra de n unidades tiene la misma
probabilidad de ser seleccionada, Una muestra obtenida por este
procedimiento se dice muestra aleatoria si mpl e .

1 1 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Uno de los mtodos comnmente utilizados para lograr que la


muestra sea aleatoria es numerar todos los elementos de una poblacin,
escribir los nmeros en tarjetas o fichas o bolillas o cualesquiera cosas
fsicamente homogneas poner luego en una bolsa estos objetos
numerados y mezclarlos completamente. Se define el tamao n de la
muestra y se sacan los objetos al azar uno por uno, hasta que se obtenga
el nmero deseado de partidas para anotar. El procedimiento se puede
simplificar utilizando una tabla de nmeros aleatorios.

3.2. MUESTREO ALEATORIO SISTEMTICO

Cuando los elementos de la poblacin estn ordenados en listas, una


alternativa ms fcil de ejecutar que el muestreo aleatorio simple es el
muestreo sistemt ico. Muy a menudo, si se desea un muestreo aleatorio
simple se sigue un procedimiento sistemtico en vez de un mtodo al azar.
Segn el procedimiento sistemtico, se obtiene una muestra tomando cada
ksima unidad de la poblacin tras numerar las unidades de la poblacin
o haberlas ordenado de alguna manera. La letra k representa un nmero
entero, que es aproximadamente la razn de muestreo entre el tamao de
la poblacin y el tamao de la muestra. As, si la poblacin consiste en
10.000 unidades de muestreo y se desea una muestra de 500 unidades,
entonces

K = 10.000 / 500 = 20

Y la muestra se obtiene tomando una unidad cada veinte de la


poblacin.

Para que toda unidad de la poblacin tenga igual probabilidad de


salir, el procedimiento debe empezar al azar. Con una razn de muestreo
de 20, se puede utilizar el procedimiento de la bolsa o del bolillero
poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el bolillero o
bolsa. Tras revolver y mezclar completamente, se saca una bolilla al azar.
Si se saca la bolilla 11, se empieza con este nmero y se incluye enla
muestra cada vigsima bolilla a partir de esta, es decir, la treinta y una, la
cincuenta y una , y as sucesivamente.

1 1 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3.3. MUESTREO POR ESTRATOS

El muestreo aleatorio simple debe utilizarse cundo los elementos de


la poblacin son homogneos respecto a la caracterstica a estudiar, es
decir, a priori la prediccin que haramos del valor de la variable sera el
mismo para todos los elementos. Un muestreo que sera mas efectivo que
este, es el muestreo aleatorio por estratos, procedimiento que exige tener
conocimiento previo de la poblacin. El proceso de estratificacin
contempla dividir la poblacin en grupos o clases llamados estratos .
Dentro de cada uno de tales estratos, estn los elementos situados de
manera ms homognea con respecto a las caractersticas que estn en
estudio. Para cada estrato se toma una submuestra mediante el
procedimiento aleatorio simple, y la muestra global se obtiene combinando
las submuestras de todos los estratos.

El muestreo por estratos es el ms efectivo cuando se trata de


poblaciones heterogneas tales como datos de desempleo ( que varan de
ocupacin a ocupacin ), ventas al por menor ( que difieren entre las
distintas regiones geogrficas) , y las actitudes de los consumidores
respecto de malos nuevos modelos de automviles ( en las que influyen
factores teles como el sexo, la edad, y la categora de ingreso). Al hacerse la
estratificacin, las clases se establecen de modo que las unidades de
muestreo tienden a ser uniformes dentro de cada clase, y las clases
tienden a ser diferentes entre s. As se puede controlar la proporcin de
cada estrato en la muestra global y no dejarla al azar y queda asegurado
el carcter representativo de la muestra.

El muestreo por estrato es por consiguiente una combinacin de


submuestras de los estratos, que son muestras aleatorias simples o
sistemticas. En cuanto tales, todo elemento disponible de cada estrato
tiene igual probabilidad de ser seleccionado, y esta ser la situacin aun
en el caso en que la muestra no sea proporcionada, en el cual las
probabilidades de ser seleccionado cada elemento individual de la
poblacin no son iguales.

3.4.MUESTREO POR CONGLOMERADO

Diametralmente opuesto al muestreo por estratos est el muestreo


por conglomerados, que consiste en seleccionar primero al azar grupos,
llamados conglomerados , de elementos individuales de la poblacin, y en
tomar luego todos los elementos o una submuestra de ellos dentro de cada
conglomerado para constituir as la muestra global. Para lograr los mejores

1 1 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

resultados ern el plan del muestreo por conglomerado, se hacen tan


pequeas como sea posible las diferencias entre conglomerados, en tanto
que las diferencias entre los elementos individuales dentro de cada
conglomerado se hacen tan grandes como sea posible.

Por ejemplo, si queremos extraer una muestra aleatoria simple de los


estudiantes universitarios de un pas sera necesario disponer de una lista
de todos ellos y de sus direcciones y telfonos. Esta informacin puede no
estar disponible o ser muy cara de conseguir. Sin embargo, en este caso,
los estudiantes aparecen clasificados en universidades, facultades y
cursos. Podemos seleccionar en una primera etapa algunas universidades,
despus algunas facultades al azar de cada universidad, dentro de las
facultades algunas clases y, dentro de las clases, estudiantes mediante
muestreo aleatorio.

Para la primera etapa solo necesitamos una lista de universidades.


Para las universidades seleccionadas es necesario luego conocer las
facultades que incluyen. En las facultades elegidas necesitamos una lista
de las clases, y de las clases que se tomen, una relacin de los
estudiantes. Esta informacin estar disponible por lo que este tipo de
muestreo ser factible.

Llamaremos conglomerados a estas unidades amplias donde se


clasifican los elementos de la poblacin. En cada etapa de muestreo , en
lugar de seleccionar elementos al azar , seleccionamos conglomerados. Los
conglomerados se refieren a formas de agrupacin fsica de las unidades
en el espacio o en el tiempo.

Idealmente los conglomerados tienen que ser lo ms parecido posible


a muestras aleatorias de la poblacin , de manera que cada conglomerado
sea tan heterogneo como la poblacin a investigar.

El muestreo por conglomerado tiene la ventaja de simplificar


enormemente la recogida de la informacin muestral. El inconveniente
obvio es que si los conglomerados son heterogneos entre s, como slo se
analizan algunos de ellos, la muestra final puede no ser representativa de
la poblacin.

1 1 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

3.5. MUESTREO POR CUOTAS

A veces la estratificacin no es posible, o es muy cara, y se recurre


en su lugar al muestreo por cuot as. Por ejemplo, se desea tomar una
muestra de una poblacin para estudiar la proporcin de personas que
estn de acuerdo con el uso de remedios especiales. Si suponemos que la
edad y el sexo pueden influir en la opinin, deberamos tomar una
muestra donde estas caractersticas sean las mismas que en la poblacin
base, lo que implica una muestra estratificada. Sin embargo, esto requiere
una lista de las personas de la poblacin que incluya su sexo y edad, lo
que puede no estar disponible. Sin embargo, si conocemos la proporcin
de cada sexo y la distribucin de la edad en la poblacin, una solucin
frecuente es exigir que estas caractersticas aparezcan en la muestra en la
misma proporcin que en la poblacin. Esto conduce a fijar cuotas de
hombres y mujeres por grupos de edad. El entrevistador debe conseguir
los elementos de la muestra respetando esta restriccin de cuotas.

4. ESTIMACIN DE PARMETROS

Algunas cantidades que aparecen en las funciones de distribucin,


como p de la distribucin binomial , m y s en la distrIbucin normal, se
llaman parmetros. Generalmente estamos interesados en conocer los
pa r metros de la poblacin, es decir , aquellas caractersticas que sirven
para determinarla. Ahora veremos como obtener estimaciones de
parmetros a partir de una muestra dada.

Dada una poblacin, se trata de estimar, esto es, de valorar, alguno


o algunos parmetros caractersticos de la misma, como, por ejemplo, a la
media aritmtica. Recurriremos a la inferencia estadstica, y mediante el
anlisis de una muestra obtendremos una estimacin de los valores
correspondientes a la poblacin completa.

Esta estimacin puede ser por punto o por i nterval o, segn se


trate de determinar un valor nico del parmetro en cuestin o bien un
intervalo dentro del cual quede comprendido, con una cierta probabilidad,
el valor correspondiente al parmetro de toda la poblacin .El intervalo en
cuestin recibe el nombre de intervalo de confianza y la probabilidad, el de
nivel de significacin.

1 1 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.1. ESTIMACIN PUNTUAL

La Inferencia Estadstica est casi siempre concentrada en obtener


algn tipo de conclusin acerca de uno o ms parmetros (caractersticas
poblacionales). Para hacerlo, se requiere que se obtenga datos muestrales
de las poblaciones en estudio. Entonces, las conclusiones pueden estar
basadas en los valores calculados de varias cantidades muestrales.

Una esti ma cin puntual estima ci n por punto es un solo valor


numrico utilizado para estimar el parmetro correspondiente de la
poblacin. La estimacin puntual se obtiene al seleccionar una estadstica
apropiada y calcular su valor a partir de datos de la muestra dada.

Sirve como una aproximacin del valor exacto desconocido del


parmetro

El est adst ico que se utiliza para obtener una estimacin puntual
recibe el nombre de esti ma dor puntual del par metro .

Es conveniente notar que se ha dado el nombre de estimacin a un


solo valor calculado. La regla para calcular este valor o estimacin se
conoce como estima dor. Los estimadores generalmente se presentan
como frmulas. Por ejemplo la media x de una muestra es un estimador
de la media m de la poblacin correspondiente. El valor numrico
individual que resulta de la evaluacin de la frmula de la media se conoce
como estimacin del parmetro m. De esta manera se tiene la estimacin
m @ x para m

De forma similar , la variancia muestral, S2 , se puede utilizar para


inferir algo acerca de s 2 .

Ejemplo:
Una muestra aleatoria de 3 bateras para calculadora podra
presentar duraciones observadas en horas de x1 = 5.0 , x2 = 6.4 y x3 =
5.9 . El valor calculado de la duracin media muestral es x = 5.77 , y es
razonable considerar 5.77 como el valor adecuado de m .

El enunciado : la estimacin puntual de m es 5.77 se puede


escribir en forma abreviada m = 5.77.

1 1 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.2. ESTIMACIN POR INTERVALO EN EL MUESTREO AL ZAR


SIMPLE

Supngase que un grupo de investigadores quiere estimar la media


de una poblacin que sigue una distribucin normal y que, para ello,
extraen una muestra aleatoria de tamao n de la poblacin y calculan el
valor de x , el cual utilizan como una estimacin puntual de m . Aunque
este estimador de m posee todas las cualidades de un buen estimador, se
sabe que, debido a los caprichos del muestreo, no se puede esperar que x
sea igual a m.

Un estimador puntual por ser un solo nmero, no proporciona por s


mismo informacin alguna sobre la precisin y confiabilidad de la
estimacin. El estimador puntual nada dice sobre lo cercano que est de
m x .

Si se quiere llegar a asignar determinadas garantas o confianza a


los resultados de un proceso inferencial de estimacin, cabe la posibilidad
de ampliar la ptica de la Esti ma cin Puntual analizada en el tema
anterior, pasando a la estimacin mediante Intervalos de Confi a nza .

En trminos estadsticos las garantas asignables consisten en


afirmaciones de tipo probabilstico.

La estimacin de una magnitud desconocida mediante Intervalo de


Confi a nza consiste en derivar unos lmites aleatorios que contendrn al
parmetro desconocido con una probabilidad fijada de antemano.

Los extremos de un intervalo de conf ia nza son aleatorios, por lo


que podrn o no contener al verdadero parmetro y ser posible evaluar la
probabilidad de que as ocurra. A la probabilidad de que un Intervalo de
Confianza contenga al parmetro poblacional objeto de anlisis se le
denomina Nivel de Confi a nza y la denotaremos por g ( 1 a )

Por ejemplo, si escogemos g = 1 a = 95 % , implica que 95 % de


todas las muestras dara lugar a un intervalo que incluye m o cualquier
otro parmetro que se est estimando , y slo 5 % de las muestras
producir un intervalo errneo. Cunto mayor sea el nivel de confianza
podremos creer que el valor del parmetro que se estima est dentro del
intervalo.

Al estimar un parmetro q , el problema correspondiente debera ser


la determinacin de dos cantidades numricas que dependen de los

1 1 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

valores de la muestra, y en cuyo intervalo se incluya el valor desconocido


del parmetro con certeza. Sin embargo, sabemos que a partir de una
muestra no podemos obtener conclusiones acerca de la poblacin
correspondiente que sean 100 % verdaderas. As, tenemos que ser ms
modestos y modificar nuestro problema, de la siguiente manera.

Escogemos una probabilidad g cercana a 1 , ( por ejemplo, g = 95 %


, 99 % o alguna semejante) . Luego, determinamos dos cantidades q 1 y q2
tales que la probabilidad de que incluyan el valor exacto desconocido del
parmetro q sea igual a g .

Los n valores de la muestra se pueden considerar como valores


observados de n variables aleatorias X1 , X2 , ......., Xn . Entonces q1 y q2
son funciones de estas variables aleatorias y , por lo tanto, tambin son
variables aleatorias. . Nuestro requisito anterior se puede escribir como

P(q1 q q2 ) = g

Si conocemos q1 y q2 y se d una muestra, podemos calcular un valor


numrico q1 de q1 , y un valor numrico q2 de q2 . El intervalo con
puntos extremos q1 y q2 se llaman intervalos de confianza o estimacin
por intervalo para el parmetro desconocido q , y se representa

CONF q1 q q2

Los valores q1 y q2 se llaman lmites de confianza inferior y superior


para q. El nmero g se llama nivel de confianza. Se elige g = 95 % , 99%
o algunas veces 99,9 %.

Es evidente que si se intenta obtener una muestra y determinar un


intervalo de confianza correspondiente, entonces g es la probabilidad de
disponer de un intervalo que incluya el valor exacto desconocido del
parmetro.

1 2 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

4.2.1. INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA


DISTRIBUCIN NORMAL CUYA VARIANCIA ES CONOCIDA

Sea x1 , , xn una muestra extrada de una poblacin


distribuida normalmente o , a falta de esto, si n es lo bastante grande,y
cuya variancia s 2 es conocida. Suponemos que la media m es
desconocida , y que deseamos determinar un intervalo de confianza para
m . Los pasos necesarios para determinar un intervalo de confianza bajo
las suposiciones anteriores son .

1 paso .Elegir un nivel de confianza g ( 95 % , 99 % ,o uno


semejante ).

2 paso . Determinar el valor de z correspondiente mediante la tabla


de distribucin normal estandarizada. Por ejemplo:

g 0,90 0,95 0,99 0,999


Z 1,645 1,960 2,576 3,291

3 paso . Calcular la media x de la muestra

4 paso . Calcular

z s
k = (1)
n

Por lo tanto :

Si x es la media de una muestra aleatoria de tamao n de


una poblacin con variancia conocida el intervalo de confianza de ( g ) 100
% para la media poblacional es.

CONF x k m x + k

Z S m X S
X + Z
n n

Ejemplo:
Se calcula que la media de los promedios de los puntos de calidad de
una muestra aleatoria de 36 alumnos de los ltimos aos del nivel medio
es 2,6. Encuentre los intervalos de confianza del 95 % y del 99 % para la

1 2 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

media total de alumnos del ltimo ao. Asuma que la desviacin estndar
de la poblacin es 0,3.

Solucin:

La estimacin puntual de m es 2,6. El valor de z para el 95 % es z =


1,96. De aqu que el intervalo de confianza es :

0,3 0,3
( 2,6 1,96 m 2,6 + 1,96 )
36 36

el cual se re duce a, ( 2,50 , 2,70 )

Par a e nc ontr ar un i nter val o de l 99 % , se e nc ue ntr a e l valor


de z, donde z = 2,576

0,3 0,3
( 2 , 6 2 , 5 7 6 m 2,6 + 2 , 5 7 6 )
36 36

o simp le me nte : ( 2,47 , 2,73 )

Aho ra se obse rva que se re quie re un int ervalo ms grande


para e stimar m con mayor precisin.

Si no se conoce la variabilidad de la poblacin y solo se


dispone de la informacin proporcionada por la muestra, es
d e c i r s e c o n o c e X y s , s i e m p r e q u e s e t r a b a j e c o n u n
t a m a o d e m u e s t r a g r a n d e :

Z S m X S
X + Z
n n

1 2 2
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

GUA DE EJERCICIOS

ACTIVIDAD 1

El Departamento de Biologa de una escuela desea estimar la


cantidad promedio de agua que consume diariamente cierta especie
animal en condiciones experimentales, para completar un estudio que se
est realizando.Esta investigacin supone que la poblacin de valores de
consumo diario de agua est normalmente distribuida y, con base en
experiencias pasadas, que la variancia de la poblacin es de 4 gramos
cuadrados. Una muestra aleatoria de 40 animales arroja una media de
16,5 gramos.

a) Estime puntualmente la cantidad promedio de agua .

b) Con un nivel de confianza del 95 estime la cantidad promedio de


agua.

c) Realice los clculos solicitados en el inciso b) pero con un nivel


de confianza de 90 % . Compare los intervalos obtenidos.

ACTIVIDAD 2

En una escuela para adultos , se seleccion una muestra de 100


alumnos aparentemente sanos, de 25 aos de edad, donde se muestra una
presin sangunea media de 125. Si se supone que la desviacin estndar
de la poblacin es de 15, calcule
a) El intervalo de confianza del 90 por ciento para m

b) El intervalo confianza del 95 por ciento para m

ACTIVIDAD 3
Una investigacin realizada en el rea de educacin sostiene que la
edad promedio de los docentes del rea rural ha disminuido . La edad
promedio de los docentes rurales en elos ltimos aos fue de 35 aos.

Para ello,se extrae una muestra aleatoria de 100 docentes en la que


la edad promedio es de 28 aos con una desviacin estndar de 8 ao.

1 2 3
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

Confirman estos datos la hiptesis de esta investigacin?. Trabaje con


a = 0,01 y a = 0,05.

ACTIVIDAD 4

Una muestra aleatoria que representa el tiempo ( en minutos) que


tardaron 36 estudiantes en familiarizarse con el manejo de un software
adquirido por las Autoridades del Colegio, dio un tiempo promedio de 10
minutos . El tiempo se distribuye normalmente. con una desviacin
estndar de 3 minutos.

a) Determine e interprete un intervalo del 95 % de confianza para el


verdadero tiempo promedio.
b) El instructor considera que el tiempo promedio requerido por los
alumnos es mayor que 10 minutos, qu se puede decir de
acuerdo con el intervalo hallado?.

1 2 4
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

A N EXO
TABLA SESTAD STI CAS

1 2 5
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 2 6
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 2 7
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 2 8
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 2 9
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 3 0
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

1 3 1
LicenciaturaenGestinEducativaEscuelaparalaInnovacinEducativaUNSE

BIBLIOGRAFA

Bent ez, Celia de Pece, Marta G. Galndez , Margarit a de. (2003).


Serie Didctica N7: Elementos de Estadstica para tcnicos en
vivero y plantaciones forestales, con gua de ejercitacin.

Barbancho, A. (1983). Estadstica Elemental Moderna . 9a Edicin.


Ariel, S. A. Barcelona. ISBN 8434420058.

Daniel, W.W. (1997) Bioestadstica. ISBN 968185196X.

Kreyszig, E. (1994). Introduccin a la Estadstica Matemtica .


Principios y mtodos. LIMUSA. Noriega Editores. ISBN 96818
07294.

Pea, D. y Romo, J. (1999) . Introduccin a la Estadstica para las


Ciencias Sociales. ISBN 8448116178.

Triola, M.F.(2004). Estadstica. Novena edicin.ISBN 970260519


9. Editorial Pearson. Mxico. 837 pags.

YaLun, Chou. (1990). Anlisis Estadstico. ISBN 9701000463.


pags.808.

1 3 2

Вам также может понравиться