Вы находитесь на странице: 1из 64

Estadstica aplicada a la

Educacin

ESTADSTICA APLICADA A LA
EDUCACIN

Algn
Algn da el pensamiento estadstico ser nenecesario como la habilidad para leer o escribir
(H.G. Wells)

Magster Agustina Subelda Coronel

AO 2014
Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

INDICE
UNIDAD I

INTRODUCCIN A LA METODOLOGIA DE LA INVESTIGACIN CUANTITATIVA

Metodologa cuantitativa................................................................................................................................ 4
Caractersticas de la metodologa cuantitativa............................................................................................ 4
Fases de la investigacin cuantitativa......................................................................................................... .4
Definicin del tema de investigacin.......................................................................................................... 4
Planteamiento del problema...................................................................................................................... 5
Objetivos del estudio................................................................................................................................. 5
Justificacin del estudio............................................................................................................................. 5
Revisin de la literatura marco terico.................................................................................................... 6
Diseo metodolgico................................................................................................................................ 6
Bibliografa................................................................................................................................................. 6
Cronograma de trabajo.............................................................................................................................. 7

UNIDAD II

INTRODUCCIN A LA ESTADSTICA

Concepto de la estadstica............................................................................................................................. 8
Importancia de la estadstica ........................................................................................................................ 8
Funciones de la estadstica........................................................................................................................... 8
Nomenclatura estadstica.............................................................................................................................. 9
Elementos bsicos de la estadstica.............................................................................................................. 10
Elaboracin de matriz tripartita de datos....................................................................................................... 10
Ejercicios de aplicacin 1........................................................................................................................... 10
Variables........................................................................................................................................................ 11
Categoras de las variables......................................................................................................................... 11
Clasificacin de las variables....................................................................................................................... 11
Ejercicios de aplicacin 2............................................................................................................................. 12
Construccin de indicadores.......................................................................................................................... 14
Razn, relacin............................................................................................................................................ 14
Proporcin, porcentaje................................................................................................................................. 14
Ejercicios de aplicacin 3............................................................................................................................ 15
ndice, crecimiento....................................................................................................................................... 17
Ejercicios de aplicacin 4............................................................................................................................ 17
Tcnicas de recoleccin de datos cuantitativos............................................................................................. 19
Cuestionario................................................................................................................................................. 19
Problemas ms usuales en los cuestionarios............................................................................................. 19
Fases y diseo de preguntas de un cuestionario........................................................................................ 19

UNIDAD III

POBLACIN Y MUESTRA

Concepto de poblacin y muestra...................................................................................................... 21


Principales tipos de muestras...................................................................................................................... 21
Tamao de la muestra................................................................................................................................. 22
Determinacin del tamao de la muestra probabilstica..............................................................................22
Representatividad de la muestra................................................................................................................. 24
Distribucin del tamao de la muestra por afijacin proporcional................................................................24
Ejercicios de aplicacin 5............................................................................................................................. 25

UNIDAD 4

ORGANIZACIN Y PRESENTACIN DE DATOS

Construccin de tablas de frecuencias.......................................................................................................... 27


Ejercicios de aplicacin 6............................................................................................................................. 29
Elaboracin de cuadros estadsticos............................................................................................................. 31
Partes principales de un cuadro estadstico................................................................................................ 31
Ejercicios de aplicacin 7............................................................................................................................ 31
Construccin de grficos estadsticos........................................................................................................... 32
Principales partes de un grfico................................................................................................................... 32
Principales tipos de grficos........................................................................................................................ 32
Ejercicios de aplicacin 8............................................................................................................................ 36
Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

UNIDAD 5

ANLISIS DE DATOS

Estadsticas descriptivas............................................................................................................................... 38
Medidas de centralizacin (media, mediana y moda)..................................................................................38
Ejercicios de aplicacin 9............................................................................................................................ 42
Medidas de dispersin (rango, desviacin media, varianza, desviacin estndar, CV)...............................44
Ejercicios de aplicacin 10.......................................................................................................................... 46
Medidas de asociacin (correlacin, regresin)...........................................................................................48
Ejercicios de aplicacin 11.......................................................................................................................... 53
Ejercicios de aplicacin 12.......................................................................................................................... 55
Inferencias estadsticas................................................................................................................................. 57
Pruebas de hiptesis..................................................................................................................................... 57
Ejercicios de aplicacin 13.......................................................................................................................... 61
ANEXOS........................................................................................................................................................ 63
BIBLIOGRAFA.............................................................................................................................................. 64

Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

UNIDAD 1: INTRODUCCIN A LA METODOLOGA CUANTITATIVA


METODOLOGA CUANTITATIVA
Es una manera de enfocar los modelos de la investigacin basada en un paradigma explicativo, cuando se
busca una explicacin matemtica (cuantitativa) al problema, especialmente en el campo de la Estadstica.
Sus resultados estarn reflejados en frecuencias absolutas, porcentajes, tasas, ndices, grficos, tablas, etc.
Ofrece mucha informacin pero, no se ver en profundidad.

CARACTERSTICAS DE LA METODOLOGA CUANTITATIVA

Basada en la induccin probabilstica del positivismo lgico


Medicin penetrante y controlada
Objetiva
Inferencias ms all de los datos
Confirmatoria, deductiva
Orientada al resultado
Datos "slidos y repetibles
Generalizable
Particularista
Realidad esttica

PREPARACIN DEL PROYECTO DE INVESTIGACIN

DEFINICIN DEL TEMA DE INVESTIGACIN


En esta parte el investigador, define en qu rea del conocimiento quiere llevar a cabo la investigacin. Se
plantea algunas preguntas tales como:
Es el tema de inters?
Existe informacin sobre el mismo? Dnde?
Qu resultados puede proporcionar la investigacin?
Debe conocer el objeto de investigacin.
Debe documentarse en todo tipo de material referido a su tema.
Define el ttulo preliminar de la investigacin
Consulta con expertos que lo ayudar a delimitar el objeto de conocimiento.

Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

PLANTEAMIENTO DEL PROBLEMA


En este apartado se realiza una breve descripcin de la situacin actual del tema que se va a investigar ubi cndolo en un contexto que lo haga comprensible (yendo de lo general a lo particular), se identifica y descri ben los sntomas o efectos que se observan y se los relaciona con las causas que los producen. La formulacin puede hacerse en forma de pregunta/s.
Ejemplo 1: En la actualidad, el nivel formativo de los estudiantes que ingresan a la Universidad Nacional ha
bajado considerablemente con respecto a los aos anteriores. Por otro lado, en el mercado aparecen diversas instituciones privadas competidoras que ofrecen formaciones similares que con cuotas mnimas se pueden cursar y obtener un ttulo igual o similar a las otorgadas por la Universidad Nacional.
Efecto o sntoma: Descenso de calidad educativa
Causas: Nivel de formacin, Currculo, competencia, etc.

OBJETIVOS DEL ESTUDIO


Son los propsitos que se persigue en la INVESTIGACIN
Para qu y qu se busca con este estudio?
Qu quiero hacer en la investigacin?
Qu es lo que busco conocer?
A dnde quiero llegar?
Se recomienda formular un solo objetivo general global, coherente con el problema planteado, y ms objetivos especficos que conducirn a lograr el objetivo general y que son alcanzables con la metodologa pro puesta.
El objetivo debe redactarse con un verbo en infinitivo al principio que denote la bsqueda de un conocimien to, por ejemplo: determinar, identificar, evaluar, analizar, describir, desarrollar, descubrir, clasificar, enumerar,
establecer, experimentar, observar, obtener, proponer, comparar, intuir, percibir, capturar, acopiar, desarrollar,
discutir, elaborar, recolectar, concentrar, discutir, comprobar, aplicar, probar, inferir, aclarar, acoger, actualizar,
abatir, comprender, adecuar, adquirir, debatir, afirmar, advertir, afrontar, agotar, ahondar, definir, generar,
guiar, diferenciar, comentar, estudiar, estructurar, sugerir, reforzar, explicar, registrar, buscar, recopilar, examinar, estudiar, entre otros.

JUSTIFICACIN DEL ESTUDIO


Cules son los motivos que justifican la realizacin de esta investigacin?
Los motivos pueden ser de carcter:
Terico:

Es importante sealar en el diseo los principales elementos tericos sobre los cuales se
pretende desarrollar la investigacin.

Metodolgico: Hace mencin al uso de metodologas y tcnicas especficas que han de servir de aporte
para el estudio de problemas.
Prctico:

Se manifiestan en el inters del investigador por acrecentar sus conocimientos, obtener un ttulo acadmico o contribuir a la solucin de problemas concretos.

Se responden a preguntas tales como:


Cul es la importancia de este estudio?Para qu sirve?
Cul es su trascendencia para la sociedad?
A quin beneficiar la investigacin? Cul ser el aporte?
Qu alcance y limitaciones tendr?
Se justifica la realizacin del estudio desde el punto de vista del investigador.

REVISIN DE LA LITERATURA MARCO TERICO


Qu teora/ informaciones se tiene sobre el tema?
Quines han investigado ya sobre este tema?
Qu antecedentes se tiene sobre el contenido del tema?
Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin
En la investigacin que se va a realizar se debe tomar en cuenta el conocimiento ya existente sobre el tema.
Se atiende lo que los diferentes autores ya escribieron sobre el tema. Con esto se fundamenta tericamente
el trabajo de investigacin.
Su funcin es definir el significado de los trminos (lenguaje tcnico) que se van a emplear durante el proceso de construccin del conocimiento en la investigacin.
Se realiza una definicin operacional de los conceptos fundamentales del estudio.
Por sobre todas las cosas se debe explicar exactamente el alcance de cada una de las palabras o frases
que van a definir el mbito del trabajo de investigacin.

ASPECTO O DISEO METODOLGICO


Es la estrategia que se utilizar para cumplir con los objetivos de la investigacin. En este parte se explica la
realizacin del trabajo, se describen los procedimientos y tcnicas a ser utilizados
Cmo se va realizar el estudio?
Cules son los procedimientos y tcnicas que se va a tener en cuenta en la realizacin del trabajo?
Las partes a tener en cuenta son:

BIBLIOGRAFA
Se debe tener en cuenta toda la documentacin bibliogrfica que se ha consultado en el proceso de elabora cin de la investigacin.
La presentacin del mismo se realiza teniendo en cuenta los reglamentos o normativas vigentes.

Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

CRONOGRAMA DE TRABAJO
Considera las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas.
Para el mismo se utiliza la Grfica de Gantt, que es la representacin grfica de las variables actividades de
las etapas de investigacin y tiempo de ejecucin (pueden ser en das, semanas, meses, ao)

Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

UNIDAD 2: INTRODUCCIN A LA ESTADSTICA


Qu es la Estadstica?
Es la ciencia que tiene por objeto la recoleccin, clasificacin y anlisis de conjuntos de datos de observaciones obtenidos en un estudio, para interpretarlos y obtener leyes y relaciones entre ellas, que orienta la toma
de decisiones a partir del anlisis e interpretacin de observaciones realizadas en forma directa o experi mentalmente

Por qu es importante la estadstica?

Permite comprender la bibliografa especializada (libros, estudios e investigaciones) basados en el anlisis estadstico.

Constituye una herramienta auxiliar de utilidad inmediata y prctica en el trabajo profesional.

Ayuda a desarrollar una investigacin rigurosa, ofreciendo fundamentos lgicos en los que se sustenta la
investigacin bsica y aplicada.

Qu funciones cumple la estadstica?


Descriptiva: Se hace una descripcin del resumen de los datos mediante el empleo de medidas de clculos
(%, promedios, desviacin estndar y coeficientes de correlacin).
Inferencial: Consiste en inferir propiedades de una poblacin sobre la base de una muestra con resultados
conocidos.
Predictiva: Orienta la toma de decisiones con vigencia y efecto en el futuro (estimativo).

Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

NOMENCLATURA ESTADSTICA
ESTADISTICAS, sinnimo de datos estadsticos, servir para designar a toda coleccin sistemtica de datos
referentes a un determinado fenmeno.
ESTADSTICO, es la persona que se dedica al estudio de la Estadstica, es el profesional que analiza esta dsticas, desarrolla mtodos y modelos estadsticos y contribuye a la evolucin de la ciencia estadstica. (Roberto B. vila Acosta)
ESTADGRAFO es el trmino utilizado para designar a la persona dedicada a las tareas propias de la estadstica, aunque en ocasiones tambin es frecuente que se utilice para designar a la variable que define una
distribucin estadstica, de esta forma es comn escuchar el trmino estadgrafo de prueba.
mx.answers.yahoo.com/question, smathdown.blogspot.com
ESTADGRAFO es una caracterstica descriptiva global de una muestra .Es la medida de una caracterstica
relativa a una muestra. La mayora de los estadsticos mustrales se encuentran por medio de una frmula y
suelen asignrseles nombres simblicos que son letras latinas.
http://virtual.uav.edu.mx/tmp/2611217572402.doc
DATO, es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la
observacin, entrevista o recopilacin en general. Los datos son la materia prima de la Estadstica.
INFORMACION, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay informacin
sin datos.
VARIABLE, Son caractersticas o dimensiones observables, susceptibles de adoptar distintos valores o ser
expresados en varias categoras, tales como edad, ingresos, matrcula, Instituciones, lugar de nacimiento,
ahorros, etc.. Las variables se definen e identifican en funcin de los objetivos del estudio.
INDICADORES, son elementos caractersticos que describen una situacin permitiendo su anlisis. Son re ferentes empricos que permiten una medicin, descripcin, ordenamiento de los datos o caractersticas en
forma vlida y confiable. La validez y confiabilidad del indicador depende de la validez de los datos utiliza dos y de la lgica de su relacin o construccin. En este sentido, los llamados ndices, tasas, estadgrafos,
medidas de resumen, etc., son indicadores.
POBLACIN O UNIVERSO, est referido a cualquier coleccin finito o infinito de elementos que interesan a
un estudio y poseen alguna caracterstica comn observable y pueden ser personas, instituciones, objetos,
familias, animales y otras unidades ms complejas. Toda poblacin tiene N elementos y una muestra de n
elementos, donde n<N.
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.
PARAMETRO, es un valor obtenido para describir en forma resumida las caractersticas pertinentes o ms
importantes acerca de una poblacin. Son las medidas de resumen de una poblacin. Una poblacin puede tener muchas caractersticas y por tanto muchos parmetros.
ESTADIGRAFO, datos empricos que se usa con fines descriptivos o analticos; son medidas de resumen
estadstico de un conjunto de datos. Las medidas de resumen de una muestra se llamarn estadgrafos.
Ejemplo, la media aritmtica, mediana, varianza, coeficiente de correlacin, etc.
CENSO, consiste en un recuento de todos los elementos en una poblacin y/o una especificacin de las dis tribuciones de sus caractersticas, basados en la informacin obtenida para cada uno de los elementos.
ENCUESTA, consiste en la obtencin de datos de inters sociolgico mediante la interrogacin a los miembros de la sociedad. Permite obtener informaciones sobre un amplio abanico de cuestiones a la vez y no
slo sobre un aspecto o problema definido.
UNIDAD DE ANLISIS, es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre los
cuales se va a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fe nmeno y proporciona datos concretos.
Magster Agustina Subelda Coronel

Estadstica aplicada a la
Educacin

ELEMENTOS BSICOS DE LA ESTADSTICA


En el trabajo estadstico existen tres elementos bsicos como son: la poblacin o muestra (unidades de
anlisis), las variables o caractersticas, y los datos. A esto se lo denomina matriz tripartita
1. Los elementos o unidades de anlisis (poblacin) que pueden ser personas, instituciones, objetos,
familias, etc. y otras unidades ms complejas. Estas unidades tienen una caracterstica en comn, en
cuanto constituyen el objeto de estudio de una investigacin.
2. Las variables, dimensiones o caractersticas que se desea conocer en relacin a las unidades de anlisis, tales como matrcula, instituciones, etc.
3. Los datos o valores que alcanzan las unidades en las variables estudiadas, son las respuestas o resultados que se obtienen cuando
CUADRO 1
MATRZ TRIPARTITA DE DATOS: CARACTERSTICAS SOCIODEMOGRFICAS DE LOS DOCENTES
DE LA MAESTRA EN EDUCACIN. AO 2012
Unidades de anlisis
(Poblacin)

01
02
03
04
05
06
07
08
09
10
11
12

VARIABLES
Edad

Sexo

48
37
28
36
25
38
45
37
48
41
50
35

F
F
F
M
F
F
M
M
F
F
F
F

Estado Civil

Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin

N de hijos

Aos de servicio

4
3
1
3
3
0
2
5
3
5
1
2

21
15
6
15
5
18
25
16
25
17
24
13

EJERCICIOS DE APLICACIN 1
1. Establece poblaciones e identifica en l por lo menos tres variables (pueden ser del tipo nominal, ordinal,
razn o intervalar) que puedan ser estudiadas en las mismas. Elabora una matriz tripartita para cada poblacin con 20 unidades de anlisis.

Magster Agustina Subelda Coronel

10

Estadstica aplicada a la
Educacin

VARIABLES
Objeto, proceso o caracterstica que est presente, o supuestamente presente en el fenmeno medible que
un cientfico quiere estudiar, que vara (cambia) a travs del tiempo, o que difiere de un lugar a otro o de un
individuo a otro. Los objetos, procesos o caractersticas reciben el nombre de variables en la medida en que
su modificacin provoca una modificacin en otro objeto, proceso o caracterstica.

CATEGORAS DE LAS VARIABLES


Cada uno de los grupos de clasificacin de una variable recibe el nombre de categora, clase, nmina o lista.
Un conjunto de categoras para una determinada variable constituye la escala de clasificacin.

Las categoras deben ser excluyentes entre s.


En conjunto deben ser exhaustivas (cada posible respuesta en una categora).

Ejemplo 2
Variable: Sexo
Categora
1. Femenino
2. Masculino

CLASIFICACIN DE LAS VARIABLES


Las variables se clasifican segn diversos criterios. A continuacin se presentan algunas;

SEGN LA NATURALEZA DE LA VARIABLE


a)

Variables cualitativas o estadsticas de atributos


Cuando expresan una cualidad, caracterstica o atributo, tienen carcter cualitativo; sus datos se expresan mediante una palabra, es no numrico. Por ejemplo: estado civil, lugar de nacimiento, profesiones,
actividad econmica, causas de accidentes, etc.

b) Variables cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico. El dato o valor puede resultar de la operacin de contar o medir. Las variables cuantitativas pueden ser discretas y continuas.
Discreta; cuando el valor resulta de la operacin de contar, su valor est representado solo por nmeros
naturales. Ej. Cantidad de jvenes de una carrera, cantidad de docentes por carrera, cantidad de alumnos
en la institucin de educacin superior, cantidad de asignaturas por carrera, Hijos por familia, nmero de
accidentes por da, habitaciones por vivienda, etc.
Continua; cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Se expresa por cualquier nmero real. Ej. rea
de parcelas, ingresos monetarios, produccin de maz, peso de los alumnos, estatura de los alumnos,
tiempo de servicios, horas trabajadas de los docentes, etc.

SEGN LA ESCALA DE MEDICIN; Se presenta a continuacin las caractersticas bsicas de los cuatro niveles distinguidos por Stevens,

a) Variables nominales; Son aquellas que establecen la distincin de los elementos en diversas categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o ms categoras.
Ejemplos: sexo, estado civil, deportes que practica, profesiones, lugar de nacimiento, etc.
Magster Agustina Subelda Coronel

11

Estadstica aplicada a la
Educacin

b) Variables ordinales: Aquellas variables que implican orden entre sus categoras, pero no grados de
distancia iguales entre ellas; estn referidas a un orden o jerarqua, donde las categoras expresan una
posicin de orden. Ejemplo: grado de instruccin, clases sociales, grado de simpata, rango de agresividad, orden de mrito, nivel de dolor, nivel de preferencia, etc.

c) Variables de intervalo: Son aquellas que suponen a la vez orden y grados de distancia iguales entre
las diversas categoras, pero no tienen un origen natural, sino convencional. En este tipo de variables es
posible describir la informacin contenida en ellas calculando el promedio, desviacin Standard (DS) y
siempre debiera tambin incluirse en base a cuantos casos (o sea el n) tienen dichos resultados.
Ejemplos: coeficiente de inteligencia, temperatura, puntuacin obtenida en una escala, etc.

d) Variables de razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero
absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pu dindose aplicarles todo tipo de instrumental matemtico. El valor de estas variables se expresa con un
nmero real. Ejemplo: edad, peso, ingresos, nmero de hijos, produccin, accidentes de trnsito, etc.

SEGN LA RELACIN ENTRE VARIABLES


a)

Variables dependientes: Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razn de ser. Es la variable que traduce
la consecuencia del efecto de una o varias razones o causas de otras variables.

b)

Variables independientes: Son las variables explicativas o predictivas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende descubrir en la investigacin. Las variables independientes (VI) son las que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). En la relacin de variables, las causas o antecedentes seran las VI y el efecto o conse cuente es la VD.

Ejemplo 3
1.
2.
3.
4.
5.
6.
7.
8.

El presupuesto familiar (VD) depende de los ingresos (VI).


El volumen de ventas (VD) se explica por la inversin en propaganda (VI).
El nmero de hijos por familia (VD) tiene relacin con el nivel educativo de los padres (VI).
El analfabetismo (VD) tiene relacin con el lugar de residencia (VI) y la expansin del servicio educativo (VI).
El aprendizaje de los jvenes (VD) tiene relacin con las estrategias de enseanza del docente (VI).
Las estrategias de enseanza del docente (VD) depende de su formacin pedaggica (VI).
Los aos de estudios de la madre (VI) determinan el logro educativo del hijo (VD).
La inversin en la capacitacin docente (VI) aumenta el logro escolar (VD).

EJERCICIOS DE APLICACIN 2
2. En qu escala de medida estn basadas las respuestas al siguiente cuestionario?
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.

Cul es su estatura?
Cul es su peso?
Cul es su ocupacin?
Cul es su nombre?
Cuntos aos tiene?
Tiempo empleado para comprar en la librera
Cantidad de dinero que se utiliza para adquirir libros
Nmero de materias en las que se inscribi
Cantidad de nios de un aula
Cantidad de docentes de una institucin
Sector de una Institucin (Pblico, Privado, etc.)

Magster Agustina Subelda Coronel

12

Estadstica aplicada a la
Educacin
3. Clasifica cada una de las siguientes variables, segn su naturaleza y escala de medicin
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.

Zona de residencia
Direccin de una persona
Nmero de miembros de una familia
Nmero de libros de texto que se adquieren
Niveles de enseanza (EEB, Media, Superior)
Grado que cursa
Departamentos geogrficos del pas
Zona
Edad en aos cumplidos
Carrera cursada

4. Analiza y clasifica las siguientes variables, segn su naturaleza y escala de medicin


aa
aa
aa
aa
aa

Religin que profesan las personas


Profesan s o no la religin catlica
Considera usted bueno, regular o malo el desempeo del profesor de estadstica?
Estado civil
Lugar de residencia

5. En una institucin de educacin superior se ha realizado una encuesta acerca de la procedencia y nacionalidad de los estudiantes, obtenindose los siguientes resultados.
Cuadro 2: Cant. de estudiantes por procedencia segn nacionalidad
Nacionalidad
Total
Paraguayos
Extranjeros

Total
55
35
20

Procedencia
Capital
Interior
38
17
23
12
15
5

Fuente: Universidad XX. Ao 2008

a.
b.
c.
d.

Con qu escala de medicin se mide la nacionalidad?


A qu tipo de variable, segn su naturaleza correspondera la Procedencia?
A qu tipo de variable, segn su escala de medicin correspondera la Procedencia?
A qu tipo de variable, segn su naturaleza correspondera la nacionalidad?

6. D 3 ejemplos de variables segn la relacin entre variables.


7. En un estudio sobre los estudiantes universitarios del ltimo ao, se mide su promedio acadmico y su
consumo de alcohol durante el mes anterior. Formule una hiptesis para estas dos variables e indique
cul es la variable independiente y cul es la variable dependiente.
8. En un estudio sobre los estudiantes del ltimo ao en una prestigiosa universidad, se mide el rea de especializacin del alumno y su ao de escolaridad. En dicho estudio, cul de estas mediciones representa una variable, y cul una constante?

Magster Agustina Subelda Coronel

13

Estadstica aplicada a la
Educacin

CONSTRUCCIN DE INDICADORES
INDICADORES: Un indicador social es una medida de resumen, de preferencia estadstica, referente a la
cantidad o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar
las unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables que se estn analizando.

RAZN Y RELACIN
RAZN: Es la comparacin entre dos nmeros que puede calcularse por diferencia
RELACIN: Comparacin entre dos nmeros que puede calcularse por cociente.
Ejemplo 4: En una institucin de nivel medio asisten 1200 varones y 600 mujeres. Calcula
a. La razn de varones y mujeres. Interpreta.
b. La relacin entre varones/mujeres. Interpreta
a. Ra=1.200-600=600. Interpretacin: Indica que existen 600 varones ms que mujeres en dicha Institucin.
b. Re

V
1200 2

Interpretacin: Indica que hay 2 varones para cada 1 mujer.


M
600
1

PROPORCIN Y PORCENTAJE
PROPORCIN: Una proporcin (P) es una comparacin por cociente de la magnitud de una parte con la del
todo. El valor de una proporcin (P) siempre se halla entre el cero y la unidad.

0 P 1
Ejemplo 5: Indica la proporcin de mujeres matriculadas en la enseanza superior durante 2010.
MUJERES
343.050

MATRCULA
TOTAL
576.500

PROPORCIN
(343.050/576.500)=0,59

PORCENTAJE: Es la expresin de la proporcin en forma de porcentaje (%). As, para convertir una proporcin en porcentaje se multiplica dicha proporcin por 100.
Interpretacin: Aproximadamente la sexta parte (0,59) de los estudiantes son mujeres.
O de cada 10 estudiantes 6 son mujeres
Ejemplo 6: Indica el porcentaje mujeres matriculadas en la enseanza superior durante 2010.
MUJERES
343.050

MATRCULA
TOTAL
576.500

PORCENTAJE
(343.050/576.500)*100=59,5%

Interpretacin: El 59,5% de los estudiantes son mujeres.

Magster Agustina Subelda Coronel

14

Estadstica aplicada a la
Educacin

EJERCICIOS DE APLICACIN 3
9. Las Instituciones de Educacin Superior se clasifican de la siguiente manera:
Cuadro 3: Cant. de instituciones de Educacin Superior por sector.
SECTOR
Oficial
Privado
Subvencionado
a)
b)
c)
d)
e)
f)

CANT. INST.
5
35
12

Cuntas instituciones de Educacin Superior existen en el Paraguay?


Calcula la razn entre las instituciones del sector Oficial y Privado. Interpreta
Calcula la razn entre las instituciones del sector Privado y Subvencionado. Interpreta
Halla la relacin de Privado a Oficial. Interpreta esta relacin
Qu proporcin representan las instituciones del sector Oficial?. Interpreta
Qu porcentaje representan las instituciones de los distintos sectores?. Interpreta

10. El siguiente cuadro presenta la matrcula por nivel del Sistema Educativo.
Cuadro 4: SISTEMA EDUCATIVO. MATRCULA POR NIVEL. Ao: 2012
NIVEL
INICIAL
EEB
MEDIO
a)
b)
c)
d)
e)
f)

MATRCULA
100.685
905.813
111.066

Calcula la razn entre la matrcula del nivel EEB y MEDIO. Interpreta


Calcula la razn entre la matrcula del nivel Inicial y la EEB. Interpreta
Halla la relacin de la matrcula del Nivel Medio y la EEB. Interpreta
Halla la relacin de la matrcula del Nivel Inicial y la EEB. Interpreta
Qu porcentaje representa la matrcula de la EEB?. Interpreta el resultado obtenido.
Qu proporcin representa la matrcula del nivel Medio. Interpreta el resultado obtenido.

11. El siguiente cuadro presenta la distribucin de la matrcula de la Educacin Superior en cuatro departamentos.
Cuadro 5: PARAGUAY. EDUCACIN SUPERIOR.
MATRCULA EN CUATRO DEPARTAMENTOS. Ao: 2011
DEPARTAMENTO
Asuncin
Central
Alto Paran
Itapa
a)
b)
c)
d)
e)
f)

MATRCULA
5882
4343
1672
1329

Calcula la razn por diferencia entre la matrcula de Asuncin y Alto Paran Interpreta
Calcula la razn por diferencia entre la matrcula del Itapa y Alto Paran. Interpreta
Cul es la relacin entre la matrcula del Departamento Central y Alto Paran?
Cul es la relacin entre la matrcula del Departamento Central y Asuncin?
Qu porcentaje representa la matrcula del departamento Central? Interpreta
Qu proporcin representa la matrcula de Asuncin?

Magster Agustina Subelda Coronel

15

Estadstica aplicada a la
Educacin
12. En una institucin educativa se ha realizado un sondeo acerca de la procedencia y nacionalidad de los
estudiantes, obtenindose los siguientes resultados.
Cuadro 6: Cant. de estudiantes por procedencia segn nacionalidad
Nacionalidad
Total
Paraguayos
Extranjeros
aa
aa
aa
aa
aa
aa
aa

Total
55
35
20

Procedencia
Capital
Interior
38
17
23
12
15
5

Cul es la razn entre paraguayos y extranjeros?. Interpreta


Qu relacin hay entre paraguayos y extranjeros?
Halla la relacin capital/interior. Interpreta.
Halla la proporcin de los que vienen de la capital e interior
Qu porcentaje de extranjeros se encuentran en la capital?
Halla el porcentaje de paraguayos y extranjeros que provienen de la capital
Qu porcentaje de extranjeros provienen del Interior?

13. El siguiente cuadro presenta la distribucin de la matrcula por carrera.


Cuadro 7: UNIVERSIDAD XX. EDUCACIN SUPERIOR.
MATRCULA POR CARRERA. Ao: 2011
CARRERA
INFORMTICA
COMERCIO INTERNACIONAL
DERECHO
ARQUITECTURA

MATRCULA
188
151
241
122

a) Cul es la razn entre la matrcula de Informtica y Arquitectura? Interpreta


b) Cul es la relacin entre la matrcula de Comercio Int. e Informtica?. Interpreta
c) Qu proporcin representa la matrcula de la carrera de Derecho? Interpreta
d) Qu porcentaje representa la matrcula de Arquitectura? Interpreta
14. En Asuncin en el ao 2011 se han matriculado 7.612 alumnos en la educacin superior, de los cuales
aprobaron el 65,3%, el 4,3% sali en el ao y el resto de alumnos se aplaz. Calcula la cantidad de
alumnos aplazados en ese ao.
15. En una carrera universitaria que tiene dos secciones del 1 semestre, se aplazaron el 41,9% del 1 A,
que tiene 43 alumnos y 29% del 1 B que tiene 31 alumnos. Qu porcentaje se aplaz en el 1 se mestre?.
16. En una institucin de educacin superior que tiene tres secciones del 1er semestre, se aplazaron en Matemtica el 35,4% de la seccin A, que tiene 45 alumnos, 37,2 % de la seccin B que tiene 48 alumnos y el 25,6% de la seccin C que tiene 40 alumnos. Qu cantidad de alumnos del 1er semestre no
se aplaz en Matemtica? Qu porcentaje se aplaz en Matemtica?
17. Es el regreso de fin de semana y en la universidad se eligi a un rey y a una reina. Cuando se anunciaron los resultados para la coronacin de la reina, se supo que Natalia gan con 526 votos; la ganadora
del segundo lugar obtuvo 510, las siguientes cuatro recibieron 482, 325, 200 y 150 votos, respectiva mente, y las restantes 10 participantes alcanzaron un total de 1140 votos. En la fiesta para los concursantes, usted descubre que Natalia viene de una familia numerosa, y que 28 de sus parientes asisten a
la misma universidad y votaron por ella.
a.
b.
c.
d.

Qu porcentaje de los 15000 estudiantes vot en la eleccin?


Del total de votos, qu porcentaje recibi Natalia?
Qu proporcin del total de estudiantes representa la familia de Natalia?
Fue el apoyo familiar un factor clave en la victoria de Natalia?

Magster Agustina Subelda Coronel

16

Estadstica aplicada a la
Educacin

NDICE Y CRECIMIENTO
NMERO NDICE: Indica la evolucin de una serie cronolgica. Por consiguiente, en su clculo es funda mental considerar el orden en que se presentan las observaciones a travs del tiempo.
Es un indicador de una caracterstica observable, no una medida, por lo tanto, lo ms que puede hacer es
indicar.
CUADRO 8: PARAGUAY. EDUCACIN PRIMARIA.
MATRCULA POR AO. PERIODO 1989 - 1994
MATRCULA
ndice
Cantidad
Base 1990=100
656.877
687.331
100,00
720.983
104,90
755.492
109,92
798.981
116,24
835.089
121,49

AO
1989
1990
1991
1992
1993
1994

Fuente: MEC. Anuarios 1989 a 1994

Considerando como ao base 1990, se tiene para el ao 1994 que:

ndice de alumnos

835.089
100 121,50%
687.331

Lo que indica un crecimiento positivo, pues el ndice es superior al del ao base 1994
CRECIMIENTO: Determinadas variables crecen, permanecen constantes o decrecen con el paso del tiempo,
es muy til para describir y explicar el funcionamiento de los sistemas de la educacin en el pasado; sirven
tambin para predecir el comportamiento de las variables en el futuro.
Los crecimientos pueden ser; Crecimiento absoluto y Crecimiento relativo o porcentual
Ejemplo 7: Considerando el cuadro anterior, se puede calcular los dos tipos de crecimiento.
Crecimiento absoluto de la matrcula =M1994 - M1989=835.089-687.331=147.758 alumnos

Crecimiento relativo de la matrcula

M n

M0)

M0

100

835.089 - 687.331) 100 21,49%


687.331

Interpretacin: El resultado indica que en un perodo de 5 aos, la matrcula se increment en un 21,49%

EJERCICIOS DE APLICACIN 4
18. El siguiente cuadro contiene datos histricos de la matrcula de una Institucin.
AO
2002
2003
2004
2005
2006
2007
2008
2009
2010

TOTAL
2779
3490
3750
3527
3618
3696
3521
3863
4186

HOMBRE
1684
2004
2046
1868
1840
1894
1824
1920
2193

Magster Agustina Subelda Coronel

MUJER
1095
1486
1704
1659
1778
1802
1697
1943
1993
17

Estadstica aplicada a la
Educacin
2011
a)
b)
c)
d)
e)
f)
g)

4567

2506

2061

Considerando como ao base 2005, calcular para el ao 2010, el ndice total de alumnos.
Halla el crecimiento absoluto de la matrcula total en el perodo 2002-2006
Halla el crecimiento porcentual de la matrcula total en el perodo 2002-2006
Halla el crecimiento porcentual de la matrcula total en el perodo 2007-2011
Halla el crecimiento porcentual de la matrcula total en el perodo 2006-2010
Halla el crecimiento porcentual de la matrcula de hombres en el perodo 2007-2011
Halla el crecimiento porcentual de la matrcula de mujeres en el perodo 2007-2011

19. El siguiente cuadro indica el nmero total de alumnos matriculados en la EEB, durante el perodo 1990
1997, su distribucin por zona urbana y rural.
AO
1990
1991
1992
1993
1994
1995
1996
1997
a)
b)
c)
d)
e)

TOTAL
454853
452249
467552
478584
493231
504377
518968
530163

URBANA
195533
191215
193722
194702
196685
198555
200781
202783

RURAL
259320
261034
273830
283882
296546
305822
318187
327380

Considerando 1993 como ao base, calcular para el ao 1997 el ndice de alumnos de la zona urbana.
Calcula el crecimiento porcentual de la matrcula total en el perodo 1992-1997
Calcula el crecimiento porcentual de la matrcula por zona entre los aos 92-97
Calcula el crecimiento porcentual de la matrcula por zona entre los aos 90-94
Analiza los porcentajes obtenidos en el clculo anterior.

20. El siguiente cuadro indica el nmero total de alumnos matriculados de la Institucin XX, durante el perodo 1996 2000, su distribucin por sexo.
AO
1996
1997
1998
1999
2000
a)
b)
c)
d)

TOTAL

VARN
350
348
450
443
448

MUJER
475
462
446
435
450

Considerando 1996 como ao base, calcular para el ao 2000 el ndice de alumnos VARONES
Constryase un nuevo cuadro con columnas que muestre los datos en porcentajes por fila.
Calcula el crecimiento porcentual de la matrcula total, por SEXO entre los aos 1996/2000
Analiza los porcentajes obtenidos en el clculo anterior.

21. El siguiente cuadro indica el nmero total de Instituciones y su distribucin por SECTOR, durante el perodo 1996 2000.
AO
1996
1997
1998
1999
2000

TOTAL

OFICIAL
35
36
45
48
50

PRIVADO
25
28
29
35
38

aa Considerando 1996 como ao base, calcular para el ao 2000 el ndice de Instituciones por Sector.
aa Calcula el crecimiento porcentual de las instituciones, por SECTOR entre los aos 1996/2000

Magster Agustina Subelda Coronel

18

Estadstica aplicada a la
Educacin

TCNICAS DE RECOLECCIN DE DATOS CUANTITATIVOS


En el enfoque cuantitativo generalmente se elige una idea, la cual se transforma en preguntas de investiga cin, que luego derivan en objetivos y/o hiptesis. Se desarrolla un plan para lograr los objetivos y/o las probar estas hiptesis, midiendo las variables en un determinado contexto. Con frecuencia en la metodologa
cuantitativa se hace uso de la estadstica para el anlisis de las mediciones obtenidas y a partir de ah se es tablece conclusiones respecto a las hiptesis formuladas.
La tcnica ms destacada del enfoque cuantitativo es la encuesta, que consiste en la obtencin de informacin relativa a un tema, problema o situacin determinada. La encuesta es un mtodo de investigacin compatible con el empleo de varias tcnicas e instrumentos de recoleccin de datos, como son: la entrevista, el
cuestionario, la observacin, el test, etc. Adems es importante resaltar que es la tcnica que se emplea frecuentemente en los trabajos de grados, tesis. Se realiza mediante la aplicacin de cuestionarios orales o
escritos.
El cuestionario se ha convertido pues, para muchos investigadores, en una herramienta de investigacin fcil de usar, popular y con resultados directos. Sin embargo, se debe advertir sobre los peligros a los que
puede llevar su empleo indiscriminado, pues no todos los que la usan tienen un conocimiento suficiente para
explotarla adecuadamente convirtindose entonces en un medio poco fiable para obtener una informacin
representativa.
Problemas ms usuales en los cuestionarios1
Preguntas con alto grado de ambigedad.
Mala estructuracin de las preguntas.
Mala secuenciacin de las preguntas.
Cuestionarios con excesivo nmero de tems.
Cuestionarios elaborados sin pruebas de validacin - piloto
Utilizacin errnea de escalas de medida.
Errores en la codificacin de las preguntas.
1

VI Jornadas Espaolas de Documentacin

Fases de la encuesta y del diseo de preguntas en un cuestionario

Reglas bsicas para la elaboracin del cuestionario

Si se quieren respuestas concretas las preguntas deben ser concretas.


No deben hacerse preguntas que contengan potencialmente las respuestas.
Las preguntas que admiten varias respuestas deben ser definidas cuidadosamente.
El nmero de categoras de las respuestas es tambin muy importante. Raramente son necesarias ms
de 5 7 categoras en preguntas de actitud o de opinin. Cuando sean necesarias ms categoras, es
preferible desglosar la pregunta en varias con menos categoras cada una.
Las preguntas deben ser neutrales. No deben incorporar juicios, opiniones o valoraciones.
El encuestado no debe esforzarse en recordar ante lo que conviene facilitar su memoria.

Magster Agustina Subelda Coronel

19

Estadstica aplicada a la
Educacin

El orden del cuestionario deber ser lgico. Las preguntas deben hacerse por temas afines y en orden
de dificultad creciente. Las preguntas ms sencillas han de ir al principio del cuestionario.
El orden de las preguntas no debe afectar a las respuestas.
Se ha de explicitar el recorrido del cuestionario, que ha de depender del tipo preguntas, de las respues tas a las preguntas, etc.; teniendo como finalidad indicar cundo se deben efectuar las preguntas, en
qu orden, y otra informacin semejante.

Ejemplo 8

Magster Agustina Subelda Coronel

20

Estadstica aplicada a la
Educacin

UNIDAD 3 - POBLACIN Y MUESTRA


POBLACIN O UNIVERSO, est referido a cualquier coleccin finita o infinita de elementos que interesan a un estudio y poseen alguna caracterstica comn observable y pueden ser personas, instituciones,
objetos, familias, animales y otras unidades ms complejas. Toda poblacin tiene N elementos y una mues tra de n elementos, donde n < N.
Ejemplo 9:
Las instituciones de una zona
Las instituciones de un departamento
Los jvenes de una carrera
Los estudiantes de un postgrado
Los docentes de una universidad

MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos selec cionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.

PRINCIPALES TIPOS DE MUESTRAS


No-probabilstica: En este tipo de muestreo no hay modo alguno de evaluar estadsticamente los resultados
obtenidos a partir de la muestra. Se utiliza mucho debido a su comodidad y bajo costo.
Casual o accidentales: consisten simplemente en tomar los casos casuales hasta alcanzar un cierto tamao de la muestra. Generalmente son los muestreos que se utilizan en los sondeos. Por ej. Se incluirn en la muestra las primeras 100 personas que pasen por una esquina.
Por cuotas:1 es aquel en que se busca garantizar la seleccin de elementos pertenecientes a los diferentes estratos que conforman la poblacin y que dichos elementos puedan ser tenidos en cuenta en las
mismas proporciones que ocurren en esa poblacin. Por ejemplo, se quiere conocer las opiniones de los
nios de EEB y se supone que las mismas variarn de acuerdo a las edades, entonces sera convenien te hacer una estratificacin por grupo etario.
Probabilsticas: En las muestras probabilsticas o aleatorias requiere que todos los elementos de una poblacin tengan una probabilidad conocida de ser seleccionados.
Azar simple: es la muestra donde todos los elementos de la poblacin tienen la misma probabilidad de
resultar seleccionados. El requisito fundamental es tener un listado completo de los elementos de la poblacin, por lo que en la prctica se torna difcil trabajar con poblaciones grandes.
Sistemtica: Se trata de un procedimiento de muestreo que simplifica la seleccin de las unidades. Tambin se requiere de un listado completo de los elementos de la poblacin, que debern ser numeradas
correlativamente.
El procedimiento es el siguiente:
1. Determinar el tamao de la poblacin (N)
2. Determinar el tamao de la muestra (n).
3. Establecer la fraccin de muestreo f

N
n

4. Seleccionar un solo nmero al azar, que corresponder a la primera unidad seleccionada.


5. A la primera unidad seleccionada se le suma la fraccin de muestreo y se procede sucesivamente
hasta completar la muestra.
Estratificada: Este tipo de muestreo se hace en base a determinadas variables que se consideran perti nentes para la estratificacin de la poblacin. La diferencia con respecto a la muestra por cuotas es el
1

Segn Denis Baranger, Construccin y anlisis de datos

Magster Agustina Subelda Coronel

21

Estadstica aplicada a la
Educacin
hecho de que la seleccin de las unidades se realiza al azar y adems que es apta para realizar cual quier tipo de inferencia estadstica.
Por Conglomerados (clusters) y en etapas mltiples: Este tipo de diseo se utiliza en general para reducir los costos de recoleccin de datos, sin embargo, hay que tener en cuenta que aumenta el grado de
error a diferencia del muestreo estratificado. En la mayora de los casos se utiliza cuando no se cuenta
con un listado de todos los elementos de la poblacin.
Los conglomerados son unidades de un mismo tamao, es en cierto modo una estrategia opuesta a la
del muestreo estratificado, ya que en una muestra estratificada, los casos se seleccionan dentro de
cada estrato, en cambio, en este tipo de muestra se selecciona entre los conglomerados; correlativamente, as como se busca que los estratos sean lo ms homogneos posible internamente, para los conglomerados cuanto ms heterogneos sean mejor ser el resultado.
La tcnica por conglomerados se integra en diseos de muestra en etapas mltiples; muestras que su ponen la definicin de unidades de muestreo en diferentes niveles.

TAMAO DE LA MUESTRA
Uno de los aspectos a concretar en las fases previas de la investigacin, es el tamao de la muestra.
En estadstica, el tamao de la muestra es el nmero de sujetos o elementos que componen la muestra extrada de una poblacin, necesarios para que los resultados obtenidos sean representativos de la
poblacin, vlidos y confiables.
Determinar el tamao adecuado para una muestra es una eleccin crucial, por todas las consecuencias negativas que puede producir una equivocacin, representa una parte esencial del mtodo cientfico para po der llevar a cabo una investigacin. El tamao de la muestra, generalmente, se determina en funcin a los
objetivos del estudio y las caractersticas de la poblacin, as como de los recursos disponibles (costo, tiem po, entre otros).
En este sentido, es importante definir el alcance de la investigacin de manera a determinar el tipo de mues tra a ser empleado (no probabilsticos -dirigidos o intencionales- o probabilsticos). La muestras dirigidas
(intencionales) o no probabilsticas, generalmente son utilizadas en los estudios exploratorios (aunque
tambin puedan ser utilizados muestras probabilsticas) e investigaciones experimentales (debido a que
los experimentos requieren de manejos de grupos no muy grandes, donde la validez externa se consolida
mediante la repeticin o reproduccin del estudio). Mientras que en aquellos estudios que requieren ser expandidos a una poblacin, como los no experimentales descriptivos o correlacionales-causales se deben utilizar las muestras probabilsticas.

Determinacin de la muestra probabilstica


En caso que se desee determinar el tamao de la muestra para encuestas, sondeos de mercadotecnia y estudios de investigacin, se recurre a la determinacin del tamao de la muestra probabilstica, segn la apli cacin de las siguientes frmulas.

(*) Donde deben ser considerados los siguientes elementos de la inferencia estadstica:
n0: Cantidad terica de elementos de la muestra. Tambin sirve para el caso en que la poblacin en estudio no sea finita.
n: Cantidad real de elementos de la muestra a partir de la poblacin asumida o de los estratos asumidos
en la poblacin.
N: Nmero total de elementos que conforman la poblacin, o nmero de estratos totales de la poblacin.
z: Valor estandarizado en funcin del grado de confiabilidad de la muestra calculada. Por ejemplo, si
consideramos trabajar con un 95 % de confiabilidad la muestra seleccionada, entonces el valor estandaMagster Agustina Subelda Coronel

22

Estadstica aplicada a la
Educacin
rizado asumir es igual a 1.96 (Para dos colas). Algunos valores estandarizados (z) en funcin de grado
de confiabilidad asumido (para dos colas):
99 % ------------- z = 2,58 (Empleado con frecuencia)
97.5%------------ z = 2,24
95 % ------------- z = 1,96 (El ms empleado)
90 % ------------- z = 1,64
85%--------------- z = 1,44
80%--------------- z = 1,28
: Error asumido en el clculo. Toda expresin que se calcula contiene un error de clculo debido a las
aproximaciones decimales que surgen en la divisin por decimales, error en la seleccin de la muestra,
entre otras, por lo que este error se puede asumir entre un 1 hasta un 10 %; es decir, que se asume en
valores de probabilidad correspondiente entre un 0.01 hasta un 0.1:

Para 3 N 10 --------------------- Se asume = 0.1 (un error del 10 %).

Para N > 10 --------------------- Se asume = 0.05 (un error del 5 %).


q: probabilidad de la poblacin que no presenta las caractersticas. Parmetro mediante el cual se
asume qu por ciento o proporcin de la muestra no puede presentar las mismas caractersticas de la
poblacin, debido a diversos factores subjetivos y objetivos de los individuos u objetos que conforman la
poblacin. Muchos autores plantean esta probabilidad entre un 1 hasta un 25 %, otros asumen, cuando
no se conoce esta variable asumir el valor mximo de 50 %. A continuacin se propone la siguiente tabla:
Para 3 N 19 ------- Se asume q = 0,01 (un 1 %).
Para 20 N 29 ------ Se asume q = 0,01 hasta 0,02 (del 1 al 2 %).
Para 30 N 79 ----- Se asume q = 0,02 hasta 0,05 (del 2 al 5 %).
Para 80 N 159 ---- Se asume q = 0,05 hasta 0,10 (del 5 al 10 %).
Para N 160 --------- Se asume q = 0,05 hasta 0,20 (del 5 al 20 %).
p: Probabilidad de la poblacin que presenta las caractersticas. Es la probabilidad que tiene la muestra en poseer las mismas cualidades de la poblacin (homogeneidad) y est determinada por:
Como p + q = 1 (Probabilidad mxima) p = 1 q
En caso de no contar con la informacin respecto a p y q se recomienda el uso de l valor p = 0,5 (50%)
que maximiza el tamao muestral. Asimismo, a decir de Ritchey F, 2001, una norma tradicional para determinar las muestras para encuestas, sondeos de mercadotecnia y estudios de investigacin, consiste en reportar los resultados con 95% de confianza y 3 por ciento de rango de error.
Ejemplo 10: Determinacin de tamao para una muestra probabilstica
La universidad se encuentra abocada en realizar una evaluacin del desempeo docente, para ello desea
consultar a los estudiantes. Debido al alto costo que podra ocasionar la aplicacin del instrumento a todos
los estudiantes y al escaso tiempo con que se cuenta, se recurre a una muestra que facilite informacin
adecuada, por lo que se debe tener en cuenta; p = 60%, q =40%, con un margen de error de 3% y con un
nivel de confianza de 99%. Determine el tamao de la muestra de estudiantes a ser utilizada para la evaluacin.
A continuacin se presenta la distribucin de alumnos por carrera de la Universidad.

Carrera
Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N

Magster Agustina Subelda Coronel

Cant. de alumnos
650
825
365
720
2.560

23

Estadstica aplicada a la
Educacin
N 2.560
z 2,58........ para..99%..nivel.de.confianza
3% 0,03
p 60% 0,6
q 40% 0,4

Clculo de la cantidad terica de elementos de la muestra


2

a 2,58 a
aza
2
n0 a a . p.q a
a 0,6 0,4 86 ) 0,6 0,4 7.396 0,6 0,4 1.775,04
a a
a 0,03 a
Clculo de la cantidad real de elementos de la muestra a partir de la poblacin

n
1.775,04
1.775,04
1.775,04
n 0

1.048,23 1.048
n0
1.775,04 1 0,693375 1,693375
Tamao de la muestra de
1
1
2.560
N
estudiantes a ser utilizada para la evaluacin.
REPRESENTATIVIDAD DE LA MUESTRA
Uno de los primeros pasos en cualquier investigacin consiste en la determinacin del universo o poblacin,
si la poblacin que nos interesa es de gran tamao, podra resultar sumamente trabajoso obtener informa cin sobre todos sus elementos, en este caso se recurre a una muestra.
Para que la muestra sea representativa de la poblacin, esta debe ser seleccionada de modo tal de obtener la mxima aproximacin a los parmetros poblacionales. Uno de los mtodos para mejorar la calidad del
muestreo es la estratificacin de la poblacin.
La idea de representatividad tiene que ver con la posibilidad de que la muestra sea una rplica adecuada de
la poblacin en lo que hace a las variables relevantes. Al respecto, convendr tener en cuenta las siguientes
consideraciones:
1. Una muestra que sea representativa para determinados propsitos, puede no serlo para otros: no existe
la muestra representativa en s, para cualquier propsito.
2. Si bien existen procedimientos para evaluar la bondad de una muestra, no es la muestra en s la que es
representativa; ms bien nuestra creencia en su representatividad la que va a depender del plan de
muestreo utilizado para seleccionarla.
3. La representatividad de una muestra est dada en considerar que la misma fue extrada de una pobla cin con un determinado nivel de confianza (se trabaja preferiblemente con un 95 % de confianza o
ms), de asumir un determinado porcentaje en el error de clculo, que debe estar comprendido entre un
1 hasta un 10 % (0,01 hasta 0,10); y de considerar un adecuado porcentaje (desde un 1 hasta un 20 %)
en valores probabilsticos (0, 01 hasta 0, 2) de que la muestra no posee las caractersticas de la poblacin.

DISTRIBUCIN DEL TAMAO DE LA MUESTRA POR ESTRATOS (AFIJACIN PROPORCIONAL)


Una vez seleccionada la muestra total, el problema est en cmo proceder para distribuir sta de manera
equitativa o proporcional con relacin a cada estrato constituido. Esto se lleva a cabo mediante la aplicacin
Magster Agustina Subelda Coronel

24

Estadstica aplicada a la
Educacin
de la metodologa de la afijacin proporcional.
Para determinar el tamao de la muestra por afijacin proporcional se procede de la siguiente manera:
1.
2.
3.
4.

Se estratifica la poblacin de acuerdo a las determinadas variables que se consideran pertinentes.


Se calcula la proporcin por estrato
Se determina el tamao de la muestra
Se multiplica cada una de las proporciones de cada estrato por el tamao de la muestra.

Ejemplo 11: Distribucin del tamao de la muestra por estrato (Afijacin proporcional)
Teniendo en cuenta el resultado obtenido en el ejemplo anterior. Distribuir el tamao total de muestra igual a
1.048 estudiantes por carrera para realizar la evaluacin del desempeo docente.
A continuacin se presenta la distribucin de alumnos por carrera de la Universidad.
Cant. de Proporcin de alumnos por
alumnos
carrera
650
2.560 0,26
650
825
825 2.560 0,32
365
365 2.560 0,14
720
365 2.560 0,28
2.560
1

Carrera
Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N

Distribucin de la Muestra
0,26 1.048 272,48 273

0,32 1.048 335,36 335


0,14 1.048 146,72 147
0,28 1.048 293,44 293
Total de estudiantes para la muestra = n= 1.048

Los resultados indican que el instrumento de evaluacin ser aplicado a: 273 estudiantes de la carrera de
Informtica, 335 de Derecho, 147 de Ing. Comercial y 293 de Marketing, totalizando de esta manera una
muestra total de 1.048 estudiantes de la Universidad

EJERCICIOS DE APLICACIN 5
22. Se desea hacer un estudio para rescatar la percepcin de los alumnos acerca de la carrera de Educacin y para ello se requiere de una muestra representativa tanto del total de alumnos como por semes tres. Considerar para el clculo del tamao de la muestra; p=q=50%, con un margen de error de 4% y un
nivel de confianza de 95%.El siguiente cuadro presenta la distribucin de la matrcula de la carrera de
Educacin por semestre.
SEMESTRE
1
2
3
4
5
6
7
8
9
10

MATRCULA
AO 2011
188
151
141
122
103
85
80
75
70
60

23. Se realizar una encuesta a los docentes y para ello se requiere de una muestra en la que se tendr en
cuenta los siguientes criterios: p = q =50%, con un margen de error de 3% y con un nivel de confianza de
99%. Asimismo se requiere la muestra por carrera.
El siguiente cuadro presenta la distribucin de docentes por carreras de una determinada Universidad.

Carreras

Total

Informtica
Derecho
Magster Agustina Subelda Coronel

20
30
25

Estadstica aplicada a la
Educacin
Ing. Comercial
Marketing

25
12

24.La universidad se encuentra abocada en realizar una evaluacin del desempeo docente. Debido al alto
costo que podra ocasionar la aplicacin del instrumento a todos los alumnos, recurre a una muestra en
la que se debe tener en cuenta; p = 70%, q =30%, con un margen de error de 4% y con un nivel de con fianza de 99%. Cmo quedara distribuida dicha muestra por carrera?
El siguiente cuadro presenta la distribucin de alumnos del 2 curso por carrera.

Carrera

Cant. de alumnos

Informtica

133
127
119
126

Derecho
Ing. Comercial
Marketing

25. Un investigador se encuentra abocado en la tarea de realizar un estudio de percepcin de los estudiantes, para ello desea recurrir a una muestra del 25% del total de estudiantes, asimismo requiere que la
muestra este distribuida por promocin. El siguiente cuadro presenta la distribucin de alumnos de la li cenciatura de C. de la Educ. por promocin.
Promocin

Cant. de alumnos

Ao 1998/2000
Ao 1999/2001

78
87

Total

165

26. El siguiente cuadro presenta la distribucin de la matrcula de alumnos de la Educacin Superior en cuatro departamentos.
PARAGUAY. EDUCACIN SUPERIOR. MATRCULA EN CUATRO DEPARTAMENTOS. Ao: 2010
DEPARTAMENTO
Asuncin
Central
Alto Paran
Itapa

MATRCULA
5848
4343
1672
1329

a) Calcular el tamao de la muestra probabilstica para el total de matriculados de la Educ. Superior, te niendo en cuenta los siguientes criterios; p = 60%, q =40%, con un margen de error de 5% y con un
nivel de confianza de 95%. Cmo quedara distribuida dicha muestra por departamentos?
b) Por otro lado, de cuntos alumnos estara conformada la muestra, si se considera el 17% del total
de la matrcula? En este caso, Cuntos matriculados de Alto Paran debern ser seleccionados
para la muestra estratificada por departamento?
27. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad para determinar
la proporcin de jvenes que estara a favor de una nueva zona de ocio. El nmero de jvenes de dicha
poblacin es N=2.000. Determinar el tamao de muestra necesario para estimar la proporcin de estudiantes que estn a favor con un error de estimacin de 005 y un nivel de confianza del 95%

Magster Agustina Subelda Coronel

26

Estadstica aplicada a la
Educacin

UNIDAD 4 ORGANIZACIN Y PRESENTACIN DE DATOS


CONSTRUCCIN DE TABLAS DE FRECUENCIAS
TABLAS DE FRECUENCIA O DE DISTRIBUCIN, son tablas de trabajos estadsticos, que presentan la
distribucin de un conjunto de elementos de acuerdo a las categoras de la variable. En ellas se observa la
frecuencia o repeticin de cada uno de los valores de la variable, que se obtiene despus de realizar la operacin de tabulacin; las tablas presentan los diversos tipos de frecuencia (absoluta, relativas, etc.)
TIPOS DE FRECUENCIAS:
FRECUENCIA ABSOLUTA (fa): Es el nmero de veces que se repite un valor.
FRECUENCIA ABSOLUTA ACUMULADA (faa): en un punto determinado, es igual a las sumas de las frecuencias absolutas anteriores al punto.
FRECUENCIA RELATIVA o DISTRIBUCIN DE PROBABILIDADES (fr): Es el cociente entre la frecuencia
absoluta y el nmero total de casos (Fabs /n), siendo n el nmero total de casos.
FRECUENCIA RELATIVA ACUMULADA (fra): en un punto determinado, es igual a las sumas de las frecuencias relativas anteriores al punto.
DISTRIBUCIN DE FRECUENCIAS: Es una tabla que indica las distintas clases en que los datos se han
clasificado y la frecuencia de valores en cada clase.
La informacin estadstica se puede presentar en forma:
NO AGRUPADA: cuando no hay muchos datos.
Ejemplo 12:
Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica de 12 alumnos de
la carrera de Ciencias de la Educacin.
51
88

62
73

68
61

90
92

62
61

88
51

Ordena ya sea en forma ascendente o descendente los datos y halla las frecuencias.
FRECUENCIA FRECUENCIA
PUNTAJE
ABSOLUTA (fa) RELATIVA (fr)

51
61
62
68
73
88
90
92
TOTAL

2
2
2
1
1
2
1
1
12

16,7
16,7
16,7
8,3
8,3
16,7
8,3
8,3
100

FRECUENCIA
ABSOLUTA
ACUMULADA
faa

2
4
6
7
8
10
11
12

FRECUENCIA
RELATIVA ACUMULADA fra

16,7
33,4
50,1
58,4
66,7
83,4
91,7
100,0

Rango o Recorrido: En todo conjunto de valores de la variable Xi, es posible conocer el mximo y el mnimo valor de Xi, donde Xmax-Xmin constituye el rango o recorrido (R) de la variable.
R=Xmx Xmn

Magster Agustina Subelda Coronel

27

Estadstica aplicada a la
Educacin
Considerando el ejemplo anterior, se calcula el Rango
Xmx=92
Xmin=51
R=92-51=41
DATOS AGRUPADOS EN INTERVALOS: cuando hay muchos datos.
Ejemplo 13: Los datos siguientes corresponden a los puntajes obtenidos en un examen de matemtica
75
88
68
58

82
73
76
87

68
61
88
91

90
92
91
63

62
71
79
65

88
51
56
77

R=92-51=41
El recorrido se puede dividir en un nmero arbitrario de intervalos de clase (m) o pequeos segmentos.
S m = nmero de intervalos, entonces: la amplitud (c) o el tamao del intervalo est dado por:

ci

( R 1)
m

Para elegir un nmero arbitrario de intervalos se calcula R+1 y se verifica si este resultado es mltiplo de
algn nmero, como por ejemplo R+1=41+1=42. El 42 es mltiplo de 2, 3, 6, 7, 14, es decir, que el nmero
arbitrario de intervalos (m) a ser elegido puede ser cualquiera de esos divisores.
Se considera a m=6 como el nmero arbitrario, entonces, la amplitud o el tamao del intervalo (c) ser:

41 1 42

7
6
6

Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92

El intervalo contiene a:
51, 52, 53, 54, 55, 56, 57
58, 59, 60, 61, 62, 63, 64
65, 66, 67, 68, 69, 70, 71
72, 73, 74, 75, 76, 77, 78
79, 80, 81, 82, 83, 84, 85
86, 87, 88, 89, 90, 91, 92

Cada intervalo de clase tiene: Lmite inferior y un lmite superior; es el menor y el valor que delimita un inter valo de clase.
Intervalo de clase Lmite inferior
51 - 57
51

Lmite superior
57

Los intervalos pueden ser:


Cerrado: cuando incluyen los extremos del mismo.
Intervalo de clase Cerrado
51 - 57
Incluye a 51 y 57
Abierto: cuando se excluyen los extremos del mismo.
Intervalo de clase Abierto
(51 - 57)
No incluye a 51 y 57
Magster Agustina Subelda Coronel

28

Estadstica aplicada a la
Educacin
Cerrado y abierto: cuando incluye el lmite inferior y excluye el lmite superior.
Intervalo de clase Cerrado y Abierto
51 - 57)
Incluye a 51 y no incluye a 57
Abierto y cerrado: cuando excluye el lmite inferior e incluye el lmite superior
Intervalo de clase Abierto y cerrado
(51 - 57
No incluye a 51 e incluye a 57
El punto medio de cada intervalo se llama marca de clase y se denota por yi
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92

yi Marca de clase
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89

Mtodo general para hallar la distribucin de frecuencias para datos agrupados en intervalos
1) Determina el valor mximo y el mnimo entre todos los datos registrados y as calcular el RANGO: es el
valor mximo menos el valor mnimo.
2) Divide el rango en un nmero arbitrario (m) de INTERVALO DE CLASE del mismo tamao.
3) Halla la MARCA DE CLASE.
4) Determina el nmero de observaciones que cae dentro de cada intervalo de clase, es decir, encontrar la
frecuencia de clase, mediante un conteo de los datos.
Ejemplo 14: Agrupa utilizando los datos del ejemplo anterior. Considera m=7 para el tamao de intervalo
PUNTAJE
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
TOTAL

Marca de clase
yi
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89

FRECUENCIA ABSOLUTA (fa)

2
4
4
4
2
8
24

FRECUENCIA RELATIVA
(fr)

FRECUENCIA
ABSOLUTA
ACUMULADA
faa

8,3
16,7
16,7
16,7
8,3
33,3
100

FRECUENCIA RELATIVA ACUMULADA fra

2
6
10
14
16
24

16,7
25,0
41,7
58,4
66,7
100,0

EJERCICIOS DE APLICACIN 6
28. Los datos siguientes corresponden a los puntajes obtenidos en un examen.
75
87
74
62
93
78
82
75
94
77
69
74
a) Construye una tabla de frecuencias para datos agrupados en intervalos (fa, fr, faa y fra)
29. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica.
75
82
68
90
62
88
73
61
93
71
75
87
74
62
93
a) Construye una tabla de frecuencias (fa, fr, faa y fra)
Magster Agustina Subelda Coronel

88
51
78
29

Estadstica aplicada a la
Educacin
30. En la siguiente tabla se registran los pesos (en Kilogramos) de 30 estudiantes de la carrera de Informtica. Considera nmero de intervalos igual a 6.
48
59
56
aa

50
61
61

47
60
64

52
48
70

60
70
69

61
68
55

50
69
54

47
55
60

47
53
55

51
70
60

Construye una tabla de frecuencias (fa, fr, faa y fra) b) analiza los resultados

31. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemtica I.
75
82
68
90
62
88
75
87
74
62
93
78
89
61
75
95
60
79
95
94
78
85
76
65
73
67
88
78
62
76
73
81
72
63
76
75
a) Construye una tabla de frecuencias (fa, fr, faa y fra). Analiza los resultados
32. Las remuneraciones mensuales (en dlares) de 80 maestros de una institucin, son los siguientes:
260
120
255
175
115
145
135
153

190
215
233
190
205
185
160
178

130
230
190
140
125
145
145
164

135
235
160
220
140
230
222
173

220
230
170
185
155
170
170
156

155
265
130
195
170
220
195
170

225
120
105
125
190
165
210
182

230
91
217
92
190
288
135
190

93
115
95
240
233
95
180
177

180
185
190
140
185
120
173
210

a) Considerando el nmero de intervalos igual a 10. Construye una tabla de frecuencias (fa, fr, faa y fra)
33. Considerando el siguiente cuadro:
PUNTAJES

GRUPO A

GRUPO B

51 60
61 70
71 80
81 90
91 - 100

20
18
15
15
12
15
10
5
8
7
65
60
a) Construye una tabla de frecuencias (faa, fr y fra) para ambos grupos
34. El siguiente cuadro contiene los puntajes de un examen de Matemticas de dos secciones del Primer
Semestre:
PUNTAJE

Seccin A

20 34
35 49
50 64
65 79
80 94

Seccin B

5
8
5
12
10
40

10
15
8
15
8
56

a) Construye una tabla de frecuencias (faa, fr y fra) para ambos grupos


b) Compara los grupos A y B.

Magster Agustina Subelda Coronel

30

Estadstica aplicada a la
Educacin

ELABORACIN DE CUADROS ESTADSTICOS


CUADROS ESTADSTICOS; es el arreglo ordenado, columnas y filas, de datos estadsticos o caractersticas
relacionadas, con el objeto de ofrecer informacin estadstica de fcil lectura, comparacin e interpretacin y
ser autoexplicativos.
En un cuadro de dos variables o de doble entrada, se distinguen una Variable Principal colocada en forma
horizontal y una Variable Secundaria colocada en forma vertical. No es la nica forma de presentar datos,
pero es la ms recomendable, si lo permite la naturaleza de las variables. Para diferenciar las variables prin cipal y secundaria, en el ttulo del cuadro se antepone la palabra POR a la variable principal y SEGN a la
variable secundaria.
PARTES PRINCIPALES DE UN CUADRO ESTADSTICO
aa
aa
aa
aa
aa
aa
aa
aa

Nmero del cuadro.


Ttulo
Encabezamiento o conceptos.
Cuerpo
Nota de pie o llamadas
Fuente
Nota de unidad de medidas
Elaboracin

Ejemplo 15: Cuadro 9

Cuadro 10

PARAGUAY. EDUCACIN INICIAL.


MATRCULA SEGN SECTOR. AO 1996

PARAGUAY. EDUCACIN INICIAL.


MATRCULA POR SEXO, SEGN SECTOR. AO 1996

SECTOR TOTAL

SECTOR

Oficial
Privado
Total

65,2
34,8
100,0

Oficial
Privado
Total

55.231
29.433
84.664

Fuente. MEC. Anuario Estadstico. Ao 1996


Elaboracin. Direccin..........

SEXO
Mujeres

30.377
15.600
45.977

Hombres

24.854
13.833
38.687

TOTAL
55.231
29.433
84.664

Fuente. MEC. Anuario Estadstico. Ao 1996


Elaboracin. Direccin..........

EJERCICIOS DE APLICACIN 7
35. Elabora cuadros que correspondan a los siguientes ttulos:
a)
b)
c)
d)
e)

Educacin Superior: Matrcula por sector y zona, segn departamento y sexo.


Educacin Superior: Matrcula por semestre, segn zona y sexo.
Educacin Superior: Cargos docentes por zona y sector, segn nivel de formacin.
Educacin Superior: Matrcula por edad, segn sexo.
Educacin Superior: Cargos docentes por sexo, segn nivel de formacin del personal.

Magster Agustina Subelda Coronel

31

Estadstica aplicada a la
Educacin

CONSTRUCCIN DE GRFICOS ESTADSTICOS


Un grfico o diagrama es una representacin pictrica, de figuras geomtricas, de superficie o volumen, con
el objeto de ilustrar los cambios o dimensin de una variable, para comparar visualmente dos o ms varia bles similares o relacionadas.
Las cualidades esenciales del grfico son: simplicidad, claridad y veracidad. Los grficos de una sola varia ble sirven para fines comparativos de cantidades absolutas, tasas, proporciones, etc. Pueden tener la forma
de barras, superficies, puntos o lneas. Los grficos de dos variables, se construyen en el plano rectangular
o de coordenadas cartesianas, donde hay dos ejes, X e Y. En el eje Y (ordenada) se colocan los valores de
la variable independiente y en X (abscisa) la variable independiente, siendo y = f(x).
PRINCIPALES PARTES DE UN GRFICO
1) TTULO, como en los cuadros, es una descripcin del contenido del grfico debe indicar claramente la
naturaleza del fenmeno representando.
2) DIAGRAMAS, est dado por el propio dibujo del grfico, y como en el cuerpo del grfico, estn representados los datos indicados en el ttulo.
3) ESCALAS Y/O LEYENDAS, son indicaciones donde se precisa la correspondencia entre los elementos
del grfico y la naturaleza de las medidas representadas.
4) FUENTE de los datos estadsticos representados.
PRINCIPALES TIPOS DE GRFICOS
HISTOGRAMA:
Es el grfico utilizado en las distribuciones agrupadas en clases o intervalos, construido con barras verticales
que no guardan separacin entre ellas. Para construirlo se marcan en el eje x (abscisa) los intervalos (las
clases) y en el eje y (ordenada) las frecuencias (absolutas o relativas). Sobre cada intervalo se dibuja una
barra proporcional a su frecuencia.

GRFICO N 1: CANT. DE ALUMNOS SEGN PUNTAJE


PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

fa
5
8
5
12
10
12

12

11
10

fa

10

9
8

7
6
5

4
3
2
1
0
20 - 34

35 - 49

50 - 64

65 - 79

80 - 94

PUNTAJE
FUENTE: Universidad XX
ELABORACIN: Universidad XX. Facultad XX. Dpto Est

Magster Agustina Subelda Coronel

32

Estadstica aplicada a la
Educacin
POLGONO DE FRECUENCIAS
Para construirlo se calculan los puntos medios (marca de clase) de los intervalos, se levanta un segmento de
altura igual a la respectiva frecuencia (absoluta o relativa), luego se unen los extremos con una lnea poligo nal.
PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

MARCA
DE CLASE

fa

27
42
57
72
87

5
8
5
12
10

GRFICO 2: ALUMNOS SEGN PUNTAJE MEDIO

fa

12
11
10
9
8
7
6
5
4
3
2
1
0

12
10
8

12

27

42

57

72

87

102

PUNTAJE MEDIO
FUENTE: INST. XX.
ELABORACIN: ......

OJIVAS
Para representar las frecuencias acumuladas (absolutas o relativas) se utilizan las Ojivas o polgonos acumulativos de frecuencias. Se construye ubicando los extremos de los intervalos en el eje x y en el eje y
el valor de las frecuencias acumuladas. En el extremo superior de cada intervalo se levanta un segmento de
altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se
une, con segmentos de recta, los extremos de los segmentos verticales, obteniendo una lnea poligonal que,
partir de la ltima frecuencia acumulada, se extiende paralelamente al eje horizontal.

PUNTAJE

20 - 34
35 - 49
50 - 64
65 - 79
80 - 94

GRFICO 3: FRECUENCIA ACUM ULATIV A SEGN PUNTAJE

MARCA
DE CLASE

fa

27
42
57
72
87

5
8
5
12
10

faa
5
13
18
30
40

fa a
40

40

35

30

30

25

20
18

15
13

10

0
20

34

35

49

50

64

65

79

80

94

PUNTAJE
FUENTE: INST. X X .
ELA B ORA CIN: ......

Magster Agustina Subelda Coronel

33

Estadstica aplicada a la
Educacin
LINEAS
Este tipo de grfico relaciona variables entre s (variable dependiente y variables independientes).
Un grfico que muestre la distribucin de una variable en funcin del tiempo se llama

GRFICO DE SUCESIN

EN EL TIEMPO.

G R A F IC O 4 : E V O L U C I N D E L A M A T
U N IV E R S IT A R IA . P E R IO D O 2 0 0 3 - 2 0 0 7
16 0 0 0 0
15 8 0 0 0

M a t r ic u la

15 6 0 0 0
15 4 0 0 0
15 2 0 0 0
15 0 0 0 0
14 8 0 0 0
14 6 0 0 0
14 4 0 0 0

2003

2004

2005

2006

2007

AOS

FUENTE: INST.AO 2003-2007

BARRAS
El grfico de barra (o diagrama de barras) se puede representar en forma vertical u horizontal. El ancho de
las barras debe ser constante y pueden ser de cualquier tamao, mientras que las barras no se sobrepongan. Este tipo de grfico se usa para representar variables relacionadas entre s
BARRAS VERTICALES
S el grfico corresponde al de barra vertical, entonces, las categoras de la variable independiente son re gistradas horizontalmente y sobre ellas son levantadas columnas de alturas correspondientes a la variable
dependiente (frecuencia).
BARRAS HORIZONTALES
Se diferencia de las barras verticales por la posicin entre la variable y la frecuencia. Las variables pueden
ser ordenadas en forma creciente o decreciente de acuerdo a la frecuencia o alguna otra clasificacin.

G R F IC O N 5 : E D U C A C I N S U P E R IO R .
DES ER T O R ES S EG N DEP A RT A M ENT O .
A O 2006

G R A F IC O 6 : D E S E R C I N U N IV E R S IT A R IA P O R
C A RR ERA . A O 2007
C omer cial

7.000

A r quitec tur a

6.000
5.000

Inf or mtica

4.000
3.000

D er echo

2.000
1. 0 0 0

D is eo

0
DE PART AM ENT O

10

15

20

25

30

D e s e r c i n

FUENTE: INST.

Magster Agustina Subelda Coronel

34

Estadstica aplicada a la
Educacin
BARRAS COMPUESTAS
Este tipo de grfico sirve para representar un fenmeno dividido en categoras que a su vez se dividen en
subcategoras. Para su elaboracin se utilizan generalmente, cifras absolutas y no relativas.
Las barras pueden estar en posicin vertical u horizontal.
G R F IC O N 7 : E D U C A C I N S U P E R IO R .
M A T R C U L A P O R A O , S E G N S E C T O R

16 7 . 2 6 2

18 0 . 0 0 0

M A T R C U L A

16 0 . 0 0 0

14 9 .7 19
13 0 . 9 7 9

14 0 . 0 0 0
12 0 . 0 0 0
10 0 . 0 0 0
8 0 .0 0 0
3 5 .9 15

6 0 .0 0 0

4 5 .3 9 4

3 9 .0 3 9

4 0 .0 0 0
2 0 .0 0 0
0
19 9 1

19 9 2

19 9 3

AO
P b lic o

P r iv a d o

FUENTE: MEC. ANUARIO 1993

GRFICO DE PILAS
Se utiliza para comparar categoras o subcategoras de una variable, es decir, ilustra las partes en un todo.
Se construye sobre una escala de frecuencia relativa (de cero a cien).

FUENTE: XXXXX

CIRCULAR O DE SECTORES
Se utiliza para demostrar una proporcin de un todo y solamente cuando la variable est dividida en pocas
categoras, en caso contrario pierde su principal cualidad que es la legibilidad.
Para construir un grfico circular se calculan los ngulos repartiendo 360 en partes directamente proporcionales a cada una de las frecuencias, que pueden ser cifras absolutas o relativas.

Magster Agustina Subelda Coronel

35

Estadstica aplicada a la
Educacin

Fuente:

EJERCICIOS DE APLICACIN 8
36. En el cuadro se cuenta con la siguiente distribucin de alumnos por estatura:
ESTATURA (cm)
111 120
121 130
131 140
141 150
151 160
161 170
171 - 180

%
5,1
7,8
9,5
9,6
12,7
48,7
6,6

a) Construye un histograma para la distribucin de alumnos por estatura


b) Construye un polgono de frecuencias para la distribucin de alumnos por estatura
c) Construye una ojiva con las frecuencias absolutas acumuladas
37. El siguiente cuadro contiene la distribucin de alumnos por peso:
PESO (Kg)
15 - 21
22 - 28
29 - 35
36 - 42
43 - 49

fa
3
5
7
4
3

a) Construye un histograma para la distribucin de alumnos por peso


b) Construye un polgono de frecuencias para la distribucin de alumnos por peso
c) Construye una ojiva con las frecuencias absolutas acumuladas
38. El siguiente cuadro indica el nmero total de Instituciones y su distribucin por SECTOR, durante el perodo 1996 2000.
SECTOR
OFICIAL
PRIVADO
2006
35
25
2007
36
28
2008
45
29
2009
48
35
2010
50
38
A partir de la informacin proporcionada construye:
a) Un grfico de lneas por sector
AO

TOTAL

Magster Agustina Subelda Coronel

36

Estadstica aplicada a la
Educacin
b) Un grfico de lneas de la distribucin total de instituciones
39. El siguiente cuadro presenta la distribucin de alumnos del 2 semestre por carrera.

CARRERA

Total de
alumnos

Ing. Comercial
Derecho
Ing. Informtica
Marketing
Total

33
27
19
26
105

Fuente: XXXXX
Elaboracin: XXXX

a) A partir de la informacin proporcionada construye grficos que se adecuen a las caractersticas de


las mismas.
40. El siguiente cuadro presenta la opinin de egresados profesionales: Egresados profesionales segn opinin con respecto a la malla curricular. Ao 2007
El diseo curricular implementado para
su formacin profesional responde
Al perfil profesional docente que se necesita
actualmente.
A las necesidades acadmicas de la modalidad.
A las expectativas sociales sobre la intervencin del docente en la sociedad.
A las exigencias del mercado profesional de
nuestro pas.

Totalmente Parcialmente

No responde

28,6

65,3

6,1

16,7

72,9

10,4

26,5

63,3

10,2

32,7

53,1

14,3

Fuente: xxxxx
Elaboracin:

a) A partir de la informacin proporcionada construye grficos que se adecuen a las caractersticas de


las mismas.
41. El siguiente cuadro se presenta:
La formacin recibida en la Universidad le permite realizar una buena gestin en el mbito
Administrativo
Acadmico
Comunitario
Financiero

44,9
95,9
61,2
26,5

Fuente: xxxxx
Elaboracin

a) A partir de la informacin proporcionada construye grficos que se adecuen a las caractersticas de


las mismas.

Magster Agustina Subelda Coronel

37

Estadstica aplicada a la
Educacin

UNIDAD 5 - ANLISIS DE DATOS


ESTADSTICAS DESCRIPTIVAS
MEDIDAS DE CENTRALIZACIN
Son estadgrafos que describen la posicin que ocupa una distribucin de frecuencia alrededor de un valor
de la variable, es decir los valores observados se agrupan alrededor de cierto valor central o valor medio.
Las medidas de centralizacin de uso ms frecuente son: la media aritmtica (promedio), la mediana, las
cuartilas, las decilas, los percentiles y la moda.
DATOS NO AGRUPADOS
Media aritmtica; comnmente se lo conoce como promedio, se define y calcula dividiendo la suma de los
valores de la variable entre el nmero de observaciones o valores.
n

x x 2 x 3 ....... x n
X 1
n

Suma de valores de la variable


X
Nmero de valores

X i 1
n

Mediana (Me); una vez ordenados los datos, para calcular la mediana se toma como referencia el valor de
(n+1)/2 para los datos no agrupados.
b.
c.

Se ordenan los datos


Calcular (n+1)/2, que determina el lugar o posicin donde estar ubicado el valor de la mediana; y si se
tiene como datos un nmero:
Impar, la mediana es igual al valor del trmino central.
Par; la mediana es igual al promedio de los dos valores centrales.

Moda (Mo); es el valor ms frecuente para una variable, es decir, al que le corresponde mayor frecuencia.
Ejemplo 16 Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin,
por 12 alumnos del primer semestre.
75
82
a)
b)
c)
d)

87
75

74
94

62
77

93
69

78
73

Cul es el puntaje mnimo y cul el mximo?


Cul es la media o el promedio de los puntajes obtenidos por los alumnos? Interpretar
Calcular la mediana de los puntajes obtenidos. Interpretar
Cul es el puntaje ms frecuente?

a) El puntaje mnimo es 62 y el mximo es 94.


b) El puntaje promedio est dado por:

75 87 74 62 93 78 82 75 94 77 69 73 939

78,25
12
12

Interpretacin: Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25
puntos
c) Para calcular la mediana (Me) se procede a:

Ordenar los datos (puede ser en forma ascendente o descendente)


62
77

69
78

Magster Agustina Subelda Coronel

73
82

74
87

75
93

75
94

38

Estadstica aplicada a la
Educacin

Calcular

Posicin de la mediana
Posicin
Puntos

1
62

2
69

3
73

4
74

n 1 13
6,5
2
2

5
75

6
75

7
77

8
78

9
82

10
87

11
93

12
94

75 77
76
2
Interpretacin: esto implica que aproximadamente el 50% de los estudiantes han obtenido hasta 76 puntos
La mediana est dada por Me

e) En cuanto al puntaje ms frecuente es 75, porque tiene mayor frecuencia, es decir 3.


DATOS AGRUPADOS- Tablas sin intervalo
Son aquellos que estn presentados en tablas de frecuencia.
Media o promedio ( Y );
m

Y n
i

Y i 1

Media aritmtica;
Mediana (Me);

b.

Determinar las frecuencias absolutas acumuladas Ni =faa


Calcular n/2:

Si n/2 no coincide con algn Ni, es decir el valor se encuentra entre dos valores de Ni:: N j 1

a.

n
Nj
2

entonces Me=Yj (siendo Yj el valor de la variable asociada a Nj)

Si n/2 coincide con algn Ni, o sea N j 1

n
1
N j , entonces Me Y j 1 Y j
2
2

Ejemplo 17: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica, por
30 alumnos de un curso de postgrado.
30
28
18
a)
b)
c)
d)

24
28
24

28
30
24

22
18
24

30
30
10

22
24
18

30
28
22

22
28
22

28
22
24

30
18
28

Agrupar los datos en una tabla de frecuencias


Cul es la media o el promedio de los puntajes obtenidos por los alumnos?
Calcular la mediana de los puntajes obtenidos. Interpretar
Cul es el puntaje ms frecuente?

Magster Agustina Subelda Coronel

39

Estadstica aplicada a la
Educacin
a) Tabla de frecuencias
Puntajes (Yi)
10
18
22
24
28
30

fa=ni
1
4
6
6
7
6
30

b) El puntaje promedio est dado por:


Puntajes (Yi)
10
18
22
24
28
30

30

Yi.ni
10x1=10
18x4=72
22x6=132
24x6=144
28x7=196
30x6=180

fa=ni
1
4
6
6
7
6

Y .n
i

734

10,1 18,4 22,6 24,6 28,7 30,6


734

24,47
30
30

El puntaje promedio de los alumnos es de 24,47 puntos.


c) Para calcular la mediana (Me) se procede a:

Determinar las frecuencias absolutas acumuladas Ni =faa

Calcular

n 30

15
2
2

Puntajes (Yi)

Yj-1
Yj

10
18
22
24
28
30
n=

fa=ni
1
4
6
6
7
6
30

faa=Ni
1
5
11 Nj-1
n
15
17 Nj
2
24
30

n
15 no coincide con ningn Ni, el valor se encuentra entre dos valores de Ni o sea:
2
n
11 15 N j 17 entonces Me Y 24 , es decir, existen 17 alumnos que tienen 24
2

Como

N j 1

puntos o menos.
d) En cuanto al puntaje ms frecuente es 28, porque tiene mayor frecuencia (7).

Magster Agustina Subelda Coronel

40

Estadstica aplicada a la
Educacin
Ejemplo 18: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica, por
30 alumnos de un curso de licenciatura.
30
28
18
a)
b)
c)
d)

23
28
23

28
30
23

22
18
23

30
30
10

22
24
18

30
28
22

22
28
22

28
22
24

30
18
28

Agrupar los datos en una tabla de frecuencias


Cul es la media o el promedio de los puntajes obtenidos por los alumnos?
Calcular la mediana de los puntajes obtenidos. Interpretar
Cul es el puntaje ms frecuente?

a)Tabla de frecuencias
Puntajes (Yi)
10
18
22
23
24
28
30

El puntaje promedio est dado por:

fa=ni
1
4
6
4
2
7
6

Puntajes (Yi)
10
18
22
23
24
28
30

30

30
Y

Yi.ni
10x1=10
18x4=72
22x6=132
23x4=92
24x2=48
28x7=196
30x6=180

fa=ni
1
4
6
4
2
7
6

Y .n
i

730

10,1 18,4 22,6 23,4 24,2 28,7 30,6


730

24,33
30
30

El puntaje medio de los alumnos es de 24,33 puntos.


c) Para calcular la mediana (Me) se procede a:

Determinar las frecuencias absolutas acumuladas Ni =faa

Calcular

n 30

15
2
2

Puntajes (Yi)
10
18
22
Yj-1 23
Yj 24
28
30
n=
Como

Me

fa=ni
1
4
6
4
2
7
6
30

n
15
2

faa=Ni
1
5
11
15 Nj-1
17 Nj
24
30

coincide

con

Ni,

n
15
2

entonces,

N j 1

n
15 N j 17
2

entonces

1
Y j 1 Y j ) 1 23 24) 23,5 , es decir,
2
2

Interpretacin: El 50% de los alumnos tienen puntajes iguales o menores que 23,5 puntos.
d) En cuanto al puntaje ms frecuente de los estudiantes es de 28 puntos, porque tiene mayor frecuencia (7).

Magster Agustina Subelda Coronel

41

Estadstica aplicada a la
Educacin

EJERCICIOS DE APLICACIN 9
42. Los puntajes obtenidos por un alumno en 5 exmenes parciales de estadstica son:
X1=13, X2=10, X3=14, X4=11, X5=10. CALCULA el puntaje promedio en estadstica obtenido por el
alumno, la mediana y la moda.
43. A continuacin se presenta, la matrcula por semestre de una Institucin de educacin superior:
AO

1
150
160
11

2006 - MATRICULA
2007 - MATRCULA
DESERTORES

a)
b)
c)
d)
e)
f)
g)
h)
i)

2
132
137
10

SEMESTRE
3
4
110
102
120
97
9
8

5
97
90
5

6
76
90
4

Cul es el promedio de alumnos matriculados del ao 2006?


Cul es la mediana de alumnos matriculados del ao 2006?
Cul es la moda de alumnos matriculados del ao 2006?
Cul es el promedio de alumnos matriculados del ao 2007?
Cul es la mediana de alumnos matriculados del ao 2007?
Cul es la moda de alumnos matriculados del ao 2007?
Cul es el promedio de alumnos desertores del ao 2007?
Cul es la mediana de alumnos desertores del ao 2007?
Cul es la moda de alumnos desertores del ao 2007?

44. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin.
75

87

74

62

93

78

75

82

75

94

77

69

93
78

74
74

a) Halla el puntaje promedio, el puntaje mediano y Cul es la nota ms frecuente?


45. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica.
75
88

82
73

68
61

90
93

62
71

88
51

82
75

77
69

75
87

74
62

a) Halla el puntaje promedio, el puntaje mediano y Cul es el puntaje ms frecuente?


46. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemtica III.
59

61

60

48

70

68

69

55

53

70

53

55

68

70

Halla el puntaje: promedio, mediana y el ms frecuente


47. El siguiente cuadro presenta: Educacin Superior. Instituciones por zona, segn sector. Ao 1997
Sector
Oficial
Privado

ZONA
Urbana
21
15

Rural
5
2

Fuente: xx
Elaboracin: xx

a) Cul es el promedio de instituciones por zona?


b) Cul es el promedio de instituciones por sector?
c) Interpreta el valor mediano de las instituciones

Magster Agustina Subelda Coronel

42

Estadstica aplicada a la
Educacin
48. Los datos siguientes corresponden a las edades de un grupo de jvenes de una institucin.
25

17

26

19

26

19

25

26

17

18

26

17

174
162

193
178

174
174

a) Halla la edad promedio,


b) la edad mediana. Interpreta
c) Cul es la edad ms frecuente?
49. Los datos siguientes corresponden a la talla en cms de un grupo de jvenes.
175
188
a)
b)
c)
d)

174
173

168
161

190
193

162
171

188
174

182
175

177
169

175
187

Halla la talla promedio,


la talla mediana y
Cul es la talla ms frecuente?
Interpreta la informacin

50. Las remuneraciones mensuales (en dlares) de 30 maestros de una institucin, son los siguientes:
260
120
255
a)
b)
c)
d)

190
215
250

130
230
190

135
250
160

220
230
170

155
250
130

225
120
105

230
100
217

103
115
105

250
185
190

Halla la remuneracin mensual promedio,


La remuneracin mensual mediana
Cul es la remuneracin mensual ms frecuente?
Interpreta la informacin

Magster Agustina Subelda Coronel

43

Estadstica aplicada a la
Educacin

MEDIDAS DE DISPERSIN
Son aquellos valores que nos dan una idea de cuan alejados estn unos datos de otros, es decir es neces ario tener una idea del grado de concentracin o dispersin de las observaciones alrededor de un valor central o de posicin.
Los estadgrafos de dispersin de mayor uso son:
Rango o recorrido: es un estadgrafo de dispersin muy limitado, pues slo considera los valores extremos
de la distribucin
DATOS NO AGRUPADOS
Desviacin media: o desviacin promedio de un conjunto de observaciones se define por
n

X
DM

donde X es la media aritmtica y

j 1

es el valor absoluto de las desviaciones

n
de Xj respecto a X .
Varianza: En la perspectiva de construir un indicador que dimensione la desviacin o distancia promedio de
los Xj respecto a X , se propuso elevar al cuadrado de la desviacin X j X a fin que sea siempre no negativa. De esta manera la varianza queda definida como:
n

V ( X ) s 2

X)

j 1

La varianza es el estadgrafo de dispersin ms importante, que asociado a

la media aritmtica se constituyen en los pilares fundamentales de la estadstica.


Desviacin tpica o estndar: es uno de los estadgrafos de mayor uso, en el cual las unidades de la variable ya no estn elevadas al cuadrado.

s s2
La desviacin estndar, al igual que la varianza; es no negativa, puesto que es la raz cuadrada positiva de
la varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
Interpretacin de la desviacin estndar

Si la desviacin estndar es ms grande que la media, esto probablemente indica un sesgo, es decir su giere que una o ms puntuaciones extremas inflaron la media y la desviacin estndar.
Si la desviacin estndar no es de la mitad de tamao de la media o menos, se debe tener en cuidado al
examinar la distribucin para analizar la posible existencia de sesgos o valores extremos.

Coeficiente de variacin (CV): Es una medida de variacin RELATIVA, mide el grado de dispersin de un
conjunto de datos en relacin con su media. Uno de sus usos ms comunes es para expresar la desviacin
estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado
de variabilidad que la desviacin tpica o estndar. Todos los valores deben ser positivos y su media de por
tanto un valor positivo. El CV pierde utilidad cuando la media se aproxima a cero
Es til para comparar la dispersin de conjunto de datos que tienen distintas desviaciones estndar y distintos promedios.
Interpretacin del coeficiente de variacin
s

CV __ .100
X

Magster Agustina Subelda Coronel

26% o ms Muy Heterogneo


16% a 25% Heterogneo
11% a 15% Homogneo
0% a 10% Muy Homogneo
44

Estadstica aplicada a la
Educacin
Ejemplo 19: Usando los datos correspondientes al ejemplo 16.
62

69

73

74

75

75

77

78

82

87

93

94

Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25 puntos
a) Calcula la desviacin media de los puntajes obtenidos.
b) Calcula la varianza y la desviacin tpica o estndar.
c) Calcula el coeficiente de variacin
d) Interpreta los resultados
a) Calcula la desviacin media de los puntajes obtenidos.
n

Aplicando la frmula:

DM

DM

X
DM

j 1

, se tiene

62 78,25 69 78,25 73 78,25 74 78,25 2. 75 78,25 77 78,25 78 78, 25 82 78


12

16,25 9,25 5,25 4,25 2 * 3,25 1,25 0,25 3,75 8,75 14,75 15,75
86

7,1666 7,2
12
12

Interpretacin: Lo que significa que la distancia media entre cada uno de los valores y el valor central es de
7,2 puntos
b) Calcula la varianza y la desviacin tpica o estndar.
n

Aplicando la frmula para el clculo de la varianza:

s2
s2

62

V ( X ) s 2

X)

j 1

n
2

78,25) 69 78,25) 73 78,25) 74 78,25) 2. 75 78,25) 2 77 78,25) 2 78 78,25) 2 8


12

16,25) 2 9,25) 2 5,25) 2 4,25) 2 2.3,25) 2 1,25) 2 0,25) 2 3,75) 2 8,75) 2 14,75) 2 15,75) 2

12
264,0625 85,5625 27,5625 18,0625 21,125 1,5625 0,0625 14,0625 76,5625 217,5625 248
s2
12
s 2 81,19

La varianza es de 81,19 puntos


Para el clculo de la desviacin tpica o estndar, se aplica la siguiente frmula: s s 2
s

81,19 9,01

El valor de la desviacin tpica o estndar es de 9,01 puntos


c) Calcula el coeficiente de variacin e Interpreta los resultado
Se aplica la frmula
CV

s
CV __ .100 , reemplazando por los valores se tiene:
X

9,01
.100 11,515 11,52%
78,25

Magster Agustina Subelda Coronel

El coeficiente de variacin indica que la desviacin


tpica o estndar representa el 11,52% del valor de
la media de puntos. Lo que significa que los puntajes de los estudiantes son homogneos
45

Estadstica aplicada a la
Educacin

EJERCICIOS DE APLICACIN 10
51. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemtica I, por 12
alumnos del primer curso.
75
a)
b)
c)
d)
e)

87

74

62

93

78

82

75

94

77

69

73

Cul es rango de los datos? Interpreta


Cul es desviacin media? Interpreta
Cul es la varianza y la desviacin estndar?
Calcula el coeficiente de variacin
Interpreta los resultados

52. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin.
75

87

74

62

93

78

75

82

75

94

77

69

93
78

74
74

68

70

a) Cul es rango de los datos?


b) Cul es desviacin media?
c) Cul es la varianza y la desviacin estndar? Interpreta
53. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica.
75
88

82
73

68
61

90
93

62
71

88
51

82
75

77
69

75
87

74
62

a) Cul es rango de los datos?


b) Cul es desviacin media?
c) Cul es la varianza y la desviacin estndar? Interpreta
54. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Romano I.
59
a)
b)
c)
d)
e)

61

60

48

70

68

69

55

53

70

53

55

Cul es rango de los datos?


Cul es desviacin media?
Cul es la varianza y la desviacin estndar? Interpreta
Calcula el coeficiente de variacin
Interpreta los resultados

55. Los datos siguientes corresponden a las edades de un grupo de jvenes de una institucin de educacin
superior.
25
a)
b)
c)
d)
e)

17

26

19

26

19

25

26

17

18

26

17

Cul es rango de las edades?


Cul es desviacin media de las edades?
Cul es la varianza y la desviacin estndar? Interpreta
Calcula el coeficiente de variacin
Interpreta los resultados

56. Los datos siguientes corresponden a la talla en cms de un grupo de jvenes que asisten a una institucin
de educacin superior.
175
188

174
173

168
161

Magster Agustina Subelda Coronel

190
193

162
171

188
174

182
175

177
169

175
187

174
162

193
178

174
174
46

Estadstica aplicada a la
Educacin
a)
b)
c)
d)
e)

Cul es rango de la talla?


Cul es desviacin media de la talla?
Cul es la varianza y la desviacin estndar? Interpreta
Calcula el coeficiente de variacin
Interpreta los resultados

57. Las remuneraciones mensuales (en dlares) de 30 docentes de una institucin, son los siguientes:
260
120
255
a)
b)
c)
d)
e)

190
215
250

130
230
190

135
250
160

220
230
170

155
250
130

225
120
105

230
100
217

103
115
105

250
185
190

Cul es rango de los datos?


Cul es desviacin media?
Cul es la varianza y la desviacin estndar? Interpreta
Calcula el coeficiente de variacin
Interpreta los resultados

Magster Agustina Subelda Coronel

47

Estadstica aplicada a la
Educacin

MEDIDAS DE ASOCIACIN
Son medidas que se usan para evaluar la asociacin entre un evento y un factor de estudio. Los tpicos estadsticos de asociacin son la correlacin y la regresin.
CORRELACIN: Expresa el grado y sentido de la variacin concomitante de dos o ms series de datos. Es
decir, analiza la relacin entre dos o ms variables, siempre que se tenga un indicio que entre ellas existe
por lo menos cierto grado de dependencia o asociacin.
Clasificacin
a Perfecta (r 1)
a
a Imperfecta (0 r 1; - 1 r 0)
a Nula (r 0)
a

Segn criterio cuantitativo

a Positiva
a (variacin de las series en el mismo sentido)
a
a
a Negativa
a
a (variacin en sentido contrario)

Segn criterio cualitativo


Diagramas de Dispersin

Los Diagramas de Dispersin o Grficos de Correlacin permiten estudiar la relacin entre 2 variables. Da das 2 variables X e Y, se dice que existe una correlacin entre ambas si cada vez que aumenta el valor de X
aumenta proporcionalmente el valor de Y (Correlacin positiva o directa) o si cada vez que aumenta el valor
de X disminuye en igual proporcin el valor de Y (Correlacin negativa o indirecta).
En un grfico de correlacin representamos cada par X, Y como un punto donde se cortan las coordenadas
de X e Y:
Grfico 1

Grfico 2

Como se observa en el grfico 1 ambas variables presentan una correlacin lineal positiva; es decir, a medi da que aumenta el valor de la variable Estatura aumenta tambin el valor de la variable Peso. Mientras que
en el grfico 2 se observa una relacin lineal negativa; es decir que a medida que aumentan los aos de es tudio, disminuye el nmero de hijos.
Se habla de correlacin lineal fuerte cuando la nube de puntos se parezca mucho a una recta y ser cada
vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.
Propiedades de r
1.
2.
3.

1 r 1

Si r>0, entonces existe correlacin directa positiva


Si r<0, entonces existe correlacin inversa negativa
Si r2=1, entonces existe correlacin rectilnea

Magster Agustina Subelda Coronel

48

Estadstica aplicada a la
Educacin
Interpretacin de r
1.
2.
3.
4.

0,00 r < 0,20


0,20 r < 0,40
0,40 r < 0,70
0,70 r < 1,00

existe correlacin no significativa (muy dbil)


existe una baja correlacin (dbil)
existe una significativa correlacin (considerable)
existe alto grado de asociacin (fuerte)

ALGUNOS COEFICIENTES DE CORRELACIN

rxy Pearson (dos variables de razn continuas)


rs Spearman (dos variables ordinales)
Lineal

rbp Biserial-Puntual (una variable continua y otra dicotmica)


rb Biserial (una variable continua y otra dicotomizada)

Distribuciones Bidemensionales

o Cuadruple (dos variables dicotmicas)


rt Tetracrico (dos variables dicotomizadas)

Curvilnea

Coeficiente ETA ()

FRMULAS DE LOS COEFICIENTES DE CORRELACIN

PEARSON:

rxy

n. X

rS 1

SPEARMAN

rb

CUADRUPLE:

TETRACRICO

6. D 2

X . Y
X ) . n .Y Y )
2

N. N 2 1

BISERIAL-PUNTUAL:

BISERIAL:

n. XY )

rbp

Xq
. pq
St

X q p.q
.
St
y

A.D ) B.C )
A B ). A C ). C D ). B D )

A.D
B.C

Magster Agustina Subelda Coronel

49

Estadstica aplicada a la
Educacin
Ejemplo 20: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

a) Representa la informacin en un diagrama de dispersin

b) Cul es el grado y el sentido de la relacin entre las variables velocidad lectora y comprensin lectora?
Como la velocidad lectora y comprensin lectora son variables continuas o de razn, para medir el grado
se utiliza el coeficiente r de Pearson. La frmula, para datos sin agrupar y a partir de puntuaciones directas
es:

rxy

n. X

n. XY )
2

X . Y
X ) .n .Y Y )
2

Para aplicar la frmula son necesarios los siguientes clculos previos:


1
2
X
69
68
Y
29
30
X.Y 2001 2040
X2
Y

3
4
5
38
50
57
10
21
24
380 1050 1368

6
33
11
363

4761 4624 1444 2500 3249 1089

841

X
X

900

100

441

576

121

8
38
8
304

144

64

35.245

9 10
39 22
7
5
273 110

11
12
13
20
37
62
3
6
28
60 222 1736

14
35
12
420

15
16
41
50
9
20
369 1000

17
43
16
688

18
19
751
2
253
38 12782

900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245

751
2

7
30
12
360

49

25

36

XY

253
2

784

4.975

144

81

400

256

4975

12.782

N=18

Sustituyendo estos valores en la frmula:

rxy

n. X

Obtenemos

n. XY )
2

X . Y
X ) . n .Y Y )
2

18.12782 751.253

18.35245 751) .18.4975 253)


2

40073
0,94
42406,56

rxy 0,94

Por tanto, la relacin entre X (velocidad lectora) e Y (comprensin lectora) es imperfecta positiva y alta
para la muestra, es decir que la relacin entre estas dos variables es significativa.

Magster Agustina Subelda Coronel

50

Estadstica aplicada a la
Educacin

EJERCICIOS DE APLICACIN 11
58. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institucin de educacin superior en los exmenes de Matemtica y Contabilidad.
Matemtica
Contabilidad

12
13

18
14

09
16

15
08

14
19

12
06

10
20

18
13

17
14

07
17

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Calcule el coeficiente de correlacin ms adecuado y razone su eleccin
c) Interprete el resultado del coeficiente obtenido.
59. Los datos siguientes corresponden a la estatura y el peso de 12 alumnos del curso de Estadstica
Estatura (cms)
Peso (Kg.)

170
72

168
65

186
82

160
58

168
63

155
65

162
58

168
70

170
69

165
62

182
76

156
60

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Cul es el grado y el sentido de la relacin, entre las variables; estatura y peso?
60. A 12 alumnos de un centro se les pregunt a qu distancia estaba su residencia del Instituto, con fin de
estudiar si esta variable estaba relacionada con la nota media obtenida. Se obtuvieron los datos que figuran en la siguiente tabla:
Distancia (en km)
Nota media

0,05
4,4

0,1
4

0,12
4,7

0,4
4,1

0,5
3,3

0,7
3,7

1
4,3

1,2
2,4

2,1
4,8

2,5
3,5

3
4,2

3
5

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Calcule el coeficiente de correlacin ms adecuado y razone su eleccin
c) Interprete el resultado del coeficiente obtenido.
61. El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida en el examen correspondiente, de ocho personas es:

Horas (X)

20

16

34

23

27

32

18

Calificacin (Y)

3.5

4.5

3.5

4.5

4.5

3.5

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Calcule el coeficiente de correlacin ms adecuado y razone su eleccin. Interprete.
62. Se quiere estudiar si existe relacin entre los resultados obtenidos en Estadstica 1 y el sexo de los estudiantes. Para ello usted debe utilizar el coeficiente de correlacin que considere adecuado e interpretar
dicho valor en vas de esclarecer el problema en estudio.
Sexo
Calificacin

M
13

Magster Agustina Subelda Coronel

F
09

F
19

M
15

M
14

F
08

M
07

F
14

F
17

F
11

M
15

F
08

F
20

M
15

51

Estadstica aplicada a la
Educacin
63. Se desea determinar el grado de asociacin entre el rendimiento acadmico de 100 estudiantes de la
Facultad de Ciencias respecto a la procedencia del sector del grupo de estudiantes seleccionados.
Rendimiento acadmico
Bueno
Regular
Malo
13
14
5
23
13
4
19
1
5

Sector
Oficial
Subvencionado
Privado

a) Aplique el coeficiente de correlacin adecuado y razone su eleccin. Interprete el resultado


64. Los datos siguientes corresponden a la madurez lectora y el nivel intelectual de 10 alumnos del 1er. Grado
Madurez lectora
Nivel intelectual

18
43

17
30

07
18

12
23

15
19

06
22

07
26

10
20

09
19

04
18

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Cul es el grado y el sentido de la relacin entre las variables madurez lectora y el nivel intelectual?
c) Interprete el resultado del coeficiente obtenido.
65. Los datos siguientes corresponden a nivel de vocabulario previo y el nivel intelectual de 10 alumnos del
1 G
Vocabulario previo
Nivel intelectual

28
43

27
30

14
18

23
23

24
19

14
22

14
26

18
20

14
19

10
18

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados.
b) Cul es el grado y el sentido de la relacin entre las variables nivel de vocabulario previo y el nivel
intelectual? Interprete el resultado del coeficiente obtenido
66. Los datos siguientes corresponden a la comprensin lectora y el nivel intelectual de 10 alumnos del 1er.
Grado
Comprensin lectora
Nivel intelectual

29
43

30
30

10
18

21
23

24
19

11
22

12
26

08
20

07
19

05
18

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Cul es el grado y el sentido de la relacin entre las variables nivel de vocabulario previo y el nivel
intelectual? Interprete el resultado del coeficiente obtenido
67. Los datos siguientes corresponden a la comprensin lectora y la memoria general de 10 alumnos del
1er. Grado.
Comprensin lectora
Memoria general

29
30

30
20

10
30

21
26

24
37

11
15

12
21

08
27

07
20

05
32

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados.
b) Cul es el grado y el sentido de la relacin entre las variables?

Magster Agustina Subelda Coronel

52

Estadstica aplicada a la
Educacin

REGRESIN LINEAL
La correlacin es til para medir si la relacin que existe entre las variables es aproximadamente lineal o no;
mientras que la regresin sirve para buscar la ecuacin matemtica que mejor describe la relacin entre las
variables, consiste en cuantificar la relacin que existe entre las variables con el fin de predecir cules sern
los valores de una variable cuando se conocen los valores de la otra.
El coeficiente de correlacin lineal determina si, efectivamente, existe relacin entre dos variables. Una
vez que se concluye la existencia de relacin, la regresin nos permite definir la recta que mejor se ajusta a
esta nube de puntos.

Y a bX

Una recta viene definida por la siguiente frmula:


Donde "Y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra variable "X"
(variable independiente). Para definir la recta hay que determinar los valores de los parmetros "a" y "b":
La regresin lineal permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se ajus ta a esta nube de puntos.
El parmetro "a" es el valor que toma la variable dependiente "Y", cuando la variable independiente "X" vale
0, y es el punto donde la recta cruza el eje vertical.
El parmetro "b" o coeficiente de regresin determina la pendiente de la recta, su grado de inclinacin.
Viene determinado por la siguiente frmula:
b

n. XY )
n X 2

X ). Y
X )
2

Donde; b = coeficiente de regresin (pendiente de la recta de regresin)

X = una variable independiente de nivel de intervalo/razn (u ordinal de tipo intervalo)


Y = una variable dependiente de nivel de intervalo/razn (u ordinal de tipo intervalo)
n = tamao de la muestra
Clculo del parmetro a;
a Y b X

Donde; a = interseccin del eje y


Y = promedio de la variable dependiente
X = promedio de la variable independiente
b = coeficiente de regresin
Ejemplo 21: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

Magster Agustina Subelda Coronel

53

Estadstica aplicada a la
Educacin

Grficamente se puede visualizar la existencia de una correlacin lineal positiva y alta para la muestra, es
decir que la relacin entre estas dos variables es significativa (vase ejemplo 20, donde rxy 0,94 ). Concluida la existencia de relacin entre ambas variables a travs del coeficiente de correlacin r Pearson, la regresin permite definir la recta que mejor se ajusta a esta nube de puntos.
La recta se define de la siguiente manera: Y = a + b X, donde X es la variable independiente (velocidad
lectora) e Y (comprensin lectora), los parmetros a y b se determinan de la siguiente manera;

n. XY )
n X 2

X ) Y )
Donde; b = coeficiente de regresin (pendiente de la recta de regre X )
2

sin)
X = una variable independiente de nivel de intervalo/razn u ordinal (Velocidad lectora)
Y = una variable dependiente de nivel de intervalo/razn u ordinal (Comprensin lectora)
n = tamao de la muestra
Para aplicar la frmula son necesarios los siguientes clculos previos:
1
2
X
69
68
Y
29
30
X.Y 2001 2040
X2

4
5
38
50
57
10
21
24
380 1050 1368

6
33
11
363

4761 4624 1444 2500 3249 1089

7
30
12
360

8
38
8
304

9
10 11 12
13
14
15
16
17 18
39 22 20
37
62
35
41
50
43 19
751
7
5
3
6
28
12
9
20
16
2
253
273 110 60 222 1736 420 369 1000 688 38 12782

900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245

X ) Y ) 190.003
X ) 564.001

XY 12.782
X 35.245

n=18
X 41.72

Y 18.06

Clculo del coeficiente de regresin b

n. XY )
n X 2

X ) Y ) 18 12782 190003 230076 190003 40073

0.57
18 * 35245 564001 634410 564001 70409
X )
2

Clculo del parmetro a o constante de la ecuacin de regresin;


a Y b X 18.06 0.57 41.72 18.06 23.7804 5.72

Sustituyendo estos valores en la frmula de la ecuacin de la recta de ajuste se tiene:

Y a bX 5.72 0.57 X , es decir


Magster Agustina Subelda Coronel

54

Estadstica aplicada a la
Educacin
Comprensin lectora = -5.72+0.57xVelocidad Lectora
Esta ecuacin de regresin puede usarse para calcular, la mejor estimacin de la Comprensin lectora (Y)
para cualquier valor de la Velocidad lectora (X). Sin embargo, esta asociacin debera ser validada mediante
pruebas de hiptesis adecuadas.

EJERCICIOS DE APLICACIN 12
68. Se busca establecer si hay relacin entre el puntaje de la parte terica del 1er parcial de Estadstica y la
parte prctica del mismo.
Terica
Prctica

2
2

2.5
1

1.5
2

1.5
1

3
4

2
3.5

3
5

2.5
1

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados.
b) Si un alumno obtuviera en teora 5 puntos Cunto se espera que obtenga en la parte prctica?
c) Un alumno que obtuvo una calificacin de 2,5 puntos en la prctica Cunto se espera que haya
obtenido en la parte terica?
69. Un investigador quiere conocer la asociacin entre el puntaje de razonamiento abstracto y el puntaje de
razonamiento espacial, en un grupo de 10 personas.
RA
RE

50
32

82
60

64
44

50
38

63
49

81
63

80
59

72
63

72
69

69
63

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados.
b) Determina la recta de regresin para las asociaciones significativas.
70. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institucin de educacin superior en los exmenes de Matemtica y Contabilidad.
Matemtica
Contabilidad
aa
aa

12
13

18
14

09
16

15
08

14
19

12
06

10
20

18
13

17
14

07
17

Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
Determina la recta de regresin para las asociaciones significativas.

71. Los datos siguientes corresponden a nivel de vocabulario previo y el nivel intelectual de 10 alumnos del
1 G
Vocabulario previo
Nivel intelectual

28
43

27
30

14
18

23
23

24
19

14
22

14
26

18
20

14
19

10
18

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Determina la recta de regresin para las asociaciones significativas.
72. Las notas de 10 alumnos en biologa y lenguaje
BIOLOGIA

LENGUAJE

10

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Determina la recta de regresin para las asociaciones significativas.
73. Las notas de 10 alumnos en Matemticas y en Lengua vienen dadas en la siguiente tabla:
Magster Agustina Subelda Coronel

55

Estadstica aplicada a la
Educacin
MATEMTICAS

LENGUA

10

a) Representa la informacin en un diagrama de dispersin y analiza a travs de ste la relacin entre


los resultados de los exmenes aplicados.
b) Determina la recta de regresin para las asociaciones significativas.

Magster Agustina Subelda Coronel

56

Estadstica aplicada a la
Educacin

INFERENCIAS ESTADSTICAS
PRUEBAS DE HIPTESIS
Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera.
Esto por su puesto sera impractico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hiptesis. La prueba de hiptesis estadstica cuantifica el proceso de toma de decisiones.
Formulacin de hiptesis en estudios cuantitativos con diferentes alcances
ALCANCE DEL ESTUDIO
Exploratorio
Descriptivo
Correlacional
Explicativo

(Hernndez S, 2004)

FORMULACIN DE HIPTESIS
No se formulan hiptesis
Slo se formulan hiptesis cuando se pronostica un hecho o dato
Se formula hiptesis correlacionales
Se formulan hiptesis causales

Hiptesis
La hiptesis constituye una prediccin sobre la relacin entre dos variables, que afirma que los cambios en
la medida de una variable independiente correspondern a los cambios en la medida de una variable dependiente.
Ejemplos
Las caractersticas del hogar asociados a la pobreza influyen en el logro educativo de los hijos en grados di ferentes por departamentos geogrficos
La oferta de carreras profesionales de la Universidad XX no satisface la demanda de formacin acadmica
profesional de los egresados de nivel medio.
El grado de instruccin acadmica influye en la probabilidad de abortar
Hiptesis estadstica; es aquella que se establece para ser rechazada o anulada, es decir es la hiptesis que
se quiere contrastar. Por ejemplo, si la hiptesis de investigacin propone: Los adolescentes le atribuyen
ms importancia al atractivo fsico en sus relaciones heterosexuales que las mujeres, la hiptesis estadstica postulara: Los jvenes no le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que las adolescentes.
Hiptesis alternativa; es la hiptesis que se acepta si la hiptesis estadstica es rechazada.

Grados de libertad
Los procedimientos estadsticos (instrumentos de medicin y tcnica) tienen limitaciones (distorsionan la in terpretacin de los datos) que repercuten potencialmente en la valoracin exacta de parmetros de poblacin. En este sentido, el trmino de grados de libertad se emplea para referirse a qu tan flexible es un pro cedimiento estadstico. Por lo que, mientras ms grados de libertad se tenga, mejor, porque los grados de li bertad son el nmero de oportunidades de muestreo para compensar las limitaciones, distorsiones y debilidades potenciales en los procedimientos estadsticos. (Ritchey, 2001)

Tipos de error y nivel de significancia


Si rechazamos una hiptesis cuando debiera ser aceptada diremos que se ha cometido un error de tipo I.
Por otra parte si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error
de tipo II. En ambos casos se ha producido un juicio errneo.
Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los errores de deci sin, y no es una cuestin sencilla, por que para cualquier tamao de la muestra, un intento de disminuir un
tipo de error suele ir acompaado de un crecimiento del otro tipo. En la prctica un tipo de error puede ser
Magster Agustina Subelda Coronel

57

Estadstica aplicada a la
Educacin
ms grave que el otro, y debe alcanzarse un compromiso que disminuya el error ms grave, la nica forma
de disminuir ambos a la vez es aumentar el tamao de la muestra, que no siempre es posible.
Nivel de significancia o nivel de error de muestreo
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a correr el riesgo
de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por
, se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra eleccin.
En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros valores. Si, por
ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla de decisin entonces hay
unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hipte sis ha sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hiptesis tiene una probabilidad
del 5% de ser falsa.

Criterios para la seleccin de una prueba estadstica


Muchas veces nos preguntamos acerca de cules son las frmulas estadsticas correctas para un problema
particular. En este sentido, la tarea se vuelve ms fcil hacindonos las siguientes preguntas (Ritchey, 2001).
Cuntas variables estamos observando para esta prueba?
Cules son los niveles de medicin de las variables?, son variables nominales, ordinales o de
razn/intervalo?
Estamos tratando con una muestra representativa de una sola poblacin, o con ms?
Cul es el tamao de la muestra, y/o cuntos grados de libertad estn disponibles para la prueba?
Existen circunstancias peculiares a considerar?
Pruebas estadsticas, sus aplicaciones y frmulas
Nombre de
la prueba

Estadstico de la
prueba

Correlacin
lineal simple
y regresin

n 2
t r r
1 r2

Correlacin
rho de
Spearman
de rangos ordenados
Correlacin
gamma de
rangos ordenados
Prueba de
chi cuadrado
de asociacin

rs 1

N, tipo y nivel
de medicin
de las variables

Peculiaridades o
suposiciones

gl n 2

Dos variables de
intervalo / razn
u ordinales de
tipo intervalo

Las variables deben


relacionarse linealmente

n 10

Dos variables ordinales

Requiere pocos rangos empatados

No aplica

Dos variables ordinales

Tolera muchos rangos


empatados

gl ( f 1)(c 1)

Dos variables nominales /ordinales

Requiere al menos 5
casos por casilla

6 D 2
n( n 2 1)

f f
f f
a
a

c 2

Tamao de la muestra/ grados de libertad

N de
muestras

O E )
E

i
i

ANLISIS DE CORRELACIN Y REGRESIN


El anlisis de correlacin y regresin (distribucin t, gl=n-2), a travs del coeficiente de correlacin r de
Pearson, se usa para comprobar una hiptesis de que existe relacin entre dos variables de intervalo/razn
u ordinales (una variable independiente X y una variable dependiente Y) cuando 2:
1. Se tiene una muestra representativa de una sola poblacin
2. Se tienen dos variables de de intervalo/razn u ordinales
2

Segn Ritchey, Ferris 2001

Magster Agustina Subelda Coronel

58

Estadstica aplicada a la
Educacin
3. No existe ninguna restriccin en el tamao de la muestra; pero generalmente cuanto ms grande sea n,
ser mejor
4. Un diagrama de dispersin de las coordenadas de las dos variables se ajusta a un patrn lineal
Lista de verificacin para los seis pasos de la inferencia estadstica (Ritchey, 2001)
Preparacin de la prueba
Formule la pregunta de investigacin; liste las especificaciones, incluso las variables (X; Y), sus niveles de
medicin, la(s) poblacin(es) bajo estudio, y la(s) muestra(s) y el (los) tamao(s) de la(s) muestra(s); seleccione la prueba estadstica; proporcione observaciones de estadsticos y parmetros; y trace un diagrama
conceptual.
Seis pasos
Empleando el smbolo H para hiptesis
1. Enuncie la H estadstica y la H alternativa
El enunciado de la hiptesis estadstica es H est : 0 , es decir no existe relacin entre las variables
Mientras que, el enunciado de la hiptesis alternativa depende del planteamiento de la pregunta de investigacin y pueden ser;
De dos colas, no direccional (es decir, 0 ; existe una relacin)
Una cola en la direccin negativa (es decir, 0 ; existe una relacin negativa)
Una cola en la direccin positiva (es decir, 0 ; existe una relacin positiva)
2. Describa la distribucin muestral
Se describe la distribucin a ser utilizada, en este caso la distribucin t aproximadamente normal, los
gl n 2 . Si H est : 0 es verdadera y repetidamente se extraen muestras de tamao n de la poblacin en estudio, las r de las muestras se centrarn alrededor de cero con un error estndar inversamente
relacionado con el tamao de la muestra (es decir, a mayor tamao de la muestra menor ser el error
estndar3)
3. Determine el nivel de significancia ( a ) y especifique el valor crtico de la prueba.
Frecuentemente se utiliza un nivel de confianza de 95%, al que le corresponde un nivel de significancia
de 5% (0.05), si bien se usan otros valores. Lo que significa, que hay unas cinco oportunidades entre
cien de rechazar la hiptesis cuando debiera haberse aceptado (error tipo I); es decir, tenemos un 95%
de confianza de que se ha adoptado la decisin correcta.
El valor crtico se determina a partir de la tabla de la distribucin t (ver anexo), se obtiene la t a ; valores
crticos de t para los niveles de significancia y los grados de libertad especificados.
4. Observe los resultados de la muestra en cuestin y calcule los efectos de la prueba, el estadstico de la
prueba y el valor p.
El estadstico de la prueba utilizado es t r r
donde

n 2
. Con gl n 2
1 r2

t r = la prueba t para el coeficiente de correlacin r de Pearson


r = coeficiente de correlacin r de Pearson calculado en una muestra
n = tamao de la muestra

gl = grados de libertad
5. Tome la decisin de rechazo
La H est : 0 se rechaza cuando t r ta

, as

p<0.05.

La ley de los grandes nmeros sostiene que, para una distribucin muestral de medias, cuanto mayor sea el tamao de la
muestra n, menor ser el error estndar.
Magster Agustina Subelda Coronel

59

Estadstica aplicada a la
Educacin
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin

Existencia : describiendo la existencia de la relacin entre variables


Direccin : que puede ser positiva o negativa, se determina por el signo de r y b
Fuerza
: es la proporcin de la variacin en Y explicada por X, sabiendo que se relacionan y se
mide con r 2 x100 .
Naturaleza : En este punto se interpreta la pendiente de la lnea de regresin b.

Ejemplo 22: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a

10

11

12

13

14

15

16

17

18

Velocidad lectora
(X)

69

68

38

50

57

33

30

38

39

22

20

37

62

35

41

50

43

19

Comprensin lectora (Y)

29

30

10

21

24

11

12

08

07

05

03

06

28

12

09

20

16

02

Preparacin para la prueba


Tanto el diagrama de dispersin como los datos de coeficiente de correlacin rxy 0,94 y regresin sugieren una relacin lineal. Sin embargo, el patrn lineal de la muestra tan slo puede ser el resultado del error
de muestreo.
Pregunta de investigacin : Existe una relacin entre la velocidad lectora y la comprensin lectora en los nios del 1 G?
Especificaciones

: Variables; X = velocidad lectora, Y = comprensin lectora, ambas son variables


de intervalo/razn.
Poblacin
: nios del 1 G.
Muestra
: 18 nios
Procedimiento estadstico : la prueba t para la significancia del coeficiente de correlacin r de Pearson, distribucin t nos permite probar la hiptesis planteada.
Observaciones
: el diagrama de dispersin sugiere una relacin lineal; los datos y clculos son
rxy 0,94
Y a bX 5.72 0.57 X n=18.
En el siguiente diagrama conceptual se visualiza la pregunta de investigacin.

Poblacin: Nios de 1
grado
X = velocidad lectora
Y= comprensin lectora
Es ?

Muestra: 18 nios
del 1 grado
r=0.94

Donde rho ( ) es el coeficiente de correlacin que se obtendra si el coeficiente de correlacin de Pearson


se calculara para la poblacin entera.
Seis pasos
1. Enuncie la H estadstica y la H alternativa

H est : 0 . Es decir, no existe relacin entre la velocidad lectora y la comprensin lectora


Magster Agustina Subelda Coronel

60

Estadstica aplicada a la
Educacin

H alt : 0 . Es decir, existe una relacin positiva entre la velocidad lectora y la comprensin lectora. De
una cola
2. Describa la distribucin muestral
La distribucin t aproximadamente normal, con gl n 2 18 2 16 . Si H est : 0 es verdadera y
repetidamente se extraen muestras de tamao 18 de la poblacin de nios de 1 grado, las r de las
muestras se centrarn alrededor de cero con un error estndar inversamente relacionado con el tamao
de la muestra.
3. Determine el nivel de significancia ( a ) y especifique el valor crtico de la prueba.
Se define a 0.05 , (en este caso se supone que si la hiptesis es rechazada tiene una probabilidad del
5% de ser falsa) de una cola.
El valor crtico para a 0.05
4. Observacin

gl 16 , es t a 1.746

El diagrama de dispersin revela una relacin lineal, r=0.94. n=18


Efecto de la prueba = 0.94 (es decir, efecto = r 0.94 0 0.94 )
El estadstico de la prueba

n 2
18 2
16
16
0.94
0.94
0.94
0.94 137.46 0.94 11.724
2
2
1 0.8836
0.1164
1 r
1 0.94
t r 11.02 Error Estndar
t r r

5. Tome la decisin de rechazo


Como t r 11 .74 ta 1.746 , as p<0.05, entonces la H est : 0 se rechaza y se acepta la

H alt : 0 , es decir que existe una relacin positiva entre la velocidad lectora y la comprensin lecto ra.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin
Existencia : existe una relacin positiva entre la velocidad lectora (VI) y la (VD) comprensin lectora
en los nios del 1 grado
Direccin

: la relacin es positiva, ya que r =0.94 y b=0.57 son positivos.

Fuerza

: r 2 0.94 2 100 0.8836 100 88.36 % de la variacin de la comprensin lectora


se explica por la velocidad lectora en los nios del 1 grado.

Naturaleza : siendo b=0.57 puntos en la comprensin lectora por punto en la velocidad lectora, es
decir, un aumento de un punto en la velocidad lectora se relaciona con un aumento de
0.57 en la comprensin lectora.
A partir de este anlisis se puede concluir que la comprensin lectora puede explicarse por la velocidad lectora, de esta manera la mejor estimacin de la relacin en la poblacin est dada por;

Y a bX 5.72 0.57 X , es decir Comprensin lectora = -5.72+0.57xVelocidad Lectora


EJERCICIOS DE APLICACIN 13
74. Se busca establecer si hay relacin entre el puntaje de la parte terica del 1er parcial de Estadstica y la
parte prctica del mismo.
Terica

2.5

Magster Agustina Subelda Coronel

1.5

1.5

2.5

61

Estadstica aplicada a la
Educacin
Prctica

3.5

a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelos.
75. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente intelectual (CI en
puntos), depende del nmero de hermanos. Toma una muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la siguiente tabla;
CI
N hermanos

110
0

115
1

120
1

118
1

110
2

108
2

105
2

104
3

98
3

99
4

98
4

100
5

90
5

93
5

90
6

aa

Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.

aa

Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX

aa

Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.

76. Un investigador quiere conocer la asociacin entre el puntaje de razonamiento abstracto y el puntaje de
razonamiento espacial, en un grupo de 10 personas.
RA
RE

50
32

82
60

64
44

50
38

63
49

81
63

80
59

72
63

72
69

69
63

a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
77. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institucin de educacin superior en los exmenes de Matemtica y Contabilidad.
Matemtica
Contabilidad

12
13

18
14

09
16

15
08

14
19

12
06

10
20

18
13

17
14

07
17

a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
78. El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida en el examen correspondiente, de ocho personas es:
Horas (X)
Calificacin (Y)

20
3.5

16
3

34
4.5

23
3.5

27
4.5

32
4.5

18
3.5

22
4.8

a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.

Magster Agustina Subelda Coronel

62

Estadstica aplicada a la
Educacin
ANEXO

Magster Agustina Subelda Coronel

63

Estadstica aplicada a la
Educacin
BIBLIOGRAFA

vila Acosta, Roberto. Estadstica Elemental Con 300 problemas resueltos (1996). Lima Per:
Nueva Edicin, Estudios y Ediciones R.

vila Acosta, Roberto. Introduccin a la Metodologa de la Investigacin La tesis Profesional Gua para elaborar la tesis - Aplicaciones y Ejemplos (1997). Lima Per: Estudios y Ediciones
R.A,

Baranger. Construccin y anlisis de datos Introduccin al uso de tcnicas cuantitativas en la


Investigacin Social (1992). Argentina: Edit. Universitaria.

Hernndez Sampieri, R., Fernndez, C. y Baptista P. Metodologa de la Investigacin (2008). Mxico: Mc Graw-Hill.

Lebart, L., Morineau, A. y Fnelon JP. Tratamiento Estadstico de Datos - Mtodos y Programas
(1994). - Marcombo, Boixareu.

Levin, Richard. ESTADISTICA PARA ADMINISTRADORES. 7a. edicin. Editorial Prentice Hall Hispanoamericana, Pgs. 93-107

Montgomery, H W. Probabilidad y Estadstica para Ingeniera y Administracin (1995). Mxico:


Cia. Editorial Continental S.A 3ra. Edicin.

Murria y Spiegel. Probabilidad y Estadstica (1975). Mxico: Mc Graw-Hill.

Ritchey, Ferris J.. Estadstica para las Ciencias Sociales. (2001). Mxico: Mc Graw-Hill

Magster Agustina Subelda Coronel

64

Вам также может понравиться