Академический Документы
Профессиональный Документы
Культура Документы
Educacin
ESTADSTICA APLICADA A LA
EDUCACIN
Algn
Algn da el pensamiento estadstico ser nenecesario como la habilidad para leer o escribir
(H.G. Wells)
AO 2014
Magster Agustina Subelda Coronel
Estadstica aplicada a la
Educacin
INDICE
UNIDAD I
Metodologa cuantitativa................................................................................................................................ 4
Caractersticas de la metodologa cuantitativa............................................................................................ 4
Fases de la investigacin cuantitativa......................................................................................................... .4
Definicin del tema de investigacin.......................................................................................................... 4
Planteamiento del problema...................................................................................................................... 5
Objetivos del estudio................................................................................................................................. 5
Justificacin del estudio............................................................................................................................. 5
Revisin de la literatura marco terico.................................................................................................... 6
Diseo metodolgico................................................................................................................................ 6
Bibliografa................................................................................................................................................. 6
Cronograma de trabajo.............................................................................................................................. 7
UNIDAD II
INTRODUCCIN A LA ESTADSTICA
Concepto de la estadstica............................................................................................................................. 8
Importancia de la estadstica ........................................................................................................................ 8
Funciones de la estadstica........................................................................................................................... 8
Nomenclatura estadstica.............................................................................................................................. 9
Elementos bsicos de la estadstica.............................................................................................................. 10
Elaboracin de matriz tripartita de datos....................................................................................................... 10
Ejercicios de aplicacin 1........................................................................................................................... 10
Variables........................................................................................................................................................ 11
Categoras de las variables......................................................................................................................... 11
Clasificacin de las variables....................................................................................................................... 11
Ejercicios de aplicacin 2............................................................................................................................. 12
Construccin de indicadores.......................................................................................................................... 14
Razn, relacin............................................................................................................................................ 14
Proporcin, porcentaje................................................................................................................................. 14
Ejercicios de aplicacin 3............................................................................................................................ 15
ndice, crecimiento....................................................................................................................................... 17
Ejercicios de aplicacin 4............................................................................................................................ 17
Tcnicas de recoleccin de datos cuantitativos............................................................................................. 19
Cuestionario................................................................................................................................................. 19
Problemas ms usuales en los cuestionarios............................................................................................. 19
Fases y diseo de preguntas de un cuestionario........................................................................................ 19
UNIDAD III
POBLACIN Y MUESTRA
UNIDAD 4
Estadstica aplicada a la
Educacin
UNIDAD 5
ANLISIS DE DATOS
Estadsticas descriptivas............................................................................................................................... 38
Medidas de centralizacin (media, mediana y moda)..................................................................................38
Ejercicios de aplicacin 9............................................................................................................................ 42
Medidas de dispersin (rango, desviacin media, varianza, desviacin estndar, CV)...............................44
Ejercicios de aplicacin 10.......................................................................................................................... 46
Medidas de asociacin (correlacin, regresin)...........................................................................................48
Ejercicios de aplicacin 11.......................................................................................................................... 53
Ejercicios de aplicacin 12.......................................................................................................................... 55
Inferencias estadsticas................................................................................................................................. 57
Pruebas de hiptesis..................................................................................................................................... 57
Ejercicios de aplicacin 13.......................................................................................................................... 61
ANEXOS........................................................................................................................................................ 63
BIBLIOGRAFA.............................................................................................................................................. 64
Estadstica aplicada a la
Educacin
Estadstica aplicada a la
Educacin
Es importante sealar en el diseo los principales elementos tericos sobre los cuales se
pretende desarrollar la investigacin.
Metodolgico: Hace mencin al uso de metodologas y tcnicas especficas que han de servir de aporte
para el estudio de problemas.
Prctico:
Se manifiestan en el inters del investigador por acrecentar sus conocimientos, obtener un ttulo acadmico o contribuir a la solucin de problemas concretos.
Estadstica aplicada a la
Educacin
En la investigacin que se va a realizar se debe tomar en cuenta el conocimiento ya existente sobre el tema.
Se atiende lo que los diferentes autores ya escribieron sobre el tema. Con esto se fundamenta tericamente
el trabajo de investigacin.
Su funcin es definir el significado de los trminos (lenguaje tcnico) que se van a emplear durante el proceso de construccin del conocimiento en la investigacin.
Se realiza una definicin operacional de los conceptos fundamentales del estudio.
Por sobre todas las cosas se debe explicar exactamente el alcance de cada una de las palabras o frases
que van a definir el mbito del trabajo de investigacin.
BIBLIOGRAFA
Se debe tener en cuenta toda la documentacin bibliogrfica que se ha consultado en el proceso de elabora cin de la investigacin.
La presentacin del mismo se realiza teniendo en cuenta los reglamentos o normativas vigentes.
Estadstica aplicada a la
Educacin
CRONOGRAMA DE TRABAJO
Considera las diferentes etapas del proyecto y el tiempo estimado para cada una de ellas.
Para el mismo se utiliza la Grfica de Gantt, que es la representacin grfica de las variables actividades de
las etapas de investigacin y tiempo de ejecucin (pueden ser en das, semanas, meses, ao)
Estadstica aplicada a la
Educacin
Permite comprender la bibliografa especializada (libros, estudios e investigaciones) basados en el anlisis estadstico.
Ayuda a desarrollar una investigacin rigurosa, ofreciendo fundamentos lgicos en los que se sustenta la
investigacin bsica y aplicada.
Estadstica aplicada a la
Educacin
NOMENCLATURA ESTADSTICA
ESTADISTICAS, sinnimo de datos estadsticos, servir para designar a toda coleccin sistemtica de datos
referentes a un determinado fenmeno.
ESTADSTICO, es la persona que se dedica al estudio de la Estadstica, es el profesional que analiza esta dsticas, desarrolla mtodos y modelos estadsticos y contribuye a la evolucin de la ciencia estadstica. (Roberto B. vila Acosta)
ESTADGRAFO es el trmino utilizado para designar a la persona dedicada a las tareas propias de la estadstica, aunque en ocasiones tambin es frecuente que se utilice para designar a la variable que define una
distribucin estadstica, de esta forma es comn escuchar el trmino estadgrafo de prueba.
mx.answers.yahoo.com/question, smathdown.blogspot.com
ESTADGRAFO es una caracterstica descriptiva global de una muestra .Es la medida de una caracterstica
relativa a una muestra. La mayora de los estadsticos mustrales se encuentran por medio de una frmula y
suelen asignrseles nombres simblicos que son letras latinas.
http://virtual.uav.edu.mx/tmp/2611217572402.doc
DATO, es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la
observacin, entrevista o recopilacin en general. Los datos son la materia prima de la Estadstica.
INFORMACION, es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay informacin
sin datos.
VARIABLE, Son caractersticas o dimensiones observables, susceptibles de adoptar distintos valores o ser
expresados en varias categoras, tales como edad, ingresos, matrcula, Instituciones, lugar de nacimiento,
ahorros, etc.. Las variables se definen e identifican en funcin de los objetivos del estudio.
INDICADORES, son elementos caractersticos que describen una situacin permitiendo su anlisis. Son re ferentes empricos que permiten una medicin, descripcin, ordenamiento de los datos o caractersticas en
forma vlida y confiable. La validez y confiabilidad del indicador depende de la validez de los datos utiliza dos y de la lgica de su relacin o construccin. En este sentido, los llamados ndices, tasas, estadgrafos,
medidas de resumen, etc., son indicadores.
POBLACIN O UNIVERSO, est referido a cualquier coleccin finito o infinito de elementos que interesan a
un estudio y poseen alguna caracterstica comn observable y pueden ser personas, instituciones, objetos,
familias, animales y otras unidades ms complejas. Toda poblacin tiene N elementos y una muestra de n
elementos, donde n<N.
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos seleccionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.
PARAMETRO, es un valor obtenido para describir en forma resumida las caractersticas pertinentes o ms
importantes acerca de una poblacin. Son las medidas de resumen de una poblacin. Una poblacin puede tener muchas caractersticas y por tanto muchos parmetros.
ESTADIGRAFO, datos empricos que se usa con fines descriptivos o analticos; son medidas de resumen
estadstico de un conjunto de datos. Las medidas de resumen de una muestra se llamarn estadgrafos.
Ejemplo, la media aritmtica, mediana, varianza, coeficiente de correlacin, etc.
CENSO, consiste en un recuento de todos los elementos en una poblacin y/o una especificacin de las dis tribuciones de sus caractersticas, basados en la informacin obtenida para cada uno de los elementos.
ENCUESTA, consiste en la obtencin de datos de inters sociolgico mediante la interrogacin a los miembros de la sociedad. Permite obtener informaciones sobre un amplio abanico de cuestiones a la vez y no
slo sobre un aspecto o problema definido.
UNIDAD DE ANLISIS, es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre los
cuales se va a obtener datos. La unidad de anlisis no es el fenmeno investigado sino el que genera el fe nmeno y proporciona datos concretos.
Magster Agustina Subelda Coronel
Estadstica aplicada a la
Educacin
01
02
03
04
05
06
07
08
09
10
11
12
VARIABLES
Edad
Sexo
48
37
28
36
25
38
45
37
48
41
50
35
F
F
F
M
F
F
M
M
F
F
F
F
Estado Civil
Casada
Casada
Casada
Casado
Soltera
Casada
Viudo
Divorciado
Soltera
Casada
Viuda
Separada
Fuente Universidad XXX. Facultad de Postgrado.
Elaboracin: Maestra en Educacin
N de hijos
Aos de servicio
4
3
1
3
3
0
2
5
3
5
1
2
21
15
6
15
5
18
25
16
25
17
24
13
EJERCICIOS DE APLICACIN 1
1. Establece poblaciones e identifica en l por lo menos tres variables (pueden ser del tipo nominal, ordinal,
razn o intervalar) que puedan ser estudiadas en las mismas. Elabora una matriz tripartita para cada poblacin con 20 unidades de anlisis.
10
Estadstica aplicada a la
Educacin
VARIABLES
Objeto, proceso o caracterstica que est presente, o supuestamente presente en el fenmeno medible que
un cientfico quiere estudiar, que vara (cambia) a travs del tiempo, o que difiere de un lugar a otro o de un
individuo a otro. Los objetos, procesos o caractersticas reciben el nombre de variables en la medida en que
su modificacin provoca una modificacin en otro objeto, proceso o caracterstica.
Ejemplo 2
Variable: Sexo
Categora
1. Femenino
2. Masculino
b) Variables cuantitativas
Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico. El dato o valor puede resultar de la operacin de contar o medir. Las variables cuantitativas pueden ser discretas y continuas.
Discreta; cuando el valor resulta de la operacin de contar, su valor est representado solo por nmeros
naturales. Ej. Cantidad de jvenes de una carrera, cantidad de docentes por carrera, cantidad de alumnos
en la institucin de educacin superior, cantidad de asignaturas por carrera, Hijos por familia, nmero de
accidentes por da, habitaciones por vivienda, etc.
Continua; cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Se expresa por cualquier nmero real. Ej. rea
de parcelas, ingresos monetarios, produccin de maz, peso de los alumnos, estatura de los alumnos,
tiempo de servicios, horas trabajadas de los docentes, etc.
SEGN LA ESCALA DE MEDICIN; Se presenta a continuacin las caractersticas bsicas de los cuatro niveles distinguidos por Stevens,
a) Variables nominales; Son aquellas que establecen la distincin de los elementos en diversas categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o ms categoras.
Ejemplos: sexo, estado civil, deportes que practica, profesiones, lugar de nacimiento, etc.
Magster Agustina Subelda Coronel
11
Estadstica aplicada a la
Educacin
b) Variables ordinales: Aquellas variables que implican orden entre sus categoras, pero no grados de
distancia iguales entre ellas; estn referidas a un orden o jerarqua, donde las categoras expresan una
posicin de orden. Ejemplo: grado de instruccin, clases sociales, grado de simpata, rango de agresividad, orden de mrito, nivel de dolor, nivel de preferencia, etc.
c) Variables de intervalo: Son aquellas que suponen a la vez orden y grados de distancia iguales entre
las diversas categoras, pero no tienen un origen natural, sino convencional. En este tipo de variables es
posible describir la informacin contenida en ellas calculando el promedio, desviacin Standard (DS) y
siempre debiera tambin incluirse en base a cuantos casos (o sea el n) tienen dichos resultados.
Ejemplos: coeficiente de inteligencia, temperatura, puntuacin obtenida en una escala, etc.
d) Variables de razn: tiene las caractersticas de la escala de intervalo, pero se agrega un punto cero
absoluto tal que significa ausencia del atributo y la razn o cociente de dos nmeros es significativo pu dindose aplicarles todo tipo de instrumental matemtico. El valor de estas variables se expresa con un
nmero real. Ejemplo: edad, peso, ingresos, nmero de hijos, produccin, accidentes de trnsito, etc.
Variables dependientes: Son aquellas que se explican por otras variables, son los efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razn de ser. Es la variable que traduce
la consecuencia del efecto de una o varias razones o causas de otras variables.
b)
Variables independientes: Son las variables explicativas o predictivas, cuya asociacin, relacin o
influencia en la variable dependiente se pretende descubrir en la investigacin. Las variables independientes (VI) son las que traducen o explican las causas o razones de las variaciones en la variable dependiente (VD). En la relacin de variables, las causas o antecedentes seran las VI y el efecto o conse cuente es la VD.
Ejemplo 3
1.
2.
3.
4.
5.
6.
7.
8.
EJERCICIOS DE APLICACIN 2
2. En qu escala de medida estn basadas las respuestas al siguiente cuestionario?
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.
Cul es su estatura?
Cul es su peso?
Cul es su ocupacin?
Cul es su nombre?
Cuntos aos tiene?
Tiempo empleado para comprar en la librera
Cantidad de dinero que se utiliza para adquirir libros
Nmero de materias en las que se inscribi
Cantidad de nios de un aula
Cantidad de docentes de una institucin
Sector de una Institucin (Pblico, Privado, etc.)
12
Estadstica aplicada a la
Educacin
3. Clasifica cada una de las siguientes variables, segn su naturaleza y escala de medicin
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
Zona de residencia
Direccin de una persona
Nmero de miembros de una familia
Nmero de libros de texto que se adquieren
Niveles de enseanza (EEB, Media, Superior)
Grado que cursa
Departamentos geogrficos del pas
Zona
Edad en aos cumplidos
Carrera cursada
5. En una institucin de educacin superior se ha realizado una encuesta acerca de la procedencia y nacionalidad de los estudiantes, obtenindose los siguientes resultados.
Cuadro 2: Cant. de estudiantes por procedencia segn nacionalidad
Nacionalidad
Total
Paraguayos
Extranjeros
Total
55
35
20
Procedencia
Capital
Interior
38
17
23
12
15
5
a.
b.
c.
d.
13
Estadstica aplicada a la
Educacin
CONSTRUCCIN DE INDICADORES
INDICADORES: Un indicador social es una medida de resumen, de preferencia estadstica, referente a la
cantidad o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar
las unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables que se estn analizando.
RAZN Y RELACIN
RAZN: Es la comparacin entre dos nmeros que puede calcularse por diferencia
RELACIN: Comparacin entre dos nmeros que puede calcularse por cociente.
Ejemplo 4: En una institucin de nivel medio asisten 1200 varones y 600 mujeres. Calcula
a. La razn de varones y mujeres. Interpreta.
b. La relacin entre varones/mujeres. Interpreta
a. Ra=1.200-600=600. Interpretacin: Indica que existen 600 varones ms que mujeres en dicha Institucin.
b. Re
V
1200 2
PROPORCIN Y PORCENTAJE
PROPORCIN: Una proporcin (P) es una comparacin por cociente de la magnitud de una parte con la del
todo. El valor de una proporcin (P) siempre se halla entre el cero y la unidad.
0 P 1
Ejemplo 5: Indica la proporcin de mujeres matriculadas en la enseanza superior durante 2010.
MUJERES
343.050
MATRCULA
TOTAL
576.500
PROPORCIN
(343.050/576.500)=0,59
PORCENTAJE: Es la expresin de la proporcin en forma de porcentaje (%). As, para convertir una proporcin en porcentaje se multiplica dicha proporcin por 100.
Interpretacin: Aproximadamente la sexta parte (0,59) de los estudiantes son mujeres.
O de cada 10 estudiantes 6 son mujeres
Ejemplo 6: Indica el porcentaje mujeres matriculadas en la enseanza superior durante 2010.
MUJERES
343.050
MATRCULA
TOTAL
576.500
PORCENTAJE
(343.050/576.500)*100=59,5%
14
Estadstica aplicada a la
Educacin
EJERCICIOS DE APLICACIN 3
9. Las Instituciones de Educacin Superior se clasifican de la siguiente manera:
Cuadro 3: Cant. de instituciones de Educacin Superior por sector.
SECTOR
Oficial
Privado
Subvencionado
a)
b)
c)
d)
e)
f)
CANT. INST.
5
35
12
10. El siguiente cuadro presenta la matrcula por nivel del Sistema Educativo.
Cuadro 4: SISTEMA EDUCATIVO. MATRCULA POR NIVEL. Ao: 2012
NIVEL
INICIAL
EEB
MEDIO
a)
b)
c)
d)
e)
f)
MATRCULA
100.685
905.813
111.066
11. El siguiente cuadro presenta la distribucin de la matrcula de la Educacin Superior en cuatro departamentos.
Cuadro 5: PARAGUAY. EDUCACIN SUPERIOR.
MATRCULA EN CUATRO DEPARTAMENTOS. Ao: 2011
DEPARTAMENTO
Asuncin
Central
Alto Paran
Itapa
a)
b)
c)
d)
e)
f)
MATRCULA
5882
4343
1672
1329
Calcula la razn por diferencia entre la matrcula de Asuncin y Alto Paran Interpreta
Calcula la razn por diferencia entre la matrcula del Itapa y Alto Paran. Interpreta
Cul es la relacin entre la matrcula del Departamento Central y Alto Paran?
Cul es la relacin entre la matrcula del Departamento Central y Asuncin?
Qu porcentaje representa la matrcula del departamento Central? Interpreta
Qu proporcin representa la matrcula de Asuncin?
15
Estadstica aplicada a la
Educacin
12. En una institucin educativa se ha realizado un sondeo acerca de la procedencia y nacionalidad de los
estudiantes, obtenindose los siguientes resultados.
Cuadro 6: Cant. de estudiantes por procedencia segn nacionalidad
Nacionalidad
Total
Paraguayos
Extranjeros
aa
aa
aa
aa
aa
aa
aa
Total
55
35
20
Procedencia
Capital
Interior
38
17
23
12
15
5
MATRCULA
188
151
241
122
16
Estadstica aplicada a la
Educacin
NDICE Y CRECIMIENTO
NMERO NDICE: Indica la evolucin de una serie cronolgica. Por consiguiente, en su clculo es funda mental considerar el orden en que se presentan las observaciones a travs del tiempo.
Es un indicador de una caracterstica observable, no una medida, por lo tanto, lo ms que puede hacer es
indicar.
CUADRO 8: PARAGUAY. EDUCACIN PRIMARIA.
MATRCULA POR AO. PERIODO 1989 - 1994
MATRCULA
ndice
Cantidad
Base 1990=100
656.877
687.331
100,00
720.983
104,90
755.492
109,92
798.981
116,24
835.089
121,49
AO
1989
1990
1991
1992
1993
1994
ndice de alumnos
835.089
100 121,50%
687.331
Lo que indica un crecimiento positivo, pues el ndice es superior al del ao base 1994
CRECIMIENTO: Determinadas variables crecen, permanecen constantes o decrecen con el paso del tiempo,
es muy til para describir y explicar el funcionamiento de los sistemas de la educacin en el pasado; sirven
tambin para predecir el comportamiento de las variables en el futuro.
Los crecimientos pueden ser; Crecimiento absoluto y Crecimiento relativo o porcentual
Ejemplo 7: Considerando el cuadro anterior, se puede calcular los dos tipos de crecimiento.
Crecimiento absoluto de la matrcula =M1994 - M1989=835.089-687.331=147.758 alumnos
M n
M0)
M0
100
EJERCICIOS DE APLICACIN 4
18. El siguiente cuadro contiene datos histricos de la matrcula de una Institucin.
AO
2002
2003
2004
2005
2006
2007
2008
2009
2010
TOTAL
2779
3490
3750
3527
3618
3696
3521
3863
4186
HOMBRE
1684
2004
2046
1868
1840
1894
1824
1920
2193
MUJER
1095
1486
1704
1659
1778
1802
1697
1943
1993
17
Estadstica aplicada a la
Educacin
2011
a)
b)
c)
d)
e)
f)
g)
4567
2506
2061
Considerando como ao base 2005, calcular para el ao 2010, el ndice total de alumnos.
Halla el crecimiento absoluto de la matrcula total en el perodo 2002-2006
Halla el crecimiento porcentual de la matrcula total en el perodo 2002-2006
Halla el crecimiento porcentual de la matrcula total en el perodo 2007-2011
Halla el crecimiento porcentual de la matrcula total en el perodo 2006-2010
Halla el crecimiento porcentual de la matrcula de hombres en el perodo 2007-2011
Halla el crecimiento porcentual de la matrcula de mujeres en el perodo 2007-2011
19. El siguiente cuadro indica el nmero total de alumnos matriculados en la EEB, durante el perodo 1990
1997, su distribucin por zona urbana y rural.
AO
1990
1991
1992
1993
1994
1995
1996
1997
a)
b)
c)
d)
e)
TOTAL
454853
452249
467552
478584
493231
504377
518968
530163
URBANA
195533
191215
193722
194702
196685
198555
200781
202783
RURAL
259320
261034
273830
283882
296546
305822
318187
327380
Considerando 1993 como ao base, calcular para el ao 1997 el ndice de alumnos de la zona urbana.
Calcula el crecimiento porcentual de la matrcula total en el perodo 1992-1997
Calcula el crecimiento porcentual de la matrcula por zona entre los aos 92-97
Calcula el crecimiento porcentual de la matrcula por zona entre los aos 90-94
Analiza los porcentajes obtenidos en el clculo anterior.
20. El siguiente cuadro indica el nmero total de alumnos matriculados de la Institucin XX, durante el perodo 1996 2000, su distribucin por sexo.
AO
1996
1997
1998
1999
2000
a)
b)
c)
d)
TOTAL
VARN
350
348
450
443
448
MUJER
475
462
446
435
450
Considerando 1996 como ao base, calcular para el ao 2000 el ndice de alumnos VARONES
Constryase un nuevo cuadro con columnas que muestre los datos en porcentajes por fila.
Calcula el crecimiento porcentual de la matrcula total, por SEXO entre los aos 1996/2000
Analiza los porcentajes obtenidos en el clculo anterior.
21. El siguiente cuadro indica el nmero total de Instituciones y su distribucin por SECTOR, durante el perodo 1996 2000.
AO
1996
1997
1998
1999
2000
TOTAL
OFICIAL
35
36
45
48
50
PRIVADO
25
28
29
35
38
aa Considerando 1996 como ao base, calcular para el ao 2000 el ndice de Instituciones por Sector.
aa Calcula el crecimiento porcentual de las instituciones, por SECTOR entre los aos 1996/2000
18
Estadstica aplicada a la
Educacin
19
Estadstica aplicada a la
Educacin
El orden del cuestionario deber ser lgico. Las preguntas deben hacerse por temas afines y en orden
de dificultad creciente. Las preguntas ms sencillas han de ir al principio del cuestionario.
El orden de las preguntas no debe afectar a las respuestas.
Se ha de explicitar el recorrido del cuestionario, que ha de depender del tipo preguntas, de las respues tas a las preguntas, etc.; teniendo como finalidad indicar cundo se deben efectuar las preguntas, en
qu orden, y otra informacin semejante.
Ejemplo 8
20
Estadstica aplicada a la
Educacin
MUESTRA, es una parte o subconjunto de una poblacin en estudio. Esta constituida de elementos selec cionados de una manera deliberada, con el objeto de investigar las propiedades de su poblacin. La muestra
slo da informacin de aquella poblacin de la que ha sido extrada.
N
n
21
Estadstica aplicada a la
Educacin
hecho de que la seleccin de las unidades se realiza al azar y adems que es apta para realizar cual quier tipo de inferencia estadstica.
Por Conglomerados (clusters) y en etapas mltiples: Este tipo de diseo se utiliza en general para reducir los costos de recoleccin de datos, sin embargo, hay que tener en cuenta que aumenta el grado de
error a diferencia del muestreo estratificado. En la mayora de los casos se utiliza cuando no se cuenta
con un listado de todos los elementos de la poblacin.
Los conglomerados son unidades de un mismo tamao, es en cierto modo una estrategia opuesta a la
del muestreo estratificado, ya que en una muestra estratificada, los casos se seleccionan dentro de
cada estrato, en cambio, en este tipo de muestra se selecciona entre los conglomerados; correlativamente, as como se busca que los estratos sean lo ms homogneos posible internamente, para los conglomerados cuanto ms heterogneos sean mejor ser el resultado.
La tcnica por conglomerados se integra en diseos de muestra en etapas mltiples; muestras que su ponen la definicin de unidades de muestreo en diferentes niveles.
TAMAO DE LA MUESTRA
Uno de los aspectos a concretar en las fases previas de la investigacin, es el tamao de la muestra.
En estadstica, el tamao de la muestra es el nmero de sujetos o elementos que componen la muestra extrada de una poblacin, necesarios para que los resultados obtenidos sean representativos de la
poblacin, vlidos y confiables.
Determinar el tamao adecuado para una muestra es una eleccin crucial, por todas las consecuencias negativas que puede producir una equivocacin, representa una parte esencial del mtodo cientfico para po der llevar a cabo una investigacin. El tamao de la muestra, generalmente, se determina en funcin a los
objetivos del estudio y las caractersticas de la poblacin, as como de los recursos disponibles (costo, tiem po, entre otros).
En este sentido, es importante definir el alcance de la investigacin de manera a determinar el tipo de mues tra a ser empleado (no probabilsticos -dirigidos o intencionales- o probabilsticos). La muestras dirigidas
(intencionales) o no probabilsticas, generalmente son utilizadas en los estudios exploratorios (aunque
tambin puedan ser utilizados muestras probabilsticas) e investigaciones experimentales (debido a que
los experimentos requieren de manejos de grupos no muy grandes, donde la validez externa se consolida
mediante la repeticin o reproduccin del estudio). Mientras que en aquellos estudios que requieren ser expandidos a una poblacin, como los no experimentales descriptivos o correlacionales-causales se deben utilizar las muestras probabilsticas.
(*) Donde deben ser considerados los siguientes elementos de la inferencia estadstica:
n0: Cantidad terica de elementos de la muestra. Tambin sirve para el caso en que la poblacin en estudio no sea finita.
n: Cantidad real de elementos de la muestra a partir de la poblacin asumida o de los estratos asumidos
en la poblacin.
N: Nmero total de elementos que conforman la poblacin, o nmero de estratos totales de la poblacin.
z: Valor estandarizado en funcin del grado de confiabilidad de la muestra calculada. Por ejemplo, si
consideramos trabajar con un 95 % de confiabilidad la muestra seleccionada, entonces el valor estandaMagster Agustina Subelda Coronel
22
Estadstica aplicada a la
Educacin
rizado asumir es igual a 1.96 (Para dos colas). Algunos valores estandarizados (z) en funcin de grado
de confiabilidad asumido (para dos colas):
99 % ------------- z = 2,58 (Empleado con frecuencia)
97.5%------------ z = 2,24
95 % ------------- z = 1,96 (El ms empleado)
90 % ------------- z = 1,64
85%--------------- z = 1,44
80%--------------- z = 1,28
: Error asumido en el clculo. Toda expresin que se calcula contiene un error de clculo debido a las
aproximaciones decimales que surgen en la divisin por decimales, error en la seleccin de la muestra,
entre otras, por lo que este error se puede asumir entre un 1 hasta un 10 %; es decir, que se asume en
valores de probabilidad correspondiente entre un 0.01 hasta un 0.1:
Carrera
Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N
Cant. de alumnos
650
825
365
720
2.560
23
Estadstica aplicada a la
Educacin
N 2.560
z 2,58........ para..99%..nivel.de.confianza
3% 0,03
p 60% 0,6
q 40% 0,4
a 2,58 a
aza
2
n0 a a . p.q a
a 0,6 0,4 86 ) 0,6 0,4 7.396 0,6 0,4 1.775,04
a a
a 0,03 a
Clculo de la cantidad real de elementos de la muestra a partir de la poblacin
n
1.775,04
1.775,04
1.775,04
n 0
1.048,23 1.048
n0
1.775,04 1 0,693375 1,693375
Tamao de la muestra de
1
1
2.560
N
estudiantes a ser utilizada para la evaluacin.
REPRESENTATIVIDAD DE LA MUESTRA
Uno de los primeros pasos en cualquier investigacin consiste en la determinacin del universo o poblacin,
si la poblacin que nos interesa es de gran tamao, podra resultar sumamente trabajoso obtener informa cin sobre todos sus elementos, en este caso se recurre a una muestra.
Para que la muestra sea representativa de la poblacin, esta debe ser seleccionada de modo tal de obtener la mxima aproximacin a los parmetros poblacionales. Uno de los mtodos para mejorar la calidad del
muestreo es la estratificacin de la poblacin.
La idea de representatividad tiene que ver con la posibilidad de que la muestra sea una rplica adecuada de
la poblacin en lo que hace a las variables relevantes. Al respecto, convendr tener en cuenta las siguientes
consideraciones:
1. Una muestra que sea representativa para determinados propsitos, puede no serlo para otros: no existe
la muestra representativa en s, para cualquier propsito.
2. Si bien existen procedimientos para evaluar la bondad de una muestra, no es la muestra en s la que es
representativa; ms bien nuestra creencia en su representatividad la que va a depender del plan de
muestreo utilizado para seleccionarla.
3. La representatividad de una muestra est dada en considerar que la misma fue extrada de una pobla cin con un determinado nivel de confianza (se trabaja preferiblemente con un 95 % de confianza o
ms), de asumir un determinado porcentaje en el error de clculo, que debe estar comprendido entre un
1 hasta un 10 % (0,01 hasta 0,10); y de considerar un adecuado porcentaje (desde un 1 hasta un 20 %)
en valores probabilsticos (0, 01 hasta 0, 2) de que la muestra no posee las caractersticas de la poblacin.
24
Estadstica aplicada a la
Educacin
de la metodologa de la afijacin proporcional.
Para determinar el tamao de la muestra por afijacin proporcional se procede de la siguiente manera:
1.
2.
3.
4.
Ejemplo 11: Distribucin del tamao de la muestra por estrato (Afijacin proporcional)
Teniendo en cuenta el resultado obtenido en el ejemplo anterior. Distribuir el tamao total de muestra igual a
1.048 estudiantes por carrera para realizar la evaluacin del desempeo docente.
A continuacin se presenta la distribucin de alumnos por carrera de la Universidad.
Cant. de Proporcin de alumnos por
alumnos
carrera
650
2.560 0,26
650
825
825 2.560 0,32
365
365 2.560 0,14
720
365 2.560 0,28
2.560
1
Carrera
Informtica
Derecho
Ing. Comercial
Marketing
Total de estudiantes = N
Distribucin de la Muestra
0,26 1.048 272,48 273
Los resultados indican que el instrumento de evaluacin ser aplicado a: 273 estudiantes de la carrera de
Informtica, 335 de Derecho, 147 de Ing. Comercial y 293 de Marketing, totalizando de esta manera una
muestra total de 1.048 estudiantes de la Universidad
EJERCICIOS DE APLICACIN 5
22. Se desea hacer un estudio para rescatar la percepcin de los alumnos acerca de la carrera de Educacin y para ello se requiere de una muestra representativa tanto del total de alumnos como por semes tres. Considerar para el clculo del tamao de la muestra; p=q=50%, con un margen de error de 4% y un
nivel de confianza de 95%.El siguiente cuadro presenta la distribucin de la matrcula de la carrera de
Educacin por semestre.
SEMESTRE
1
2
3
4
5
6
7
8
9
10
MATRCULA
AO 2011
188
151
141
122
103
85
80
75
70
60
23. Se realizar una encuesta a los docentes y para ello se requiere de una muestra en la que se tendr en
cuenta los siguientes criterios: p = q =50%, con un margen de error de 3% y con un nivel de confianza de
99%. Asimismo se requiere la muestra por carrera.
El siguiente cuadro presenta la distribucin de docentes por carreras de una determinada Universidad.
Carreras
Total
Informtica
Derecho
Magster Agustina Subelda Coronel
20
30
25
Estadstica aplicada a la
Educacin
Ing. Comercial
Marketing
25
12
24.La universidad se encuentra abocada en realizar una evaluacin del desempeo docente. Debido al alto
costo que podra ocasionar la aplicacin del instrumento a todos los alumnos, recurre a una muestra en
la que se debe tener en cuenta; p = 70%, q =30%, con un margen de error de 4% y con un nivel de con fianza de 99%. Cmo quedara distribuida dicha muestra por carrera?
El siguiente cuadro presenta la distribucin de alumnos del 2 curso por carrera.
Carrera
Cant. de alumnos
Informtica
133
127
119
126
Derecho
Ing. Comercial
Marketing
25. Un investigador se encuentra abocado en la tarea de realizar un estudio de percepcin de los estudiantes, para ello desea recurrir a una muestra del 25% del total de estudiantes, asimismo requiere que la
muestra este distribuida por promocin. El siguiente cuadro presenta la distribucin de alumnos de la li cenciatura de C. de la Educ. por promocin.
Promocin
Cant. de alumnos
Ao 1998/2000
Ao 1999/2001
78
87
Total
165
26. El siguiente cuadro presenta la distribucin de la matrcula de alumnos de la Educacin Superior en cuatro departamentos.
PARAGUAY. EDUCACIN SUPERIOR. MATRCULA EN CUATRO DEPARTAMENTOS. Ao: 2010
DEPARTAMENTO
Asuncin
Central
Alto Paran
Itapa
MATRCULA
5848
4343
1672
1329
a) Calcular el tamao de la muestra probabilstica para el total de matriculados de la Educ. Superior, te niendo en cuenta los siguientes criterios; p = 60%, q =40%, con un margen de error de 5% y con un
nivel de confianza de 95%. Cmo quedara distribuida dicha muestra por departamentos?
b) Por otro lado, de cuntos alumnos estara conformada la muestra, si se considera el 17% del total
de la matrcula? En este caso, Cuntos matriculados de Alto Paran debern ser seleccionados
para la muestra estratificada por departamento?
27. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad para determinar
la proporcin de jvenes que estara a favor de una nueva zona de ocio. El nmero de jvenes de dicha
poblacin es N=2.000. Determinar el tamao de muestra necesario para estimar la proporcin de estudiantes que estn a favor con un error de estimacin de 005 y un nivel de confianza del 95%
26
Estadstica aplicada a la
Educacin
62
73
68
61
90
92
62
61
88
51
Ordena ya sea en forma ascendente o descendente los datos y halla las frecuencias.
FRECUENCIA FRECUENCIA
PUNTAJE
ABSOLUTA (fa) RELATIVA (fr)
51
61
62
68
73
88
90
92
TOTAL
2
2
2
1
1
2
1
1
12
16,7
16,7
16,7
8,3
8,3
16,7
8,3
8,3
100
FRECUENCIA
ABSOLUTA
ACUMULADA
faa
2
4
6
7
8
10
11
12
FRECUENCIA
RELATIVA ACUMULADA fra
16,7
33,4
50,1
58,4
66,7
83,4
91,7
100,0
Rango o Recorrido: En todo conjunto de valores de la variable Xi, es posible conocer el mximo y el mnimo valor de Xi, donde Xmax-Xmin constituye el rango o recorrido (R) de la variable.
R=Xmx Xmn
27
Estadstica aplicada a la
Educacin
Considerando el ejemplo anterior, se calcula el Rango
Xmx=92
Xmin=51
R=92-51=41
DATOS AGRUPADOS EN INTERVALOS: cuando hay muchos datos.
Ejemplo 13: Los datos siguientes corresponden a los puntajes obtenidos en un examen de matemtica
75
88
68
58
82
73
76
87
68
61
88
91
90
92
91
63
62
71
79
65
88
51
56
77
R=92-51=41
El recorrido se puede dividir en un nmero arbitrario de intervalos de clase (m) o pequeos segmentos.
S m = nmero de intervalos, entonces: la amplitud (c) o el tamao del intervalo est dado por:
ci
( R 1)
m
Para elegir un nmero arbitrario de intervalos se calcula R+1 y se verifica si este resultado es mltiplo de
algn nmero, como por ejemplo R+1=41+1=42. El 42 es mltiplo de 2, 3, 6, 7, 14, es decir, que el nmero
arbitrario de intervalos (m) a ser elegido puede ser cualquiera de esos divisores.
Se considera a m=6 como el nmero arbitrario, entonces, la amplitud o el tamao del intervalo (c) ser:
41 1 42
7
6
6
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
El intervalo contiene a:
51, 52, 53, 54, 55, 56, 57
58, 59, 60, 61, 62, 63, 64
65, 66, 67, 68, 69, 70, 71
72, 73, 74, 75, 76, 77, 78
79, 80, 81, 82, 83, 84, 85
86, 87, 88, 89, 90, 91, 92
Cada intervalo de clase tiene: Lmite inferior y un lmite superior; es el menor y el valor que delimita un inter valo de clase.
Intervalo de clase Lmite inferior
51 - 57
51
Lmite superior
57
28
Estadstica aplicada a la
Educacin
Cerrado y abierto: cuando incluye el lmite inferior y excluye el lmite superior.
Intervalo de clase Cerrado y Abierto
51 - 57)
Incluye a 51 y no incluye a 57
Abierto y cerrado: cuando excluye el lmite inferior e incluye el lmite superior
Intervalo de clase Abierto y cerrado
(51 - 57
No incluye a 51 e incluye a 57
El punto medio de cada intervalo se llama marca de clase y se denota por yi
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
yi Marca de clase
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89
Mtodo general para hallar la distribucin de frecuencias para datos agrupados en intervalos
1) Determina el valor mximo y el mnimo entre todos los datos registrados y as calcular el RANGO: es el
valor mximo menos el valor mnimo.
2) Divide el rango en un nmero arbitrario (m) de INTERVALO DE CLASE del mismo tamao.
3) Halla la MARCA DE CLASE.
4) Determina el nmero de observaciones que cae dentro de cada intervalo de clase, es decir, encontrar la
frecuencia de clase, mediante un conteo de los datos.
Ejemplo 14: Agrupa utilizando los datos del ejemplo anterior. Considera m=7 para el tamao de intervalo
PUNTAJE
Intervalo de clase
51 - 57
58 64
65 71
72 78
79 85
86 92
TOTAL
Marca de clase
yi
(51+57)/2= 54
(58+64)/2= 61
(65+71)/2= 68
(72+78)/2= 75
(79+85)/2= 82
(86+92)/2= 89
2
4
4
4
2
8
24
FRECUENCIA RELATIVA
(fr)
FRECUENCIA
ABSOLUTA
ACUMULADA
faa
8,3
16,7
16,7
16,7
8,3
33,3
100
2
6
10
14
16
24
16,7
25,0
41,7
58,4
66,7
100,0
EJERCICIOS DE APLICACIN 6
28. Los datos siguientes corresponden a los puntajes obtenidos en un examen.
75
87
74
62
93
78
82
75
94
77
69
74
a) Construye una tabla de frecuencias para datos agrupados en intervalos (fa, fr, faa y fra)
29. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica.
75
82
68
90
62
88
73
61
93
71
75
87
74
62
93
a) Construye una tabla de frecuencias (fa, fr, faa y fra)
Magster Agustina Subelda Coronel
88
51
78
29
Estadstica aplicada a la
Educacin
30. En la siguiente tabla se registran los pesos (en Kilogramos) de 30 estudiantes de la carrera de Informtica. Considera nmero de intervalos igual a 6.
48
59
56
aa
50
61
61
47
60
64
52
48
70
60
70
69
61
68
55
50
69
54
47
55
60
47
53
55
51
70
60
Construye una tabla de frecuencias (fa, fr, faa y fra) b) analiza los resultados
31. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemtica I.
75
82
68
90
62
88
75
87
74
62
93
78
89
61
75
95
60
79
95
94
78
85
76
65
73
67
88
78
62
76
73
81
72
63
76
75
a) Construye una tabla de frecuencias (fa, fr, faa y fra). Analiza los resultados
32. Las remuneraciones mensuales (en dlares) de 80 maestros de una institucin, son los siguientes:
260
120
255
175
115
145
135
153
190
215
233
190
205
185
160
178
130
230
190
140
125
145
145
164
135
235
160
220
140
230
222
173
220
230
170
185
155
170
170
156
155
265
130
195
170
220
195
170
225
120
105
125
190
165
210
182
230
91
217
92
190
288
135
190
93
115
95
240
233
95
180
177
180
185
190
140
185
120
173
210
a) Considerando el nmero de intervalos igual a 10. Construye una tabla de frecuencias (fa, fr, faa y fra)
33. Considerando el siguiente cuadro:
PUNTAJES
GRUPO A
GRUPO B
51 60
61 70
71 80
81 90
91 - 100
20
18
15
15
12
15
10
5
8
7
65
60
a) Construye una tabla de frecuencias (faa, fr y fra) para ambos grupos
34. El siguiente cuadro contiene los puntajes de un examen de Matemticas de dos secciones del Primer
Semestre:
PUNTAJE
Seccin A
20 34
35 49
50 64
65 79
80 94
Seccin B
5
8
5
12
10
40
10
15
8
15
8
56
30
Estadstica aplicada a la
Educacin
Cuadro 10
SECTOR TOTAL
SECTOR
Oficial
Privado
Total
65,2
34,8
100,0
Oficial
Privado
Total
55.231
29.433
84.664
SEXO
Mujeres
30.377
15.600
45.977
Hombres
24.854
13.833
38.687
TOTAL
55.231
29.433
84.664
EJERCICIOS DE APLICACIN 7
35. Elabora cuadros que correspondan a los siguientes ttulos:
a)
b)
c)
d)
e)
31
Estadstica aplicada a la
Educacin
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
fa
5
8
5
12
10
12
12
11
10
fa
10
9
8
7
6
5
4
3
2
1
0
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
PUNTAJE
FUENTE: Universidad XX
ELABORACIN: Universidad XX. Facultad XX. Dpto Est
32
Estadstica aplicada a la
Educacin
POLGONO DE FRECUENCIAS
Para construirlo se calculan los puntos medios (marca de clase) de los intervalos, se levanta un segmento de
altura igual a la respectiva frecuencia (absoluta o relativa), luego se unen los extremos con una lnea poligo nal.
PUNTAJE
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
MARCA
DE CLASE
fa
27
42
57
72
87
5
8
5
12
10
fa
12
11
10
9
8
7
6
5
4
3
2
1
0
12
10
8
12
27
42
57
72
87
102
PUNTAJE MEDIO
FUENTE: INST. XX.
ELABORACIN: ......
OJIVAS
Para representar las frecuencias acumuladas (absolutas o relativas) se utilizan las Ojivas o polgonos acumulativos de frecuencias. Se construye ubicando los extremos de los intervalos en el eje x y en el eje y
el valor de las frecuencias acumuladas. En el extremo superior de cada intervalo se levanta un segmento de
altura igual a la respectiva frecuencia absoluta, luego partiendo del extremo inferior del primer intervalo se
une, con segmentos de recta, los extremos de los segmentos verticales, obteniendo una lnea poligonal que,
partir de la ltima frecuencia acumulada, se extiende paralelamente al eje horizontal.
PUNTAJE
20 - 34
35 - 49
50 - 64
65 - 79
80 - 94
MARCA
DE CLASE
fa
27
42
57
72
87
5
8
5
12
10
faa
5
13
18
30
40
fa a
40
40
35
30
30
25
20
18
15
13
10
0
20
34
35
49
50
64
65
79
80
94
PUNTAJE
FUENTE: INST. X X .
ELA B ORA CIN: ......
33
Estadstica aplicada a la
Educacin
LINEAS
Este tipo de grfico relaciona variables entre s (variable dependiente y variables independientes).
Un grfico que muestre la distribucin de una variable en funcin del tiempo se llama
GRFICO DE SUCESIN
EN EL TIEMPO.
G R A F IC O 4 : E V O L U C I N D E L A M A T
U N IV E R S IT A R IA . P E R IO D O 2 0 0 3 - 2 0 0 7
16 0 0 0 0
15 8 0 0 0
M a t r ic u la
15 6 0 0 0
15 4 0 0 0
15 2 0 0 0
15 0 0 0 0
14 8 0 0 0
14 6 0 0 0
14 4 0 0 0
2003
2004
2005
2006
2007
AOS
BARRAS
El grfico de barra (o diagrama de barras) se puede representar en forma vertical u horizontal. El ancho de
las barras debe ser constante y pueden ser de cualquier tamao, mientras que las barras no se sobrepongan. Este tipo de grfico se usa para representar variables relacionadas entre s
BARRAS VERTICALES
S el grfico corresponde al de barra vertical, entonces, las categoras de la variable independiente son re gistradas horizontalmente y sobre ellas son levantadas columnas de alturas correspondientes a la variable
dependiente (frecuencia).
BARRAS HORIZONTALES
Se diferencia de las barras verticales por la posicin entre la variable y la frecuencia. Las variables pueden
ser ordenadas en forma creciente o decreciente de acuerdo a la frecuencia o alguna otra clasificacin.
G R F IC O N 5 : E D U C A C I N S U P E R IO R .
DES ER T O R ES S EG N DEP A RT A M ENT O .
A O 2006
G R A F IC O 6 : D E S E R C I N U N IV E R S IT A R IA P O R
C A RR ERA . A O 2007
C omer cial
7.000
A r quitec tur a
6.000
5.000
Inf or mtica
4.000
3.000
D er echo
2.000
1. 0 0 0
D is eo
0
DE PART AM ENT O
10
15
20
25
30
D e s e r c i n
FUENTE: INST.
34
Estadstica aplicada a la
Educacin
BARRAS COMPUESTAS
Este tipo de grfico sirve para representar un fenmeno dividido en categoras que a su vez se dividen en
subcategoras. Para su elaboracin se utilizan generalmente, cifras absolutas y no relativas.
Las barras pueden estar en posicin vertical u horizontal.
G R F IC O N 7 : E D U C A C I N S U P E R IO R .
M A T R C U L A P O R A O , S E G N S E C T O R
16 7 . 2 6 2
18 0 . 0 0 0
M A T R C U L A
16 0 . 0 0 0
14 9 .7 19
13 0 . 9 7 9
14 0 . 0 0 0
12 0 . 0 0 0
10 0 . 0 0 0
8 0 .0 0 0
3 5 .9 15
6 0 .0 0 0
4 5 .3 9 4
3 9 .0 3 9
4 0 .0 0 0
2 0 .0 0 0
0
19 9 1
19 9 2
19 9 3
AO
P b lic o
P r iv a d o
GRFICO DE PILAS
Se utiliza para comparar categoras o subcategoras de una variable, es decir, ilustra las partes en un todo.
Se construye sobre una escala de frecuencia relativa (de cero a cien).
FUENTE: XXXXX
CIRCULAR O DE SECTORES
Se utiliza para demostrar una proporcin de un todo y solamente cuando la variable est dividida en pocas
categoras, en caso contrario pierde su principal cualidad que es la legibilidad.
Para construir un grfico circular se calculan los ngulos repartiendo 360 en partes directamente proporcionales a cada una de las frecuencias, que pueden ser cifras absolutas o relativas.
35
Estadstica aplicada a la
Educacin
Fuente:
EJERCICIOS DE APLICACIN 8
36. En el cuadro se cuenta con la siguiente distribucin de alumnos por estatura:
ESTATURA (cm)
111 120
121 130
131 140
141 150
151 160
161 170
171 - 180
%
5,1
7,8
9,5
9,6
12,7
48,7
6,6
fa
3
5
7
4
3
TOTAL
36
Estadstica aplicada a la
Educacin
b) Un grfico de lneas de la distribucin total de instituciones
39. El siguiente cuadro presenta la distribucin de alumnos del 2 semestre por carrera.
CARRERA
Total de
alumnos
Ing. Comercial
Derecho
Ing. Informtica
Marketing
Total
33
27
19
26
105
Fuente: XXXXX
Elaboracin: XXXX
Totalmente Parcialmente
No responde
28,6
65,3
6,1
16,7
72,9
10,4
26,5
63,3
10,2
32,7
53,1
14,3
Fuente: xxxxx
Elaboracin:
44,9
95,9
61,2
26,5
Fuente: xxxxx
Elaboracin
37
Estadstica aplicada a la
Educacin
x x 2 x 3 ....... x n
X 1
n
X i 1
n
Mediana (Me); una vez ordenados los datos, para calcular la mediana se toma como referencia el valor de
(n+1)/2 para los datos no agrupados.
b.
c.
Moda (Mo); es el valor ms frecuente para una variable, es decir, al que le corresponde mayor frecuencia.
Ejemplo 16 Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin,
por 12 alumnos del primer semestre.
75
82
a)
b)
c)
d)
87
75
74
94
62
77
93
69
78
73
75 87 74 62 93 78 82 75 94 77 69 73 939
78,25
12
12
Interpretacin: Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25
puntos
c) Para calcular la mediana (Me) se procede a:
69
78
73
82
74
87
75
93
75
94
38
Estadstica aplicada a la
Educacin
Calcular
Posicin de la mediana
Posicin
Puntos
1
62
2
69
3
73
4
74
n 1 13
6,5
2
2
5
75
6
75
7
77
8
78
9
82
10
87
11
93
12
94
75 77
76
2
Interpretacin: esto implica que aproximadamente el 50% de los estudiantes han obtenido hasta 76 puntos
La mediana est dada por Me
Y n
i
Y i 1
Media aritmtica;
Mediana (Me);
b.
Si n/2 no coincide con algn Ni, es decir el valor se encuentra entre dos valores de Ni:: N j 1
a.
n
Nj
2
n
1
N j , entonces Me Y j 1 Y j
2
2
Ejemplo 17: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica, por
30 alumnos de un curso de postgrado.
30
28
18
a)
b)
c)
d)
24
28
24
28
30
24
22
18
24
30
30
10
22
24
18
30
28
22
22
28
22
28
22
24
30
18
28
39
Estadstica aplicada a la
Educacin
a) Tabla de frecuencias
Puntajes (Yi)
10
18
22
24
28
30
fa=ni
1
4
6
6
7
6
30
30
Yi.ni
10x1=10
18x4=72
22x6=132
24x6=144
28x7=196
30x6=180
fa=ni
1
4
6
6
7
6
Y .n
i
734
24,47
30
30
Calcular
n 30
15
2
2
Puntajes (Yi)
Yj-1
Yj
10
18
22
24
28
30
n=
fa=ni
1
4
6
6
7
6
30
faa=Ni
1
5
11 Nj-1
n
15
17 Nj
2
24
30
n
15 no coincide con ningn Ni, el valor se encuentra entre dos valores de Ni o sea:
2
n
11 15 N j 17 entonces Me Y 24 , es decir, existen 17 alumnos que tienen 24
2
Como
N j 1
puntos o menos.
d) En cuanto al puntaje ms frecuente es 28, porque tiene mayor frecuencia (7).
40
Estadstica aplicada a la
Educacin
Ejemplo 18: Los datos siguientes corresponden a los puntajes obtenidos en un examen de Estadstica, por
30 alumnos de un curso de licenciatura.
30
28
18
a)
b)
c)
d)
23
28
23
28
30
23
22
18
23
30
30
10
22
24
18
30
28
22
22
28
22
28
22
24
30
18
28
a)Tabla de frecuencias
Puntajes (Yi)
10
18
22
23
24
28
30
fa=ni
1
4
6
4
2
7
6
Puntajes (Yi)
10
18
22
23
24
28
30
30
30
Y
Yi.ni
10x1=10
18x4=72
22x6=132
23x4=92
24x2=48
28x7=196
30x6=180
fa=ni
1
4
6
4
2
7
6
Y .n
i
730
24,33
30
30
Calcular
n 30
15
2
2
Puntajes (Yi)
10
18
22
Yj-1 23
Yj 24
28
30
n=
Como
Me
fa=ni
1
4
6
4
2
7
6
30
n
15
2
faa=Ni
1
5
11
15 Nj-1
17 Nj
24
30
coincide
con
Ni,
n
15
2
entonces,
N j 1
n
15 N j 17
2
entonces
1
Y j 1 Y j ) 1 23 24) 23,5 , es decir,
2
2
Interpretacin: El 50% de los alumnos tienen puntajes iguales o menores que 23,5 puntos.
d) En cuanto al puntaje ms frecuente de los estudiantes es de 28 puntos, porque tiene mayor frecuencia (7).
41
Estadstica aplicada a la
Educacin
EJERCICIOS DE APLICACIN 9
42. Los puntajes obtenidos por un alumno en 5 exmenes parciales de estadstica son:
X1=13, X2=10, X3=14, X4=11, X5=10. CALCULA el puntaje promedio en estadstica obtenido por el
alumno, la mediana y la moda.
43. A continuacin se presenta, la matrcula por semestre de una Institucin de educacin superior:
AO
1
150
160
11
2006 - MATRICULA
2007 - MATRCULA
DESERTORES
a)
b)
c)
d)
e)
f)
g)
h)
i)
2
132
137
10
SEMESTRE
3
4
110
102
120
97
9
8
5
97
90
5
6
76
90
4
44. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin.
75
87
74
62
93
78
75
82
75
94
77
69
93
78
74
74
82
73
68
61
90
93
62
71
88
51
82
75
77
69
75
87
74
62
61
60
48
70
68
69
55
53
70
53
55
68
70
ZONA
Urbana
21
15
Rural
5
2
Fuente: xx
Elaboracin: xx
42
Estadstica aplicada a la
Educacin
48. Los datos siguientes corresponden a las edades de un grupo de jvenes de una institucin.
25
17
26
19
26
19
25
26
17
18
26
17
174
162
193
178
174
174
174
173
168
161
190
193
162
171
188
174
182
175
177
169
175
187
50. Las remuneraciones mensuales (en dlares) de 30 maestros de una institucin, son los siguientes:
260
120
255
a)
b)
c)
d)
190
215
250
130
230
190
135
250
160
220
230
170
155
250
130
225
120
105
230
100
217
103
115
105
250
185
190
43
Estadstica aplicada a la
Educacin
MEDIDAS DE DISPERSIN
Son aquellos valores que nos dan una idea de cuan alejados estn unos datos de otros, es decir es neces ario tener una idea del grado de concentracin o dispersin de las observaciones alrededor de un valor central o de posicin.
Los estadgrafos de dispersin de mayor uso son:
Rango o recorrido: es un estadgrafo de dispersin muy limitado, pues slo considera los valores extremos
de la distribucin
DATOS NO AGRUPADOS
Desviacin media: o desviacin promedio de un conjunto de observaciones se define por
n
X
DM
j 1
n
de Xj respecto a X .
Varianza: En la perspectiva de construir un indicador que dimensione la desviacin o distancia promedio de
los Xj respecto a X , se propuso elevar al cuadrado de la desviacin X j X a fin que sea siempre no negativa. De esta manera la varianza queda definida como:
n
V ( X ) s 2
X)
j 1
s s2
La desviacin estndar, al igual que la varianza; es no negativa, puesto que es la raz cuadrada positiva de
la varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
Interpretacin de la desviacin estndar
Si la desviacin estndar es ms grande que la media, esto probablemente indica un sesgo, es decir su giere que una o ms puntuaciones extremas inflaron la media y la desviacin estndar.
Si la desviacin estndar no es de la mitad de tamao de la media o menos, se debe tener en cuidado al
examinar la distribucin para analizar la posible existencia de sesgos o valores extremos.
Coeficiente de variacin (CV): Es una medida de variacin RELATIVA, mide el grado de dispersin de un
conjunto de datos en relacin con su media. Uno de sus usos ms comunes es para expresar la desviacin
estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado
de variabilidad que la desviacin tpica o estndar. Todos los valores deben ser positivos y su media de por
tanto un valor positivo. El CV pierde utilidad cuando la media se aproxima a cero
Es til para comparar la dispersin de conjunto de datos que tienen distintas desviaciones estndar y distintos promedios.
Interpretacin del coeficiente de variacin
s
CV __ .100
X
Estadstica aplicada a la
Educacin
Ejemplo 19: Usando los datos correspondientes al ejemplo 16.
62
69
73
74
75
75
77
78
82
87
93
94
Los estudiantes han obtenido en el examen de Administracin un puntaje medio de 78,25 puntos
a) Calcula la desviacin media de los puntajes obtenidos.
b) Calcula la varianza y la desviacin tpica o estndar.
c) Calcula el coeficiente de variacin
d) Interpreta los resultados
a) Calcula la desviacin media de los puntajes obtenidos.
n
Aplicando la frmula:
DM
DM
X
DM
j 1
, se tiene
16,25 9,25 5,25 4,25 2 * 3,25 1,25 0,25 3,75 8,75 14,75 15,75
86
7,1666 7,2
12
12
Interpretacin: Lo que significa que la distancia media entre cada uno de los valores y el valor central es de
7,2 puntos
b) Calcula la varianza y la desviacin tpica o estndar.
n
s2
s2
62
V ( X ) s 2
X)
j 1
n
2
16,25) 2 9,25) 2 5,25) 2 4,25) 2 2.3,25) 2 1,25) 2 0,25) 2 3,75) 2 8,75) 2 14,75) 2 15,75) 2
12
264,0625 85,5625 27,5625 18,0625 21,125 1,5625 0,0625 14,0625 76,5625 217,5625 248
s2
12
s 2 81,19
81,19 9,01
s
CV __ .100 , reemplazando por los valores se tiene:
X
9,01
.100 11,515 11,52%
78,25
Estadstica aplicada a la
Educacin
EJERCICIOS DE APLICACIN 10
51. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Matemtica I, por 12
alumnos del primer curso.
75
a)
b)
c)
d)
e)
87
74
62
93
78
82
75
94
77
69
73
52. Los datos siguientes corresponden a los puntajes obtenidos en un examen de Administracin.
75
87
74
62
93
78
75
82
75
94
77
69
93
78
74
74
68
70
82
73
68
61
90
93
62
71
88
51
82
75
77
69
75
87
74
62
61
60
48
70
68
69
55
53
70
53
55
55. Los datos siguientes corresponden a las edades de un grupo de jvenes de una institucin de educacin
superior.
25
a)
b)
c)
d)
e)
17
26
19
26
19
25
26
17
18
26
17
56. Los datos siguientes corresponden a la talla en cms de un grupo de jvenes que asisten a una institucin
de educacin superior.
175
188
174
173
168
161
190
193
162
171
188
174
182
175
177
169
175
187
174
162
193
178
174
174
46
Estadstica aplicada a la
Educacin
a)
b)
c)
d)
e)
57. Las remuneraciones mensuales (en dlares) de 30 docentes de una institucin, son los siguientes:
260
120
255
a)
b)
c)
d)
e)
190
215
250
130
230
190
135
250
160
220
230
170
155
250
130
225
120
105
230
100
217
103
115
105
250
185
190
47
Estadstica aplicada a la
Educacin
MEDIDAS DE ASOCIACIN
Son medidas que se usan para evaluar la asociacin entre un evento y un factor de estudio. Los tpicos estadsticos de asociacin son la correlacin y la regresin.
CORRELACIN: Expresa el grado y sentido de la variacin concomitante de dos o ms series de datos. Es
decir, analiza la relacin entre dos o ms variables, siempre que se tenga un indicio que entre ellas existe
por lo menos cierto grado de dependencia o asociacin.
Clasificacin
a Perfecta (r 1)
a
a Imperfecta (0 r 1; - 1 r 0)
a Nula (r 0)
a
a Positiva
a (variacin de las series en el mismo sentido)
a
a
a Negativa
a
a (variacin en sentido contrario)
Los Diagramas de Dispersin o Grficos de Correlacin permiten estudiar la relacin entre 2 variables. Da das 2 variables X e Y, se dice que existe una correlacin entre ambas si cada vez que aumenta el valor de X
aumenta proporcionalmente el valor de Y (Correlacin positiva o directa) o si cada vez que aumenta el valor
de X disminuye en igual proporcin el valor de Y (Correlacin negativa o indirecta).
En un grfico de correlacin representamos cada par X, Y como un punto donde se cortan las coordenadas
de X e Y:
Grfico 1
Grfico 2
Como se observa en el grfico 1 ambas variables presentan una correlacin lineal positiva; es decir, a medi da que aumenta el valor de la variable Estatura aumenta tambin el valor de la variable Peso. Mientras que
en el grfico 2 se observa una relacin lineal negativa; es decir que a medida que aumentan los aos de es tudio, disminuye el nmero de hijos.
Se habla de correlacin lineal fuerte cuando la nube de puntos se parezca mucho a una recta y ser cada
vez ms dbil (o menos fuerte) cuando la nube vaya desparramndose con respecto a la recta.
Propiedades de r
1.
2.
3.
1 r 1
48
Estadstica aplicada a la
Educacin
Interpretacin de r
1.
2.
3.
4.
Distribuciones Bidemensionales
Curvilnea
Coeficiente ETA ()
PEARSON:
rxy
n. X
rS 1
SPEARMAN
rb
CUADRUPLE:
TETRACRICO
6. D 2
X . Y
X ) . n .Y Y )
2
N. N 2 1
BISERIAL-PUNTUAL:
BISERIAL:
n. XY )
rbp
Xq
. pq
St
X q p.q
.
St
y
A.D ) B.C )
A B ). A C ). C D ). B D )
A.D
B.C
49
Estadstica aplicada a la
Educacin
Ejemplo 20: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
b) Cul es el grado y el sentido de la relacin entre las variables velocidad lectora y comprensin lectora?
Como la velocidad lectora y comprensin lectora son variables continuas o de razn, para medir el grado
se utiliza el coeficiente r de Pearson. La frmula, para datos sin agrupar y a partir de puntuaciones directas
es:
rxy
n. X
n. XY )
2
X . Y
X ) .n .Y Y )
2
3
4
5
38
50
57
10
21
24
380 1050 1368
6
33
11
363
841
X
X
900
100
441
576
121
8
38
8
304
144
64
35.245
9 10
39 22
7
5
273 110
11
12
13
20
37
62
3
6
28
60 222 1736
14
35
12
420
15
16
41
50
9
20
369 1000
17
43
16
688
18
19
751
2
253
38 12782
900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245
751
2
7
30
12
360
49
25
36
XY
253
2
784
4.975
144
81
400
256
4975
12.782
N=18
rxy
n. X
Obtenemos
n. XY )
2
X . Y
X ) . n .Y Y )
2
18.12782 751.253
40073
0,94
42406,56
rxy 0,94
Por tanto, la relacin entre X (velocidad lectora) e Y (comprensin lectora) es imperfecta positiva y alta
para la muestra, es decir que la relacin entre estas dos variables es significativa.
50
Estadstica aplicada a la
Educacin
EJERCICIOS DE APLICACIN 11
58. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institucin de educacin superior en los exmenes de Matemtica y Contabilidad.
Matemtica
Contabilidad
12
13
18
14
09
16
15
08
14
19
12
06
10
20
18
13
17
14
07
17
170
72
168
65
186
82
160
58
168
63
155
65
162
58
168
70
170
69
165
62
182
76
156
60
0,05
4,4
0,1
4
0,12
4,7
0,4
4,1
0,5
3,3
0,7
3,7
1
4,3
1,2
2,4
2,1
4,8
2,5
3,5
3
4,2
3
5
Horas (X)
20
16
34
23
27
32
18
Calificacin (Y)
3.5
4.5
3.5
4.5
4.5
3.5
M
13
F
09
F
19
M
15
M
14
F
08
M
07
F
14
F
17
F
11
M
15
F
08
F
20
M
15
51
Estadstica aplicada a la
Educacin
63. Se desea determinar el grado de asociacin entre el rendimiento acadmico de 100 estudiantes de la
Facultad de Ciencias respecto a la procedencia del sector del grupo de estudiantes seleccionados.
Rendimiento acadmico
Bueno
Regular
Malo
13
14
5
23
13
4
19
1
5
Sector
Oficial
Subvencionado
Privado
18
43
17
30
07
18
12
23
15
19
06
22
07
26
10
20
09
19
04
18
28
43
27
30
14
18
23
23
24
19
14
22
14
26
18
20
14
19
10
18
29
43
30
30
10
18
21
23
24
19
11
22
12
26
08
20
07
19
05
18
29
30
30
20
10
30
21
26
24
37
11
15
12
21
08
27
07
20
05
32
52
Estadstica aplicada a la
Educacin
REGRESIN LINEAL
La correlacin es til para medir si la relacin que existe entre las variables es aproximadamente lineal o no;
mientras que la regresin sirve para buscar la ecuacin matemtica que mejor describe la relacin entre las
variables, consiste en cuantificar la relacin que existe entre las variables con el fin de predecir cules sern
los valores de una variable cuando se conocen los valores de la otra.
El coeficiente de correlacin lineal determina si, efectivamente, existe relacin entre dos variables. Una
vez que se concluye la existencia de relacin, la regresin nos permite definir la recta que mejor se ajusta a
esta nube de puntos.
Y a bX
n. XY )
n X 2
X ). Y
X )
2
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
53
Estadstica aplicada a la
Educacin
Grficamente se puede visualizar la existencia de una correlacin lineal positiva y alta para la muestra, es
decir que la relacin entre estas dos variables es significativa (vase ejemplo 20, donde rxy 0,94 ). Concluida la existencia de relacin entre ambas variables a travs del coeficiente de correlacin r Pearson, la regresin permite definir la recta que mejor se ajusta a esta nube de puntos.
La recta se define de la siguiente manera: Y = a + b X, donde X es la variable independiente (velocidad
lectora) e Y (comprensin lectora), los parmetros a y b se determinan de la siguiente manera;
n. XY )
n X 2
X ) Y )
Donde; b = coeficiente de regresin (pendiente de la recta de regre X )
2
sin)
X = una variable independiente de nivel de intervalo/razn u ordinal (Velocidad lectora)
Y = una variable dependiente de nivel de intervalo/razn u ordinal (Comprensin lectora)
n = tamao de la muestra
Para aplicar la frmula son necesarios los siguientes clculos previos:
1
2
X
69
68
Y
29
30
X.Y 2001 2040
X2
4
5
38
50
57
10
21
24
380 1050 1368
6
33
11
363
7
30
12
360
8
38
8
304
9
10 11 12
13
14
15
16
17 18
39 22 20
37
62
35
41
50
43 19
751
7
5
3
6
28
12
9
20
16
2
253
273 110 60 222 1736 420 369 1000 688 38 12782
900 1444 1521 484 400 1369 3844 1225 1681 2500 1849 361 35245
X ) Y ) 190.003
X ) 564.001
XY 12.782
X 35.245
n=18
X 41.72
Y 18.06
n. XY )
n X 2
0.57
18 * 35245 564001 634410 564001 70409
X )
2
54
Estadstica aplicada a la
Educacin
Comprensin lectora = -5.72+0.57xVelocidad Lectora
Esta ecuacin de regresin puede usarse para calcular, la mejor estimacin de la Comprensin lectora (Y)
para cualquier valor de la Velocidad lectora (X). Sin embargo, esta asociacin debera ser validada mediante
pruebas de hiptesis adecuadas.
EJERCICIOS DE APLICACIN 12
68. Se busca establecer si hay relacin entre el puntaje de la parte terica del 1er parcial de Estadstica y la
parte prctica del mismo.
Terica
Prctica
2
2
2.5
1
1.5
2
1.5
1
3
4
2
3.5
3
5
2.5
1
50
32
82
60
64
44
50
38
63
49
81
63
80
59
72
63
72
69
69
63
12
13
18
14
09
16
15
08
14
19
12
06
10
20
18
13
17
14
07
17
71. Los datos siguientes corresponden a nivel de vocabulario previo y el nivel intelectual de 10 alumnos del
1 G
Vocabulario previo
Nivel intelectual
28
43
27
30
14
18
23
23
24
19
14
22
14
26
18
20
14
19
10
18
LENGUAJE
10
55
Estadstica aplicada a la
Educacin
MATEMTICAS
LENGUA
10
56
Estadstica aplicada a la
Educacin
INFERENCIAS ESTADSTICAS
PRUEBAS DE HIPTESIS
Una prueba de hiptesis estadstica es una conjetura de una o ms poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se examine la poblacin entera.
Esto por su puesto sera impractico en la mayora de las situaciones. En su lugar, se toma una muestra aleatoria de la poblacin de inters y se utilizan los datos que contiene tal muestra para proporcionar evidencia
que confirme o no la hiptesis. La prueba de hiptesis estadstica cuantifica el proceso de toma de decisiones.
Formulacin de hiptesis en estudios cuantitativos con diferentes alcances
ALCANCE DEL ESTUDIO
Exploratorio
Descriptivo
Correlacional
Explicativo
(Hernndez S, 2004)
FORMULACIN DE HIPTESIS
No se formulan hiptesis
Slo se formulan hiptesis cuando se pronostica un hecho o dato
Se formula hiptesis correlacionales
Se formulan hiptesis causales
Hiptesis
La hiptesis constituye una prediccin sobre la relacin entre dos variables, que afirma que los cambios en
la medida de una variable independiente correspondern a los cambios en la medida de una variable dependiente.
Ejemplos
Las caractersticas del hogar asociados a la pobreza influyen en el logro educativo de los hijos en grados di ferentes por departamentos geogrficos
La oferta de carreras profesionales de la Universidad XX no satisface la demanda de formacin acadmica
profesional de los egresados de nivel medio.
El grado de instruccin acadmica influye en la probabilidad de abortar
Hiptesis estadstica; es aquella que se establece para ser rechazada o anulada, es decir es la hiptesis que
se quiere contrastar. Por ejemplo, si la hiptesis de investigacin propone: Los adolescentes le atribuyen
ms importancia al atractivo fsico en sus relaciones heterosexuales que las mujeres, la hiptesis estadstica postulara: Los jvenes no le atribuyen ms importancia al atractivo fsico en sus relaciones heterosexuales que las adolescentes.
Hiptesis alternativa; es la hiptesis que se acepta si la hiptesis estadstica es rechazada.
Grados de libertad
Los procedimientos estadsticos (instrumentos de medicin y tcnica) tienen limitaciones (distorsionan la in terpretacin de los datos) que repercuten potencialmente en la valoracin exacta de parmetros de poblacin. En este sentido, el trmino de grados de libertad se emplea para referirse a qu tan flexible es un pro cedimiento estadstico. Por lo que, mientras ms grados de libertad se tenga, mejor, porque los grados de li bertad son el nmero de oportunidades de muestreo para compensar las limitaciones, distorsiones y debilidades potenciales en los procedimientos estadsticos. (Ritchey, 2001)
57
Estadstica aplicada a la
Educacin
ms grave que el otro, y debe alcanzarse un compromiso que disminuya el error ms grave, la nica forma
de disminuir ambos a la vez es aumentar el tamao de la muestra, que no siempre es posible.
Nivel de significancia o nivel de error de muestreo
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a correr el riesgo
de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por
, se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra eleccin.
En la prctica es frecuente un nivel de significancia de 0.05 0.01, si bien se usan otros valores. Si, por
ejemplo, se escoge un nivel de significancia del 5% 0.05 al disear una regla de decisin entonces hay
unas cinco oportunidades entre cien de rechazar la hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la hipte sis ha sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hiptesis tiene una probabilidad
del 5% de ser falsa.
Estadstico de la
prueba
Correlacin
lineal simple
y regresin
n 2
t r r
1 r2
Correlacin
rho de
Spearman
de rangos ordenados
Correlacin
gamma de
rangos ordenados
Prueba de
chi cuadrado
de asociacin
rs 1
N, tipo y nivel
de medicin
de las variables
Peculiaridades o
suposiciones
gl n 2
Dos variables de
intervalo / razn
u ordinales de
tipo intervalo
n 10
No aplica
gl ( f 1)(c 1)
Requiere al menos 5
casos por casilla
6 D 2
n( n 2 1)
f f
f f
a
a
c 2
N de
muestras
O E )
E
i
i
58
Estadstica aplicada a la
Educacin
3. No existe ninguna restriccin en el tamao de la muestra; pero generalmente cuanto ms grande sea n,
ser mejor
4. Un diagrama de dispersin de las coordenadas de las dos variables se ajusta a un patrn lineal
Lista de verificacin para los seis pasos de la inferencia estadstica (Ritchey, 2001)
Preparacin de la prueba
Formule la pregunta de investigacin; liste las especificaciones, incluso las variables (X; Y), sus niveles de
medicin, la(s) poblacin(es) bajo estudio, y la(s) muestra(s) y el (los) tamao(s) de la(s) muestra(s); seleccione la prueba estadstica; proporcione observaciones de estadsticos y parmetros; y trace un diagrama
conceptual.
Seis pasos
Empleando el smbolo H para hiptesis
1. Enuncie la H estadstica y la H alternativa
El enunciado de la hiptesis estadstica es H est : 0 , es decir no existe relacin entre las variables
Mientras que, el enunciado de la hiptesis alternativa depende del planteamiento de la pregunta de investigacin y pueden ser;
De dos colas, no direccional (es decir, 0 ; existe una relacin)
Una cola en la direccin negativa (es decir, 0 ; existe una relacin negativa)
Una cola en la direccin positiva (es decir, 0 ; existe una relacin positiva)
2. Describa la distribucin muestral
Se describe la distribucin a ser utilizada, en este caso la distribucin t aproximadamente normal, los
gl n 2 . Si H est : 0 es verdadera y repetidamente se extraen muestras de tamao n de la poblacin en estudio, las r de las muestras se centrarn alrededor de cero con un error estndar inversamente
relacionado con el tamao de la muestra (es decir, a mayor tamao de la muestra menor ser el error
estndar3)
3. Determine el nivel de significancia ( a ) y especifique el valor crtico de la prueba.
Frecuentemente se utiliza un nivel de confianza de 95%, al que le corresponde un nivel de significancia
de 5% (0.05), si bien se usan otros valores. Lo que significa, que hay unas cinco oportunidades entre
cien de rechazar la hiptesis cuando debiera haberse aceptado (error tipo I); es decir, tenemos un 95%
de confianza de que se ha adoptado la decisin correcta.
El valor crtico se determina a partir de la tabla de la distribucin t (ver anexo), se obtiene la t a ; valores
crticos de t para los niveles de significancia y los grados de libertad especificados.
4. Observe los resultados de la muestra en cuestin y calcule los efectos de la prueba, el estadstico de la
prueba y el valor p.
El estadstico de la prueba utilizado es t r r
donde
n 2
. Con gl n 2
1 r2
gl = grados de libertad
5. Tome la decisin de rechazo
La H est : 0 se rechaza cuando t r ta
, as
p<0.05.
La ley de los grandes nmeros sostiene que, para una distribucin muestral de medias, cuanto mayor sea el tamao de la
muestra n, menor ser el error estndar.
Magster Agustina Subelda Coronel
59
Estadstica aplicada a la
Educacin
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin
Ejemplo 22: Los datos siguientes corresponden a las puntuaciones obtenidas por 18 alumnos del 1er G, que
fue utilizada en un diseo experimental sobre mtodos de enseanza de la lectura
Nio/a
10
11
12
13
14
15
16
17
18
Velocidad lectora
(X)
69
68
38
50
57
33
30
38
39
22
20
37
62
35
41
50
43
19
29
30
10
21
24
11
12
08
07
05
03
06
28
12
09
20
16
02
Poblacin: Nios de 1
grado
X = velocidad lectora
Y= comprensin lectora
Es ?
Muestra: 18 nios
del 1 grado
r=0.94
60
Estadstica aplicada a la
Educacin
H alt : 0 . Es decir, existe una relacin positiva entre la velocidad lectora y la comprensin lectora. De
una cola
2. Describa la distribucin muestral
La distribucin t aproximadamente normal, con gl n 2 18 2 16 . Si H est : 0 es verdadera y
repetidamente se extraen muestras de tamao 18 de la poblacin de nios de 1 grado, las r de las
muestras se centrarn alrededor de cero con un error estndar inversamente relacionado con el tamao
de la muestra.
3. Determine el nivel de significancia ( a ) y especifique el valor crtico de la prueba.
Se define a 0.05 , (en este caso se supone que si la hiptesis es rechazada tiene una probabilidad del
5% de ser falsa) de una cola.
El valor crtico para a 0.05
4. Observacin
gl 16 , es t a 1.746
n 2
18 2
16
16
0.94
0.94
0.94
0.94 137.46 0.94 11.724
2
2
1 0.8836
0.1164
1 r
1 0.94
t r 11.02 Error Estndar
t r r
H alt : 0 , es decir que existe una relacin positiva entre la velocidad lectora y la comprensin lecto ra.
6. Interprete y aplique las mejores estimaciones en trminos cotidianos.
La interpretacin de los resultados se hace analizando los cuatro aspectos de una relacin
Existencia : existe una relacin positiva entre la velocidad lectora (VI) y la (VD) comprensin lectora
en los nios del 1 grado
Direccin
Fuerza
Naturaleza : siendo b=0.57 puntos en la comprensin lectora por punto en la velocidad lectora, es
decir, un aumento de un punto en la velocidad lectora se relaciona con un aumento de
0.57 en la comprensin lectora.
A partir de este anlisis se puede concluir que la comprensin lectora puede explicarse por la velocidad lectora, de esta manera la mejor estimacin de la relacin en la poblacin est dada por;
2.5
1.5
1.5
2.5
61
Estadstica aplicada a la
Educacin
Prctica
3.5
a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelos.
75. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente intelectual (CI en
puntos), depende del nmero de hermanos. Toma una muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la siguiente tabla;
CI
N hermanos
110
0
115
1
120
1
118
1
110
2
108
2
105
2
104
3
98
3
99
4
98
4
100
5
90
5
93
5
90
6
aa
Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
aa
Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
aa
Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
76. Un investigador quiere conocer la asociacin entre el puntaje de razonamiento abstracto y el puntaje de
razonamiento espacial, en un grupo de 10 personas.
RA
RE
50
32
82
60
64
44
50
38
63
49
81
63
80
59
72
63
72
69
69
63
a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
77. Se tienen los datos correspondientes a las calificaciones de 12 estudiantes de una institucin de educacin superior en los exmenes de Matemtica y Contabilidad.
Matemtica
Contabilidad
12
13
18
14
09
16
15
08
14
19
12
06
10
20
18
13
17
14
07
17
a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
78. El nmero de horas dedicadas al estudio de una asignatura y la calificacin obtenida en el examen correspondiente, de ocho personas es:
Horas (X)
Calificacin (Y)
20
3.5
16
3
34
4.5
23
3.5
27
4.5
32
4.5
18
3.5
22
4.8
a) Traza un diagrama de dispersin y analiza a travs de ste la relacin entre las variables.
b) Calcula el coeficiente de correlacin r de Pearson para estas dos variables, as como la ecuacin de
regresin lineal Y=a+bX
c) Prueba la hiptesis de existe relacin entre estas dos variables. Si la hay, analcelas.
62
Estadstica aplicada a la
Educacin
ANEXO
63
Estadstica aplicada a la
Educacin
BIBLIOGRAFA
vila Acosta, Roberto. Estadstica Elemental Con 300 problemas resueltos (1996). Lima Per:
Nueva Edicin, Estudios y Ediciones R.
vila Acosta, Roberto. Introduccin a la Metodologa de la Investigacin La tesis Profesional Gua para elaborar la tesis - Aplicaciones y Ejemplos (1997). Lima Per: Estudios y Ediciones
R.A,
Hernndez Sampieri, R., Fernndez, C. y Baptista P. Metodologa de la Investigacin (2008). Mxico: Mc Graw-Hill.
Lebart, L., Morineau, A. y Fnelon JP. Tratamiento Estadstico de Datos - Mtodos y Programas
(1994). - Marcombo, Boixareu.
Levin, Richard. ESTADISTICA PARA ADMINISTRADORES. 7a. edicin. Editorial Prentice Hall Hispanoamericana, Pgs. 93-107
Ritchey, Ferris J.. Estadstica para las Ciencias Sociales. (2001). Mxico: Mc Graw-Hill
64