Вы находитесь на странице: 1из 144

ESTADSTICA E INFORMATICA APLICADA

A LA GESTIN EDUCATIVA
DRA. IRENE TAFUR ANZUALDO

GUIA DIDCTICA

UNIVERSIDAD ALAS PERUANAS

ESCUELA DE POST GRADO

ESTADSTICA E INFORMATICA APLICADA


A LA GESTIN EDUCATIVA

CICLO I

Universidad Alas Peruanas

Direccin Universitaria de Educacin a Distancia (DUED)


Los Lirios 144-San Isidro
4221808
http://dued.uap.edu.pe
maestriavirtual@uap.edu.pe

GUA DIDCTICA

ndice

1.

Presentacin a la gua Didctica

2.

Presentacin del Docente

3.

Introduccin a la Asignatura.

4.

Objetivos

5.

Requisitos

6.

Medios

7.

Contenidos.

8.

Orientacin Bibliogrfica

a. Bibliografa Bsica

b. Bibliografa Complementaria
9.

Actividades

10.

Evaluacin

11.

Orientaciones para el estudio de cada unidad o tema

12.

Orientaciones para las tutoras

1. Presentacin de la Gua Didctica

Estimado participante:
Nos es grato dirigimos a usted para darle la BIENVENIDA

FELICITARLE por la decisin tomada de continuar sus estudios y

pertenecer a la gran familia de la Universidad Alas Peruanas, y al


programa de

la maestra que lo conducir a obtener el grado

Acadmico de Maestro; en DOCENCIA UNIVERSITARIA Y GESTIN


EDUCATIVA, adems, usted ser el protagonista de su propio
aprendizaje y desarrollo profesional, ya que debe organizarse y buscar
un tiempo especial para estudiar; as como cumplir eficazmente con
todas las prcticas y su trabajo que realiza da a da. Que ms adelante
redundar en beneficio suyo de la institucin donde labora, de su familia
y por supuesto contribuir al desarrollo de nuestro pas.

Estamos seguros que su participacin en el programa de maestra ser


exitosa as como en el presente curso de

ESTADSTICA E

INFORMTICA APLICADA A LA GESTIN EDUCATIVA que le


corresponde llevar en el presente mdulo el cual le permitir profundizar
conocimientos, utilizar tcnicas y herramientas con fundamento cientfico
necesarios para maximizar su efectividad en la gestin y la toma de
decisiones educativas. As mismo, la estadstica descriptiva e informtica
le facilitaran el desarrollo de su sus actividades en el que hacer diario de
su trabajo y en la gestin de diferentes actividades a realizar.

Para que usted pueda seguir sus estudios adecuadamente, es


importante que lea la presente Gua Didctica, herramienta que le
orientadora y conducir su aprendizaje durante el desarrollo del curso
de Estadstica e Informtica Aplicada a la Gestin Educativa. En la gua
usted encontrar la informacin relevante y oportuna, contenidos claves,
auto-evaluaciones

bibliografa

actualizada

que

lo

guiar

complementar su aprendizaje durante todo el proceso de estudio.

En esta gua encontrar la siguiente informacin:


Presentacin de la Gua Didctica
En ella se indica el contenido de la gua y los beneficios que obtiene
para realizar sus estudios con xito.

Equipo de docente
Equipo humano que lo apoyarn en el transcurso del curso y a los
cuales podr recurrir ante alguna duda o inquietud.

Introduccin general de la asignatura


Comprende la definicin de los puntos temticos que abarcar

la

asignatura y le permitirn tener una mejor concepcin de los temas a


estudiar.

Objetivos
Comprender y manejar los conceptos y mtodos bsicos de la
estadstica e informtica aplicada a la gestin educativa.
Requisitos
Conocimiento y temtica inicial muy necesario que se debe tener en
consideracin cada uno de los temas a tratar, para lo cual, es
fundamental que usted, debe estudiar y repasar antes de iniciar sus
estudio de la asignatura.

Medios
Herramientas que van a permitir el acercamiento a la informacin y
conocimientos temticos capaces de complementar nuestro aprendizaje.

Contenidos
Contenido por temas: esquema, objetivos, materiales, introduccin,
orientaciones, conceptos claves, bibliografa y las actividades.

Fuentes de Informacin

a. Bsica: Referencias de libros, entre otros, que lo ayudarn durante


su aprendizaje.

b. Complementaria:

Referencias

bibliogrficas

adicionales

que

complementarn su aprendizaje.

Actividades
Abarca

las actividades Sugeridas, obligatorias, el trabajo que debe

entregar al finalizar el curso, aplicando las tcnicas y herramientas


conocidas nos permitir medir el grado de aprendizaje y su avance
durante el desarrollo del estudio de la presente asignatura.

Evaluacin Oral
Usted tendr una evaluacin oral, en la cuarta semana, que consiste en
la sustentacin de su trabajo presentado. As mismo, cada clase se ira
evaluando su participacin activa en los problemas a resolver.
Orientaciones para el estudio de cada unidad o tema
Consejos de cmo organizar su estudio, cmo afrontar dificultades que
pueda encontrar en la asignatura.

Le recomendamos tener en cuenta la indicacin mencionada y le


sugerimos que lea atentamente siguiendo la secuencia del
desarrollo de la Gua Didctica para el mejor aprovechamiento y
adecuado aprendizaje de la Asignatura.

Orientaciones para las tutoras virtuales


Encontrar las convenciones de comunicacin a travs de la Sala de
conversacin del campus virtual.
Recuerde que el esfuerzo, la responsabilidad, la disciplina, la
voluntad, la puntualidad y la constancia en el estudio le permitir
alcanzar su objetivo, que tambin forma parte del nuestro: Su xito.

2. Presentacin del docente-tutor

La Universidad Alas Peruanas, tiene el agrado de presentar a ustedes a


la seorita Vicenta Irene Tafur Anzualdo, Economista, egresada de la
Universidad Inca Garcilaso de la Vega, Graduada de Maestra en
Economa Agrcola (1989) por el Colegio de Postgraduados de Mxico,
Graduada de Doctora en Economa (2000) y Doctora en Medio Ambiente
y Desarrollo Sostenible (2008) en la Escuela de Postgrado de la
Universidad Inca Garcilaso de la Vega. As mismo, ha realizados
estudios en Administracin y Control de Proyectos de Inversin en la
Escuela Superior para Graduados (ESAN), Diplomado en Investigacin
Cientfica y Ctedra Universitaria, entre otros.

Con experiencia profesional y acadmica. Se ha desempeado


profesionalmente en el rea de planificacin, ocupando cargos directivos
en la Direccin General Forestal y de Fauna del Sector Agrario, en la
Gerencia General de la Asociacin de Becarios de los Estados Unidos
USAID/PER y Directora Ejecutiva de la Asociacin Civil Ecodesarrollo,
Medio Ambiente y Reforestacin (EDMAR). En la actualidad se
desempea como docente de Maestra y Doctorado de la Escuela de

Postgrado de la Universidad Inca Garcilaso de la Vega, es Profesora


invitada de la Escuela de Postgrado de la Universidad Nacional de
Educacin Enrique Guzmn y Valle La Cantuta, de la Universidad Alas
Peruanas y de la Universidad Peruana de los Andes. Su amplia
experiencia nos garantiza el desarrollo de un buen trabajo. Quien ser la
responsable de la conduccin del presente Mdulo.

Queridos participantes les deseamos MUCHOS XITOS!

3. Introduccin a la asignatura

La asignatura de Estadstica E Informtica Aplicada a la Gestin


Educativa corresponde al primer ciclo del plan de estudios del programa
de Maestra en Educacin de la Escuela de Post Grado.

El objetivo fundamental de la asignatura es comprender y manejar los


conceptos y mtodos bsicos de estadstica e informtica aplicadas a la
gestin educativa, destacar la importancia de la estadstica y la
informtica sobre la gestin educativa, proporcionando al participante un
conjunto de tcnicas estadsticas, que pueda complementarse con su
experiencia para una buena gestin y toma de decisin oportuna. As
mismo,

les permita a los participantes desarrollar adecuadamente un

informe adecuado para la gestin educativa.

Para que logre estudiar adecuadamente el presente curso haremos uso


de los siguientes materiales didcticos:

Gua didctica.

Libro Estadstica. 2006 de Weimer Richard/Brown Wn. Editorial


GRUPO PATRIA CULTURAL, S.A. DE C.V. Mxico, DF.

Libro

Estadstica para la Administracin y Economa. 2000 de

Mason/Lind/Marchal. Editorial Alfaomega. 10 Edicin.

La asignatura ha sido dividida en cuatro unidades didcticas que


contienen temas secuenciados adecuadamente para que el participante
se inicie en el estudio de la asignatura.
-

La Primera Unidad Didctica tiene como objetivo presentar una visin


general del tema de la estadstica e informtica, as mismo sus
aplicaciones, especficamente en la gestin educativa. En esta unidad
se tratar de comprender y manejar los conceptos bsicos de la
estadstica descriptiva y su aplicacin en la gestin educativa. Usted
encontrar los contenidos de la pgina 32 a la pgina 51 de la
presente

Gua

Didctica.

As

mismo,

Usted

encontrar

ms

informacin en cualquier libro de Estadstica.

Es importante que preste atencin, en los contenidos de la presente


unidad que se desarrollan en la gua

1. Los temas tratados en esta unidad son de gran utilidad para los
temas posteriores.
2. Es importante interrelacionar la experiencia y los conocimientos
sobre el tema para una adecuada gestin educativa, y a usted le
permitir tener una visin mas clara de los aspectos tratados, ya
que le servirn de base para tomar una decisin adecuada y ser
de gran utilidad para realizar informes de su trabajo profesional y
en el su trabajo de investigacin.
-

En la Segunda Unidad Didctica el objetivo es hacer comprender


sobre las caractersticas y propiedades de los datos cuantitativos:
medidas de tendencia central y de dispersin, as mismo, desarrollar
los modelos de regresin lineal simple y de correlacin, como
instrumentos de prediccin y para medir la intensidad de la asociacin
entre dos variables. Usted encontrar los contenidos de la pgina 52
a la pgina 83 de la presente Gua Didctica. Usted tambin
encontrar los contenidos en el captulo doce (pginas 430-455) del

Libro Estadstica para Administracin y Economa (2001) de Lind /


Marchal / Wathen, dcima edicin.
1.

Lea con atencin

y comprenda cada uno de los aspectos

importantes de las funciones que le presenta el libro.


2. En esta unidad es importante tener presente la utilidad que tienen
en la toma de decisiones y en la elaboracin del informe del
trabajo de investigacin. Le servir a usted para distinguir y tener
en claro el uso de un dato y de un conjunto de datos, as mismo,
ser de gran utilidad en el que hacer diario de su vida profesional.
-

En la Tercera Unidad Didctica el objetivo es comprender los


conceptos bsicos de probabilidad, base fundamental para el estudio
de la distribucin de probabilidades y de la inferencia estadstica.
Desarrollar los mtodos y distribuciones muestrales. Para determinar
el tamao de muestra necesario de poblaciones finitas e infinitas.
Usted encontrar los contenidos de la pgina 84 a la pgina 112 de la
presente Gua Didctica. Con la finalidad de tener mejor discernimiento
acerca de la distribucin de probabilidades y el tamao de muestra,
debe leer el libro de Estadstica para Administracin y Economa de
Mason / Lind / Marchal pginas 224-240 y el contenido que se
desarrolla en la presente Gua Didctica.
Considere por favor los pasos que ha continuacin se seala para el
estudio y as poder lograr el objetivo de la presente unidad:
1. Lea con atencin y practique los ejercicios planteados que le
ayudar a fortalecer sus conocimientos para la toma de decisin y
en el trabajo de investigacin.
Antes debe:
2. Revisar la Presente Gua Didctica en el anexo de la tercera unidad
de las pginas antes mencionadas.

En la Cuarta Unidad Didctica el objetivo es utilizar la distribucin de


muestreo para estimar los intervalos de confianza para la media
poblacional. As mismo, desarrollar, la metodologa para realizar una
prueba de hiptesis para la media poblacional a un determinado nivel
de riesgo. Usted encontrar los contenidos de la pgina 113 a la
pgina 148 de la presente Gua Didctica. Con la finalidad de tener
mayor informacin y fortalecer los conocimientos acerca de la
estimacin y las hiptesis puede consultar en el libro Estadstica para
Administracin y Economa de Mason / Lind / Marchal pginas 309321.

Es necesario, que usted siga ordenadamente cada unidad didctica tal


como ha sido pedaggicamente presentadas, en caso contrario se
perder la informacin que le ayudar en el desarrollo del curso, as
como en su desempeo profesional.

Es indispensable que para el estudio efectivo de esta asignatura,


usted disponga de una computadora en casa, oficina o se encuentre
en una cabina pblica con acceso a Internet y una calculadora
cientfica.

Adicionalmente al texto entregado, es necesario el apoyo de la


plataforma virtual al cual usted tiene acceso, con tan slo ingresar a la
pgina Web de la DUED http://dued.uap.edu.pe (previamente debe
digitar su usuario y contrasea) en donde encontrar importante
informacin complementaria tales como ayudas, links interesantes,
foros de discusin, sala de conversacin para las tutoras virtuales,
modelo de examen, calendario de evaluaciones y mucho ms, capaz
de encontrar respuesta a sus inquietudes o dudas que pudieran
suscitar durante el desarrollo del curso.

La modalidad de Educacin a Distancia le permite estudiar en un


horario flexible y desde cualquier lugar geogrfico en que se
encuentre. Es por esta razn que se requiere su constancia,

dedicacin, disciplina y responsabilidad para lograr el objetivo inicial


del curso.
A continuacin le sugerimos la siguiente distribucin de horas
mnimas por semana de estudio, adecuadas para lograr su correcto
aprendizaje:

Lectura del texto

Revisin de algn material didctico :

6 horas semanales
3 horas

De acuerdo a la caracterstica de esta asignatura, dividida en teora y


prctica, ser necesaria su dedicacin en casa y tomarse un tiempo
para la comunicacin permanente con el tutor o docente utilizando los
medios de comunicacin.

(Recuerde por favor que las horas que acabamos de considerar son
sugeridas, depender de su ritmo de aprendizaje y de los objetivos,
metas y motivacin que tenga usted.)

4. Objetivos
Objetivo General:
La asignatura de Estadstica e informtica aplicada a la gestin educativa;
tiene como objetivo fundamental desarrollar en los participantes los
conocimientos, destrezas y habilidades en el uso de las tcnicas y
herramientas para una adecuada gestin y toma de decisiones en una
institucin educativa, as mismo, les facilite la elaboracin y ejecucin de
informes para la toma de decisiones.

Unidad
Didctica

Objetivos Especficos

Material Didctico

Semana
de
Estudio

Presentar una visin


general de temas de
estadstica e
informtica para la
gestin educativa.
Primera
Unidad

Conocer los

- Primera unidad
(Anexa a la

mtodos y tcnicas

presente gua

para obtener datos

didctica).

1
Semana

estadsticos.
Organizar y
presentar datos en
tablas y diagramas.
- Segunda unidad
Describir conjunto
de mediciones.
Segunda
Unidad

Desarrollar un
modelo simple de

(Anexa a la
presente gua
didctica).
- Estadstica para

regresin y

administradores y

correlacin.

economistas de
Mason/Lind/Mahc

2
Semana

hal. Editorial
Alfaomega.
PRIMER EXAMEN ORAL

Unidad
Didctica

Objetivos
Especficos

Material Didctico

2
semana
Semana
de
Estudio

Comprender los
conceptos
bsicos de
probabilidad.
Tercera
Unidad

Desarrollar la
distribucin de

(Anexa a la presente
gua didctica)

3
Semana

probabilidades.
Determinar
tamao de
muestra.
- Cuarta unidad
Estimar intervalos

Cuarta
Unidad

(Anexa a la

de confianza para

presente gua

la media

didctica)

poblacional.

- Libro Estadstica

Desarrollar la

4a
para Administracin Semana

metodologa para

y Economa de

pruebas de

Mason/Lind/Mahc

hiptesis.

hal. Editorial
Alfaomega

EXAMEN FINAL ORAL

4
semana

5. Requisitos

La asignatura de Estadstica e Informtica Aplicada a la


gestin educativa, no tiene ningn pre-requisito de acuerdo al
Plan de Estudios de la Escuela de Post Grado.

Para una mejor comprensin y aprendizaje se recomienda,


leer la Gua Didctica y los libros seleccionados de
Estadstica

Se recomienda

tener conocimientos de algunos conceptos

bsicos de Internet, como electrnico, Chat, buscadores, y


haber tenido contacto con algn programa de computador.

6. Medios Didcticos
A continuacin detallaremos los medios que utilizar para llevar
adecuadamente la presente asignatura:
MATERIAL IMPRESO
1. Gua Didctica: Es el documento que tiene entre sus manos y que
est leyendo, el cual contiene la informacin necesaria y til que le
permitir conducir su aprendizaje y enfocarse en los temas claves
capaz de cumplir con los objetivos.
2. Unidades Didcticas: Son los captulos pedaggicamente divididos
cuyo contenido se encuentran dentro del libro que le fue entregado al
iniciar la presente asignatura.
3. Libros: Son los materiales de lectura obligatoria que contienen las
unidades didcticas y que a partir de ahora ser su gua y material
principal de estudio:

1. Libro Estadstica Aplicada a los Negocios y a la Economa (2005)


de Douglas A. Lind, William G. Marchal y Samuel A. Wathen.
Editorial McGraw-Hill.
2. Libro

Estadstica para Administracin y Economa (2001) de

Mason/Lind/Marchal. 10a. Edicin. Alfaomega.


CAMPUS VIRTUAL
Es el espacio virtual a travs de la Internet, Usted va a ingresar con
un usuario y clave que le van a ser asignadas en el momento de su
matrcula en la Coordinacin de la Unidad Descentralizada donde se
matricul. En el Campus Virtual encontrar las Aulas Virtuales (una
por cada curso matriculado).

RUTA WEB DEL CAMPUS VIRTUAL.- http://dued.uap.edu.pe

a. Ayudas.- es el espacio que se encuentra en el Aula Virtual dentro


de materiales del curso en el que usted podr descargar las
ayudas que el docente colocar cada semana de estudio para que
usted pueda reforzar o complementar sus conocimientos; ellos son
parte de las evaluaciones del presente curso.

b. Foro.- Es el espacio que se encuentra dentro del Aula Virtual en el


que el docente explicar como se ha de conducir el curso, las
exigencias o requisitos para las actividades obligatorias

como

tambin las aclaraciones al respecto de temas que requieran una


mayor explicacin. Usted puede participar del foro cuando lo
requiera, sea planteando sus dudas o comentando sobre lo
aprendido.

c. Sala de Conferencia.- Es el espacio en el aula virtual en el que


usted encontrar al tutor para recibir su asesoramiento en lnea,
para intercambiar opiniones, preguntas y respuestas acerca de
vuestra evaluacin. Recuerde usted que los horarios de tutora

estn especificados en el Campus Virtual en un link llamado


Calendario de evaluacin, durante las horas de tutoras
telemticas o virtuales; el docente estar conectado en la sala de
conversacin.
d. Actividades Obligatorias.- Es el espacio en el Aula Virtual
en el que usted podr descargar la Actividad Obligatoria que
necesita desarrollar y entregar en el plazo que figure en el
Calendario de evaluacin. No olvide descargarlo para que
pueda elaborarlo.

e. Examen Oral.- Es el espacio desde el cual usted podr hacer


uso del audio y micro a fin de contestar las interrogantes que
le plantea la docente tutora.

f.

Enlaces Interesantes.- Es el espacio en el que el docente


colocar rutas o enlaces a pginas Web.

g. Comunidades de Aprendizaje
Es el espacio dentro del aula virtual en la cual usted podr
relacionarse con otros compaeros del curso con el fin de
resolver preguntas para las actividades obligatorias o para
llevar a cabo los dilogos.

CORREO ELECTRNICO
Es el medio de comunicacin que usted utilizar para comunicarse
con el docente plantendole sus dudas o comentarios al respecto de
los temas del curso. Si usted tiene algn inconveniente con sus notas,
trtelo a travs de este medio; la universidad le ha proporcionado un
correo electrnico que viene a ser:

cdigo@mail.uap.edu.pe

donde cdigo

es el cdigo de matrcula que la Universidad le asign, por ejemplo:


2006185427@mail.uap.edu.pe; su clave usted debe solicitarla en la

Coordinacin de su Unidad Descentralizada luego de haber efectuado


su pago de matrcula y primera cuota.

7. Contenidos

Para el estudio de la asignatura se le proporcion la Gua didctica y los libros


de Estadstica. A continuacin se detalla el contenido de ellos por cada
semana de estudio. El Mdulo consta de cuatro semanas.
Unidad
didctica

Material
didctico

Contenidos

Pginas

Semana
de
estudio

Objetivos
Introduccin
Contenidos

PRIMERA
UNIDAD
Estadstica e
informtica
aplicada a la
gestin
educativa

- Conceptos bsicos
de Estadstica e
informtica y su
Primera
Del 32 51 Primera
Unidad
utilidad.
semana
- Poblacin y
muestra
(Anexo a la
- Variables, tipos de
presente
variables.
gua
- La Estadstica y el
didctica)
proceso de gestin.
- Recopilacin y
presentacin de
datos.

SEGUNDA

(Anexo a la

UNIDAD

presente

Objetivos
Introduccin

gua
Descripcin

didctica)

de un
Estadstica

Contenidos
Medidas
de
tendencia central y

Del 52 al
83

conjunto de
mediciones.
Anlisis
univariado y

aplicada
a de dispersin.
los negocios
y
a
la Regresin
Economa.
correlacin
Lin/Marchal/
Wathen

Segunda
semana
y 430 -455

bivariado

Objetivos
Introduccin
(Anexo a la
presente
gua
didctica

Contenidos
Probabilidad,
experimentos,
eventos.

Del 84 al Tercera
112
semana

Principios para
asignar una
probabilidad

TERCERA
UNIDAD
Probabilidad
y
distribuciones
muestrales

Objetivos de la
distribucin de
probabilidades
Funcin de
densidad y
distribuciones
muestrales.
Tamao de muestra

Objetivos

CUARTA
UNIDAD

(Anexo a la
presente
gua
didctica

Introduccin

Del 113 al
148

Contenidos
Estimacin,

Estimaciones Estadstica
y pruebas de aplicada a
hiptesis
los negocios
y a la
economa de
Lind/Marchal

Cuarta
semana

Estimacin puntual,
Captulo 9
Estimacin por
intervalo para la
media y la varianza

Captulo

/Wathen.

poblacional.

10

Estadstica
para
Administraci
n y
Economa
de
Mason/Lind/
Marchal

Prueba de
hiptesis,
elementos de la
Captulo 9
prueba de hiptesis,
procedimiento para Captulo
una prueba de
10
hiptesis, prueba de
hiptesis para la
media y para la
varianza
poblacional y sus
aplicaciones

8. Orientacin Bibliogrfica

A continuacin, veremos las fuentes de consulta que puede utilizar para


ampliar y comprender mejor los temas del curso.
Bsicas
-

LIND, A. Douglas, MARCHAL, G. William y WATHEN A. Samuel. (2005).


Estadstica Aplicada a los Negocios y a la Economa. 12 Edicin. Editorial
Mc Graw-Hill.

MASON/LIND/MARCHAL.

(2000).

Estadstica

para

Administracin

Economa. 10a. Edicin. Alfaomega.


Los textos cumplen con los contenidos del presente curso. Es obligatoria su
lectura y anlisis. (Usted podr visualizar las pginas de lectura obligatoria a
travs de la Web)
Anexos a las Unidades Didcticas
Vienen a ser los objetivos, introduccin y resumen que pertenecen a cada
unidad didctica.
COMPLEMENTARIA. Son todos aquellos materiales que usted podr utilizar
para profundizar en los temas de la presente asignatura. No es obligatoria su
lectura, pero es muy recomendable que usted haga el esfuerzo de tenerlos a la
mano, pues le ayudarn para lograr una mejor preparacin profesional.

9. Actividades

Estimado participante a continuacin se sealarn las actividades que usted


debe desarrollar, para lograr el objetivo propuesto.

1.

ACTIVIDAD SUGERIDA:
Es aquella actividad, que usted no tiene obligacin de entregarlo, pero es
importante que usted las resuelva para reforzar su aprendizaje.

Las actividades sugeridas, usted las encontrar en los anexos a las


unidades didcticas.
2.

ACTIVIDAD GRUPAL :

Es aquella que le invita a usted a un trabajo en equipo, cuya interaccin se


dar a travs de las Comunidades de Aprendizaje; cuya explicacin las
encontrar en el numeral 6 llamados Medios Didcticos.

3.

PRESENTACIN DE UN TRABAJO:
El trabajo que usted, va ha desarrollar es de carcter individual, consiste en
la utilizacin de las tcnicas y herramientas en un trabajo profesional o de
investigacin.

4.

EVALUACION ORAL :

Es aquella actividad por la cual usted, se comunicar con la docente tutora, a


travs de la sala de conferencia en forma oral, para

sustentar el trabajo

realizado.

El examen oral es individual, sin embargo, por razones de orden y tiempo se


atender de acuerdo a los grupos establecidos, se atender de acuerdo al
horario que se establezca.

Ver el campus virtual.

No se olvide antes de iniciar la evaluacin oral de revisar:

Tener audfono.

Micrfono y

Probar la seal de audio.

10. Evaluacin
Las evaluaciones tienen por finalidad medir los logros alcanzados de los
objetivos propuestos en cada unidad didctica.

La escala de calificacin es vigesimal de 0 a 20.

Se considera nota aprobatoria a partir de 13.

Los instrumentos de evaluacin en el presente caso sern:

La revisin del Trabajo individual o Grupal que se llevar a cabo es al


iniciar la segunda, tercera y cuarta semana,

En los trabajos, se tendr en cuenta para la evaluacin la presentacin,


el procedimiento, la interpretacin de los resultados y la oportunidad.
1.

La Evaluacin Oral es estrictamente individual, se llevar a cabo


durante el desarrollo de, las unidades y la cuarta semana, de acuerdo al
cronograma establecido, por favor revise el campus virtual, por razones
de tiempo se tendr en cuenta la formacin de grupos.
El examen oral consiste en la sustentacin clara y concisa, referente
al Trabajo que realiz, ms algunas preguntas en relacin al desarrollo
de los temas realizados.

11. Orientaciones para el estudio de cada Unidad Didctica

UNIDAD
DIDACTICA

TEMAS EJES

ORIENTACIONES

HORAS DE
ESTUDIO
POR
SEMANA

SEMANA
DE
ESTUDIO

Leer, estudiar y
1. Mtodos y

PRIMERA
UNIDAD

practicar con

tcnicas de la

detenimiento cada

estadstica e

uno de los temas

informtica

tratados en la

aplicada en la

unidad.

Enfoques de

gestin

estadstica e

educativa.

Es conveniente

informtica y su

2. Conceptos

que tengan una

aplicacin en la

bsicos

gestin educativa

3. Clasificacin de

1
8 horas

Semana

calculadora
cientfica

la informacin
4. Distribucin de

anlisis e

representacin

interpretacin de

grfica

los resultados.

1. Medidas de
SEGUNDA
UNIDAD
Caractersticas y
propiedades de
un conjunto de
mediciones

Es importante el

frecuencias y su

En esta unidad es

tendencia central y

importante

8 horas de la

de dispersin

practicar

maana

constantemente
2. Regla emprica de
la curva normal

Semana

a fin de
fortalecer el
aprendizaje

3. Regresin y
correlacin
4. Aplicaciones

TERCERA

1. Probabilidad,

No se olvide de

6 teoria

UNIDAD
Probabilidad,
variables
aleatorias y

experimento

continuar con sus

10 de

aleatorio, espacio

estudios, para lo cual

prctica

muestral.

usted debe cotar con:

2. Variables aleatorias

mtodos y

3. Distribuciones
2. Es importante la

muestrales.

distribuciones
muestrales y

Semana

cientfica

probabilidad.

distribucin,

1. Una calculadora

y distribuciones de

su

4. Tamao de muestra

prctica de los

tamao de

ejercicios

muestra

contemplados en
las unidades.

Para una buena gestin y


CUARTA

1.

UNIDAD
2.
Estimacin y

Estimacin puntual y

toma de decisiones

6 teoria

por intervalo

educativas es importante

10 de

tener las tcnicas y

prctica

Intervalos
confianza

pruebas de
hiptesis

de
para

la

cual, usted, debe continuar

grandes y pequeas.

fortaleciendo su aprendizaje

3.

Pruebas de hiptesis

4.

Elementos

y conocimiento sobre la
y

procedimientos

de

una

de

prueba

hiptesis
5.

herramientas, razn por la

media con muestras

Prueba de hiptesis
para

la

media

varianza poblacional.

realidad educativa.

4
Semana

12. Orientaciones para las tutoras Virtuales

A continuacin le hacemos algunas recomendaciones sobre lo que debe


hacer en una sesin tutorial:

Tutora telemticas

En este curso usted tendr tutoras telemticas. El horario aparecer en


el Aula virtual desde el inicio del mdulo. Usted debe acceder en ese
horario a la sala de conversacin desde el aula virtual.

Para facilitar la comunicacin entre usted, la

tutora

y los dems

participantes, se dirigir de la siguiente forma:

Si la comunicacin es escrita y usted desea hacer uso de la palabra


debe enviar el signo de interrogante (?). Este signo, enviado en la
sala de conversacin, le indica al docente que usted quiere hacer uso
de la palabra. Recuerde que el docente le debe autorizar la palabra
para que usted formule su pregunta, de lo contrario se puede generar
una confusin similar a la que se dara en un aula presencial si todos
preguntaran al mismo tiempo.

Si usted est escribiendo un mensaje muy largo y la sala de


conversacin no le permite escribir ms, escriba al final tres puntos
suspensivos () Esto le indicar a todos los que estn en la sala de
conversacin que usted seguir escribiendo y todos esperarn el
siguiente mensaje.

Lleve las preguntas preparadas si las lleva escritas mejor an, as


usted no solo las formular, sino que adems podr ver si su
pregunta abarca totalmente o cubre en su totalidad las dudas que
tiene.

Por favor,

primero estudie cuidadosamente y con seriedad, luego

pregunte. Haga usted primero el esfuerzo.

Mientras lea o repase la unidad didctica, tome nota en una hoja


aparte las reas que no le quedan claras.

Si no entendi nada es que no fue el momento adecuado para


estudiar o sencillamente no se concentr en su lectura, reljese y
dispngase a aprender, sintase feliz y motvese.

Si encuentra que hay algo que puede compartir hgalo, quizs est
en lo correcto y otros alumnos se podran beneficiar con su aporte,
adems demostrar que ya comienza a dominar el tema. Use el
foro y las salas de conversacin para esto.

SIGUIENDO ESTAS
INDICACIONES Y SIENDO
CONSTANTE EN SU
ESTUDIO, CULMINAR
ESTE CURSO
SATISFACTORIAMENTE.

ANEXO A LA PRIMERA UNIDAD

ESTADSTICA E INFORMTICA
APLICADA A LA GESTIN EDUCATIVA

CONCEPTOS BSICOS DE
ESTADSTICA

Objetivo

Describir y analizar los conceptos, la naturaleza y terminologa de la


estadstica en la gestin como instrumentos para la toma de decisin en
asuntos relacionados a la gestin educativa.

Conocer los mtodos y tcnicas para obtener datos de variables


cualitativas y cuantitativas.

Construir e interpretar cuadros de distribucin de frecuencias de


variables cualitativas y cuantitativas

Introduccin

La primera unidad del curso de Estadstica e informtica aplicada a la


gestin educativa, tienen el propsito de sentar las bases para ser
utilizado como un medio de informacin y programacin en la toma de
decisiones para una adecuada gestin. La naturaleza de la estadstica y
la informtica aplicadas como disciplina nos ayudar en la toma de
decisiones mediante la aplicacin de enfoques cientficos a problemas
administrativos y de gestin educativa.

Contenidos

Los contenidos de la presente unidad se encuentran en la Gua


Didctica. Dichos contenidos los encontrar revisados en la pgina 32
a la pgina 51.

El papel de la Estadstica en la gestin

Importancia:
El xito o fracaso de una gestin educativa se evala sobre la base de
los resultados obtenidos, razn por la cual los responsables de una
gestin, deben conocer y utilizar las tcnicas y los instrumentos que les
permitan lograr sus objetivos.
La estadstica tiene un alcance ilimitado de aplicaciones en diferentes
disciplinas de las ciencias de fcil comprensin. El aspecto ms
importante de la estadstica es la obtencin de conclusiones basados en
los datos experimentales, este proceso es la inferencia estadstica.
El trabajo estadsticos o el trabajo para la gestin es un proceso que
pasa generalmente por 6 etapas y la solucin de cada una de ellas
permite lograr los objetivos.
1. Formulacin del problema o la tarea. La definicin clara de la
poblacin de inters, es la parte ms importante de las etapas de un
trabajo estadstico, en esta parte se debe realizar una especificacin
clara de la pregunta a responder y de la poblacin sobre la cual dicha
pregunta se hace.

2. Diseo del experimento o procedimiento del muestreo. La obtencin


de una muestra es importante por que la informacin cuesta tiempo y
dinero.

3. Recopilacin de los datos. En la recopilacin y anlisis de la


informacin muestral, debe utilizarse el mtodo estadstico apropiado
para extraer la informacin de datos.
4. Clasificacin, tabulacin y descripcin de resultados. Se debe
identificar el procedimiento para hacer inferencias sobre la poblacin con
base en la informacin muestral

5. Generalizacin o inferencia. El anlisis de toma de decisiones, para la


obtencin de una medida de la bondad (confiabilidad) de la inferencia.
6. Elaboracin del informe y conclusiones. El informe debe ser
redactado con mayor cuidado, con la finalidad de ser comprendido por
todas las personas que lo utilizan.
Estadstica: Es una ciencia de tcnicas,

que se usa para recolectar,

organizar, analizar e interpretar los datos numricos, de manera que las


conclusiones obtenidas de ella tengan un grado de confiabilidad
especificado con el fin de realizar una toma de decisiones ms efectiva.
La estadstica nos ofrece la oportunidad de tomar decisiones y solucionar
problemas. En nuestro caso realizaremos un trabajo de gestin educativa.
Para lo cual es necesario que revisemos algunos trminos comunes
utilizados en el anlisis estadstico.

Estadstica Descriptiva:
Es el conjunto de mtodos estadsticos que se relacionan con el resumen y
descripcin de datos, con tablas grficas y el anlisis mediante algunos
clculos.

Inferencia Estadstica
Es el conjunto de mtodos con los que se hacen la generalizacin o la
inferencia sobre una poblacin utilizando la muestra a un determinado nivel
de confianza.
Estas dos partes de la estadstica no son mutuamente excluyentes, ya que
para utilizar los mtodos de la inferencia estadstica, se requiere conocer los
mtodos de la estadstica descriptiva.

Poblacin
Es un conjunto de elementos que contienen una o ms caractersticas
observables de naturaleza cualitativa o cuantitativa que se puede medir en

ellos.
Parmetro es una medida descriptiva de la poblacin total de todas las
observaciones de inters, es decir, es el valor representativo de una
poblacin. Se simbolizan con letras griegas.
Tipos de poblacin:
Por el nmero de elementos que la componen, la poblacin se clasifica en
finita o infinita. La poblacin es finita si tiene un nmero finito de
elementos. En caso contrario la poblacin es infinita.
Muestra Es una parte representativa de la poblacin que se selecciona
para ser estudiada de acuerdo con un plan o regla, con el fin de obtener
informacin a cerca de la poblacin de la cual proviene.
Estimador es el valor representativo de una muestra. Se simboliza con
letras latinas. Existen tantos estimadores como muestra se extraiga de una
poblacin.

PARAMETROS

ESTIMADORES
X Media muestral

Media poblacional

2 Varianza poblacional

S2 Varianza muestral

Desviacin estndar poblacional

S Des. Estndar muestral

Proporcin poblacional

proporcin muestral

Datos: Son registros de caractersticas, los datos pueden ser constantes y


variables.
Variables: Es una caracterstica de la muestra o poblacin que toma
diversos valores en las unidades elementales. Ejemplo: Edad de los
participantes en esta clase, profesin de los profesores de una universidad.
Tipos de variables
Variables Cualitativos:

Es el registro de un atributo o una cualidad,

que proviene de una observacin. Las operaciones posibles son: la tasa


porcentual y proporciones. Ejemplos: El 60 % son varones, 8 de cada 10

participantes son mayores (porcin). En este tipo de variables conocemos


las variables cualitativas nominales y las variables cualitativas ordinales

Cuantitativos: Es el registro de una caracterstica que se puede establecer


con claridad criterios de magnitud a travs de un conteo o una medicin.
Las operaciones posibles son los promedios y las medidas de dispersin
entre otras.
Tipos de variables cuantitativas:
Discretas: Cuando la variable solo puede tomar determinados valores
dentro de una escala de valores. Proviene de un conteo. Ejemplo Nmero
de carros vendidos por da, nmero de paciente atendidos por da, etc.
Continuas: Cuando la variable puede tomar cualquier valor dentro de una
escala de valores. Proviene de una medicin. Ejemplo: el tiempo de
permanencia de los participantes.
Qu se pueden hacer con los datos?
Identificar caractersticas de inters para la gestin:
La recoleccin de dato nos permite:

Organizar en tablas, grficos y figuras.

Calcular promedios (media, mediana y moda).

Calcular su dispersin (varianza, desviacin estndar y coeficiente de


variacin).

Determinar una ecuacin que represente la relacin entre ellos


(regresin lineal).

Determinar el grado de asociacin entre ellos (correlacin).

Analizar dentro de un horizonte (series de tiempo).

El uso de los datos es para mejorar la calidad del trabajo o de una gestin.

Recopilacin y Presentacin de datos:


Una de las tareas ms difciles que ocupa mayor tiempo en la elaboracin
de un trabajo de investigacin es la recoleccin de datos vlidos y

confiables. Los datos se recopilan como un medio para describir los hechos
que estn tras los datos.
1) Cmo se recopilan los datos?

Las buenas decisiones se basan

en un ordenado registro de datos, para lo cual se debe:


a) Establecer objetivos claros
b) Determinar el tipo de datos. Una serie de tiempo es una
secuencia ordenada de observaciones sobre una variable en
particular
c) Para determinar si los datos sern tiles, se puede aplicar
cuatro criterios:

Los datos deben ser confiables y precisos. Se debe tener


un cuidado adecuado al recolectar los datos, que sean de
una fuente confiable y con la debida atencin en su
precisin.

Los

datos

deben

ser

pertinentes.

Deben

ser

representativos de las circunstancias para las cuales sern


utilizados. Los datos que supongan la representacin de la
actividad econmica debern mostrar las alzas y bajas de
acuerdo con las fluctuaciones cclicas en el pasado
histrico de la empresa.

Los datos deben ser consistentes. Cuando se modifican las


definiciones relacionadas con la forma como se renen los
datos, se debe hacer ajustes para mantener la consistencia
de los patrones histricos.

Los datos deben ser peridicos. Los datos que se


recolectan, y resumen y publican con base en una
periodicidad sern de gran valor para el investigador.

2) Escala de Medida
Es un instrumento de medida, con el que se asigna valores
(cualidades o nmeros) a las unidades estadsticas para una variable
definida. El conocimiento de las escalas de medicin es muy

importante, pues cada una de ellas tiene mtodos estadsticos


especficos. Las escalas de medicin son de los siguientes tipos:
Nominal, ordinal, de intervalos y de razones.
Escala nominal Nombres o clasificaciones que se utilizan para datos
en categoras distintas y separadas. Los nmeros son nominativos,
sirven para designar. Slo se puede analizar un conteo (frecuencias).
No son factibles las operaciones aritmticas. Se analiza a travs de
la comparacin igualdad y no igualdad. Ejemplo:
Sexo:

1. Masculino y
2. Femenino.

Escala ordinal

Son las que clasifican las observaciones en

categoras con un orden significativo. Los nmeros representan un


orden de las unidades estadsticas. No son cuantitativos, solo
simbolizan una posicin. Se analiza a travs de la desigualdad (> o <
que.)
Calificacin
Lugar

A, B, C, D
1 2 3 4

A >D
1 > 2

Escala de intervalo Medidas en una escala numrica en la cual el


valor cero es arbitrario pero la diferencia entre valores es importante.
Se utiliza nmeros cardinales. Se puede realizar operaciones
aritmticas. El cero no indica ausencia de la caracterstica, ejemplo:
Ao
Hora
Temperatura

0
00,00
0 C

Escala de razn

Son medidas numricas en las cuales cero es un

valor fijo en cualquier escala y la diferencia entre valores es


importante.

Se utiliza nmeros cardinales. Se puede realizar

operaciones aritmticas. El cero indica ausencia de la caracterstica.


Ejemplo: Ingreso mensual
3) Redondeo de Datos

S/. 0.00 y N. de hijos zero.

En cualquier anlisis, continuamente se divide un nmero por otro


obtenindose en algunas ocasiones un nmero infinito de decimales.
Para cortar o redondear se siguen las siguientes reglas:
a) Para la respuesta final, debemos redondear hasta dos lugares
mas de lo que haba en los datos originales ejemplo:
Datos originales :

enteros

Resultado final :

2 decimales

b) Si la cifra que sigue es mayor a 5, se aumente 1; si la cifra que


sigue es menor a 5, queda igual ejemplo:
5,776

5,78

5,123

5,12

4) Fuentes de Datos. Se pueden clasificar en primarias y secundarias.


Las fuentes secundarias de datos, son datos ya publicados,
recolectados con fines diferentes de los que la investigacin
especfica necesita tener a la mano. Este tipo de datos se puede
clasificar a su vez en fuentes internas, originadas dentro de la
organizacin, o de fuentes externas, generadas fuera de ella. Las
publicaciones basadas en censos, tesis, revistas son buenos
ejemplos de fuentes secundarias externas. Con frecuencia, se
utilizan los registros de contabilidad como fuentes de datos
secundarios internos.

Las organizaciones que disponen de publicaciones tenemos: INEI,


SUNAT, SUNAD, COFIDE, ADEX, SIN, BCR, PROMPEX, SBS,
MINISTERIOS, etc.
Las fuentes primarias de datos, comprenden todos los mtodos de
la recoleccin de datos originales. Es comn que este tipo de datos
se rena mediante procedimientos de muestreo, encuestas de panel,
etc. Se registran bajo dos mtodos.

5)

Mtodos y Tcnicas de recoleccin


a) Mtodos directos. El responsable registra personalmente la
caracterstica. Ejemplo el registro del tiempo que demora un
cliente en un Banco. Comprende dos tcnicas:

Observacin. Se registra el dato bajo condiciones


normales, cuando se mide el desempeo, la persona
observada no debe saber que es sujeta de observacin, se
utiliza generalmente una hoja de registro, por ejemplo la
observacin de la conducta de un comprador en un
autoservicio.

Experimentacin. Se registra un dato bajo condiciones


probadas, simulando el proceso lo mas real posible.
Ejemplo

b) Mtodos indirectos. Se registra la caracterstica

a travs de

preguntas. No se realiza medicin. Ejemplo: Se pregunta a un


cliente el tiempo que demor en realizar una gestin en el Banco,
comprende dos tcnicas:

La encuesta.

Se elabora un cuestionario de preguntas

abiertas o cerradas, al disearlas se debe: Elegir los temas


generales de la encuesta; Decidir la forma de aplicarlo por
correo, telfono o persona; Plantear preguntas, Realizar
una prueba piloto y hacer revisiones finales. Ejemplo Una
encuesta para conocer el grado de satisfaccin de los
clientes de una Banco.

La entrevista. Permite recolectar datos a partir de un


dilogo, que puede ser estructurada o no estructurada.
Ejemplo entrevista a un gerente de produccin sobre la
aplicacin de normas de calidad.

6)

Selecciona de la caracterstica, la fuente y la tcnica


a) Definir CARACTERSTICAS que interesan registrar.
b) Identificar la FUENTE de informacin apropiada para cada
caracterstica

c) Seleccionar la TCNICA ms conveniente.

CARACTERSTICAS
Tasa de mortalidad

FUENTE

TCNICA

Secundaria

Fichaje

Nivel socioeconmico Fam. Primaria

Encuesta

Textura del producto

Entrevista

Primaria

El cuestionario. Consiste en un conjunto de preguntas diseadas de


acuerdo a la necesidad de informacin, junto con las hojas de registro,
es la tcnica ms comn para la recopilacin de datos de fuentes
primarias.
Recomendaciones para su elaboracin:

Las preguntas deben ser coherentes con el objetivo de la


investigacin

La extensin (N de preguntas) depende de la necesidad de


informacin

El lenguaje utilizado en las preguntas debe ser entendible por los


encuestados

Debe evitarse la ambigedad: Ejemplo: Fuma? Si

No formular preguntas dirigidas evitar adjetivos cree. que el precio


es alto? Si

No

No

Preguntas cerradas:

Las posibles respuestas se presentan como alternativa

Facilita la codificacin y operatividad de los datos. Ejemplo posee


usted una computadora compatible? Si

No

Preguntas abiertas

Los encuestados tienen la libertad de emitir su opinin

Se utiliza cuando no se tiene precisin sobre las posibles respuestas

Dificulta la recoleccin de datos (incomoda al encuestado). Ejemplo


Qu opinin tiene sobre la poltica econmica del actual Gobierno?

7) Las tablas y los grficos


Los datos deben organizarse en tablas y en grficos para entender mejor
su naturaleza. Las tablas de distribucin pueden ser simples o cruzadas
a) Tablas simples.

Sirven para presentar una sola variable

Puede representar datos cualitativos o cuantitativos

Presentan por lo menos dos columnas: categora o clase y el


nmero de datos frecuencias de clase.

Puede incluirse una columna de tasa porcentual

Para datos cualitativos se siguen los siguientes pasos:


identificar diferentes categoras, realizar un conteo y elaborar
la tabla: Ttulo, cuerpo y fuente, ejemplo
Categora

N Alumnos Tasa porcentual (%)

Excelente

11.11

Bueno

16

35.55

Aceptable

12

26.67

17.78

Malo
Muy malo

TOTAL
b)

8.89

45

100.00

Tablas cruzadas

Sirven para representar dos o ms variables cualitativas.

En cada celda se puede incluir la frecuencia absoluta y relativa


(por fila, columna y total). Ejemplo Rendimiento en el aprendizaje
con la satisfaccin con la lectura:

Satisfaccin
con lectura

Rendimiento en el aprendizaje
Malo

Regular Bueno Excelente Total

Bajo

10

14

34

Medio

15

Alto

11

17

42

Total

17

27

26

21

91

a. Para datos cuantitativos.

Analizaremos

con

un

ejemplo

del

nmero de horas semanales que los nios menores de seis aos de


edad, se dedican a ver televisin. En una muestra de 25 nios se
encontr los siguientes nmeros de horas semanales:
10 19 25 19 26 16 19 27 27 25 23 22 17 12 20 15 21 23 26 14 18
25 23 24 21
Pasos necesarios para la construccin de los intervalos de clase o
tablas de frecuencias.
1.

Eleccin de nmero de clases. Es arbitraria, comnmente


se establece de 5 a 20 clases dependiendo del nmero de
datos.
Existe el mtodo de Esturges:

k 1 3.322log10 n
= 1 + 3.322 (log10 25)
= 1 + 3.322 (1.39794)
= 1 + 4.6439567
2.

Clculo de intervalo de clase

El intervalo de clase es el

tamao o la amplitud de las clases.

Se obtiene de la

diferencia entre el mayor y el menor valor numrico de los


datos, la cual nos indicara la distancia mnima que debe
cubrir la suma de los intervalos de clase. Esta distancia
dividida entre el nmero de clase nos da el intervalo de
clase.

IC

ValorMxim o ValorMnim o
NmeroDeClasesDeseado

IC

3.

27 10
17

2.8 3
6
6

Eleccin del lmite inferior de la primera o superior de la


ltima clase y clculo de los lmites de las dems clases.
Limites de clase, son los puntos que limitan a cada clase.

4.

Clculo de las frecuencias absolutas de clase,


Frecuencias

Es el nmero de observaciones que

pertenecen a una clase de intervalos.


5.

Clculo de los valores medios de clase (Vi)

Li Ls
vi
2
6.

Li

Lmite inferior de la clase

Ls

Lmite superior de la clase

Clculo de las frecuencias relativas de clase (Pi)


Pi =

7.

Xi/ N total de observaciones

1/25

Clculo de las frecuencias relativas acumuladas (F i)


F i = fi
Fi = Fi - 1 + fi ( i = 2,3, ..., k )
Donde:
k = Nmero total de clases
F = 1/25 + 2/25 =
Clase

Intervalo

fi

Vi

fi//n

Fi//n

10 - 13

11.5

2/25=0.08

2/25= 0.08

13 - 16

14.5

2/25=0.08

4/25= 0.16

16 - 19

17.5

3/25=0.12

7/25= 0.28

19 - 22

20.5

6/25=0.24

13/25= 0.52

22 - 25

23.5

5/25=0.20

18/25= 0.72

25 - 28

26.5

7/25=0.28

25/25= 1.00

25

Informacin:

(i).

Es el resultado de los datos procesados y organizados de acuerdo a


ciertos objetivos o a ciertos criterios de clasificacin. Es decir, no hay
informacin sin datos. Con los mismos datos podemos obtener
distintas informaciones.

Resumen
-

La estadstica como ciencia nos proporciona un conjunto de


tcnicas y herramientas que se utilizan en la recoleccin, anlisis
e interpretacin de los datos, con el objeto de alcanzar mayor
conocimiento de una situacin especfica sobre la que se desea
tomar decisiones, usualmente bajo condiciones de incertidumbre.

La estadstica es una excelente herramienta que nos permite


fortalecer la gestin, as mismo la informtica nos facilita la
presentacin ordenada de los datos.

Actividades Sugeridas

Lea con sumo cuidado cada uno de los temas, analiza e interprete los
resultados de los datos es vital para la discusin en todo trabajo
profesional y de gestin.

Es importante que revisen otras bibliografas recomendadas, con el


propsito de fortalecer el aprendizaje.

ANEXO A LA SEGUNDA UNIDAD

ESTADSTICA E INFORMTICA APLICADA A LA


GESTIN EDUCATIVA

Descripcin de un conjunto de mediciones


Regresin y coeficiente de correlacin en los
pronsticos

Objetivo

Calcular e interpretar las medidas de tendencia central y de


dispersin.

Aplicar los diferentes mtodos para determinar las medidas de


tendencia central y de dispersin con datos simples y datos
agrupados

Desarrollar en forma descriptiva e inferencial, los modelos de


regresin lineal simple y de correlacin, como un medio de utilizar
una

variable

independiente

para

predecir

otra

variable

dependiente, as mismo, medir la intensidad de la asociacin


entre las dos variables.

Introduccin

El conocimiento de la descripcin de un conjunto de mediciones es muy


importante como insumo para temas de inferencia estadstica. Razn por
la cual estudiaremos la media, la mediana, la moda, la varianza, la
desviacin estndar y el coeficiente de variacin.

Motivar al participante a utilizar el anlisis de regresin, con el propsito


de realizar predicciones. La finalidad de usar el anlisis de regresin
lineal, es el desarrollo de un modelo estadstico que nos permita predecir
los valores de una variable dependiente basados en los valores de al
menos una variable independiente o explicatorio.

En la presente unidad mantendremos nuestra atencin en un modelo de


regresin lineal simple, que utiliza una sola variable independiente, para
predecir la variable dependiente.

El anlisis de correlacin, lo utilizaremos para medir la intensidad de


asociacin entre las variables independiente y dependiente.

Contenidos

Los contenidos de la presente unidad se encuentran en la presente gua


de la pgina 52 a la pgina 83. As mismo, encontrar en el libro de
Estadstica para Administracin y EconomaLin/Marchal,Wathem en el
campus virtual. Debe revisar el captulo 13 del Libro antes mencionado.

Descripcin de un conjunto de mediciones


Hacer inferencia implica descripcin parcial o total de un fenmeno u
objeto fsico, las medidas descriptivas nos permiten tener una
apreciacin clara del conjunto de datos.
1.

Mtodo grfico de los datos

Una descripcin informativa de cualquier conjunto de datos o mediciones


puede realizarse mediante una distribucin de frecuencias relativas o
absolutas. En este caso se divide la amplitud de los valores numricos
de los datos en un cierto nmero de intervalo o clase y se cuenta
cuantas observaciones pertenecen a cada una de ellas.

Para aplicar nuestro caso sobre el mtodo grfico, lo vamos ha realizar


con un ejemplo aplicado con los datos de las edades de un grupo de 25
personas que laboran en un Centro Educativo, para la construccin de
los intervalos se ha realizado en base a los pasos estructurados en el
primer ejemplo.
Clases

Intervalo

fi

Vi

fi//n

Fi//n

15.0 - 17.5

16.25

3/25=0.12

3/25= 0.12

17.5 - 20.0

18.75

2/25=0.08

5/25= 0.20

20.0 - 22.5

21.25

4/25=0.16

9/25= 0.36

22.5 - 25.0

23.75

7/25=0.28

16/25= 0.64

25.0 - 27.5

26.25

5/25=0.20

21/25= 0.84

27.5 - 30.5

28.75

4/25=0.16

25/25= 1.00

25
a.

Histogramas

Es la grfica de barras verticales sin espaciamiento entre ellas, se


construye colocando en el eje vertical a las frecuencias absolutas o
relativas y en el eje horizontal a los lmites de clase de una tabla de
frecuencia.

Fi
8
6
4
2
Limites de clase
15 17.5 20 22.5 25 27.5 30
b.

Polgono de Frecuencia (PF)

Es una grfica de lneas rectas que unen los puntos obtenido al colocar
en el eje horizontal a los valores medios de clase y en el vertical a las
frecuencias relativas o absolutas.
c.

Ojiva o Polgono de Frecuencia Acumulada

Es una grfica construida con segmentos de lneas rectas que unen los
puntos obtenidos al colocar en el eje horizontal a los lmites superiores
de clase y en el eje vertical a las frecuencias acumuladas absolutas
2.

Mtodos numricos

El histograma y el polgono de frecuencias proporcionan informacin til


respecto al conjunto de mediciones, sin embargo no es adecuado para
hacer inferencias.

Para hacer inferencias con respecto a una poblacin basada en la


informacin contenida en una muestra y medir la bondad de la
inferencia, se requiere cantidades obtenidas rigurosamente definidas
para analizar la informacin de la muestra.

Las cantidades que se pretende definir son mediciones numricas


descriptivas de un conjunto de datos, se tendr dos tipos de nmeros
descriptivos: las medidas de tendencia central y las medidas de
dispersin o variacin.

a.

Medidas de tendencia central

Las medidas de tendencia central son valores que nos indican lo ms


representativo del conjunto de datos, se refiere al punto medio de una
distribucin, generalmente se conoce como medidas de posicin. Las
principales medidas de tendencia central son: la media, la mediana y la
moda
Media Aritmtica De un conjunto de datos de n mediciones esta dada
por:

Se obtiene sumando los valores registrados y divididos entre el nmero


de datos. Tambin llamada promedio es la ms comn de las utilizadas
para describir una distribucin de frecuencias.

579
23.16
25

aos de edad promedio

La media es la ms usual de las medidas descriptivas, tiene la ventaja


de ser muy fcil de calcular y la desventaja, es que, por ser el punto de
equilibrio de los datos es muy sensible o la presencia de observaciones
extremos.

Mediana (Md) Es el conjunto de nmeros ordenados de menor a mayor,


la mediana es el nmero central del arreglo

Si n es un nmero impar solo hay un valor central

15, 17, 17, 19, 19, 20, 21, 22, 22, 23, 23, 23, 23, 24, 24, 24, 25, 25, 25,
26, 27, 28, 28, 29, 30

Md X ( n 1) X ( 251) X (13) 23 Aos de edad


2

Si n es un nmero par, hay dos valores centrales, la mediana debe


tomarse como la media de estos valores.
15, 17, 17, 19, 19, 20, 21, 22, 22, 23, 23, 23, 23, 24, 24, 24, 25, 25, 25,
26, 27, 28, 28, 29, 30, 30

Md

= 23 + 24 / 2 = 47/2 = 23.5 aos de servicios

Xn Xn
Md

X n X 26 X (13) 23

2

Xn

1
2

23 24
S / .23.5
2

X 131 X 14 24

Moda: La Moda de un conjunto de datos es el valor que se presenta con


mayor frecuencia, a menudo no es un valor nico.
15, 17, 17, 19, 19, 20, 21, 22, 22, 23, 23, 23, 23, 24, 24, 24, 25, 25, 25,
26, 27, 28, 28, 29, 30
La moda es Mo = 23 aos de edad con cuatro frecuencias.
b.

Medidas de dispersin

Para caracterizar un conjunto de datos no es suficiente con las medidas


de tendencia central, sino que es necesario considerar la dispersin
para tener en cuenta la variabilidad de las observaciones. Se refiere a la
extensin o amplitud de los datos de una distribucin, representa el
grado de variabilidad de los datos.

Dispersin Los

datos

numricos

tienden a extenderse alrededor

de un valor medio. Las Medidas de dispersin ms usadas son:

Varianza (S)
La varianza de un conjunto de datos o mediciones, es la suma de los
cuadrados de las desviaciones de las observaciones con respecto a su
media, dividida entre el nmero de observaciones menos uno.
2

xi
1

2
x

S
n 1
n

S2

5792 14.89
1
13
,
717

25 1
25

La varianza es una medida que nos proporciona informacin sobre el


grado de dispersin de los valores de una serie con respecto a su media,
de tal modo que, mientras mayor sea el valor de la varianza, mayor es la
dispersin y cuanto ms pequea sea la varianza, menor es la
dispersin, lo que significa que mayor es la concentracin de los datos o
valores alrededor de su media.

La varianza es til en comparacin de la varianza relativa de dos


conjuntos de mediciones pero slo aporta medicin con respecto a la
variacin en un slo conjunto cuando se interpreta en trminos de la
desviacin estndar.
Desviacin Estndar (S)

La desviacin estndar de un conjunto de mediciones es la raz


cuadrada positiva de la varianza.

S S2

S 14.89 3.86 Aos de servicios

La desviacin estndar puede utilizarse para dar una idea bastante


exacta de la variacin de los datos en un solo conjunto de mediciones.
Puede interpretarse utilizando el teorema de Tchebysheff y mediante la
regla emprica.

Muchas distribuciones de los datos de la vida real tienen la forma de una


montaa, es decir se aproximan a una distribucin de frecuencias en
forma de una campana (curva normal). Los datos que tienen una
distribucin acampanada tienen caractersticas bien definidas con
respecto a la variacin.

Coeficiente de Variacin
CV

S
100
X

CV

3.86
100 16.67%
23.16

Regla emprica
Para una distribucin de mediciones que es aproximadamente normal
(forma de campana) el intervalo.
contiene aproximadamente el 68.27% de las mediciones
2 contiene aproximadamente el 95.45% de las mediciones
3 contiene aproximadamente el 99.73% de las mediciones.

Izquierda (-)
X, Md, Mo

derecha (+)

68.27%
95.45%
99.73%
Ejemplo: Los aos de servicios de los 25 profesionales tienen una
distribucin aproximada a la normal con una media de 23.16 aos de
servicios y una desviacin estndar de 3.86 aos de servicios.
= 23.16 3.86 19.3 a 27.02
2 = 23.16 7.72 15.44 a 30.88
3 = 23.16 11.58 11.58 a 34.74

De acuerdo a la regla emprica se espera que aproximadamente el 68%


de las observaciones estarn en el intervalo (19.3, 27.02), el 95% de las
observaciones en el intervalo (15.44, 30.88) y todas ellas en el intervalo
(11.58, 34.74).

Ahora vamos ingresar y procesar las mismas informaciones del ejemplo


anterior en el software del SPSS, para ver cuan simple es trabajar con
estos programas estadsticos. Para ello primero debemos definir la
variable en el icono de la pestaita de la hoja de clculo que se
encuentra en la parte inferior a lado izquierdo (variable view). Luego
ingresamos los datos en data view.

Teniendo la base de datos podemos procesar para lo cual en el men


buscamos anlisis y vamos a la opcin de estadstica bsica.

Statistics
Aos de serv icio
N
Valid
Missing
Mean
Median
Mode
St d. Dev iation
Variance

25
0
23.1600
23.0000
23.00
3.85876
14.890

Histogram

Frequency

1
Mean =23,16
Std. Dev. =3,859
N =25
0
16,00

18,00

20,00

22,00

24,00

26,00

28,00

30,00

Aos de servicio

Regresin y correlacin

El anlisis de regresin y correlacin reconoce que puede haber una


relacin determinable y cuantificable entre dos o ms variables. Es decir
una variable dependiente de otra y puede estar determinado por esta; o
bien podemos decir que una variable es funcin de otra. La notacin que
lo expresa es:

f
Y est en funcin de X, y establece que Y depende de X de alguna
manera. Como Y depende de X, es la variable dependiente y X es la
variable independiente.

Variable dependiente e independiente. La variable dependiente est en


funcin de la variable independiente.
Regresin y correlacin.
La regresin determina si X e Y presentan una relacin positiva, es decir,
si crecen o decrecen a la vez, o si la relacin es negativa por que se
desplazan en sentido opuesto. Tambin determina la magnitud de la
variable de Y para una variable dada de X. La correlacin mide la solidez
de la relacin entre X e Y.

Regresin simple. Establece que la variable dependiente Y est en


funcin de una sola variable independiente. A veces se denomina
anlisis bivariante porque solo son hay implicadas dos variables: una
dependiente y otra independiente.
Regresin mltiple. Abarca dos o ms variables independientes. S se
dice que Y depende de tres variables independientes, podemos
escribir: f 1, 2 , 3 .

Un modelo que contenga K variables

independientes se puede expresar: f 1, 2 ,..., k

El objetivo del anlisis de regresin lineal es encontrar una recta que


pase por el diagrama de dispersin y represente lo mejor posible los
datos puntuales.
Ejemplos:
. La estatura y el peso de un grupo de personas
. El ingreso y el consumo de una familia
. La temperatura y la tasa de reproduccin de una bacteria
Objetivo bsico del anlisis de Regresin
La relacin entre variables son deterministas o estocsticas (aleatorias).
La relacin determinista se puede expresar mediante un modelo
matemtico. La variable dependiente presenta un cierto grado de

aleatoriedad. Un modelo de esta naturaleza se dice que es estocstico


porque est presente una funcin aleatoria. Una funcin que refleja esta
variacin es:

Y 0 1 X i i
La frmula representa la relacin poblacional segn la cual la Y es
regresiva en funcin de X. Los parmetros son o y 1.

Ordenada de origen de la recta utiliza para reflejar la relacin


entre X e Y a nivel poblacional. Es el valor de Y cuando X toma el
valor de cero.

Es la pendiente de la recta, es el nmero de unidades que


aumenta o disminuye Y por cada unidad que aumenta o
disminuye X. Puede ser positivo, negativo o cero y entero o

fraccionario.
Variable aleatoria no observable. El valor (letra griega psilon)
es un trmino aleatorio de error ideado para recoger la variacin
por encima y por debajo de la recta de regresin debida a todos
los dems factores no incluidos en el modelo.

Modelos

determinista

estocstico.

Un

modelo

matemtico

determinista se expresa con 0 1i . Dado un valor cualquiera de


X, el valor de Y se puede determinar con precisin. Un modelo
estocstico contiene dos o mas componentes aleatorios que conducen al
error de precisin y se expresa con i 0 1 i i
Hay que destacar que la recta verdadera de regresin de la poblacin
sigue siendo desconocida, al igual que la mayora de los parmetros. Lo
mejor que podemos hacer es estimarla mediante el modelo:

0 1 i
Los valores 0 y 1 son estimadores de los parmetros poblacionales

0 y 1 . Se denominan, respectivamente, constantes de regresin y

coeficiente de regresin:

En el modelo de lnea recta:

1 0 1 i i

i = 1,..., n

Las suposiciones son:


a)

1 , 2 ... n son observaciones de variables independientes


controladas por el investigador.

b)

0 y 1

son parmetros desconocidos que determinan la

recta de regresin i 0 1i
c)

1, 2, ..., n son variables aleatorias no observables,


independientes, distribuidas normalmente con media cero
y varianza . simblicamente puede escribirse:

Mtodo de mnimos cuadrados (La recta de ajuste ptimo)


Para encontrar la lnea recta de mejor ajuste a un conjunto de datos, se
debe minimizar las desviaciones que presentan las observaciones en
relacin con la recta que se propone. Para lo cual debemos encontrar
los estimadores de los parmetros o y 1. La ecuacin de pronstico o
perdicin es:
0 1 i 0 y1 Representan los estimadores de

0 y 1

El mtodo de mnimos cuadrados consiste en encontrar

0 y1 ,

estimadores de 0 y 1 , tales que minimicen la suma de cuadrados de las


desviaciones entre los valores observados y pronosticados, la cual tiene
como expresin

SCE i 0 1 i

SCE = Suma de Cuadrado del Error:

Los estimadores producidos por el mtodo son:

SCxy
SCx

SC xy xi y i

x y
i

SC x xi2

0 Y 1 X
La recta de regresin estimada es por tanto:

i 0 1 i
Estos clculos son de gran sensibilidad al redondeo, sobre todo cuando
se trata de calcular coeficientes de determinacin. Los errores de
redondeo en el clculo de la SCx y SCxy pueden afectar enormemente
la respuesta. Por lo que se recomienda trabajar por lo menos con cinco o
seis cifras.
Ejemplo de ajuste por mnimos cuadrados
El Director del Hospital Cayetano Heredia, supone que existe una
relacin directa entre los pesos y estaturas. Para determinar si esta
relacin existe recoge datos de 10 personas. Con estos datos solicita
determinar los estimadores de la regresin con su respectiva
interpretacin.

Individuos

Peso (Kg.)

Estatura (cm.)

XY

X2

Y2

63

162 10206

3969

26244

52

158

8216

2704

24964

78

167 13026

6084

27889

49

151

7399

2401

22801

71

162 11502

5041

26244

62

168 10416

3844

28224

68

167 11356

4624

27889

48

153

7344

2304

23409

56

152

8512

3136

23104

10

67

173 11591

4489

29929

614

1613 99568

38596 260697

Las estadsticas que necesitamos para estimar la recta de regresin


son:

614

1,613
38,596
260,697
99,586
i

2
i

2
i

Donde:
SCxy = 99,568 - (614) (1613) = 529.8
10
SCx = 38,596 - (614) = 896.4
10
SCy = 260.697 - (1613) = 529.1
10
Entonces el valor de 1 es:

= 529.8 = 0.591
896.4

Adems necesitamos:

= 61.4

= 161.3

y por lo tanto:

0 q

= 161.3 - (0.591)(61.4) = 125.0126

De acuerdo al principio de mnimos cuadrados la lnea recta de mejor


ajuste (recta de regresin) que relaciona los pesos y las estaturas es:
i 125.0126 0.591i

Estatura
180

170

160

Obser ved
150

Linear

40

50

60

70

80

Peso

Interpretacin de la ecuacin de regresin estimada


Cuando se obtiene una recta estimada de regresin el investigador se
enfrenta al problema de interpretar, lo que a menudo se hace
cometiendo errores.

De la estimacin de la ordenada al origen (o)


La ecuacin de regresin estimada
0 1 i

a un valor de X = 0 corresponde a un valor estimado


i 0

Lo que indica que o es el valor de prediccin para Y, cuando la variable


independiente toma el valor cero.

La estimacin de la ordenada al origen (o) no siempre tiene una


interpretacin prctica algunas veces, solo es un factor de ajuste que

permite representar la tendencia de los datos (en el espacio de valores


observados para la variable independiente) mediante un modelo de lnea
recta.

Para que sea posible interpretar o es necesario que:


a)

Sea fsicamente posible que X tome el valor cero

b)

Se haya colectado datos al rededor de X = 0

Del estimador de la pendiente o coeficiente de regresin 1


El estimador de la pendiente ( 1 ) o coeficiente de regresin estimado, es
de mayor importancia que 0 , ya que nos indica la forma en que se
relacionan X e Y, en el sentido que mide y en que direccin se modifican
los valores de Y cuando Xi cambia.
Recuerden que 1 estima la pendiente de la recta, o sea el nmero de
unidades que cambia Y por cada uno de cambio de Xi.
Para interpretar 1 , es necesario tener en cuenta las caractersticas del
fenmeno que se estudia por que una interpretacin matemtica es
insuficiente.

Una de las suposiciones del modelo es que para cada posible valor de
X, Y es una variable aleatoria con distribucin normal cuya media es
y/x E(y/x).

Entonces lo correcto es decir que las medias poblacionales de Y se


incrementan al aumentar X (esto es en el caso del ejemplo de pesos y
estatura).

Error tpico de la estimacin: Grado de bondad de ajuste

El error tpico de la estimacin, Se, es una medida de la cantidad media


en que las observaciones reales de Y varan entorno a la recta de

regresin

Para predecir un valor futuro de Y, los errores aleatorios afectarn el


error de prediccin. En consecuencia, la variabilidad de los errores
aleatorios medida por juega un papel importante cuando se estima o
se pronostica con Mnimos Cuadrados.

Si se quiere encontrar cuotas para el error de prediccin, lo conveniente


es estimar la varianza () de Y para un valor dado de X, por lo que es
razonable usar la SCE respecto a la recta de prediccin.
La frmula del estimador de es un buen estimador insesgado y
basado en (n-2) grados de libertad.

SC y 1 SC xy
SCE

n2
n2

2 S e2

Sustituyendo por S e2 en las distribuciones de los estimadores de los


mnimos cuadrados se obtiene para la varianza de 0 y1 :

S 0
2

S 1

S e2

2
i

nSCx
S e2

SCx

Ejemplo: Continuando el anlisis de los datos usados en el ejemplo


anterior, necesitamos las siguientes informaciones:
SCxy =

529.8

SCx

892.4

SCy

520.1

38,596.0

125.0126

0.591

61.4

Para calcular los estimadores de estas varianzas requerimos estimar


entonces su estimador es:

Se2

SCE SCy 1SCxy 520.1 0.591529.8

25.873525
n2
n2
10 2

En consecuencia las varianzas estimadas de o y 1 son:

S 2 0

S 21

Se2 i2
nSCx

25.8738,596
111.39
10896.4

Se2
25.87

0.029
SCx 896.4

Estimacin de Intervalos en anlisis de regresin


Ahora derivamos los intervalos de confianza para 0 y 1. Usando la
distribucin de t de estudent y concluimos que un intervalo de confianza
de nivel 1 - para i ( i = 0, 1 ) est dado por (Li, Ls), donde:

Li i S i t
2

Ls i S i t
2

n 2

n 2

Un intervalo de confianza al 99% para 1 tiene lmites.


Li 1 S 1 t
2

n 2

0.591 0.0285 3.355 0.0247

Li 1 S 1 t
2

n 2

0.591 0.0285 3.355 1.1573

(0.0247, 1.1573)
Pruebas de inferencia sobre el coeficiente de regresin
Ahora utilizaremos el estimador y su varianza para producir inferencia
sobre el parmetro de inters. Conocemos la distribucin de los
estimadores:
o ~ N (o, o)
1 ~ N (1; 1)

Se tiene estimadores para

2 2

Parmetros

S 2 0 S 21

Estimadores

Entonces podemos inferior sobre o y 1


Las hiptesis de inters son:

Sea i* (i = 0, 1) un nmero arbitrario, los juegos de hiptesis que


consideramos son:
a) Ho: i i* en oposicin a
Ha: i > i*
b) Ho: i > i* en oposicin a
Ha: i < i*
c)

Ho: i = i* en oposicin a
Ha: i i*

Dado que la distribucin de i ( i = 0, 1 ) es normal


Entonces el estadstico de prueba:

tc

i i*
S i

Los grados de libertad de tc , que tiene una distribucin de student


cuando i = *i ( i = 0, 1 ), son ahora n - 2 que es el divisor de S e2 el
estimador . Por lo tanto las reglas de decisin para los juegos de
hiptesis son:

a)

Rechazar H0

s c > t (n-2)

b)

Rechazar H0

s c - t (n-2)

c)

Rechazar H0

s c > t/2 (n-2)


s c - t/2 (n-2)

En el ejemplo que se viene analizando, donde la variable independiente


representa el peso, la dependiente mide la estatura, una hiptesis
interesante es:

H0: 1 = 0 en oposicin a
Ha: 1 0

1 = 0.591

S1 = 0.0285

El valor de estadstica de prueba es:

tc

1 *
S 1

0.591 0
3.5008
0.0285

Se tiene 10 pares de observaciones, para probar la hiptesis con =


0.01 los valores crticos son t0.005(8) = 3.355 y - t0.005(8) = - 3.355 como t0 >
3.355, se rechaza H0 y se concluye con = 0.01 que la pendiente de la
recta es mayor que cero.

Interpretacin de la inferencia de 0
0 es la ordenada al origen de la recta, o sea el valor de Y cuando X=0
en consecuencia su estimador 0 es el valor de la prediccin YX=0.
Anteriormente se estableci que para que 0 tenga una interpretacin
prctica debe ser fsicamente posible que X tome el valor de cero,
adems que debe tener observaciones alrededor de este valor. Ahora
reforzamos estas ideas desde el punto de vista de las inferencias
estadsticas.
La varianza del estimador 0 es:

2 xi2
nSCx

y su varianza estimada:

S 0
2

De

donde

S 2 xi2
nSCx
apreciamos

que

la

varianza

se

incrementa

proporcionalmente a xi, de modo que la confiabilidad de 0 es mayor


cuando las observaciones de X se realicen cerca de cero, y el estimador
0 es intil cuando los valores observados se encuentran muy distantes
de cero. Estas observaciones son evidentes en los intervalos de
confianza para 0, cuya amplitud es directamente proporcional a S 0 y
por lo tanto, a xi; de manera que la informacin proporcionada por el
intervalo de confianza para 0 es mayor si las observaciones estn
cercanas a X = 0
Interpretacin de la inferencia de 1
Las inferencias sobre 1 dependen, del valor de S, como es evidente de

la expresin para su varianza que es:

2
1

SCx

la cual se estima por:

S e2

SCx

S 1

Desde el punto de vista de 1 tambin se requiere minimizar S e2 . La


varianza de 1 disminuye si aumenta SCx = (xi-x), es que sugiere que
se obtiene mejores inferencias sobre 1 a medida que el rango de
valores observadas para X es mayor.
La prueba del juego de hiptesis H0: 1 = 0 en oposicin a Ha: 1 0 es
la ms importante en el modelo de regresin lineal simple, ya que de ella
depende la decisin de si la variable independiente de X contribuye o no
a predecir Y.
Anlisis de correlacin

rxy

S xy
SxS y

S xy

1
x y
xy
n 1
n

S xy

1
x y 1 99,568 6141613 58.86
xy

n 1
n
10

Sxy = 58.86
Sx = 9.98
Sy = 7.60

rxy

S xy
58.86

0.776
9.987.60
Sx S y

El coeficiente de correlacin es: 0.776


Caractersticas:
1. El coeficiente de correlacin mide la relacin entre dos variables debido
a una causa o factor comn.
2. El valor de estos coeficientes est en el intervalo [-1, 1].
3. Si el coeficiente es positivo, las dos variables estudiadas tienden a variar
en el mismo sentido, esto es si se incrementa el valor de una variable se
incrementa el valor de la otra. Y si baja el valor de una baja el valor de la
otra.
4. Si el coeficiente es negativo las variables varan en sentido contrario.
5. La relacin entre las variables es ms estrecha cuando el valor del
coeficiente se acerca a 1 -1.
Ejemplo con software SPSS.
Con los siguientes datos muestrales:
Coeficiente Intelectual 135 115 95 100 110 120 125 130 140
Notas de examen
16 12 12 12 14 14 15 15 18
Determine y grafique la ecuacin de regresin
Calcule e interprete el coeficiente de correlacin
Calcule e interprete el coeficiente de correlacin
Prediga la nota del examen si el coeficiente intelectual es de 90.

Model Summary and Parameter Estimates


Dependent Variable: Not as de examen
Equation
Linear

Model Summary
F
df 1
30.751
1

R Square
.815

df 2
7

Sig.
.001

Paramet er Estimates
Constant
b1
-.079
.120

The independent v ariable is Coef iciente intelectual.

Notas de examen
Observed
Linear

18,00

17,00

16,00

15,00

14,00

13,00

12,00
90,00

100,00

110,00

120,00

130,00

Coeficiente intelectual

i 0.079 0.12 i
Model Summary
Model
1

R
.903a

R Square
.815

Adjusted
R Square
.788

Std. Error of
the Est imat e
.94280

a. Predictors: (Constant), Coef icient e int electual

140,00

Resumen

Las medidas de tendencia central y de dispersin son herramientas


poderosas para la toma de decisiones en todo tipo de gestin.

Todo trabajo de gestin implica un examen de la relacin de dos


conjuntos de variables. El anlisis de regresin se ocupa en parte
del desarrollo de una expresin matemtica para tal relacin. La
forma general de la ecuacin de regresin es Y = 0 + 1X, en
donde Y es el valor pronosticado, dado un valor especfico de X.

La recta de regresin se determina utilizando la tcnica de


mnimos cuadrados, donde minimiza la suma de los cuadrados de
las desviaciones entre los valores de Y reales de Y pronosticado
sobre la recta de regresin.

Actividades Sugeridas

Es importante que los participantes apliquen en el quehacer diario de su


profesin y practiquen en toda gestin y en el trabajo de investigacin.

Entre otras actividades sugeridas, para este caso es utilizar la tecnologa


disponible, como las calculadoras cientficas o un Software estadstico
SPSS (Programa Estadstico para el Estudio de las Ciencias Sociales) y
luego interpretar los resultados obtenidos.

ANEXO A LA TECERA UNIDAD

ESTADSTICA E INFORMTICA APLICADA A


LA GESTIN EDUCATIVA

PROBABILIDAD, DISTRIBUCIONES
MUESTRALES Y TAMAO DE MUESTRA

Objetivo

Desarrollar la comprensin de los conceptos bsicos de probabilidad que


es base fundamental para el estudio de distribuciones de probabilidad e
inferencia estadstica.

Usar la funcin de densidad de probabilidad normal para representar


ciertos tipos de fenmenos continuos y desarrollar conceptos de una
distribucin de muestreo para variables numricas para casos en que
una poblacin est distribuida normalmente.

Determinar la probabilidad que una observacin este arriba o debajo de


un valor, utilizando la distribucin normal estndar

Introduccin

En esta unidad estudiaremos las reglas bsicas de la probabilidad para


usar en evaluar las posibles ocurrencias de diferentes fenmenos.
Iniciaremos por analizar planteamientos para determinar probabilidades
que pueden usarse en diferentes situaciones.

Nuestro anlisis girar sobre la distribucin de probabilidades ms


importantes en estadstica, la distribucin normal y las distribuciones
muestrales.

Empezamos

estudiando

las

caractersticas

de

una

distribucin probabilstica normal y luego desarrollaremos diversas


aplicaciones.

Contenidos

Los contenidos de la presente unidad se encuentran en la presente gua


desde la pgina 84 a la pgina 112. En el libro de Estadstica para
Administracin y Economa. Mason/Lin/Marchal, lo puede encontrar.

Probabilidad
Para entender el fundamento racional de los procedimientos de decisin
estadstica es importante familiarizarse con la probabilidad.

La probabilidad es un mecanismo por medio del cual puede estudiarse


sucesos aleatorios, cuando stos se comparan con los fenmenos
deterministicos. Por ejemplo nadie espera predecir con certidumbre el
resultado de un experimento tan simple como el lanzamiento de una
moneda.

La probabilidad nos proporciona las bases matemticas para razonar de


una poblacin sobre la base de muestras.

La estadstica es el estudio de como la informacin de una muestra


puede ser usada para razonar acerca de una poblacin.

El concepto de probabilidad esta ligado a la frecuencia relativa. Esta


asociacin entre frecuencia relativa y probabilidad es la base para la
presentacin de principios probabilisticos.

Probabilidad en un lenguaje cotidiano nos indica la posibilidad de la


ocurrencia de un evento futuro.

El proceso para obtener una observacin es un experimento.

Los

resultados de un experimento son eventos aleatorios o estadsticos.


Experimento. Proceso mediante el cual obtenemos una observacin

Evento. Posible resultado de un experimento.


Ejemplos: Experimento

Preguntar a los estudiantes de maestra que

marca de computadoras prefiere adquirir.


Evento.

1.

Prefieren IBM

2.

Prefieren Olivetti

3.

Prefieren Compatible

Experimento: Tirar un dado


Evento. 1. Observar 1

4. Observar 4

2. Observar 2

5. Observar 5

3. Observar 3

6. Observar 6

La probabilidad es la interpretacin basada en la frecuencia relativa


como una medida significativa de la confianza de una persona en la
ocurrencia de un evento.

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
No puede

seguramente

Ocurrir

ocurre

Cuanto ms se acerca una probabilidad a 0, es ms improbable que


ocurra el evento al que se asocia. Cuanto ms se acerca la probabilidad
a 1 estaremos seguros de que ocurrir.
Principios para asignar una probabilidad
a) La probabilidad de cada punto muestral debe estar entre 0 y 1
b) La suma de las probabilidades de todos los puntos maestrales debe
ser igual a 1

La teora de la probabilidad nos permitir calcular la probabilidad de


observar resultados especficos, suponiendo que el modelo hipottico lo
sea correcto.

Experimento aleatorio

Es

aquel

cuyos

resultados

no

pueden

predecirse antes de su realizacin y, por lo tanto estn sujetos al azar.


Espacio muestral

Conjunto de todos los posibles resultados de un

experimento, lo identificaremos con la letra M.


Ejemplo.
del 2008

Produccin de leche en el Per durante el primer trimestre

M = {X/0 x }

Se pregunta a un estudiante su opinin sobre la calidad educativa de la


Universidad Alas Peruanas. Se registra la respuesta como favorable (F)
y desfavorable (D).
M = {F, D}

Caractersticas de los espacios muestrales:


a)

Espacio muestral discreto

Es el conjunto de todos los posibles resultados que puede ser finito,


infinito numerable.

Los posibles resultados pueden ponerse en

correspondencia con los nmeros naturales.


b)

Espacio Muestral continuo

Contiene todos los elementos en uno o varios segmentos de la lnea


real, o contiene al menos una parte de la recta real.

En relacin con el experimento aleatorio es conveniente recalcar


poblacin y muestra
Poblacin Es el conjunto de resultados potenciales de un experimento
aleatorio.
Muestra de una poblacin estadstica es el conjunto de resultados que
se colectan de hecho en una investigacin.

Espacio Muestral

Es el conjunto de posibles resultados de una

caracterstica.

Espacio Muestral de ingresos entre S/ 600.00 y S/ 3,000.00


Espacio Muestral de altura entre 0 centmetros y 3 metros
La muestra de una poblacin es el sub conjunto de la poblacin

1. Probabilidad clsica o a priori. Se basa en la consideracin de


que los resultados de un experimento son igualmente posibles y
mutuamente excluyentes. La probabilidad de que suceda un
evento A se calcula dividiendo el nmero de casos favorables
entre el nmero de casos posibles.

P (A) = N casos favorables


N casos posibles

Las aplicaciones de la probabilidad a priori se refieren casi


exclusivamente a experimentos idealizados con una estructura
similar o derivada de los juegos de azar.
Ejemplos:
a)

Al lanzar una moneda de 2 caras son eventos igualmente


posibles. De acuerdo a la definicin la probabilidad a priori
de cada una de ellas es 0.5.
E1: se observa cara
E2: se observa sello

P (A) =

N casos favorables =
N casos posibles

b)

1 =

0.5

Considerando el lanzamiento de un dado supone que la


ocurrencia de cada una de las 6 caras es resultados
igualmente posibles, el evento "nmero impar" tiene la
probabilidad de 3/6 1/2.

2. Probabilidad Axiomtica. Sea M cualquier espacio muestral y A


cualquier evento de este y P una funcin de probabilidad que
satisface los siguientes axiomas:

a.

P (A) [ 0, 1 ] A M
0 P(A) 1 A M

b.

P(M) = 1

c.

Si A1, A2,..., An son eventos mutuamente excluyentes en M

entonces:
n
n

i i
i 1
i 1

Variables aleatorias y sus distribuciones

Variable aleatoria
Es una funcin definida en un espacio muestral en el que a cada evento
se le asocia un nmero real. Las distribuciones de probabilidad se basan
en los valores de las variables aleatorias.

Ejemplo: Supongamos un espacio muestral donde cada evento


constituye la respuesta de saber o no hacer negocios de tres
participantes.

M = {NNN, SNN, NSN, NNS, SSN, SNS, NSS, SSS}


B1

B2

B3

B4

B5

B6

B7

B8

Si estamos interesados solo en el nmero de participantes que si saben


hacer negocios, entonces los resultados pueden representarse por los
nmeros 0, 1, 2 y 3, considerando estos nmeros como valores tomados
por una variable X. La variable X toma los valores de acuerdo a los
resultados de un experimento aleatorio.

Notacionalmente pueden establecerse los siguientes:


X (B1) = 0

X (B5) = 2

X (B2) = 1

X (B6) = 2

X (B3) = 1

X (B7) = 2

X (B4) = 1

X (B8) = 3

Distribucin de variables aleatorias


M = {B1, B2, B3, B4, B5, B6, B7, B8 }
Los eventos {B1} a {B8} forman una particin de M si le asociamos a
estos eventos las probabilidades entonces tendremos:
P (B1)

1/8

P (B2), P (B3), P (B4)

3/8

P (B5), P (B6), P (B7)

3/8

P (B8)

1/8

Como a cada evento del espacio muestral se le asocia un nmero que


es el valor que toma la variable X por ejemplo al evento (B 1) se le asocia
el valor cero, de tal forma que X = 0 con la misma probabilidad asignada
a B1 entonces:
P (X = 0)= P (B1) = 1/8
P (X = 1)= P(B2) + P(B3) + P(B4) = 1/8 + 1/8 + 1/8 = 3/8
P (X = 2)= P(B5) + P(B6) + P(B7) = 1/8 + 1/8 + 1/8 = 3/8
P (X = 3) = P (B8) = 1/8
Toda la informacin anterior puede ordenarse en una tabla.

Eventos

B1

Valor de X
P (X)

B2, B3, B4

B5, B6, B7

B8

1/8

3/8

3/8

1/8

Esta tabla nos proporciona la distribucin de probabilidades para la


variable aleatoria X, definida sobre eventos (B1), (B2),..., (B8) en el
espacio muestral M.
(x)

3/8
2/8
1/8
0

No personas que saben negocios

Las caractersticas de una variable aleatoria son discretas y continuas.


Variable aleatoria contina
Se dice que una variable aleatoria X es continua si sus valores consisten
en uno o ms intervalos de la recta de los reales.
Distribucin de probabilidades.
Una distribucin de probabilidad es una lista de todos los resultados
posibles de un experimento y de la probabilidad asociada a cada
resultado.
Funciones de densidad de probabilidades para variables aleatorias
continas
La funcin de densidad de probabilidades de una variable aleatoria
continua X es (x) y tiene las siguientes propiedades:
a)

La curva siempre se encuentra sobre el eje de las abscisas es


decir:
(x) > 0

b)

El rea total bajo (x) es = 1

c)

El rea delimitada por dos lneas verticales levantadas sobre los


puntos a y b (a < b) y la curva de probabilidades de X toma un
valor entre a y b

(x)

P(a x b)

a
0

b
1

Para una variable aleatoria continua P (X = 0) = 0, para cualquier valor x


de la variable aleatoria.

Si X es una variable aleatoria continua.


P(a < x < b) = P (a x b) = P (a < x b) = P (a x < b)
x no puede tomar valores menores que cero

(x) =

1,

0 x 1

0,

de otra forma

Funcin de distribucin acumulativa de probabilidades


La funcin de distribucin acumulativa de una variable aleatoria X
discreta o continua se define as:

F x

Para encontrar la funcin de probabilidad acumulada para un valor dado


x de la variable X se obtendr sumando los valores f (x) para todos los
valores posibles de X x.

La funcin de densidad de probabilidades es


(x) =

1, 0 x X
0, de otra forma

Ejemplo:
Se supone que una variedad de maz puede producir plantas con cero,
una, dos y tres mazorcas, se sabe adems que las probabilidades de
que se tenga plantas con estos nmeros de mazorcas son 0.1, 0.7,
0.1, 0.1 respectivamente, haciendo una tabla se tiene:

X
f (X)

0
0.1

1
0.7

X<0
X0

= 0
= 0.1

2
0.1

3
0.1

F (x) =

a)

X 1 = 0.8
X < 1 = 0.1
X 2 = 0.9
X < 2 = 0.8
X < 3 = 0.9
X>3 = 1
X3 = 1

Cul es la probabilidad de que una planta seleccionada al azar de


un lote de maz, tenga menor que una mazorca?
P (X < 1)

b)

x = 0 = 0.1

Cul es la probabilidad de que una planta seleccionada


aleatoriamente tenga 1 o ms mazorca?
P (X < 1) = 0.1
P (X > 1) = 1 - P (x < 1) = 1 - 0.1 = 0.9

c)

Cul es la probabilidad de que una planta elegida aleatoriamente


en un lote de maz, tenga entre uno y dos mazorcas inclusive?
P ( 1 x 2 ) = P ( x 2 ) - P ( x < 1 ) = 0.9 - 0.1 = 0.8

Media y Varianza de una distribucin de probabilidades


La media
La media de una distribucin de probabilidades se denomina valor
esperado de una variable aleatoria El valor esperado de una variable
aleatoria X se escribe E(X), para hallarlo se multiplica cada resultado por
su probabilidad y despus se suma los productos.

E X Xf x
La Varianza
Mide el grado de dispersin o variacin en una distribucin, nos permite
comparar la variacin entre dos distribuciones que tengan la misma
media, pero diferente dispersin.

La varianza de una distribucin

probabilstica, se simboliza con letra griega sigma (minscula) elevada


al cuadrado (). La formula para la varianza de una probabilidad es:

2 X 2 f x
Pasos para su clculo
a)

Restar la media a cada valor y elevar al cuadrado la diferencia.

b)

Multiplicar cada diferencia al cuadrado por su probabilidad.

c)

Sumar los productos resultantes para encontrar la varianza.

Encontrar la y del ejemplo anterior.

X
f
(X)

0.1

0.7

0.1

0.1

1 Calcular la media:
= 0 (0.1) + 1 (0.7) + 2 (0.1) + 3 (0.1)
= 0 + 0.7 + 0.2 + 0.3
= 1.2

2 Calcular la varianza:
= (0-1.2)(0.1) + (1-1.2)(0.7) + (2- 1.2) (0.1) + (3-1.2)(0.1)
= 0.144 + 0.028 + 0.064 + 0.324
= 0.56

Modelo probabilstica

Un modelo probabilstica de una variable aleatoria es la forma especfica


de las funciones de probabilidades que refleja el comportamiento de X.

Las funciones de distribucin de una variable aleatoria que muestran


tener mayor utilidad como modelo probabilstica para las variables
continuas es la Distribucin Normal, T de Estudent y la Chi cuadrada X
Curva normal
La curva normal tiene importancia fundamental en estadstica por los
numerosos casos que se explican con la distribucin normal. Varios
matemticos han contribuido en su formulacin entre ellos Abraham De
Moivre (1667 - 1754), Pierre S. Laplace (1749-1827) y Karl Gauss
(1777 - 1855).

MOIVRE fue el primero que formul la distribucin

normal, su trabajo quedo en el anonimato y fue el trabajo de Gauss que


apareci, el ms conocido entre los matemticos. Por lo cual a la
distribucin normal se le conoce tambin como Distribucin Gausiana.

La Curva normal es la expresin grfica de la distribucin normal, que es


una distribucin

de frecuencias que tiene muchas observaciones

cercanas al centro de la distribucin y luego disminuye gradualmente y


simtricamente.
Propiedades de la Curva Normal
a. Es simtrica y tiene la forma de campana
b. La media est en la mitad y divide el rea en dos partes idnticas, la
media, la mediana y la moda tienen el mismo valor.
c. La

curva se

extiende

en

ambas

direcciones

tiende

gradualmente a unirse con el eje horizontal. Sin embargo se


extiende hasta el infinito sin topar nunca el eje de las abscisas.

Las reas bajo la curva normal se analizaron en forma breve en la


primera unidad, ahora ampliaremos. Para una distribucin probabilstica
normal:
a. Aproximadamente el 68% del rea bajo la curva normal est dentro
de mas y menos de una desviacin estndar respecto a la media,
esto es .
b. Aproximadamente el 95% del rea bajo la curva normal est dentro
de ms y menos de dos desviaciones estndares respecto a la
media, esto es 2.
c. Prcticamente toda el rea (99.73%) bajo la curva normal est dentro
de las tres desviaciones estndares respecto a la media, esto es
3.
Ejemplo:
La distribucin de ingresos anuales de un grupo de empleados de la
telefnica sigui en forma aproximada una distribucin normal con una
media de S/. 37,200 y una desviacin standard de S/ 800.
1.

Entre que par de cantidades est aproximadamente 68.27% de


los ingresos.

= 37,200
= 800

37,200 800
36,400

37,200 +
800
38,000

2.

Entre que par de valores est aproximadamente el 95.73% de


los ingresos?
2
37,200 37,200 +
800 x 2 = 1,600
1,600
1,600
35,600
38,800

3.

Y entre que par de valores est aproximadamente el 99.73% de


los ingresos.
3
800 x 3 = 2,400

4.

37,200 2,400
34,800

37,200+
2,400
39,600

Que cantidad es la media, mediana y la moda de los ingresos


La media, la mediana y la moda son S/. 37,200

Distribucin normal
Es de mucha importancia porque es un modelo adecuado para diversas
situaciones en el mundo real y la de mayor uso de todas las
distribuciones continuas de probabilidad. Es la piedra angular en la
aplicacin de la inferencia estadstica en el anlisis de datos, puesto que
las distribuciones de muchas estadsticas mustrales tienden hacia la
distribucin normal conforme crece el tamao de la muestra. Lo utilizan
como modelo los fsicos, astrnomos, bilogos, agrnomos y los
mdicos. Los parmetros de distribucin son la y , identificaremos
la variable normal por:
X ~ N ( , )
= es un parmetro de localizacin
= Parmetro de escala o de dispersin

La funcin de densidad de una variable aleatoria normal es complicada


por lo que es difcil de calcular probabilidades en ellas. El problema se
resuelve con la distribucin normal Standard ()

Distribucin normal estndar ()

Si X es una variable aleatoria con media y varianza distribuida


normalmente (, ) la variable aleatoria:

Con una distribucin normal (0, 1), es una variable estandarizada

Ejemplos:
Considerando que la distribucin de los coeficientes intelectuales de los
alumnos de la Universidad Alas Peruanas tienen una distribucin normal
con = 100 y

= 10, queremos saber cul es la proporcin de

alumnos que tienen un coeficiente intelectual entre 100 y 105? As


mismo se desea encontrar grficamente el rea de la proporcin.

Las desviaciones entre 100 y 105 en trminos de la desviacin estndar


son:

P( X 105)

P( X 100) 105 100

0.05 0.1915
10
10

P ( > 0.50) = 0.1915


Si la desviacin X - es 0.5 desviaciones tpicas. La proporcin que le
corresponde en la tabla es 0.1915.

Cul es la probabilidad de alumnos que tienen un coeficiente intelectual


entre 100 y 105.7?
= 105.7 - 100 = 5.7 = 0.2157
10

10

P (X > 105.7) = P (X-100) > 105.7-100) = P ( > 0.57) = 0.2157


10
10
Cul es la probabilidad de alumnos que tienen un coeficiente intelectual
entre 103 y 105.7?

103 100
0.30 01179
10

Conociendo que la proporcin de 105.7 es 0.2157

0.2157

- 0.1179 = 0.0978 = P (0.3 < < 0.57) = 0.2157 - 0.1179 = 0.0978

Qu probabilidad de alumnos tienen un coeficiente intelectual a 83.6?

P( X 83.6) P

X 100 83.6 100

1.64 0.4495
10
10

0.5 - 0.4495 = 0.0505


P (Z - 1.64) = 0.0505

Mtodos y Distribuciones de muestreo

El muestreo es una forma lgica de determinar algo acerca de una


poblacin, analizaremos alguno mtodos bsicos para seleccionar una
muestra probabilstica.

Las poblaciones suelen ser demasiado grandes para estudiarlas en su


totalidad, es necesario elegir una muestra representativa que tenga un
tamao manejable. La muestra se utiliza para sacar conclusiones sobre
la poblacin que nos interesa. Por ejemplo,
valores de los parmetros

queremos estimar los

entonces debemos utilizar como

estimadores a los estadsticos X y S2. Los estadsticos se utilizan como


estimadores de los parmetros. Cuando confiamos en una muestra para
sacar algunas conclusiones o inferir sobre la poblacin estamos en el
campo de la estadstica inferencial.

El muestreo es una herramienta de la investigacin cientfica, cuya


funcin es determinar que parte de la poblacin debe examinarse para
hacer inferencias y generalizaciones sobre la poblacin en estudio.

Los mtodos para la seleccin de una muestra que tienen mayor utilidad
son las probabilsticas o aleatorias y las no probabilsticas.

Ventajas:

Rapidez y facilidad de realizar el estudio

Menor nmero de elementos a estudiar

Menor costo econmico

Mayor validez del estudio

Controlar y ajustar posibles variables de confusin

Mtodos de muestreo probabilstico o aleatorio

Muestreo aleatorio simple


Es aquel en que cada elemento de la poblacin tiene la misma
probabilidad de ser seleccionada para integrar la muestra

Se realiza enumerando todas las unidades listadas de la poblacin y


utilizando la tabla de nmeros aleatorios seleccionando las mismas.

Muestro aleatorio sistemtico

Este mtodo se parece al MAS donde cada unidad listada tiene igual
probabilidad de ser seleccionada, se diferencia en el proceso de
seleccin de la muestra

Debe calcularse el intervalo de muestreo

Al azar debe escogerse el primer elemento que integrar la muestra.

El resto de los elementos se incluyen sistemticamente de acuerdo al


valor del intervalo encontrado

Muestreo aleatorio estratificado

La poblacin se divide en categoras mutuamente excluyentes en


subgrupos o estratos (sexo, edad, etc.)

En el interior de cada estrato se le realiza una MAS por separado.

Puede ser proporcional y no proporcional.

La idea es producir estratos heterogneos entre s en las variables a


ser estudiadas, pero homogneas dentro de cada uno de ellas.

Muestreo aleatorio conglomerado

Est fundamentalmente orientado a la seleccin de grupos y no de


individuos dentro de la poblacin

Seleccionar un conjunto de unidades conglomeradas, por ejemplo;


escuelas, barrios, manzanas, etc.

Estos conglomerados constituyen la unidad de muestreo

La idea es realizar conglomerados lo ms heterogneos dentro de


cada uno de ellos y homogneas entre s.

Distribuciones muestrales

Uno de los objetivos de la estadstica es saber cerca del comportamiento


de parmetros poblacionales, tales como la media y la varianza. Se
extrae una muestra aleatoria de la poblacin y se calcula el valor de un
estadstico correspondiente. Ejemplo: la media muestral () y la varianza
muestral (S2). El valor del estadstico es aleatorio por que depende de
los elementos elegidos en la muestra seleccionada, por lo tanto el
estadstico tiene la distribucin de una probabilidad, conocida cmo la
distribucin muestral.

n x

Ejemplos:
Si la telefnica quiere conocer la probabilidad de que una llamada dure
entre 150 y 155 segundos, considerando que la media de las llamadas
es de 150 segundos y su desviacin estndar de 15 segundos, la
probabilidad se determina de la siguiente manera:

P(150 X 155)

155 150 0.33 0.1293


15

Por tanto P (150 X 155) = P (0 Z 0.33) = 0.1293

La probabilidad de que una llamada telefnica dure entre 150 y 155


segundos es de 12.93%.

Pero si la telefnica quiere conocer la probabilidad de que una muestra


de 35 llamadas dure por trmino medio entre 150 y 155 segundos, se
utilizar la siguiente ecuacin:

P(150 X 155)

35 155 150
1.97 0.4756
15

P (150 X 155) = P (0 Z 0.33) = 0.4756


La probabilidad de una sola llamada que dure entre 150 y 155 segundos
es de 12.93% y la probabilidad de que una muestra de 35 llamadas
tenga una duracin de media comprendida en ese intervalo es de
47.56%, la diferencia es que la distribucin muestral est menos
dispersa que la poblacin original. La dispersin de la poblacin original
es, mientras que la dispersin de la distribucin muestral es /n y es
evidente que > n.

Determinacin del tamao de muestra

Una de las preocupaciones ms comunes cuando se disea un estudio


estadstico es cuntos elementos debe incluirse en una muestra? Si
esta es demasiado grande, se derrocha intilmente dinero en la
recoleccin de datos. De forma semejante, si la muestra es demasiado
pequea, las conclusiones resultantes podran ser incorrectas. El
tamao correcto de la muestra depende de tres factores:

1. El nivel de confianza deseado


2. El mximo error permisible por el investigador
3. La variacin en la poblacin que se estudia

El grado de error que un investigador puede tolerar depende de lo crtico


que sea el trabajo, algunos trabajos son muy delicados y requieren
resultados exactos; los procedimientos mdicos de los que dependen

vidas humanas o la produccin de piezas de mquinas que han de


cumplir medidas de alta precisin slo admiten errores pequeos. Por el
contrario, hay casos en que errores grandes tienen consecuencias
menos graves.

Tamao de la muestra al estimar la media de la poblacin

Z 2 2
n
X 2
n tamao de la muestra
Z Desviacin estndar en la distribucin normal que producir el nivel
deseado de confianza (para una confianza del 95%, Z = 1.96;
para una confianza del 99%, Z = 2.58)
Desviacin estndar de la poblacin (conocida o estimada a partir
de estudios anteriores)
E error, o diferencia mxima entre la media muestral y la media
poblacional que est dispuesto a aceptar en el nivel de confianza
que hemos indicado. E = (X - )2 error, Diferencia entre la media
muestral y la media poblacional

Z 2 2
n
e2
Ejemplo:

Se quiere conocer el gasto mensual en medicina por familia, el gerente


de un laboratorio farmacutico desea determinar el tamao de la
muestra que le proporcione un nivel de confianza de 95%. Adems
conoce por estudios anteriores que las medias por familia eran de S/.
120 mensuales con una

de 30. El gerente busca un tamao de

muestra que le permita estimar el nivel de gastos con un error ms o

menos de 10.

n = Z2 2

= (1.96)2 (30) 2 = 35

(e)2

(10)2

Muestra para poblaciones finitas


Cuando se desconoce la poblacin.

2 1
n0
2
no

= Tamao necesario de la muestra

= Es la desviacin normal estndar correspondiente a un intervalo


central (para una confianza del 95%, Z = 1.96 y

para una

confianza del 99%, Z = 2.58)


P

= Proporcin o probabilidad que suceda algo (s puede estimar la


proporcin, hgala y utilcela como P; en caso contrario, sea
conservador y use P = 0.5 en la frmula)

E = Error que podemos permitir en estimar la verdadera proporcin


que suceda algo.

Tamao de la muestra al estimar la proporcin de una


poblacin finita
n

Tamao de la muestra proporcional


n

Z 2 PQN
2 ( N 1) Z 2 PQ

n = Tamao de la muestra

Z = Distribucin normal estndar correspondiente


P = Probabilidad de xito
Q = No probabilidad
2 = Error
N = Poblacin
n

S la relacin entre no/N < 5% aceptamos como muestra


S la relacin no/N > 5% se reajusta

El tamao de muestra inicial se corrige mediante la expresin

no
no
1
N

Tamao de la muestra

no

Constante definida

Tamao de la poblacin

Resumen

Las probabilidades son herramientas poderosas para la toma de


decisiones en todo tipo de gestin.
-

La aplicacin de las probabilidades en situaciones reales para


realizar una gestin tiene relevancia en diferentes situaciones.

La distribucin normal es de mucha importancia debido a que es


un modelo adecuado para diversas situaciones del mundo real y

de mayor uso de todas las distribuciones continuas de


probabilidad.
-

Sus aplicaciones en la estadstica inferencial y en el anlisis de


datos, es importante puesto que las distribuciones de muchas
estadsticas mustrales tienden hacia la distribucin normal
conforme se incremente el tamao de la muestra.

Actividades Sugeridas

A manera de

fortalecer sus conocimientos es importante que

realice prcticas diarias de las diferentes operaciones realizando


con sus respectivos anlisis e interpretacin, que lo pueden
encontrar en los libros sugeridos.

Lea con sumo cuidado cada uno de los temas, analiza e


interprete, la interpretacin de los datos es vital para la discusin
en todo trabajo profesional y de gestin.

ANEXO A LA CUARTA UNIDAD

ESTADISTICA E INFORMTICA APLICADA


EN LA GESTIN EDUCATIVA

ESTIMACIN Y PRUEBA DE HIPTESIS

Objetivo

Utilizar la distribucin de probabilidades y de muestreo para desarrollar


una estimacin del intervalo de confianza para la media y varianza de
una poblacin, considerando el tamao de muestra.

Desarrollar las metodologas de prueba de hiptesis como una tcnica


para analizar diferencias y tomar decisiones; determinar los riesgos
implicados al tomar tales decisiones si nos basamos nicamente en la
muestra; y estudiar la interrelacin de estos riesgos con el tamao de
muestra utilizada.

Introduccin

La inferencia estadstica consiste en utilizar los resultados de una


muestra para llegar a conclusiones a cerca de las caractersticas
de una poblacin. En la presente unidad examinaremos los
procedimientos estadsticos que nos permitan estimar y probar las
hiptesis ya sea de la media o varianza poblacional.

Contenidos

Los contenidos de la presente unidad se encuentran en la presente gua


desde la pgina 113 a la pgina 148. En el libro de Estadstica para
Administracin y Economa. Mason/Lin/Marchal, lo puede encontrar.

Estimacin

Cuando tenemos un fenmeno desconocemos los parmetros de la


poblacin por lo que tomamos una muestra aleatoria para generar
estimadores de los parmetros.

, , , P (parmetros)
X, S, S, p (estimadores)

Propiedades de la Estimacin
Un estimador de un parmetro poblacional es un estadstico muestral

al que se le puede atribuir una funcin muestral (), que permite

asociar el estimador al parmetro que puede resultar conveniente en


trminos de representatividad del parmetro y permiten elaborar pruebas
de hiptesis:

Parmetro
Estimador
Si ,

es un estimador insesgado del parmetro.

a) Estimador Insesgado El valor esperado del estimador es igual al


parmetro poblacional desconocido.

Sesgo El sesgo de un estimador para un parmetro se define:


S

Si un estimador es sesgado, entonces S() = 0

b) Varianza mnima Es aquel que tiene menor varianza entre todos los
estimadores in sesgados del parmetro que se quiere estimar.
c) Consistencia Un estimador es consistente si,

a medida que el

tamao de la muestra tiende a infinito, la probabilidad de que el valor


calculado del estimador se aproxime al valor del parmetro se acerca
a la mitad.

1
Donde y son valores arbitrariamente nfimos y positivos.

Las verificaciones de las propiedades de insesgado, consistencia y


varianza mnima permiten asignar al estimador un carcter de
representatividad del parmetro.
Estimacin puntual Es un solo nmero que se emplea para estimar un
parmetro poblacional desconocido.

El propsito de la estimacin puntual es obtener una estadstica que,


una vez evaluada en la muestra, nos proporciona un valor que
posiblemente refleje el parmetro desconocido.
La X (media muestral), es el mejor estimador de la media poblacional.

x
n

Xi = valor de una observacin


n = nmero total de observaciones.

La varianza muestral (S) y la desviacin Standard de la muestra (S) se


utiliza para estimar la varianza de la poblacin 2.
2

xi
1

2
x i

S
n 1
n

S S2

En donde xi representa el valor de un elemento relacionado para la


muestra y n es el nmero de la muestra.

Estimacin de intervalo Es un intervalo de valores que se utiliza para


estimar un parmetro de poblacin.
Intervalo de confianza 1 - Tiene un limite inferior de confianza y un
lmite superior de confianza.

Li Ls 1
Li, Ls

son variables aleatorias

1-

intervalo de confianza

Probabilidad de error

El coeficiente de confianza, es el nivel de confianza que tenemos en que


el intervalo contiene el valor desconocido del parmetro.

El valor de alfa, es el porcentaje de intervalo que no contiene el valor


desconocido del parmetro

La interpretacin de la realizacin del intervalo de confianza (IC) es que,


al nivel de seguridad 1 - (%) el intervalo (Li, Ls) cubre el parmetro.

Cuando el nmero de observaciones es superior a 30, con frecuencia se


utilizan 3 intervalos de confianza para la media poblacional el IC de 90%,
95% y del 99%

Para realizar un intervalo de confianza es necesario calcular el error


estndar de la media
Error Standard de la media

Es la desviacin Standard de la

distribucin muestral de las medias muestrales si se conoce la .

x Error estndar de la media


Desviacin Standard poblacional
n tamao de la muestra

Si no se conoce y n 30

Sx

S
n

Intervalo de confianza para la media de una distribucin normal


cuando n es superior a 30 observaciones

Los intervalos de confianza cuando n > 30 observaciones es:

90%

X 1.65 / n

95%

X 1.96 / n

99%

X 2.58 / n

Ejemplos:
1.

Un sondeo efectuado a 400 familias de clase media revelo un


gasto mensual promedio de $ 200 en productos de tocador, con
una desviacin estndar

de $ 20. Determine un intervalo de

confianza para la media poblacional a un nivel de confianza del


95%.
Ls = 200 + 1.96 (20/ 400) = 201.96 Dlares
Li = 200 - 1.96 (20/ 400) = 198.04 Dlares.

El intervalo de confianza al 95% del gasto mensual en productos


de tocador se encuentra entre (198.04, 201.96)

Al nivel de seguridad del 95% el intervalo (198.04, 201.96) cubre


el parmetro

2.

En un experimento se trata de seleccionar 230 administradores


para gerenciar puestos de confianza del Ministerio de Educacin.
Un elemento de inters es su ingreso anual. La media muestral
que se calcula es S/ 31,878 y la desviacin Standard de la
muestra es S/ 1,845.

a.

Cual es el ingreso medio estimado de todos los


funcionarios.
La media muestral: X = S/ 31,878.

b.

Cul es el intervalo de confianza al 95%


Li = 31,878 - 1.96 (1845 / 230) = S/ 31,639
Ls = 31,878 + 1.96 (1845 / 230) = S/ 32,116

c.

Cuales son los lmites de intervalo de confianza al 95%


Los lmites de confianza: Li, Ls = (31,639. 32.116)

d.

Que grado de confianza se est usando


95% = 0.95

e.

Interprete los resultados


Al nivel de seguridad del 95% el intervalo (31,639, 32,116)
cubre el parmetro

Ahora trabajaremos con el software estadstico MINITAB, con la finalidad


de simplificar el trabajo y facilitar la actividad de la construccin de los
intervalos de confianza.
Ejemplo: En un esfuerzo para estimar el promedio del pulso de adultos
de 40 aos de edad durante el descanso, se uso una muestra aleatoria
de 50 individuos con medidas del pulso en individuos de 40 y 50 aos. Si
la media muestral se usa para estimar y e desea tener un 95% de
confianza con respecto a que la media poblacional difiere de la media
muestral X es no mas de E, encuentre el error mximo E si se supone
que = 10 pulsaciones por minuto.
Como 1 - = 0.95, recordemos que la curva normal siempre es dividida
en dos partes idnticas por la media, entonces 0.95/2 = 0.475, con esta
informacin vamos a la tabla Z y encontramos que z es 1.96; aplicando
la ecuacin tenemos:

E Z / 2

10
(1.96)
2.77
n
50

Si la X se usa para estimar , podemos tener un 95% de confianza de


que el error mximo de estimacin sea menor que 2.77 pulsaciones por
minuto.

Ejemplo: Para estimar la media de todas las calificaciones del examen


de admisin de una universidad, se usa una muestra aleatoria de 50 de
un examen de admisin universitario. Si la X = 98.2, S = 17 y el nivel de
confianza 99%, construya un intervalo de confianza para la media
poblacional.

N Mean
50 98.20

SE Mean
2.40

99% CI
(92.01, 104.39)

Intervalo de confianza para la media de una distribucin normal


cuando n es menor a 30 y la desviacin estndar es desconocida

n x

N 0,1

S es desconocido entonces recurrimos a la distribucin de t de


estudent:

n x
t n 1
n
Si toman valores t/2 (n-1) y - t/2 (n-1) en la distribucin t con n - 1
grados de libertad.

t
t n 1 t
1
n 1
2
2 n 1

Donde

t n 1

n x
S

S
S
P X t X t 1
n 2 n1
n 2 n1

Un intervalo de confianza (1 - ) para est dado por:

Li X

S
t
n 2 n1

Ls X

S
t
n 2 n 1

Es claro que los lmites (Li, Ls) son variables aleatorias, ya que X y S lo
son, entonces el intervalo resultante es aleatorio.
Ejemplos:
1.

Los pesos netos, en onzas, de una muestra aleatoria de 8 tarros de


leche son los siguientes: 12,1

11,9

12,4

12,3

11,9

12,1

12,4

12,1. Encuentre los lmites de confianza al 99% para el peso medio por
tarro de leche, correspondiente a la poblacin de la cual se obtuvo la
muestra.
X = 12.15
S = 0.2
n=8
De la tabla de distribucin t de estudent
= 1 - 0.99 = 0.01
Li X

t/2 = t0.01/2(8-1) = t0.005(7) = 3.4995

S
t
n 2 n 1

= 12.15 - (0.2/ 8) (3.4995)


= 11.75
Ls X

S
t
n 2 n 1

= 12.15 - (0.2/ 8) (3.4995)


= 12.25

El intervalo de confianza al 99% es (11.75, 12.75), por lo que podemos


concluir que con un nivel de confianza del 99%, el peso promedio de los
tarros de leche se encuentra entre esos lmites.

Ahora vamos hacer un ejemplo utilizando el software estadstico del

MINNITAB.
En un esfuerzo para determinar el nivel de ruido promedio debido a
camiones grandes, el Ministerio del Ambiente obtuvo una muestra
aleatoria de lectura del nivel de ruido en decibeles, en ocho camiones
grandes. Se encontr que la media muestral para estimar y la desviacin
estndar fueron 85.6 y 0.65 decibeles, respectivamente; usando la
media muestral para estimar dista E de X . Suponga que los niveles
de ruido de los camiones de distribuyen normalmente. Construya un
intervalo de confianza para la media poblacional al 95%.
Error mximo de estimacin:
E t / 2( n 1)

S
0.65
t0.05 / 2(81)
t0.025( 7 ) (0.2298) 2.3646 x0.2298 0.54
n
8

Si usamos la media muestral de 85.6 para estimar , podemos tener un


95% de confianza de que est a 0.54 decibeles de la media muestral
85.6 decibeles. Es decir podemos tener la confianza del 95% en que el
error mximo de estimacin ea menor que 0.54 si se usa la media
muestral de 85.6 par estimar .
Ahora contruiremos el intervalo de confianza, utilizando MINITAB.

One-Sample T
N Mean StDev
8 85.600 0.650

SE Mean
95% CI
0.230 (85.057, 86.143)

Intervalo de confianza para la varianza de una distribucin normal

(n 1) S 2

2n 1

Usando

2
2

2n 1

n 1

y 2
1

podemos

encontrar

valores

n 1

Tales que:

P 2
2n1 2
1
n1
1 n 1
2
2

Donde:

n 1

n 1S 2
2

La expresin que se ha establecido debe manipularse para obtener el


intervalo P (Li < < Ls) = 1 - ya que las tres cantidades del parntesis
son positivas.
El intervalo de confianza es:

1
S
n 1S 2

P 2
2 2
1

1 n 1
2
2 n 1

n 1S 2 n 1S 2
, 2
2

n 1
1 n 1
2
2

Ejemplo:

Un experimentador quiere verificar la variabilidad de un equipo diseado


para medir el volumen de una fuente de audio frecuencia. Tres
mediciones independientes registradas con este equipo fueron 4.1, 5.2 y
10.2, Estime el intervalo de confianza para la con un coeficiente de
confianza del 90%
S= 10.57
n=3
De la tabla: = 1 - % ---> = 1 - 0.90 = 0.10 = X0.10/2
X0.05(2) = 5.9915

X0.95(2) = 0.1026

Los lmites del intervalo de confianza al 95% son:


Li = (n-1) S / X/2(n-1) = (3-1)(10.57)/ 5.9915 = 3.53
Ls = (n-1) S / X1-/2(n-1) = 2(10.57) / 0.1026 = 206.04
El intervalo de confianza al 95% para es: (3.53, 206.04)
Interpretacin: con un nivel de confianza del 90%, el valor de se
encuentra entre los lmites establecidos. Observe que este
intervalo para la varianza es muy amplio, bsicamente porque n
es muy pequea.
Ejemplo con MINITAB: La variacin de la potencia de un frmaco
debe ser pequea, de lo contrario podra ser peligroso o ineficaz.
Una compaa farmaceutica se intereso por determinar la vrianza
de las medidas de la potencia de una nueva presentacin de un
cietrto medicamento, para ello una muestra aleatoria de
ampolletas de 20 cc dio como resultado una varianza igual a
0.0018. Construya u intervalo del 99% de confianza para la
vrianza de las medidas de potencia del frmaco.

Statistics
N
20

StDev Variance
0.0424 0.00180

99% Confidence Intervals


Method
CI for StDev
Standard (0.0298, 0.0707)

CI for Variance
(0.00089, 0.00500)

Prueba de hiptesis
El objetivo de una prueba de hiptesis es analizar cmo se puede probar
las hiptesis y sacar conclusiones sobre la poblacin
Hiptesis Estadstica Es la afirmacin sobre un modelo probabilstico.

Prueba de Hiptesis Es el procedimiento mediante el cual se juzga la


factibilidad de la hiptesis.
Hiptesis Enunciado acerca del valor de un parmetro poblacional.
Elementos de una prueba estadstica

1. Hiptesis Nula (Ho) Es aquella hiptesis que desea rechazar el


investigador. Su negacin es la hiptesis alternativa (Ha).
2. Hiptesis alternativa (Ha) Es la negacin de la Ho.
3. Estadstico de la Prueba

Es una funcin de las mediciones

mustrales en el cual se fundamenta la decisin estadstica


4. Regin de rechazo
Procedimientos para probar una hiptesis
1.

Plantear la Ho y la Ha
La Ho se plantea con el objetivo de aceptarla o rechazarla, es
decir, la Ho es una afirmacin que se aceptar si los datos
muestrales no pueden proporcionar evidencia convincente de que
es falsa.

2.

Nivel de Significacin
Es la probabilidad de rechazar la Ho cuando en realidad es
verdadera. Al nivel de significacin tambin se le denomina nivel
de riesgo, porque existe el riesgo de rechazar la Ho cuando en
realidad es verdadera.

No hay un nivel de significacin que se aplique a todos los


estudios de muestreo. El investigador decidir de usar 0.05, 0.01,
0.10, o cualquier otro nivel entre 0 y 1. Generalmente se
selecciona el nivel 0.05 para Proyectos de investigacin sobre
consumo, el 0.01 para control de calidad y el 0.10 para encuestas
polticas. El investigador decidir el nivel de significacin antes de
formular una regla de decisin y recopilar datos mustrales.

En una prueba de hiptesis puede cometerse dos tipos de


errores:
1.

Error Tipo I Rechazar una hiptesis nula que es cierta.

2.

Error Tipo II No rechazar una hiptesis nula que es falsa.

Sus probabilidades asociadas son las probabilidades de cometer


error.
= P[Cometer error tipo I]=[Rechazar Ho cuando es cierta]
=P[Cometer error tipo II]=[No rechazar Ho cuando es falsa]

Obviamente que debemos escoger aquellas pruebas que


minimicen estos errores.

Esto no es posible sin embargo, un

criterio adecuado es fijar uno y minimizar el otro. Lo usual es fijar


y minimizar .
Situacin real (desconocida)

Ho
Rechazar
No rechazar

3.

Cierta
Error tipo I
Decisin
correcta

Falsa
Decisin
correcta
Error tipo II

Estadstico de Prueba

Es un valor, determinado a partir de la informacin muestral, que


se utiliza para aceptar o rechazar la Ho. Las pruebas de hiptesis
que analizaremos son Z, t , y X.

4.

Regla de Decisin

Es una afirmacin de las condiciones bajo las que se acepta o


rechaza la Ho.
La distribucin muestral se divide en dos partes: Regin de
aceptacin y regin de rechazo.

Zona de
rechazo

5.

Valor
crtico

Toma de una decisin


Aceptar Ho
Rechazar Ho y aceptar Ha.

Tipos de hiptesis
Si es un parmetro cualquiera y o es una constante en el conjunto de
valores que puede tomar el parmetro, entonces el investigador
considera importante los posibles juegos de hiptesis.
a) Ho: o en oposicin a
Ha: > o
b) Ho: o en oposicin a
Ha: < o
c) Ho: = o en oposicin a
Ha: o
Prueba de hiptesis para la media poblacional cuando las muestras
son mayores de 30 observaciones
a)

Ho
Ha

:
:

>

o
o

en oposicin a

b)

Ho
Ha

:
:

>
<

o
o

en oposicin a

c)

Ho
Ha

:
:

o
o

en oposicin a

o es una constante elegida por el investigador.


El estadstico de prueba en cualquiera de los tres casos:

n X 0

Zc

Las reglas de decisin para a, b y c, son: respectivamente


a) Rechazar Ho: S c 1
b) Rechazar Ho: S c
c) Rechazar Ho: S c

S c
2

En cualquier caso puede usarse los valores de Z o Z/2, obtenida en la


tabla de probabilidades de la distribucin normal estndar.
Ejemplo:
1. El gerente de una Empresa de conserva de frutas cree que las latas
de 16 onzas de pia se estn llenando en exceso. El Dpto. de Control
de calidad tom una muestra aleatoria de 50 envases y encontr que
el peso medio aritmtico es de 16.05 onzas, con una desviacin
estndar de la muestra de 0.03 onzas Puede rechazarse la
hiptesis de que el peso medio es igual a 16 onzas? a un nivel de
significancia del 5%
Ho :
Ha : >

16
16

= 16.05 onzas
= 0.03 onzas
n = 50
Zc =
50 (16.05 -16) = 11.78
0.03

Rechazar Ho s Zc > Z1-


(Z1- = 11.78) > (Z

1 - 0.05

11.78 > 1.65

= Z0.95 = 1.645)

Este valor encuentra en la tabla de la distribucin normal estndar


Z
1.6

0.04
0.05
0.9495 0.9505

1.645

Se rechaza Ho, a un nivel de significancia del 5% porque existe


evidencia de que las latas estn siendo llenadas en exceso de peso.

Ahora trabajaremos con el software estadstico del MINITAB, la


aplicacin lo haremos con un ejemplo: Un estudio de 50 amas de casa
elegidas al azar mostr que ven televisin un promedio de 15 horas
semanales: la desviacin estndar fue de 12.5 horas. A un nivel de
significancia del 2% Ponga a aprueba:
Ho:

20

Ha:

< 20

One-Sample Z
Test of mu = 20 vs < 20
The assumed standard deviation = 12.5
98% Upper
N Mean SE Mean
Bound
Z
P
50 15.00
1.77
18.63 -2.83 0.002
Cuando se trabaja con MINITAB, se tiene que tener en cuenta las
probabilidades. De acuerdo a las resultados es significativo por
que P = 0.002 < que el nivel de significancia = 0.02. Razn por
la cual se rechaza hiptesis nula a un nivel de riesgo del 2%.
Concluyndose que las amas de casa ven televisn menos de 20
horas.

Prueba de hiptesis para la media poblacional cuando el nmero de


observaciones es de menor que 30,
a)

Ho
Ha

:
:

>

o
o

en oposicin a

b)

Ho
Ha

:
:

>
<

o
o

en oposicin a

c)

Ho
Ha

:
:

o
o

en oposicin a

o es una constante elegida por el investigador.


El estadstico de prueba en cualquiera de los tres casos:

tc

n X 0
S

Las reglas de decisin para a, b y c, son: respectivamente


a) Rechazar Ho: S tc t n 1
b) Rechazar Ho: S tc t n 1
c) Rechazar Ho: S tc t
2

n 1

S tc t
2

n 1

En cualquier caso los valores t(n-1) t/2(n-1) que limitan las regiones de
rechazo, se obtiene de la tabla de probabilidades de la distribucin t de
estudent.
Ejemplo:
Los propagandistas de cierta marca de cigarrillos sostienen que el
contenido promedio de nicotina de su producto es menor de 0.7
miligramos por cigarrillo. Suponiendo una distribucin normal para el
contenido de nicotina, su afirmacin es que < 0.7.
Ho: > 0.7
Ha: < 0.7

La hiptesis se quiere probar con un nivel de significancia de =


0.01, ya que si se rechaza Ho, debemos autorizar que en la
publicidad aparezca sta afirmacin y slo estamos dispuestos a
hacerlo si la evidencia en contra la Ho es sustancial. Para realizar
la prueba determinamos el contenido de nicotina de 30 cigarrillos,
encontrando los siguientes valores:
0.72 0.61 0.69 0.69 0.70 0.62 0.63 0.73 0.77 0.76
0.60 0.68 0.60 0.59 0.78 0.64 0.75 0.79 0.64 0.71
0.76 0.61 0.73 0.70 0.74 0.68 0.65 0.62 0.76 0.81
X = 0.6920
S = 0.0653
= 0.01
n = 30
c = n (X - ) = 30 ( 0.692 - 0.7 ) = - 0.671
S
0.0653
La regla de decisin es rechazar Ho si tc -t(n-1) en este caso
t0.01(29) = 2.462
0.671 -2.462
No se rechaza Ho, con un nivel de significancia = 0.01 nuestro
experimento contradice la afirmacin de los propagandistas.
Ejemplo con MINITAB: Las calificaciones de 10 estudiantes en un
examen de estadstica fueron 43, 61, 67, 70, 74, 76, 79, 85, 94, y 81.
Suponga que estas calificaciones provienen de una poblacin normal a
un nivel de significancia del 5% ponga a prueba la siguiente hiptesis:
Ho:

70

Ha:

70

One-Sample T: Calificaciones

Test of = 70 vs not = 70
Variable

N Mean StDev SE Mean

Calificaciones 10 73.00 14.08

4.45

95% CI

(62.93, 83.07) 0.67 0.517

En este saco la prueba de hiptesis resulto no significativo, por que la P =


0.517 > que = 0.05, en este caso no rechazamos Ho a un nivel de
significancia del 5%, concluyndose que las calificaciones no son diferentes a
70.

Prueba de hiptesis de la varianza poblacional sobre una


distribucin normal
El otro parmetro que aparece explcitamente en la funcin de
distribucin normal es entonces debemos disponer de tcnicas para
probar hiptesis sobre la varianza de una poblacin.
Sea un nmero mayor que cero entonces los juegos de hiptesis son:
a)

Ho
Ha

:
:

>

o
o

en oposicin a

b)

Ho
Ha

:
:

>
<

o
o

en oposicin a

c)

Ho
Ha

:
:

o
o

en oposicin a

La estadstica natural para probar stas hiptesis se basa en la varianza


muestral S entonces:
(n -1) S ~ X2 (n-1)

La estadstica que nos permite fijar el nivel de significancia deseada es:

2
c

n 1S 2

02

Puesto que si Ho es cierta, Xo ~ X(n-1) las reglas de decisin para a, b y


c son respectivamente:

a) Rechazar Ho: S c2 2 n 1

c2 12 n 1

b) Rechazar Ho: S

c) Rechazar Ho: S c2 2

n 1

2
2

O s c2

n 1

Ejemplo:
Para establecer la variabilidad en las mediciones de un equipo, con el
que se trata de determinar el porcentaje de magnesio en un producto.
Se realizan 12 determinaciones en una solucin que se sabe tiene 5%
de magnesio. De acuerdo con las normas de calidad vigentes, la
mxima desviacin que podemos tolerar es de 0.2%, es decir, que si el
equipo es adecuado debe tener una < 0.04 (en %). La hiptesis que
conviene probar es:
Ho
Ha

:
:

>
<

0.04
0.04

El rechazo de la Ho con un bajo nivel de significancia aceptamos el


equipo como adecuado. Las 12 determinaciones arrojan los siguientes
resultados: 5.1
4.7

5.1

5.3

4.9

4.9

5.2

4.8

5.2

5.3

4.8

4.8

Para estos datos el valor de la S es 0.0463

2
c

n 1S 2 12 10.0463

12.7325
02

0.04

El nivel de significancia que usaremos es de = 0.05


X1- (n-1) = X1-0.05(12-1) = X0.95(11) = 4.5748
X0.95 (11) = 4.5748
La regla de decisin correspondiente a la cola izquierda es rechazar Ho
si Xc X1- (n-1)
Xc 4.5748
Como Xc = 12.7325 entonces no pertenece a la regin de rechazo y la

decisin es que con un nivel de significancia = 0.05 no hay razn para


rechazar Ho.
En otras palabras: dada la evidencia con una probabilidad de error tipo I
al 5%, el equipo no es confiable para el trabajo propuesto.

Ahora realizaremos un ejemplo con MINITAB:


Se cree que la muestra siguiente proviene de una poblacin normal con 2 =
25: 2.1, 3.6, 3.8, 4.2, 4.7y 15.3. Haga una prueba con nivel de significancia 0.05
para determinar si 2 25.

Statistics
Variable N StDev Variance
C1
6 4.82
23.3
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
C1
Standard (3.01, 11.83) (9.1, 140.0)
Tests
Variable Method
C1
Standard

Chi-Square DF P-Value
4.65
5.00 0.919

La prueba de hiptesis resulto no significativo, por que la P =


0.919 > que = 0.05, en este caso no se rechaza Ho a un nivel
de significancia del 5%, concluyndose que la varianza es igual a
25.

Resumen

Una estimacin puntual es el nmero que se utiliza para estimar


un parmetro poblacional, como la media, varianza, desviacin
estndar y proporcin poblacional. La estimacin por intervalo da
el alcance dentro del cual probablemente queda el parmetro de
la poblacin.

Las pruebas de hiptesis que se han realizado es para muestras


mayores y menores de 30 observaciones, suponiendo que la
poblacin

bajo

estudio

est

distribuida

desviacin estndar conocida y desconocida.

normalmente

con

Actividades Sugeridas

Lea y practique constantemente cada uno de los ejercicios que se


realizan en la gua, con la finalidad de fortalecer su conocimiento,
especficamente para utilizar en toda gestin que pueda realizar
en su trabajo.

Es importante que los participantes apliquen en el que hacer


diario de su profesin y practiquen en toda gestin.

Entre otras actividades sugeridas, para este caso es utilizar la


tecnologa disponible, como las calculadoras cientficas o un
Software estadstico SPSS (Programa Estadstico para el Estudio
de las Ciencias Sociales) y luego interpretar los resultados
obtenidos.

Bibliografa

1. Weimer, Richard C. (2006) Estadstica. Segunda Edicin en Ingls


(primera edicin en Espaol). Editorial Continental. Mxico. D.F.
2. Lind/Marchal/Wathen. (2005). Estadstica Aplicada a los Negocios y a la
Economa. Editorial McGraw-Hill.
3. Prez Lpez, Csar. 2004. Estadstica Aplicada a travs de Excel.
Editorial Pearson Educacin S.A. Madrid, Espaa.
4. Mason/ Lind/ Marchal (2001). Estadstica para Administracin y
Economa. 10 Edicin. Editorial Alfa omega - Mxico.
5. Juez Martel,

Pedro. 2001. Herramientas estadsticas para la

investigacin en Medicina y economa de la salud. Editorial Centro de


Estudios Ramn Areces, S.A. Madrid, Espaa.
6. Webster, Allen L. (2000). Estadstica Aplicada a los Negocios y la
Economa. Tercera Edicin. Editorial Mc Graw Hill - Mxico.
7. Helorza Prez Tejada, Haroldo. 2000. Estadstica para las ciencias
sociales y del comportamiento. Segunda Edicin. Editorial OXFORD.
Mxico.
8. Levin

I.

Richard

Rubin

S.

David

(1996).

Estadstica

para

Administradores. Editorial Prentice-Hall Hispanoamericana S.A.


9. Heinz Kohler. (1996). Estadstica para Negocios y Economa. Editorial
CECSA. Primera Edicin. Mxico.
10. Berenson, Mark L. y Levine, David M. (1996). Estadstica Bsica en
Administracin.

Segunda

edicin.

Editorial

Prentice-Hall

Hispanoamericana S.A. Mxico.


11. Wayne W. Daniel (1996). Bio Estadstica. Editorial Limusa. S.A de CV Mxico.
12. Siegel Sydney. Castellan N.John. 1995 (reinp. 2003) Estadstica no
paramtrica, aplicada a las ciencias de la conducta. 4ta. Edisin Mxico.
Editorial TRILLAS.
13. Mendenhall/Reinmuth (1981).

Estadstica para Administradores y

Economistas. Grupo Editorial Iberoamericana - Mxico.