Вы находитесь на странице: 1из 20

Rey Mndez Jos Alfredo Probabilidad y Estadstica

Instituto Tecnolgico de Veracruz



Ing. en Sistemas Computacionales
Probabilidad y Estadstica
Profesor:
Barrientos Arzamendi Victor Javier
Alumno:
Rey Mndez Jos Alfredo

Veracruz, Ver.




Rey Mndez Jos Alfredo Probabilidad y Estadstica
Unidad 5 Estadstica Aplicada
1.1 Inferencia Estadstica
Tambin se le llama estadstica inferencial, pero previamente recordemos que la
estadstica (EI) comprende el conjunto de mtodos estadsticos que permiten deducir
(inferir) cmo se distribuye la poblacin bajo estudio, a partir de la informacin que
proporciona una muestra representativa obtenida de dicha poblacin. Ver seccin 1.6.2
del presente libro. Para que la estadstica inferencial proporcione buenos resultados debe:


1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente
validada.


2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao
suficiente.


Veamos el siguiente ejemplo:



Ejemplo 2.1.



Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como
son:

1. El mtodo de la enseanza recproca.



2. El mtodo de instruccin directa.



3. La combinacin de mtodos de instruccin directa y enseanza recproca.

Las preguntas por resolver son:



1. Cul de los mtodos mejora la comprensin lectora?



2. Para el prximo ao el mtodo, identificado como el mejor, dar buenos resultados
para el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin
Rey Mndez Jos Alfredo Probabilidad y Estadstica
Bsica Secundaria?


La primera pregunta es un caso de incertidumbre porque basndonos en el estudio de tres
muestras independientes y en igualdad de condiciones se aplicar uno de los tres mtodos
a cada muestra de manera independiente; con el apoyo de la estadstica inferencial
absolvemos esta pregunta, eligiendo a la que mejora significativamente la comprensin
lectora para este tipo de alumnos.


La segunda pregunta es un caso de toma de decisiones porque Javier Hernndez Len no
ha participado en el estudio, pero se le aplicar el mejor mtodo que resulte de la
investigacin realizada, ahora bien, con qu confianza diremos que ese mtodo lograr
que Javier mejore su comprensin lectora en ingls.

Los casos de incertidumbre y toma de decisiones son resueltos por la estadstica
inferencial, por supuesto apoyada por la probabilidad.






Para iniciarse en el estudio y aplicacin de la estadstica inferencial es

necesario conocer los conceptos bsicos que a continuacin se van a tratar.




1.2. POBLACIN


Este concepto vamos a definirlo bajo diferentes enfoques.

En investigacin cientfica se le define como la totalidad de elementos sobre los
cuales recae la investigacin. A cada elemento se le llama unidad estadstica, a
sta se le observa o se le somete a una experimentacin, estas unidades son
medidas pertinentemente.
Si representamos mediante X una variable aleatoria bajo investigacin, al estudiar
a sta

variable en la poblacin, como resultado tendremos los
valores:



X
1
, X
2
, X
3
,..., X
N



Rey Mndez Jos Alfredo Probabilidad y Estadstica

Donde N es el total de elementos de la poblacin.



Ejemplo 2.2.



Sea X una variable aleatoria que representa la calificacin obtenida en la
prueba de conocimientos sobre educacin ambiental (escala vigesimal) de los
alumnos de la Facultad
de Educacin, si la poblacin consta de 300 alumnos, entonces:



X
1
, X
2
, X
3
,...,
X
300




Es una poblacin en trminos de variable aleatoria, que se
lee as:



La calificacin que ha obtenido el alumno 1 en la prueba de conocimientos
sobre educacin ambiental, la calificacin que ha obtenido el alumno 2 en la
prueba de conocimientos sobre educacin ambiental, la calificacin que ha
obtenido el alumno 3 en la prueba de conocimientos sobre educacin ambiental, y
as sucesivamente hasta la calificacin que ha obtenido el alumno 300 en la
prueba de conocimientos sobre educacin ambiental.


El propsito de un estudio estadstico es extraer conclusiones acerca de la
naturaleza de la poblacin, pero resulta que las poblaciones son grandes, o por
razones de tica, recursos financieros, metodolgicos u otros no ser posible,
entonces se debe trabajar con una muestra extrada de la poblacin bajo estudio.
2.3. MUESTRA

Sierrra Bravo (1991), anota que una muestra en general es toda parte
representativa de la poblacin, cuyas caractersticas debe reproducir en pequeo lo
ms exactamente posible.

Para que sea representativa se debe seleccionar empleando el muestreo, tpico
importante de la estadstica, con la finalidad de que los resultados de esta muestra
sean vlidos para la poblacin de la que se ha obtenido la muestra. Esta
generalizacin se realiza empleando la estadstica inferencial.


Rey Mndez Jos Alfredo Probabilidad y Estadstica
2.4. MUESTRA ALEATORIA


Una muestra aleatoria de tamao n de la funcin de distribucin de la variable
aleatoria

X es una coleccin de n variables aleatorias
independientes con la misma funcin de
distribucin de la variable aleatoria X.

X
1
, X
2
, X
3
,..., X
n
, cada una


2.5. MUESTRA ALEATORIA APLICADA



Una muestra aleatoria de tamao n es un conjunto de n
observaciones
x
1
, x
2
, x
3
,..., x
n


sobre las
variables

X
1
, X
2
, X
3
,..., X
n
, independientes e idnticamente distribuidas
Rey Mndez Jos Alfredo Probabilidad y Estadstica
x
2.6. PARMETRO


Sierra Bravo (1991), indica que parmetro deriva del vocablo griego parmetreo que
significa medir una cosa con otra: En estadstica se refiere a los valores o medidas que
caracterizan a una poblacin como, por ejemplo, la media y la desviacin tpica de una
poblacin () Son cantidades indeterminadas, constantes o fijas respecto a una condicin
o situacin, que caracterizan a un fenmeno en un momento dado que ocurre en una
poblacin.

Se suele representar a un parmetro mediante letras griegas. Por ejemplo, la media
poblacional se representa mediante
x
y se lee como media poblacional de la variable

aleatoria X, la varianza poblacional se representa mediante
2
y se lee como varianza
Rey Mndez Jos Alfredo Probabilidad y Estadstica

poblacional de la variable aleatoria X.



En trminos prcticos, un parmetro es un valor que resulta al emplear los valores que se
obtienen de una poblacin.


Ejemplo 2.5.



Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, stas se
promedian, entonces
x
= 14.78 es el parmetro correspondiente. Para su clculo se ha
empleado la siguiente expresin, llamada media poblacional:



N

X
i
i 1
(2.1)

x
N



Obviamente que N toma el valor de 300 para este ejemplo.

Si de estos 300 alumnos, 198 son mujeres, entonces la proporcin poblacional de mujeres
representada por
x
= 0.66 (66%). Para su clculo se ha empleado la siguiente expresin,
llamada proporcin poblacional:



N

X
i
i 1
(2.2)

x
N



Pero, ahora la variable aleatoria se define como:



1

X
i

si alumna

0 si

alumno



En este caso el numerador de la expresin (2.2) es 198 y N toma el valor de 300.










Rey Mndez Jos Alfredo Probabilidad y Estadstica
2.7. ESTADSTICO



Se contrapone al parmetro porque es un valor que se obtiene a partir de los valores
muestrales. Se pueden obtener media y varianzas mustrales, por ejemplo.


Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la
muestra en relacin al valor poblacional, que se asume es constante.


Ejemplo 2.6.



Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, una

vez identificados los seis alumnos, se obtienen las siguientes calificaciones

x
1
= 13,


x
2
=


10, x
3
= 13, x
4

= 14 x
5
= 11, x
6

= 10. La media obtenida de los seis alumnos es de

11,83, llamada media muestral y se representa mediante x , cuya expresin es:





Rey Mndez Jos Alfredo Probabilidad y Estadstica
Unidad x
i

x x
2
x
i
13 1,3689
10 -1,83 3,3489
13 1,3689
14 4,7089
11 -0,83 0,6889
10 -1,83 3,3489
Total 71 0,02* 14,8334


n

x
i
i 1
n
(2.3)




El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido
por 6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de
calificacin en la prueba de educacin ambiental.



La varianza de esta muestra aleatoria es 2,4722, y se representa mediante

expresin es:
S
2
, cuya



n
2


x
i
x

S
2 i 1

n
(2.4)



Para su clculo, disponemos de la tabla 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4), sabiendo que x = 11,83:


Tabla 2.1

Clculos para obtener el valor de la varianza (Ejemplo 2.6)




i





















Rey Mndez Jos Alfredo Probabilidad y Estadstica

Tericamente
n

x
i
x 0

i 1



El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de
cada valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que
dividido por 6 es justamente 2,4722.

La raz cuadrada, positiva, de la varianza se llama desviacin estndar o desviacin tpica,
esto es:



S S
2
(2.5)



Entonces, usando la expresin anterior (2.5), la desviacin estndar es S = 1,5723.



2.8. DISTRIBUCIN MUESTRAL



Sierrra Bravo (1991), anota que la distribucin muestral est formada por estadsticos o
valores determinados obtenidos de muestras: medias, varianzas, etc. acompaados de sus
respectivas frecuencias relativas o probabilidades, o de la proporcin de veces que se
repiten en el conjunto de todas las muestras posibles del mismo tamao obtenidas de la
poblacin.


De manera ms formal, Tsokos y Milton (1998), anotan que la distribucin de
probabilidad del estadstico se llama distribucin muestral.


Ejemplo 2.7.


Vamos a obtener la distribucin muestral, de las calificaciones obtenidas en la prueba que
mide la educacin ambiental, de una poblacin hipottica compuesta por 3 estudiantes y

que toma calificaciones iguales a:

X
1
= 13,


X
2
= 11,


X
3
= 07. Fijamos para una muestra





Rey Mndez Jos Alfredo Probabilidad y Estadstica
de tamao 2. En la tabla 2.2 se muestran los posibles resultados de la muestra de tamao

2, as como su respectiva media muestral:



Tabla 2.2

Resultados de posibles muestras de tamao 2



Muestras

posibles
Medias muestrales

(media para cada muestra)
13,11 12
13,7 10
11,13 12
11,7 9
7,13 10
7,11 9


Ahora se muestra la distribucin de frecuencias para los valores de la media muestral:



Tabla 2.3

Distribucin muestral de la media muestral



Valores de las

medias muestrales
Frecuencia Frecuencia relativa
9 2 2/6 = 0.33
10 2 2/6 = 0.33
12 2 2/6 = 0.33


La distribucin muestral de la media muestral es la distribucin de frecuencias o de
probabilidad. En este caso, de las frecuencias relativas de todas las medias muestrales
posibles, obtenidas de muestras de tamao 2, de la poblacin de tamao 3.






Rey Mndez Jos Alfredo Probabilidad y Estadstica
x
Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad

(distribucin muestral).



2.8.1. Media muestral



La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus
propiedades:


Propiedades de la media muestral


Si X es una variable aleatoria con esperanza o media poblacional y varianza
poblacional
2
, entonces la media muestral x tiene las siguientes propiedades:



1. E x



2. V x
2
/ n



3. La desviacin estndar de x , que se representa mediante , conocida tambin como

error estndar de la media muestral es igual a / n



4. Sea X
1
, X
2
, X
3
,..., X
n

una muestra aleatoria de tamao n, de una distribucin con

media poblacional y varianza poblacional
2
. Entonces, para n grande, la variable

aleatoria:



x
/ n
(2.6)




Se distribuye aproximadamente como una normal estandarizada N 0,1 . Se considera

una buena aproximacin cuando n 30 (teorema del lmite central). De este modo,



Rey Mndez Jos Alfredo Probabilidad y Estadstica
(n-1)s^2
a^2
incluso, an cuando la variable aleatoria X no est normalmente distribuida, podemos
aplicarla en la inferencia estadstica.


2.8.2. Varianza muestral



A partir de cada muestra aleatoria de tamao n de X :

calcular la varianza muestral definida como:
x
1
, x
2
,..., x
n
, tambin se puede



s
2
1

n 1

n
2


x
i
x



(2.7)
i 1



Cabe precisar, que algunos autores la llaman cuasivarianza.
Propiedades de la varianza muestral
Si X es una variable aleatoria con esperanza y varianza y ^2

respectivamente,

entonces para la varianza muestral de tamao n se cumple que:



1. E(s^2) = ^2



2. Si X tiene distribucin de probabilidad normal ,
esuna variable aleatoria con

distribucin chi-cuadrado con n 1 grados de libertad.








CUL ES LA DIFERENCIA ENTRE DESVIACIN ESTNDAR
Y ERROR ESTNDAR?
La diferencia es que la DESVIACIN ESTNDAR describe la variabilidad
de los valores de una variable, en cambio el ERROR ESTNDAR describe
la precisin del estadstico.

Rey Mndez Jos Alfredo Probabilidad y Estadstica
Ejemplo 2.8.



En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin
Educativa Martn Adn, se aplic un cuestionario para recoger su opinin sobre el
investigador educativo. Se presenta la respuesta de 3 preguntas, de un total de 27:


Tabla 2.4

Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)



Docente Edad(1) Investigador(2) Remuneracin(3)
1 34 1 1
2 38 1 1
3 49 2 1
4 42 1 1
5 35 1 2
6 44 2 1
7 30 1 2
8 36 1 1
9 43 2 1
10 47 2 1
11 39 1 2
12 46 2 1
13 48 2 1
14 36 1 2
15 44 1 1


(1) Edad en aos cumplidos del docente.

(2) La profesin de investigador es profesin atractiva para:

1. Docentes jvenes. 2. Docentes maduros.

(3) El investigador educativo debe ser bien remunerado:

1. S. 2. No.

Rey Mndez Jos Alfredo Probabilidad y Estadstica

5,48

5,48

n

15

3,87

Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error
estndar.


Media muestral



La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y
varianza poblacional,
2
= 30 aos
2
.


Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene

s
2
= 33,21 aos
2
.



Por tanto la desviacin estndar muestral de la edad es: s s
2
33,21 = 5,76.



En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:




x
= 1,42 aos.




Proporcin muestral


Para la segunda variable, interesa que el docente encuestado indique que la profesin de
investigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria

es igual a 15 docentes n

15 .



En esta poblacin se asume que la proporcin poblacional de docentes que consideran

que la profesin de investigador es una profesin atractiva para docentes jvenes es igual

a 0,71

0,71 .









Rey Mndez Jos Alfredo Probabilidad y Estadstica
De la tabla contamos que, n
A
=9, es decir 9 docentes afirman que la profesin de

investigador es una profesin atractiva para docentes jvenes, entonces empleando la
expresin 2.8, se obtiene:



p
9
= 0,6 (60%)

15



Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.


El error estndar del estadstico p es:



(1 )
p
n
0,71(1
15
0,71) 0,71(0,29)
15
0,2059
15

0,0137

= 0,1170



2.9. ESTIMACIN



La inferencia estadstica se clasifica como: estimacin y prueba de hiptesis de parmetros
estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al
menos un parmetro de esta poblacin, al que vamos a representar mediante la letra
griega .


Cuando no se tiene una nocin preconcebida sobre el valor de , se desea responder a la
pregunta: Cul es el valor de ?


En este caso el intentar conocer el valor de es en trminos estadsticos, estimar el valor
de es decir tratar de conocer el valor del parmetro en trminos prcticos.


Sierra Bravo (1991), anota que estimacin proviene del latn estimatio y significa
estimacin, precio y valor que se da a una cosa. En estadstica es la operacin que
mediante la inferencia un parmetro, utilizando datos incompletos procedentes de una


Rey Mndez Jos Alfredo Probabilidad y Estadstica
muestra, se trata de determinar el valor del parmetro. Pero los valores de la muestra estn
sujetos al error muestral esto es a las fluctuaciones de la muestra.


La estimacin de un parmetro puede ser mediante una:



1. Estimacin puntual.



2. Estimacin mediante intervalos de confianza.



Para cualquiera de estas dos situaciones empleamos el estadstico que, como ya se ha
mencionado, es una variable aleatoria.


La aproximacin se hace utilizando estadsticos apropiados. A un estadstico empleado
para aproximar o estimar un parmetro de la poblacin se le llama estimador puntual
de y se denota mediante

. De este modo por ejemplo, al estimador de la media , se
le denotara por . Una vez que la muestra ha sido tomada y se han hecho algunas
observaciones, se puede obtener el valor numrico del estadstico

. A tal nmero se le
denomina una estimacin puntual de . Ntese que hay una diferencia entre los trminos
estimador y estimacin.




ESTIMADOR: Es el estadstico utilizado para generar una estimacin y es una
variable aleatoria.
ESTIMACIN: Es el valor que toma el estimador.




Ejemplo 2.9.



Consideremos las variables edad en aos cumplidos X y el docente considera que el
investigador educativo debe ser bien remunerado Y , para distinguir entre estimador y
estimacin:



Rey Mndez Jos Alfredo Probabilidad y Estadstica

Variable Parmetro Estimador Estimacin







X

n

x
i
x
i 1

n


x = 40,73 aos


2
2
1
n
2

s
n 1

x
i
x

i 1



2
s
2
=33,21 aos
2



Y

p
n
A

n


p 0,7333 (73,33%)




2.10. PRUEBA DE HIPTESIS



Proceso mediante el cual, a partir de los valores de una muestra aleatoria, se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por
tomar una decisin.


Ejemplo 2.10.



En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8
aos de edad, que asisten a Instituciones Educativas estatales y privadas, para tal fin se
elige al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se
pretenden lograr los siguientes objetivos:

1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin
lectora para tipo de IE.





Rey Mndez Jos Alfredo Probabilidad y Estadstica
2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin
lectora en nios de IE estatal es diferente de los nios de IE privados.


Explicar cul rama de la inferencia estadstica emplear para lograr cada objetivo.



Solucin



Previamente se requiere identificar:



Poblacin. Se trata de dos poblaciones bajo estudio:



1. Nios de 8 aos de edad, que asisten a Instituciones Educativas estatales.



2. Nios de 8 aos de edad, que asisten a Instituciones Educativas privadas.



Muestra. Nios de 8 aos de edad seleccionados aleatoriamente e independiente de cada
poblacin.


Variable aleatoria. Est representada mediante X y se define como: Puntaje de
comprensin lectora obtenida mediante una prueba especial.


Parmetros: En relacin a la variable aleatoria bajo estudio y considerando que se
investiga para dos tipos de IE, los parmetros son:


1
= Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para
nios de 8 aos de edad que asisten a IE estatales.

2
= Nivel promedio poblacional del puntaje de la prueba de comprensin lectora
para nios de 8 aos de edad que asisten a IE privados.






Rey Mndez Jos Alfredo Probabilidad y Estadstica
1
= Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora
para nios que asisten a IE estatales.

2
= Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora
para nios que asisten a IE privadas.
Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener
un valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de
manera independiente de cada tipo de institucin educativa.
Para el logro del objetivo 2. Se debe verificar que los promedios poblacionales 1 y 2
son diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de
2 ( 1 2) o equivalentemente 1 - 2 = 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promedio
poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
estatales y privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el
cual se somete a prueba 1 - 2 = 0.