You are on page 1of 22

c) Modelos no lineales y Mtodo de linealizacin de datos.

Antes de presentar el mtodo de linealizacin, veamos algunos modelos no lineales y sus


correspondientes funciones de error:

Nombre: Modelo: Funcin de error:


Hiperblico 1 k =n 1
2
Y=
aX+b j ( a,b ) = - yk
k =1
axk +b
Geomtrico
( )
k =n 2
Y =aXb j ( a,b ) = axbk - y k
k =1

Exponencial
( )
k =n
Y =ceaX axk 2
j ( a,c ) = ce - yk
k =1

Logartmico Y=aln(X)+b k =n
j ( a,b ) = ( aln ( x k ) + b - y k )
2

k =1

Logstico b k =n b
2
Y= j ( a,b,c ) = axk - y k
1+ceaX
k =1 1+ce

Como se puede ver, las funciones de error tienen formas muy complejas que con seguridad,
conducirn a sistemas de ecuaciones normales muy difciles de resolver. Por esta razn, se
requiere realizar cambios de variables en el modelo a fin de que el sistema de ecuaciones
normales resultante sea lineal. A continuacin se muestran algunos ejemplos de cambios de
variables convenientes de acuerdo al modelo, en algunos modelos se requiere aplicar logaritmos
y por tanto se requiere que los datos sean positivos.

Modelo hiperblico:
1 1
Para el modelo Y = , es conveniente escribirlo como aX+b = , luego hacer los cambios
aX+b Y
1
u= y v=X, resultando el modelo lineal u=av + b.
Y

Modelo Potencial:
Para el modelo Y =aXb , se aplican logaritmos y resulta la ecuacin logartmica ln(Y)=ln(a)
+bln(X). Despus de hacer los cambios u=ln(Y), v=ln(X) y c=ln(a) resulta la ecuacin lineal u =
bv + c.

Modelo Exponencial:
Para el modelo Y =ceaX , se aplican logaritmos y resulta la ecuacin logartmica ln(Y)=ln(c)+aX.
Despus de hacer los cambios u=ln(Y), v=X y b=ln(c) resulta la ecuacin lineal u = b + av.
Para el modelo Y=aln(X)+b, se aplican los cambios u=Y, v=ln(X) y resulta la ecuacin lineal u =
av + b.

Modelo Logstico:

1
b b
Para el modelo Y= , primero se escribe como 1+ceaX = , luego se escribe como
aX Y
1+ce
b b
ceaX = - 1 , se aplican logaritmos y resulta la ecuacin logartmica ln - 1 = aX+ln(c) . Despus
Y Y

b
de hacer los cambios u = ln - 1 , v=X y d=ln(c) resulta la ecuacin lineal u = av + d.
Y

Ejercicio 1. Un problema de medicina legal.


El Instituto Nacional de Medicina Legal y Ciencias Forenses, recoge y analiza la informacin sobre
lesiones fatales y no fatales de causa externa para darlas a conocer y coadyuvar con la
formulacin y seguimiento a las polticas pblicas diseadas con el fin de reducir el fenmeno de
la violencia en Colombia.

Es as como a travs de los puntos de atencin en donde el INMLCF tiene presencia (informacin
directa) y por medio de los mdicos rurales en los lugares del pas en donde no se cuenta con
unidad bsica (informacin indirecta), se ingresa la informacin que permite caracterizar las
lesiones de causa externa mediante variables sociodemogrficas, de caracterizacin del hecho y
espacio-temporales. La siguiente tabla contiene datos de los homicidios durante los aos 2004 a
2009 en Bogot:

Departamento
2004 2005 2006 2007 2008 2009 Total
del hecho
Bogot, D.C. 1600 1689 1336 1401 1465 1649 9140
Teniendo en cuenta el nmero de homicidios en Bogot entre los aos 2004 y 2009, determine
el coeficiente de correlacin. En el ao 2012, cuntos homicidios podemos suponer que se
presentarn en la ciudad de Bogot?

Ejercicio 2: Un problema de frecuencia cardiaca.


En la siguiente tabla se muestra el nmero de latidos que registran 10 personas cada 6
segundos en relacin con el tiempo que gastan en recorrer un kilmetro.

Latidos por minuto Tiempo (en minutos)


52 4,7
55 5,0
58 5,8
60 5,7
65 6,1
70 6,4
72 6,8
75 7,4
80 7,2
82 7,8

a) Encuentre la recta de regresin lineal.


2
b) Cuntos latidos por minuto, se espera que registre una persona que gasta 8,5 minutos para
recorrer un kilmetro?

Ejercicio 3: Un problema de poblacin de roedores.


La tabla muestra la poblacin de cierto tipo de roedores en una zona selvtica de Suramrica,
registrada al finalizar cada semestre durante seis aos.

Semestre Poblacin
Semestre 1 de 2005 12
Semestre 2 de 2005 34
Semestre 1 de 2006 62
Semestre 2 de 2006 96
Semestre 1 de 2007 134
Semestre 2 de 2007 176
Semestre 1 de 2008 222
Semestre 2 de 2008 271
Semestre 1 de 2009 324
Semestre 2 de 2009 379
Semestre 1 de 2010 437
Semestre 2 de 2010 498

a) Encuentre el modelo exponencial que mejor se ajusta a los datos.


b) Pronostique la poblacin para el segundo semestre del 2014.

Ejercicio 4: Ingresos y Publicidad.


La tabla muestra la inversin anual en publicidad para promover cierta marca de jabones y los
ingresos brutos recibidos por ventas anuales, durante 12 aos.
Ao Inversin (en millones) Ingresos (en millones)
2000 10 200
2001 20 230
2002 30 260
2003 40 290
2004 50 240
2005 60 280
2006 70 320
2007 80 380
2008 90 320
2009 100 380
2010 110 440
2011 120 500

a) Encuentre el modelo Geomtrico que mejor se ajusta a los datos.


b) Pronostique los ingresos para cuando se inviertan 150 millones de pesos en publicidad.

Ejercicio 5: Cmo elegir el modelo apropiado?


Retomemos el ejemplo anterior: La tabla muestra la inversin anual en publicidad para
promover cierta marca de jabones y los ingresos brutos recibidos por ventas anuales, durante 12
aos.

Inversin Ingresos
(en (en
millones) millones)
10 200
20 230

3
30 260
40 290
50 240
60 280
70 320
80 380
90 320
100 380
110 440
120 500

Comparar los modelos lineal, cuadrtico, geomtrico, exponencial y logartmico, y determinar


cul es el ms apropiado para realizar pronsticos de los ingresos.

Ejercicio 6: Censo electoral


Segn datos de la Registradura Nacional del Estado Civil, la abstencin ha tenido altibajos del
ao 1958 al ao 2006, como se muestra en la tabla. Determine entre los modelos lineal,
cuadrtico e hiperblico, cul es el ms apropiado para pronosticar la abstencin en futuras
elecciones.

Elecciones presidenciales 1958 - 2006


Ao Censo Votacin Abstencin
total
1958 5.365.191 3.108.567 42.29%
1962 5.404.765 2.634.840 51.25%
1966 6.611.352 2.649.258 59.93%
1970 7.683.785 4.036.458 47.47%
1974 8.925.330 5.218.855 41.53%
1978 12.580.851 5.075.719 59.66%
1982 13.734.093 6.834.250 50.24%
1986 15.611.274 7.228.676 53.70%
1990 14.237.110 6.047.576 57.52%
1994* 17.146.597 7.427.742 56.68%
1998* 20.857.801 12.310.107 59.01%
2002 24.208.311 11.249.734 53.53%
2006 26.731.700 12.041.737 54.95%
* Segunda vuelta.

Ejercicio 7: Paracaidismo
Para conocer la relacin entre la velocidad de cada de un paracaidista y la fuerza de friccin
hacia arriba, se han realizado las siguientes mediciones:

Velocidad 1.5 2.5 3.5 4.5 5.5 6.5


Friccin 6.0 15.5 30.0 46.5 66.5 90.5

La velocidad se mide en centmetros por segundo y la friccin en dinas. Elabore el diagrama de


dispersin y obtenga la curva parablica que mejor se ajusta a los datos.

4
Ejercicio 8: Poblacin de roedores
Cuando una poblacin P(t) tiende a cierto valor L a medida que transcurre el tiempo t, la grfica
L
de P es una curva conocida como curva logstica y definida como P(t) = . Encuentre la curva
1+ceat
logstica que se ajusta a la siguiente tabla, considerando que la poblacin tiende a L=1200.

t 0 1 2 3 4 5
P(t) 180 350 600 800 950 1100

Ejercicio 9: Crditos hipotecarios


Las tasas de inters aplicadas a los crditos hipotecarios en los ltimos aos han influido en el
nmero de construcciones iniciadas en el pas. Los datos que se muestran a continuacin
muestran las tasas de inters por trimestre y la cantidad de construcciones iniciadas en este
semestre en una ciudad dada:

Y = Cantidad de
X = Tasa de
Mes Construcciones
inters (%)
iniciadas
Enero 11,5 260
Febrero 11,4 250
Marzo 11,6 241
Abril 12,4 256
Mayo 12,8 270
Junio 13,2 220
Julio 13,5 190
Agosto 13,0 195
Septiembre 12,7 200
Octubre 12,9 210
Noviembre 12,5 230
Diciembre 12,0 245
a) Encuentre la recta de regresin lineal para estos datos.
b) Pronostique el nmero de construcciones iniciadas que corresponden a una tasa de
inters de 11,0%.

Ejercicio 10: Nutricin


Un nutricionista plante una dieta de adelgazamiento para un grupo de pacientes. En la tabla
aparecen los datos sobre el promedio de kilos perdidos desde el inicio de la dieta (variable Y) y
la cantidad de semanas que llevan siguiendo la dieta (Variable X).

X 3 5 6 8 11 13 15 16
Y 2.5 5.5 5.5 8.5 10.5 13.5 15.0 15.0

a) Determine el modelo de regresin que explica el peso perdido en funcin del tiempo que se
lleva siguiendo la dieta.

b) Segn el modelo considerado, qu peso esperara perder una persona que siga la dieta
durante 8 semanas?
5
Ejercicio 11: El mejor modelo
Las funciones Y = 4.5 0.121X, Y = 0.0054X 2 0.3065X + 5.3333, Y = 8.4242X -
0.5644 -0.0516X
, Y = 4.9408e y Y = 6 1.4427ln(X), son modelos que se ajustan a los datos que se
muestran en la tabla. Determine cul de las cinco curvas es la que mejor se ajusta.

X 2 4 8 16 32
Y 5 4 3 2 1

Ejercicio 12: Clculo de errores


Considere la siguiente tabla de datos, correspondientes a dos variables X e Y:
X 5 20 35 50 64 80 95 110
Y 20 15 20 15 25 25 30 45

a) Encuentre la recta y la parbola de regresin.


b) Calcule el error total para cada una de las lneas anteriores.
c) Calcule Y(155), utilizando la lnea que considere ms confiable.

Ejercicio 13: Poblacin


A continuacin se presenta una tabla incompleta de la poblacin en las ultimas 11 dcadas de
una ciudad cosmopolita de acuerdo a censos realizados. Se debe llenar la tabla con ayuda de un
modelo de regresin apropiado.

Ejercicio 14: Oferta y demanda


En mercadeo, la ecuacin de demanda relaciona el precio de un artculo con la cantidad de
unidades que los consumidores estn dispuestos a comprar a ese precio. Generalmente a mayor
precio la demanda baja y a menor precio la demanda sube. En la siguiente tabla se muestra el
precio p de un artculo (en miles de pesos) y la demanda q (en miles de unidades) en diferentes
periodos. Encuentre la curva de regresin que mejor se ajusta a los datos, como una funcin
hiperblica de p en trminos de q.

q 10 20 30 40 50 60 70 80 90
p 100 70 50 55 50 45 40 35 35

Ejercicio 15: Problema de Poblacin

6
La siguiente tabla muestra la poblacin de Estados Unidos cada 20 aos, desde el ao 1820
hasta el ao 2000. Encuentre las curvas de regresin exponencial y geomtrica asociadas a la
tabla de datos, y determine de dos maneras diferentes cul es la ms apropiada para pronosticar
la poblacin aproximada en el ao 2020.

Ao 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000
Pobl 1,0 1,7 3,1 5,0 7,6 10,6 13,2 17,9 22,7 28,1

Ejercicio 16: Evolucin de una Virosis


Se desea estudiar la evolucin de una virosis en un instituto que tiene 520 alumnos, por tanto el
contagio slo puede extenderse, como mximo a 520 alumnos. Dos aos antes una virosis
similar evolucion de la manera como se muestra en la tabla, donde S representa el nmero de
semanas transcurridas desde el momento que apareci la virosis y A representa la cantidad de
alumnos contagiados. Aprovechando los datos histricos, encuentre la curva logstica que mejor
se ajusta a la propagacin de la virosis y determine en qu semana se habr enfermado la mitad
de los alumnos.

S 1 2 3 4 5 6 7 8 9 10 11 12
A 14 28 34 56 68 114 158 226 326 400 438 474

(Distribucin de Medias y Varianzas)

Objetivo:
El objetivo de este taller es elaborar tablas de distribuciones muestrales a partir de los datos una
variable aleatoria X.

Definicin:
Una muestra es la seleccin de un numero de observaciones de a partir de una poblacin objeto
de investigacin; se denomina muestra aleatoria a una seleccin que sigue un mtodo de
eleccin impredecible. Las muestras nos permiten mediante la inferencia estadstica representar
los resultados de la poblacin de donde se haya extrado, existiendo una variacin en los
resultados conocida como error de muestreo.
7
Actividad 1:
Consideremos la variable X correspondiente a las notas de siete estudiantes en una prueba de
informtica. La tabla muestra los cdigos de los estudiantes y las notas obtenidas por ellos:

Cdigo X=Notas
01 25
02 20
03 45
04 40
05 30
06 35
07 50

Consideremos todas las posibles muestras de tamao 3:

20,25,30 20,30,45 20,45,50 25,35,50 30,40,45


20,25,35 20,30,50 25,30,35 25,40,45 30,40,50
20,25,40 20,35,40 25,30,40 25,40,50 30,45,50
20,25,45 20,35,45 25,30,45 25,45,50 35,40,45
20,25,50 20,35,50 25,30,50 30,35,40 35,40,50
20,30,35 20,40,45 25,35,40 30,35,45 35,45,50
20,30,40 20,40,50 25,35,45 30,35,50 40,45,50

Definicin:
Sea A= { x1,x2 ,x3 ,...,xn } una muestra tomada de una poblacin S= { x1,x2 ,x3 ,...,xn ,..., xm } .
k =n

x1 +x2 +x3 +...+xn


xk
a) La media muestral se define como .
X= = k =1

n n
k =n

b) La varianza muestral se define como ( x - x) +( x


1
2
2 )
2
- x +...+ xn - x ( )
2
(x k - x)2
.
S2 = = k =1

n-1 n-1

Actividad 2:
Consideremos las 35 muestras resultantes, y a cada muestra, calclese la media X :

8
Actividad 3:
Considere la variable aleatoria X . (Poblacin de medias)

9
a) Determine el recorrido de la variable X .
b) Elabore una tabla de distribucin de frecuencias de la variable X .
c) Elabore una tabla de distribucin de frecuencias relativas de la variable X .

Actividad 4:

a) Calcule la media de la variable X.


b) Con base en la tabla anterior, calcule la media de la variable X .
c) Qu relacin hay entre las medias X y X ?
d) Calcule la varianza de la variable X.
2

e) Con base en la tabla anterior, calcule la varianza 2 de la variable X .


f) Qu relacin hay entre las varianzas 2X y 2X ?

Conclusiones:
Dada una poblacin X y su poblacin de medias muestrales X , se concluye que:

1) La relacin entre las medias X y X es:

2) La relacin entre las varianzas 2X y 2X es:

Actividad 5:
Consideremos las 35 muestras resultantes, y a cada muestra, calclese la varianza S2.

10
Actividad 6:
Considere la variable aleatoria S2. (Poblacin de varianzas muestrales)

11
a) Determine el recorrido de la variable S2.
b) Elabore una tabla de distribucin de frecuencias de la variable S2.
c) Elabore una tabla de distribucin de frecuencias relativas de la variable S 2.

Actividad 7:

a) Calcule la media de la variable S2.


b) Qu relacin hay entre las medias (S2 ) y (X) ?
c) Calcule la varianza 2 de la variable S2.
d) Qu relacin hay entre las varianzas 2 (X) y (S2 ) ?

Conclusiones:
Dada una poblacin X y su poblacin de varianzas muestrales S2, se concluye que:

1) La relacin entre las medias (X) y (S2 ) es:

2) La relacin entre la varianza 2 (X) y la media (S2 ) es:

3) Existe alguna relacin entre las varianzas 2 (X) y 2 (S2 ) ?

12
Objetivo:
El objetivo de la estimacin puntual es usar una muestra para obtener nmeros (estimaciones
puntuales) que sean la mejor representacin de los verdaderos parmetros de la poblacin.

1. Sea un parmetro (Medida descriptiva en una poblacin).


2. Un estimador $ es un estadstico (Medida descriptiva en una muestra) que se usa para
estimar un parmetro, a travs de una variable aleatoria.
3. $ en cada muestra se llaman estimaciones puntuales.
Los valores que toma

Actividad 1:
Cuatro tiradores desconocidos llegan a una competencia en donde cada uno debe lanzar el dardo
25 veces. Dependiendo de la zona en donde quede el dardo recibir una puntuacin segn la
siguiente figura:

Al terminar de hacer sus lanzamientos cada tirador, se tom una foto del objeto de tiro al blanco para
ser analizada por los jueces y decidir cul de los cuatro es el mejor. Las fotos se muestran en la
siguiente figura:

Tirador 1 Tirador 2 Tirador 3 Tirador 4

Llene la siguiente tabla, en la primera se colocan los puntajes, y en las dems columnas se
colocan la cantidad de dardos que cay en cada zona para cada tirador.

Puntajes: Xk Tirador 1: Fk Tirador 2: Fk Tirador 3: Fk Tirador 4: Fk


0
20
40
60
80
100
Total

Los jueces, para determinar cul es el mejor de los cuatro competidores, calcula la media de los puntajes
obtenidos por cada tirador. Calcule la media X de los puntajes Xk obtenidos por cada tirador, y escrbalos en
la siguiente tabla:

13
Competidor Media de los puntajes X
Tirador 1 x1 =

Tirador 2 x2 =
Tirador 3 x3 =
Tirador 4 x4 =

PREGUNTAS:

4. Desde el inicio de la competencia se poda predecir la media que obtendra cada competidor?

5. Se puede decir que la media X es una variable aleatoria?

6. Es X una variable aleatoria muestral?

De acuerdo con la ltima tabla:

7. Cul es el mejor de los cuatro competidores? (mayor exactitud)

8. Cul es el peor de los cuatro competidores?

9. Cul es el ms preciso de los cuatro competidores?

NOTA:

10. La variable X es un estimador. $ = X.


11. Cada valor xk , es decir, la media de cada jugador es una Estimacin puntual.

Actividad 2:
Con motivo de los festejos del da del nio, el departamento de relaciones pblicas de una
fbrica desea conocer el nmero de hijos que tienen los 200 obreros que ah laboran. Para esto,
se entrevistan a todos los obreros en orden alfabtico, como aparecen en la nmina,
obtenindose los resultados que se muestran en la tabla.

12. Seleccione una muestra con reemplazo de tamao n=30. Considere la variable X = Nmero
de hijos por obrero.
13. Elabore una tabla de frecuencias absolutas y relativas para su muestra, clasificando los
obreros de acuerdo a la variable X.
14. Calcule x de su muestra seleccionada

14
Nmero del Nmero de Nmero del Nmero de Nmero del Nmero de Nmero del Nmero de
Obrero Hijos Obrero Hijos Obrero Hijos Obrero Hijos

1 8 51 6 101 8 151 4
2 0 52 4 102 0 152 3
3 5 53 7 103 5 153 4
4 3 54 8 104 3 154 5
5 6 55 5 105 4 155 0
6 5 56 7 106 8 156 8
7 0 57 4 107 2 157 4
8 4 58 8 108 0 158 5
9 0 59 8 109 6 159 5
10 8 60 7 110 3 160 8
11 7 61 0 111 0 161 4
12 6 62 2 112 5 162 3
13 1 63 0 113 4 163 8
14 4 64 0 114 2 164 0
15 0 65 2 115 4 165 8
16 7 66 3 116 4 166 0
17 4 67 4 117 2 167 2
18 5 68 8 118 5 168 4
19 8 69 7 119 6 169 8
20 0 70 3 120 8 170 1
21 2 71 5 121 6 171 8
22 8 72 1 122 0 172 2
23 4 73 5 123 7 173 5
24 5 74 3 124 3 174 8
25 6 75 4 125 7 175 2
26 5 76 7 126 0 176 4
27 3 77 6 127 3 177 6
28 8 78 2 128 0 178 3
29 7 79 3 129 5 179 6
30 1 80 0 130 4 180 5
31 4 81 0 131 7 181 3
32 6 82 6 132 3 182 2
33 0 83 2 133 5 183 7
34 5 84 6 134 5 184 2
35 4 85 4 135 6 185 7
36 1 86 4 136 0 186 3
37 1 87 0 137 3 187 2
38 4 88 8 138 5 188 6
39 4 89 8 139 2 189 4
40 3 90 5 140 3 190 6
41 5 91 4 141 3 191 8
42 5 92 4 142 0 192 5
43 7 93 8 143 4 193 3
44 8 94 3 144 8 194 5
45 7 95 3 145 3 195 5
46 8 96 1 146 3 196 3
47 6 97 7 147 1 197 6
48 4 98 8 148 7 198 6
49 3 99 8 149 5 199 4
50 3 100 6 150 4 200 4

Tabla: Obreros y Cantidad de hijos por obrero.

PREGUNTAS FINALES:

15. Cul es el estimador?


16. Cul es la estimacin puntual?
17. Puede elaborarse la distribucin muestral para x ?

15
4.1 Estimacin de la media por intervalos - Varianza conocida

Objetivo:
El objetivo de la estimacin por intervalos es obtener los lmites entre los cuales se encuentra el
verdadero valor del parmetro de una poblacin con un cierto nivel de confianza.

Teora:
Un intervalo probabilstico (a,b) para el cual la probabilidad de que el intervalo contenga al
parmetro (Medida descriptiva para la poblacin) sea igual a 1- se llama Intervalo de
confianza al (1-)x100% para estimar al parmetro . En tal caso se escribe P(a< <b) = 1-.

El valor se denomina Nivel de significacin, y el valor (1-) se denomina Nivel de confianza.

Si la media de la poblacin es desconocida y la varianza 2 es conocida, se puede determinar


un intervalo (a,b) talque P(a< <b) = 1-. El valor de se reparte simtricamente entre las
dos colas de la curva Normal estndar, quedando (1- ) en la regin central y /2 en cada cola

de la curva. El problema se reduce a resolver la desigualdad P - x0 < Z/2 = 1 - , donde
n

x0 es una estimacin puntual de y Z/2 es el margen de error.
n

Actividad 1:

Las calificaciones finales de 250 participantes en unas Olimpiadas Internacionales de


Matemticas y Estadstica se presentan en la tabla 1 con sus respectivos cdigos. Las
pruebas se calificaron de 0 a 10 puntos. Se sabe que la varianza fue de 10.50 puntos
cuadrados.

18. Seleccione una muestra con reemplazo de tamao n=40. Considere la variable X = Nota
final del participante.
19. Calcule una estimacin puntual x0 a partir de su muestra seleccionada.
20. Calcule un intervalo de confianza para la media poblacional con una probabilidad del 95%,
tomando la estimacin puntual x0 calculada por usted en el punto anterior.
21. Use la Tabla de la Normal Estndar Z, para encontrar los extremos del intervalo (-Z /2,Z/2)

talque P{ (-Z/2,Z/2) } = 0.95

22. Cules son los valores de Z/2 y Z/2? Estos valores se llaman coeficientes de confianza.

16

23. La desigualdad - x0 < Z/2 es equivalente a x0 -Z/2 << x 0 +Z /2 . Por lo tanto,
n n n


P - x0 < Z/2 = 0.95 es equivalente a P
x0 -Z/2 << x 0 +Z /2 = 0.95

n n n


24. Ahora, comparando P( a < < b ) = 0.95 y P x0 -Z/2 << x 0 +Z /2 = 0.95
se tiene
n n


a = x0 -Z/2 y b = x0 -Z/2 .
n n

25. Cules son los valores de a = x0 -Z/2 y b = x0 -Z/2 ?
n n
26. Finalmente, Cul es el intervalo de confianza (a,b) ?

27. Con base en el desarrollo anterior, complete la siguiente frase:

La probabilidad de que el verdadero valor del parmetro ______ se encuentre en el intervalo


______________ es del __________.

28. Cul ser el intervalo de confianza, si se toma un nivel de significacin del 10% ?

29. Cul ser el intervalo de confianza si toma un nivel de confianza del 96.6%

30. Cul debe ser el tamao de la muestra para obtener un intervalo con un nivel de confianza
del 95%, con un margen de error de 1 punto?

31. Cul debe ser el tamao de la muestra para obtener un intervalo con un nivel de confianza
del 95%, con un margen de error de 2 puntos?

32. Cul debe ser el tamao de la muestra para obtener un intervalo con un nivel de
significacin del 10%, con un margen de error de 2 puntos?

33. Si se toma una muestra de tamao n=20 y se desea obtener un intervalo de confianza con
un nivel de confianza del 90%, entonces:
a) Cules son los coeficientes de confianza?
b) Cul es la longitud del intervalo de confianza?

34. Ahora, seleccione una muestra sin reemplazo de tamao n=30. Considere la variable X =
Nota final del participante.
a) Elabore la Tabla de distribucin de X.
b) Calcule una estimacin puntual de la media poblacional .
c) Cul es el margen de error?
d) Para un nivel de confianza del 90%, Cul es el intervalo de confianza?

35. Ahora, seleccione una muestra sin reemplazo de tamao n=40. Considere la variable X =
Nota final del participante.
a) Elabore la Tabla de distribucin de X.
b) Calcule una estimacin puntual de la media poblacional .
c) Cul es el margen de error?
d) Para un nivel de significacin del 10%, Cul es el intervalo de confianza?

17
Tabla 1: Notas finales de 250 participantes.

18
4.2 Estimacin de la media por intervalos - Varianza desconocida

Objetivo:
El objetivo de este taller es realizar la estimacin por intervalos de la media poblacional cuando
no se conoce la varianza de la poblacin. Se usar la distribucin T-Student y se trabajar con la
varianza de la muestra. Tambin veremos la utilidad del teorema central del lmite.

Distribucin T-Student:
La distribucin T fue creada por Goset y formalizada por Fisher. Es una familia de distribuciones
semejantes a la distribucin normal estndar Z. Cada miembro de la familia T est determinado
por el tamao de la muestra n. Para valores pequeos de n, se tiene que 2 (T)> 2 (Z) . A medida
que aumenta el valor de n, las grficas de f(T) se acercan a la grfica de f(Z), esto permite
calcular probabilidades de la distribucin T-Student con la distribucin Z-Estndar.

Supngase que se toma una muestra de tamao n. Entonces:


X-
Z= X
1) Cuando la varianza de X se conoce, se usa la expresin X y la tabla de la
n
distribucin normal estndar Z.
X-
2) Cuando la varianza de X no se conoce, se usa la expresin T= X
y la tabla de la
S
n
k=n

distribucin T-Student. S es la desviacin estndar de la muestra (x k -x) 2


con (n-1)
S= k=1

n-1
grados de libertad.
n +1
-
x 2 2 n + 1
+ 1 G
3) La funcin T-Student para n grados de libertad es f ( x) = n 2 , donde
n
n
np G
2

G(a) =
t a -1e - t dt .
0

Estimacin de en muestras pequeas (n<30):

Si X es una variable distribuida normalmente con media y varianza desconocidas, S es la


desviacin estndar muestral de una muestra de tamao n, entonces, para estimar el intervalo
que contiene a la media de X con una seguridad del ( 1- %) , la tabla T-Student proporciona

el valor de t0 para el cual se acumula el 1- % del rea bajo la curva fn(x). Es decir,
2
S S S
P x- < t 0 =1( - %) . El intervalo de confianza es x - t 0 < <x + t 0 .
n n n

19
Estimacin de en muestras grandes (n>30):

Cuando el tamao de la muestra es n suficientemente grande, el teorema central del lmite


garantiza que:

1) X es aproximadamente normal sin necesidad de que la variable X sea normal.

2 (X)
2) (X)=(X) y 2 (X)= .
n

Por lo tanto se puede utilizar la tabla de la normal estndar Z para estimar el intervalo que
contiene a la media con una seguridad de ( 1- %) buscando el valor de z0 para el cual se
acumula simtricamente el ( 1- %) del rea bajo la normal estndar. Es decir,
S 1- S S
0< x-< z
P 0 = % . El intervalo de confianza es x - z 0 < <x + z0 .
n 2 n n

Ejercicio 1:
Encuentre el valor de t0, para el cual se cumplen las siguientes igualdades:

a) P ( T8 < t 0 ) = 0.75
b) P ( T10 < t 0 ) = 0.80
c) P ( T12 < t 0 ) = 0.85
d) P ( T15 < t 0 ) = 0.90
e) P ( T20 < t 0 ) = 0.95

20
Ejercicio 2:
De una poblacin X, donde no se conoce la media y la varianza, se toman muestras de tamao n
y varianza S2. Se quiere estimar (X). Use la tabla T-Student, para completar la siguiente tabla:

n x 1- S2 t0
10 8.5 0.80 14.40
15 7.5 0.90 20.25
20 9.0 0.95 12.25
25 10.5 0.90 72.25
30 11.5 0.99 81.00

Ejercicio 3:
De una poblacin X, donde no se conoce la media y la varianza, se toman muestras de tamao n
y varianza S2. Se quiere estimar (X). Use la tabla T-Student, para completar la siguiente tabla:

Intervalo de
n x 1- S2
confianza
10 8.5 0.80 14.40
15 7.5 0.90 20.25
20 9.0 0.95 12.25
25 10.5 0.90 72.25
30 11.5 0.99 81.00

Ejercicio 4:
De una poblacin X, donde no se conoce la media y la varianza, se toman muestras de tamao n
y varianza S2. Se quiere estimar (X). Compare los intervalos de confianza obtenidos usando la
tabla T-Student con los obtenidos usando la tabla normal estndar. Complete la siguiente tabla:

Intervalo de Intervalo de
n x 1- S2
confianza con T confianza con Z
35 8.5 0.80 14.40
40 7.5 0.90 20.25
45 9.0 0.95 12.25
50 10.5 0.90 72.25
55 11.5 0.99 81.00

Ejercicio 5:
Un grupo de 400 estudiantes present una prueba de Informtica calificada de 0 a 10 puntos. Se
toma una muestra de 40 estudiantes. En la tabla se muestran las notas de la muestra.

Estime en que intervalo se encuentra el promedio de todo el grupo con una seguridad del 80%,
90% y 95%, utilizando las distribuciones T-Student y Z-Normal estndar.

21
TABLA DE LA DISTRIBUCIN T-STUDENT

1-
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707


7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106


12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921


17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831


22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779


27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704


60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

22