Вы находитесь на странице: 1из 35

INGENIERIA CIVIL

QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

UNIVERSIDAD RURAL DE
GUATEMALA

TEXTO PARALELO
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

CESAR FROILAN CHIQUIN CHIQUIN 15-059-

0038

TEXTO PARALELO

ING. RONAL ASIG


METODOS ESTADISTICOS PARA INVESTIGADORES
09-06-17

TEORA DE LA ESTIMACIN
Razn para estimar
Los profesionales utilizan las estimaciones porque se deben tomar decisiones

racionales, sin que tengan la informacin pertinente completa y con una gran incertidumbre

acerca de lo que pueda deparar el futuro, pero con la esperanza de que las estimaciones

posean una semejanza razonable con el resultado


Estimador
Es la regla o procedimiento, expresado en general por medio de una frmula, que se

utiliza para deducir la estimacin.


Estimacin
Es un valor especfico observado de un estimador, por lo que asigna un valor

numrico a un parmetro de una poblacin sobre la base de datos de muestra.


Tipos de estimacin
a. Estimacin puntual: consiste en un solo estadstico muestral que se usa para

estimar el valor verdadero de un parmetro de una poblacin que es desconocido.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Por ejemplo, la media muestral es un estimador puntual de la media poblacional

.
Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo

bueno de estimacin es prcticamente improbable que el valor de la estimacin

coincida con el verdadero valor del parmetro, as que sera conveniente acompaar

nuestra estimacin con alguna medida que nos permitiera expresar la cercana del

estimador al parmetro.
b. Estimacin por intervalo: es la estimacin de un parmetro de la poblacin dado

por dos nmeros entre los cuales se puede considerar que se encuentra el parmetro.

Las estimaciones de intervalo indican la precisin de una estimacin y son, por lo

tanto, preferibles a las estimaciones puntuales.


Caractersticas que debe tener un buen estimador
1. Debe ser insesgado: un estimador es insesgado, si en promedio, tiende a tomar

valores que estn por encima del parmetro de la poblacin con la misma frecuencia

y la misma extensin, con la que tiende a asumir valores por debajo del parmetro

de poblacin que se est estimando.


2. Debe ser eficiente: de varios estimadores insesgados, el ms eficiente es el que

tiene el error estndar ms pequeo.


3. Debe ser consistente: significa que a medida que aumenta el tamao de la muestra,

la estimacin se aproxima al valor del parmetro.


4. Debe ser suficiente: significa que ningn otro estimador puede suministrar ms

informacin sobre el parmetro.


Nivel de Confianza
Probabilidad asociada con una estimacin de intervalo de un parmetro de

poblacin. sta indica qu tan seguro se est de que la estimacin de intervalo incluir al

parmetro de la poblacin. Los niveles de confianza que ms se utilizan son 90%, 95% y

99%.
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Intervalo de Confianza
Es el alcance, rango o recorrido de la estimacin que se hace y que tiene designada

una probabilidad de que incluya el valor real del parmetro de la poblacin que se est

estimando.
Lmites de Confianza
Son el lmite inferior y superior de un intervalo de confianza.
Coeficiente de Confianza
Es el nivel de confianza (en valores relativos) que tenemos en que el intervalo

contiene el valor desconocido del parmetro. Por ejemplo, para un nivel de confianza del

90%, el coeficiente de confianza es 0,9

Relacin entre nivel de confianza e intervalo de confianza

Aunque podra pensarse que deberamos utilizar un alto nivel de confianza (como

99%) en todos los problemas de estimaciones, en la prctica, altos niveles de confianza

producen intervalos de confianza grandes y stos no son precisos.

Interpretacin de los intervalos de confianza

Un intervalo de confianza se puede interpretar de dos maneras diferentes. Ejemplo:

una directora de tiendas cree que el gasto medio de sus clientes en el ltimo ao se

encuentra en el intervalo de 35 a 38 dlares y concede una significacin del 95% a ese

intervalo.
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Interpretacin 1: confa al 95% en que la media poblacional se encuentra entre 35

y 38 dlares.

Interpretacin 2: si se construyen todos los intervalos de confianza posibles, el

95% de ellos incluir el parmetro desconocido.

Probabilidad de error (el valor )

Es la proporcin de intervalos que no contienen el valor desconocido del parmetro.

Se calcula utilizando el coeficiente de confianza:

= 1 Coeficiente de Confianza

Intervalos de confianza para la media poblacional y la proporcin (muestras grandes)

a. Para la media:

La expresin Z o Z s es el margen de error. Grficamente:


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

b. Para la proporcin: tericamente, la distribucin binomial es la distribucin

correcta para utilizarse en la construccin de intervalos de confianza para estimar

una proporcin, sin embargo, debido a que el clculo de probabilidades binomiales

es muy tedioso podemos aproximar a una normal al aumentar el tamao de la

muestra y siempre que n y n(1-) sean mayores o iguales 5.

Intervalos de confianza para la media poblacional (muestras pequeas)

Hasta ahora se haba estudiado la estimacin para la media poblacional en diversas

condiciones, en algunos casos se conoca mientras que en otros se eluda esta hiptesis. Se

han calculado intervalos de confianza con la hiptesis de una poblacin que segua una

distribucin normal y tambin cuando se supona que la distribucin era desconocida pero a

la cual se poda aplicar el teorema del lmite central ya que las muestras eran grandes. Sin

embargo, en muchas aplicaciones, obtener una muestra grande es poco probable e incluso

imposible, por ejemplo, las compaas de seguro que comprueban la resistencia de los

carros a las colisiones. Destruir a propsito 30 o ms carros puede ser algo caro.
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Cuando hay que tomar una muestra pequea, la distribucin t de student es ms

apropiada.

El intervalo correspondiente ser: = x t s

La distribucin t

(a) Caractersticas

Es simtrica respecto de la media.

El eje horizontal es una asntota y la grfica se extiende de - a .

Su varianza es mayor que 1 por lo que grficamente esta distribucin es ms

achatada y ms dispersa que la normal.

La varianza de la distribucin depende de los grados de libertad (es el nmero de

valores que podemos escoger libremente. gl = n 1)

La varianza es

Cuando n 30, esta distribucin se aproxima a una normal


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

(b) Condiciones para usar la distribucin t:

La muestra es pequea (n < 30)

No se conoce

Se supone que la poblacin es normal o aproximadamente normal.

(c) Caractersticas de la tabla de la distribucin t:

Es ms compacta y muestra reas y valores de t solamente para algunos porcentajes.

No se enfoca en la probabilidad de que el parmetro de la poblacin que se est

estimando se encuentre dentro de nuestro intervalo de confianza, mide la

probabilidad de que no est dentro de nuestro intervalo de confianza.

Se deben especificar los grados de libertad con los cuales se est trabajando

Determinacin de tamao de muestra en estimacin

Qu tan grande deber ser la muestra?, si es muy pequea se puede fallar en la

obtencin de los objetivos de nuestro anlisis; pero si es demasiado grande desperdiciamos

recursos cuando tomamos la muestra.

Siempre se tendr algo de error de muestreo debido a que no hemos estudiado a la

poblacin completa, cada vez que tomamos una muestra perdemos algo de informacin til
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

con respecto a la poblacin; pero ese error se puede controlar si se selecciona una muestra

cuyo tamao sea adecuado.

Dado un nivel de confianza que se desea, hay dos factores principales que influyen

en el tamao muestral necesario:

a) La variabilidad de la poblacin (queda fuera del control del investigador).

b) El grado de error que se puede tolerar.

Control de la anchura del intervalo

Es evidente que si se estrecha el intervalo, se suministrar al investigador una

estimacin ms exacta del valor del parmetro. Hay dos mtodos corrientes para estrechar

un intervalo, pero para ambos se debe hacer un sacrificio adicional. Estos procedimientos

son:

a. Ajuste del nivel de confianza: por la propia naturaleza de los intervalos de

confianza, si se acepta un nivel de confianza ms bajo, se podra generar un

intervalo ms preciso, menos amplio, pero eso aumenta la probabilidad de

error.
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

b. Ajuste del tamao de la muestra: el aumentar el tamao de la muestra

disminuye el error esperado y es ms probable que se de una estimacin

ms ajustada del valor verdadero del parmetro, con ello se puede conservar

un nivel de confianza determinado y al mismo tiempo disminuir la anchura

del intervalo; pero el sacrificio es un aumento ya sea de tiempo, del gasto,

etc.; que se exige para recoger los datos para una muestra mayor.

Ejemplo:

Hemos preguntado a un conjunto de 42 personas, tomadas al azar de la ciudad,

cuntas llamadas realizaron la semana pasada desde su telfono mvil a un fijo. La ciudad

cuenta con 130 mil habitantes. El resultado es el siguiente:

Por trmino medio

Lo primero que nos interesa es encontrar cul es el nmero medio semanal de

llamadas a fijos que realizan en la ciudad desde un telfono mvil. Se trata de estimar la

media aritmtica poblacional, para lo que necesitamos la media de la muestra (estimador), la

desviacin tipo, la distancia estandarizada que representa la seguridad y el tamao de la


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

muestra. Pongamos que, por llevar la contraria a Sir Ronald y porque tampoco se nos ocurre

qu problema serio puede derivarse de nuestro posible error, utilizaremos una seguridad del

90%.

Lo primero es observar si podemos suponer que la distribucin muestral de medias

de la que proviene nuestra muestral es normal. Podemos suponerlo, puesto que n = 42 30.

Lo siguiente es traducir la seguridad a una distancia estandarizada, utilizando la

curva normal estandarizada. Segn la tabla que tenemos en el monogrfico La curva normal,

un rea centrada del 90% se corresponde con una puntuacin tipo de valor 1,645.

Acto seguido, nos falta el estimador y la desviacin tipo. Lo resolvemos mediante

una tabla de frecuencias (donde d2 es la distancia cuadrtica a la media):


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Con esta informacin:

Luego, con una seguridad del 90%, afirmamos que la gente de la ciudad realiza

semanalmente entre 3,97 y 5,03 llamadas de mvil a fijo por trmino medio.

Pongamos un porcentaje

Qu porcentaje de personas en la ciudad realizan no menos de 5 llamadas de mvil

a fijo durante una semana? Utiliza una probabilidad de errar del 5%.

En la muestra, 8+3+9+2=22 personas realizaron no menos de 5 llamadas de ese

tipo, lo que significa un 22/42*100 = 52,38% de la muestra. Al consultar la tabla de la curva

normal estandarizada, el rea centrada del 95% se corresponde con una distancia

estandarizada de 1,96. Podemos consultar sin problemas esta tabla, puesto que es asumible

que la distribucin muestral de proporciones es normal. Utilizando p como criterio (pues

carecemos del valor de ):

np = 420,5238 = 22 5 n (1p)= 42 0,4762= 20 5

As pues:
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Luego, con una seguridad del 95% podemos concluir que entre un 37% y un 67%

de la gente de la ciudad realiza no menos de 5 llamadas de mvil a fijo en una semana.

Observa que he utilizado valores de porcentaje en lugar de proporciones. Esto es

intrascendente. Puedo hacer los clculos con proporciones y multiplicar finalmente por 100,

o arrastrar los porcentajes desde cuando quiera.

En total

Y, por ltimo, a partir de los resultados anteriores queremos conocer cuntas

llamadas de mvil a fijo se hacen en la ciudad y cunta gente hace no menos de 5 llamadas,

ambos semanalmente. Como sabemos que la ciudad alberga a 130 mil habitantes, podemos

responder a estas dos inquietudes. No obstante, al tratarse de dos conclusiones realizadas

con niveles diferentes de seguridad, no van a ser comparables. Para evitarlo, vamos a repetir

los clculos y, ya puestos, variando tambin la seguridad. Esta vez vamos a responder a

ambas preguntas a travs de un riesgo de equivocarnos del 3%.

Al consultar la tabla para un rea centrada del 97% de seguridad, el valor

estandarizado correspondiente es 2,17. Luego:

Para la media:
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Si cada persona realiza entre 3,8 y 5,2 llamadas de mvil a fijo semanales, las 130

mil realizarn entre 3,8*130000= 494 mil y 5,2*130000= 676 mil de este tipo de llamadas a

la semana. Respecto a la proporcin:

Si esto ocurre en una poblacin de 130 mil personas, podemos concluir con una

seguridad del 97% que entre 130000*0,3566= 46358 y 130000*0,691=89830 de ellas

realizan no menos de cinco llamadas de mvil a fijo a la semana.

ENSAYO DE HIPTESIS

Generalidades

Un ensayo de hiptesis se puede utilizar para tomar una decisin respecto a una

afirmacin hecha sobre el valor de uno o ms parmetros poblacionales, sobre la forma

especfica de la distribucin de una determinada caracterstica, sobre la independencia (o


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

correlacin) de distintas variables, sobre mejoras introducidas (por ej. en tratamientos o

procesos), etc.

En principio se establece una hiptesis nula (H0) y se analiza si la informacin

estadstica obtenida es suficiente o no para rechazarla. Por otro lado, se define la hiptesis

alternativa (H1), que sera la afirmacin a aceptar cuando la H0 es rechazada. El resultado

del test puede ser rechazar H0 en favor de H1 o no rechazar H0 (tambin puede no

hacerse nada y pedir ms datos antes de decidir)

A veces tambin se dice que hay evidencia estadstica significativa en contra de H0 o que no

la hay.

Rechazar una hiptesis es ms fuerte que no hacerlo. Por ello, suele usarse como H0

a la hiptesis que uno desea rechazar. Hay tambin un compromiso respecto a la simplicidad

(por ej. es ms simple el clculo asumiendo que dos cosas son iguales a que son distintas)

El no rechazo de H0 no implica que sea cierta. Simplemente no se cuenta con evidencia

suficiente para rechazarla a favor de H1. En un test no se hace un juicio de valor lgico

(verdadero o falso).

Para tomar la decisin, se utiliza la informacin de una muestra de la poblacin.

Debido a la naturaleza aleatoria de la muestra, es de esperarse que uno pueda cometer

errores al tomar la decisin.

El test permite cuantificar dichos errores.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Ejemplo: Sistema Legal

1) Se presume inocente hasta que se pruebe lo contrario

2) Se presenta evidencia

3) Las pruebas deben ser ms all de una duda razonable

4) El resultado es culpable o no culpable

5) Los errores que pueden cometerse son:

- Declarar culpable a una persona que es inocente (tipo I)

- Declarar no culpable a una persona que es culpable (tipo II)

Una persona polticamente de derecha no tolera el error tipo II mientras que la de

izquierda no tolera el tipo I.

Si se analizan las polticas sociales, sucede lo contrario.

Se contina con el estudio de la inferencia estadstica mostrando la forma de usar la

prueba de hiptesis para determinar si una afirmacin acerca del valor de un parmetro

poblacional debe o no ser rechazada.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Cuando se hace una prueba de hiptesis se empieza por hacer una suposicin

tentativa acerca del parmetro poblacional. A esta suposicin tentativa se le llama hiptesis

nula y se denota por H0. Despus se define otra hiptesis, llamada hiptesis alternativa,

que dice lo contrario delo que establece la hiptesis nula. La hiptesis alternativa se denota

Ha.

En el procedimiento de pruebas de hiptesis se usan datos de una muestra para

probar dos afirmaciones contrarias indicadas por H0 y Ha.

En este captulo se indica el modo de realizar pruebas de hiptesis para medias

poblacionales y proporciones poblacionales. Para empezar se facilitan ejemplos que ilustran

los mtodos para elaborar la hiptesis nula y la hiptesis alternativa.

Elaboracin de las hiptesis nula y alternativa

Se debe tener cuidado en estructurar las hiptesis apropiadamente de manera que la

conclusin de la prueba de hiptesis proporcione la informacin que el investigador o la

persona encargada de tomar las decisiones desea. Se darn los lineamientos para establecer

la hiptesis nula y la hiptesis alternativa en tres tipos de situaciones en las cuales se suele

emplear el procedimiento de prueba de hiptesis.

1. Prueba de una hiptesis de investigacin

Considere un determinado modelo de automvil en el que el rendimiento de la

gasolina es 24 millas por galn. Un grupo de investigacin elabora un nuevo

sistema de inyeccin de combustible diseado para dar un mejor rendimiento en


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

millas por galn de gasolina. Para evaluar el nuevo sistema se fabrican varios de

stos, se instalan en los automviles y se someten a pruebas controladas de manejo.

En este caso, el grupo de investigacin busca evidencias para concluir que el nuevo

sistema aumenta la media del rendimiento. La hiptesis de investigacin es,

entonces, que el nuevo sistema de inyeccin de combustible proporciona un

rendimiento medio mayor a 24 millas por galn de combustible; es decir, > 24.

Como lineamiento general, una hiptesis de investigacin se debe plantear como

hiptesis alternativa. Por tanto, en este estudio las hiptesis nula y alternativa

adecuadas son:

Si los resultados obtenidos con la muestra indican que no se puede rechazar H0, los

investigadores no concluirn que el nuevo sistema de inyeccin de combustible sea

mejor. Quiz ser necesario continuar investigando y realizar nuevas pruebas. Pero

si los resultados muestrales indican que se puede rechazar H0, los investigadores

inferirn que Ha: > 24 es verdadera. Esta conclusin proporciona a los

investigadores el apoyo estadstico necesario para afirmar que el nuevo sistema

aumenta el rendimiento medio en millas por galn. Se considerar la produccin del

nuevo sistema.

En estudios de investigacin como ste, las hiptesis nula y alternativa deben

formularse de manera que al rechazar H0 se apoye la conclusin de la investigacin.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

La hiptesis de la investigacin, entonces, debe expresarse como hiptesis

alternativa.

2. Prueba de la validez de una afirmacin

Como ilustracin de la prueba de la validez de una afirmacin, considere una

situacin en la que un fabricante de refrescos asegura que los envases de dos litros

de refresco contienen en promedio, por lo menos, 67.6 onzas de lquido. Se

selecciona una muestra de envases de dos litros y se mide su contenido para

confirmar lo que asegura el fabricante. En este tipo de situaciones de prueba de

hiptesis, se suele suponer que el dicho del fabricante es verdad a menos que las

evidencias muestrales indiquen lo contrario. Si se sigue este mtodo en el ejemplo

de los refrescos, las hiptesis nula y alternativa se establecen como sigue.

Si los resultados muestrales indican que no se puede rechazar H0, entonces no se

cuestiona lo que asegura el fabricante. Pero si los resultados muestrales indican que

se puede rechazar H0, lo que se inferir es que Ha:

< 67.6 es verdad. Si tal es la conclusin, las evidencias estadsticas indican que el

dicho del fabricante no es correcto y que los envases de refrescos contienen en

promedio menos de las 67.6 onzas que se asegura contienen. Se considerar realizar

las acciones correspondientes en contra del fabricante. En toda situacin en la que

se desee probar la validez de una afirmacin, la hiptesis nula se suele basar en la


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

suposicin de que la afirmacin sea verdadera. Entonces, la hiptesis alternativa se

formula de manera que rechazar H0 proporcione la evidencia estadstica de que la

suposicin establecida es incorrecta. Siempre que se rechace H0 debern

considerarse las medidas necesarias para corregir la afirmacin.

3. Prueba en situaciones de toma de decisin

Cuando se prueba una hiptesis de investigacin o la validez de una afirmacin, se

toman medidas si se rechaza H0; sin embargo, en algunas situaciones se toman

tanto si no se puede rechazar H0 como si se puede rechazar H0. En general, este

tipo de situaciones se presentan cuando la persona que debe tomar una decisin

tiene que elegir entre dos lneas de accin, una relacionada con la hiptesis nula y

otra con la hiptesis alternativa. Por ejemplo, con base en una muestra de las piezas

de un pedido recibido, el inspector de control de calidad tiene que decidir si acepta

el pedido o si lo regresa al proveedor debido a que no satisface las especificaciones.

Suponga que una especificacin para unas piezas determinadas sea que su longitud

media deba ser de dos pulgadas. Si la longitud media es menor o mayor a dos

pulgadas, las piezas ocasionarn problemas de calidad en la operacin de

ensamblado. En este caso, las hiptesis nula y alternativa se formulan como sigue.

Si los resultados muestrales indican que no se puede rechazar H0, el inspector de

control de calidad no tendr razn para dudar que el pedido satisfaga las

especificaciones y aceptar el pedido. Pero si los resultados muestrales indican que


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

H0 se debe rechazar, se concluir que las piezas no satisfacen las especificaciones.

En este caso, el inspector de control de calidad tendr evidencias suficientes para

regresar el pedido al proveedor. As, se ve que en este tipo de situaciones, se toman

medidas en ambos casos, cuando H0 no se puede rechazar y cuando H0 se puede

rechazar.

Resumen de las formas para las hiptesis nula y alternativa

Las pruebas de hiptesis de este captulo se refieren a dos parmetros poblacionales:

la media poblacional y la proporcin poblacional. A partir de la situacin, las pruebas de

hiptesis para un parmetro poblacional asumen una de estas tres formas: en dos se emplean

desigualdades en la hiptesis nula y en la tercera se aplica una igualdad en la hiptesis nula.

En las pruebas de hiptesis para la media poblacional, 0 denota el valor hipottico y para la

prueba de hiptesis hay que escoger una de las formas siguientes.

Por razones que sern claras ms tarde, a las dos primeras formas se les llama

pruebas de una cola. A la tercera se le llama prueba de dos colas.

Con frecuencia se tienen situaciones en las que no es obvio cmo elegir H0 y Ha y

se debe tener cuidado para elegirlas en forma adecuada. Sin embargo, como se observa en

las formas anteriores, la igualdad (ya sea , , =) debe aparecer siempre en la hiptesis

nula. Al elegir la forma adecuada para H0 y Ha hay que tener en mente que la hiptesis

alternativa a menudo es lo que la prueba est tratando de demostrar. Por tanto, preguntarse si
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

el usuario est buscando evidencias en apoyo de < 0, > 0 0 ayuda a determinar

Ha.

Nivel de Significancia

El nivel de significancia es la probabilidad de cometer un error tipo I cuado la

hiptesis nula es verdadera como igualdad.

Para denotar el nivel de significancia se usa la letra griega (alfa), y los valores que

se suelen usar para son 0.05 y 0.01.

En la prctica la persona responsable de la prueba de hiptesis especifica el nivel de

significancia. Al elegir se controla la probabilidad de cometer un error tipo I. Si el costo

de cometer un error tipo I es elevado, los valores pequeos de son preferibles. Si el costo

de cometer un error tipo I no es demasiado elevado, entonces se usan valores mayores para

. A las aplicaciones de la prueba de hiptesis en que slo se controla el error tipo I se les

llama pruebas de significancia. Muchas aplicaciones de las pruebas de hiptesis son de este

tipo.

Aunque en la mayor parte de las aplicaciones de las pruebas de hiptesis se controla

la probabilidad de cometer un error tipo I, no siempre sucede lo mismo con un error tipo II.

Por tanto, si se decide aceptar H0 no es posible establecer la confianza en esa decisin.

Debido a la incertidumbre de cometer un error tipo II al realizar una prueba de significancia

los dedicados a la estadstica suelen recomendar que se diga no se rechaza H0 en lugar de

se acepta H0. Decir no se rechaza H0 implica la recomendacin de reservarse tanto el

juicio como la accin. En efecto al no aceptar directamente H0, se evita el riesgo de cometer
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

un error tipo II. Siempre que no se determine y controle la probabilidad de cometer un error

tipo II, no se dir se acepta H0. En esos casos slo son posibles dos conclusiones: no se

rechaza H0 o se rechaza H0.

Aunque controlar el error tipo II en una prueba de hiptesis es poco comn, es

posible. En las secciones 9.7 y 9.8 se ilustra el procedimiento para controlar y determinar la

probabilidad de cometer un error tipo II. Si se ha establecido un control adecuado de este

error, las medidas basadas en la conclusin se acepta H0 son adecuadas.

MODELOS DE REGRESIN Y CORRELACIN

El anlisis de regresin consiste en emplear mtodos que permitan determinar la mejor

relacin funcional entre dos o ms variables concomitantes (o relacionadas). El anlisis de

correlacin estudia el grado de asociacin de dos o ms variables.

Regresion Lineal Simple

Cuando la relacin funcional entre las variables dependiente (Y) e independiente

(X) es una lnea recta, se tiene una regresin lineal simple, dada por la ecuacin

Y = o + 1X +

donde:

o : El valor de la ordenada donde la lnea de regresin se intersecta al eje Y.

1 : El coeficiente de regresin poblacional (pendiente de la lnea recta)


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

: El error.

Suposiciones de la regresin lineal

1. Los valores de la variable independiente X son "fijos".

2. La variable X se mide sin error (se desprecia el error de medicin en X)

3. Existe una subpoblacion de valores Y normalmente distribuido para cada valor de

X.

4. Las variancias de las subpoblaciones de Y son todas iguales.

5. Todas las medias de las subpoblaciones de Y estn sobre la misma recta.

6. Los valores de Y estn nomalmente distribuidos y son estadsticamente

independientes.

Los supuestos del 3 al 6 equivalen a decir que los errores son aleatorios, que se

distribuyen normalmente con media cero y variancia .

Terminologia:

Promedios:

Sumas de cuadrados y productos de X e Y.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

SCY tambien corresponde a la suma de cuadrados total = SC total

Estimacin de parmetros

La funcin de regresin lineal simple es expresado como:

Y = o + 1X +

La estimacin de parmetros consiste en determinar los parmetros o y 1 a partir

de los datos muestrales observados; es decir, deben hallarse valores como bo y b1 de la

muestra, que represente a o y 1, respectivamente.

Empleando el mtodo de los mnimos cuadrados, es decir minimizando la suma de

cuadrados de los errores, se determinan los valores de bo y b1, as


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

b0 : es el valor que representa (estimador) a 0 constituye el intercepto cuando X=0;

b1 : es el valor que representa (estimador) a 1.

Sus desviaciones estandares respectivas son:

Luego, la ecuacin de regresin es: y = bo + b1X

El coeficiente de regresin (b1) .- pendiente de la recta de regresin, representa la tasa de

cambio de la respuesta Y al cambio de una unidad en X.

Si b1=0, se dice que no existe relacin lineal entre las dos variables.

Fuentes de variacin en la regresin lineal


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Los clculos de regresin pueden ser vistos como un proceso de particin de la suma total

de cuadrados; as, grficamente se tiene:

Se observa que la desviacin total para un Yi en particular es igual a la suma de las

desviaciones explicada e inexplicada, simbolicamente.

Luego:

SC total = SC regresion + SC residual

Suma de Cuadrados del Total (SCT), mide la dispersin (variacin total) en los valores

observados de Y. Este trmino se utiliza para el clculo de la variancia de la muestra.

Suma de Cuadrados explicada (Suma de Cuadrados debido a la Regresin, SCR) mide

la variabilidad total en los valores observados de Y en consideracin a la relacin lineal

entre X e Y.
INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Suma de Cuadrados residual (inexplicada, Suma de Cuadrados del Error, SCE) mide

la dispersin de los valores Y observados respecto a la recta de regresin Y (es la cantidad

que se minimiza cuando se obtiene la recta de regresin).

Anlisis de Variancia para la regresin lineal simple

Cuando cada particin se asocia a una porcin correspondiente del total de grados de

libertad, la tcnica es conocida cono analisis de variancia (ANVA), que generalmente se

presenta en un cuadro de la siguiente forma:

Cuadro del ANVA.

La prueba estadstica F evalua las hiptesis:

Hp: 1 = 0. No existe una regresin lineal entre X e Y.

Ha: 1 0. Existe regresion lineal de Y en funcin de X.

Intervalos de Confianza

Intervalos de confianza para 1 (tasa)


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

En muchos casos es de inters conocer entre que valores se encuentra el coeficiente

de regresin de la poblacin 1 para un cierto grado de confianza fijada, este procedimiento

permite hallar los valores llamados lmites de confianza, as:

b1 - t0 Sb1 1 b1 + to Sb1

donde: t0 es el valor "t" tabular al nivel de significacin y n-2 grados de libertad ( t0 =

t,n-2).

t 0.05, 8 = 2,30; SC X = 82.5; Sb1 = 9,23

Limite Inferior = 24,42 2,30 (9,23) = 3.12

Limite Superior = 24,42 + 2,30 (9,23) = 45,72

Con estos resultados se puede afirmar al 95% de confianza que la tasa de

crecimiento en madera aserrada es positiva y por lo menos se tendra un crecimiento de 3 mil

metros cubicos por ao.

En funcin del modelo se puede hacer estimaciones para los siguientes aos:

Estas proyecciones son puntuales, en base al modelo; para ao 2000, X=10, resulta una

produccin de 711 mil m3 de madera aserrada.

Para obtener limites de confianza para estos valores predecidos, se debe determinar sus

desviaciones estandar correspondiente; utilice la siguiente formula:


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Limites : Valor Predicho (t0.05,n-2 ) (S_predicho)

Para el 2002, los limites de confianza son:

Limite Inferior = 760,55 2,30 (111,98) = 502

Limite Superior = 760,55 + 2,30 (111,98) = 1018

Esta informacin significa que para el ao 2002, se estima una produccion de madera

aserrada entre 502 a 1018 miles de m3.

Prueba de Hipotesis

Se plantea los siguientes casos:

a. Cuando 1 = 0; es decir, si la variable Y no esta relacionada linealmente con

la variable X. Esto equivale a plantear la hiptesis Hp: 1=0, y va una

prueba F comparar el valor de F calculado (Fc) con el valor F tabular (Fo),

donde Fc=CMR/CME y Fo=F(1,n-2)gl. Si Fc>Fo, se rechaza la hipteis

planteada, esto supone un valor 1 distinto de cero y se concluye que Y se

puede expresar en terminos de X linealmente.

b. Cuando 1 tiene un valor especfico distinto de cero 10; es decir, Hp:

1=10. En este caso, para la prueba de esta hiptesis se usa el estadstico t


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

de Student. El valor t calculado es hallado mediante la expresin: tc = (b1-

10)/Sb1

Si tc > t se rechaza la hiptesis planteada, donde t es el valor de la tabla

al nivel y n-2 gl.

Para el ejemplo planteado, se rechaza la hipotesis planteada, esto significa que

existe una relacin lineal significativa del tiempo y la produccin de madera aserrada total.

Analisis de Correlacin

El anlisis de correlacin emplea mtodos para medir la significacin del grado o

intensidad de asociacin entre dos o ms variables. El concepto de correlacin est

estrechamente vinculado al concepto de regresin, pues, para que una ecuacin de regresin

sea razonable los puntos muestrales deben estar ceidos a la ecuacin de regresin; adems

el coeficiente de correlacin debe ser:

Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo cuando

es bajo, cerca de cero.

Independiente de las unidades en que se miden las variables.

Coeficiente de correlacion Lineal Simple ( r).

Es un nmero que indica el grado o intensidad de asociacin entre las variables X e

Y. Su valor vara entre -1 y +1; esto es: -1 r 1.

Si r = -1, la asociacin es perfecta pero inversa; es decir, a valores altos de una

variable le corresponde valores bajos a la otra variable, y viceversa.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Si r=+1, tambin la asociacin es perfecta pero directa.

Si r=0, no existe asociacin entre las dos variables.

Luego puede verse que a medida que r se aproxime a -1 +1 la asociacin es

mayor, y cuando se aproxima a cero la asociacin disminuye o desaparece.

El coeficiente de correlacin est dada por:

Para los datos de la produccin de madera aserrada total entre los aos 1990 a 1999,

existe una asociacin de 0.68.

Modelo de Regresin Mltiple

Objetivos

Construir un modelo que represente la dependencia lineal de una variable respuesta

cuantitativa Y simultneamente respecto de varias variables explicativas

cuantitativas X1, . . . ,XK.

Determinar la funcin de regresin lineal ptima.

Partiendo de un conjunto de regresores X1, . . . ,XK, estudiar cules son

significativos para explicar la respuesta.


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

Estimar el valor esperado de la respuesta y predecir un valor futuro de sta para

unos valores prefijados de las variables explicativas. Determinar la precisin de la

estimacin y la prediccin.

Analizando los residuos, estudiar si se verifican las hiptesis bsicas del modelo.

Proponer alternativas si no es as.

Modelo de Regresin lineal Mltiple

En la regresion lineal multiple de Y sobre X1, . . . ,XK se supone que la funcin de

regresin tiene la expresin

E(Y |X1 = x1, . . . ,XK = xK) =

Cuando K = 2 la funcin de regresin es un plano

Tenemos una muestra de n individuos en los que observamos las variables Y y X =

(X1, . . . ,XK) obteniendo (xi , yi ), i = 1, . . . , n,


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

donde xi = (xi1, xi2, . . . , xiK).

El modelo de regresion lineal mltiple supone que

donde las perturbaciones Ui verifican las hiptesis

a) E(Ui ) = 0, para cada i = 1, . . . , n.

b) Var(Ui ) = 2, para cada i = 1, . . . , n.

c) E(UiUj ) = 0 , para todo i 6= j .

d) Ui Normal, para todo i .

e) n K + 2

f) Las variables Xi son linealmente independientes entre s (no hay

colinealidad).

Las hiptesis (a)-(d) se pueden reexpresar as: los individuos de la muestra son

independientes entre s con

El modelo admite una expresion equivalente en forma matricial:


INGENIERIA CIVIL
QUINTO SEMESTRE
CESAR FROILAN CHIQUIN

donde X es la matriz del diseo.

Cada coeficiente i (i 1) mide el efecto marginal que, sobre la variable respuesta Y , tiene

un aumento de una unidad de la variable explicativa xi cuando el resto de las variables xj ,

con j 6= i , permanece constante

Вам также может понравиться