Вы находитесь на странице: 1из 6

Teora de errores

Trabajo prctico n 2. Teora de probabilidad de errores

Las mediciones se consideran variables aleatorias continuas y responden a la funcin de dis-


tribucin normal, cuya funcin de densidad se expresa como

1
1 x 2
f (x) = p e 2 ,
2

donde es la media poblacional y el desvo estndar.

1 ( )
1 x 2
f (x) = p e 2
2

+ x

Para estimar los parmetros de una poblacin se utilizan los estadsticos que se pueden
calcular a partir de una muestra. En la siguiente tabla se expone el parmetro y su correspon-
diente estadstico que lo estima:

1
2

Estadstico (Muestra) Parmetro (Poblacin)

1 iX
=n 1 iX
=N
Media x = xi = xi
n i =1 N i =1

1 iX =n 1 iX
=N 2
Varianza 2x = (x i x)2 2x = xi
n 1 i =1 N i =1
v v
u u i =N
u 1 iX =n u1 X 2
Desvo estndar x = t (x i x)2 x =t xi
n 1 i =1 N i =1

x
Error estndar de x = p
n
la media

1 iX =n 1 iX
=N
Covarianza x,y = (x i x) y i y x,y = x i x y i y
n 1 i =1 N i =1
x,y x,y
Coeficiente de r x,y = r y,x = x,y = y,x =
x y x y
correlacin

Es posible evaluar la probabilidad de que la observacin x se encuentre dentro de un valor


de dispersin c, siendo c un valor real constante, calculando la superficie debajo de la curva
de la funcin de densidad en el intervalo,


+c

1 1 x 2
Pr c < x < + c = p e 2 dx.
2
c

Es conveniente trabajar con una funcin normal estandarizada que permita tabular los valores
de probabilidad y su relacin con la constante c. Si tomamos

x
z= ,

se obtiene la funcin de distribucin estndar, siendo = 0 y = 1, y la funcin de densidad se


simplifica como

1 1 2
f (z) = p e 2 z .
2

Intervalo de confianza para la media

Consideremos la media de una muestra aleatoria de observaciones de una poblacin normal



N , 2 , en un conjunto aleatoriode muestras
de la poblacin la media muestral es una va-
2
riable aleatoria con distribucin N , n . La variable tipificada
3

p
x n
z= ,

sigue una distribucin normal estndar N (0, 1), y los intervalos de confianza para la media se
pueden calcular del siguiente modo:

p c
x n 1 z2
Pr c < <c = p e 2 dz,
2
c

c
1 z2
Pr x c p < < x + c p = p e 2 dz,
n n 2
c

siendo Pr x c pn < < x + c pn el nivel de confianza.

1 z2
f (z) = p e 2
2

3 2 1 0 1 2 3 z

Para el caso en que no se conoce la varianza poblacional se utiliza el siguiente cambio de


variable:
p
x n
t= ,

que sigue un distribucin t de Student con r = n1 grados de libertad. El intervalo de confianza


presenta la probabilidad siguiente

c r +1
1 r +1
2 t2 2
Pr x c p < < x + c p = p r 1+ dt .
n n r 2 r
c

Los valores p y p se definen como el error estndar de la media y se utilizan para definir
n n
los intervalos de confianza en los resultados obtenidos.
4

Intervalo de confianza para la varianza

Siendo z i variables aleatorias independientes con distribucin Normal y varianza igual a la


unidad, defino una nueva variable X como

iX
=r
X= z i2 .
i =1

La variable X tiene distribucin 2 con r grados de libertad, es decir

X 2r ,

Podemos plantear entonces la relacin siguiente

iX
=n
(n 1) 2x = (x i x)2 ,
i =1

divididiendo ambos trminos por la varianza poblacional,

2x 1 iX
=n
(n 1) = (x i x)2 2n1 . (1)
2x 2x i =1

Si asumimos ahora un nivel de confianza 1 que representa la superficie bajo la curva de la



funcin de densidad de 2 delimitado por percentiles 2/2 ; 21/2 :

0 2/2 21/2 x


Pr 2n1,/2 < 2n1 < 2n1,1/2 ,

reemplazando en (1)

2 2x 2
Pr n1,/2 < (n 1) 2 < n1,1/2 ,
x
!
(n 1) 2x (n 1) 2
x
Pr > 2x > 2 ,
2n1,/2 n1,1/2

o bien !
(n 1) 2x (n 1) 2x
Pr < 2x < .
2n1,1/2 2n1,/2
5

Eliminacin de observaciones atpicas

Una observacin atpica, o outlier, es una observacin distante del resto de la muestra. Un dato
outlier se considera que tiene un error anmalo y el mismo debe ser eliminado. Existen nume-
rosos criterios de los cuales se estudiarn el criterio propuesto por Chauvenet y la eliminacin
de observaciones de acuerdo a un intervalo de confianza en la distribucin t de Student. Segn
el mtodo utilizado se pueden obtener resultados diferentes en el proceso de eliminacin de
outliers. Informalmente, al segundo mtodo lo llamaremos test t .
En el criterio de Chauvenet se elimina la observacin cuyo residuo es mayor que el intervalo
1
definido por la probabilidad 1 2n , donde n es el nmero de observaciones. Es decir, si |x i x| >
c el valor se descarta, calculando c como

c
1 1 1 2
1 =p e 2 z dz.
2n 2
c

En el test t se determina un nivel de confianza previamente y se eliminan las medidas don-


de se cumple que |x i x| > c . Por ejemplo, si se eliminan los residuos con un nivel de con-
fianza del 95 % se calcula c como
c r +1
1 r +1
2 t2 2
0.95 = p r 1+ dt ,
r 2 r
c

siendo r = n 1 los grados de libertad.

Ejercicio n 1

Se tienen dos simulaciones de 2000 observaciones que representan la poblacin de dos series
de mediciones. La serie 1, archivo TP01_Ej1_serie1.xls, tiene media poblacional = 454.675 y
desvo estndar = 0.10, en tanto que la serie 2, archivo TP01_Ej1_serie2.xls, tiene una media
poblacional = 454.675 y desvo estndar = 0.25.

a) Seleccionar 20 observaciones de cada serie, calcular el error estndar de la media para


cada una de las series con el valor correspondiente a la muestra seleccionada.

b) Calcular los intervalos de confianza para la media poblacional con una probabilidad del
90 %.

c) Cuantas observaciones se deben hacer con el mtodo/instrumento utilizado en la serie


2 para que igualar el grado de precisin obtenido en la serie 1? Tener en cuenta el error
estndar de la media x = p .
n

Ejercicio n 2

a) En la tabla de datos TP01_Ej_2_30.xls verificar si existe algn dato outlier por el mtodo
de Chauvenet, si es as eliminarlo.
6

b) Repetir el proceso anterior utilizando el test t .

c) Con la tabla TP01_Ej_2_5.xls verificar la existencia de un outlier por el mtodo de Chau-


venet, si existe, eliminar el dato de la muestra.

d) dem utilizando el test t .

e) Elaborar un comentario comparando los resultados obtenidos con ambos mtodos.

f) Comparar el desvo estndar de la serie original respecto de la serie a la que se elimin


una observacin para el caso de la muestra TP01_Ej_2_5.xls.

Вам также может понравиться