Академический Документы
Профессиональный Документы
Культура Документы
8 DE SEPTIEMBRE DE 2017
Geoestadística 2PM2
Teoría de decisión.
La gran mayoría de los métodos que serán usados para plantear y resolver estos
problemas pertenecen al enfoque clásico, ya que no toman en cuenta los varios
factores subjetivos mencionados antes. Algunas otras aplicaciones pertenecen al
enfoque Bayesiano, que consideran, informalmente al menos, algunos de estos
factores subjetivos. La subjetividad influye mucho en la elección de los métodos
estadísticos o fórmulas empleadas en una situación específica.
Una Estadística: Es una medida de resumen que se calcula para describir una
característica de una sola muestra de la población.
Muestra aleatoria: Es una muestra elegida independientemente de todas las
demás, con la misma probabilidad que cualquier otra y cuyos elementos están
elegidos independientemente unos de otros y con la misma probabilidad.
DESCRIPCION DE DATOS
Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y
obtener información directamente de ellos; otras veces solo habrá que agruparlos y
presentarlos en forma gráfica o tabulada, aquí el uso de las tecnologías
computacionales es mucha utilidad y rapidez.
DATOS AGRUPADOS
Una forma de sintetizar los datos consiste en valerse de una tabla o distribución de
frecuencia. Tomemos como ejemplo el inventario promedio en días de 20 tiendas
de conveniencia.
2.0 3.4 3.8 4.1 4.1 4.3 4.7 4.9 5.5 5.5
3.4 3.8 4.0 4.1 4.2 4.7 4.8 4.9 5.5 5.5
Hasta ahora se ha expresado la frecuencia con que ocurren los valores en cada
clase como el número total de observaciones que caen en dicha clase. También se
puede expresar la frecuencia de cada valor como una fracción o porcentaje del
número total de observaciones. La frecuencia de un inventario promedio, digamos
de 4.4 a 4.9, es 5 en la tabla 2 y de 0.25 en la tabla 3. Para obtener este último valor,
dividimos la frecuencia de esta clase (5) entre el número total de observaciones en
el conjunto de datos (20). La respuesta puede expresarse como una fracción ( 5 20 ),
un decimal (0.25) o un porcentaje (25 %). Una distribución de frecuencia relativa
presenta las frecuencias en fracciones o porcentajes.
La suma de todas las frecuencias relativas es de 1.00 o 100 %. Esto sucede porque
una distribución de frecuencia relativa parea cada clase con su fracción o porcentaje
correspondiente de los datos totales. Por lo anterior, las clases en cualquier
distribución de frecuencia simple o relativa son exhaustivas. Todos los datos
encajan en una u otra categoría. Observe también que las clases son mutuamente
excluyentes; es decir, ninguna observación cae dentro de más de una categoría.
Clases discretas.
Los datos continuos pueden pasar de una clase a la siguiente sin ruptura alguna.
Contienen una medida numérica como el peso de unas latas de tomates, los
kilogramos de presión sobre el concreto, o el promedio de calificaciones de los
universitarios el último semestre.
Construcción de una distribución de Frecuenci
16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
Para analizar los datos de esta tabla seguiremos los siguientes pasos:
1.- Escoger el tipo y número de clases para dividir los datos. En este caso, ya
se ha optado por clasificar los datos según la medida cuantitativa del número de
ppm del cloro en el agua tratada, en vez de hacerlo a partir de un atributo cualitativo
como color o el olor del agua.
Después necesitamos decidir cuántas clases utilizar y el intervalo (la distancia que
debe comprender cada clase).
A continuación se muestra una tabla que nos puede ser útil para seleccionar el
número de clases, aclarando que esta designación no es obligatoria y puede ser a
decisión del analista.
Para designar el número de clases usaremos la letra K, para este ejemplo se usará
K= 6 clases.
R
A R Val. mayor Val. menor
K
16.9 15.2
A 0.283 0.30 ppm
6
CLASE FRECUENCIA
15.2 - 15.4 2
15.5 - 15.7 5
15.8 - 16.0 11
16.1 - 16.3 6
16.4 - 16.6 3
16.7 - 16.9 3
30
12 11
10
FRECUENCIA
8
6
6 5
4 3 3
2
2
0
15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9
Histogramas
HISTOGRAMA DE FRECUENCIA
RELATIVA
0.400 0.367
0.350
0.300
PORCENTAJE
0.250
0.200
0.200 0.167
0.150
0.100 0.100
0.100 0.067
0.050
0.000
15.2 - 15.5 - 15.8 - 16.1 - 16.4 - 16.7 -
15.4 15.7 16.0 16.3 16.6 16.9
Polígono de frecuencias
Aunque de menor uso, los polígonos de frecuencias son otro medio de representar
gráficamente tanto las distribuciones de frecuencia simples como las de frecuencia
relativa. Para construir un polígono de frecuencias, marcamos las frecuencias sobre
el eje vertical y los valores de la variable que vamos a medir las marcamos sobre el
eje horizontal, tal como lo hicimos con los histogramas. El siguiente paso consiste
en graficar cada frecuencia de clase dibujando un punto sobre su marca de clase,
o punto medio, y conectar los puntos consecutivos con una recta para formar un
polígono (figura de muchos lados).
POLIGONO DE FRECUENCIAS
12
10
FRECUENCIA
0
15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1
Concentración de cloro en ppm
El polígono es simplemente una gráfica lineal que une los puntos medios de todas
barras en un histograma.
Ojivas
33
30
No. Acumulativo de gal. muestreados
27
24
21
18
15
12
9
6
3
0
15.2 15.5 15.8 16.1 16.4 16.7 17.0
Concentración de cloro en ppm
Estas medidas se utilizan para indicar un valor que tiende a ser el más
representativo de un conjunto de números. Las tres medidas que más comúnmente
se emplean son la media, la mediana y la moda. En la fig. 5 podemos apreciar el
significado grafico de las medidas de tendencia central.
Curva B Curva C
Curva A
Hay otras medidas de tendencia central que se explican con detalle en capítulos
posteriores. Una medida importante es la mediana de la muestra. El propósito de la
mediana de la muestra es reflejar la tendencia central de la muestra de manera que
no sea influida por los valores extremos.
Por ejemplo, suponga que el conjunto de datos es el siguiente: 1.7, 2.2, 3.9, 3.11 y
14.7. La media y la mediana de la muestra son, respectivamente, x¯ = 5.12, ˜x =
3.9. Es evidente que la media es influida de manera considerable por la presencia
de la observación extrema, 14.7; en tanto que el lugar de la mediana hace énfasis
en el verdadero “centro” del conjunto de datos. En el caso del conjunto de datos de
dos muestras del ejemplo 1.2, las dos medidas de tendencia central para las
muestras individuales son:
Es evidente que hay una diferencia conceptual entre la media y la mediana. Para el
lector con ciertas nociones de ingeniería quizá sea de interés que la media de la
muestra es el centroide de los datos en una muestra. En cierto sentido es el punto
en el cual se puede colocar un fulcro (apoyo) para equilibrar un sistema de “pesos”,
que son las ubicaciones de los datos individuales.
Hay muchos otros métodos para calcular la ubicación del centro de los datos en la
muestra.
Observe que, en este caso, como se esperaba, las medias recortadas están cerca
tanto de la media como de la mediana para las muestras individuales. Desde luego,
el enfoque de la media recortada es menos sensible a los valores extremos que la
media de la muestra, pero no tan insensible como la mediana. Además, el método
de la media recortada utiliza más información que la mediana de la muestra.
Advierta que la mediana de la muestra es, de hecho, un caso especial de la media
recortada, en el cual se eliminan todos los datos de la muestra y queda sólo el
central o dos observaciones.
Medidas de variabilidad
Así como hay muchas medidas de tendencia central o de localización, hay muchas
medidas de dispersión o variabilidad. Quizá la más simple sea el rango de la
muestra Xmáx - Xmín. La medida muestral de dispersión que se utiliza más a
menudo es la desviación estándar de la muestra. Nuevamente denotemos con x1 ,
x2 ,..., xn los valores de la muestra.
7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08.
La media de la muestra x – está dada por x¯ = (7.07 7.00 + + ++ 7.10 . . . 7.08 ) /10
= 7.0250.
Espacio muestral
S1 = {1, 2, 3, 4, 5, 6}
El ejemplo ilustra el hecho de que se puede usar más de un espacio muestral para
describir los resultados de un experimento. En este caso, S1 brinda más información
que S2 . Si sabemos cuál elemento ocurre en S1 , podremos indicar cuál resultado
tiene lugar en S2 ; no obstante, saber lo que pasa en S2 no ayuda mucho a
determinar qué elemento ocurre en S1 . En general, lo deseable sería utilizar un
espacio muestral que proporcione la mayor información acerca de los resultados del
experimento. En algunos experimentos es útil listar los elementos del espacio
muestral de forma sistemática utilizando un diagrama de árbol.
Muchos de los conceptos de este capítulo se ilustran mejor con ejemplos que
involucran el uso de dados y cartas. Es particularmente importante utilizar estas
aplicaciones al comenzar el proceso de aprendizaje, ya que facilitan el flujo de esos
conceptos nuevos en ejemplos científicos y de ingeniería.
Eventos
Es posible concebir que un evento puede ser un subconjunto que incluye todo el
espacio muestral S, o un subconjunto de S que se denomina conjunto vacío y se
denota con el símbolo ϕ, que no contiene ningún elemento. Por ejemplo, si en un
experimento biológico permitimos que A sea el evento de detectar un organismo
microscópico a simple vista, entonces A =ϕ. También, si
entonces B debe ser el conjunto vacío, pues los únicos factores posibles de 7 son
los números nones 1 y 7.
A ∩ B = regiones 1 y 2,
B ∩ C = regiones 1 y 3,
A ∪ C = regiones 1, 2, 3, 4, 5 y 7,
B’ ∩ A = regiones 4 y 7,
A ∩ B ∩ C = región 1,
(A ∪ B) ∩ C' = regiones 2, 6 y 7,
y así sucesivamente.
En la figura vemos que los eventos A, B y C son subconjuntos del espacio muestral
S. También es claro que el evento B es un subconjunto del evento A; el evento B ∩
C no tiene elementos, por lo tanto, B y C son mutuamente excluyentes; el evento A
∩ C tiene al menos un elemento; y el evento A ∪ B = A. Por consiguiente, la fi gura
2.4 podría representar una situación en la que se selecciona una carta al azar de
una baraja ordinaria de 52 cartas y se observa si ocurren los siguientes eventos:
A: la carta es roja,
C: la carta es un as. Claramente, el evento A ∩ C consta sólo de los dos ases rojos.
1. A ∩ ϕ = ϕ. 6. ϕ’ = S.
2. A ∪ ϕ = A. 7. (A’)’ = A.
3. A ∩ A’ = ϕ. 8. (A ∩ B)’ = A’ ∪ B’.
4. A ∪ A’ = S. 9. (A ∪ B)’ = A’ ∩ B’.
5. S’ = ϕ.
Probabilidad de eventos que involucran el uso de técnicas de conteo.
Si una operación se puede llevar a cabo en n1 formas, y si para cada una de éstas
se puede realizar una segunda operación en n2 formas, entonces las dos
operaciones se pueden ejecutar juntas de n1 n2 formas.
{(a, e, i, o), (u)}, {(a, i, o, u), (e)}, {(e, i, o, u), (a)}, {(a, e, o, u), (i)}, {(a, e, i, u), (o)}.
Los datos de la sección, junto con los datos adicionales antes dados para el conjunto
A, nos permiten calcular
Si mostramos estas probabilidades mediante el diagrama de árbol de la figura,
donde la primera rama da la probabilidad P(E)P(A|E) y la segunda rama da la
probabilidad
Una generalización del ejemplo anterior para el caso en donde el espacio muestral
se parte en k subconjuntos se cubre mediante el siguiente teorema, que algunas
veces se denomina teorema de probabilidad total o regla de eliminación.
Cuando una variable aleatoria puede tomar valores en una escala continua, se le
denomina variable aleatoria continua. A menudo los posibles valores de una variable
aleatoria continua son precisamente los mismos valores incluidos en el espacio
muestral continuo.
Una distribución continua describe las probabilidades de los posibles valores de una
variable aleatoria continua. Una variable aleatoria continua es una variable aleatoria
con un conjunto de valores posibles (conocido como el rango) que es infinito y no
se puede contar.
Las probabilidades de las variables aleatorias continuas (X) se definen como el área
por debajo de la curva. Por lo tanto, solo los rangos de valores pueden tener una
probabilidad diferente de cero. La probabilidad de que una variable aleatoria
continua equivalga a algún valor siempre es cero.
Con una distribución discreta, a diferencia de una distribución continua, usted puede
calcular la probabilidad de que X sea exactamente igual a algún valor. Por ejemplo,
puede utilizar la distribución discreta de Poisson para describir el número de quejas
de clientes en un día. Supongamos que el número promedio de quejas por día es
10 y usted desea saber la probabilidad de recibir 5, 10 y 15 quejas de clientes en un
día.
x P (X = x)
5 0.037833
10 0.12511
15 0.034718
Usted también puede visualizar una distribución discreta en una gráfica de
distribución para ver las probabilidades entre los rangos.
Distribución exponencial
Medias de las muestras
Definición.
Visto de una manera simple, el “mejor” estimador será aquel que minimice el ECM.
Sin embargo, aún en el caso en el que determinemos el ECM para un gran número
de estimadores, para la mayor parte de las funciones de densidad f(x; q) no existe
un estimador que minimice el error cuadrático medio para todos los posibles valores
de q. Por esta razón hay que añadir criterios adicionales para la selección de los
estimadores de q.
Estimadores insesgados.
Definición
Demostración
Como Y sigue una Chi-cuadrado con n-1 grado de libertad; E(Y) = n-1. Luego
Teorema 1
Sea X1, X2, …, Xn una muestra aleatoria de alguna población con función de
densidad no especificada de manera que E(Xi)=m y Var(Xi)=s2 para todo i. Entonces
si
Estimadores consistentes.
Definición
El requisito
constituye lo que se llama convergencia en probabilidad.
Desigualdad de Tchebysheff.
Sea X una variable aleatoria con función de densidad f(x) y tal que E(X)=m y
Var(X)=s2 son finitas. Entonces:
o de otra manera
Teorema.
Sean X1, X2, …, Xn n variables aleatorias IID, tales que E(Xi)=m y Var(Xi)=s2 y son
finitas. Entonces
Demostración
Tomando
se tiene :
y por tanto:
Ejercicio.
Por tanto:
De otro lado
Para un parámetro dado q, considérese la clase formada por todos los estimadores
insesgados de q. Si T es un estadístico perteneciente a esta clase, entonces
E(T)=q y ECM(T) = Var (T). Debe buscarse una clase de estimadores insesgados,
si es que existe, que tenga una varianza mínima para todos los valores de q. Este
estimador recibe el nombre de estimador insesgado de varianza mínima uniforme
(VMU) de q.
Definición
Sea X1, X2, …, Xn una muestra aleatoria cuya función de probabilidad es f(x; q). Sea
el estadítico T=u(X1, X2, …, Xn) un estimador de q tal que E(T)=q y Var(T) es menor
que la varianza de cualquier otro estimador insesgado de q. Se dice que T es un
estimador insesgado de varianza mínima.
Teorema
Definición
Teorema.
Sea X1, X2, …, Xn una muestra de una distribución con una función de densidad de
probabilidad f(x;q). Se dice que T=u(X1, X2, …, Xn) es un estadístico suficiente
de q si y solo si la función de verosimilitud puede factorizarse de la siguiente forma:
Para cualquier valor t=u(x1, x2, …, xn) de T y en donde g(x1, x2, …, xn) no contiene
al parámetro q.
¿Cómo obtener estimadores que cumplan con las propiedades deseables de los
estimadores? Veamos el método de máxima verosimilitud y el de los momentos.
Más adelante, en otro capítulo, se estudiará el método de mínimos cuadrados:
Sea X1, X2, …, Xn una muestra aleatoria de una distribución con función de densidad
de probabilidad f(x; q), y sea L(x1, x2, …, xn;q) la verosimilitud de la muestra como
función de q. Si t=u(x1, x2, …, xn) es el valor de q para el cual la función de
verosimilitud es máxima, entonces T=u(X1, X2, …, Xn) es el estimador de máxima
verosimilitud de q.
Por otra parte, es más fácil, generalmente, maximizar Ln(L(q)) que L(q).
Definición
Sea X1, X2, …, Xn una muestra aleatoria con función de densidad f(x;q). El r-ésimo
momento alrededor de cero se define como
El método de los momentos constituye una alternativa razonable cuando no pueden
hallarse los estimadores de máxima verosimilitud.
Téngase en cuenta que muchas veces los parámetros son funciones de los
momentos teóricos.
Si la prueba de duración se termina sólo cuando todos los artículos han fallado, se
dice que la muestra aleatoria de tiempos está completa. Sin embargo,
generalmente, si la prueba termina después de un lapso determinado de tiempo x0 o
después de la falla de un número determinado de unidades m £n. Las dos
condiciones producen muestras censuradas.
Si no se tienen en cuenta las inferencias, existe muy poca diferencia entre ambos
tipos.
Siendo
Tomando logaritmos
Derivando con respecto a q.
Se deduce que
Luego
Dada una variable aleatoria con distribución Normal N (μ, σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro μ, basado en una
muestra de tamaño n de la variable.
se distribuye según una Normal estándar. Por tanto, aplicando el método del pivote
podemos construir la expresión
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha
una probabilidad de α/2, de la que se deduce el intervalo de confianza