Академический Документы
Профессиональный Документы
Культура Документы
DE HUAMANGA
FACULTAD DE CIENCIAS DE LA SALUD
ESCUELA DE FORMACION PROFESIONAL DE OBSTETRICIA
TRABAJO MONOGRAFICO
CURSO : BIOESTADISTICA
PROFESORA :
INTEGRANTES:
SERIE
AYACUCHO – PERU
2018
1
DEDICATORIA
2
3
INDICE
DEDICATORIA ...................................................................................................................... 2
INTRODUCCIÓN .................................................................................................................. 5
OBJETIVOS ................................................................................................................................ 6
OBJETIVO GENERAL: ........................................................................................................ 6
OBJETIVO ESPECIFICOS: ................................................................................................. 6
RESUMEN................................................................................................................................... 7
MARCO TEORICO ................................................................................................................... 8
1. INFERENCIA ESTADÍSTICA ..................................................................................... 8
2. ESTIMACIÓN. ............................................................................................................. 10
3. TIPOS DE ESTIMACIÓN. .......................................................................................... 10
4. METODOS DE ESTIMACION................................................................................... 12
5. ESTIMACION POR INTERVALOS .......................................................................... 18
6. DISTRIBUCIÓN MUESTRAL ................................................................................... 19
7. INFERENCIA Y MUESTRAS .................................................................................... 19
CONTRASTE DE HIPÓTESIS: ......................................................................................... 22
8. MUESTREO .................................................................................................................. 25
MUESTREO ALEATORIO SIMPLE (MAS).................................................................... 26
MUESTREO SISTEMATICO............................................................................................. 27
9. ESTADISTICOS Y DISTRIBUCIONES MUESTRALES ....................................... 29
10. DISTRIBUCIONES MUESTRALES DE LA MEDIA Y LA DESVIACION
TIPICA................................................................................................................................... 32
11. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION
NORMAL DE VARIANZA CONOCIDA .......................................................................... 34
12. LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN ................. 36
DISCUSIONES.......................................................................................................................... 41
CONCLUSION.......................................................................................................................... 43
REFRENCIAS BIBLIOGRAFICAS ....................................................................................... 44
ANEXO ...................................................................................................................................... 46
MODELO DE EJERCICIOS................................................................................................... 47
4
INTRODUCCIÓN
conocimiento científico.
5
OBJETIVOS
OBJETIVO GENERAL:
distribución muestral
OBJETIVO ESPECIFICOS:
6
RESUMEN
comprende las técnicas con las que, con base únicamente en una muestra sometida a
observación, se toman decisiones sobre una población o proceso estadísticos. Dado que
de probabilidad. Mientras que a las características medidas de una muestra se les llama
las características de todos los miembros de una población definida se llama censo.
crecientes hasta que falle cada uno de ellos. Con base en estos resultados muestrales puede
la población muestreada.
7
MARCO TEORICO
1. INFERENCIA ESTADÍSTICA
CONCEPTO:
términos de probabilidad.
8
se estima un parámetro poblacional, aunque el estimador que se utiliza posea todas
desconocido por lo cual es imposible saber en cada caso cual ha sido la magnitud o el
signo del error; para valorar el grado de precisión asociado con una estimación puntual
intervalo de confianza está formado por un conjunto de valores numéricos tal que la
probabilidad de que éste contenga al verdadero valor del parámetro puede fijarse tan
intervalo, y la amplitud de éste constituye una medida del grado de precisión con el
En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho) es aquella que
9
considera cierta, está en función de que sea o no compatible con la evidencia empírica
de cometer el error de rechazar la hipótesis nula siendo ésta cierta; dicha probabilidad
2. ESTIMACIÓN.
estadística, rama de la estadística que tiene que ver con el uso de los conceptos de la
3. TIPOS DE ESTIMACIÓN.
insuficiente, debido a que sólo tiene dos opciones: es correcta o está equivocada.
Una estimación puntual es mucho más útil si viene acompañada por una
10
b) Una estimación de intervalo: es un intervalo de valores que se utiliza para
Estimador y estimaciones.
referimos a ese valor como una estimación. Una estimación es un valor específico
Estimaciones puntuales.
la información de muestreo.
11
4. METODOS DE ESTIMACION
valores observados y esperados tras suponer que las observaciones se obtienen como
fuente de error).
técnicas relacionadas.
xi = m + ei
12
obtenemos la media muestral como estimador de la poblacional.
Consiste en sustituir los parámetros por aquellos valores que maximizan el logaritmo de
Los valores muestrales X1, ... , Xn se supone que son variables aleatorias independientes
y todas con distribución N(m, s). La función de densidad conjunta será el producto de las
Tomando logaritmos
13
Propiedades de los estimadores Máximo-verosímiles
a que se obtienen mediante un método simple y tienen buenas propiedades con respecto
verosimilitud.
o cota de Cramer-Rao.
NORMAL
Sea una muestra aleatoria simple, X1, X2, ...... , Xn de una población con distribución
N(m , s).
-Estimador de la media
14
La cantidad estima a la desviación típica de la media y se denomina error
estándar de la media, por esta razón se dice que el error estándar de la media mide la
Estimador de la Varianza
variable dicotómica (dos posibles resultados). Una variable cualitativa con más de dos
resultados puede reducirse a una dicotómica sin más que agrupar algunas de las
categorías.
15
a) BINOMIAL
b) HIPERGEOMETRICA
conocido.
EJEMPLO
Habíamos caracterizado la población que queríamos estudiar y los objetivos del estudio.
El paso siguiente consiste en tomar una muestra, más tarde trataremos el tema del tamaño
16
de muestra necesario para obtener una determinada precisión. La tabla siguiente contiene
RIBERA DE DUERO
12,8 12,8 12,5 11,9 12,5 12,1 12,2 12,6 13,0 12,4 12,6 12,2 12,8 13,0
La primera hipótesis que hicimos era que la población es normal. Si disponemos de una
mediante un Box-Plot.
extremas por lo que, en principio, no hay ninguna razón para suponer una distribución no
normal.
Los estimadores de los principales parámetros aparecen en la tabla siguiente junto con
17
alta, cercano a la misma. La variabilidad de la media en el muestreo se estima mediante
utilizando n-1.
Dada una muestra aleatoria X1, X2, ... , Xn , de una población con función de densidad
de confianza”.
El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%). La interpretación práctica es
sencilla, por ejemplo, si el nivel de confianza es del 95%, significa que en el 95% de
18
Una vez que el intervalo de confianza ha sido particularizado para una muestra
parámetro, con probabilidad 1, por esa razón, cuando ya tenemos un valor concreto
6. DISTRIBUCIÓN MUESTRAL
Sierra Bravo (1991) anota que la distribución muestral: Está formada por estadísticos
que se repiten en el conjunto de todas las muestras posibles del mismo tamaño
obtenidas de la población.
De manera más formal, Tsokos y Milton (1998) anotan que: “(…) la distribución de
Ejemplo:
Fijamos para una muestra de tamaño 2, en la tabla 2.2 se muestra los posibles
7. INFERENCIA Y MUESTRAS
Por ejemplo:
de estar muy claros cuales son los criterios de inclusión de un paciente en la población
(muestra) a estudiar.
20
estudio de estaturas no incluirá solamente individuos bajos o altos, sino individuos de
muestra queda garantizada con la elección correcta del método de muestreo, que se
Sobre cada uno de los individuos medimos una o varias características que denominamos
variables. Así a cada población le corresponde una variable aleatoria que denotaremos
aleatoria en estudio que resuma las características de la misma (apartado 2c del método
una muestra.
Por ejemplo:
Suponemos que X es N (m, s) donde los dos parámetros, o uno de ellos, son desconocidos.
21
Inferencia Paramétrica:
la distribución conocida.
Inferencia No Paramétrica:
tienen por qué ser parámetros de una distribución conocida (Mediana, Estadísticos de
Orden).
Estimación:
Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas
CONTRASTE DE HIPÓTESIS:
real. El estudio pertenece a otro más amplio llevado a cabo en colaboración por los
22
Departamentos de Química Analítica, Nutrición y Bromatología, y Estadística y
Matemática Aplicada.
El objetivo original del trabajo consiste en estudiar los vinos jóvenes embotellados de dos
objetivas, con el fin de buscar las características que los diferencian y evitar los posibles
se obtiene de los propios objetivos del mismo. Estudiaremos vinos jóvenes embotellados
Seguramente todos hemos observado que en las botellas de vino aparece el grado
alcohólico de las mismas, que suele ser entre 12 y 12,5 grados. Es obvio que este valor
no es el contenido exacto de cada una de las botellas, sino que se trata de un contenido
necesidad de seleccionar una muestra es clara ya que el análisis del contenido alcohólico
botellas es muy grande y supondremos que la variable aleatoria sigue una distribución
23
normal. La hipótesis sobre la distribución de probabilidad ha de hacerse a priori, teniendo
en cuenta las características conocidas de la población en estudio (hay que tener en cuenta
que se trata solamente de un modelo para ajustar la realidad.) El ejemplo parece lógico
utilizar una distribución normal ya que es posible suponer que los posibles valores del
probabilidad de encontrar valores decrece a medida que aumenta la distancia a dicho valor
medio.
distribución normal ya la distribución es probablemente asimétrica con una cola hacia los
24
En la mayor parte de las investigaciones reales suponemos que las variables o
aproximadamente normales.
8. MUESTREO
Aunque la teoría que será desarrollada más tarde está referida solamente a muestras
aleatorias simples, realizaremos aquí una rápida revisión de posibles métodos para la
Los pasos a seguir para la recolección de una muestra son los siguientes:
- Definir las variables a medir o las preguntas que se harán si se trata de una
encuesta.
son los primeros los que nos permiten la estimación correcta de parámetros.
25
En cuanto al tipo de muestreo, algunas de las características más importantes de
seleccionan muestras del tamaño deseado utilizando una tabla de números aleatorios o un
Recuérdese que "al azar" no significa "de cualquier manera", para que el procedimiento
números aleatorios.
Entre las ventajas de este procedimiento esta la compensación de valores altos y bajos
26
El principal inconveniente de este tipo de muestreo es que necesita un marco adecuado y
amplio que no siempre es fácil de conseguir y que no contiene información a priori sobre
MUESTREO SISTEMATICO
primer grupo y se elige el que ocupa el mismo lugar en todos los grupos.
La ventaja principal es que es más sencillo y más barato que el muestreo aleatorio simple,
de los parámetros.
Este tipo de muestreo puede utilizarse, por ejemplo, en encuestas telefónicas programadas
mediante ordenador.
características de la población.
27
Por ejemplo, los conglomerados en un estudio sobre la situación de las mujeres en una
Este tipo de muestreo se utiliza fundamentalmente para reducir los costes de toma de
MUESTREO ESTRATIFICADO
ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen presentar
características diferenciales.
28
Se selecciona una muestra aleatoria de cada estrato tratando de que todos los estratos de
- Optima.
Todo lo que veremos a continuación está pensado para poblaciones infinitas (muy
grandes) y con muestreo aleatorio simple. El muestreo aleatorio simple garantiza una
independientes.
luego los posibles valores para x1 son todos los de X, y por tanto x1 puede considerarse
x2 que puede considerarse como una realización particular de una variable aleatoria
29
población no se modifica al extraer uno de sus individuos ya que es infinita. (Si la
El proceso continúa hasta obtener una muestra de tamaño n, n observaciones x 1, x2, ... ,
Definición: Sea X una variable aleatoria con f.d.p F, y sean X1, X2, ... , Xn , n variables
aleatorias independientes con la misma f.d.p F que X. Se dice que X1, X2, ... , Xn , son
Hemos utilizado letras minúsculas, como en descriptiva, para denotar las observaciones
particulares de una muestra, y letras mayúsculas para denotar las variables aleatorias de
las que se han tomado. A lo largo de la exposición teórica ambas serán intercambiables y
aleatorias.
Otra forma de ver la muestra es como una variable aleatoria multivariante con función
donde las funciones de densidad son iguales a la de X. Esta forma de entender la muestra
fundamentales como la media, la desviación típica, etc ... A tales características las
30
Un estadístico es también una variable aleatoria ya que es una función de variables
Supongamos que obtenemos una muestra sin reemplazamiento de tamaño 2. Las distintas
posibilidades son
Es claro que la media muestral no es un valor fijo sino que puede considerarse también
como una variable aleatoria de la que tenemos una sola observación, la media de la
Dicha variable tendrá una distribución de probabilidad asociada. (En este caso una
distribución discreta que toma los valores 1.5, 2, 2.5, 3 y 3.5 con probabilidades 1/6, 1/6,
31
En la mayor parte de los casos supondremos que nuestra población tiene distribución
normal y que los estadísticos que vamos a utilizar son la media y la desviación típica (o
TIPICA.
Sea X1, X2, ... , Xn , una muestra aleatoria de una población X en la que
E(X) = m Var(X)= s2
Entonces el valor esperado (media) y la varianza del estadístico "media muestral" son
varianza es la suma de las varianzas, y además que si multiplicamos una variable por una
también normal .
32
El resultado es importante en estimación ya que, aunque la media poblacional y la media
y su obtención supera los objetivos del curso, de forma que nos limitaremos a exponerlas.
Sea X1, X2, ... , Xn , una muestra aleatoria simple de una población X º N(m, s2), entonces
la variable aleatoria
33
11. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACION
Supongamos que disponemos de una población en la que tenemos una v.a. con
distribución N(m , s) con s conocida (de estudios previos, por ejemplo). Obtenemos
conocida
la cantidad
34
Despejando la media muestral y la varianza
en la práctica, de todos los posibles valores de tenemos uno sólo y por tanto un único
intervalo contiene información sobre el estimador puntual (valor central del intervalo) y
confianza para la media de una distribución normal con varianza conocida. Para los
35
del parámetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel
en que nuestro intervalo sea de la mayoría que con tiene al verdadero valor objetivo
aunque no tenemos la seguridad de que sea así, tenemos concretamente un riesgo del 5%
de equivocarnos.
normal.
más pequeña posible, es decir, que el error en la estimación sea lo mas pequeño
posible.
36
Esto puede conseguirse modificando las distintas cantidades que aparecen en la
a) NIVEL DE CONFIANZA
embargo conviene mantenerlo en unos límites razonables que suelen ser del 95%
b) VARIANZA
c) TAMAÑO MUESTRAL
lo que significa que se obtienen estimaciones más precisas cuanto mayor sea el
37
estimaciones más precisas, es por ello que en la práctica se selecciona el tamaño
normal de forma que la diferencia existente entre la media muestral que obtendré del
de antemano.
podemos escribir
Despejando n de la igualdad
experimentos previos o a partir una muestra piloto con unas pocas observaciones.
38
Obsérvese que en el cálculo del tamaño muestral se han igualado el error fijado a priori
con el error en la estimación obtenido del intervalo de confianza y que este último incluye
el nivel de confianza. En este apartado un nivel de confianza del 95%, por ejemplo,
implicaría que en el 95% de las veces que repetiríamos el experimento con el tamaño
muestral calculado, obtendríamos un error por debajo del prefijado, mientras que en el
población, que habrá que estimar a partir de los datos muestrales. Utilizaremos la cuasi-
39
Obsérvese la similitud con el intervalo calculado para la distribución normal, salvo en el
Desde el punto de vista práctico esto implica que los valores críticos son un poco más
grandes y, por tanto, el intervalo tiene mayor longitud, este es el precio que debemos
40
DISCUSIONES
de una población, en tanto que una distribución muestral es la distribución de los valores
valores que una estadística muestral, o estimador, podría adoptar en muchas muestras del
mismo tamaño. Así, aunque por lo general disponemos únicamente de una muestra
Más aún, el valor de una estadística muestral variará de una muestra a otra, a causa de la
variabilidad del muestreo aleatorio, o error de muestreo. Ésta es la idea en la que se apoya
41
Media (µ). Es el promedio aritmético de las medias del conjunto de datos; ya sea de la
42
CONCLUSION
La estadística es la rama de las matemáticas que se ocupa de reunir, organizar, y analizar
información cuantitativa o cualitativa, y deducir de ella, gracias al análisis de estos datos, unos
significados precisos o unas previsiones para el futuro, siendo un auxiliar en la toma de decisiones
administrativos.
Por el tipo de información que se trate, podemos dividir la estadística en dos categorías, la
estadística descriptiva que trabaja con todo el universo de la población, por ejemplo la venta de
estadística inferencial, que utiliza para su manejo solo una muestra representativa de la población,
como por ejemplo con la estatura promedio de una escuela, se puede inferir la estatura promedio
A las características medidas de una muestra se les llama estadística muestral, y a las
población. En otras palabras, las características de una muestra se llaman estadísticas, y las
al agregado de todas las unidades individuales, sean personas, cosas..., que se hallan en una
situación determinada, pudiendo ser estas finitas e infinitas. Una muestra es solo una parte de la
población.
43
REFRENCIAS BIBLIOGRAFICAS
LOSILLA, J.M.; Navarro, J.B.; Palmer, A.; Rodrigo, M.F. y Ato, M. (2005). Del
contraste de hipótesis al modelado estadístico. Girona: Documenta Universitaria.
PARDO, A., Ruiz, M.A. y San Martín, R. (2009). Análisis de datos en ciencias sociales
y de la salud I. Madrid: Síntesis.
44
TUKEY, J.W. (1962): “El análisis de los datos en el futuro”. Annals of Mathematical
Statistics, 33, 1-67.
45
ANEXO
46
MODELO DE EJERCICIOS
Ejercicio 1:
En una muestra de 40 estudiantes se mide el ritmo cardiaco al comienzo de un examen,
obteniéndose un valor medio de 123 p.p.m. (media: 123; varianza = 47). ¿Entre qué valores se
hallará el verdadero valor de la media de ritmo cardiaco para la población de estudiantes con un
nivel de confianza del 90%?.
¿Y con una confianza del 95%? %?(Una pista para empezar a resolver el problema: dado que no
se conoce el valor de la desviación típica de la variable en la población, hay que estimarla a partir
de la cuasi-desviación típica obtenida en la muestra).
¿Y cuáles hubiesen sido esos IC si la muestra hubiera sido de 20 sujetos? (Datos de interés para
la obtención del IC (95%): (0,025t19 = 2,09; 0,975t19 = 2,09) y del IC (90%): (0,05t19 = 1,73;
0,95t19 = 1,73).
Ejercicio 2:
Una cadena hotelera desea conocer el nivel de satisfacción de sus clientes sobre la calidad del
servicio. Para ello seleccionan una muestra aleatoria de 100 clientes y obtienen una puntuación
media de 7 en una escala de satisfacción del cliente (rango posible de la puntuación: 0 a 10) con
una cuasi-desviación típica de 2,3.
a) ¿Entre qué valores se encuentra la media de satisfacción en la población de clientes de esa
cadena hotelera con un nivel de confianza del 95% (= 0,05)?
b) ¿Cuál sería el intervalo de confianza si, con el mismo nivel de riesgo, la muestra hubiera sido
de 300 clientes?
c) ¿Y cuál sería el IC con = 0,10 y n = 300?
Ejercicio 3:
En una muestra aleatoria de 20 estudiantes de Psicología encontramos que la media de
satisfacción con la carrera es de 6,5 puntos (en una escala de 0 a 10) con una cuasi-desviación
típica de 2,4. a) ¿Cuál será el valor de la media de satisfacción en la población de estudiantes de
Psicología? Realiza la estimación por IC con un = 0,05 (0,025t19 = 2,09; 0,975t19 = 2,09) b)
¿Cuál sería esta estimación si considerásemos un = 0,10? (0,05t19 = 1,73; 0,95t19 = 1,73)
47