Академический Документы
Профессиональный Документы
Культура Документы
DATO ESTADSTICO II
Elaborada por los Profs.: Carolina Pea, Gioconda Briceo, Manuel Godoy y
Roberto Herrera del PFG en Gestin Ambiental-UBV, Sede Caracas,
Septiembre 2005.
COMPETENCIAS A LOGRAR:
CONTENIDOS
1.1. Qu es la estadstica?
Ejemplos:
El nmero de nios que viven en una determinada parroquia de
Caracas.
El porcentaje de graduados de las universidades pblicas del pas
El salario promedio de los habitantes de la parroquia La Vega.
El nmero de decesos anuales debidos al alcoholismo.
El nmero de goles anotados por la vino tinto.
1.3. POBLACIN
1.3.1. PARMETRO:
Ejemplos:
1.4. MUESTRA:
1.4.1. ESTADSTICO:
1.5. DATOS
1.5.1. El Dato:
Datos
Ejemplo: Ejemplo:
- Numero de hijos por familia - Peso de los
alumnos
- Nmero de empleado por empresa - Kilmetros
recorridos
- Nmero de televisores vendidos en el ao entre cambio de
aceite
1.7. PLANEAMIENTO Y EJECUCIN DE UNA INVESTIGACIN
ESTADSTICA.
2. Diseo de un experimento.
Propiedades:
a) Las categoras son mutuamente excluyentes. Un individuo u
objeto pertenece solo a una categora
b) Las categoras son exhaustivas. Un individuo u objeto
pertenece cuando mucho a una categora
Propiedades:
a) Las categoras de datos son Mutuamente excluyentes y
exhaustivas.
Es el nivel de medicin mas alto, este tiene todas las caractersticas del nivel
de intervalo, pero adems el punto 0 tiene significado y la relacin entre dos
nmeros tiene sentido
Nombre de la encuesta
Titulo del cuestionario
Objetivo
Institucin que lo respalda
Lugar y fecha.
Para la elaboracin de las preguntas hay que tomar en cuentas los siguientes
puntos:
Hay que tomar en cuenta quien anotar la respuesta en el
cuestionario (El entrevistado el entrevistador)
Hay que tomar en cuenta el aspecto, contenido y extensin que debe
tener el cuestionario.
Se determinara el menor nmero de preguntas que ofrezcan mejores
y mayores numeraos de datos.
Para obtener resultados lgicos, verdaderos y precisos es preciso seguir los
siguientes pasos al redactar las preguntas:
Sencillez en la preparacin
Facilidad de contestacin
COMPETENCIAS A LOGRAR:
CONTENIDOS
1. Qu es la probabilidad?
f
P= ; Donde f: nmero de casos favorables
n
n: nmero de casos posibles o realizados
Variable dependiente: puede ser definida como los cambios sufridos por
los sujetos como consecuencia de la manipulacin de la variable
independiente por parte del experimentador.
Ejemplo: La crecimiento de la poblacin del gusano de palma en el
Parque del Este en Caracas en los meses de Octubre- Diciembre
del ao 2003.
Qu es un experimento?
Es todo proceso que produce un resultado u observacin.
Qu es un Espacio Muestral?
Es el conjunto de todos los resultados posibles de un evento proceso
se simboliza por letras maysculas, S = {rboles, ros, casas,}, tambin
se pueden representar en cuadros o formatos ya elaborados.
Qu es un Evento?
Es cualquier subconjunto del espacio muestral.
\ varones y hembras
Aos Varones (V) Hembras (H) TOTAL
2002 (1er ao) 100 80 180
2003 (2do ao) 70 50 120
2004 (3er ao) 50 40 90
TOTAL 220 170 390
1. De segundo ao P1
2. Hembra P2
3. De tercer ao P3
4. Varn P4
Solucin:
Se procede de la siguiente manera:
120
p1 = = 0,3076 P1= 0,3076; P1= 30,76%
390
170
P2 = = 0, 4358 P2 = 0,4358; P2 = 43,58%
390
90
P3 = = 0, 2307 P3 = 0,2307; P2 = 23,07%
390
220
P4 = = 0,5641 P4 = 0,5641; P4 = 56,41%
390
Interpretacin: Esto quiere decir que:
1. Existe el 0,3076 30,76 % de probabilidad de que
sea de segundo ao,
2. El 0,4358 43,58% de probabilidad de que sea
hembra.
3. Existe el 0,2307 23,07 % de probabilidad de que
sea de tercer ao,
4. El 0,5641 56,41% de probabilidad de que sea
varn.
PROPIEDADES DE LA PROBABILIDAD:
55
P1 = = 0,578 P1= 0,578 ; P1= 57,8%
95
40
P2 = = 0,010 P2 = 0,010; P2 = 0,10%
95
55
P3 = = P3 = ; P 2 = %
95
55
P4 = = 0 P4 = ; P 4 = %
95
DENSIDAD DE POBLACIN
UBICACIN Urbana(U) Rural (R) TOTAL
Cul Este (E) 25 50 75 es la
Oeste (O) 20 30 50
TOTAL 45 80 125
probabilidad de que el mercado seleccionado para la prueba est en el este
P(E)?
Cul es la probabilidad de que el mercado seleccionado para la prueba est
en el oeste P(O)?
Cul es la probabilidad de que est localizado en un rea urbana P(U)?
Cul es la probabilidad de que est localizado en un rea rural P(R)?
Cul es la probabilidad de que el mercado este en un rea rural al oeste, P(R
y O)?
Cul es la probabilidad de que est al este o dentro de un rea urbana, P(E
U)?
Cul es la probabilidad de que si est en el este, est localizado en un rea
urbana, P(U/ E)?
Son independientes la ubicacin y la densidad de poblacin?
50
P O = (Total para el oeste dividido entre el nmero total de
125
mercados)
45
P U = (Total para la ubicacin urbana dividido entre el nmero total de
125
mercados)
80
P R = (Total para la ubicacin rural dividido entre el nmero total de
125
mercados)
95
P E U =
125
75 45 25 95
=
125 125 125 125
25
P U / E =
75
Tambin puede utilizarse la frmula de la probabilidad condicional:
25
P (U y E) 25
P U /E = 125 =
P(E) 75 75
125
2.1. DISTRIBUCIN.
2.1.1. Qu es la Distribucin?
La distribucin probabilstica es esencialmente una explicacin del
comportamiento de un determinado fenmeno, es una herramienta
imprescindible para tomar decisiones en aspectos donde de alguna forma
intervenga la incertidumbre.
P = k, n, p = nk p k q n - k
n! 5! 5 . 4 . 3!
nk = 53 = = =
n - k ! . k! 5 - 3 ! . 3! 5 3 ! . 3!
20
donde; = = 10
2 .1
4 5
x = n. p.q = (20) (1/5) (4/5) = 80/25 = = 1,79
5
3. DISTRIBUCIN NORMAL
La distribucin normal se presenta con un enfoque ms prctico
representndose con una grfica o Curva Normal o De Campana utilizando
una escala aproximada, como se indica en la figura siguiente:
X -
2
1 e = 2,71828
f(x) = .e-
2p 2 2 p = 3,14159
X-
Z=
Z=0 a
Cuando los valores viene dados por la tabla de la distribucin normal, y con
valores o nmeros reales (positivos y negativos), para tipificar la
puntuacin, esto es, tomar en cuenta la simetra de f(z) con respecto a z,
se proporciona el clculo y su uso de la tabla de la distribucin normal,
como se sigue la frmula
a- b-
Z1 = ; Z2 = . En general
X-
Z=
x
25% 25%
2da manera:
1.- La probabilidad de obtener una puntuacin igual o inferior a 32, es la
proporcin del rea de la curva normal existente por debajo de esa
puntuacin bruta o directa.
2.- Se tipifica la puntuacin:
X - 32 - 36
Z= = = - 0,80
X 5
3.-la puntuacin tipificada (z= -0,80) se busca en la tabla de reas bajo la curva
normal y corresponde a un 28,81%. Por lo tanto, por debajo de dicha
puntuacin se encontrar un (50 -28,81) =21,19%.
28,81 %
-0,80
3era manera:
1.- Como la distribucin es normal, los alumnos que tengan una puntuacin
igual o mayor que 34, corresponder al porcentaje de la curva normal que
supere esa puntuacin.
2.- Se obtiene la puntuacin tpica:
X - 34 - 36
Z= = = - 0 ,40
X 5
5,54% 50%
65,54%
Z = -0,40
3.- Se busca en la tabla de reas para la curva normal, el valor (z= -0,40),
obtenindose un porcentaje igual a 15,54%.
4.- Como z= -0,40, es negativa, el porcentaje de alumnos, ubicados por encima
de esa puntuacin, ser (15,54% + 50) = 65,54%.
5.-Si la muestra tiene 3000 alumnos, la cantidad de los que le superen esa
puntuacin (X= 34), es el 65,54% de 300, es decir (300)(65,54)/100 = 197
alumnos.
NORMALIZACIN
Escala T: Los puntajes obtenidos en una distribucin cualquiera pueden
llevarse a puntos equivalentes dentro de una distribucin normal.
Los puntajes T son puntajes estndar normalizados, convertidos en una
distribucin cuya media aritmtica es 50 y alejndose en -5 de la media, le
corresponde 0, mientras que el se aleja 5 de la media, tiene 100 puntos. Para
obtener un puntaje T, se utiliza la siguiente frmula:
T = 50 + 10 .z
F ajustada = F inferior = . f
F ajust.
P acumulada = F mx. no ajust. . 100
48,5
P acum. 10 = .100 = 97
50
3.- Se obtiene en la curva normal el puntaje tpico que corresponde a cada uno
de os porcentajes obtenidos. Z = 1,88.
97% 47%
2 = 1,88
E1 . 20 = (T/ Tmx) . 20
Tabla de operaciones
N Xi - X s f F F ajust. P z T E1 . 20
10 72 3 50 48,5 97 1,88 69 20
76
9 67 7 47 43,5 87 1,13 63 18
71
8 62 1 40 39,5 79 0,81 58 17
66
7 57 9 39 34,5 69 0,50 55 16
61
6 52 2 30 29 58 0,20 52 15
56
5 47 5 28 25,5 51 0,02 50 14
51
4 42 4 23 21 42 - 0,20 48 14
46
3 37 4 19 17 34 - 0,41 46 13
41
2 32 6 15 12 24 - 0,71 43 12
36
1 27 9 9 4,5 9 - 1,34 37 11
31
50
1.11. ACTIVIDADES
Individual
Grupal Cooperativa
- Los empleados de una universidad fueron clasificados de acuerdo con su
edad y adscripcin a la administracin, cuerpo docente o personal de apoyo.
grupo
de
Clasificacin/ 51 o TOTAL
20 30 31 40 41 50
edad mayor
Administracin 2 24 16 17 59
Cuerpo Docente 1 40 36 28 105
Personal de 52
16 20 14 2
Apoyo
TOTAL 19 84 66 47 216
- Suponga que cierta caracterstica oftlmica est asociada al color de los ojos.
Se estudiaron 3000 personas seleccionadas aleatoriamente con los siguientes
resultados:
Nmero de Reuniones a 0 1 2 3 4
las que asisten (x)
Probabilidad 0.12 0.38 0.30 0.12 0.08
BIBLIOGRAFA BSICA
Sokal, R.R. y Rohlf, F.J. 1995. Biometry, the principles and practice of
statistics in biological research. 3era edicin. W.H. Freeman and
Company. USA.
PGINAS WEB
http://www.hrc.es/bioest/M_docente.html
http://www.e-
biometria.com/ebiometria/conceptos_basicos/estimacion_estadistica.htm
Competencias:
Conoce la medida en la que se alejan los datos de la media poblacional,
es decir, la diferencia entre el valor estimado y el valor real.
Contenidos:
Introduccin a la Estadstica Inferencial.
Definicin y clculos del error estndar.
Usos del error estndar.
Tamao muestral.
Los dos tipos de problemas que resuelven las tcnicas estadsticas son:
estimacin y contraste de hiptesis. En ambos casos se trata de generalizar la
informacin obtenida en una muestra a una poblacin. Estas tcnicas exigen
que la muestra sea aleatoria. En la prctica rara vez se dispone de muestras
aleatorias, por la tanto la situacin habitual es la que se esquematiza en la
Figura 1.
40 40
Sx = = =8 2 Sx = 2 x 8 = 16
25 5
+ 2 Sx = 1000 + 16 = 1016
- 2 Sx = 1000 - 16 = 984
p (1 p ) / n
= 5,6mg/100ml
= 0,9 mg/100ml
n = 100
s 0,9 0 ,9
Sx = Sx = = = 0 ,09
n 100 10
2 Sx = 2 x 0,09 = 0,18
S n = 20
0,9 0,9
Sx = = = 0,20
20 4,47
2 Sx = 2 x 0,20 = 0,40
= 1,70 m
0,24 0 ,24
= 0,24 m Sx = = = 0 ,03
64 8
n = 64
2 Sx = 2 x 0,03 = 0,06
Tamao muestral
Para decidir el aumento adecuado hay que tener una idea del tamao
del objeto. Del mismo modo, para decidir el tamao muestral:
i) en un problema de estimacin hay que tener una idea de la magnitud a
estimar y del error aceptable.
ii) en un contraste de hiptesis hay que saber el tamao del efecto que
se quiere ver.
N
n= 2
1 ( N P )
N = 20.000 familias
P = 5% (0,05 expresado en proporcin)
N 20000
n=
1 ( N P )
2
=
1 20000 0,05 2
= 392,5
Por lo tanto, la muestra requerida debe ser de 393 familias.
s = 0,05 mg/100ml
P = 0,02 mg/100ml
Z = 1,96
2 2 2 2
Z s 1,96 0 ,05
n= 2
= 2
= 24,01
P 0 ,02
ACTIVIDADES
GRUPALES
1. Dado que el error estndar muestra la desviacin estndar de la
distribucin muestral de cualquier estadstico, investigue como se puede
calcular el error estndar para otros estadsticos, como la mediana,
desviacin estndar, varianza y coeficiente de variacin.
INDIVIDUALES
1. Una poblacin consiste en cinco nmeros 2, 3, 6, 8 y 11. Considere
todas las muestras de tamao igual a 2 que pueden obtenerse, con
reemplazamiento, a partir de esta poblacin. Calcule a) la media de la
poblacin, b) la desviacin estndar de la poblacin, c) la media de la
distribucin muestral de medias y d) la desviacin estndar de la
distribucin muestral de medias (es decir, el error estndar de las
medias).
2. Resuelva el problema anterior, pero considerando que el muestreo es
sin reemplazamiento.
3. Suponga que el peso de 3000 estudiantes universitarios varones se
distribuye normalmente, con una media de 68,0 Kg y una desviacin
estndar de 3,0 Kg. Si se obtienen 80 muestras de 25 estudiantes cada
una; cules seran la media y la desviacin estndar esperadas de la
distribucin muestral de medias resultante s los muestreos se hubieran
hecho a) con reemplazamiento y b) sin reemplazamiento.
4. En la comunidad de Guaraunos Estado Sucre, se han presentado un
gran nmero de casos de malaria. Determine cuntas personas debe
estudiar un investigador, para demostrar la existencia de una endemia,
cuando se ha estimado en trabajos anteriores, que la prevalencia de la
enfermedad es del 10%. Espera que los resultados obtenidos en la
muestra no varen en ms de un 2% con respecto a los valores reales de
la poblacin.
5. Se ha encontrado que el valor promedio de mercurio en msculo liso de
peces de reas cercanas a la Refinera El Palito (Estado Carabobo) es
de 0,9 g/100g con una desviacin estndar de 0,01 g/100g. Se desea
realizar una investigacin en la cual la muestra d una media de
mercurio no mayor del valor real en ms de 0,005 g/100ml. Cuntos
peces deben incluirse en la muestra?
6. En una comunidad constituida por 1146 familias se desea realizar un
diagnstico socioambiental, para lo cual se tomar una muestra
representativa que admita un error mximo de 5%. Cuntas familias
deben constituir la muestra?
BIBLIOGRAFA BSICA
COMPLEMENTARIA
Sokal, R.R. y Rohlf, F.J. 1995. Biometry, the principles and practice of
statistics in biological research. 3era edicin. W.H. Freeman and
Company. USA.
PGINAS WEB
http://www.hrc.es/bioest/M_docente.html
http://www.e-
biometria.com/ebiometria/conceptos_basicos/estimacion_estadistica.htm
TEMA 5 ESTIMACIN
Competencias:
Infiere las caractersticas de la poblacin a partir de las caractersticas
de la muestra.
Contenidos:
Definicin de estimacin, estadstico, parmetro, sesgo, estimacin por
puntos, intervalos de confianza, teorema del lmite central.
La Estimacin
Estimacin de parmetros.
La estimacin de parmetros puede efectuarse por puntos o por
intervalos. La estimacin por puntos plantea un solo valor numrico como
parmetro de la poblacin, estimado a partir de una muestra.
s s
X-Z XZ
n n
o de manera ms sencilla:
intervalo de confianza = X Z Sx
Siendo
s
Sx =
n
donde:
X : media aritmtica de la muestra.
Z : valor crtico o valor sigma. Se busca en la tabla de reas de la curva
normal, segn el nivel de confianza establecido.
Sx : error estndar.
s : desviacin estndar de la muestra.
n : tamao de la muestra.
Ejemplo 5-1. En una investigacin acerca del estado nutricional de los
escolares de primero a tercer grado, se encontr que los niveles de
hemoglobina en ayunas se distribuyen en forma normal, con una media
aritmtica de 12.38gr%, y una desviacin estndar de 0.87gr%. Se desea
conocer, con el 95% de confianza, el valor promedio de hemoglobina para esa
poblacin de escolares, de donde se extrajo la muestra aleatoria de 144 nios
(Puertas y col., 1998).
DATOS:
X = 12.38gr%
s = 0.87gr%
n = 144 nieos
nivel de confianza = 95 % ( = 0.05), el cual equivale a 1.96 sigma ().
s
Aplicando la frmula del intervalo de confianza = X Z
n
087 gr %
= 12.38 gr % 1.96
144
= 12.38 gr% 1.96x 0.07
10.2aos
= 48.2aos 1.96
350
= 48.2 aos 1.96 x 0.55
Estimacin de proporciones
0,7216
0,8784
ACTIVIDADES
INDIVIDUALES
BIBLIOGRAFA
BSICA
Macchi, R.L. 2001. Introduccin a la Estadstica en Ciencias de la Salud.
Editorial Mdica Panamericana. Argentina.
Milton, J.S. y Tsocos, J.O. 1991. Estadstica para Biologa y Ciencias de
la Salud. McGraw-Hill, Inc.
Puertas L., E.; Urbina, J.; Blanck, M.E.; Granadillo, D.; Blanchard, M.;
Garca, J.A.; Vargas V.; P. & Chiquito, A. 1998. Bioestadstica,
Herramienta de la Investigacin. Ediciones del Consejo de Desarrollo
Cientfico, Humanstico y Tecnolgico de la Universidad de Carabobo,
Venezuela.
SALAMA, D. 1987. Estadstica: Metodologa y aplicaciones. Editora
Principios, Caracas, Venezuela. 308 p.
SEGNINI, S. 2003. Apuntes de Estadstica para Bilogos. Direccin de
Publicaciones ULA, Mrida, Venezuela.
Spiegel, M.R. y Stephens, L.J. 2002. Estadstica. Serie Schaum. 3era
edicin. McGraw-Hill, Inc.
COMPLEMENTARIA
Sokal, R.R. y Rohlf, F.J. 1995. Biometry, the principles and practice of
statistics in biological research. 3era edicin. W.H. Freeman and
Company. USA.
PGINAS WEB
http://www.hrc.es/bioest/M_docente.html
http://www.e-
biometria.com/ebiometria/conceptos_basicos/estimacion_estadistica.htm
Competencias:
Toma decisiones en relacin a una poblacin a partir del anlisis de una
muestra, mediante la contrastacin de hiptesis.
Contenidos:
Definicin de hiptesis, planteamiento de hiptesis (Alternativa y Nula), Nivel
de significancia, Zonas de aceptacin y rechazo, seleccin del estadstico de
prueba, Errores (Tipo I, Tipo II), Toma de decisiones, Valores de prefijados.
Prueba de T.
Contrastes de hiptesis
1. Formulacin de hiptesis.
6. Decisin estadstica.
7. Conclusiones.
H0: = 25
Hi: < 25
Ejemplo 6-2. Se quiere saber si una nueva droga es eficaz como tratamiento
del SIDA. Para lo cual a un grupo de pacientes se le aplica un tratamiento con
la droga. Si la droga es eficaz a la mayora de los pacientes, es decir ms de la
mitad de los pacientes a los cuales se les aplic el tratamiento con la droga,
debieron responder positivamente a la enfermedad (Segnini, 2003).
Por lo tanto, si se considera que p es la proporcin de pacientes para los
cuales la droga es eficaz, las hiptesis que se deben someter a prueba sern
las siguientes:
H0: p = 0,5
X
Z =
Sx
X
t=
Sx
4. Establecimiento de una zona de rechazo para H0, con el fin de tomar una
decisin. Para establecer la regla de decisin, es necesario conocer el valor
crtico o valor en unidades sigmas donde se levanta la ordenada que limita las
zonas de rechazo y aceptacin, dependiendo del nivel de significacin, en las
curvas de probabilidades (Puertas y col., 1998).
Los valores crticos (Z) se hallan en las tablas de rea bajo la curva
normal. Zc es el valor calculado mediante la frmula planteada en el punto
anterior.
H0 cierta H0 falsa
H1 cierta
H0 rechazada Error tipo I ( ) Decisin correcta
(*)
H0 no rechazada Decisin correcta Error tipo II ( )
no est en la regin crtica (no es mayor que 1,69), por tanto no rechazamos
H0.
es decir, se acepta H0 si
= 50cms
N = 225 nias
X
Z =
Sx
X - 53 - 50 3 3
Z= = = = = 20,41
s/ n 2,2 / 225 2,2 / 15 0,147
Zona de no
rechazo Zona de rechazo
de Ho
0 2.33
s= 0,550 Kg Ho : =
n = 256 nios
= 3,500 Kg
-2,575 0 2,575
Q = 50%
Z=
P-p
Es =
P * Q
Es n
(-1,645 < Zc )
Es =
P * Q = 50% * 50% = 11,11
n 225
Es = 3,33
Zona no
rechazo
Zona de rechazo H0
H0
-1,645 -0,90 0
Hi: 1 > 2
Ho : 1 = 2
5.- Clculos del estadstico a prueba: pero antes conviene calcular el error
estndar de la diferencia.
1 - 2
Z=
E s ( dif)
Es(dif) = E1 2 E 2 2
S1 S2
E1 = E2 =
n1 n2
2,5 2,2
E1 = = 0,15625 E2 = = 0,14666
256 225
Aplicando la frmula del error estndar de la diferencia, se tiene:
Es(dif) = 0,21
55 cm - 53 cm 2 cm
Z= = = 9,523
0,21 0,21
Zona de
aceptacin H0 Zona de rechazo
H0 9,523
0 1,28
6.- Decisin: Dado que el valor de Z calculada es mayor (9,523) al valor crtico
(1,28), se puede afirmar con ms de 90% de confianza, que la diferencia entre
las dos medias comparadas, es estadsticamente significativa. Se rechaza la
Hiptesis nula.
7.- Conclusin: Se tiene evidencias para que los nios (varones) nacidos en el
Hospital Universitario, durante los ltimos aos, tienen una estatura superior a
las nias nacidas en ese centro.
256
p varones = * 100 = 53%
481
255
p hembras = * 100 = 47%
481
P = 50% Q = 50%
1 - 2
Z=
E s ( dif)
Es(dif) = E1 2 E 2 2
P * Q P * Q
Es = Es =
n1 n2
Es(dif) = 9,7656 2
11,1111 2
= 20,8767
Es(dif) =4,569
53% - 47% 6%
Z= = = 1,31
4,569 4,569
Zona de No
Zona de rechazo rechazo H0 Zona de rechazo
H0 H0
-1,96 0 1,96
X -
t=
Es
Datos:
X = 7,87 grs.
s = 1,65 grs.
n = 16 pacientes
S 1,65 1,65
Es = = = = 0,413
n 16 4
8,75 grs
7,87 0,88
6,99 grs
Conclusin: El nivel promedio de nitrgeno excretado en orina de 24
horas, para los pacientes que recibieron este tratamiento no debe ser menor de
6,99 grs. ni mayor de 8,75 grs. por 100 cc de orina, con 5% de riesgo de
equivocacin.
Hi: 25
H0: = 25
X - M
t=
Es
22 - 25
5.- Clculos de t =
Es
S 6,71 6,71
Es = = = = 2,12
n 10 3,16
-3
t = 2,12 = - 1,415
(d) (d)2
4 16
4 16
6 36
7 49
4 16
8 64
4 16
3 9
4 16
6 36
5 25
= 299
S=
S = 5,47 Grados.
Ho: 1 = 2
t=
4.- Regla de decisin: Se rechaza H0 si la t calculada es mayor de 1,8125.
5.- Clculos de t =
Es =
t=
H0 = = 0
T = [( - 0) n1/2] / S
De donde es la media estimada y S2 es la varianza estimada basada en n
observaciones aleatorias.
Concretando H1: = 0 + .
Si n suficientemente grande
para poder usar la normal,
es decir
resulta que
Comparacin de medias
La hiptesis nula
H0: = d0
Generalmente d0=0
Se quiere estudiar un posible factor pronstico del xito de una terapia, p.e.
cierto grado de albuminuria como mal pronstico en la dilisis. Los resultados de un
estudio de este tipo se pueden comprimir en una tabla 2x2 del tipo
F nF
E a b m = a+b
nE c d n = c+d
e = a+c f = b+d T
Ejemplo 6-5. En una muestra de 100 pacientes que sufrieron infarto de miocardio se
observa que 75 sobrevivieron ms de 5 aos (xito). Se quiere estudiar su posible
asociacin con la realizacin de ejercicio moderado (factor). La tabla es
F nF
E 50 25 75
nE 10 15 25
60 40 100
F nF
E 60x75/100=45 40x75/100=30
nE 60x25/100=15 40x25/100=10
Obsrvese que una vez calculado uno de los valores esperados, los
dems vienen dados para conservar los totales marginales (eso es lo que
significa que hay 1 g.l.). A partir de aqu calculamos
Rechazamos la H0 y concluimos que hay asociacin entre el ejercicio y la
supervivencia. Obviamente esta asociacin no es necesariamente causal.
ACTIVIDADES
INDIVIDUALES
Diferencia 0,7
media
COMPLEMENTARIA
Sokal, R.R. y Rohlf, F.J. 1995. Biometry, the principles and practice of
statistics in biological research. 3era edicin. W.H. Freeman and
Company. USA.
PGINAS WEB
http://www.hrc.es/bioest/M_docente.html
http://www.e-
biometria.com/ebiometria/conceptos_basicos/estimacion_estadistica.htm
COMPETENCIAS
CONTENIDOS
H0:1= 2= 3=4= 5
1=2=3
H1:1= 2
H2:1= 3
H3:1= 4
H4:1= 5
H5:2= 3
H6:2= 4
H7:2= 5
H8:3= 4
H9:3= 5
H10:4= 5
H0: 1 2 3 4 5
1 2 3
Ejemplo
N Peso (g) de los pepinos Peso (g) de los pepinos Peso (g) de los
Pepino bajo fertilizante qumico bajo abono verde pepinos bajo compost
1 300 350 360
2 310 345 365
3 320 350 360
4 295 350 365
5 300 350 355
6 325 345 360
7 290 345 350
8 310 340 355
9 300 350 360
10 320 340 365
1.- Los efectos debidos al azar as como los factores no contrastados estn
distribuidos en forma normal y la varianza originada por estos efectos es
constante a lo largo del experimento. La variable tiene distribucin normal.
.-http://www.seh-lelha.org/intervalref.htm
.-http://www.seh-lelha.org/noparame.htm
.-
http://descartes.cnice.mecd.es/Bach_HCS_2/distribuciones_probabilidad/aplic_normal.
htm
Ho: m1 = m2 = m3 = md = m
H1: m1 m2 m3 md
donde:
.
. Xij
.
. ..
.. . Xij es la j-sima observacin del i-
XC .. . simo grupo (cada dato u
XA. .. ..
.. .. observacin)
.. .. X0
. XB . .. generalXi (XA, XB, XC, XD) es la media de
. .. XD cada grupo y
. ..
.
. . X0 es la media general de todas
.
..
.. las observaciones (gran media)
. ..
.
A B. C. D grupos
. .
Por lo tanto elevando
. al cuadrado:
.
2 2 2
(Xij- X0) = (Xij - Xi) + (Xi - X0) + 2(Xij - Xi)(Xi - X0)
de donde:
(Xi - X0)2 = (Xij - Xi)2 + (Xi - X0)2 , porque la suma de los dobles
productos se anula si los grupos son independientes.
CUADRO 1
suma de cuadrados total (SCT) es la suma de los cuadrados de
2
(xij x0) los desvos de todas las observaciones respecto a su media
general. Si la dividimos por n-1 obtendremos una estimacin de
la varianza de las observaciones (S2total )
suma de cuadrados entre grupos (SC entre) es la suma de los
2
(xij xi) cuadrados de los desvos de las medias de los grupos respecto a
la media general. Si se divide por a-1 se obtiene otra estimacin
de la varianza de x (S2 entre )
suma de cuadrados dentro de grupos (SC dentro) es la suma
de los cuadrados de los desvos de las observaciones respecto a
(xij xi)2
la media de su respectivo grupo. Al dividirla por n-a se obtiene una
tercera estimacin de la varianza de x (S2 dentro)
Fuente: http://www.fvet.edu.uy/estadis/anova.htm
xij
( 0)
Prueba de F
F= X21 / X22
Pruebas a posteriori
DMS = t.S2d; donde Sd2= Si2 + Si2 siendo Si2 y Si2 las varianzas
n n
Ejemplo
N Peso (g) pepinos Peso (g) pepinos Peso (g) pepinos
PEPINO fertilizante quimico abono verde compost
1 290 350 385
2 295 345 385
3 290 350 380
4 290 350 385
5 290 350 380
6 290 345 385
7 290 345 380
8 295 340 385
9 295 350 380
10 295 340 385
(xi x x
xo)2
(xij
xi)2S23=
6,67
0
=340.50
S21=6,6
6
(xij
xo)2
S22=16, x x
94 292 346.5 383
2550.25 2352.25 4.00
2070.25 36.00 9.00
2550.25 1806.25 4.00 2550.25
4194.504.002550.25dividido entre a-1 (3-
1)4.002550.252097.254.002550.25este valor es S2
entre4.002070.259.002070.259.002070.259.0090.2512.2520.252.2590.2512.2
590.2512.2590.2512.2520.252.2520.252.250.2542.2590.2512.250.2542.25198
0.2530.251980.2530.251560.250.251980.2530.251560.250.251980.2530.2515
60.250.251980.2530.251560.250.251980.2530.2542217.50395.00dividido entre
(n-1) x adividido entre n-a (10-3)1455.7856.43este valor es S2 totaleste valor
es S2 dentro
Fcrtico= 18.6
(2,27,0.05)
1.-La prueba de ANOVA indic que se rechaza la Ho, es decir, las medias
poblacionales (estimadas a travs de las medias muestrales) de los pesos de
los pepinos cultivadas bajo diferentes tratamientos (fertilizantes) no son iguales.
En otras palabras, los pepinos cultivados bajo diferentes tratamientos no tienen
el mismo peso, en promedio.
4.- Esta experiencia indica que en este caso particular, es preferible cultivar los
pepinos con compost que con fertilizantes debido a que as se obtienen
pepinos de mayor peso. Haciendo eso adems estaramos obteniendo una
ganancia extra ya que se sabe que al cultivar con compost se minimiza la
degradacin de suelos y aguas y la afectacin negativa de personas, animales,
plantas y otros seres vivos que ocurre por el uso de fertilizantes.
Actividad individual
Seale en cual de estos casos podra utilizar un ANOVA y explique por que.
Tome en cuenta el tipo de variable para esta consideracin.
o
2Grande Mediano Mediano Mediano
M3
e
d
i
a
n
o
P
e
q
u
e
o
4Grande Grande Pequeo Mediano
P5
e
q
u
e
o
M
e
d
i
a
n
o
6Mediano Grande Grande Pequeo
P7
e
q
u
e
o
P
e
q
u
e
o
87Mediano Grande Mediano Pequeo
M8
e
d
i
a
n
o
M
e
d
i
a
n
o
9Mediano Grande Mediano Pequeo
M10
e
d
i
a
n
o
M
e
d
i
a
n
o
Grande
t
i
p
o
2
S
u
e
l
o
t
i
p
o
3
1Suelo tipo 1 50 66 50
2 55 63 55
3 54 65 52
4 50 66 50
5 53 64 51
6 52 65 49
7 57 60 50
87 54 63 48
8 53 66 51
9 55 64 50
10 53 68 49
Actividad grupal
BIBLIOGRAFA
BSICA
PGINAS WEB:
http://www.dim.uchile.cl/doc/MA34B/tablas_esta.pdf
http://www.fvet.edu.uy/estadis/anova.htm
http://www.seh-lelha.org/intervalref.htm
http://www.seh-lelha.org/noparame.htm
http://descartes.cnice.mecd.es/Bach_HCS_2/distribuciones_probabilidad/aplic_normal.
htm
http://www.e-
biometria.com/ebiometria/conceptos_basicos/ventajas_y_limitaciones_anova.htm
COMPETENCIA A LOGRAR:
CONTENIDOS:
1. REGRESIN
Que es Regresin?
2. CURVA DE AJUSTE
Segn SCHILLER 2000, con frecuencia, en la prctica se encuentra que existe
una relacin entre dos o mas variables y uno desea expresar esta relacin de
manera matemtica, planteando una ecuacin que conecte las variables.
Nube de puntos
. . .
. .. . .
. . . . . Recta ptima o de ajuste
. .. .
Valores de y
Valores de x
y = a + bx
de lo cual se obtiene
Como podemos ver tenemos dos ecuaciones con dos incgnitas por lo cual
podemos aplicar cualquiera de los mtodos conocidos, o podemos usar las
siguientes formulas
ayx =
byx =
x = a + by
Como podemos ver tenemos dos ecuaciones con dos incgnitas por lo cual
podemos aplicar cualquiera de los mtodo conocidos, o podemos usar las
siguientes formulas
ayx =
byx =
Exy =
Exy =
Exy = Sx
Exy =
Eyx = Error de estimacin de la recta de regresin de y en x
Yo= Valores observados de la variable y
Yc= Valores calculados de la variable y
N = N de pares de variables
Otro mtodo
Eyx =
Eyx = Sy
r=
x = a + by
Se usar una formula basada en el Coeficiente de Correlacin r de manera de
obtener mayor utilidad de la tabla de doble entrada
X X = (Y Y)
Donde
X = Es la variable dependiente
X = Es la media aritmtica
r = Coeficiente de correlacin
Sx y Sy son la Desviacin Estndar de cada una de las variables
X = Xa + . Icx
Donde Xa es el valor de una media arbitraria la asumir el valor del punto
medio donde la diferencia o desvi unitario sea cero. Ic x , Icy son los intervalos
de clase de cada variable
Y = Ya + . Icy
Para el calculo de la Sx
Sx = Icx ( )
Para el calculo Sy
Sy = Icy ( )
Y Y = (X X)
Y procederemos igual sustituyendo los valores respectivos
5. Actividades:
5.1. Individuales:
1. Lea detenidamente la gua y consulte otra Bibliografa recomendada
2. Escriba un ensayo sobre la correlacin y su utilidad. Consulte la
bibliografa disponible e Internet.
3. Dentro de su familia mas cercana recopile los datos de altura y peso y
calcule la recta de regresin respectiva.
6. BIBLIOGRAFA
BSICA
COMPETENCIA A LOGRAR:
CONTENIDOS:
1. CORRELACION
Qu es Correlacin?
a. Relacin causal
b. Relacin circunstancial
Hay que ser muy cuidadoso en la seleccin adecuada de las variables que
tratemos de relacionar, para evitar un mal uso de los tipos de relaciones,
descartando aquellas que se presentan contrarias al sentido comn segn
el nivel de nuestro conocimiento de la realidad.
El estudio de la correlacin tiene la importancia de permitirnos sintetizar el
nivel relacin en un solo valor: El Coeficiente de Correlacin.
3. Clasificacin de la Correlacin
Mtodo de Pearson:
r=
donde dx = x X ; dy= y Y
Sxy=
Con lo cual pudiramos construir una nueva expresin de la formula de
Pearson
r=
Incorrelacin
Cuando el Coeficiente de Correlacin es igual a cero r= 0 se dice que no
existe relacin asociacin alguna entre las dos variables consideradas.
Es decir son carente de relacin o dependencia lineal.
Ejemplo de aplicacin:
Se desea conocer:
a. Coeficiente de Correlacin por el mtodo de Pearson
b. Coeficiente de correlacin mediante el uso de las Desviaciones
Estndar
c. Coeficiente de correlacin mediante el uso de la Covarianza
d. Interpretar el coeficiente obtenido.
Solucin:
X = ; X = 17,20 Y = ; Y = 0,88
r= ; r = ; r = 0,104
Sx = ; Sx = ; Sx = ; Sx = 1,28
Sy = ; Sy = ; Sy = ; Sy= 0,575
r= ; r= ; r = 0,104
Determinamos la Covarianza
r= ; r = ; r = 0,104
r=
7. ACTIVIDADES PROPUESTAS:
Individual:
Grupal Cooperativo:
Los siguientes datos corresponden a las precipitacin promedio
mensual y las temperaturas promedio mensual en Caracas durante
algunos meses 2004.
mm. T
76 20
91 21
71 24
104 24,5
178 25
215 26
345 25,5
a. BIBLIOGRAFA
BSICA
COMPETENCIA A LOGRAR:
CONTENIDOS:
Paso 2: Encuentre la suma de los ordenes para cada una de las muestras
7. Otras aplicaciones