Академический Документы
Профессиональный Документы
Культура Документы
Problemas actuales
1
Metodologas para el procesamiento de datos en
Investigaciones Cientficas. Uso de Software
Teora - Prctica
METODOLGA DE TRABAJO
2
Se desea probar dos nuevos medicamentos A y B que van a ser
utilizado para combatir cierta enfermedad. Se tiene la sospecha que el
medicamento A hace disminuir mas los glbulos rojos que el
medicamento B durante el tratamiento y se desea verificar dicha
sospecha. Por tal motivo se seleccionaron al azar 32 animales de
laboratorio y 16 de ellos fueron tratados con el medicamento A y 16
con el medicamento B . Pasado el tiempo se hizo un conteo de
glbulos rojos
1. Caracterizar y /o describir en comportamiento de cada
muestra seleccionada.
2. A partir de la muestra inferir para la poblacin, con niveles de
confianza superior al 90%
3. Comprobar cientficamente la eficiencia de un medicamento.
Comparacin de medias
EATADSTICA UNIVARIADA
Pruebas paramtricas y No paramtricas
Se desea conocer
La dinmica del crecimiento con respecto al tiempo
Indicadores zootcnicos como son: ganancia diaria,
edad en que se produce la mxima tasa de ganancia,
peso promedio en la madurez , etc.
3
Modelacin Estadstico-Matemtica
Proceso de crecimiento
4
En un anlisis econmico de funciones de produccin versus agua
aplicada mediante regado. Se conoce cantidad total de agua aplicada
(m 2/ha) y sea la variable dependiente el rendimiento de alfalfa
(kg/ha) dadas por:
(2 000 , 8 100)(3 000, 10 000) (4 000, 13 500) (5 000, 15 010) (6 000, 16 000)
(7 000, 16 500)(8 000, 17 100)( 9 000 , 17 300) (10 000, 17 500)
Das (X) 1 3 5 7 9 11
REGRESIONES NO LINEALES
ESTADSTICA BIVARIADA
ASPECTOS METODOLGICOS A TENER EN
CUENTA EN LA MODELACIN ESTADSTICO
- MATEMTICO DE PROCESOS
5
En un experimento se estudi el comportamiento del rendimiento de
10 variedades de calabaza sometidas a 8 ambientes o condiciones
diferentes de estrs de temperatura y humedad. Los resultados se
presenta en la siguiente tabla:
Ambientes
Variedades E1 E2 E3 E4 E5 E6 E7 E8
Manual de Estadstica para proyectos de Investigacin Autor Pereyra A.M; Abbiati,N ,N; Fernndez,
E.N Universidad Nacional de Lomas de Zamora ISBN 987-9455-33-9, Argentina, ao 2004) Pg. 124
6
Se estudi el comportamiento de 18 variedades de boniato, a las que
se le evaluaron un total de 10 variables
ESTADISTICA MULTIVARIADA
REQUIEREN DE UN ANLISIS
ESTADSTICO
Observacin
MTODOS DE RECOLECCIN DE
DATOS EN UN PROCESOS DE La encuesta
INVESTIGACIN Experimentacin
7
CONTENIDOS
Papel de la Bioestadstica en las investigaciones Agrarias. Generalidades del
trabajo Estadstico. Consideraciones sobre el manejo y resumen de datos.
Estimacin y pruebas segn las escalas de medicin, metodologas Estadstico
Matemticas para el procesamiento de la informacin. Interpretacin de
resultados. Uso de software Estadstico.
Cmo ajustar datos a expresiones matemticas?. Anlisis de regresin.
Regresin lineal y no lineal. Mtodos de ajuste. Uso de diferentes ecuaciones en
la modelacin de proceso. Bondad de ajuste, criterios para la seleccin.
Discriminacin entre modelos. Aplicaciones
Modelacin estadstico-Matemtico de Procesos Biolgicos (curvas de
crecimiento animal y vegetal, curvas de lactancia, entre otros procesos).
Consideraciones prcticas de los modelos. Interpretacin de los modelos. Empleo
del clculo diferencial e integral en la bsqueda de soluciones ptimas en el
contexto descrito.
OBJETIVOS
Actualizar a los profesionales en cuanto al empleo de Mtodos
Estadsticos con el correspondiente procesamiento,
presentacin e interpretacin de los resultados en funcin de
las caractersticas propias de su objeto de estudio, con vistas a
lograr una mayor eficiencia en la actividad docente y cientfica
Investigativa.
8
EVALUACIN
REFERENCIAS BIBLIORAFIACAS
Bouxa,C.N; Sistachs Vivian. Estadstica. Teora Bsica y ejercicios.
Editorial Flix Varela, 2006
Guerra, C.W. Estadstica. Editorial Pueblo y Educacin Cuba, 1987.
Pea, D. Estadstica Modelos y Mtodos (parte I y II) Alianza
Editorial. Madrid. 2000.
Pereyra A.M; Abbiati,N ,N; Fernndez, E.N. Manual de Estadstica
para proyectos de Investigacin Autor Universidad Nacional de
Lomas de Zamora ISBN 987-9455-33-9, Argentina, ao 2004.
CONTENIDO (tpico 1)
Papel de la Bioestadstica en las investigaciones Agrarias.
Generalidades del trabajo Estadstico. Consideraciones sobre el
manejo y resumen de datos. Estimacin y pruebas segn las escalas
de medicin, metodologas EstadsticoMatemticas para el
procesamiento de la informacin. Interpretacin de resultados. Uso
de software Estadstico.
9
TRABAJO CON VARIABLE (ESTADSTICA UNIVARIADA)
Tipos de suelo
Estadstica Descriptiva
Tipo de variable? Qu dice el dato? Para que me sirve?
TIPO DE VARIABLES
CUALITATIVAS CUANTITATIVAS
(sus valoresno se pueden (sus valores son nmericos)
asociar a un nmero)
10
TRABAJO CON VARIABLE
VARIABLE? Una variable es una propiedad que puede variar y cuya variacin es susceptible de
medirse
raza
8
Diagrama de Barras de evaluaciones
6
5
Histograma
frecuencia
frecuencia
4
6
3
4 2
2 1
0
0
0 1 2 3 4 5 6
B M R
evaluac num
Tabulacin y presentacin
de datos
Nota: Hay momentos en que es conveniente codificar variables con nmeros, pero no
debemos olvidar el tipo de variable con que se esta trabajando y su significado.
11
Uso de SOFTWARE Statgraphics (versin 6.1)
EJERCICIO Estudio de la evaluacin sanitaria de una muestra de 30 pias, tres das despus de
cosechado el producto
Tabulacin y presentacin
de datos
12
EJERCICIO En una Investigacin Agraria, relacionada con la
caracterizacin de tipos y subtipos de suelos, se analizaron las 21
subregiones correspondientes al rea en estudio, obtenindose los
siguientes resultados :Leyenda :1-Pardo con Carbonatos 2-Ferralitico
Rojo Lixiviado 3-Ferralitico Rojo 4-Ferralitico Purpura 5-Ferralitico
Amarillento De una caracterizacin, teniendo en cuenta el tipo de dato.
Represente grficamente. Interprete el resultado
2, 1, 3, 3, 4, 3, 1, 4, 5, 1, 2, 5, 3, 2, 4, 3, 4, 5, 3, 4, 2.
A MODO DE EJEMPLO
MATERIALES Y MTODOS
La descripcin del tipo de suelo y subsuelo se llevo a cabo mediante el
muestreo de las 21 subregiones correspondiente al rea en estudio ubicada
al., para la caracterizacin del suelo de la regin se realiz una estadstica
descriptiva que incluy tablas de frecuencia y diagramas de barras. Para el
procesamiento de la informacin se utiliz el software.. Versin.
RESULTADOS Y DISCUSIN
El estudio realizado en cuanto a tipo de suelo mostr (tabla. 1) la
presencia de cinco tipos de suelos, donde los suelos que
mayormente prevalecen en la regin son los Ferralticos Rojos
(28.57% del total) y con menor frecuencia predominan los suelos
Pardos con Carbonatos y los Ferralticos Amarillentos (14.29 %
del total), similares resultados fueron encontrados por Garca
(2014) quien considera que esto pudiera favorecer en gran
medida ,.Se puede apreciar que
CRITERIO DEL AUTOR
13
Descripcin estadstica de una variable:
cualitativa y cuantitativa discreta
continua
Diagrama de barras: Se deja un hueco entre barras para indicar los valores que
no son posible
Histogramas:
Se utilizan para variables
cuantitativas continuas.
14
15
Descripcin estadstica de una variable
Histogramas: Conjunto de rectngulos que representa un intervalo de
agrupacin o clase.
Los Histogramas muestran la distribucin de los datos. Distribuciones
tericas de probabilidad
Prueba de
normalidad??
Estadstica Descriptiva
Variables CUANTITATIVA
Resumen de datos
Descripcin de datos
MUESTRA POBLACIN
16
Estadstica Descriptiva Estadstica Inferencial
Resume la masa de datos y los Se infieren y se toman importantes
describe. No hace conclusiones de la poblacin del
conclusiones sobre el grupo anlisis de la muestra
) n
x
Media (x ,
i
Moda (Mo)
Medidas de tendencia central x i 1
Varianza ( S2 , 2 )
Medidas de dispersin
mas Desviacin Estndar (S, )
Coeficiente de Variacin CV= S *100
X
Medidas de asimetra Coeficiente de asimetra n
(X i X ) 2
Medidas de apuntamiento Curtosis S2 i 1
n 1
n n
( X i X ) 2 (X i X) 2 ES X
S
S 2 i 1 S i 1
n
n 1 n 1
Grado de espaciamiento de En que medida se puede estar
Mide el promedio de las las observaciones con equivocado. Mientras ms
desviaciones (al cuadrado) de respecto la media pequeo sea el ES ms cerca se
las observaciones respecto a Tiene la misma dimensin esta de la media
la media que la variable Se utiliza para determinar los
intervalos de confianza
s
CV .100
x Teorema: Si se extraen repetidamente muestras
Medida de dispersin relativa aleatorias de tamao fijo n de una poblacin
Permite adems comparar
conjuntos de observaciones con
que tiene media y desviacin tpica . La
respecto a su dispersin distribucin resultante de las medias ser
aproximadamente normal con media y
S
desviacin tpica n (error tpico o estndar
X
17
Estadstica Descriptiva
medidas de dispersin ?
VENTAJA:
Normal Distribution Medida de tendencia central ms importante, es fcil de calcular, se
Normal Distribution
0,24 entiende rpidamente 0,6
MEDIA 0,2 0,5
0,16 DESVANTAJA: Est afectada por los valores extremos y por consiguiente puede
density
0,4
density
0,12 estar muy lejos de ser una representacin 0,3de la muestra.
0,08 0,2
0,04
0,1
x
n
Median = 5,0 Median2= 5,0
Mode = 5,0 i ( X i Mode
X ) = 5,0
12
Variance = 3,5 ikg
x S i 1 Variance = 0,5 kg2
Standard deviation = 1,87 kg.
Standard error = 0,83666
n n 1
Standard deviation = 0,70 kg.
Standard error = 0,316228
Skewness = 1,14541 Skewness = 0,0
Stnd. skewness = 1,04561 Stnd. skewness = 0,0
Coeff. of variation = 37,4166% Coeff. of variation = 14,1421%
Simtrica respecto a x=
Segn sea habr mayor o menor
concentracin de los datos respecto al
valor central ()
p X 68.27 %
p 2 X 2 95.45 %
p 3 X 3 99.73 %
18
Matriz de datos
Ejercicio
En una investigacin Agropecuaria se desea analizar el rendimiento
de cierta variedad de maz teniendo en consideracin cuatro tipos de
suelos diferentes (c.suelo, vermicompost, 1/3, 1/4) . Por tal motivo se
realizaron estudios previos, donde se observ la longitud del tallo
(en cm) de estas plantas al cabo de los 21 das, para un total de 120
observaciones (30 observaciones por tipo de suelo).
Pregunta 1Se desea caracterizar los grupos con los diferentes tipos
de suelo?.
DISEO
v.a Longitud del tallo (continua)
C. suelo
19
Algunos conceptos bsico
MATERIALES Y MTODOS
El anlisis del rendimiento del maz, requiri de un estudio preliminar que
consisti en medir la longitud del tallo de las plantas (en cm) a los 21 das de
germinadas, las mediciones se realizaron a partir del diseo utilizado
(DESCRIBIR EL DISEO) ---------por lo que se tuvo en cuenta los cuatro tipos
de suelos diferentes (C. suelo, vermicompost, 1/3 y 1/4). Se tomo un total de
l20 plantas (30 observaciones por tratamiento). Para la caracterizacin de la
variable se utiliz una estadstica descriptivita que incluyo medidas de
tendencia central y dispersin. Para el procesamiento de la informacin se
utiliz el software.. Versin.
20
Caracterizar el comportamiento de la longitud del tallo teniendo en cuenta el
tipo de suelo. Que herramientas estadsticas utiliz en este anlisis. ?Cul
grupo de observaciones result ms variable?. Fundamente su respuesta.
RESULTADOS Y DISCUSIN
En la tabla 1 se observa que las longitudes promedios del tallo oscilaron entre 4, 96 cm
y 7,37 cm, con errores estndar inferiores a 0,29cm, estos resultados . Por
otra parte el grupo que present menor variabilidad fue el relacionado con el suelo
vermicompost con Coeficientes de Variacin de 9,24% esto pudiera estar explicado
Estadstica Inferencial
Parmetros: Indicador constante que caracteriza la poblacin
Estadgrafos: Es una funcin de n valores muestrales
1-
cercanos a 1
Muestra Poblacin 0.90
0.95
0.99
Probabilidad
Estimacin
puntual
x s p
~ p
...
p I x
Estimacin s
intervalo t n 1 1
n 1 2
de
ES percentil Nivel de
confianza confianza
21
p I x
s
t n 1 1
n 1 2
5.24 0.240721 * 2.04
5.24 0.491
5.24 0.491 ; 5.24 0.491
4.75 ; 5.73
t n 1 t029
.975 2.04
1
2
22
MATERIALES Y MTODOS ------ RESULTADOS Y DISCUSIN
Muestras Independientes
Lenguaje estadstico
H 0 : cs sv H 0 : cs sv
H1 : cs sv
H1 : cs sv
23
Estimacin y dcima de medias
Anlisis de Varianza (ANOVA)
Quin es H0 y H1?
H0: Hiptesis nula (estn los valores de probabilidad que pertenecen a H 0)
H1: Hiptesis alternativa
TOMA DE DECISIONES
H0 CIERTA H0 FALSA
2
2 2 2
24
Definiciones y axiomas de PROBABILIDAD se tiene que:
P A 0,1
v.a.d P A 0,1
f (t)dt 1
v.a.c
( P( x)
x
F (t ) P ( x t )
x t
2 2
2 2
H 0 : A B H 0 : A B H 0 : A B
H1 : A B H1 : A B H1 : A B
25
COMPARACIN DE MEDIAS
H 0 : A B
H1 : A B
Estadgrafo
xy Marca la Regin de
Tcalculada rechazo
(n1 1) S12 (n2 1) s22
n1 n2 2
1 1
n1 n2
Ttabulada T1n1 n2 2
Probabilidad
26
H 0 : A B nivel de
confianza?
H1 : A B 1- = 0.95
T tabulada T calculada
xy
n1 n2 2 3030 2 T
t1 t 0.95 (n1 1)S (n 2 1)s 22
2
1 1
1
n1 n 2 2 n1 n 2
t058.95 1.64 5.2433 7.3733
T 7.864
(30 1) 1.7384 (30 1) 0.46478 1 1
30 30 2 30 30
Rechazo de H0 STATGRAPHIS
Se estima con un 95% de confianza que existe diferencias significativas entre las
longitudes promedios de los tallos, analizados en estos dos tipos de suelo.
H 0 : A B
H1 : A B
27
p rechazar H 0 / H 0cierta entonces rechazo a H 0
0.0000
Rechazo a H0
0.05
H0 : A B
H1 : A B
Se estima con un 95% de confianza que existe diferencias significativas entre las
longitudes promedios de los tallos, analizados en estos dos tipos de suelo.
EJERCICIO (Equipo 2)
28
Equipo 1 Existir diferencias estadsticamente significativas entre la longitud
promedio del tallo alcanzada en las plantas sembradas en C,suelo y S.
1/3?
H 0 : A B
H1 : A B
t058.95 1.64
0.5876
??
NO Rechazo a H0
0.05
H0 : A B
H1 : A B
29
Equipo 2
Existir diferencias estadsticamente significativas entre la longitud promedio del
tallo alcanzada en las plantas sembradas en S y S. 1/3?
H 0 : A B
H1 : A B
t058.95 1.64
0.2965
??
NO Rechazo a H0
0.05 H0 : A B
H1 : A B
Se estima con un 95% de confianza que NO existe diferencias significativas entre la
longitud promedios de los tallos al ser sembrados en estos dos tipos de suelos.
RESUMEN
30
Existir diferencias estadsticamente significativas
entre la longitud promedio del tallo, al ser
sembradas en cuatro tipos de suelos diferentes?
En caso de existir diferencia Cules
difieren?????
Anlisis de Varianza
Cmo comparar dos
o ms poblaciones? ANOVA
ANOVA SIMPLE
Fundamento terico del
ANOVA DOBLE
Anlisis de Varianza ANOVA MULTIFACTORIAL
31
Variacin Total = Variacin entre niveles + Variacin dentro de niveles
MEDIA GENERAL
32
eij yij yi
I ni
SC error ei2
i 1 j 1
I ni
ij2 2,243332 (1,94333) 2 .... 0,162 192,631
SC error e
i 1 j 1
Ftab F1 I 1; n I F03.95
; 119
2.68
33
H 0 : 1 2 3 4
H 1 : Al menos dos i difieren Dos vas para decidir
Estadgrafo
Yi i ei P-valor
FACTOR SUELO
34
ANOVA
Cules difieren?????
35
Interpretacin de resultados??
Ambientes
E1 E2 E3 E4 E5
36
Modelo que describe la informacin
Yij i eij
H 0 : 1 2 3 4 5
H1 : Al menos dos i difieren
Yi i ei
37
H 0 : 1 2 3 4 5
H1 : Al menos dos i difieren
Cules difieren???????????
38
MATERIALES Y MTODOS
Se utiliz un diseo completamente aleatorizado, y se observ el
rendimiento (t/ha) bajo cinco tipos de ambientes diferente
(DESCRIBIR LOS AMBIENTES), se realizaron seis replicas por
tratamiento para un total de 30 observaciones. Para caracterizar en
rendimiento en cada ambiente se utiliz una estadstica descriptica
(media , error estndar y coeficiente de variacin) y se realiz un
Anlisis de Varianza (ANOVA) simple para comparar los rendimientos
promedios, as como la docima de Duncan en caso de diferencias
significativas. Para el procesamiento de la informacin se realiz
mediante el software
RESULTADOS Y DISCUSIN
ANOVA SIMPLE
ANOVA DOBLE
ANOVA MULTIFACTORIAL
Suponga que se desea analizar la altura a los 21 das de sembrado de cierta variedad
de maz (cm), teniendo en consideracin los cuatro tipos de suelos y tres sistemas de
riego, y se disponen de 10 observaciones por combinacin de tratamientos, el resto
de las condiciones del experimento son homogneas.
De acuerdo a esta problemtica, Que anlisis y herramientas usted empleara para
caracterizar, describir y comparar los resultados alcanzados?
Yij i j eij
39
Tipo de riego Tipos de suelos
Csuelo vermicompost 3 1/3 4 1/4
RAs 3 8 5,9 6,2
3,3 8 6,4 6,3
4,1 8 2,4 6,2
4,6 8 4 4,1
7 8,3 5,1 4
6,4 7,3 4,6 2,2
4,2 8 6,2 6,6
4 7,7 6,3 6,4
5 7,3 5,9 6,7
4,3 7,1 6,4 4,3
ANOVA MULTIFACTOR
Cmo procesar la
informacin??
40
En una investigacin Agropecuaria se desea analizar el rendimiento de cierta
variedad de maz teniendo en consideracin cuatro tipos de suelos diferentes
(c.suelo, vermicompost, 1/3, 1/4) . Por tal motivo se realizaron estudios
previos, donde se observ la longitud del tallo (en cm) de estas plantas al cabo
de los 21 das, para un total de 120 observaciones (30 observaciones por tipo
de suelo).
Equipo 1 C. suelo
v.a Longitud del
Equipo 2 S. vermicompost
tallo
Equipo 3 1/3
v.a. continua
Equipo 4 1/4
FACTOR RIEGO
H 0 : RAs RA RL
H1 : al menos dos difieren
41
Factor riego
0.467 < 0.05
NO existen diferencias
significativas en al menos
dos alturas promedios
debido al factor riego
Factor suelo
42
Interaccin entre los factor riego y suelo
43
Comparar medias en cuatro poblaciones
ANOVA SIMPLE
H 0 : P 2 P 5 P 8 P10
H1 : Al menos dos i difieren
Yi i ei
H 0 : P 2 P 5 P 8 P10
H1 : Al menos dos i difieren
Existen diferencias significativas entre al menos dos promedios de cantidad de L/min que
se obtienen debido a los diferentes niveles de presin
44
Cules difieren????
45
Situacin problmica
Yij i j eij
de aplicar el T1 T2 T3 T4 T5
BLOQUE
diseo F
E I 0,9 2,3 3,6 2,7 0,5
R
v,a. rendimiento (t/ha)
T
I
II 1,4 1,8 3,2 2,3 3,6
L
I III 1,4 2,3 4,5 2,3 2,7
F
A IV 2,3 2,3 4,1 1,9 0,9
D
46
T1 T2 T3 T4 T5
BLOQUE
H 0 : T 1 T 2 T 3 T 4
H1 : Al menos dos i difieren
47
observ C,suelo S.vermicompost tall 1/3 tall 1/4
1 3 8 5,9 6,2
2 3,3 8 6,4 6,3
3 4,1 8 2,4 6,2
4 4,6 8 4 4,1
5 7 8,3 5,1 4
6 6,4 7,3 4,6 2,2
7 4,2 8 6,2 6,6
8 4 7,7 6,3 6,4
9 5 7,3 5,9 6,7
10 4,3 7,1 6,4 4,3
11 4,6 6,6 2,4 4,4
12 5,1 6,2 4 2,5
13 5,5 6,5 5,1 2,6
14 6 7,2 4,6 6,2
15 6 8 6,2 6,3
16 5 8 6,3 6,2
17 5,3 8 5,9 4,1
18 5,1 8 6,4 4
19 3 8,3 2,4 2,2
20 7,3 7,3 4 6,6
21 7,5 8 5,1 6,4
22 5,3 7,7 4,6 6,7
23 5,8 7,3 6,2 4,3
24 5,9 7,1 6,3 4,4
25 6 6,6 6,5 2,5
26 7 6,2 5,2 2,6
27 7,6 6,5 5,5 6,9
28 3,2 7,2 6,3 6,8
29 6 6,5 2,5 5,3
30 4,2 6,3 6,3 4,8
48
49