Вы находитесь на странице: 1из 37

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA CENTRO UNIVERSITARIO DE SUR OCCIDENTE MAZATENANGO SUCHITEPQUEZ ESTADISTICA DR.

MARCO ANTONIO DEL CID FLORES

TEXTO PARALELO

BYRON MARINO MORALES PINEDA 201040355 TECNICO EN ALIMENTOS 3ER. CICLO 05/05/11

INTRODUCCION El siguiente trabajo es un texto paralelo o digital el cual contiene la informacin sobre las notas que el alumno del tercer semestre de ingeniera en alimentos ha hecho durante el curso de estadstica, el cual contiene todo el contenido, hojas de trabajo, exmenes parciales y cortos, ejercicios, graficas, etc. lo cual usted podr leer a continuacin.

ESTADSTICA Es el conjunto de tcnicas orientadas a la recoleccin, tabulacin, graficacion, anlisis e interpretacin de datos y la toma de decisiones razonables a partir de los mismos. La estadstica se divide en 3 fases: Estadistica descriptiva, inferencial y diseo estadstico. La estadstica descriptiva se responsabiliza de recolectar, tabular y graficar valores. La estadstica inferencial se encarga de estudiar pequeos grupos llamados muestras y generalizar esos resultados hacia toda la poblacin. El diseo estadstico recibe tambien el nombre de diseo experimental y consiste en la comprobacin y desarrollo de pruebas de hiptesis para lograr un crecimiento significativo de la produccin en base a la investigacin. Se llama poblacin al total de individuos o cosas por el cual se tiene inters de investigacin. Se le llama muestra a una parte representativa de una poblacin. Para que la muestra sea representativa es necesario que tenga un tamao adecuado y que cualquiera de los elementos de la poblacin tenga la oportunidad de formar parte de la muestra. MEDIDAS DE CENTRALIZACION Son parmetros o estadsticos que permiten agrupar en un solo valor central las caractersticas generales de una poblacoin o de una muestra. Se llama parmetro a todo dato que se obtiene de una poblacin. Se llama estadstico a todo dato que se obtiene de una muestra. Las medidas de centralizacin reciben tambien el nombre de medidas de sentencia central. Para valores sin agrupar las mas utilizadas son: media aritmtica, mediana, moda, media cuadrtica, media aritmtica y media geomtrica. Media aritmtica Se le llama tambien promedio o promedio aritmtico. Es la ms utilizada de las medidas de sentencia central pero presenta el inconveniente que se deja influenciar por valores extremos. Cuando se obtiene de una poblacin su smbolo es y cuando se obtiene de una muestra su smbolo es . Su frmula es: Mediana Es el valor central o el promedio de los 2 valores centrales en una serie ordenada de datos. Moda Es el valor que mas se repite en una serie de datos. Cuando no existe moda la serie es amodal, cuando hay una moda la serie es unimodal, cuando existen 2 modas la serie es bimodal y cuando hay mas de 2 modas la serie es polimodal o multimodal. Media cuadrtica Se define como la raz cuadrada del promedio cuadrtico de los valores.Su formula es:

Media armnica Se define como la resultante del total de datos entre la sumatoria de recprocos. Su frmula es:

Media geomtrica Se define como la ensima raz del producto de los valores. Su frmula es: EJEMPLO Para los valores: 16, 18, 20, 19, 15, 17, 23, 18, 19, 20, 19, 23, 19 Calcule: y clasifique a la serie de datos de acuerdo a su moda. = Md = 15, 16, 17, 18, 18, 19, 19, 19, 19, 20, 20, 23, 23 = 19 Mo = 15, 16, 17, 18, 18, 19, 19, 19, 19, 20, 20, 23, 23 = 19 = 18.92 , Md, Mo, Mc, Ma, MG

Mc =

= 19.05

Ma =

= 18.66

= 18.79

MG =

La serie es unimodal TAREA Para los valores: 26, 25, 29, 33, 40, 29, 27, 28, 30, 28 Calcular: clasifique a la serie de datos de acuerdo a su moda. = = 29.5 , Md, Mo, Mc, Ma, MG y

Md = 25, 26, 27, 28, 28, 29, 29, 30, 33, 40 = Mo = 25, 26, 27, 28, 28, 29, 29, 30, 33, 40 = 28, 29

= 28.5

Mc =

= 29.78

Ma =

= 29.02

= 29.25 La serie es bimodal

MG =

MEDIDAS DE DISPERSION Se les llama tambin medidas de variabilidad. Son parmetros o estadsticos que expresan la variacin que existe entre los datos y la media aritmtica. Las medidas de dispersin mas importantes son: rango, desviacin media, varianza, desviacin estndar y coeficiente de variacin. Rango Se le llama tambien recorrido o amplitud general. Su formula es: R = Dato mayor Dato menor Desviacin Media Se define como el promedio de diferencias absolutas que existe entre los datos y la media aritmtica. Su frmula es: DM = Varianza Se le llama tambin variacin. Es el promedio de diferencias cuadrticas que existe entre los datos y la media aritmtica. Su frmula es: S = Desviacin estndar Se le llama tambin desviacin tpica. Se define como la raz cuadrada del promedio de diferencias cuadrticas que existe entre cada dato y la media aritmtica. Su frmula es: S = Cuando se conoce la varianza basta con sacarle raz cuadrada para obtener la desviacin estndar. Coeficiente de variacin Su formula es: CV = ( ) 100
2

Es la mas importante de las medidas de variacin pues expresa el grado de representatividad de la media aritmtica. Si el coeficiente de variacin es menor que 16.67% la media aritmtica tiene alta representatividad. Si el coeficiente de variacin esta entre 16.67% y 25% tiene baja representatividad y si el coeficiente de variacin es mayor que 25% la media aritmtica carece de representatividad.

EJEMPLO Para los valores: 15, 15, 18, 14, 13, 20, 18, 22 Calcule: R, DM, S , S, CV e indique el grado de representatividad de R = 22 13 = 19 =
2

= 17 = 2.5 = 8.25 = 2.87

DM =

S = S=

CV = La

) x 100 =

16.88%

tiene baja representatividad

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSION PARA VALORES AGRUPADOS Cuando se dispone de ms de 30 datos es necesario organizar los datos en grupos llamados intervalos o clases. Al ancho de cada intervalo se le da el nombre de amplitud y al nmero de casos que corresponde a cada intervalo se le llama frecuencia. El nmero de intervalos es una decisin de quien va a tabular los datos. Se recomienda utilizar de 6 a 15 intervalos. Cuando se utilizan menos de 6 intervalos la informacin queda demasiado condensada y puede llegarse a conclusiones que no son validas para la investigacin. Por el contrario si se utilizan ms de 15 intervalos no se cumple con el propsito real de agrupamiento de valores que es reducir tiempo y esfuerzo en el anlisis y tabulacin de los datos. Al centro de cada intervalo se le llama punto medio, centro de clase o marca de clase. TAREA Para los valores: 14, 17, 15, 19, 20, 16, 18, 22, 23, 20, 19 Calcule: R, DM, S , S, CV e indique el grado de representatividad de R = 23 14 = 9 =
2

= 18.45 = 2.23 = 7.15


= 2.67 CV = (

DM =
2

S = S=

) x 100 = 14.47

La

tiene alta representatividad

EJERCICIOS Agrupar en 7 intervalos: 45 56 77 68 44 62 59 63 77 81 38 79 51 66 78 69 76 80 44 61 76 36 68 47 42 61 72 47 70 38 65 50 48 62 72 56 56 48 55 43 38 61 70 47 56 70 41 75 70 67 66 61 60 47 68 72 47 44 67 83 77 63 77 70 66 60 50 60 62 63 77 79 65 79 63 63 68 70 52 47 76 72 70 47 74 68 39 43 37 68 53 63 48 61 83 82 60 47 68 39 47 60 63 58 63 60 28 65 56 93 58 72 60 61 57 49 63 47 69 79 14 73 42 60 71 63 78 67 49 50 73 63 80 55 65 52 48 37 47 60 70 61 47 47 77 62 47 70 60 61 42 44 60 40 48 72

Intervalo 27.5 36.5 36.5 45.5 45.5 54.5 54.5 63.5 63.5 72.5 72.5 81.5 81.5 90.5 90.5 99.5

Frecuencia 2 17 32 44 35 22 3 1 156

R = 93 28 = 65 Agrupar en 8 intervalos: 48 52 63 77 69 38 65 70 46 38 55 56 82 63 70 63 58 62 61 62 60 61 36 38 62 49 63 77 76 79 62 78 58 61 60 53 58 60 68 63 73 66 47 60 53 77 62 47 40 88

amplitud =

= 65/7 = 9.29 9

63 52 60 56 61 47 60 56 48 48

69 60 73 52 57 54 59 58 52 62

47 47 65 45 60 72 63 62 56 73

68 60 59 47 60 47 39 70 60 65

36 75 62 49 70 66 64 53 49 72

65 72 68 47 69 86 75 63 49 60

Intervalos 35.5 - 42 42 - 48.5 48.5 - 55 55 - 61.5 61.5 - 68 68 - 74.5 74.5 - 81 81 - 87.5 87.5 - 94

Frecuencia 7 13 13 27 26 13 8 2 1 110

R = 88 36 = 52 Agrupar en 7 intervalos: 56 83 72 81 63 76 59 78 85 47 60 28 37 45 52 63 70 63 51 66 51 45 55 63 77 63 57 68 66 74 72 37 68 47 63 59 62 50 70 85 49 62 66 63 70 68 70 40 49 69

amplitud = 52/8 = 6.5

60 59 77 47 55 51 53 60 54 47

61 60 63 80 46 64 46 65 60 78

77 62 63 71 62 57 81 78 60 49

63 63 63 71 62 57 81 78 60 63

42 58 61 47 77 63 81 76 47 77

57 63 71 44 39 83 77 66 54 61

Intervalos 27.5 35.5 35.5 43.5 43.5 51.5 51.5 59.5 59.5 67.5 67.5 75.5 75.5 83.5 83.5 91.5

F 2 7 19 15 33 13 18 3 110

Xi 31.5 39.5 47.5 55.5 63.5 71.5 79.5 87.5

FXi 63 276.5 902.5 832.5 2095.5 929.5 1431 262.5 6793

Fa 2 9 28 43 76 89 107 110

F(xi- ) 1820.12 3465.44 3858.19 585.94 101.06 1235.81 5671.12 1989.19 18,736.87

R = 87 28 = 59

amplitud = 59/7 = 8.43 8

= Donde:

= 6793/110 = 61.75

MD = Li + (

)xi

Li = lmite inferior del intervalo que tiene la mitad de los datos 110/2 = 55 Li = 59.5

J = n/2 Fac del intervalo anterior J = 55 43 = 12 W = Frecuencia absoluta del intervalo donde est la mitad de datos n/2 = 55 i = amplitud = 8 MD = 59.5 + ( ) x 8 = 62.41 W = 33

Mo = Li + ( Donde:

)xi

Li = Limite inferior del intervalo que tiene la mayor frecuencia Li = 59.5 1 = mayor F F anterior = 33 15 = 18 2 = mayor F F posterior = 33 13 = 20 i = amplitud Mo = 59.5 + ( ) x 8 = 63.29

Medidas de dispersin
2

S = S= =

= = 13.05

= 170.34

CV = ( ) X 100 = ( La

) X 100 = 21.13%

tiene baja representatividad.

MEDIDAS DE POSICIN O FRACTILOS Son medidas que permiten determinar la posicin que ocupa un valor en una serie de datos. Los fractilos mas importantes son: a) cuartilos o cuartiles, b) decilos, d) centilos. Los cuartiles dividen la serie en 4 partes, los deciles en 10 partes y los centiles o porcentiles en 100 partes. El segundo cuartil, quinto decil y quincuagsimo porcentil tienen el mismo valor de mediana. El ultimo cuartil, ultimo decil y ltimo porcentil tienen como valor el lmite superior del ltimo intervalo, las formulas a utilizar son las siguientes:

Qx = Li + (

)xi

Dx = Li + (

) xi ) xi
EJEMPLO

Cx = Li + (

Para los valores: Intervalo 2.5 7.5 7.5 12.5 12.5 17.5 17.5 22.5 22.5 27.5 27.5 32.5 32.5 37.5 F 8 15 20 60 26 20 5 154 Fac 8 23 43 103 129 149 154

Encuentre: Q1, Q2, Q3, y Q4 Encuentre: D3, D6 y D8 Q1 = 12.5 + ( ) x 5 = 16.68 D3 = 17.5 + ( Q2 = 17.5 + ( ) x 5 = 20.33 ) x 5 = 17.77

D6 = 17.5 + (

) x 5 = 21.52

Q3 = 22.5 + ( Q4 = 37.5

) x 5 = 24.9

D8 = 22.5 + (

) x 5 = 26.38

Encuentre: C23, C64 y C85 C64 = 17.5 + ( C23 = 12.5 + ( ) x 5 = 15.6 C85 = 27.5 + ( ) x 5 = 27.98 ) x 5 = 22.13

HOJA DE TRABAJO Para los valores: Intervalo 22.5 33.5 33.5 44.5 44.5 55.5 55.5 66.5 66.5 77.5 77.5 88.5 88.5 99.5 99.5 110.5 110.5 121.5 Frecuencia 16 23 30 38 125 56 22 20 12 342 Fac 16 39 69 107 232 288 310 330 342

Calcular: Q1, Q3, Q4, D2, D5, D8, C45, C64, C93

Q1 = 55.5 + (

) x 11 = 60.28

Q3 = 77.5 + (

) x 11 = 82.31

Q4 = 110.5 + (

) x 11 = 121.5

D2 = 44.5 + (

) x 11 = 55.28

D5 = 66.5 + (

) x 11 = 72.13

D8 = 77.5 + (

) x 11 = 85.67

C45 = 66.5 + (

) x 11 = 70.63

C64 = 66.5 + (

) x 11 = 76.34

C93 = 99.5 + (

) x 11 = 103.93

GRAFICAS ESTADISTICAS Constituyen representaciones estticas de las series de valores. Existen graficas estadstica para variables cualitativas y para variables cuantitativas. Se llama variables cualitativas a aquellas que expresan atributos o cualidades y por tanto son caractersticas que no pueden presentarse numricamente. Las variables cuantitativas son caractersticas que se pueden expresar en forma numrica. Las graficas para variables cuantitativas son: a) Polgono de frecuencias absolutas Para construir esta grafica se anotan en el eje horizontal los puntos medios de los intervalos y en el eje vertical la respectiva frecuencia absoluta. Cuando el primer intervalo no inicia en 0 la grafica debe estar cortada. Despus de encontrar la posicin en donde coincide el punto medio y su frecuencia se hace lneas rectas para unir esos puntos. Esta grafica inicia en el eje horizontal a partir del lmite inferior del primer intervalo con una lnea punteada dirigida al punto que corresponde a la primera frecuencia. A partir del ltimo punto se traza una lnea punteada dirigida al lmite superior del ltimo intervalo. En todas las graficas estadsticas por cuestiones de esttica la altura debe ser entre 60 y 75% de la base. b) Polgono de frecuencias relativas porcentuales El procedimiento para construir esta grafica es similar al utilizado en la construccin del polgono de frecuencias absolutas, con la diferencia que en el eje vertical en lugar de colocar las frecuencias absolutas se anotan las frecuencias relativas porcentuales. c) Polgono de frecuencias acumuladas (ojiva de galdo) Es una grafica utilizada para expresar crecimiento, se diferencia de las anteriores en que en el eje vertical se escribe la frecuencia acumulada; adems, no surge del eje horizontal, sino que surge del eje vertical a partir de la primera frecuencia; otra diferencia es que, no desciende al eje horizontal y se queda en el aire. d) Histograma de Pesaron Se diferencia de los polgonos en lo siguiente: a) En el eje horizontal en lugar de escribir los puntos medios, se escriben los lmites de cada intervalo. b) No se construye mediante lneas irregulares pues consiste en una serie de rectngulos. EJEMPLOS Para los valores: Intervalo F 4.5 9.5 6 9.5 14.5 12 14.5 19.5 15 19.5 24.5 27 24.5 29.5 16 29.5 34.5 9 34.5 39.5 4 89

Xi 7 12 17 22 27 32 37

F.R.P. 6.74% 13.48% 16.85% 30.34% 17.98% 10.11% 4.5% 100%

Fac 6 18 33 60 76 85 89

Construya: a) Un polgono de frecuencias absolutas

b) Un polgono de frecuencia relativa porcentual

c) Polgono de frecuencia acumulada

d) Histograma de Pesaron

GRAFICAS PARA VARIABLES CUALITATIVAS Las graficas ms importantes para variables cualitativas son: a) Diagramas de barras verticales Para construir esta grafica se escribe en el eje vertical las frecuencias absolutas y en el eje horizontal las respectivas categoras o cualidades. Entre cada categora se deja un espacio igual al ancho utilizado para cada categora. La grafica consiste en una serie de rectngulos que se pintan de colores. b) Diagramas de barras horizontales El procedimiento para construir esta grafica es similar al de la grafica anterior con la diferencia que en el eje vertical se colocan las categoras y en el horizontal se escriben las frecuencias. c) Diagrama de sectores Se le llama tambin pie, diagrama de pastel o diagrama circular. Para construir esta grafica se construye una tabla con la categora, la frecuencia absoluta y una tercera columna en donde se multiplica la frecuencia por 360 y se divide entre el total de datos. EJEMPLO Departamento de origen Suchitepquez Escuintla Guatemala Retalhuleu Quetzaltenango Jutiapa F 20 2 5 4 1 1 33 Grados 218.18 21.82 54.54 43.64 10.91 10.91 360

ANLISIS DE REGRESIN Y CORRELACION Es un procedimiento estadstico que se utiliza cuando se desea establecer una relacin de dependencia entre 20 o ms variables cuantitativas. Cuando solo participan, una variable independiente y una variable dependiente, el anlisis de regresin y correlacin es simple. Cuando participan 2 o ms variables independientes y una variable dependiente el anlisis de regresin y correlacin es mltiple. Se llama correlacin a la relacin que se da entre 2 o ms variables. Se llama regresin a la fuerza o intensidad con que se relacionan las variables. La variable dependiente es aquella cuyo comportamiento depende del comportamiento de otras variables. Se llama variable independiente a aquella cuyos valores dependen de si misma y no estn condicionados por el comportamiento de otra variable. EJEMPLO Para los valores: x 15 18 20 19 23 22 19 20 = 156 y 23 22 24 20 23 25 22 24 183 xy 345 396 480 380 529 550 418 480 3578 x 225 324 400 361 529 484 361 400 3084
2

y 529 484 576 400 529 625 484 576 4203

Encuentre el coeficiente de correlacin lineal

=
= 0.36

EJERCICIO x 20 16 21 17 22 23 19 = 138 y 23 24 25 26 27 20 21 166 xy 460 384 525 442 594 460 399 2760 x 400 256 441 289 484 529 361 2760 =
2

y 529 576 625 676 729 400 441 3976

yc 23.65 24.53 23.43 24.31 23.21 22.99 23.87 165.99 =

(y-yc) 0.42 0.28 2.46 2.86 14.36 8.94 8.24 37.56

(y- ) 0.5 0.08 1.66 5.24 10.82 13.76 7.34 39.4

(yc- ) 0 0.67 0.08 0.36 0.25 0.52 0.03 1.91

= -0.22

Tipo de correlacin Existe correlacin negativa dbil Encuentre la ecuacin de regresin m= = -0.22

b=

= 28.05

yc = -0.22x + 28.05 Lnea de regresin

Error estndar de estimacin s = Variacin total St= Variacion explicada S E = (yc- ) = 1.91 Variacion no explicada S ne = (y-yc) = 37.56
2 2 2 2 2

= 5.37

= 166/7 = 23.71

S t = 39.4

HOJA DE TRABAJO x 13 15 17 19 18 19 23 24 = 148 y 17 19 20 22 23 22 24 26 173 xy 221 285 340 418 414 418 552 624 3272 x 169 225 289 361 324 361 529 576 2834
2

y 289 361 400 484 529 484 576 676 3799

yc 17.555 19.035 20.515 21.995 21.255 21.995 24.955 25.695 173

(y-yc) 0.31 0 0.265 0 3.045 0 0.91 0.09 4.62

21.39 6.89 2.64 0.14 1.89 0.14 5.64 19.14 57.87

16.56 6.71 1.23 0.14 0.14 0.14 11.09 16.56 52.57

Coeficiente de correlacion

=
Ecuacion de regresin m= = 0.74 b=

= 0.96

= 7.935

yc = 0.74x + 7.935 Lnea de regresin Error estndar de estimacin S = 4.62/8 = 0.58 Variacion total S t = 57.87 Variacion explicada S E = 52.57 Variacion no explicada S ne = 4.62
2 2 2

ANALISIS DE REGRESION Y CORRELACION MULTIPLE Este procedimiento estadstico se utiliza cuando se quiere establecer una relacion de dependencia entre variables cuantitativas y se disponen de una variable dependiente y una o mas variable independientes. x1 17 18 20 22 23 = 21 x2 20 16 18 20 22 20 y 20 23 24 25 26 27 x1y 340 414 480 550 598 504 x1x2 340 288 360 440 506 420 x2y 400 368 432 500 572 480 yc 20.03 22.77 24.05 25.33 25.55 24.27
2

289 324 400 484 529 441

400 256 324 400 484 400

(y ) 13.47 0.45 0.11 1.77 5.43 0.11

(yc ) 13.23 0.81 0.14 2.76 3.53 0.36

(y yc 0 0.05 0 0.11 0.20 0.07

)2

yc = a + bx1 + cx2 y = na + bx1 + cx2

yx1 = ax1 + bx1 + cx1x2 yx2 = a x2 + bx1x2 + c x2


2

142 = 6a + 121b + 116 2886 = 121a + 2467b + 2354c

121 -6 -134 = -161b 88c

142 = 6a + 121b + 116c 2752 = 116a + 2354b + 2264c

58 -3 -5 = 11b 16c

-134 = 161b 88c -5 = 11b 16c

-11 161 669 = 1608c

c = 669 / 1608 = -0.42 b = -5 16 (-0.42) / -11 = 1.06 a = 142 (128.26 48.72) / 6 = 10.41

Ecuacin de regresin yc = 10.41 + 1.06x1 - -0.42x2 s t = 21.34 = y / n = 142 / 6 = 23.67 S n = 20.86 S ne = 0.43
2 2 2

Coeficiente de correlacin / 21.34 = 0.99

Que tipo de correlacin existe? Existe correlacin positiva fuerte S = 0.43 / 6 = 0.07

DISTRIBUCION NORMAL El comportamiento estadstico de los datos en una investigacin siempre obedece al modelo de una distribucin normal; es decir existirn algunos pocos datos bajos, la mayora de valores intermedios y pocos datos altos. La figura que mejor representa a esta distribucin recibe el nombre de curva normal o campana de Gauss. Las caractersticas principales de la curva normal son las siguientes. 1. Posee simetra bilateral; lo cual significa que al lado derecho del eje central de la curva normal se encuentra el 50% de los datos y al lado izquierdo se encuentra el otro 50%. 2. En el eje central convergen todas las mediadas de tendencia central. 3. La curva normal es asinttica; es decir tiende a acercarse hacia el eje horizontal pero jams llega a unirse a l. 4. Existen curvas normales tres desviaciones estndar positivas y tres desviaciones estndar negativas. 5. A menos una desviacin estndar se encuentra el 68.26% de los datos. Para revisar clculos de rea bajo la curva normal se aplican las siguientes reglas: 1. Si Z, es positivo y se pide lo que es superior a ella, se busca en la tabla y ese valor se resta a 50% 2. Si Z, es positivo y se pide lo que es inferior a ella, se busca el valor en la tabla y se suma a 50% 3. Si Z, es negativa y se pide lo que es superior a ella, se busca el valor en la tabla y se suma a 50%. 4. Si Z, es negativa y se pide lo que es inferior a ella, se busca el valor en la tabla y se resta a 50% 5. Si Z, se encuentra entre los valores de igual signos se buscan ambos puntajes en la tabla y se restan. 6. Si Z, se encuentra entre dos valores de diferentes signos se buscan ambos puntajes en la tabla y se suman. 7. Si se quiere encontrar el nmero de casos que corresponden a una probabilidad determinada, primero se encuentra la probabilidad determinada y se multiplica por el total de casos y se divide dentro de cien (100).

ANALISIS DE MUESTRA DE IGUAL TAMAO Cuando se dispone de grupos de igual tamao la metodologa estadstica que se recomienda para tabular los resultados recibe el nombre de: Prueba de T siempre y cuando se tenga un mximo de 30 parejas de datos, cuando se tiene ms de 30 parejas de datos el procedimiento estadstico a utilizar difiere en que en lugar de utilizar la tabla de T como parmetro se comparacin se utiliza la tabla de Z. EJEMPLO Para los valores que se presentan establezca si existe diferencia estadstica significativa: a 20 16 18 20 26 25 28 26 28 = 207 Calcule b 16 15 16 17 15 16 17 15 19 146 (a a 9 40 25 9 9 9 25 9 25 164
)2

(b b) 0.05 1.49 0.05 0.60 1.49 0.05 0.60 1.46 7.72 13.54

de cada tratamiento

a= a / na = 207 / 9 = 23 b = b / nb = 146 / 9 = 16.22 Calcule la S de cada tratamiento Sa= (a a)2 / na =164 / 9 = 4.27 Sb = (b b)2 / nb = 13.54 / 9 = 1.23 Encuentre el error estndar d cada X = S / n 1 A = S / n 1 = 4.27 / 9 1 = 1.51 B = S / n 1 = 1.23 / 9 1 = 0.43 Encuentre el error estndar de la diferencia df = (A) + (B)
2 2 2

df = (1.51) + (0.43) = 1.57 Encuentre Tc Tc = A B / df = 23 16.22 / 1.57 = 4.32 Tf = 2.306 Conclusin: Existe diferencia estadstica significativa entre los grupos.

ANALISIS DE MUESTRA DE DIFERENCIA DE TAMAO Se recomienda cuando se tiene 2 grupos que presentan diferente cantidad de repeticiones, tambin puede utilizarse cuando se empieza con grupos de igual tamao pero por diversos problemas o razones se pierden algunas unidades experimentales durante el proceso de investigacin. a 20 17 23 25 22 21 20 19 = 167 Encuentre b 22 20 21 23 24 22 (a a) 0.75 14.97 4.54 17.06 1.28 0.02 0.75 3.50 42.87
2

(b b) 0 4 1 1 4 0

132

10

en cada tratamiento

a = a / na = 167 / 8 = 20.87 b = b / nb = 132 / 6 = 22 Encuentre el error estndar de la diferencia df = [ (a a)2 + (b b)2 / na + nb 2 ] [ 1 /na + 1 / nb ] df = [ 42.87 + 10 / 8 + 6 2 ] [ 1/8 + 1/6 ] df = 1.13 Encuentre Tc Tc = a b / df = 20.87 22 / 1.13 = 1.00 Encuentre Tf Tf = 2.179 Conclusin: No existe diferencia estadsticamente significativa entre los grupos.

ANALISIS DE UN MISMO GRUPO 2 VECES Esta metodologa estadstica se utiliza cuando se tiene un grupo de muestra o unidades experimentales a las cuales se les realizan una tabulacin estadstica, luego s les aplica algn tratamiento experimental y se vuelven a realizar mediciones despus de este tratamiento. Antes (a) 17 18 19 20 22 20 21 20 23 24 25 229 Despus (d) 13 12 11 10 13 14 15 16 14 17 16 151

Calcule X antes y despus de la fase experimental a = a / na = 229 / 11 = 20.82 d = d / nd = 151 / 11 = 13.73 Encuentre la S S = d / n (a d)
2 2 2

S =596 / 11 ( 20.82 13.73) = 1.98 Encuentre el error estndar de la diferencia df = S / n 1 = 1.98 / 11 1 = 0.63 Encuentre Tc Tc = A D / df = 20.82 13.73 / 0.63 = 11.25 Encuentre Tt Tt = 2.228 Conclusin: Existe diferencia estadstica significativa

DITRIBUCION COMPLETAMENTE AL AZAR Esta se utiliza cuando se tiene dos o ms tratamientos y condiciones. Son homogneas. El mnimo nmero de grado de libertas para el error es 16. En el procedimiento esta para una distribucin completamente al azar se utiliza el siguiente formulario. Causa de variacin Tratamiento Error Total Fc = ( total) / n EJEMPLO Repeticiones i ii iii iv v vi 2 CV trat error tot
2 2

Sumatoria de cuadra (trat) / no. rep fc sc total sc tratamiento 2 (dato) fc


2

Grados de libertad no. trat 1 gl total gl trat n-1

Cuadrado medio sc trat / gl trat sc error / gl error

Factor calculado cm trat / cm erro

Factor tabulado Buscar en la tabla

a 256 16 289 17 400 20 529 23 576 24 484 22 122 14884 SC 318.87 116.33 435.20

b 225 15 196 14 256 16 284 17 256 16 225 15 93 8644

c 484 22 529 23 576 24 625 25 729 27 784 28 149 22201 GL 4 25 29

d 225 15 289 17 324 18 256 16 225 15 361 19 100 10000 CM 79.72 4.65

e 324 18 289 17 400 20 441 21 400 20 484 22 118 13924 Ft 17.14

582 69658 Ft 2.76

Fc = ( total) / n 2 Fc = (582) / 30 = 11290.8 Sc = = (trat) / No. rep Fc Sc = 69658 / 6 11290.8 Sc = 318.87 Sc total = datos Fc Sc total = 11726 11290.8 Sc total = 435.20 Conclusin: Existe diferencia significativa entre los tratamientos
2 2

DISTRIBUCION EN BLOQUE AL AZAR Esta distribucin se utiliza cuando se tiene 3 0 mas tratamientos y las condiciones experimentales son heterogneas. El mnimo nmero en grados de libertas para el error es 12. Las formulas que se utilizan en esta distribucin son las siguientes: causa de variacion tratamiento bloque error total sumatoria de cuadrado 2 = (trat) / no. bloque fc 2 (bloque) / no. trat fc sc total sc trat sc bloque 2 (dato) - fc grado de libertad no.trat 1 no. bloque 1 gl trat gl bloque n-1 cuadrado medio sc trat / gl trat sc bloque / gl bloque sc error / gl error factor calculado cm trat / cm error cm bloque / cm error factor tabulado buscar en la tabla buscar en la tabla

Fc = ( total)2 / n EJEMPLO Bloques i ii iii iv v vi 2 CV trat blo error tot a 10 16 15 17 18 20 96 9216 b 19 22 20 17 15 18 111 12321 SC 443.80 44.17 77 564.97 c 19 20 21 20 19 22 121 14641 GL 4 5 20 29 d 26 27 28 30 26 28 165 27225 CM 110.95 8.83 3.85 e 17 20 19 22 19 21 118 13924 FC 28.82 2.29 91 105 103 106 97 109 611 77327 2 8281 11025 10609 11236 9409 11881 62441

FT 2.87 2.71

Fc = ( total)2 / n Fc = (611)2 / 30 = 12444.03 Sc trat = = (trat) / No. bloque Fc Sc trat = 77327 / 6 12444.03 Sc trat = 443.80 Sc bloque = (bloque) / No. trat Fc Sc bloque = 62441 / 5 12444.03 Sc bloque = 44.17 Sc total = (dato) Fc Sc total = 13009 12444.03 Sc total = 564.97 Conclusion: 1. Existe diferencia significativa entre los tratamientos. 2. No existe diferencia significativa entre los bloques.
2 2 2

PRIMER EXAMEN PARCIAL

CASO No.1 Para los valores: 25, 27,28,29,29,30

intervalo 2.5- 7.5 7.5- 12.5 12.5-17.5 17.5-22.5 22.5-27.5 27.5-32.5 32.5-37.5

Frecuencia 8 11 24 70 21 10 5

Media aritmtica Mediana= 28,29 Moda = 29 es unimodal Media cuadrtica. Media armnica. Media geomtrica. Desviacin media. Varianza. Desviacin estndar.

x=

Mc=

Ma= Mg = dm= s=
2

s= )

Coeficiente de variacin. CV= (

Como se clasifica la serie de acuerdo a su moda? unimodal cual es el grado de representatividad de la media aritmetica? tiene alta representatividad

Construya: Un poligono de frecuencias absolutas

Un polgono de frecuencias acumuladas

Polgono de frecuencias relativas porcentuales

CASO No.2

X1 23 29 25 28 22 25

X2 32 24 30 32 36 30

X3 25 22 30 28 27 27

Y 23 27 30 29 28 28

X= Md= Mo= S= S= Cv= ( Q3= D4= C87= ) ( ( ) )


2

( ( )

CASO No.3 165=6+152b+184c+159d 4190= -152+3888b+4620c+4016d

5060=184a+4620b+5720c+4906d 4393=159a+4016b+4906c+4251d

Yc=-2.54+0.46x1+(-0.04)x2+0.74x3 2 2 S t= (y-Y) =29.5 2 S e=20.14 2 S ne=10.09 R=

SEGUNDA PRUEBA PARCIAL Caso No. 1 En un estudio en donde se analizaron 678 muestras se obtuvo una media aritmetica de 34 con una desviacion estandar de 4. Si se selecciona una muestra al azar, cual es la probabilidad de que su promedio sea: Superior a 43 50 Z= 43-34= 2.2548.784 1.22 Inferior a 42 50 Z= 42-34= 2.047.72+ 4 97.72 Superior a 28 50 Z= 28-34= -1.543.32+ 4 93.32 Inferior a 30 50 Z= 30-34= -1.034.134 15.87 Entre 27 y 31 Z= 27-34= -1.7545.99 4 Z= 31-34= -0.75 27.344 18.65 Entre 30.5 y 39.5 Z= 30.5-34= -0.87 30.78 4 Z= 39.5-34= 1.37 41.47+ 4 72.25 Entre 39 y 45 Z= 39-34= 1.25 39.44 4 Z= 45-34= 2.75 49.704 10.26 Cuantas muestras tendran un promedio: a. Superior a 45.5 50 Z= 45.5-34= 2.87 49.794 0.21*678= 1 muestra 100 b. Inferior a 44 50 Z= 44-34= 2.5 49.38+ 4 99.38*678= 673 muestras 100 c. Superior a 26 50 Z= 26-34= -2 47.72+ 4 97.72*678= 662 muestras

d. Inferior a 31.5 50 Z= 31.5-34= -0.62 23.244 26.76*678= 181 muestras 100 e. Entre 27 y 31.9 Z= 27-34= -1.75 45.99 4 Z= 31.9-34= -0.52 19.854 26.14*678= 177 muestras 100 f. Entre 30.5 y 42.5 Z= 30.5-34= -0.87 30.78 4 Z= Z= 42.5-34= 2.12 48.30+ 4 79.08*678= 536 muestras 100 g. Entre 36 y 44 Z= 36-34= 0.5 19.15 4 Z= 44-34= 2.5 47.984 -28.83*678= 195 muestras 100 Caso No.2 Para los valores A 23 26 27 29 34 35 37 40 251 B 34 35 37 30 28 26 27 26 243 (A-A) 70.14 28.89 19.14 5.64 6.89 13.14 31.64 74.39 249.87
2

(B-B) 13.14 21.39 43.89 0.14 5.64 19.14 11.39 19.14 133.87

Sera que existe diferencia estadisticamente significativa entre tratamientos? A= 251= 31.375 8 SA= rA= 5.59= 2.11 1.65 rdif= tt= 2.365 CONCLUSION: No existe diferencia estadistica significativa entre los grupos o tratamientos = 2.61 tc= B= 243= 30.375 8 SB= rB= 4.09= 1.54 2.65 = 0.38

Caso No.3 Para los valores. A 33 36 37 39 44 35 37 40 301 B 34 35 37 30 28 26 (A-A) 21.39 2.64 0.39 1.89 40.64 6.89 0.39 5.64 79.87
2

(B-B) 5.43 11.09 28.41 2.79 13.47 32.15

190

93.34

Sera que existe diferencia estadisticamente significativa entre tratamientos? A= 301= 37.625 8 Rdif= * +* += [ B= 190= 31.67 6 ] * += 2.05 tt= 2.179

Tc= 37.625-31.67= 2.90 2.05

CONCLUSION: Si existe diferencia estadistica significativa entre tratamientos. Caso No. 4 Para los valores Antes 23 26 27 29 34 35 37 40 251 Despues 24 25 27 20 28 26 27 26 203 d
2

Sera que existe diferencia estadisticamente significativa entre los valores? Caso No. 5 TRATAMIENTO REPETICION A B C D I 23 529 23 529 23 23 529 529 II 23 529 25 625 22 24 484 576 III 24 576 26 676 23 26 529 676 IV 26 676 27 729 25 25 625 625 V 27 729 28 784 26 24 676 576 VI 32 1024 31 961 28 28 784 784 155 160 147 150 2 24,025 25,600 21,609 22,500

612 93,734

Sera que existe diferencia estadistica entre los tratamientos? CV TRATAMIENTO ERROR TOTAL Fc= (612) = 15,606 24 CONCLUSION: No existe diferencia estadistica entre los tratamientos. Caso No.6 TRATAMIENTO A B C D E 2 I 23 529 32 1024 24 576 26 676 27 729 132 17,424 II 23 529 30 900 26 676 27 729 28 784 134 17,956 BLOQUE III 23 529 32 1024 23 529 25 625 26 676 129 16,641 IV 23 529 36 1296 23 529 25 625 26 676 133 17,689 92 130 96 103 107 528 69,710 8,464 16,900 9,216 10,609 11,449 56,638
2 2

SC 16.33 137.67 154

GL 3 20 23

CM 5.44 6.87

FC 0.79

FT 2.60

Sera que existe diferencia estadistica entre los tratamientos? Sera que existe diferencia estadistica significativa entre bloques? CV TRATAMIENTO BLOQUE ERROR TOTAL SC 220.3 2.8 27.7 250.8 GL 4 3 12 19 CM 55.075 0.93 2.31 FC 23.84 0.40 FT 3.11 3.26

Fc= (528) =13,939.2 20 CONCLUSIONES: Si existe diferencia estadistica entre los tratamientos. No existe diferencia estadistica entre los bloques.

PRIMERA PRUEBA CORTA Caso No. 1 Para los valores: 23, 45,32, 30, 40, 50, 45, 46, 34, 38, 56 Media Aritmtica: = Md= 50 Mo= 45 Mc.= Ma.=

= 39.91 aprox. = 40

= 40.96 aprox.= 41 = 37.57 aprox. = 38 = 38.77 aprox. = 39

Mg.= Rango= 56-23= 33 DM= S = S= 9.22 Cv= (


2

= -0.09 = 85

) 100% = 23.05% = Baja Representatividad

Clasificacin de Acuerdo a la Moda: 45, 45, 23, 32, 30, 40, 50, 46, 34, 38, 56. Caso No. 2 Organice los siguientes valores en 7 intervalos. 45 23 58 55 64 25 56 56 59 53 58 45 67 25 90 66 52 58 58 58 54 29 56 67 76 54 51 33 23 55 52 52 52 58 58 76 65 25 58 14 28 15 57 56 51 45 54 87 32 29 52 58 34 25 52 58 25 56 25 90 56 37 63 45 51 65 58 56 28 51 56 87 58 56 58 58 32 69 56 55 62 66 56 87 54 29 45 67 56 58 58 11 53 88 52 54 25 28 25 67 58 56 52 45 38 75 55 56 59 45 58 65 57 52 54 55 59 25 54 65 68 51 69 52 56 52 25 58 68 56 58 66 56 65 54 58 54 35 58 55 67 25 56 65

Rango= 90-11 = 76 Amplitud= = 10.86 = 11 F 3 21 5 33 61 15 3 3 144

INTERVALO 10.5-21.5 21.5-32.5 32.5-43.5 43.5-54.5 54.5-65.5 65.5-76.5 76.5-87.5 87.5-98.5

Caso No. 3 Para los siguientes valores agrupados. Intervalos 4.5-8.5 8.5-12.5 12.5-16.5 16.5-20.5 20.5-24.5 24.5-28.5 28.5-32.5 32.5-36.5 Frecuencia 4 7 11 45 75 32 15 12 201 Xi 6.5 10.5 14.5 18.5 22.5 26.5 30.5 34.5 164 Fxi 26 73.5 159.5 832.5 1687.5 848 457.5 414 4498.5 Fac. 4 11 22 67 142 174 189 201 F(xi-x)
2

1008.70 987.94 683.04 677.45 1.08 543.18 989.016 1762.73 6653.13

Media Aritmtica:

= 22.38

Md= 24.5 + ( ) 4 = 26.14 Mo= 20.5 + ( ) 4 = 22.14 S= S= Cv = (


2

= 33.10 = 5.75 ) 100% = 25.69%

La Media Aritmtica carece de Representatividad.

Segunda Prueba Corta CASO no. 1 Para los valores: Intervalo 2.5-7.5 7.5-12.5 12.5-17.5 17.5-22.5 22.5-27.5 27.5-32.5 32.5-37.5 frecuencia 7 13 22 70 21 10 5 fac 7 20 42 112 133 143 148 xi 5 10 15 20 25 30 35 frp 4.73% 8.78% 14.86% 47.30% 14.19% 6.76% 3.38%

Calcule: Q1 = 12.5+ (37-20/22)*5 = 16.36 Q3 =17.5+ (111-42/70)*5 = 22.43 D2 =12.5+ (29.6-20/22)*5 = 14.68 D5 = 17.5+ (74-42/70)*5 = 19.78 C43 = 17.5+ (63.64-42/70)*5 = 19.04 C87 = 22.5+ (128.76-112/21)*5 = 26.49 Polgono de Frecuencias Absoluta

Polgono de Frecuencias Acumuladas

Polgono de frecuencias relativas porcentuales

Caso no 2 Curso Asignado Biologa Qumica General 1 Introduccin a la Ciencia de los Alimentos Metodologa de la investigacin Matemtica Numero de Estudiantes Grados 28 43 32 25 50 56.63 86.97 64.72 50.56 101.12

Diagrama de barras Verticales

Diagrama de barras Horizontales Matemtica Metodologa de la Introduccin a la Ciencia de Qumica General 1 Biologa

Diagrama de Sectores

Biologa

Qumica General 1 Metodologa de la investigacin

TERCERA PRUEBA CORTA CASO No. 1 Se hizo una evaluacin en 489 muestras de crema, obtenindose un promedio de grasa de 37% con una desviacin estndar de 4%. 1. S se selecciona al azar una muestra de crema, Cul es la probabilidad de que su porcentaje de grasa sea: a. Superior a 45% Z= x x 45 37 / 4 = 2 47.72 50 = 2.28 S b. Inferior a 43% Z= x x S c. Superior a 34% Z= x x S d. Inferior a 29% Z= x x S e. Entre 27 y 32% Z1= x x S Z2= x x S f. Entre 30 y 44% Z1= x x S Z2= x x S g. Entre 40 y 47% Z1= x x S Z2= x x S 40 37 / 4 = 0.75 27.34 30 37 / 4 = -1.75 45.99 27 37 / 4 = -2.5 49.38 29 37 / 4 = -2 47.72 50 = 2.28 34 37 / 4 = -0.75 27.34 + 50 = 77.34 43 37 / 4 = 1.5 43.32 + 50 = 93.32

32 37 / 4 = -1.25 39.44 9.94

44 37 / 4 = 1.75 45.99 + 91.98

47 37 / 4 = 2.5

49.38 22.04

2. Cuntas muestras tendrn un porcentaje de grasa? a. Superior a 41% Z= 42-37 / 4 = 1 50 34.13 = 15.87 X 489 100 b. Inferior a 42% Z= 42-37/4 = 1.25 50 + 39.44 = 89.44 x 489 100 c. Superior a 35% = 437 muestras = 78 muestras

Z = 35- 37 / 4 = -0.5 19.5 + 50 = 69.15 x 489 100 d. Inferior a 27% Z = 27 37 / 4 = -2.5 50- 49.38 = 0.62 x 489 = 3 muestras 100 e. Entre 29 y 35% Z1 = 29 37 / 4 = -2 Z2 = 35 37 / 4 = -0.5 47.72 19.15 = 28.75 x 489 100 f. Entre 31 y 42% Z1 = 31 37 / 4 = -1.5 Z2 = 42 37 / 4 = 1.25 43.32 +39.44 = 82.76 x 489 100 g. Entre 39 y 46% Z1 = 39 37 / 4 = 0.5 Z2 = 46 - 37 / 4 = 2.25 48.78 19.15 = 29.63 x 489 = 145 muestras = 405 muestras = 140 muestras = 338 muestras

Caso No. 2 A 23 24 24 27 27 29 154 25 29 32 32 35 37 190 B (A A)2 7-08 2.75 2.75 1.79 1.79 11.15 27.31 (B B)2 0.44 11.15 40.20 40.20 87.24 28.52 207.75

A = 154 / 6 = 25. 66 B = 190 / 6 = 31.66 SA = SB= 2.13 = 0.95 Dif = 2.79 = 2.13 = 5.88 5.88 = 2.62

Tc = 25.66 31.66 / (2.79) = -2.15 Tt = 6 1 = 5 = 2.57 Conclusin: No existe diferencia estadstica significativa entre grupos o tratamientos.

Вам также может понравиться