You are on page 1of 48

Universidad De San Carlos De Guatemala Estadstica

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA Centro Universitario Del Sur Occidente Tcnico en Procesamiento de Alimentos Dr. Marco Antonio del Cid Flores Estadstica

Texto Paralelo del Curso de Estadstica

Brandon Alexis Lau Galindo Carne: 201241868

Lunes 13 de mayo de 2013

Universidad De San Carlos De Guatemala Estadstica

La Estadstica
Es un conjunto de tcnicas orientadas a la recoleccin, tabulacin, traficacin, anlisis e interpretacin de datos y la toma de decisiones razonables a partir de los mismos. la estadstica se divide en tres fases: a) Estadstica Descriptiva b) Estadstica Inferencial c) Diseo Estadstico La estadstica descriptiva se encarga de recolectar, tabular y graficar valores. La estadstica inferencial se encarga del estudio de pequeos grupos llamados muestras, generalizando esos resultados hacia toda la poblacin. El diseo estadstico permite la tabulacin de datos de diversas investigaciones contribuyendo asi a la bsqueda permanente de la verdad. A todo lo que se obtiene de una muestra se le llama estadstico y a todo dato que se obtiene de una poblacin se le llama parmetro. La muestra es una parte representativa de una poblacin. Para que la muestra sea representativa es necesario que tenga un tamao adecuado y que todos los elementos de la poblacin o universo al total de objetos o sujetos que nos interesa en una investigacin.

Medidas de Tendencia Central


Se le llama tambin medidas de centralizacin. Son parmetros o estadsticos que expresan un solo valor central las caractersticas generales de una poblacin o de una muestra. Las ms comunes son: Media Aritmtica: Mediana: Md Moda: Mo Media Cuadrtica: Mc =

Universidad De San Carlos De Guatemala Estadstica

Media Aritmtica: Ma = Media Geomtrica: MG = Media Aritmtica: Se le llama tambin promedio o promedio aritmtico. Es la mas utilizada de las medidas de tendencia central pero presenta el problema que se deja influenciar por valores extremos. Mediana: Es el valor central o el promedio de los dos valores centrales en una serie ordenada de datos. Moda: Es el valor o los valores que mas se repiten en una serie de datos. Cuando no hay valores repetidos la serie es amodal, cuando hay un valor repetido la serie es unimodal, cuando hay dos valores repetidos es bimodal, y cuando hay mas de dos valores repetidos la serie es polimodal o multimodal. Media Cuadrtica: Es la mas exacta de las medidas de tendencia central Media Armnica: Se define como el promedio de la sumatoria de los recprocos de los valores. Ejemplo 14, 16, 17, 13, 19, 12, 11, 17, 2, 10, 18 a)

= 15.18

b) Md = 10, 11, 12, 13, 14, 16, 17, 17, 18, 19, 20 = 16 c) Mo = 17 la serie es unimodal d) Mc=

= = 14.45

= 15.52

e) Ma=

Universidad De San Carlos De Guatemala Estadstica

f) MG=

=14.82

Medidas de Dispersin o de Variabilidad


Son parmetros o estadsticos que expresan la variacin que existe entre los datos y la media aritmtica. Las ms utilizadas son: a) Rango: Se le llama tambin recorrido o amplitud general. Es la diferencia que existe entre el dato mayor y el dato menor. R= Dato mayor Dato menor b) Desviacin Media: Se define como el promedio de diferencias absolutas entre los datos y la media aritmtica.

DM

c) Varianza o Variacin : Es el promedio de diferencias cuadrticas entre los datos y la media aritmtica.

S=

d) Desviacin Estndar: Se define como la raz cuadrada del promedio de diferencias cuadrticas entre los datos y la media aritmtica. Cuando se conoce la varianza basta con sacarle raz cuadrada para obtener la desviacin estndar. A la desviacin estndar se le llama tambin desviacin tpica.
S=

S=

e) Coeficiente de Variacin: Es la mas importante de las medidas de dispersin pues expresa el grado de representatividad de la media aritmtica. Si el coeficiente de variacin (CV) es menor que 16.67% la media aritmtica tiene alta representatividad, si el coeficiente de variacin esta entre 16.67% y 25% la media aritmtica tiene baja representatividad y si el coeficiente de variacin es mayor que 25% la media aritmtica carece de representatividad.
Cv = (

Universidad De San Carlos De Guatemala Estadstica

Ejemplo Para los valores: 23, 21, 20, 18, 19, 25, 26, 17, 23 Calcule lo siguiente: R, Dm, S2, S, Cv, e indique el grado de representatividad de la a) R=26 17= 9 b)

=
DM= DM=

= 21.33
= =2.59

c) S=

S=

=8.67

d) S= e) Cv = (

= 2.94

) 100= 13.78%

f) La

tiene alta representatividad

Cuando se dispone de mas de 30 datos es necesario agrupar los valores en intervalos. El nmero de intervalos los dispone el investigador y esta entre 6 y 15. No se recomienda utilizar menos de 6 intervalos pues la informacin queda demasiada condensada y puede llegarse a conclusiones que no son validas para la investigacin; por el contrario si se usan mas de 15 intervalos no se cumple con el propsito del agrupamiento de valores que es reducir tiempo y esfuerzo en la tabulacin de datos. Al ancho de cada intervalo se le llama amplitud, al centro de cada intervalo se le llama punto medio y al nmero de casos que corresponden a cada intervalo se le llama frecuencia absoluta.

Universidad De San Carlos De Guatemala Estadstica

Ejemplo Agrupar los siguientes valores en 7 intervalos 56 60 49 60 64 72 66 68 64 51 78 61 46 72 57 65 60 82 57 71 63 52 60 72 77 56 69 62 71 60 85 48 48 45 60 60 77 56 60 71 61 56 62 60 56 61 62 60 56 67 59 60 77 70 68 52 61 71 62 58 62 0 63 65 72 70 60 46 72 56 70 64 85 56 65 62 58 85 70 62 53 87 42 61 60 54 62 70 63 56

a) R= 87 42= 45 b) Amplitud= = = 6.43 6

Intervalos 41.5 47.5 47.5 53.5 53.5 - 59.5 59.5 - 65.5 65.5 71.5 71.5 77.5 77.5 83.5 83.5 89.5

F 4 5 16 37 14 8 2 4
=90

F acumulada 4 9 25 62 76 84 86 90

Xi 44.5 50.5 56.5 62.5 68.5 74.5 80.5 86.5

Fxi 178 252.5 904 2312.5 959 596 161 346


=5709

F(xi- )2 1433.38 835.92 768.40 32.00 359.87 980.36 582.77 2128.90


=7121.60

c)

= 63.43

d) S= e) S=

= = 79.13 = 8.90

Universidad De San Carlos De Guatemala Estadstica

f) Cv = ( g) Md= Li + (

) 100 = 14.03% )i

La

tiene alta representatividad

Donde: Li
J w

Limite inferior del intervalo que tiene F acumulada anterior


F del intervalo que tiene

= 45

37 Li = 59.5

Intervalo 59.5 - 65.5

Frecuencia 37

J=

Frecuencia acumulada anterior = 45 25 = 20


Intervalo 53.5 - 59.5 59.5 - 65.5 Frecuencia F acumulada 16 25 37 62

I = amplitud = 6

Md= 59.5 + ( )6 = 62.74


h) Mo=Li + (

)i Donde:
F mayor F anterior F mayor F posterior Limite inferior del intervalo que tiene la mayor frecuencia

Li

= 45

37 Li = 59.5

Intervalo 59.5 - 65.5

Frecuencia 37

Universidad De San Carlos De Guatemala Estadstica

= 37 - 16 = 21 = 37 - 14= 23

Intervalos 53.5 - 59.5 59.5 - 65.5 65.5 71.5

F 16 37 14

I = amplitud = 6

Mo=59.5 + (

)6 = 62.36 Medidas de Posicin

Cuartiles: Los cuartiles se define como medidas de tendencia central o de posicin relativa, porque determinan la concentracin y posicin de ciertos valores en relacin con el resto de la distribucin, a la que dividen en cuatro partes iguales y le corresponde a cada una el 25% de los casos. La distribucin tiene cuatro cuartiles pero nicamente se calculan: el primero, el segundo y el tercero. El cuarto es innecesario su clculo, porque se encuentra al final de la distribucin. Los cuartiles son necesarios para calcular la distribucin cuartil y cuando se requiere dividir la serie de datos en cuatro partes iguales, para analizar con mayor detalle el comportamiento de la tendencia central en las cuatro posiciones. Qx= Li + (

)I

Deciles: Los deciles de definen mas como medidas de posicin relativa que de tendencia central, porque determinan la concentracin y posicin de ciertos valores en relacin con el resto de la distribucin, a la que dividen en 10 partes iguales y le corresponde a cada uno el 10% de los casos. La distribucin tiene diez deciles, pero nicamente se calculan desde el primero hasta el noveno, el decimo es innecesario su calculo, porque al final de la distribucin se localiza.

Universidad De San Carlos De Guatemala Estadstica

Los deciles son tiles cuando se requiere dividir la serie de datos en 10 partes iguales, lo que permite analizar con mayor detalle el comportamiento de la tendencia central en las diez posiciones. Dx= Li + (

)I

Percentiles o Centiles: Los percentiles se definen mas como medidas de posicin relativa que de tendencia central, porque determinan la posicin de ciertos valores en relacin con el resto de la distribucin, a la que dividen en 100 partes iguales y le corresponde a cada una el 1% de los datos La distribucin tiene cien percentiles, pero nicamente se calculan desde el primero hasta el noventa y nueve, el 100 es innecesario su clculo, porque al final de la distribucin se localiza. Los percentiles se calculan con el mismo procedimiento de la mediana, de los cuartiles y de los deciles. Cx= Li + ( Q4, D10 y C100 = al lmite superior del ltimo intervalo. Q2, D5 y C50 = mediana Ejemplo Intervalo 4.5-9.5 9.5-14.5 14.5-19.5 19.5-24.5 24.5-29.5 29.5-34.5 34.5-39.5 Frecuencia 10 14 23 86 19 8 6 = 166 Frecuencia acumulada 10 24 47 133 152 160 166

)I

Universidad De San Carlos De Guatemala Estadstica

Cuartiles
( ) ( )

Deciles ( ) ( )

Universidad De San Carlos De Guatemala Estadstica

Percentiles ( ) ( )

Graficas Estadsticas
Son representaciones estticas de las series de valores. Existen graficas estadsticas especficas para variables cuantitativas y otras para variables cualitativas. En variables cuantitativas se utilizan el polgono de frecuencias absolutas, polgonos de frecuencias relativas porcentuales, polgonos de frecuencias acumuladas e histogramas de Pearson.

Polgono de frecuencias absolutas: Para construirlas se escribe en el eje horizontal del plano cartesiano el punto medio de cada intervalo y en el eje vertical la respectiva frecuencia absoluta. Cada punto medio se hace coincidir con su frecuencia y al estar ubicados todos los puntos se unen mediante lneas rectas continuas. Antes del primer punto medio y despus del ltimo se debe dejar un espacio para que descienda la grafica a travs de una lnea punteada.

Universidad De San Carlos De Guatemala Estadstica

Cuando el primer punto medio no inicia en cero la grafica se presenta cortada. En todas las graficas estadsticas la altura debe ser entre el 60% y 75% de la base.

Intervalos 6.5 13.5 13.5 20.5 20.5 27.5 27.5 34.5 34.5 41.5 41.5 48-5 48.5 55-5 55.5 62.5 62.5 67.5

Frecuencia 10 18 22 29 59 23 19 15 6 =201

Punto medio (Xi) 10 17 24 31 38 45 52 59 66

Frecuencias Absolutas
63 56 49 42 35 28 21 14 7 0 10 17 24 31 38 45 52 59 66

Polgono de frecuencias relativas porcentuales: Su construccin es similar al polgono de frecuencias absolutas con la diferencia que en el eje vertical en lugar de colocar frecuencias absolutas se colocan frecuencias relativas porcentuales

Universidad De San Carlos De Guatemala Estadstica

Intervalos

Frecuencia (F)

Punto medio (Xi)

6.5 13.5 13.5 20.5 20.5 27.5 27.5 34.5 34.5 41.5 41.5 48-5 48.5 55-5 55.5 62.5 62.5 67.5

10 18 22 29 59 23 19 15 6 =201

10 17 24 31 38 45 52 59 66

Frecuencias Relativas Porcentuales (frp) 4.98% 8.96% 10.95% 14.45% 29.35% 11.44% 9.45% 7.46% 2.99% =100%

Frecuencias Relativas Porcentuales


30% 27% 24% 21% 18% 15% 12% 9% 6% 3% 0% 10 17 24 31 38 45 52 59 66

Universidad De San Carlos De Guatemala Estadstica

Polgono de Frecuencias Acumuladas: Esta grafica se utiliza para expresar crecimiento. Se diferencia de los otros polgonos en que en el eje vertical se escriben las frecuencias acumuladas y la grafica no desciende sino que se queda en el aire.

Intervalos 6.5 13.5 13.5 20.5 20.5 27.5 27.5 34.5 34.5 41.5 41.5 48-5 48.5 55-5 55.5 62.5 62.5 67.5

Frecuencia 10 18 22 29 59 23 19 15 6 =201

Punto medio (Xi) 10 17 24 31 38 45 52 59 66

Frecuencias Acumuladas 10 28 50 79 138 161 180 195 201

Frecuencias Acumuladas
220 198 176 154 132 110 88 66 44 22 0 10 17 24 31 38 45 52 59 66

Universidad De San Carlos De Guatemala Estadstica

Histograma de Pearson: para construirla se escribe en el eje horizontal los lmites inferiores de cada intervalo y en el vertical la frecuencia absoluta. Esta grafica esta constituida por una serie de rectngulos unidos en donde el ancho de cada rectngulo esta dado por la amplitud de cada intervalo y la altura por la frecuencia absoluta. Intervalos 6.5 13.5 13.5 20.5 20.5 27.5 27.5 34.5 34.5 41.5 41.5 48-5 48.5 55-5 55.5 62.5 62.5 67.5 Frecuencia (F) 10 18 22 29 59 23 19 15 6 =201

Histograma de Pearson
63 56 49 42 35 28 21 14 7 0 6.5 13.5 20.5 27.5 34.5 41.5 48.5 55.5 62.5

Universidad De San Carlos De Guatemala Estadstica

Graficas para variables Cualitativas


Para variables cualitativas las graficas recomendables son diagrama de barras verticales, diagrama de barras horizontales y diagrama de sectores. Ejemplo

Comida Preferida Carne asada Ensalada La Sagna Pollo Spaguetti Camarones Pescado

Frecuencia (F) 3 1 3 5 1 2 2 17

Grados 63.53 21.18 63.53 105.88 21.18 42.35 42.35 360

Diagrama de Barras Verticales


5 4 3 2 1 0 Carne asada Ensalada La Sagna Pollo Spaguetti Camarones Pescado

Universidad De San Carlos De Guatemala Estadstica

Diagrama de Barras Horizontales


Comida Preferida
Pescado Camarones Spaguetti Pollo La Sagna Ensalada Carne asada 0 1 2 3 4 5

Diagrama de Sectores
Carne asada Ensalada La Sagna Pollo Spaguetti Camarones Pescado

Anlisis de Regresin y Correlacin


Es una metodologa estadstica que permite determinar la relacin que se produce entre dos o ms variables. Cuando solo se compara dos variables el anlisis es simple y cuando se comparan ms de dos variables el anlisis es mltiplo. La correlacin mide la relacin que se produce entre las variables mientras que la regresin es la fuerza o intensidad con que se relacionan las variables.

Universidad De San Carlos De Guatemala Estadstica

Formulas a utilizar en el anlisis de regresin y correlacin


r = -1 & 1
[ ]

][

Coeficiente de Correlacin

Donde: Ecuacin de Regresin simple Ecuacin de Regresin mltiple Variacin total Variacin explicada Variacin no explicada Porcentaje de variacin explicada Porcentaje de variacin no explicada

( ( ) )

Universidad De San Carlos De Guatemala Estadstica

Ejemplo X= variable independiente X 20 16 21 22 19 14 23 20 19 =174 Y 18 22 23 24 25 20 26 24 20 =202 XY 360 352 483 528 475 280 598 480 380 =3936 X2 400 256 441 484 361 196 529 400 361 =3428 Y= variables dependiente Y 324 484 529 576 625 400 676 576 400 =4590 Yc 22.76 20.84 23.24 23.72 22.28 19.88 24.20 22.76 22.28 19.71 0.19 0.31 2043 6.55 50.95 17.67 2.42 5.95 =56.19 0.10 2.56 0.64 1.64 0.03 6.55 3.10 0.10 0.03 =14.75 22.66 1.34 0.06 0.08 7.40 0.01 3.24 1.54 5.20 =41.23

a) El coeficiente de correlacin = 0.51

][

b) La ecuacin de regresin

Donde:

c) Los valores corregidos de y cuando X=17 & X=18

Universidad De San Carlos De Guatemala Estadstica

a) Variacin Total

b) Variacin explicada

c) Variacin no explicada

d) Cul es el % de la Variacin que se debe a los factores investigados? ( )

e) Cul es el % de la Variacin que se debe a causas ajenas a la investigacin? ( )

X1 16 15 17 20 19 20 16 =123

X2 14 18 15 19 20 16 20 =122

Y1 20 19 18 17 15 20 16 =125

X1Y 320 285 306 340 285 400 256 =2192

X12 256 225 289 400 361 400 256 =2187

X1X2 224 270 255 380 380 320 320 =2149

X2Y 280 342 270 323 300 320 320 =2155

X22 196 324 225 361 400 256 400 =2162

Yc 20.15 17.59 19.46 16.74 16.13 18.69 16.25

4.58 1.30 0.02 0.74 8.18 4.58 3.46 =22.86

5.24 0.07 2.56 1.25 3.00 0.69 2.60 =15.41

a) Encuentre la ecuacin de regresin

Universidad De San Carlos De Guatemala Estadstica

Universidad De San Carlos De Guatemala Estadstica

b) Encuentre la Variacin total

c) Encuentre la Variacin explicada

d) Encuentre la Variacin no explicada

e) Coeficiente de Correlacin

Distribucin Normal
Todas las actividades, procesos y comportamientos obedecen a un modelo de distribucin normal; es decir, existen unos pocos datos al extremo derecho, pocos datos al extremo izquierdo y la mayora de datos al centro de la distribucin.

Formula:

Universidad De San Carlos De Guatemala Estadstica

Caractersticas: a) Posee simetra bilateral. b) Es asinttica. Las colas de la curva normal tienden a acercarse al eje horizontal pero jams llegan a juntarse c) Posee 6 desviaciones estndar. d) En el centro de la curva normal convergen todas las medidas de tendencia central. Reglas para realizar clculos en la curva normal 1) Si Z es positivo y se pide lo que es superior a ella se busca el valor en la tabla y se resta a 50%. 2) Si Z es positivo y se pide lo que es inferior a ella se busca el valor en la tabla y se suma a 50%. 3) Si Z es negativo y se pide lo que es superior a ella se busca el valor en la tabla y se suma a 50%. 4) Si Z es negativo y se pide lo que es inferior a ella se busca el valor en la tabla y se resta a 50%. 5) Si Z se encuentra entre dos valores de diferente signo se buscan ambos valores en la tabla y se suman. 6) Si Z se encuentra entre dos valores de diferente signo se buscan ambos valores en la tabla y se suman. 7) Si se quiere encontrar el numero de casos que corresponden a una probabilidad determinada se calcula la probabilidad, se multiplica por el total de datos y se divide entre 100. Ejemplo Se hizo un estudio en 837 muestras de soja, obtenindose un promedio de protena de 36% con una desviacin estndar de 42%.

a) Si se relaciona una muestra al azar, Cul es la probabilidad que su contenido de protena sea?

Universidad De San Carlos De Guatemala Estadstica

1) Superior a 49% 50% 50%0%

2) Superior a 43% 50.00% -45.25% 4.75%

3) Inferior a 48.4%

50.00% +49.84% 99.84%

Universidad De San Carlos De Guatemala Estadstica

4) inferior a 42%

50.00% +42.36% 92.36%

5) Superior a 30%

50.00% +42.36% 92.36%

6) Superior a 25% 50.00% +49.56% 99.56%

Universidad De San Carlos De Guatemala Estadstica

7) Inferior a 31%

50.00% -38.30% 11.70%

8) Inferior a 21%

50.00% -50.00% 0%

9) Entre 39% y 42%

26.11% +42.36% 16.25%

Universidad De San Carlos De Guatemala Estadstica

10) Entre 31% y 44%

38.30% +47.13% 85.43%

1) Entre 28% y 35% 47.13% +9.48% 37.65%

b) Cuntas muestras de soya tendrn un porcentaje de protena? 1) Superior a 43%

50.00% -45.25% 14 muestras

Universidad De San Carlos De Guatemala Estadstica

2) Inferior a 45% 50.00% +48.38% 823 muestras

3) Superior a 32% 50.00% +32.90% 694 muestras 4) Inferior a 34% 50.00% - 18.44% 264 muestras 5) Entre 39 y 44.8% 26.11% - 48.21% 185 muestras

6) Entre 28 y 42.8% 47.13% +44.74% 769 muestras

Universidad De San Carlos De Guatemala Estadstica

Prueba de Chi Cuadrado (X2)


Esta prueba se utiliza cuando se pretende establecer si existe dependencia entre variables cualitativas.

Xc2=

f= frecuencia observada Ejemplo

fe= frecuencia esperada

Se hizo una investigacin para establecer si la aceptabilidad de los embutidos elaborados a partir de carne de pavo depende de la procedencia de la carne. Los resultados obtenidos fueron los siguientes Aceptabilidad Altiplano del embutido occidental Procedencia Ninguna Muy baja Baja Mediana Alta Muy alta Total 15 18 20 18.88 16 17.47 18 18.71 19 19.24 23 18.71 =111 Ciudad capital 23 20.76 26 21.77 20 20.15 19 21.57 18 22.18 22 21.57 =128 Costa sur 25 26.46 26 27.73 28 25.66 30 27.47 31 28.25 23 27.47 =163 Oriente 16 18.32 18 19.22 20 17.79 19 19.04 22 19.58 18 19.04 =113 Nueva York 23 18.49 17 19.39 15 17.94 20 19.21 19 19.76 20 19.21 =114 Total 102 107 99 106 109 106 629

Xt2=31.41 Conclusin: no existe dependencia entre las variables en el estudio. Por tanto, la aceptabilidad del embutido de pavo no depende de la procedencia de la carne.

Universidad De San Carlos De Guatemala Estadstica

Anlisis de Dos Grupos de igual Tamao


A 12 13 15 17 13 16 19 20 19 16 =160 B 13 17 18 19 21 20 16 18 23 26 =191 16 9 1 1 9 0 9 16 9 0 =70 37.21 4.41 1.21 0.01 3.61 0.81 9.61 1.21 15.21 47.61 =120.9

Ser que existe diferencia estadstica entre los grupos? a) Encuentre de cada grupo.

b) Encuentre S

c) Calcule el error estndar de cada media.

Universidad De San Carlos De Guatemala Estadstica

d) Calcule el error estndar de la diferencia. e) Encuentre tc

f) Encuentre tt

tt=2.262 Conclusin: no existe diferencia estadstica entre los tratamientos pues tc es menor que tt.

Anlisis de grupos de diferente tamao


A 15 19 16 18 20 16 19 22 20 17 =182 B 20 16 15 16 24 25 23 27 17 =193 10.24 0.64 4.84 0.04 3.24 4.84 0.64 14.44 3.24 1.44 =43.60 2.07 29.59 41.47 29.59 6.55 12.67 2.43 30.91 30.91 =186.19

Universidad De San Carlos De Guatemala Estadstica

a) Encuentre de cada grupo.

b) Encuentre el error estndar de la diferencia * +[ ] [ ][ ]

c) Encuentre tc

d) Encuentre tt

Tc=2.110

Conclusin: no existe diferencia estadstica entre los tratamientos pues tc es menor que tt

Anlisis de un mismo grupo dos veces


A 16 15 19 20 17 16 18 22 23 15 =181 D 14 16 18 19 23 22 25 20 19 24 =200 d2 4 1 1 1 36 36 49 4 16 81 =229

Universidad De San Carlos De Guatemala Estadstica

a) Encuentre de cada grupo.

b) Encuentre S

c) Encuentre el error estndar de la diferencia d) Encuentre tc

e) Encuentre tt tt=2110 e) Conclusin: no existe diferencia estadstica entre los tratamientos pues tc es menor que tt.

Distribucin Completamente al Azar


Esta distribucin se utiliza cuando se tiene ms de dos tratamientos y las condiciones experimentales son homogneas. El mnimo nmero de grados de libertad que se acepta para el error es 16 y las formulas estadsticas que se utilizan en la solucin son las siguientes:

Universidad De San Carlos De Guatemala Estadstica

Causas de Sumatoria de Variacin Cuadrados (sc) (cv) Tratamiento Error Total

Grados de Libertad (gl)

Cuadrado medio

Factor Calculad o (fc)

Factor Tabulado (ft) Buscar en tabla F

Ejemplo

Tratamiento I II III IV V VI 2 Repeticion

A 12 144 15 225 16 256 18 324 19 361 17 289 97 9409

B 15 225 17 289 18 324 19 361 20 400 19 361 108 11664

C 22 484 23 529 24 576 20 400 19 361 20 400 128 16384

D 16 256 20 400 19 361 23 529 25 625 26 676 129 16641

E 18 324 17 289 16 256 18 324 15 225 17 289 101 10201

563 64299

Cv Sc Gl Cm Fc Ft Tratamiento 150.87 4 37.72 6.44 2.76 Error 146.5 25 5.86 Total 297.37 29 Conclusin: Existe diferencia estadstica entre los tratamientos, pues fc es mayor que ft.

Universidad De San Carlos De Guatemala Estadstica

Distribucin en bloques al Azar


Se utiliza cuando se tienen ms de dos tratamientos y las condiciones experimentales son heterogneas. El mnimo nmero de grado de libertad para el error es 12. Las formulas a utilizar son las siguientes. Causas de Sumatoria de Variacin Cuadrados (sc) (cv) Tratamiento Bloque Error Total Grados de Libertad (gl) Cuadrado medio Factor Calculad o (fc) Factor Tabulado (ft) Buscar en tabla F Buscar en tabla F

Ejemplo Bloque Tratamiento A B C D E I II 20 400 19 361 20 400 19 361 23 529 101 10201 III 22 484 16 256 16 256 18 324 22 484 94 8836 IV 25 625 20 400 18 324 20 400 19 361 102 10404 V 27 729 27 729 20 400 22 484 26 676 122 14884 VI 24 576 28 784 19 361 18 324 27 729 116 13456 VII 25 625 23 529 22 484 20 400 28 784 118 13924 2

18 324 23 529 22 484 20 400 20 400 103 2 10609

161 25921 156 24336 137 18769 137 18769 165 24225 756 115020 81314

Universidad De San Carlos De Guatemala Estadstica

CV Tratamiento Bloque Error Total Conclusin:

Sc 101.83 133.20 151.37 386.40

Gl 4 6 24 34

Cm 25.46 22.20 6.31

fc 6.44 3.52

ft 2.76 2.51

1) Existe diferencia estadstica entre tratamientos pues fc es mayor ft. 2) Existe diferencia estadstica bloques pues fc es mayor ft.

Distribucin completamente al Azar con distinto numero de Repeticiones


Causas de Sumatoria de Cuadrados Variacin (sc) (cv) Tratamiento Error Total Grados de Libertad (gl) Cuadrado medio Factor Calculad o (fc) Factor Tabulado (ft) Buscar en tabla F

Ejemplo Tratamiento I II III IV V VI A 10 16 15 --18 19 78 1216.8 100 256 225 324 361 17 16 18 19 20 18 108 1944 B 286 256 324 361 400 324 15 17 19 20 21 23 115 2204.17 C 225 289 361 400 441 529 22 20 19 20 18 --99 1960.20 D 484 400 361 400 324 E ----20 19 18 17 74 1369

Repeticiones

400 361 324 289 474 8694.18

Universidad De San Carlos De Guatemala Estadstica

CV SC Tratamiento 52.79 Error 113.83 Total 166.62

GL 4 21 25

CM 13.20 5.42

fc 2.44

ft 2.84

Conclusin: No existe diferencia estadstica entre tratamientos pues fc es menor que ft.

Anlisis de Bloques Incompletos


Causas de Sumatoria de Variacin Cuadrados (sc) (cv) Tratamiento Bloque Error Total Grados de Libertad (gl) Cuadrado medio Factor Calculad o (fc) Factor Tabulado (ft) Buscar en tabla F Buscar en tabla F

Universidad De San Carlos De Guatemala Estadstica Ejemplo Tratamiento I II III IV V VI A 15 17 --16 18 19 85 1445 225 289 256 324 361 B 22 20 16 18 22 23 121 2440.17 484 400 256 324 484 529 C 19 20 22 18 19 --98 1920.8 361 400 484 324 361 D 23 25 28 ----26 102 2601 529 625 784 19 16 18 20 19 22 114 2166 E 361 256 324 400 361 484 98 1920.80 98 1920.80 82 1764 72 1296 78 1521 90 2025 520 10447.6 10572.97

Bloque

676

CV SC Tratamiento 172.97 Bloque 47.60 Error 41.43 Total 262

GL 4 5 16 25

CM fc 43.24 16.69 9.52 3.68 2.59

ft 3.01 2.85

Conclusin: 1) Existe diferencia estadstica entre tratamientos pues fc es mayor ft. 2) Existe diferencia estadstica bloques pues fc es mayor ft.

Universidad De San Carlos De Guatemala Estadstica

Distribucin en Cuadro Latino Modificado


Esta distribucin se utiliza cuando el nmero de repeticiones del tratamiento o bloques es mltiplo del nmero del tratamiento. El procedimiento consiste en promediar los valores de los bloques o repeticiones hasta obtener un valor idntico de numero de tratamientos; luego se procede a realizar el anlisis del varianza por una distribucin completamente al azar o bloques al azar segn corresponda. Ejemplo

Tratamiento I II III IV V VI VII VIII IX X XI XII

A
10 20 23 22 14 16 15 17 20 16 19 23

B
16 20 17 19 20 18 17 20 21 19 20 17

C
15 18 20 19 20 16 18 20 19 20 19 21

D
19 20 17 18 20 19 22 23 20 21 20 20

Tratamiento I II III IV

A 312.23 300.33 300.33 373.65

Repeticion

17.67 17.33 17.33 19.33 71.66 2 5135.16

17.67 312.23 17.67 312.32 18.67 348.57 19 361 18.33 373.65 19 361 19.33 393.65 19 361 21.67 469.59 18.67 348.57 20 400 19 361 74.67 75 78.34 299.67 5575.61 56.35 6137.16 22472.93

Repeticion

5612.63 5.60

Universidad De San Carlos De Guatemala Estadstica

Sctotal = 5631.17 5612.63 = 18.54

CV Tratamiento Error Total

SC 5.60 12.94 18.54

GL 3 12 15

CM 1.7 1.08

fc 1.73

ft 3.49

Conclusion: No existe diferencia estadistica entre tratamiento pues fc es menor que ft

Diseo Factorial
Esta distribucin se utiliza cuando existen dos o ms factores de inters en una investigacin. Cuando las condiciones son heterogneas se utiliza un arreglo en bloques al azar y cuando las condiciones son homogneas el arreglo es completamente al azar.

Causas de Variacin (cv) Tratamiento Bloque Factor A Factor B Interaccin AB Error Total

Sumatoria de Cuadrados (sc)


Grados de Libertad (gl) - fc # trat 1 #bloques 1

Cuadrado medio

Factor Calculad o (fc)

Factor Tabulado (ft) Tabla F

-fc

SCtrat SCA SCB Sctotal Sctrat ScBloques (dato) - fc GLA * GLB Gltotal Gltrat Glbloques n-1

Tabla F Tabla F Tabla F

Universidad De San Carlos De Guatemala Estadstica Ejemplo Se hizo una investigacin para evaluar cuatro tipos diferentes de embutidos procedentes de tres localidades diferentes. El estudio consisti en evaluar el nivel de protena de los mismos, obtenindose los siguientes resultados: Embutido A1 A2 A3 B1 B2 B3 C1 C2 C3 D1 D2 D3 Localidad 1 2 3 1 2 3 1 2 3 1 2 3 I 15 18 16 16 22 18 15 20 22 20 19 16 217 47089 II 18 19 18 15 20 19 18 16 26 16 16 15 216 46656 III 17 20 20 18 23 20 20 15 25 18 18 18 232 53824 IV 16 15 19 19 25 16 19 18 28 15 19 19 228 51984 66 72 73 68 90 73 72 69 101 69 72 68 893 199553 4356 5184 5329 4624 8100 5329 5184 4761 10201 4761 5184 4624 67637

225 324 256 256 484 324 225 400 484 400 361 256

324 361 324 225 400 361 324 256 676 256 256 225

289 400 400 324 529 400 400 225 625 324 324 324

256 225 361 361 625 256 361 324 784 225 361 361

Embutido A B C D

1 66 68 72 69 275 75625

2 72 90 69 72 303 91809

Localidad 3 73 73 101 68 315 99225

211 231 242 209 893 266659

44521 53361 58564 43681 200127

Universidad De San Carlos De Guatemala Estadstica

CV Tratamiento Bloque Factor a Factor b Interaccin AB Error Total

SC 259.73 15.90 63.73 52.67 179.33 121.85 433.48

GL 11 3 3 2 6 33 47

CM 26.88 5.30 21.24 26.34 29.89 3.69

fc 7.28 1.44 5.76 7.14 8.10

ft 2.08* 2.92NS 2.92* 3.32* 2.2*

Causas de Variacin (cv) Tratamiento Factor A Factor B Interaccin AB Error Total

Sumatoria de Cuadrados (sc)


Grados de Libertad (gl) - fc # trat 1

Cuadrado medio

Factor Calculad o (fc)

Factor Tabulado (ft) Tabla F Tabla F Tabla F

SCtrat SCA SCB Sctotal Sctrat (dato) - fc Gl trat - GLA- GLB Gl total Gl trat. n-1

Tabla F

En una investigacin se evaluaron 3 preservantes provenientes de 5 casas comerciales. El estudio consisti en evaluar la vida de anaquel del helado obtenindose los siguientes resultados expresados en das Repeticiones II 14 15 17 18 19 20 16 15 16

Preservante A A A A A B B B B

Casa C 1 2 3 4 5 1 2 3 4

I 10 12 13 17 10 9 8 13 14

III 14 15 16 17 18 14 13 14 15

38 42 46 47 47 43 37 42 45

1444 1764 2116 2209 2209 1849 1369 1764 2025

Universidad De San Carlos De Guatemala Estadstica

B C C C C C

5 1 2 3 4 5

15 16 10 12 10 13

18 17 15 16 20 13

16 10 12 15 14 16

49 43 37 43 44 42 645

2401 1849 1369 1849 1936 1764 27917

Repeticin A B C

1 38 43 43 124 15376

2 42 37 37 116 13456

Casa Comercial 3 4 4 46 47 47 42 45 79 43 44 42 131 136 138 17161 18496 19044

220 216 202 83533

48400 46656 43681 138737

CV Tratamiento Factor a Factor b Interaccin AB Error Total

SC 60.67 4.13 36.44 20.10 303.33 364

GL 14 2 4 8 30 44

CM 4.33 2.07 9.11 2.51 10.11

fc 0.43 0.20 0.90 0.25

ft 2.09NS 3.32NS 2.69NS 2.27NS

Universidad De San Carlos De Guatemala Estadstica

Distribucin de probabilidad
En un conjunto de vectores estn distribuidos de acuerdo a la teora de probabilidad. Las distribuciones de probabilidad pueden ser: a) Discretas o estocsticas Cuando la variable aleatoria X, solo puede tomar ciertos valores aislados de un intervalo, en lugar de todos los valores del mismo. Por ejemplo, el puntaje que se puede obtener al tirar un dado, solo puede ser 1, 2, 3, 4, 5 o 6. Dentro de las distribuciones discretas las mas importantes son 1) Distribucin binomial 2) Distribucin de Poisson b) Continuas Cuando la variable aleatoria X puede tomar cualquier valor del intervalo, como son los tiempos de servicio de un trabajador. Dentro de las distribuciones continuas, las mas importantes son: 1) Distribucin normal 2) Distribucin de t de Student 3) Distribucin de chi cuadrada 4) Razn de las varianzas (ANDEVA o prueba de F)

Distribucin Binominal
Es una medida de probabilidad basada en el desarrollo del binomio de Newton. La formula a aplicar es

Ejemplo 1. El 20% de la produccin de una fbrica sale defectuosa. Cul es la probabilidad de que al seleccionarse al azar 4 unidades de esa produccin? a) Una esta defectuosa. n= 4

Universidad De San Carlos De Guatemala Estadstica

x= 1 p=0.20 q=0.80 b) Ninguna este defectuosa. n= 4 x= 0 p=0.20 q=0.80 a) No ms de dos estn defectuosas. n= 4 x= 2 p=0.20 q=0.80

40.96% + 40.96% + 15.36% = 97.28%

2. La probabilidad de que un artculo producido por la fbrica sea defectuoso es de 0.02. si se enva un cargamento de 10000 artculos, encontrar el numero esperado de artculos defectuosos y la desviacin estndar. a. Artculos defectuosos= no = 10000*0.02= 200 b. Desviacin estndar = raz cuadrada de npq= 14 Artculos defectuosos: Np= 10000*0.02 = 200 Desviacin estndar: = 14.14.

Universidad De San Carlos De Guatemala Estadstica

3. Si la probabilidad de que cualquier elector registrado vote en una eleccin determinada es de 0.70. Cul es la probabilidad de que dos de cinco electores registrados voten en la eleccin?

n= 5 x= 2 p=0.70 q=0.30 4. La probabilidad de que una persona que hace compras en cierto mercado aproveche una promocin especial de helado es 0.30. obtenga las probabilidades que entre seis personas que comprar en este supermercado haya 0, 1, 2, 3, 4, 5 o 6 que aprovechen la promocin

Universidad De San Carlos De Guatemala Estadstica

Distribucin de Poisson La formula de Poisson es un modelo de poblacin que se aplica en procesos fsicos, en controles de calidad para estimar el numero de piezas defectuosas, para verificacin del numero de siniestros, estimacin del numero de personas que tendrn que hacer cola en un lugar, para calcular el numero de clientes que entran a un almacn, o el numero de vehculos que llegan a una terminal, para estimar el numero de llamadas telefnicas por minuto, el numero de erratas en un texto y otros.

Donde: P= Es La probabilidad x= Numero de ocurrencias cuya probabilidad se va a encontrar. u= np para xito y nq para fracaso. Buscar el valor en la tabla de Poisson. e= 2.71828 (Valor del logaritmo natural en la calculadora). X!= x factorial. Ejemplos 1. El 3% de las pilas fabricadas por una industria estn defectuosas. Qu probabilidad hay que en una muestra tomada al azar de 100 unidades, 5 salgan defectuosas

= defectuosas.

= 0.101 = 10.1% de probabilidades de encontrar 5

2. En una esquina de Mazatenango, se registran en promedio 5 accidentes de transito por semana Cul es la probabilidad que en esta semana se registren exactamente 3 accidentes? = = 0.140 = 14.0% de probabilidades.

Universidad De San Carlos De Guatemala Estadstica

Distribucin Multinomial
Esta distribucin se utiliza cuando existen ms de dos posibilidades de ocurrencia para un evento determinado Su formula es

Ejemplo En una ciudad muy grande, el sistema de televisin nacional tiene 40% de televidentes los viernes por la noche, un canal local tiene 20%, la televisin por cable 30% y 10% ve videograbaciones. Cul es la probabilidad de que entre 7 televidentes seleccionados al azar en esa ciudad en una noche de viernes, dos estn viendo el sistema de televisin nacional, uno este viendo el canal local, tres estn viendo televisin por cable y uno este viendo videograbaciones?