Вы находитесь на странице: 1из 22

INSTITUTO TECNOLOGICO SUPERIOR DE CALKINI

Nombre de la asignatura:

Estadstica para la Administracin I


Carrera: Licenciatura en Administracin. Clave: LAD-1016 Hrs. teora - Hrs. prctica - Crditos: 2 - 3 - 5
EN EL ESTADO DE CAMPECHE

TEMARIO
U N I D A D

RAMIRO JOSE GONZALEZ HORTA A r q u i t e c t o

Arq. Ramiro Gonzlez Horta. Abril 2011

Medidas de posicin y variacin para datos agrupados y no agrupados


3.1 Media aritmtica, Mediana y Moda. 3.2 Cuartiles, Deciles y Percentiles 3.3 Rango, Varianza, Desviacion Estandar, Coeficiente de Variacion y de Pearson

Medidas de posicin y variacin para datos agrupados y no agrupados 3.1 Media aritmtica, Mediana y Moda.

Datos no agrupados.
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como fueron recolectados, para obtener informacion directamente de ellos. Ejemplos: 5,7,2,15,2,6,12,5,5,20,10. numero de personas que ayudaron a una causa. TRATAMIENTO PARA DATOS NO AGRUPADOS. A qu se refiere esto? Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.

Medidas de tendencia central


Medidas de tendencia central. Se les llama medidas de tendencia central a la media aritmtica, la mediana, la media geomtrica, la moda, etc. debido a que al observar la distribucin de los datos, estas tienden a estar localizadas generalmente en su parte central. A continuacin definiremos algunas medidas de tendencia central y la forma de calcular su valor. 1) Media aritmtica ( x ). Tambin se le conoce como promedio ya que es el promedio de las lecturas o mediciones individuales que se tienen en la muestra, se determina con la frmula siguiente:

x=
donde: x = media aritmtica xi = dato i n = nmero de datos en la muestra

x
i =1

Ejemplos: 1. Se han tomado como muestra las medidas de seis cables usados en un arns para lavadora, las cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmtica. Solucin:
x=

15.2 + 15.0 + 15.1 + 15.2 + 15.1 + 15.0 = 15.1cm 6

2. Se toman varias muestras de cierto tipo de queso y se determina la cantidad de protena por cada 100 gramos de queso, encontrndose lo siguiente: 26.5 gramos, 24.8, 25.3, 30.5, 21.4, determine la cantidad promedio de protena encontrada en la muestra por cada 100 gramos de queso que se elabora. Solucin:
_

x=

26.5 + 24.8 + 25.3 + 30.5 + 21.4 = 25.7 grs 5

3. Se hacen varias lecturas de una muestra que contiene cobre, las lecturas se hacen en un espectrofotmetro de absorcin atmica y son la siguientes: 12.3%, 12.28, 12.27, 12.3, 12.24, 15.01, determine la concentracin promedio de Cu en la muestra. Solucin:
x=
_

12.3 + 12.28 + 12.27 + 12.3 + 12.24 + 15.01 76.4 = = 12.73%Cu 6 6

Si observamos las lecturas del espectrofotmetro nos damos cuenta que el valor de 15.01% es un valor diferente al de las lecturas anteriores, por lo que se descarta el valor ya que se considera un valor atpico, es decir un valor que es debido a circunstancias especiales, en este caso puede ser que se deba al hecho de que se est descalibrando el aparato de absorcin atmica o simplemente

que se ha equivocado el operador del aparato al tomar la lectura, por lo que la media se debe calcular con las primeras cinco lecturas; como se muestra a continuacin: Solucin:
12.3 + 12.28 + 12.27 + 12.3 + 12.24 61.39 = = 12.278%Cu 5 5 media correcta x=
_

y esta sera la

4. Si deseamos determinar la edad promedio de los estudiantes de una escuela de nivel superior al iniciar sus estudios, suponga que se toman las edades de algunos de los alumnos de cierta clase y estas son las que siguen: 20, 18, 18, 19, 18, 19, 35, 20, 18, 18, 19. Solucin:

Luego, la media se determinar con solo 10 de las edades ya que es necesario descartar la edad de 35 aos, que es un dato atpico o un caso especial, por lo que;
x=
_

20 + 18 + 18 + 19 + 18 + 19 + 20 + 18 + 18 + 19 187 = = 18.7 aos 10 10

Nota: Cuando es necesario determinar aquellas medidas de tendencia central que hagan uso de todos los datos de la muestra se recomienda descartar todos aquellos datos atpicos que se encuentren en la muestra o muestras tomadas. 2) Media geomtrica (G). Es la raz en ensima del producto de los valores de los elementos de la muestra, es usada cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios factores a la vez, se determina de la siguiente forma:

G = n x1 * x2 * ...* xn
Donde: G = media geomtrica xi = dato i n = nmero de datos en la muestra

Ejemplos: 1. Las siguientes temperaturas han sido tomadas de un proceso qumico, 13.4 oC, 12.8, 11.9, 13.6, determine la temperatura promedio de este proceso.

Solucin:
4 4 G = 13.4 x12.8 x11.9 x13.6 = 27758.7968 = 12.9077 oC

2.

Las siguientes temperaturas han sido tomadas de un proceso para fabricar queso chihuahua, 21.4oC, 23.1, 20.2, 19.7, 21.0, determine la temperatura promedio de este proceso.

Solucin:
5

G=

21.4 x 23.1x 20.2 x19.7 x 21.0 = 5 4131070.852 = 21.048 oC

3) Media aritmtica ponderada ( xw ). Esta media se usa cuando el peso que tiene cada uno de los datos de la muestra es diferente, se calcula de la siguiente manera:
k

x =
w

wi xi
i =1 k

wi
i =1

donde: xw = media aritmtica ponderada xi = dato i wi = peso del dato i Ejemplo: A continuacin se mencionan las materias que Luis Prez llev en el primer semestre de Ingeniera Qumica, el nmero de crditos y la calificacin obtenida; MATERIA Metodologa de la investigacin Matemticas I Programacin Qumica NUMERO CREDITOS 8 10 8 10 CALIFICACIN 90.5 100.0 81.0 78.0

Dibujo 4 100.0 Economa 8 84.0 Determine la calificacin promedio que obtuvo Luis Prez en su primer semestre. Solucin:
( 8 x90.5 ) + ( 10 x100.0 ) + ( 8 x81.0 ) + ( 10 x78.0 ) + ( 4 x100 ) + ( 8 x84.0 ) 8 + 10 + 8 + 10 + 4 + 8 = = 724 + 1000 + 648 + 780 + 400 + 672 4224 = = 88.0 48 48

Xw =

Nota: S comparamos este promedio con el que se obtiene usando simplemente la media aritmtica, que es un 88.91, nos damos cuenta de que este ltimo es mayor, por no tomar en cuenta el peso o nmero de crditos que aporta cada materia a la carrera que se estudia, el promedio de esta persona es menor al de la media aritmtica debido a que obtiene una calificacin baja es Qumica que es una de las materias que aporta ms crditos. 4) Media armnica (H). La media armnica se define como el recproco del promedio de los recprocos de cada uno de los datos que se tienen en la muestra, y se determina de la siguiente manera:
H = 1 1 / n1 / xi
i =1 n

1 / xi
i =1

Ejemplo: Determine la media armnica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09 Solucin:
H = = 5 = 1 / 3.1 + 1 / 2.8 + 1 / 2.84 + 1 / 3.05 + 1 / 3.09

5 5 = = 2.9703 0.3226 + 0.3571 + 0.3521 + 0.3279 + 0.3236 1.6833

5) Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en la muestra una vez que estos han sido ordenados segn su valor o magnitud. Para calcular la mediana se presentan dos casos:

a.

Cuando el nmero de datos en la muestra es impar.- En este caso despus de ordenar los datos de la muestra en cuanto a su magnitud, es decir de mayor a menor valor o de menor a mayor valor, se procede a localizar aquel dato que se encuentra justo en el centro de los datos o en la parte central de los mismos, el valor de este dato ser el que d valor a la mediana.

Ejemplo: Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arns de lavadora; se toman como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.

Solucin: Ordenando los datos de menor a mayor valor; 11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5 Se observa que el dato 11.3 es el que queda en la parte central, por lo que este es el que dar valor a la mediana; entonces, xmed = 11.3 cm. b. Cuando el nmero de datos en la muestra es par.- En este caso despus de ordenar los datos en cuanto a su magnitud, observamos que en la parte central de los datos no se encuentra dato alguno, en este caso, la mediana tomar el valor del promedio de dos datos; el que se encuentra antes de la parte central y el que se encuentra despus de la parte central.

Ejemplo: Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arns de lavadora; se toman como muestra ocho circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.1, 11.4 cm.

Solucin:

Ordenando los datos de mayor a menor valor,

11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11,1 cm.

Se observa que en la parte central de los datos no hay dato alguno por lo que la mediana se determina con el promedio de los datos subrayados, entonces,

Xmed =

11.3 + 11.2 = 11.25cm 2

Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen los datos en cuanto a su magnitud, ya que de no hacerlo, se incurrira en un grave error.

5)

Moda (xmod). La moda se define como aquel valor o valores que ms se repiten o que tienen mayor frecuencia entre los datos que se han obtenido en una muestra, la muestra de una poblacin nos genera la distribucin de los datos una vez que estos se han graficado y en esta grfica es posible observar la moda o modas de la misma, es por esto que una distribucin de datos puede ser amodal (carece de moda), unimodal (tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene ms de dos modas).

Ejemplos:

1.

Determine la moda de los datos que se muestran a continuacin, se refieren a la estatura de un grupo de jvenes; 1.60m, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.71, 1.70, 1.93, 1.87, 1.85

Solucin:

Estatura 1.60 1.65 1.70 1.71 1.85 1.87 1.93

Frecuencia 1 1 5* 2 1 1 1

La tabla muestra la distribucin de frecuencias de los datos o el nmero de veces que estos se repiten, la mayor frecuencia que es 5 corresponde a una estatura de 1.70m, por lo que esta sera la moda. Luego, xmod = 1.70m 2. Determine la moda de los siguientes datos que se refieren a la edad de alumnos de primer semestre del tecnolgico de Chihuahua, 18 aos, 17, 19, 21, 19, 18, 22, 22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35

Solucin: Edad 17 18 19 20 21 22 Frecuencia 2 8* 8* 2 2 3

35

En este caso se observa que las edades que ms frecuencia tienen son las de 18 y 19 aos, por lo que se concluye que existen dos modas, Xmod1= 18 aos , Xmod2= 19aos Hay que hacer notar que la frecuencia para ambas modas puede ser de igual magnitud o diferente, como en el caso que se ilustra.

Datos agrupados.
Tabla de frecuencia
Un a dis tr ibuc in de fr e c ue nc ia s o ta bla de fr ec ue nc ia s e s un a or de na c in en fo rma de ta bla d e l o s da tos e s ta ds tic os , a si g na n d o a ca da da to su fr e c ue nc ia c or r es pond ie nte . Tipos de fr e c ue nc ia Fr ec ue nc ia a bs oluta La fr e c ue nc ia a bs oluta es el nm e r o de v ec e s q ue ap a re ce un de te rmi na d o v a lor en u n e stu d io esta d sti co . Se rep re se n ta p o r f i . La s uma de la s fr ec ue nc ia s a bs oluta s n me ro to ta l d e d a to s, q u e se re p re se n ta p o r N . e s i gu a l a l

Pa ra i nd i ca r re su mid a me n te esta s su ma s se u ti li za la le tra gri e ga (si g ma ma y scu l a ) q ue se le e su ma o su ma to ri a .

Fr ec ue nc ia re la tiv a La fr e c ue nc ia re la tiv a es el c oc ie nte en tre la

f r ec ue nc ia a bs oluta d e u n de te rmi n ad o val o r y el nm e r o tota l de da tos . Se pu e d e e xp re sa r e n ta n to s p o r ci en to y se re p re se n ta po r n i .

La su ma d e l a s fre cu en ci a s re la ti va s e s i g ua l a 1 .

Fr ec ue nc ia ac um ula da La fr ec ue nc ia ac um ula da es la s um a de las

fr e c ue nc ia s a bs oluta s d e to d o s lo s va lor e s infe r ior e s o igua le s al v a lor co n si de ra d o . Se rep re se n ta p o r F i .

Fr ec ue nc ia re la tiv a ac um ula da

La fr e c ue nc ia re la tiv a a c um ula da es el c oc ie nte en tre la fr ec ue nc ia ac um ula da de un d e te rmin a d o va lor y e l nm e r o tota l de da tos . Se pu e de e xp re sa r en ta n to s p o r ci e n to .

Eje m plo Du ra n te el me s d e ju l io , e n un a ciu d a d se ha n re gi stra d o la s si g ui e n te s te mp e ra tu ra s m xi ma s: 32 , 3 1 , 2 8 , 29 , 3 3 , 3 2 , 31 , 3 0 , 3 1 , 31 , 2 7 , 2 8 , 29 , 3 0 , 3 2 , 31 , 31 , 3 0 , 3 0 , 2 9 , 29 , 30 , 30 , 3 1 , 3 0 , 3 1 , 34 , 33 , 33 , 2 9 , 2 9 . En l a pri me ra co l u mn a de l a ta b l a co l o ca mo s l a va ria b l e o rd e n ad a d e me no r a ma yo r, e n la se g u nd a h a ce mo s el re cu e n to y en l a te rce ra a no ta mo s l a fre cu e n ci a a b sol u ta .

xi 27 28 29 30 31 32

Re c ue nto I II

fi 1 2 6 7 8

Fi 1 3 9

ni 0 .03 2 0 .06 5 0 .19 4

Ni 0 .03 2 0 .09 7 0 .29 0 0 .0 5 16 0 .77 4 0 .87 1

1 6 0 .22 6 2 4 0 .25 8 2 7 0 .09 7

III

33 34

III I

3 1 31

3 0 0 .09 7 3 1 0 .03 2 1

0 .96 8 1

Este

ti p o

de

ta bla s

de

fre c ue nc ia s

se

u ti li za

co n

va r ia ble s dis cr e ta s .

D is tr ibuc i n de fr ec ue nc ia s a gr u pa da s La dis tr ibuc in de fr e c ue nc ia s a gr upa da s o ta bla c on da tos a gr upa dos se e mpl e a si l a s v ar ia ble s to ma n u n nm e r o gr a nde de v a lor es o la v ar ia ble e s c ontinua . Se a gr upa n lo s v a lor e s en inte r v a los q ue te n g an l a m ism a am plitud de n o mi n a do s c la s es . A ca d a c la s e se l e a si g na su fr e c ue nc ia c or r es pond ie nte .

Lm ite s de la c la se Ca d a c la s e e st de lim ita da po r e l lm ite infe r ior de la c las e y el lm ite s uper ior de la c las e .

Am plitud de la c la se La am plitud de la c la se es la dife r e nc ia en tre el lm ite s upe r ior e infe r ior d e la c las e .

Mar c a de c la s e La m ar c a de c la s e e s el punto me dio d e ca d a inte r va lo y es e l v a lor q ue re p re se n ta a to d o el inte r v a lo pa ra el c lc ulo de a l gu n o s pa r m e tr os .

C ons tr ucc in de una ta bla de da tos a gr upa dos 3 , 1 5 , 2 4 , 28 , 33 , 35 , 3 8 , 4 2 , 4 3 , 38 , 36 , 34 , 2 9 , 2 5 , 1 7 , 7 , 3 4 , 3 6 , 39 , 44 , 31 , 2 6 , 2 0 , 1 1 , 13 , 22 , 27 , 4 7 , 3 9 , 3 7 , 34 , 32 , 35 , 2 8 , 3 8 , 4 1 , 48 , 15 , 32 , 1 3 . 1 se lo ca li za n los val o re s me no r y ma yo r de la

di stri b u ci n . En este ca so so n 3 y 48 . 2 Se re stan y se b u sca un n me ro en te ro un p o co ma yo r qu e l a d i fe re n ci a y q ue sea di vi si b l e po r el n me ro de in te rva lo s de qu e ra mo s po n e r. Es co n ve n i en te qu e e l n me ro d e i n te rva l o s o scil e e n tre 6 y 15. En e ste ca so , 48 - 3 = 4 5 , i ncre me n ta mo s e l n me ro ha sta 50 : 5 = 10 in te rval o s.

Se fo rman lo s in te rval o s ten i e nd o p re sen te qu e e l l mi te in fe ri o r de un a cla se pe rte n e ce al in te rva l o , pe ro el l mi te sup e rio r no pe rte n e ce in te rva lo , se cu en ta en el si g ui e n te in te rva lo .

ci [0 , 5 ) [5 , 10 ) [1 0 , 1 5 ) [1 5 , 2 0 ) [2 0 , 2 5 ) [2 5 , 3 0 ) [3 0 , 3 5 ) [3 5 , 4 0 ) [4 0 , 4 5 ) [4 5 , 5 0 ) 2 .5 7 .5 1 2 .5 1 7 .5 2 2 .5 2 7 .5 3 2 .5 3 7 .5 4 2 .5 4 7 .5

fi 1 1 3 3 3 6 7 10 4 2 40

Fi 1 2 5 8 11 17 24 34 38 40

ni 0 .02 5 0 .02 5 0 .07 5 0 .07 5 0 .07 5 0 .15 0 0 .17 5 0 .25 0 0 .10 0 0 .05 0 1

Ni 0 .02 5 0 .05 0 0 .12 5 0 .20 0 0 .2 7 75 0 .42 5 0 .60 0 0 .85 0 0 .95 0 1

Medidas de tendencia central y de posicin


Medidas de tendencia central para un conjunto de datos y datos agrupados.
Teniendo la siguiente Tabla. LI LS Frecuencia Marca clase 5.97 6.18 6.19 6.40 6.41 6.62 6.63 6.84 6.85 7.06 7.07 7.28 Total 2 5 7 13 7 6 40 6.075 6.295 6.515 6.735 6.955 7.175

de Lmite real Lmite real Frecuencia Frecuencia inferior superior relativa Relativa acumulada 5.965 6.185 2/40 = 0.05 0.05 6.185 6.405 5/40=0.125 0.175 6.405 6.625 0.175 0.350 6.625 6.845 0.325 0.675 6.845 7.065 0.175 0.850 7.065 7.285 0.15 1.000 1.000

Media, media ponderada.


Media ( x ).
k
_

x=

x * f
i =1 i

( 6.075 )( 2 ) + ( 6.295 )( 5 ) + ... + ( 7.175 )( 6 ) 12.15 + 31.475 + ... + 43.05 = = 40 40

268.52 = 6.713 pu lg adas = 40

Donde: k = nmero de clases xi = marca de clase i fi = frecuencia de la clase i n=

f
i =1

nmero de datos en la muestra

Mediana.
Mediana (Xmed).

n / 2 Fme 1 40 / 2 14 Xmed = Li + A = 6.625 + ( 0.22 ) = 6.7265 fme 13


Donde: Li = lmite real inferior de la clase que contiene a la mediana Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se encuentra la mediana fme = frecuencia de la clase en donde se encuentra la mediana A = amplitud real de la clase en donde se encuentra la mediana A = LRS-LRI LRS = lmite real superior de la clase que contiene a la mediana LRI = lmite real inferior de la clase que contiene a la mediana N = nmero de datos en la muestra

Moda.
Moda (Xmod).
d1 6 X mod = Li + A = 6.625 + ( 0.22 ) = 6.735 pu lg adas d1 + d 2 6 + 6

Donde: Li = lmite real inferior de la clase que contiene a la moda fmo fmo 1 13 7 = 6 d1 = = fmo fmo + 1 13 7 = 6 d2 = = fmo = frecuencia de la clase que contiene a la moda fmo-1= frecuencia de la clase anterior a la que contiene a la moda fmo+1= frecuencia de la clase posterior a la que contiene a la moda A = amplitud real de la clase que contiene a la moda A = LRS LRI LRS = lmite real superior de la clase que contiene a la moda LRI = lmite real inferior de la clase que contiene a la moda

Relacin entre media, mediana y moda.

En el caso de distribuciones unimodales, la mediana est con frecuencia comprendida entre la media y la moda (incluso ms cerca de la media). En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y de inferencia suele ser ms apta la media. Veamos un ejemplo de clculo de estas tres magnitudes.

Ejemplo
Consideramos una tabla estadstica relativa a una variable continua, de la que nos dan los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni. Intervalos ci ni 0 -- 2 1 2 2 -- 4 3 1 4 -- 6 5 4 6 -- 8 7 3 8 - 10 9 2 Para calcular la media podemos aadir una columna con las cantidades los trminos de esa columna dividida por n=12 es la media: Intervalos ci ni Ni 0 -- 2 1 2 2 2 -- 4 3 1 3 4 -- 6 5 4 7 6 -- 8 7 3 10 8 - 10 9 2 12 12 64 2 3 20 21 18 . La suma de

La mediana es el valor de la variable que deja por debajo de s a la mitad de las n observaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Ni, y vemos que eso ocurre en la modalidad tercera, es decir,

Para el clculo de la , lo primero es encontrar los intervalos modales, buscando los mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos modas, correspondientes a las modalidades i=1, i=3. En el primer intervalo modal, (l0,1]=(0,2], la moda se calcula como

El segundo intervalo modal es (l2,l3]=(4;6], siendo la moda el punto perteneciente al mismo que se obtiene como:

En este caso, como se ve en la figura 2.5, la moda no toma un valor nico, sino el conjunto

Figura: Diagramas diferencial e integral con clculo geomtrico de la moda y de la mediana de la variable.

RELACIN ENTRE MEDIA Y MEDIANA En una distribucin simtrica, media, mediana y moda coinciden en valor. En una distribucin asimtrica positiva, la media siempre es mayor que la mediana. En una distribucin asimtrica negativa, la media siempre es menor que la mediana. Una medida de asimetra en estadstica, basada en la diferencia entre los valores de la media y la mediana de un grupo de valores, es el coeficiente de asimetra de Pearson.

USO DE MEDIA, MEDIANA Y MODA - La moda indica la posicin de la mayora de los valores observados, puede ser til como medida descriptiva de un grupo de la poblacin, aunque slo si existe una moda claramente perceptible. La mediana es siempre una medida excelente para representar el nivel "tpico" de los valores observados, tambin la media aritmtica es excelente como valor representativo de una poblacin, aunque slo si la poblacin es claramente simtrica, en datos no simtricos, los valores extremos distorsionarn el valor de la media como valor representativo, as, la mediana es por lo general una mejor medida de posicin de datos para la descripcin de datos de la poblacin.

Вам также может понравиться