Вы находитесь на странице: 1из 25

Edades de las Personas que Asisten a Cines Unidos, Ubicado en el Centro Comercial Regina (CCR) Puerto La Cruz.

Introduccin Bases tericas Distribucin de frecuencias. Medidas de tendencia central. Medidas de posicin. Medidas de dispersin. Conclusin Bibliografa INTRODUCCIN Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de maderas y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para descubrir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para analizar y relacionar dichos datos. La estadstica se puede definir como un conjunto de mtodos para manejar la recoleccin, presentacin y agrupacin de los datos, as como del anlisis, interpretacin, proyeccin e inferencia de ellos, y ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. En este trabajo se realizar un anlisis estadstico de las edades de las personas que asisten a Cines Unidos, ubicado en el Centro Comercial Regina (CCR) Puerto La Cruz, para el desarrollo de este anlisis se utilizar un conjunto de mediciones estadsticas que hemos venido estudiando a lo largo de toda la materia y que ayudaran en el anlisis de estos datos. Estas mediciones sern: Distribucin de Frecuencias. Medidas de Tendencia Central. Medidas de Posicin. Medidas de Dispersin. BASES TERICAS Estadstica: Se define como el conjunto de mtodos para manejar la obtencin, presentacin y anlisis de observaciones numricas. Es la recopilacin, presentacin y caracterizacin de la informacin en fin de que se auxilie tanto en el anlisis de datos como en el proceso de la toma de decisiones. Probabilstica: Es aquella que proporciona una base racional para tratar de resolver situaciones influidas por factores aleatorios. Poblacin: Es el conjunto de los elementos sobre el cual realizamos nuestro estudio. Es un conjunto de elementos con caractersticas comunes, que pueden ser finitos o infinitos. Muestra: Es un conjunto de medidas, observaciones tomadas a partir de una poblacin dada. Frecuencia: 1. 2. 3. 4. 5. 6. 7. 8.

Es el nmero de veces que se repite un valor, dato o trmino dentro de una serie en estudio. Tipos de frecuencias estadsticas: Frecuencia simple absoluta: es el nmero de veces que se observa en un mismo tem o la cantidad de datos que caen en un mismo intervalo. Frecuencia simple relativa: es la razn geomtrica entre la frecuencia absoluta y el total de datos, es decir el cociente de dividir el nmero de veces que aparece un dato de un intervalo entre la totalidad de datos que conforma la muestra de que se trate. Su mximo ser la unidad y su mnimo ser el cero. Frecuencia acumulada: es la suma de la frecuencia de un intervalo de clases con todas las frecuencias de los intervalos que la preceden. Frecuencia acumulada absoluta: es la evaluacin o suma de todas las frecuencias absolutas hasta el intervalo de la clase considerado inclusive. Frecuencia acumulada relativa: viene a ser la acumulacin de todas las frecuencias relativas hasta el mismo intervalo considerado inclusive. Variable: Es la caracterstica de inters sobre cada elemento de una poblacin o muestra y puede tomar diferentes valores. Variables estadsticas: Variable aleatoria: cuando los valores que asume la variable han sido antecedidos por una seleccin aleatoria de los objetos medidos o son resultados de algn proceso al azar. Variable continua: es aquella que tericamente puede tomar cualquier valor dentro de un intervalo. Variable discreta: es aquella que toma valores separados entre s por alguna cantidad. Variable cuantitativa: es aquella que asume valores acompaados de una unidad de medida. Variable cualitativa: es la que se refiere a la clasificacin, como estado civil, preferencia por una marca, etc. Datos: Son nmeros o medidas que han sido recopilados como resultado de observaciones. Los datos pueden provenir de recuentos tales como el nmero de personas que laboran en una empresa o de mediciones como el peso de una persona. Tipos de datos estadsticos: Datos simples: cuando a los datos no se les han aplicado algn tratamiento de agrupacin, pudiendo ser dichas series: a) Sin frecuencias: cuando no se repiten los valores. b) Con frecuencias: cuando se repiten los valores. Datos agrupados en clase: los datos se agrupan en clases con el fin de sintetizar, condensar, resumir o hacer ms fcilmente manejable la informacin. Las clases constan de un lmite inferior ( linf ) y de un limite superior ( l sup ). Tablas estadsticas: Son aquellas que estn formadas por la columna matriz y el cuerpo esta compuesto por ms de una columna y se dividen en simples y complejas. Grficos estadsticos: Son datos cuantitativos que vienen representados por dibujos geomtricos donde la longitud o el rea de una parte de la figura es proporcional a la cantidad o magnitud representada. Escala:

Es la asociacin de cosas distintas pero de la misma especie. Es el tamao o proporcin con el que se desarrolla un plan de ideas. Tipos de escala: Escala nominal: es aquella en que los nmeros solo se emplean para diferenciar los objetos o distintas categoras o cuando se emplean nombres. Escala ordinal: es aquella en la que los nmeros se utilizan para diferenciar de acuerdo con ciertos criterios jerrquicos, como son los nmeros que empleamos para clasificar los distintos extractos socioeconmicos o para designar preferencias. Escala de intervalos: es una escala ms especializada que la ordinal y la nominal en la cual es posible ordenar las mediciones y decir tambin cuanto difiere una situacin de otra. DISTRIBUCIN DE FRECUENCIAS. Es el conjunto de valores que puede presentar una variable junto con sus frecuencias, estas se pueden clasificar de acuerdo a sus tipos. Segn la naturaleza de la variable estudiada las distribuciones de frecuencia pueden ser: No agrupadas: se presentan cuando el nmero de valores que puede presentar una variable no es muy elevado y en ese caso podemos observar todos los valores de esa variable. Este caso se presenta cuando la variable es discreta y no presenta excesivos valores. Agrupados en intervalos: se presenta cuando la variable es continua o discreta pero con elevado nmero de valores. Es esta situacin se agrupan dichos valores en intervalos o clases. Se llama amplitud del intervalo a la distancia que existe entre los extremos de los intervalos de clases. Fila de datos: Sirve para ordenar en forma creciente los datos de acuerdo a su frecuencia. Se agrupan a partir del nmero ms pequeo de la muestra hasta el nmero mayor. n = nmero total de datos Rango: Resulta de la diferencia entre el lmite superior y el lmite inferior, existe en los datos no agrupados, se expresa con la siguiente ecuacin:

R = Lsup Linf
Nmero de clases: Se expresa por la siguiente ecuacin: n de clases = 1 + 3,32 log n Intervalo de clases: Es el cociente que resulta de dividir el rango entre el nmero de clases.

Ic =
Punto medio ( xi ):

R n o de _ clases

Es el valor promedio de cada intervalo de clase.

xi =

Linf + Lsup 2

Lmites reales: Es el resultado de restar 0,5 al lmite inferior de clases y luego sumar esa misma cantidad al lmite superior de clases. Histograma de frecuencia: Son segmentos de geometra rectangular graficado con el intervalo de clases o los lmites reales de clase. En el caso que se utilice la frecuencia simple se graficaran histogramas simples y en el caso de que se utilicen frecuencias acumuladas se graficaran histogramas acumulados. Polgonos de frecuencia: Se obtienen de la unin de puntos obtenidos con los puntos medios de cada clase y su frecuencia simple o acumulada dependiendo del tipo que se quiere graficar. MEDIDAS DE TENDENCIA CENTRAL. Es un valor, que es tpico o representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados segn su magnitud. Se pueden definir varios tipos de medidas de tendencia central, las ms comunes son la media aritmtica o brevemente media, la mediana y la moda. Media aritmtica ( X ): La media aritmtica o media de un conjunto de N nmeros se representa por X y se define como: Para datos no agrupados

X =

x
n

Donde: xi = cada uno de los datos. n = nmero total de datos. Para datos agrupados

X =

x
n

fi
Donde: xi = punto medio. fi = frecuencia simple relativa. n = nmero total de datos.

Mediana ( M d ): La mediana de una coleccin de datos ordenados en orden de magnitud es el valor medio o la media aritmtica de los dos valores medios. Para datos no agrupados

Md = X =

x
n

Para datos agrupados

n 2 fa M d = LI + Ic f i

LI = l inf fi 0,5

Donde: LI = frontera inferior de clase. Linf fi = lmite inferior de la franja modal fa = frecuencia acumulada anterior a la clase fi = frecuencia modal. n = nmero total de datos.

total.

Moda o modo ( M D ): La moda de una serie de nmeros es aquel valor que se presenta con la mayor frecuencia, es decir, es el valor ms comn. Para datos no agrupados Es el valor que mas se repite dentro de la muestra de datos. Para datos agrupados

A1 M D = LI + Ic A1 + A2
Donde: LI = frontera inferior de clases. A1 = fi fi ant fi ant = frecuencia modal anterior fi post = frecuencia modal posterior. Ic = intervalo de clases. A2 = fi fi post

MEDIDAS DE POSICIN. Son indicadores usados para sealar que porcentaje de datos dentro de una distribucin de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama Medidas de Tendencia Central . Pero estas medidas de posicin de una distribucin de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda sntesis de una distribucin se considerara como operativa si intervienen en su determinacin todos y cada uno de los valores de la distribucin, siendo nica para cada distribucin de frecuencias y siendo siempre calculable y de fcil obtencin. A continuacin se describen las medidas de posicin ms comunes utilizadas en estadstica, como lo son: Cuartiles: Hay 3 cuartiles que dividen a una distribucin en 4 partes iguales: primero, segundo y tecer cuartil. Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).

Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil). Cuartiles (Q1, Q2, Q3) a) Primer cuartil (Q1): Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante. Formula de Q1 para series de Datos Agrupados en Clase.

Q1 = Li +
Donde:

fi

f aa fi

Ic

f
4

: posicin de Q1, la cual se localiza en la primera frecuencia acumulada que la

contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada. Li, faa, fi, Ic : idntico a los conceptos vistos para Mediana pero referidos a la medida de la posicin correspondiente. b) Segundo cuartil (Q2): Coincide, es idntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie. c) Tercer cuartil (Q3): Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie. Formula de Q3 para series de Datos Agrupados en Clase.

3 f i Q3 = Li +
Donde:

4 fi

f aa

Ic

3 f i 4

: posicin de Q3, todo idntico al calculo de la Mediana.

Deciles (D1, D2, D9) Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9). El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante).

* fi 10

D1 = Li +

f aa

fi

Ic

* 5 f i D5 = Li + 10 fi

f aa

Ic = M d

* 9 f i D9 = Li + 10 fi

f aa

Ic

El D9 (noveno decil) supera al 90% y es superado por el 10% restante. Como se observa, son formulas parecidas a la del calculo de la Mediana, cambiando solamente la respectivas posiciones de las medidas. Percentiles (P1, P2, P99) Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99). El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restantes. Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.

* fi P1 = Li + 100 * 50 f i P50 = Li + 100 fi fi

f aa

Ic

f aa

Ic = M d

* 99 f i p99 = Li + 100 fi

f aa

Ic

El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante. Idnticas formulas al clculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida. Para determinar estas medidas se aplicara el principio de la mediana; as, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tecer cuartil se encuentra el 75 por ciento; el 80 decil ser el valor por encima del cual estar el 20 por ciento de los datos, etc. Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25 percentil, el tercer cuartil el 75 percentil, el cuarto decil el 40 percentil, etc. Datos no agrupados:

Se hace difcil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente: Si tenemos una serie de valores X1, X2, X3 Xn, se localiza el primer cuartil como el valor

1 n 1(n + 1) 3 n cuando n es par, y cuando n es impar. Para el tercer cuartil ser (n par); 4 4 4 3(n + 1) (n impar). 4 An A(n + 1) o donde A representa el nmero del textil. 6 6

En caso de los textiles ser

Para los deciles ser

An A(n + 1) o . 100 100

An A(n + 1) o siendo A el nmero del decil; y para los percentiles 10 10

Ejemplo: En una serie de 32 trminos se desea localizar el 4 sextil, 8 decil y el 95 percentil.

4 o sextil = 8 o decil =

4 32 = 21 6

8 32 = 25,6 10 95 2 95 o percentil = = 30,4 100


Esto significa que el 4 textil se encuentra localizado en el termino numero 21, es decir, el que ocupa la 21 posicin; el 8 decil se encuentra localizado entre el termino numero 25 y 26; y el 95 percentil entre la posicin 30 y 31. Calculo para una distribucin de frecuencia Para el clculo de esta medida en datos agrupados en una distribucin de frecuencia, se utiliza el mismo procedimiento estudiado para el clculo de la Mediana, el cual es: 1) Se efecta la columna de las frecuencias acumuladas. 2) Se determina la posicin del trmino cuyo valor se pretende calcular, en caso de ser el primer cuartil ser

1 fi 4

, si fuese el 95 centil

95 f i 100

etc.

3) Se verifica cual es la clase que lo contiene; para ello se utiliza la columna de las frecuencias acumuladas.

4) Se hace la diferencia entre el nmero que representa el orden de posicin cuyo valor se pretende calcular y la frecuencia acumulada de la clase anterior a la que lo contiene. 5) Se calcula la medida solicitada de acuerdo a la siguiente frmula:

P = 1i +

P f a 1 Ic fi

Donde: 1i: limite inferior de la clase que lo contiene. P: valor que representa la posicin de la medida. fi: la frecuencia de la clase que contiene la medida solicitada. fa-1: frecuencia acumulada anterior a la que contiene la medida solicitada. Ic: intervalo de clase. Ejemplo: Determinacin del primer cuartil, el cuartil textil, el sptimo decil y el 30 percentil. Salarios (I. de Clases) 200 299 300 399 400 499 500 599 600 699 700 800 N de empleados (fi) 85 90 120 70 62 36 fa 85 175 295 365 427 463

463 = 115,5 4

Li = 300 I c = 100

115,5 85 = 30,75
Q1 = 300 +

f i = 90

30,75 100 = 334 90

4 o sextil : posicin = 308,66 295 = 13,66 4 o S = 500 +

4(463) 1852 = = 308,66 6 6


f i = 70

13,66 100 = 59,51 70

7 o decil : posicin =

7(463) 3241 = = 324.,1 10 10

324,1 295 = 29,1


7 o D = 500 +

f i = 70
29,1 100 = 541,57 70 30(463) 13890 = = 138,9 100 100

30 o percentil : posicin = 138,9 85 = 53,9 30 o P = 300 +

f i = 90

53,9 100 = 359,88 90

Estos resultados nos indican que el 25 por ciento de los empleados ganan salarios por debajo de Bs. 334; que sobre Bs. 519,51 ganan el 33,33 por ciento de los empleados; que bajo 541,57 gana el 57 por ciento de los empleados y sobre Bs. 359,88 gana el 70 por ciento de los empleados. Muchas veces necesitamos conocer el porcentaje de valores que esta por debajo o por encima de un valor dado; lo que representa un problema contrario al anterior, esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento de valores inferiores y superiores al valor dado. Operacin que se resuelve utilizando la siguiente formula general:

f ( P Li ) 100 P = f a 1 + i N Ic
Donde: P: lugar percentil que se busca. P: valor reconocido en la escala X. fa-1: frecuencia acumulada de la clase anterior a la clase en que esta incluida P. fi: frecuencia de la clase que contiene a p. Li: limite inferior de la clase que contiene a P. Ic: intervalo de clase. N: frecuencia total. Ejemplo: Utilizando la distribucin anterior, determinar que porcentaje de personas ganan salarios inferiores a Bs. 450,00

120(450 400) 100 P = 175 + = 50,75 100 463


El 50,75 por ciento de las personas ganan salarios inferiores a Bs. 450. Mtodo grfico para fraccionar la distribucin Se pueden obtener en forma grfica, a travs de la curva de la frecuencia acumulada (ojiva).

Para ello basta despus de trazar la ojiva, llevar el orden de posicin de la medida que se quiere sobre la ordenada, trazar por ese punto una perpendicular toca a la ojiva, baja una paralela a la ordenada hasta tocar la abscisa; en el punto donde toque a dicho eje, se encontrar el valor buscado. Obtencin grfica de las medidas de posicin Similar o idntico a la distribucin grafica de la Mediana con la sola excepcin de que se llevara al eje vertical (frecuencias acumuladas) las especificas posiciones de cada indicador de posicin en particular. Ejemplo: Forma de obtener los indicadores de posicin (cuartiles, deciles y percentiles) para series de datos agrupados en clases: Supongamos la siguiente distribucin de frecuencias referidas a las estaturas que representaban 40 alumnos de un curso. (I. de Clases) 1,60 1,64 ** 1,68 * 1,72 1,76 Estaturas (mts) 1,639 1,679 1,719 1,759 1,80 N alumnos (fi) 5 8 15 10 2 fa 5 13 ** 28 38 * 40

f
Q3=?

= 40

3 f i Q3 = Li + 4 fi

f aa

Ic
120 = *30 4

posicin * Q3 =

3 f i 4

La cual se ubica en la primera fa que la contenga

Q3 = 1,72 +

30 28 0,04 10

Q3 = 1,72 + 0,008 1,73mts


Esta estatura de Q3 = 1,73 mts. Supera en la distribucin de frecuencia al 75% de los alumnos del curso y es superada por el 25% de los mismos D8 = ?

8 f i D8 = 10 fi

f aa

Ic
= 320 = *32 10

posicin * D8 =

8 f i 10

D8 = 1,72 +

32 28 0,04 10

D8 = 1,72 + 0,016 1,736mts


supera esta estatura de 1,736 mts a 8/10 partes de curso y es superado por las 2/10 partes restantes. P55 = ?

55 f i P55 = Li + 100 fi

f aa

Ic

posicin * P55 = P55 = 1,68 +

(55) f i 100

= * * 22

22 13 0,04 15

P55 = 1,68 + 0,024 1,70mts


Esta estatura supera al 55% de los alumnos del curso y es superada por el 45% restante. MEDIDAS DE DISPERSIN. Una medida del grado de variacin de un conjunto de valores de una variable estadstica la proporciona el propio rango o recorrido de la variable. Lo mas frecuente, sin embargo, es describir esa variacin mediante las diferencias entre esos valores y alguna medida de tendencia central. Para las variables cuantitativas, las medidas de dispersin mas utilizadas son la desviacin media y la desviacin tpica. Desviacin media (DM): Se conoce tambin como promedio de desviacin. Es igual a la media aritmtica de las desviaciones de una serie de valores respecto de su media aritmtica. Para una serie de N valores: X1, X2, X3, Xn, se define a travs de la siguiente expresin:

DM =
Desviacin tpica (S):

(x

X ) f i n

Se define como la raz cuadrada positiva del promedio aritmtico de los cuadrados de los desvos con respecto a la medida aritmtica y se considera como el indicador de variacin o dispersin ms importante.

S=
2

(x

X ) fi
2

Varianza (S ): La varianza se define como el cuadrado de la desviacin tpica. Su mayor utilidad se presenta en la estadstica inductiva. Se puede determinar como una medida de variacin promedio y se obtiene dividiendo la variacin total por el nmero de medidas.

(x =

X ) fi
2

Coeficiente de variacin (CV): Se define como el cociente que resulta de dividir la desviacin tpica entre la medida aritmtica X de la serie de datos, multiplicado luego por cien para que su resultado venga expresado en porcentaje.

( )

CV =

S 100 X

Coeficiente de Shepeard (CS): Se define como el cociente que resulta de dividir el intervalo de clases al cuadrado entre doce para luego restarlo con la varianza para ser utilizado en las distribuciones cuando ya se debe haber hecho un examen completo de la situacin.

CS = S 2

( I c )2
12

Anlisis Estadstico de las Edades de las Personas que Asisten a Cines Unidos Ubicado en el Centro Comercial Regina (CCR) Puerto La Cruz Distribucin de Frecuencias Muestra de datos 31 33 40 32 22 23 32 21 20 16 22 24 18 20 15 18 20 10 21 39 17 15 13 16 54 18 11 37 45 19 37 15 40 19 27 37 19 51 21 30 34 11 34 46 14 23 36 42 43 26 41 26 42 14 30 15 16 26 35 33 23 17 46 17 35 29 Fila de datos 10 = 1 11 = 2 12 = 0 13 = 1 10

16 = 3 17 = 3 18 = 3 19 = 3

18

22 = 2 23 = 3 24 = 1 25 = 0

10

28 = 0 29 = 1 30 = 2 31 = 1

14 = 2 15 = 4

20 = 3 21 = 3

26 = 3 27 = 1

32 = 2 33 = 2

34 = 2 35 = 2 36 = 1 37 = 3 38 = 0 39 = 1

40 = 2 41 = 1 42 = 2 43 = 1 44 = 0 45 = 1

46 = 2 47 = 0 48 = 0 49 = 0 50 = 0 51 = 1

52 = 0 53 = 0 54 = 1 3 n = 66

R = Lsup Linf R = 54 10 R = 44

n de clases =

1 + 3,32 log n = 1 + 3,32 log 66

n de clases = 7,04

Ic = Ic =

R n o de _ clases 44 7,04

I c = 6,25 6

Tabla de Distribucin de Frecuencias. I. de clase 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 - 57 fi 10 18 10 8 9 7 3 1 fa 10 28 38 46 55 62 65 66 xi 12,5 18,5 24,5 30,5 36,5 42,5 48,5 54,5 fir
10 66

far
10 66

fir% 0,15 0,27 0,15 0,12 0,13 0,10 0,04 0,01

far% 0,15 0,42 0,57 0,69 0,83 0,93 0,08 1

Limites reales 9,5 15,5 15,5 21,5 21,5 27,5 27,5 33,5 33,5 39,5 39,5 45,5 45,5 51,5 51,5 57,5

18 10 8 9 7 3

66 66

28 38 46 55 62 65 66

66 66

66 66 66 66

66 66 66 66 66

1 66

Polgono e Histograma de Frecuencia Acumulada

Polgono e Histograma de Frecuencia Simple

Medidas de Tendencia Central Medidas de Tendencia Central. Para datos no agrupados

X =
X =

x
n

= 1772

1772 66

X = 26,84

M d = X = 26,84 M D = 15
Para datos agrupados I. de clase 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 57 fi 10 18 10 8 9 7 3 1 fa 10 28 38 46 55 62 65 66 xi 12,5 18,5 24,5 30,5 36,5 42,5 48,5 54,5 xi fi 125 333 245 244 328,5 297,5 145,5 54,5

x
X =

f i = 1773

x
n

fi

LI = l inf fi 0,5 LI = 16 0,5 LI = 15,5

X =

1773 X = 26,86 66

n 2 fa M d = LI + Ic f i

66 2 + 10 M d = 15,5 + 6 18

M d = 29,83

A1 M D = LI + Ic A1 + A2

A1 = f i f iant A1 = 18 10

A1 = 8

8 M D = 15,5 + 6 8 + 8
A2 = f i f i post M D = 18,5 A2 = 18 10

A2 = 8

Medidas de Posicin Medidas de Posicin Datos agrupados I. de clases 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 57 Cuartiles: fi 10 18 10 8 9 7 3 1 fa 10 28 38 46 55 62 65 66

n = 66

3 f i

Q3 = Li +
3 f i 4

4 fi
=

f aa

Ic

Li = Linf 0,5 = 10 0,5 = 9,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5

Q3 = 9,5 +

49,5 0 6 10 3 f i f aa

Q3 = 39,2

Q3 = Li + 3 f i 4

4 fi =

Ic

Li = Linf 0,5 = 16 0,5 = 15,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5

Q3 = 15,5 +

49,5 10 6 18
f aa

Q3 = 28,66

3 f i

Q3 = Li +
3 f i 4

4 fi
=

Ic

Li = Linf 0,5 = 22 0,5 = 21,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5

Q3 = 21,5 +

49,5 28 6 10 f aa

Q3 = 34,4

3 f i

Q3 = Li + 3 f i 4

4 fi =

Ic

Li = Linf 0,5 = 28 0,5 = 27,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5 Q3 = 36,12

Q3 = 27,5 +

49,5 38 6 8 f aa

3 f i

Q3 = Li + 3 f i 4

4 fi =

Ic

Li = Linf 0,5 = 34 0,5 = 33,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5
Q = 35,83

Q3 = 33,5 +

49,5 46 6 9
f aa

3 f i

Q3 = Li +

4 fi

Ic

Li = Linf 0,5 = 40 0,5 = 39,5

Posic.Q3 =

3 f i 4

3 66 198 = 4 4

Posic.Q3 = 49,5
Q3 = 34,78

Q3 = 39,5 +

49,5 55 6 7
f aa

3 f i

Q3 = Li + 3 f i 4 =

4 fi

Ic

Li = Linf 0,5 = 46 0,5 = 45,5 Posic.Q3 = 49,5 Q3 = 20,5

Posic.Q3 =

3 66 198 = 4 4

Q3 = 45,5 +

49,5 62 6 3

3 f i

Q3 = Li + 3 f i 4

4 fi =

f aa

Ic

Li = Linf 0,5 = 52 0,5 = 51,5

Posic.Q3 =

3 66 198 = 4 4

Posic.Q3 = 49,5 Q3 = 41,5

Q3 = 51,5 +
Deciles:

49,5 65 6 1

* 9 f i D9 = Li +
* 9 f i 10

10 fi
=

f aa

Ic

Posic.D9 =

9 66 10

Posic.D9 = 59,4

D9 = 9,5 +

59,4 0 6 D9 = 45,14 10 * 8 f i f aa D8 = Li + 10 Ic fi

Posic.D8 =

* 8 f i 10

8 66 10

Posic.D8 = 52,8

D8 = 15,5 +

52,8 10 6 18
f aa

D8 = 29,76

* 3 f i

D3 = Li +

10 fi

Ic

Posic.D3 =

* 3 f i 10

3 66 10

Posic.D3 = 19,8

D3 = 21,5 +

19,8 28 6 10 f aa

D3 = 16,5

* 7 f i

D7 = Li + * 7 f i 10

10 fi =

Ic

Posic.D7 =

7 66 10

Posic.D7 = 46,2

D7 = 27,5 +

46,2 38 6 8 f aa

D7 = 33,65

* 6 f i

D6 = Li + * 6 f i 10

10 fi =

Ic

Posic.D6 =

6 66 10

Posic.D6 = 39,6

D6 = 33,5 +

39,6 46 6 9

D6 = 29,23

* 9 f i

D9 = Li +

10 fi

f aa

Ic

Posic.D9 =

* 9 f i 10

9 66 10

Posic.D9 = 59,4

D9 = 39,5 +

59,4 55 6 7 f aa

D9 = 43,27

* 9 f i

D9 = Li +
* 9 f i 10

10 fi
=

Ic
Posic.D9 = 59,4

Posic.D9 =

9 66 10

D9 = 45,5 +

59,4 62 6 3 f aa

D9 = 40,3

* 9 f i

D9 = Li + * 9 f i 10

10 fi =

Ic

Posic.D9 =

9 66 10

Posic.D9 = 59,4

D9 = 51,5 +
Percentiles:

59,4 65 6 1

D9 = 17,9

* 99 f i 100 fi =

P99 = Li + * 99 f i 100

f aa

Ic

Posic.P99 =

99 66 100

Posic.P99 = 65,34

P99 = 9,5 +

65,34 0 6 10
* 55 f i f aa

P99 = 48,70

P55 = Li +
* 55 f i 100

100 fi
=

Ic

Posic.P55 =

55 66 100

Posic.P55 = 36,3

P55 = 15,5 +

36,3 10 6 18 f aa

P55 = 24,26

* 35 f i

P35 = Li + * 35 f i 100

100 fi =

Ic

Posic.P35 =

35 66 100

Posic.P35 = 23,1 P35 = 18,56

P35 = 21,5 +

23,1 28 6 10

* 39 f i

P39 = Li + * 39 f i 100

100 fi =

f aa

Ic

Posic.P39 =

39 66 100

Posic.P39 = 25,74

P39 = 27,5 +

25,74 38 6 8 f aa

P39 = 18,30

* 28 f i

P28 = Li +

100 fi

Ic

Posic.P28 =

* 28 f i 100

28 66 100

Posic.P28 = 18,48
P28 = 15,15

P28 = 33,5 +

18,48 46 6 9
f aa

* 20 f i

P20 = Li + * 20 f i 100

100 fi =

Ic

Posic.P20 =

20 66 100

Posic.P20 = 13,2 P20 = 3,67

P20 = 39,5 +

13,2 55 6 7 f aa

* 15 f i

P15 = Li + * 15 f i 100

100 fi =

Ic

Posic.P15 =

15 66 100

Posic.P15 = 9,9 P15 = 58,7

P15 = 45,5 +

9,9 62 6 3 f aa

* 10 f i

P10 = Li +
* 10 f i 100

100 fi
=

Ic

Posic.P10 =

10 66 100

Posic.P10 = 6,6 P10 = 298,9

P10 = 51,5 +

6,6 65 6 1

Medidas de Dispersin

Medidas de Dispersin I. de clases 10 15 16 21 22 27 28 33 34 39 40 45 46 51 52 57 fi 10 18 10 8 9 7 3 1 xi 12,5 18,5 24,5 30,5 36,5 42,5 48,5 54,5

xi f i
125 333 245 244 328,5 297,5 145,5 54,5

xi X
14,36 8,36 2,36 3,64 9,64 15,64 21,64 27,64

(x X ) f ( x X )
i i

fi

143,6 150,48 23,6 29,12 86,76 109,48 64,92 27,64

2062,096 1258,012 55,696 105,996 836,366 1712,267 1404,868 763,969

(x X ) f
i

= 635,6
2

(x X )
i

f i = 8199,27

DM =

(x X ) f
i

DM =

635,6 66

DM = 9,63

S=

(x
i

X ) fi
2

n
2

S=

8199,27 66

S = 11,14

(x X ) =
n S 100 X
2 2 ( Ic )

fi

S2 =

8199,27 66

S 2 = 124,23

CV =

Cv =

11,14 100 26,86

C v = 41,47%

CS = S

12

CS

2 ( 6) = 124,23

12

CS = 121,23

CONCLUSIN Una ordenacin tabular de los datos en clases, reunidas las clases y con las frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. Los datos ordenados y resumidos, se suelen llamar datos agrupados. Aunque en el proceso de agrupamiento generalmente se pierde parte del detalle original de los

datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos. Para realizar una distribucin de frecuencias se deben seguir los siguientes procedimientos: Determinar la diferencia entre el mayor y el menor de los datos registrados y as encontrar el rango. Dividir el rango entre el nmero de clases para as obtener el intervalo de clases. Sumar el lmite inferior de clases con el lmite superior de clases y dividirlo entre dos para as obtener los puntos medios. Restarle 0,5 al lmite inferior de clases y luego sumarle esa misma cantidad al lmite superior de clases nos permite obtener los lmites reales. Los histogramas y polgonos de frecuencia son dos representaciones grficas de las distribuciones de frecuencias. Un histograma de frecuencia consiste en una serie de rectngulos que tienen sus bases sobre un eje horizontal (el eje x) con longitud igual al tamao de los intervalos de clase. Un polgono de frecuencia es un grfico de lnea trazado uniendo los puntos medios de los techos de los rectngulos en el histograma. Un promedio es un valor, que es tpico a representativo de un conjunto de datos. Como tales valores tienden a situarse en el centro del conjunto de datos ordenados segn su magnitud, los promedios se conocen tambin como medidas de tendencia central. Se pueden definir varios tipos de medidas de tendencia central las mas comunes son la media aritmtica, la mediana y la moda. Las medidas de posicin se usan para describir la posicin que tiene un valor de datos especficos en relacin con el resto de los datos. Las medidas de posicin ms conocidas son los cuartiles, los percentiles y los deciles. Un percentil es el valor sobre la escala de medida, debajo del cual cae un porcentaje dado de los datos en la distribucin. Cuartiles son los valores de las variables que dividen en cuartos a los datos ordenados; cada conjunto de datos posee tres cuartiles. El primer cuartil Q1, es un nmero tal que cuando mucho el 25% de los datos es menor en valor que Q1 y cuando mucho el 75% de los datos es mayor que Q1. EL segundo cuartil es la media. El tercer cuartil Q3, es un nmero tal que cuando mucho el 75% de los datos es menor en valor que Q3 y cuando mucho el 25% de los datos es mayor que Q1. Deciles son valores de un conjunto de datos que dividen el total de observaciones en diez partes y no en cuatro, como los cuartiles, o en 100, como los percentiles. As entre los deciles se encuentra el quinto decil (intervalo), que es otro nombre para la mediana. De todas las medidas de dispersin las ms empleadas son los percentiles y los cuartiles. Una medida del grado de variacin de un conjunto de valores de una variable estadstica la proporciona el propio rango o recorrido de la variable. Lo ms frecuente, sin embargo, es describir esa variacin mediante las diferencias entre esos valores y alguna medida de tendencia central. Las medidas de dispersin ms utilizadas son la desviacin media, la desviacin tpica, la varianza, el coeficiente de variacin y el coeficiente de Shepeard. BIBLIOGRAFA Armando, Soto Negrin. Principios de Estadstica. Editorial Panapo. 1999. Pg.: 71-81. Ernesto, Rivas Gonzlez. Estadstica General. Ediciones de la Biblioteca. Caracas. 2000. Pg.: 164-169. www.monografias.com www.google.com www.elrincondelvago.com

Вам также может понравиться