Вы находитесь на странице: 1из 24

1.

5 Medidas de tendencia central


a) Media aritmtica ( x ): Es aquella medida que se obtiene al dividir la suma de
todos los valores de una variable por la frecuencia total. En palabras ms
simples, corresponde a la suma de un conjunto de datos dividida por el nmero
total de dichos datos.

Formula:
- Para datos no agrupados:
n
x
x
n
i
i
=
=
1
tal que

=
=
k
i
i
f n
1

- Para datos agrupados : c
n
u f
x x
i
n
i
i
.
1
0
|
|
|
|
.
|

\
|
+ =

=

n
f x
x
n
i
i i
=
=
1
.

- Desviacin unitaria
c
x x
u
i
i
0

=
Ejemplo:
Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de
frecuencias y luego calcular la media aritmtica. El siguiente cuadro con las
medidas de 63 varas de pino lo ilustra.
Largo (en m) Frecuencia absoluta Largo por Frecuencia absoluta
5 10 5 . 10 = 50
6 15 6 . 15 = 90
7 20 7 . 20 = 140
8 12 8 . 12 = 96
9 6 9 . 6 = 54
Frecuencia total = 63 430


Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada
valor, por lo tanto, la tabla es una manera ms corta de anotar los datos (si la
frecuencia absoluta es 10, significa que el valor a que corresponde se repite 10
veces).


b) Moda (Mo): Es la medida que indica cual dato tiene la mayor frecuencia en un
conjunto de datos; o sea, cual se repite ms.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las
edades de nias de un Jardn Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
Ejemplo 2:
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este
conjunto de valores no tiene moda.
Formula:
Para datos agrupados : c L M
i
.
2 1
1
0
|
|
.
|

\
|
A + A
A
+ =
dnde :
1 1
= A
i i
f f

1 2 +
= A
i i
f f
c=amplitud (tamao del intervalo)

i
L =extremo inferior del intervalo donde se encuentra la moda

C) Mediana: Para reconocer la mediana, es necesario tener ordenados los valores
sea de mayor a menor o lo contrario. Usted divide el total de casos (N) entre dos, y
el valor resultante corresponde al nmero del caso que representa la mediana de
la distribucin.
Es el valor central de un conjunto de valores ordenados en forma creciente o
decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja
igual nmero de valores antes y despus de l en un conjunto de datos
agrupados.
Segn el nmero de valores que se tengan se pueden presentar dos casos:
Si el nmero de valores es impar, la Mediana corresponder al valor central de
dicho conjunto de datos.
Si el nmero de valores es par, la Mediana corresponder al promedio de los dos
valores centrales (los valores centrales se suman y se dividen por 2).
Formula:
Para datos agrupados :
1 2
.
n
i
i
i
F
Md L c
f

| | +
= +
|
\ .


Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5,
8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos
impares.
Ejemplo 2:
El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a
menor, y corresponde a un conjunto de valores pares, por lo tanto, la Med ser el
promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3


1.6 Medidas de Dispersin
- LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y
la moda slo nos revelan una parte de la informacin que necesitamos acerca de
las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn
de los datos, debemos medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
- Proporciona informacin adicional que permite juzgar la confiabilidad de la medida
de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posicin central es menos representativa de los datos.
- Ya que existen problemas caractersticos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersin antes de abordar
esos problemas.
- Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersin de valores con respecto al centro de distribucin o
esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad
de describirla. Ya que la dispersin ocurre frecuentemente y su grado de
variabilidad es importante, cmo medimos la variabilidad de una distribucin
emprica? Vamos a considerar slo algunas medidas de dispersin absolutas: el
rango, la varianza, la desviacin estndar y el coeficiente de variacin.

a) EL RANGO O RECORRIDO ( R ):
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar,
el rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el ms
bajo (X1 Xmin) en un conjunto de datos.

Rango para datos no agrupados;
R =Xmx.-Xmn =Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de 1er ao, a saber:
18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las edades), se
tiene que:

R =Xn-X1 =34-18 =16 aos


b) Varianza (S2 2 ):
La varianza es una medida de dispersin relativa a algn punto de referencia. Ese
punto de referencia es la media aritmtica de la distribucin. Ms especficamente,
la varianza es una medida de que tan cerca, o que tan lejos estn los diferentes
valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia
media aritmtica, mayor es la varianza; cuando ms cerca estn las Xi a su media
menos es la varianza. Y se define y expresa matemticamente de la siguiente
manera:


a) Para datos no agrupados:
n
x x
s
k
i
i
=

=
1
2
2
) (

2
1
2
2
x
n
x
s
k
i
i
=

=
(mtodo
alternativo)
b) Para datos agrupados :
|
|
|
|
|
.
|

\
|
|
|
|
|
.
|

\
|
=

= =
2
1
2
1 2 2
. .
.
n
u f
n
u f
c s
i
k
i
i i
k
i
i
(mtodo clave)
c) Para datos agrupados :
n
x x f
s
i
k
i
i
2
1 2
) .(
=

=


c) LA DESVIACIN ESTNDAR (S ):
Es una medida de la cantidad tpica en la que los valores del conjunto de
datos difieren de la media. Es la medida de dispersin ms utilizada, se le llama
tambin desviacin tpica. La desviacin estndar siempre se calcula con respecto
a la media y es un mnimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raz
cuadrada positiva de esta. A la desviacin se le representa por la letra minscula
griega "sigma" ( ) por la letra S mayscula, segn otros analistas.


Formula:

2
s s =

d) DESVIACIN MEDIA (DM)
a) Para datos no agrupados:
n
x x
DM
i

=
b) Para datos agrupados:
n
x x f
DM
i
n
i
i

=

=
.
1

Desviacin respecto a la media
La desviacin respecto a la media es la diferencia en valor absoluto
entre cada valor de la variable estadstica y la media aritmtica.
D
m
= |x - x|
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos
de las desviaciones respecto a la media.
La desviacin media se representa por


Ejemplo:
Calcular la desviacin media de la distribucin:
9, 3, 8, 8, 9, 8, 9, 18


Desviacin media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresin
de la desviacin media es:


Ejemplo:
Calcular la desviacin media de la distribucin:
x
i
f
i
x
i
f
i
|x -x| |x - x| f
i

[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.714 21.428
21 457.5 98.57




EJERCICIOS RESUELTOS:
Ejercicio 1.
1)- sean las siguientes cifras, los pesos en kilogramos de n = 53 personas. Se pide
construir una tabla de distribucin de frecuencias y hallar los estadsticos de
tendencia central y los estadsticos de dispersin.
45 50 50 62 60 52
80 63 65 64 47 67
72 70 73 49 54 60
64 61 79 52 62
40 64 61 65 81
69 60 60 70 43
87 43 59 46 57
54 77 60 53 68
58 80 54 64 61
60 90 51 75 59
Desarrollo:
1) Xmx = 90 , Xmin = 40
2) Rango Real (Rr)
Rr = Xmx Xmin = 90 40 = 50
3) m = 1 + 3.322 x Log(n) , n = tamao de la muestra - log(53)= 1.7242
m = 1 + 3.322 x (1.7242) = 6.7277 <> Redondeo = 7
m = 7
i) hallando amplitud c` = Rr/m
c` = 50/7 = 7.14 <> Redondeo = 8
ii) Hallamos el rango terico Rt =m.c
Rt = 7.8 = 56
iii) Hallamos el exceso Rt Rr = 56 50 = 6
iv) Repartimos a los extremos el valor de (Rt Rr)/2
6/2 = 3
V) Li = Xmin (Rt Rr)/2 Ls = Xmx + (Rt Rr)/2
Li = 40 3 = 37 Ls = 90 + 3 = 93
Lmite
de

Clases
Marca de
Clase(punto
medio)
Frecuencia
Absoluta
Desvo
de

Clase
Frecuencia
por Desvo
Desvos
al
cuadrado
Frecuencias
por desvos
al cuadrado
Frecuencia
Acumulada
haca
abajo
Frecuencia
Relativa
Frecuencia
Relativa
acumulada
hacia
abajo
Frecuencia
Porcentual
Li
Ls
Xi Fi Ui Fi Ui (Ui)^2 Fi*(Ui)^2 Fi Hi = fi/n Hi Fi%

[40
48>

44

6

-3

-18

9

54

6

0.1132

0.1132

11.32%

[48
56>

52

10

-2

-20

4

40

16

0.1887

0.3019

18.87%

[56
64>

60

16

-1

-16

1

16

32

0.3019

0.6038

30.19%

[64
72>

68

11

0

0

0

0

43

0.2075


0.8113


20.75%

[72
80>


76

5

1

5

1


5

48

0.0943

0.9056

9.43%

[80
88>

84

4

2

8

4

16

52

0.0755

0.9811

7.55%

[88
96]

92

1

3

3

9

9

53

0.0189

1

1.89%

n = 53

1

Tendencia Central
i) Media Aritmtica
1/53*(3300) =62.26kg
ii) Mediana (Md)
Hallando la ubicacin n/2 = 53/2 = 26.5
56 + (( 26.5-16)/16) * 8 = 56 + 5.25 = 61.25kg
iii) Moda (Mo)
56 + (6/(6+5))*8 = 56 + 4.36 = 60.45Kg

Estadsticos de Dispersin






0
2
4
6
8
10
12
14
16
18
40-48 48-56 56-64 64-72 72-80 80-88 88-96
Serie 3
Ejercicio 2 : Sean las siguientes cifras, las calificaciones del curso de mtodos
numricos en forma vigesimal del turno maana y turno tarde de los alumnos del lll
ciclo de la universidad Privada ALAS PERUNAS. Se pide construir una tabla de
distribucin de frecuencias y hallar los estadsticos de tendencia central, los
estadsticos de dispersin y realizar comparaciones para determinar la relacin
entre los dos grupos
TURNO MAANA TURNO
TARDE
12 19 17 16 12 13
08 15 18 18 13 15
09 11 19 12 15 14
11 10 13 10 08 05
10 5 15 06 07 08
12 08 16 07 16 07
13 13 09 08 15 18
07 14 18 16 12 07
09 16 07 15 14 15
15 12 12 12 12 16
Desarrollo:
Turno Maana
1) Xmx = 19 , Xmin = 5
2) Rango Real (Rr)
Rr = Xmx Xmin = 19 5 = 14
3) m = 1 + 3.322 x Log(n) , n = tamao de la muestra - log(60)= 1.7781
m = 1 + 3.322 x (1.7781) = 6.9068 <> Redondeo = 7
m = 7
i) hallando amplitud c` = Rr/m
c` = 14/7 = 2
ii) Hallamos el rango terico Rt =m.c
Rt = 7 x 2 = 14
iii) Hallamos el exceso Rt Rr = 14 14 = 0
iv) Repartimos a los extremos el valor de (Rt Rr)/2
8 13 12 05 12 13
11 15 13 11 11 12
12 12 11 13 09 08
08 13 08 05 08 06
09 16 06 07 12 07
05 15 12 11 13 05
13 08 13 12 09 12
06 07 05 08 18 13
07 12 14 13 12 05
11 12 12 14 13 11
0/2 = 0
V) Li = Xmin (Rt Rr)/2 Ls = Xmx + (Rt Rr)/2
Li = 5 - 0 = 5 Ls = 19 + 0 =19

TURNO TARDE
1) Xmx = 18 , Xmin = 5
2) Rango Real (Rr)
Rr = Xmx Xmin = 18 5 = 13
3) m = 1 + 3.322 x Log(n) , n = tamao de la muestra - log(60)= 1.7781
m = 1 + 3.322 x (1.7781) = 6.9068 <> Redondeo = 7
m = 7
i) hallando amplitud c` = Rr/m
c` = 13/7 = 1.8571 <> REDONDEO = 2
ii) Hallamos el rango terico Rt =m.c
Rt = 7 x 2 = 14
iii) Hallamos el exceso Rt Rr = 14 13 = 1
iv) Repartimos a los extremos el valor de (Rt Rr)/2
1/2 = 0.5
V) Li = Xmin (Rt Rr)/2 Ls = Xmx + (Rt Rr)/2
Li = 5 0.5 = 4.5 Ls = 18 + 0.5 =18.5






Lmite
de

Clases
Marca de
Clase(punto
medio)
Frecuencia
Absoluta
Desvo
de

Clase
Frecuencia
por Desvo
Desvos
al
cuadrado
Frecuencias
por desvos
al cuadrado
Frecuencia
Acumulada
haca
abajo
Frecuencia
Relativa
Frecuencia
Relativa
acumulada
hacia
abajo
Frecuencia
Porcentual
Li
Ls
Xi Fi Ui Fi Ui (Ui)^2 Fi*(Ui)^2 Fi Hi = fi/n Hi Fi%

[5
7>

6

3

-3

-9

9

27

3

0.0500

0.0500

5%

[7
9>

8

11

-2

-22

4

44

14

0.1833

0.2333

18.33%

[9
11>

10

6

-1

-6

1

6

20

0.1000

0.3333

10%

[11
13>

12

10

0

0

0

0

30

0.1667


0.5000


16.67%

[13
15>


14

9

1

9

1


9

39

0.1500

0.6500

15%

[15
17>

16

14

2

28

4

56

53

0.2333

0.8833

23.33%

[17
19]

18

7

3

21

9

63

60

0.1167

1

11.67%

n = 60

1


Turno Maana


Lmite
de

Clases
Marca de
Clase(punto
medio)
Frecuencia
Absoluta
Desvo
de

Clase
Frecuencia
por Desvo
Desvos
al
cuadrado
Frecuencias
por desvos
al cuadrado
Frecuencia
Acumulada
haca
abajo
Frecuencia
Relativa
Frecuencia
Relativa
acumulada
hacia
abajo
Frecuencia
Porcentual
Li
Ls
Xi Fi Ui Fi Ui (Ui)^2 Fi*(Ui)^2 Fi Hi = fi/n Hi Fi%

[5
7>

6

9

-3

-27

9

81

9

0.1500

0.1500

15%

[7
9>

8

11

-2

-22

4

44

20

0.1833

0.3333

18.33%

[9
11>

10

3

-1

-3

1

3

23

0.0500

0.3833

5%

[11
13>

12

20


0

0

0

0

43

0.3333


0.7166


33.33%

[13
15>


14

13

1

13

1


13

56

0.2167

0.9333

21.67%

[15
17>

16

3

2

6

4

12

59

0.0500

0.9833

5%

[17
19]

18

1

3

3

9

9

60

0.0167

1

1.67%

n = 60

1

Turno Tarde
Tendencia central
Turno Maana
i) Media Aritmtica
1/60*(763) =12.72
ii) Mediana (Md)
Hallando la ubicacin n/2 = 60/2 = 30
11 + ((30-20)/10) * 8 = 11 + 8 = 19
iii) Moda (Mo)
11 + (4/(4+1))*8 = 11 + 6.4 = 17..4
Turno Tarde
i) Media Aritmtica
1/60*(660) =11
ii) Mediana (Md)
Hallando la ubicacin n/2 = 60/2 = 30
11 + ((30-23)/20) * 8 = 11 + 2.8 = 13.8
iii) Moda (Mo)
11 + (17/(17+7))*8 = 11 + 5.67 = 16.67

Relacin entre los dos turnos
i) Igual tamao de la muestra
ii) Misma cantidad de alumnos que tienen como notas entre [7,9>
ii) Hay mayor cantidad de alumnos desaprobados que aprobados (40- 36
respectivamente)




Estadsticos de Dispersin




0
2
4
6
8
10
12
14
16
5 ~ 7 7 ~ 9 9 ~ 11 11 ~ 13 13 ~ 15 15 ~ 17 17 ~ 19
Turno Maana
Serie 3
0
5
10
15
20
25
5 ~ 7 7 ~ 9 9 ~ 11 11 ~ 13 13 ~ 15 15 ~ 17 17 ~ 19
Turno Tarde
Serie 3


Ejercicio 3
Sean las siguientes cifras, los pesos en kilogramos de n=60 personas. Se pide
construir una tabla de distribucin de frecuencias y hallar los estadsticos de
tendencia y los estadsticos de dispersin.
40 56 98 57 57 67
46 59 67 76 89 68
58 86 98 87 67 79
69 68 78 66 76 98
48 54 67 67 59 78
59 46 78 88 76 67
73 78 76 77 89 89
77 46 78 77 78 76
79 97 56 45 56 67
90 64 56 47 47 68
Desarrollo:
1) Xmx = 98 , Xmin = 40
2) Rango Real (Rr)
Rr = Xmx Xmin = 98 40 = 58
3) m = 1 + 3.322 x Log(60) , n = tamao de la muestra - log(60)= 1.7781
m = 1 + 3.322 x (1.7781) = 6.9068 <> Redondeo = 7
m = 7
i) hallando amplitud c` = Rr/m
c` = 58/7 = 8.28 <> Redondeo = 9
ii) Hallamos el rango terico Rt =m.c
Rt = 7 x 9 = 63
iii) Hallamos el exceso Rt Rr = 63 58 = 5
iv) Repartimos a los extremos el valor de (Rt Rr)/2
5/2 = 2.5
V) Li = Xmin (Rt Rr)/2 Ls = Xmx + (Rt Rr)/2
Li = 40 2.5 Ls = 98 + 2.5 =
Li = 37.5 Ls = 100.5
Lmite
de

Clases
Marca de
Clase(punto
medio)
Frecuencia
Absoluta
Desvo
de

Clase
Frecuencia
por Desvo
Desvos
al
cuadrado
Frecuencias
por desvos
al cuadrado
Frecuencia
Acumulada
haca
abajo
Frecuencia
Relativa
Frecuencia
Relativa
acumulada
hacia
abajo
Frecuencia
Porcentual
Li
Ls
Xi Fi Ui Fi Ui (Ui)^2 Fi*(Ui)^2 Fi Hi = fi/n Hi Fi%

[40
49>

44.5

8

-3

-24

9

72

8

0.1333

0.1333

13.33%

[49
58>

53.5

6

-2

-12

4

24

14

0.1000

0.2333

10%

[58
67>

62.5

7

-1

-7

1

7

21

0.1167

0.3500

11.67%

[67
76>

71.5

13

0

0

0

0

34

0.2167


0.5667


21.67%

[76
85>


80.5

15

1

15

1


15

49

0.2500

0.8167

25%

[85
94>

89.5

7

2

14

4

28

56

0.1167

0.9334

11.67%

[94
103]

98.5

4

3

12

9

36

60

0.0666

1

6.66%

n = 60

1

100%
Tendencia Central
i) Media Aritmtica
1/60*(4272) =71.2kg
ii) Mediana (Md)
Hallando la ubicacin n/2 = 60/2 = 30
67 + (( 30 - 21)/13) * 9 = 67 + 6.23 = 73.23kg
iii) Moda (Mo)
67 + (6/(6-2))*9 = 56 + 13.5 = 69.5Kg

Estadsticos de dispersin

0
2
4
6
8
10
12
14
16
40-49 49-58 58-67 68-76 76-85 85-94 84-103
Serie 3

Вам также может понравиться