Вы находитесь на странице: 1из 23

COMPENDIO SEIS

LIC. JORGE OBANDO

ESTADISTICA DESCRIPTIVA
GRUPO 501
2015

DESVIACION MEDIA PARA DATOS NO AGRUPADOS


EJEMPLO:
Los siguientes datos fueron tomados en el laboratorio de fsica:
X = Espacio recorrido
t = tiempo
X Espacio (cm.)

10

20

30

40

Tiempo (seg.)

0.3

0.4

0.45

0.5

Calculemos el tiempo promedio


0.3 0.4 0.45 0.5
4
X

= 0,413

Miremos como los datos representados en segundos se acercan o se alejan de


este valor promedio.
n

Dm

Xi X

0.3 0.413 0.4 0.413 0.45 0.413 0.5 0.413

i 1

= 0.0625

0.063 es el error promedio que se comete al remplazar los segundos de cada


medida de cada uno de los datos por 0.413 segundos.
Esta distancia corta habla tambin de la homogeneidad de los datos y de la
confianza que se le debe tomar a esta media aritmtica

DESVIACION MEDIA PARA

DATOS AGRUPADOS

Xi = Marca de clase del

intervalo de referencia

= Media Aritmtica

f = frecuencia absoluta
n = nmero de datos
EJEMPLO:
La siguiente tabla representa

los salarios (Medidos en

miles de pesos diarios) de

50 trabajadores entre los

que se cuentan, celadoras,

aseadoras, secretarias de

un

Determine

ncleo

educativo.

la

desviacin

media de estos datos.


Salarios

Xi

f*Xi

Xi X

Xi X
*f

100 _ 200

10

150

1500

200

2000

200 _ 300

15

250

3750

100

1500

300 _ 400

350

1750

400 _ 500

10

450

4500

100

1000

500 _ 600

550

2750

200

1000

600 _ 700

650

3250

300

1500

Total

50

17500

7000

17500
50

= $350.000

Dm

Xi X

*f

i 1

7000
50

= 140

VARIANZA PARA DATOS NO

AGRUPADOS

EJEMPLO:
En una universidad de la regin

se nota que el promedio

de los hombres en las notas del

primer

corresponde a 3.2 y la suma de

los cuadrados de todas

las notas tiene un valor 900; y la

media de las mujeres es

de 3 con una suma de cuadrados

de 900; determine cul

de los dos grupos es mas variable

en

sabiendo que son 30 hombres y

20 mujeres.

Xi
n
n

Xi

900
(3.2)
30

rendimiento

= 30 10.24 = 19,76

i 1

S2m =

su

i 1

S2h =

periodo

900
(3)
20

45 9 = 36

Como la varianza es ms pequea en la de los hombres, podemos decir que el


grupo de las mujeres es mas variable en su rendimiento, entendindose por la
variabilidad en el hecho de que pueden existir estudiantes mujeres con notas ms
bajas que altas.

2. A la rectora del colegio han llegado 15 cajas con libros de diferentes


editoriales para ser revisados y evaluados por los docentes. El
encargado de abrir las cajas es el rector del colegio. El deber
seleccionar los libros por reas para entregarlos a los respectivos
profesores. En el transporte de los libros desde la editorial hasta la
rectora sufrieron algunos daos. Los siguientes datos representan las
cajas y la cantidad de libros que se han daado por caja.
C1=1

C2=2

C3=0

C6=3

C7=1

C8= 4

C11=0

C12=3

C13=1

C4=5

C5=2

C9=3

C10=1

C14=0

3 Cajas cada una con 0 libros daados

C15=5
Total Libros =

0
4 cajas cada una con 1 libro daado

Total Libros =

4
2 Cajas cada una con 2 libros daados

Total Libros =

4
3 Cajas cada una con 3 libros daados
9

Total Libros =

1 Cajas cada una con 4 libros daados

Total Libros =

4
2 Cajas cada una con 5 libros daados

Total libros =

10
Total de cajas 15; total de libros daados 31

Promedio de Libros daados por Caja: =

S2 =

31
15

= 2.06

(0 2.06 ) 2 * 3 (1 2.06 ) 2 * 4 (2 2.06 ) 2 * 2 (3 2.06 ) 2 * 3 (4 2.06 ) 2 (5 2.06 ) 2 * 2


2.72
15

Este valor pequeo de desviacin indica que el promedio de libros


daados por caja es confiable, se puede afirmar con seguridad dicho
valor.

VARIANZA PARA DATOS AGRUPADOS


EJEMPLO:
Se desea determinar la desviacin Standard de la situacin econmica de 50
familias clasificadas en diferentes estratos y que pertenecen a la comunidad
educativa de un colegio. Los datos expuestos en la siguiente tabla representan los
salarios que devengan dichas familias medidos en miles de pesos.
Salarios

100 _ 200

200 _ 300
300 _ 400

14
25

400 _ 500

500 _ 600

3
50

Para encontrar el valor de la varianza se elabora la siguiente tabla la que permitir


calcular primero la media y con la formula llegar al resultado esperado.
Salarios

100 _ 200
200 _ 300
300 _ 400
400 _ 500
500 _ 600

S2 =

17500

50
520.000
50

Xi
1
14
25
7
3

f*Xi

150
250
350
450
550

150
3500
8750
3150
1950
17500

X
X
(Xi- )2 (Xi- )2*f
40000
40000
10000
140000
0
0
10000
70000
90000
270000
520.00

$350.000 Salario promedio

=10.400

DESVIACION STANDART
Ejemplo de Aplicacin
Consideremos la distribucin de datos dado por los siguientes nmeros los que
representan el comportamiento de las valoraciones alcanzadas por tres
estudiantes en las asignaturas

de: Qumica, Fsica, espaol, trigonometra

filosofa para efecto de graficacin se ha hecho la siguiente semejanza.


D = 1;

I = 2;
Nombres

A = 3;
Qumica

S = 4;
Fsica

E= 5.
Espaol

Trigo

Filosofa

Juan Carlos Snchez

David Alejandro Morales

Laura Natalia Cspedes

Si reemplazamos la tabla de las valoraciones con su respectiva denominacin


obtenemos la tabla.
Nombres

Qumica

Fsica

Espaol

Trigo

Filosofa

Juan Carlos Snchez

David Alejandro Morales

Laura Natalia Cspedes

Aunque a simple vista podemos determinar cul es el estudiante con mejor


desempeo en las cinco asignaturas dejemos que el resultado de la desviacin
Standard calculada en Excel sea quien determine el estudiante con mayor
variabilidad.

Juan Carlos es el que presenta mayor variabilidad de su promedio, indica que


tiene valoraciones bajas y eso perjudica su promedio. David y Laura tienen la
misma desviacin Standard y aunque no tienen los mismos las mismas
valoraciones a los dos se les pueden clasificar en el mismo rango de rendimiento
acadmico.
COEFICIENTE DE VARIACION MEDIA:
Por

ejemplo, para una coleccin de datos que representan la edad de 15

estudiantes.
10

10

10

Calculemos la edad promedio

5 6 * 2 7 * 3 8 * 3 9 * 3 10 * 3
15

= 7,9 aos

Ahora la desviacin Standard

S=

Cv =

(5 7.9) 2 (12 7.9) 2 (21 7.9) 2 ( 27 7.9) 2 (30 7.9) 2


15
1.6mts
7.9mts

= 1,6 aos

= 0,20

EJERCICIOS DE APLICACIN
1. El ICFES decidi establecer un nuevo currculo para las materias de ciencias y
matemticas en las escuelas intermedias pblicas del pas. Para probarlo
selecciono 9 escuelas segn la disponibilidad de los maestros de esas escuelas y
la recomendacin de las secretarias de Educacin. Luego de implantados los
cambios, decidieron demostrar que esas escuelas son representativas del total de
escuelas

intermedias

pblicas

del

pas.

Utilizaron

como

criterio

de

representatividad el ingreso promedio (en miles de pesos) de los padres de


estudiantes que asisten a esas escuelas. Los resultados se resumen en la
siguiente grfica.

Los
resultados indican que en las nueve escuelas cerca del 72.5% de los estudiantes
estaban bajo el nivel de pobreza, mientras que en la poblacin de escuelas ese
porcentaje es del 79.75%. La desviacin estndar poblacional es de 7.8 puntos
porcentuales. Su conclusin es que como el 72.5% se encuentra a menos de una
desviacin estndar de la media poblacional de 79.75%, entonces no hay
diferencia significativa.
La conclusin del centro es errnea PORQUE Las escuelas de la muestra tienen
un nivel de pobreza promedio menor que los de la poblacin

2. Los siguientes datos representan las edades de los pacientes admitidos al


hospital departamental de Villavicencio durante el mes de agosto de este ao:
37 62 47 54

54

63

81 1

16 3

64

24

10

11 39 16 4

34

22 24

80 4

35 58

71 84 8

6
10.

Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al


hospital de la comunidad era de 8 aos. Hay suficiente evidencia para concluir

que la edad media de los pacientes admitidos durante el mes de agosto de este
ao es mayor que la edad mediana de los admitidos en el 2002?
I. se debe calcular la media y realizar una diferencia para establecer la evidencia
de la afirmacin
II. Se debe calcular la varianza para establecer la veracidad de la afirmacin
COMANDOS EN R

RESULTADO

>Datos=c(37,62,47,54,54,8,63,7,81,1,1
6,3,64,2,

>Rang

24,10,11,39,16,4,34,22,24,6,80,4,35,58,

83

71,84,8,10)
>Rang=max(Datos)min(Datos)
>m
5,95

>m=1+3.3*log10(32)

Se redondea por exceso 6


>C
13,83

>C =Rang/m

Se redondea por exceso a 14


>NRang
84
>NRang = C * m

NRang-Rang= 84 83 = 1
Xmin - 0.5 = 0.5
Xmax + 0.5 = 84.5

Edades
F
0.5 _

14.5

xi

f* xi

(Xi-

)2

(Xi-

)2*f

12

7.5

90

640.72

7688.64

14.5 _ 28.5

21.5

107.5

127.97

639.85

28.5 _ 42.5

35.5

142

7.22

28.88

42.5 _ 56.5

49.5

148.5

278.47

835.41

56.5 _ 70.5

63.5

254

941.72

3766.88

70.5 _ 84.5

77.5

310

1996.97

7987.88

32

1052

20947.54

Con los resultados de la tabla ya se puede hacer:


Media.

Variacin

Media

X=

( f * Xi)
i 1

1052

32

32.8125 = 33

S
2

S2

( Xi X )

*f

i 1

20947.54
32

=654.61

La edad promedio de los pacientes en este ao es de: 33 aos.


La edad promedio de los pacientes en el 2002 es de: 8 aos.
Mediactual-Media2002= 33-8= 25
3. Una compaa recoge informacin sobre los precios de libros de texto de
matemticas. En el 2000, el precio promedio para todos los textos de matemticas
era de $45.400, con una desviacin tpica de $100. Los precios de 32 libros de
matemticas seleccionados al azar durante este ao son:
50 40 41 48 48 42 49 50
48 45 56 41 57 42 45 46
45 66 45 45 55 66 42 50
46 46 55 48 45 58 47 35
El precio promedio de los libros para este ao es mayor que el precio de los libros
en el ao 2000 POR QUE, el coeficiente de variacin es tambin mayor.
COMANDOS EN R

RESULTADO

>Datos=c(50,40,41,48,48,42,49,50,48,
45,56,
41,57,42,45,46,45,66,45,45,55,66,42,5
0,46,
46,55,48,45,58,47,35)

>49

>Media=mean(Datos)

Coeficiente de
Media

Variacin

variacin

Media

( f * Xi)

i 1

1524

32

S
2

( Xi X )

*f

i 1

>X=c(35,40,41,42,45,46,47,48,

49,50,55,56,57,58,66)
X=
48.1875= 49 > D2=sum(Media-X)^2
> D2
[1] 148.5352
> Var=D2/n
> Var
[1] 4.641724

>
Cv=(sqrt(Var)/M
edia)*100
> Cv
[1] 4.471006
>
Cvx=45.4/100
> Cvx
[1] 0.454

El precio promedio actual de los libros: $48.187


El precio promedio de los libros en el ao 2000: $45.400

4. Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0,


5, se obtiene la serie Y: 12, 8, 0, 20, Para comprobar que las series
tienen el mismo coeficiente de variacin se debe

Calcular las medias de ambas series


Calcular la Varianza de ambas series

Medias

Varianza

Desviacin

coeficiente d

estndar

variacin

3+2+0+5
=
4

S2

( Xi X )

i 1

S S2

CV =
S 3.25

2.5

12+ 8+0+20
=
4

(3 2.5) 2 (2 2.5) 2 (0 2.5) 2 (5 2.5) 2


3.25
4

S2=

= 10

=72%

CV =

S 52

7.21
100 =
10

=
(12 10) (8 10) (0 10) ( 20 10)
52
4
2

S2=

1.80

1.80
100
2.5

72%

7.21

5. En una universidad de la capital, se ha Encontrado que los promedios en los 4


primeros semestres de las notas de Matemticas corresponden a: 3.2, 3.4, 3.0,
3.8, si la cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente,
y sabiendo que existe un 4 de Varianza, entonces el coeficiente de variacin del
promedio total de las notas de los cuatro semestres corresponde a:
A. 60.6 %

B. 70.6%

C. 75.6%

D. 65.6%

E. 55.6%

Notas
matriculado

1semestre
3.2
30

Nota
3,2
3,4
3,0
3,8

F
30
35
40
22
127

2semestre
3.4
35

3 semestre
3.0
40

4semestre
3.8
22

Media

Variacin

Notas=c (3.2, 3.4, 3.0, 3.8)


Matriculados=c(30,35,40,22)
nMatriculados=sum
(Matriculados)

S
2

S2

Media=sum

( Xi X )
i 1

Desviacin

Coeficiente de

estndar

variacin

*f

S S2
CV =
S 4

=4

(Matriculados*Notas)/nMatricu

=2

2
100
3,296963

=60%

lados
Media
[1] 3.296063

6. En una distribucin de datos correspondientes a salarios de 50 educadores de


un colegio, Se encontr que el salario promedio es de $600.000, con una varianza
de $625, se puede concluir que:
1. La varianza en el ejemplo representa una buena medida para establecer la
veracidad del dato promedio.
2. $600.000 de acuerdo a la desviacin Standard no es una medida suficiente
representativa.
3. La media de $600.000 es suficientemente representativa ya que la desviacin
estndar es pequea.
4. La media no est acorde con la realidad lo dice el enorme tamao de la
Varianza.

Media

Varianza

Desviacin

Coeficiente de

estndar

variacin

600

S2

( Xi X )

*f

S S2

Cv

S
X

Cv

25
600

i 1

S 625
= 25

S 2 625

Cv=4,16%

7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se


diseo un modelo para cualificar el desempeo acadmico de los estudiantes de
la U.C.C en el programa de Sistemas.
D = deficiente
R = Regular
B=bueno
S=Sobresaliente
E=Excelente
O=Optimo
.
Si en total existen 180 estudiantes con un promedio total de 3,4 y un coeficiente
de variacin del 2.5%, entonces cuntos estudiantes sobresalientes tiene la
facultad?

Coeficiente
n

180

Media

3,4

de variacin

2,5%

Estudiantes
Porcentajes
D = 2%
R = 10%
B=55%
S=25%
E=5%

sobresalientes
180
X

100%
25%

O=3%

=45

A. 100
B. 96
C. 45
D. 99
E. 9
8. La Varianza de todo el grupo corresponde a:
A. 0.085
B. 0.025
C. 7.2
D. 0.085
E. 0.0072
Desviacin
Coeficiente de variacin

Varianza
n

S2
CV =

0,085
100
3,4

=2,5%

( Xi X )

*f

estndar

S S2

i 1

S 0,0072

S 0,0072
2

0,085

9. Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la


desviacin estndar. sta mide la dispersin de los resultados del proyecto
azaroso. Es decir, si hay dos proyectos: A y B. Y si la desviacin estndar del
rendimiento del proyecto A es mayor que la del B. El proyecto A es ms
arriesgado, el B es ms Estable. Si ambos tienen valor esperado parecido el A
tiene posibilidades de rendir mucho ms que el B pero, tambin el A tiene
posibilidad de generar mayores prdidas que el B.

La Afirmacin anterior es verdadera porque:


A. La desviacin Standard mide la variabilidad de dos grupos A y B cualquiera.
C. La desviacin Standard permite comparar a dos grupos y decidir la estabilidad
del uno con respecto al otro.
D. La desviacin Standard mide el margen de error de un grupo con respecto a
otro.
E. La desviacin Standard mide la distancia entre los datos y la media aritmtica
F. La desviacin Standard mide el margen de error cometido al usar la media en
una distribucin
10. La resistencia de 100 baldosas de la fabrica De las casas se referencia en la
siguiente tabla.
Kg./Cm2

f* xi

(Xi-

)2

(Xi-

)2*f

SI

el

promedio

de

100_ 200

200_ 300

10

salario en la fbrica de

300_ 400

21

Las

400_ 500

33

$541.000

500_ 600

18

desviacin

600_ 700

es $1.791

700_ 800

casas

es
y

de
la

Standard

Concluimos que:

100

xi

A.

150

600

88804

355216

250

2500

39204

392040

350

7350

9604

201684

450

14850

132

550

9900

10404

187272

650

5850

40804

367236

750

3750
44.800

91204

456020
1.959.600

Es

mucho

dispersa

ms
la

informacin
correspondiente a la
resistencia
baldosas.

de

las

B. Es mucho ms dispersa la informacin correspondiente al salario de los


empleados.
C. Ambas informaciones presentan la misma dispersin y por tanto no se puede
tomar una decisin.
D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso
hace que el anlisis entre las dos informaciones sea indiferente
11. Se consulto en 30 almacenes de la capital el precio de monitores para
computador y se obtuvo los siguientes resultados en miles de pesos.
100

101

120

115

130

150

112

145

138

121

126

115

140

137

143

118

147

149

150

115

100

127

135

149

146

137

122

118

135

129

Elabore una distribucin de frecuencias, para datos agrupados, indicando los


valores de los lmites reales. Y calcule: Cuartil 2, Coeficiente de variacin,
Interpretacin con respecto al Cv.

COMANDOS EN R

RESULTADO

>Datos=c(100,100,101,112,115,115,115,
118,118,120,121,122,126,127,129,

>Rang

130,135,135,137,137,138,140,143,

50

145,146,147,149,149,150,150)
>Rang=max(Datos)min(Datos)
>m
>m=1+3.3 log10(30)

5,851
Se redondea por exceso a 6
>C

8,33

>C =Rang/m

Se redondea por exceso a 9.


>NRang
>NRang = C * m

54

>NRang=9*6

NRang-Rang= 54 50= 4
Xmin - 2 = 98
Xmax + 2= 152

Precios
f
98

xi

f* xi

(Xi-

)2

(Xi-

)2*f

107

102,5

307,5

712,89

2138,67

107 _

116

111,5

446

313,29

1253,16

116 _

125

12

120,5

602,5

75,69

378,45

125 _

134

16

129,5

518

0,09

0,36

134 _

143

23

138,5

969,5

86,49

605,43

143 _

152

30

147,5

1032,5

334,89

2344,23

30

3876

6720,3

Con los resultados de la tabla ya se puede hacer:

Clculo de la
media

variacin

Desviacin

Coeficiente de

estndar

variacin

segundo Cuartil

Media

( f * Xi)

i 1

3876

30

X=
129.2= 130

S2

( Xi X )

*f

S S2

i 1

6720,3
S
30

224,01

= 14.9669

224,01

CV =

14,9669
100
129,2

= 11%

2( 30)
= 15
4
sabemos que las operaciones se harn en el cuarto intervalo ya que en las
frecuencias acumuladas el valor de 15 queda perfectamente contenido en 16.
Por tanto:
Li = 125

2n
4

=15

Fa = 12 C=9

fo=4

Q2 =

2n

Fa

*C
Li 4

fo

. = 125 +

15 12

*9 = 131,75

Lo que indica que el 50 % de los precios de los monitores corresponden


a $131.450
SEGUNDO CUARTIL
COMANDOS EN R

RESULTADO

>precios=c(100,100,101,112,115,115,
115,118,118,120,121,122,126,127,

0% 25% 50% 75% 100%

129,130,135,135,137,137,138,140,

100.00 117.25 129.50 143.50 150.00

143,145,146,147,149,149,150,150)
>quantile(precios,prob=seq(0,1,length=5),type
=6)

13. En los siguientes enunciados uno es verdadero.


A. La media en una muestra de datos agrupados la divide en dos partes iguales.
B. Una distribucin de datos permite calcular todas las medidas de tendencia
central
C. La moda es un dato que permite analizar un resultado esperado.

D. Una medida de dispersin esta libre del clculo de la media


14. Cuando la media aritmtica de un determinado nmero de datos es
$270.50 y la desviacin tpica es de $33.99, el coeficiente de variacin
(CV) es igual a:
A. 6.2%
B. 795.82%
C. 2.6%
D. 5.4%
E. 1.8%

Вам также может понравиться