Вы находитесь на странице: 1из 141

ESTADISTICA APLICADA

HERNANDO CAAS ROJAS


Objetivo:
- Leer e interpretar informacin de tablas y grficos
- Recopilar y comunicar informacin utilizando los procedimientos
ms adecuados a la caracterstica de lo que se va a informar.
90
80
70
60
Este
Oeste
Norte

50
40
30
20
10
0

1er trim. 2do trim. 3er trim. 4to trim.

Qu es Estadstica?
Es la ciencia encargada de recoger, clasificar, describir y analizar
datos numricos que sirvan para deducir conclusiones y tomar
decisiones a partir de estos anlisis.
La Estadstica se divide en dos grandes
grupos:
Estadstica descriptiva o deductiva:
Se ocupa de la recoleccin, organizacin y representacin
de
datos en forma
coherente.
Estadstica
inductiva
o inferencial:
Se ocupa de interpretar los datos recogidos y obtener
conclusiones a partir de ellas.

Qu es una poblacin?
Poblacin o Universo: Es el conjunto de todos los individuos u
objetos que poseen alguna caracterstica comn observable.
Una poblacin puede ser finita o infinita.
Ejemplo:
- La poblacin consistente en la fabricacin de brocas, en
una empresa determinada, en un da determinado, es finita.
- La poblacin formada por todos los posibles sucesos (caras o
sellos en tiradas sucesivas de una moneda es infinita.
- La poblacin formada por los Nmeros Naturales es infinito
- La poblacin formada por el nmero de alumnos de un Universidad
determinada, en un ao determinado es finito.

Qu es una muestra?
Muestra es un subconjunto de la poblacin. Es una parte de ella.
Se dice que una muestra es representativa de la poblacin, cuando
corresponde ms o menos al 20% de ella. Y se pueden deducir
importantes conclusiones acerca de sta, a partir del anlisis de
la misma.
Ejemplo:
Poblacin: Campos petroleros en Colombia.
Muestra: Campos que tiene Ecopetrol.

Qu es una variable?
Una variable es la caracterstica o atributo a observar.
El conjunto de valores asignados a la variable se llama dato o
dominio de la variable.
Las variables pueden ser continuas o discretas.
Variable continua es aquella que puede tomar cualquier valor
entre dos valores dados, es decir, en un rango determinado.
Ejemplo:
La estatura de los alumnos de un cuarto bsico es continua,
porque pueden medir 1,70 m 1,72 m 1,708 m etc

Variables discreta son aquellas que toman un valor entero


Ejemplo:
El nmero de hijos de una familia es discreta, porque puede
haber 1, 2, 3, ....etc. hijos

Ejercicios
Decir de las variables siguientes cules representan datos

discretos o datos continuos.


Nmero de acciones vendidas cada da en un mercado de

valores.
Respt: Discreta

Temperaturas registradas cada media hora en un observatorio.

Respt:

Continua

Perodo de duracin de taladros producidos por una

empresa determinada
Respt: Continua
Censos de Ingenieros egresados.

Respt: Discreta
Nmero de billetes de $10000 circulando en Colombia

Respt: Discreta
Pulgadas de precipitacin en una ciudad durante varios meses
del ao.
Respt: Continua

Alumnos matriculados en la UIS, en

los ltimos cinco aos.


Respt: Discreta
Dar el dominio de cada una de las siguientes variables y decir

si son continuas o discretas.


Nmero de litros de agua en una mquina de lavar.

Dominio : cualquier valor de cero litros a la capacidad de la


mquina ( 12,3 12,005 12,0047 etc)
Variable : Continua
Nmero de libros en un estante de librera.

Dominio : 0, 1, 2, 3, ........ Hasta el mayor nmero de libros


que puedan entrar en el estante.
Variable : Discreta

Suma de puntos obtenidos en el lanzamiento de un par de

dados
Dominio : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Variable : Discreta
Tiempo de vuelo de un proyectil

Dominio : De cero en adelante ( 5 5,3 5.045 etc)


Variable : Continua
Estado civil de un individuo

Dominio : Casado, soltero, viudo


Variable : Discreta
Velocidad de un automvil en kilmetros por hora.
Dominio : De 0 en adelante ( 120 120,8 120,04 etc)
Variable : Continua

Distribuciones de frecuencias
Toma de datos: Es la obtencin de una coleccin de los mismos
que no han sido ordenados numricamente.
Ejemplo: Conjunto de alturas de 100 estudiantes, sacados de una
lista alfabtica de una Universidad.
Ordenacin: Es una colocacin de los datos numricos tomados,
en orden creciente o decreciente de magnitud.
Ejemplo:
32 , 45, 100, 120 , 145, 186, 198, 200 ( ordenacin creciente )
200, 198, 186, 145, 120, 100, 45, 32 ( ordenacin decreciente)

Al recoger informacin se obtiene un gran nmero de datos,


que conviene presentar en forma resumida en una tabla llamada
distribucin de frecuencias.
Frecuencia absoluta: es el nmero de veces que se repite un
valor
de la variable.

Ejemplo:
Los siguientes datos son las calificaciones obtenidas, en la
asignatura de Matemtica, por un grupo de 30 alumnos:
7354345657326546
3 - 4 5 2 - 7 4 5 7 6 5 4 2 3 - 1
Variable Estadstica
Calificacin

Frecuencia absoluta
N de alumnos

Frecuencia acumulada hasta un valor determinado: es el nmero


de observaciones menor o igual al valor considerado.
Se obtiene sumando sucesivamente las frecuencias absolutas.
Ejemplo:
Variable estadstica

Frecuencia absoluta

Frecuencia acumulada
-------------

Calificacin

N de alumnos

15

22

26

30

Frecuencia relativa: es el cuociente entre la frecuencia absoluta


y el nmero total de individuos de la muestra

Variable estadstica

Frecuencia absoluta Frecuencia relativa

Calificacin

N de alumnos

-----------

1 / 30

3 / 30

5 / 30

6 / 30

7 / 30

4 / 30

4 / 30

NOTA: La suma de las frecuencias relativas es igual a 1


Ej. 1 / 30 + 3 / 30 + 5 / 30 + 6 / 30 + 7 / 30 + 4 / 30 + 4 / 30 = 30 / 30
= 1

Frecuencia relativa porcentual: Es la frecuencia relativa


expresada en porcentajes.

Variable estadstica Frecuencia absoluta

Frecuencia relativa porcentual

Calificacin

N de alumnos

-----------

( 1 / 30 ) 100

( 3 / 30 ) 100

( 5 / 30 ) 100

( 6 / 30 ) 100

( 7 / 30 ) 100

( 4 / 30 ) 100

( 4 / 30 ) 100

NOTA: La suma de las frecuencias relativas porcentuales es el


100%

Ejercicios
Los siguientes datos son las calificaciones de un grupo de 27

alumnos en la asignatura de matemtica:


5 6 5 7 4 2 3 5 4 6 7 5 4 6 5 4 5 6
4 3 4 6 7 5 4 5 6
a) Construya una tabla de distribucin de frecuencias
b) Cuntos alumnos tienen nota inferior a 5?
c) Qu porcentaje de alumnos tiene nota 4?
d) Cuntos alumnos tiene nota 6?
e) Qu porcentaje de alumnos tiene nota superior o igual a 4?

Respuesta
Calificacin

frecuencia

Frecuencia
acumulada

Frecuencia
relativa

Frec. relat.
porcentual

1 / 27 = 0,037

3,7

2 / 27 = 0,074

7,4

10

7 / 27 = 0,259

25,9

18

8 / 27 = 0,296

29,6

24

6 / 27 = 0,222

22,2

27

3 / 27 = 0,111

11,1

b) 10 alumnos tienen nota inferior a 5,0


c) El 25,9% de los alumnos tiene nota 4,0
d) 6 alumnos tienen nota 6,0
e) El 88,8% de los alumnos tiene nota igual o superior a 4,0

Una encuesta realizada a alumnos de Bachillerato acerca

de su futura profesin, indica lo siguiente:


Variable
profesin

F. absoluta
N de alumnos

Ingeniera

10

Medicina

Economa

12

Periodismo

Derecho

Arquitectura

Otras

10

a) Completar la tabla con frecuencia

acumulada, relativa y relativa


porcentual.
b) Cuntos alumnos fueron encuestados?
c) Cul es la profesin que tiene mayor
preferencia?
d) Qu porcentaje de alumnos prefiere
arquitectura?
e) Qu porcentaje de alumnos prefiere
medicina?

Respuesta
Profesin

Frecuencia

F. acumulada

F. relativa

Ingeniera

10

10

10 / 60 = 0,166

16,6

Medicina

16

6 / 60 = 0,100

10,0

Economa

12

28

12 / 60 = 0,200

20,0

Periodismo

36

8 / 60 = 0,133

13,3

Derecho

41

5 / 60 = 0,083

8.3

Arquitectura

50

9 / 60 = 0,150

15,0

Otros

10

60

10 / 60 = 0,166

16,6

b) 60 alumnos fueron encuestados


c) Economa es la profesin con mayor frecuencia
d) El 15% de los alumnos prefiere Arquitectura
e) El 10% de los alumnos prefiere Medicina

F. relat. %

En una muestra de 40 familias, el nmero de hijos se

distribuye segn la tabla:


a) Completa la tabla con frecuencia
acumulada, relativa y relativa
F. absoluta
porcentual.
Variable
b) Cuntas familias tienen menos de
N de hijos N de familias
4 hijos?
1
2
c) Cuntas familias tienen 5 hijos?
2
8
d) Cul es la frecuencia relativa de las
3
12
familias que tienen 2 hijos?
e) Qu porcentaje de familias tiene 6
4
14
hijos?
5
3
f) Qu fraccin representan las familias
6
1
con 2 hijos?
g) Qu fraccin representan las familias
con 4 hijos?

Respuesta
N hijos

Frecuencia

F. acumulada

F, relativa

Frec. Relat. %

2 / 40 = 0,05

10

8 / 40 = 0,20

20

12

22

12 / 40 = 0,30

30

14

36

14 / 40 = 0,35

35

39

3 / 40 = 0,075

7,5

40

1 / 40 = 0,025

2,5

b) 22 familias tienen menos de 4 hijos


c) 3 familias tienen 5 hijos
d) La frecuencia relativa de familias con 2 hijos es de 0,20
e) El 2,5% de las familias tiene 6 hijos
f) 1 / 5 de las familias tienen 2 hijos
g) 7 / 20 de las familias tienen 4 hijos

Medidas de tendencia central en


valores no agrupados.
Son valores representativos de la totalidad de los datos.
Su clculo permite analizar los datos en torno a un valor central.
Los valores centrales ms usados son:
Media aritmtica.
Mediana
Moda.

Media aritmtica ( X )
Media aritmtica: corresponde al promedio de los valores.

Se simboliza por X
La media aritmtica se obtiene sumando los valores de la variable
dividido por el nmero total de valores.
En forma General :
X = x1 + x2 + x3 +....xn
n

Ejemplo:
Determinar el promedio de notas de un alumno, en la
asignatura
de Lenguaje y comunicacin.
Las notas son: 3- 5 - 7 - 6 - 4 - 5 - 3 - 5 - 4 - 5 - 3 - 4
X = 3 + 5 + 7 + 6 + 4 +5 + 3 +5 + 4 + 5 + 3 + 4 = 54 = 4,5
12
12
Luego, el promedio de notas del alumno es
4,5

La media aritmtica ponderada es otra forma de calcular el


promedio, utilizando la tabla de distribucin de frecuencias.
Ejemplo:
Notas

Frecuencias

Se debe multiplicar cada valor con su


frecuencia.
3 3 = 9 4 3 = 12
5 4 = 20
61=6 71=7
Se suman los productos:
9 + 12 + 20 + 6 + 7 = 54
La suma del producto se divide por el
total de datos:
54 : 12 = 4,5
Luego,
X = 4,5

Mediana ( Me )
Es el valor de la variable que deja igual nmero de valores antes y
despus de l en una distribucin de frecuencias
Segn el nmero de valores de la variable se distinguen dos casos:
Si el nmero de valores es impar, la mediana coincide con el

valor central.
Ejemplo: 5 8 9 11 12 13 15
Luego, la mediana es el 11
NOTA: los valores deben estar ordenados. Puede ser en forma
creciente o decreciente

Si el nmero de valores es par, la mediana es el promedio

aritmtico de los dos valores centrales.


Ejemplo:
2 3 5 6 8 9 11 12
El calculo sera:

( 6 + 8 ) : 2 = 14 : 2 = 7

Luego, la mediana es 7

Moda ( Mo )
Es el valor de la variable que tiene mayor frecuencia
Ejemplo:
Variable

F. absoluta

N de hijos

N de familias

12

14

La moda es 4 hijos, porque tiene


mayor frecuencia, que es del 14
familias.

Ejercicios
Las calificaciones de un estudiante de la UIS, en seis pruebas,

fueron 84, 91, 72, 68, 87 y 78. Hallar el promedio de sus notas.
Respuesta:
X = 84 + 91 + 72 + 68 + 87 + 78 = 480 = 80
6
6
Luego, el estudiante tiene promedio 80
Diez medidas de dimetro de un cilindro fueron registradas como:

3,88 4,09 3,92 3,97 4,02 3,95 4,03 3,92 3,98 y 4,06

Respuesta:

X = 3,88 + 4,09 + 3,92 + 3,97 + 4,02 + 3,95 + 4,03 + 3,92 +3,98 +4 ,06
10
= 39,82 = 3,98
10

Luego, la media aritmtica es 3,98

Calcular el salario medio semanal de 65 empleados


Salario

Frecuencia

$ 55.000

$ 65.000

10

$ 75.000

16

$ 85.000

14

$ 95.000

10

$ 105.000

Respuesta

Salario ( x)

Frecuencia

FX

$ 55.000

$ 440.000

$ 65.000

10

$ 650.000

$ 75.000

16

$ 1.200.000

$ 85.000

14

$ 1.190.000

$ 95.000

10

$ 950.000

$ 105.000

$ 735.000

X = 440.000 + 650.000+ 1.200.000 + 1.190.000 + 950.000 + 735.000


65
Luego, el sueldo promedio es
= 5.165.000 = 79.461,538
$ 79.461,5
65

Las calificaciones de un estudiante de la UIS, en seis

pruebas, fueron 84, 91, 72, 68, 87 y 78. Hallar la mediana de


sus calificaciones
Respuesta:
Se deben ordenar las calificaciones: 68 72 78 84 87 91
Luego, la mediana es 78 + 84 = 162 = 81
2
2
Hallar la moda de los siguientes nmeros: 3, 5, 2, 6, 5, 9, 5,

2, 8.
Respuesta:
La moda es el nmero 5, ya que su frecuencia es mayor

Representacin grfica de la
informacin
Grfico lineal o de segmentos:

Se utiliza especialmente para representar datos numricos de


situaciones que ocurren en perodos sucesivos.
35

Temperatura

30
25
20
15
10
5
0
Lunes

Martes

Mircoles

Jueves

Viernes

Sbado

Domingo

grfico de Barra : Permite hacer comparaciones mediante

barras paralelas colocadas en forma vertical u horizontal


entre dos ejes perpendiculares.
90
80
70
60
50
40
30
20
10
0

Matematica
Lenguaje

1er
trim.

2do
trim.

3er
trim.

4to
trim.

Grfico circular: Consiste en un crculo dividido en sectores

que representan las frecuencias relativas porcentuales de


una
distribucin
Los 360 grados del crculo se dividen proporcionalmente al
porcentaje correspondiente de cada frecuencia.

4to trim. 1er trim.


13%
13%
2do trim.
17%

3er trim.
57%

Distribucin de frecuencias con


datos agrupados
Rango: Es la diferencia entre el mayor valor y el menor de ellos.

Ejemplo:
Si la estatura del alumno ms alto de un curso es 1,92 m
y la del menor es 1,68 m, entonces el rango de estos datos es:
1,92 m 1,68 m = 0,24 m = 24 cm.
Clases o intervalos : En la ordenacin de datos muy numerosos,

es usual presentarlos agrupados y ordenados en clases o categoras.

Ejemplo:
En un grupo de 50 alumnos se registraron los siguientes
puntajes en una prueba:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
79 83 75 67 72 83 83 84 84 67 71 87 80

77 64 77 82 83 85 79 72 83 83 87
Para ordenarlos y agruparlos, se establecen los intervalos
que se usarn, determinando el rango de los datos.
Dato mayor: 88

Dato menor: 61

Rango: 88 61 = 27

De acuerdo con el rango y teniendo en cuenta la cantidad de


datos, se forman los intervalos.

Si quisiramos formar 6 intervalos, se tiene que dividir el rango


con la cantidad deseada.
27 : 6 = 4, 5 se aproxima a 5 ( amplitud aparente del intervalo)
Intervalo de puntajes

Frecuencias

60 64

65 69

70 74

75 79

12

80 84

16

85 89

El intervalo 60 64 es un
smbolo para representar
a la clase respectiva
Los valores 60 y 64 son
los lmites aparentes de
la clase.

Los lmites reales de una clase se obtienen calculando el


promedio entre el lmite aparente superior de una clase y el
lmite aparente inferior de la clase siguiente.
Ejemplo: Calcular los lmites reales de la clase 70 74
Lri = 69 70

139
=
2

Lrs = 74 75
2

= 69,5

Lmite real inferior

149
2

= 75,5 Lmite real


superior
Tamao o amplitud de una clase: Corresponde a la diferencia
entre su lmite real superior y el lmite real inferior.
Ejemplo:
75,5 69,5 = 5 Su amplitud es igual a 5
NOTA: Todas las clases tienen igual tamao.

Marca de clase: Es el punto medio de un intervalo de

clase.
Ejemplo.
Intervalo

Marca de clase

60 64

62

65 69

67

70 74

72

Frecuencia total: Es la suma de las frecuencias absolutas de

todas las clases.


Ejemplo:
Intervalo

Frecuencia

15

12

6 10

11

11 -15

10

Frecuencia total
12 + 11 + 10 = 33

Ejercicios
Dado los siguientes puntajes, determinar:
61 76 66 77 70 83 88 63 77 67 68 72 82
78 74 84 63 76 84 78 75 72 75 83 80 73
79 83 75 67 72 83 83 84 84 67 71 87 80

77 64 77 82 83 85 79 72 83 83 87
a)
b)
c)
d)

Determinar seis intervalos


Determinar el lmite real superior e inferior de cada clase
Determinar la marca de clase de cada intervalo
Determinar la frecuencia absoluta

Respuesta
Se debe determinar el rango: Pje mayor Pje menor:
88 61 = 27
Luego, 27 : 6 = 4,5 se aproxima a 5 la amplitud del intervalo
Intervalo

Lri - Lrs

Marca de clase Frecuencia

60 64

59,5 64,5

62

65 69

64,5 69,5

67

70 74

69,5 74,5

72

75 79

74,5 79,5

77

12

80 84

79,5 84,5

82

16

85 89

84,5 89,5

87

Ordena los siguientes datos de menor a mayor y calcula

su rango: 3,22 2,92 3,01 4,48 5,06 4,31 2,98 3,07


Respuesta:
Ordenado: 2,92 2,98 3,01 3,07 3,22 4,31 4,48 5,06
Rango:
5,06 2,92 = 2,14
La siguiente distribucin de frecuencias corresponde a los

salarios de los empleados de una fbrica:


Salarios ( $ )

Frecuencia

50.000 54.999

55.000 59.999

18

60.000 64.999

32

65.000 69.999

45

70.000 74.999

52

75.000 79.999

28

80.000 84.999

16

85.000 89.999

a) Calcula los lmites reales del tercer intervalo


Respuesta:
Lri = 59.999 + 60.000 = 59.999,5
2
Lrs = 64.999 + 65.000 = 64.999,5
2
b) Calcula el tamao de los intervalos
Respuesta:
Lrs Lri = amplitud
64.999,5 - 59.999,5 = 5000
c) Determina el lmite aparente inferior del sptimo intervalo
Respuesta:
[80.000 84.999] Lmite aparente inferior: 80.000

d) Determina el lmite real superior del segundo


intervalo
Respuesta:
[55.000 59.999] Lrs = 59.999 + 60.000 = 59.999,5
2
e) Escribe en orden la marca de clase
Respuesta:
Salarios ( $ )

Marca de clase

50.000 54.999

52.499,5

55.000 59.999

57.499,5

60.000 64.999

62.499,5

65.000 69.999

67.499,5

70.000 74.999

72.499,5

75.000 79.999

77.499,5

80.000 84.999

82.499,5

85.000 89.999

87.499,5

f) Determina la frecuencia
acumulada.
Respuesta:
Salarios ( $ )

Frecuencia

50.000 54.999

55.000 59.999

25

60.000 64.999

57

65.000 69.999

102

70.000 74.999

154

75.000 79.999

182

80.000 84.999

198

85.000 89.999

206

acum

g) Determinar la frecuencia relativa


Respuesta:
Salarios ( $ )

Frecuencia relativa

50.000 54.999

7 / 206 = 0,033

55.000 59.999

18 / 206 = 0,087

60.000 64.999

32 / 206 = 0,155

65.000 69.999

45 / 206 = 0,218

70.000 74.999

52 / 206 = 0,252

75.000 79.999

28 / 206 = 0,135

80.000 84.999

16 / 206 = 0,077

85.000 89.999

8 / 206 = 0,038

h) Determinar la frecuencia relativa


porcentual
Respuesta:
Salarios ( $ )

Frecuencia relativa

50.000 54.999

3,3

55.000 59.999

8.7

60.000 64.999

15,5

65.000 69.999

21,8

70.000 74.999

25,2

75.000 79.999

13,5

80.000 84.999

7,7

85.000 89.999

3,8

Ejercicio
Despus de medir las alturas de 40 alumnos de un curso,
resultaron los siguientes valores de la variable:
178
155
155
158 163
154
155
163

150
161
157
166

166
165
161
167

182
160
162
156

175
159
155
164

a) Determina el rango
Respuesta:
182 - 150 = 32

163
160
167
170

175
168
164
176

150
165
162
172

162
162
158
160

b) Determina 7 intervalos:
Respuesta: El rango es 32. Luego, 32 : 7= 4,5 (5 amplitud )
Intervalo
150 154
155 159
160 164

c) Determinar la frecuencia
Respuesta:
Intervalo

Frecuencia

165 169

150 154

170 174

155 159

175 179

160 164

14

180 184

165 169

170 174

175 179

180 184

d) Determinar la marca de clase de los intervalos

Respuesta:
Intervalo

M de C

150 154

152

155 159

157

160 164

162

165 169

167

170 174

172

175 179

177

180 184

182

e) Determinar el lmite
real inferior del tercer
intervalo
Respuesta:
Lri = 159 + 160 = 159,5
2

f) Determinar el lmite real superior del quinto intervalo


Respuesta:
Lrs = 174 + 175 = 174,5
2

g) Determinar la frecuencia acumulada


Respuesta:
Intervalo

F. acum

150 154

155 159

12

160 164

26

165 169

33

170 174

35

175 179

39

180 184

40

h) Determinar la frecuencia
relativa porcentual
Respuesta:
Intervalo

F. Relat %

150 154

10

155 159

20

160 164

35

165 169

17,5

170 174

175 179

10

180 184

2,5

i) Cuntos alumnos miden menos de 160 ?


Respuesta: 12 alumnos miden menos de 160
j) Qu porcentaje de alumnos mide entre 170 y
174 ?
Respuesta: El 5% de los alumnos miden entre 170 y
174
k) Qu porcentaje de alumnos mide entre 160 y 174 ?
Respuesta: El 57,5 % de los alumnos mide entre 160 y
174
l) Cul es la frecuencia
total ?
Respuesta: n =
40
m) Cul es la amplitud del
intervalo
? c = Lrs Lri = 159,5 - 154,5 = 5
Respuesta:

Medidas de tendencia central en


datos agrupados
Media aritmtica: Se suma el producto de la marca de clase con

la frecuencia y se divide por la frecuencia total.


En forma general : X = f x
f
Ejemplo:
Intervalo

Frecuencia

Marca de clase

f x

60 64

62

310

65 69

67

335

70 74

72

576

75 79

12

77

924

80 84

16

82

1312

85 89

87

348

X = 3805
50
X = 76,1

Mediana: Es calcular un valor que separa al conjunto en dos


grupos de igual cantidad.
Para calcular la mediana se ocupa la siguiente formula:
Me = L i m +

(n/2 f( acum. ant ) )

fm
L i m = lmite real inferior del intervalo mediano ( primer intervalo
cuya frecuencia acumulada es igual o mayor que n/2 )
n / 2 = mitad de la frecuencia total
f( acum. ant ) = frecuencia acumulada del intervalo anterior al
intervalo mediano
c = amplitud del intervalo
f m = frecuencia absoluta del intervalo mediano

Ejemplo
Hallar la mediana de los pesos de 40 estudiantes, dado en la
siguiente tabla de distribucin
Intervalo

Frecuencia

F acum

118 126

127 135

136 144

17

145 153

12

29

154 162

34

163 171

38

172 180

40

n = 40

n / 2 = 40 / 2 = 20
L i m = 144 + 145 = 144,5
2
f ( acum. ant ) = 17
c = 144,5 + 153,5 = 9
f m = 12

M e = 144,5 + ( 20 17 ) 9 = 144,5 + 3 9 = 144,5 + 27 = 146,75


12
12
12

Ejemplo 2
Las edades de los obreros que trabajan en una empresa constructora,
se distribuyen como sigue:
c=5
n
/
2
=
180
/
2
=
90
Edad
Frecuencia F acum
L i m = 32 + 33 = 32,5
18 22
15
15
23 27
26
41
2
28 32
30
71
f( acum ant) = 71 f m = 38
33 37

38

109

38 42

32

141

43 47

20

161

48 52

12

173

53 57

180

n = 180

Me = L i m + (n/2 - f(acum ant)) c


fm
= 32,5 + ( 90 - 71) 5
38
= 32,5 + 19 5 = 32,5 + 2,5
38
Me = 35

Moda
Cuando los datos estn agrupados en intervalos, la moda
corresponde a la marca de clase del intervalo de mayor
frecuencia
Ejemplo: La tabla de distribucin muestra el nmero de horas
que un grupo de jvenes dedica a ver televisin diariamente.
Horas

frecuencia

02

25

35

35

68

25

9 11

10

12 - 14

El intervalo modal es [3 - 5]
Luego, se dice que la moda es su marca
de clase.
M de C = 3 + 5 = 4 Mo = 4 horas
2

Representacin grfica en datos


agrupados
Histograma: Es un grfico de barras verticales que sirve para
representar los datos de una distribucin de frecuencias
en la cual los valores de la variable estn agrupados en
intervalos.
El histograma tiene la siguiente caracterstica:
Las bases de las barras o rectngulos estn sobre el eje horizontal y
su ancho ( longitud sobre el eje) es igual al tamao de los intervalos
de clase.

Ejemplo:
Esta tabla de distribucin de frecuencias indica las edades de
los
alumnos que asisten a clases
de Ingls.
f

Edad

frecuencia

57

8 10

10

11 13

14 16

17 19

Eje x = intervalos
Eje y = frecuencia

10
8
6
4
2
5- 7 8-10 11-13 14-16 17-19

Polgono de frecuencia
Es la modalidad de un grfico de datos que se origina al unir
los puntos medios de los lados superiores de las barras de un
f
histograma.
El punto medio
de cada intervalo
es la marca de
clase

10
8
6
4
2

12

15

18

Puff!

Ejercicio
Dada la tabla de distribucin de edades de un grupo de padres
cuyos hijos estn en primer ao de universidad.
Hallar: a) media aritmtica b) Mediana c) Moda
a) Media aritmtica
Edad
frecuencia
45 48

Edad

fx

49 52

45 48

46,5

93

53 56

12

49 52

50,5

252,5

57 60

53 56

12

54,5

654

61 64

57 60

58,5

468

61 64

62,5

312,5

X = f x = 1780 = 55,625
n
32

b) Mediana
Edad

F acum

45 48

49 52

53 56

12

19

57 60

27

61 64

32

n = 32

n / 2 = 32 / 2 = 16
L i m = 52 + 53 = 52,5
2
f (acum ant) = 7
c = 56,5 - 52,5 = 4
f m = 12

Me = 52,5 + ( 16 7 ) 4 = 52,5 + 9 4 = 55,5


12
12
c)
: Moda:
El intervalo modal es [53 - 56] . Luego. La moda es su marca
de clase: 53 + 56 = 54,5
2

* Construye una tabla de distribucin de frecuencias de datos

agrupados en intervalos de clase. Considera como limite


inferior del primer intervalo = 10 y c = 10
El puntaje obtenido por 130 alumnos en una prueba de biologa
es el siguiente:
12
95
83
76
84
42
35
66
90
56

45
32
26
68
66
64
56
80
50
38

53
45
34
90
78
72
66
80
48
51

85
56
72
99
74
54
38
95
52
23

23
58
60
56
25
89
82
96
62
90

91
33
64
48
15
92
78
99
70
84

34
49
72
56
48
28
74
94
80
96

56
55
80
68
50
34
90
40
93
75

65
70
58
82
66
40
85
42
45
38

70
66
98
40
49
56
66
58
36
28

72
62
50
92
53
64
70
65
49
36

74 86
64 55
20 35
38 56
83 91
68 63
72 58
67 81
81 73
83 29

Respuesta:
Intervalo

M. de Clase

frecuencia

F. acum.

F. Relat

F. Relat.%

10 19

14,5

0,015

1,5

20 29

24,5

10

0,061

6,1

30 39

34,5

13

23

0,100

10,0

40 49

44,5

14

37

0,107

10,7

50 59

54,5

22

59

0,169

16,9

60 69

64,5

20

79

0,153

15,3

70 79

74,5

17

96

0,130

13,0

80 89

84,5

17

113

0,130

13,0

90 - 99

94,5

17

130

0,130

13,0

De acuerdo con la tabla anterior, responder las siguientes


preguntas:
a) Cuntos alumnos obtuvieron entre 30 y 49 puntos?
Respuesta: Hay 27 alumnos
b) Cuntos alumnos obtuvieron entre 60 y 89 puntos?
Respuesta: Hay 54 alumnos
c) Cuntos alumnos obtuvieron entre 40 y 99 puntos?
Respuesta: Hay 107 alumnos

d) Qu porcentaje de alumnos obtuvieron entre 30 y 49 puntos?


Respuesta: El 20,7 % de los alumnos
e) Qu porcentaje de alumnos obtuvo entre 50 y 59 puntos?
Respuesta: el 16,9 % de alumnos
f) Cuntos alumnos obtuvieron menos de 60 puntos?
Respuesta: 59 alumnos

g) Cuntos alumnos obtuvieron menos de 30


puntos?
Respuesta: 10 alumnos
h) Cuntos alumnos obtuvieron 50 o ms
puntos?
Respuesta: 93 alumnos
i) Cuntos alumnos obtuvieron 70 o ms puntos?
Respuesta: 51 alumnos
j) Qu porcentaje de alumnos obtuvo menos de 20 puntos?
Respuesta: 1,5 % de los alumnos

k) Cul es la marca de clase que representa al intervalo de


mayor frecuencia?
Respuesta: la marca de clase de mayor frecuencia es 54,5
l) Cul es el lmite aparente superior del tercer intervalo?
Respuesta: 39
m) Cul es el lmite real inferior del quinto intervalo?
Respuesta: 49,5
n) Cul es la amplitud del intervalo?
Respuesta: c = 10

n) Calcula la media aritmtica:


Respuesta:
Intervalo

M. de Clase

frecuencia

10 19

14,5

29

20 29

24,5

196

30 39

34,5

13

448,5

40 49

44,5

14

623

50 59

54,5

22

1199

60 69

64,5

20

1290

70 79

74,5

17

1266,5

80 89

84,5

17

1436,5

90 - 99

94,5

17

1606,5

n = 130

f x

X = fx
n
X = 8095
130
X = 62,26

) Calcula la mediana:
Respuesta:
Intervalo

frecuencia

F. acum.

10 19

20 29

10

30 39

13

23

40 49

14

37

50 59

22

59

60 69

20

79

70 79

17

96

80 89

17

113

90 - 99

17

130

n = 130

n / 2 = 130 / 2 = 65
L i m = 59,5
c = 10
f(acum. ant) = 59
f m = 20
Me = 59,5 + ( 65 59 ) 10
20
Me = 59,5 + 6 10
20
Me = 59,5 + 3 = 62,5

o) Calcular el intervalo modal y la moda :


Respuesta:
El intervalo modal es [50 - 59] porque tiene la mayor
frecuencia , que es 22.
La moda corresponde a la marca de clase de ese intervalo.
Luego, Mo = 50 + 59 = 54,5
2

a+b=c

Ejercicios
Calcular el rango entre. 3,22 2,93 3.01 4,48 5,06 4.31

2,98 3,07
Repuesta: 5,06 - 2,98 = 2,08
El siguiente cuadro muestra el consumo anual en Colombia de

kilogramos de carne de bovino per cpita.


Ao

1984

1985

1986

1987

1988

1989

1990

1991

1992

1996

Consumo

17,0

15,0

14,7

14,0

15,6

17,3

18,5

18,1

17,6

20,0

a) Calcular el consumo promedio desde 1986 hasta 1992


Respuesta: X = 115,8
7

= 16,54

b) Calcular el consumo promedio de los 10 aos?


Respuesta:

X = 1678 = 16,78
10

La siguiente tabla representa las medidas de una pieza de

motores
Intervalo

Frecuencia

100 109

110 119

17

120 129

29

130 139

18

140 149

10

150 159

160 169

Dibuja en un mismo grfico el


histograma y el polgono de
frecuencias.

Respuesta:
f

29

18

10
4

104,5

114,5

124,5

134,5

144,5

154,5

164,5

Marca de clase

Dado las siguientes frecuencias, calcular la mediana,

la moda y la media aritmtica


6 - 7 - 7 - 3 - 4 - 1 - 7 - 5
Respuesta:
Me : Para calcular la mediana se deben ordenar las frecuencias:
1 - 3 - 4 - 5 - 6 - 7 - 7 - 7
Luego, 5 + 6 = 11 = 5,5
Me = 5,5
2
Mo = La moda es 7 , porque es la frecuencia que ms se repite
X = 6 + 7 + 7 + 3 + 4 + 1 + 7 + 5 = 40 = 5
8
8

Las notas obtenidas por 45 alumnos en una prueba de

Estadstica son:
Notas

Frecuencia

12

Determinar : Mo, Me y X
Respuesta:
Me = Como n / 2 = 45 / 2 = 22,5
Luego. la mediana es 5 , pues es el primer
valor de la variable cuya f(acum.) es igual o
mayor que 22,5

X = 11 + 2 4 + 3 5 + 4 6 + 5 9 + 6 12 + 7 8 = 221 = 4,9
45
45
Mo = La moda es 6 pues es el valor que tiene mayor
frecuencia

Percentiles, Deciles y Cuartiles


La mediana de un conjunto de datos ordenados, es el valor
que
los separa en dos partes iguales.
Existen otros valores tpicos que dividen a un conjunto de
datos
numricos en una cierta cantidad de partes iguales; stos son:
Percentiles, Deciles y Cuartiles.
P50 = 52 % = Me

Percentiles
Los percentiles de una distribucin de datos numricos son
los 99 valores que la dividen en 100 partes iguales.
Los percentiles se designan por: P1 , P2 , P3 , .............P99
Se lee: P1 = percentil 1 P2 = percentil 2 ............etc.
0 P1 P2 P3 ........................................................P99.
Ejemplo:
En la distribucin de notas de un grupo de alumnos, el
P45 es una nota de referencia que permite afirmar que el
45 % de esos alumnos obtuvo esa nota o una menor.

El clculo de percentiles se hace de la misma forma como se


obtiene la mediana, en una distribucin.
Ejemplo: Considerar la distribucin de frecuencias de
los
212 puntajes
para calcular
P .
Puntaje
frecuencia
Frec. Acum. 45 Respuesta:
350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

Se calcula el 45% de 212:


212 = 100%
x = 212 45
x
45 %
100
x = 95,4
La frecuencia acumulada 95,4 se
encuentra en la clase 600 - 649

L r i p = 599 + 600 = 599,5


2

f (acum. ant) = 70
c = 50
f p = 80

P45 = L r i p + [ % - f (acum. ant)] c


fp
P45 = 599,5 + ( 95,4 70 ) 50
80
= 599,5 + 15,875
= 615,375
Este valor significa que el 45 % de los alumnos obtuvo
puntajes menores o iguales a 615,3.

Considerar la misma distribucin anterior para calcular

P8.
Respuesta:
Calcular el 8 % de 212:

212 = 100 %
x
8%

x = 212 8 = 16,96
100

Este valor de la frecuencia acumulada se encuentra en la clase


450 499
L r i p = 449 + 450 = 449,5 F(acum. ant) = 10
c = 50 f p = 9
2
449,5 + ( 16,96 10) 50
9
= 449,5 + 38,66
= 488,16

P8 =

Ejercicio de percentil
Dada la tabla de distribucin, determinar qu porcentaje de los
alumnos obtuvieron entre 400 y 600 puntos.
Puntaje

frecuencia

Frec. Acum.

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

Respuesta:
400 puntos corresponde a un
percentil que se desconoce, por
lo que se simboliza por Px .
Adems se sabe que corresponde
al segundo intervalo, y que su
L r i p = 399,5

El % buscado es: x 212

F(acum. ant) = 4
fp= 6
c = 50

100

Px = 399,5 +

x.

212
4
100
6

50

400 = 399,5 + 2,12 x 4 .50


6

400 399,5 =

2,12 x 4
.50
6

0,5 6 = 2,12 x 4
50
0,06 + 4 = 2,12 x
4,06
2,12

=x

1,9 % = x

600 puntos corresponde a un percentil desconocido, por lo


que se simboliza por Py
Adems se sabe que est ubicado en el sexto intervalo, y que
su L r i p = 599,5 f(acum. ant) = 70
f p = 80 c = 50
El % buscado es
Entonces:

Py = 599,5 +

600 599,5 =
0,5 80
50
0,8 + 70
2,12

y.

212
100

y.

212
70
100
.50
80

212
70
100
.50
80

= 2,12 y - 70
= y

y = 33,3 %

La diferencia entre
ambos porcentajes
corresponde al
porcentaje pedido.
33,3 1,9 = 31,4 %

Calcular qu porcentaje de los 212 alumnos tuvieron

resultados entre 620 y 680 puntos.


Respuesta:
620 puntos corresponde a un percentil que se desconoce y se designa
212
por Px.
x.
70
Entonces, Px = 599,5 +
100
50
80

620 599,5 =
20,5 80
50

2,12 x 70
.50
80

= 2,12x 70

x = 48,4 %

680 puntos corresponde a un percentil que se desconoce y se


designa por Py.

( 680 649,5 ) 42
50

= 2,12y - 150

x = 82,8 %

As, la diferencia entre ambos porcentajes corresponde al porcentaje


de alumnos que tienen entre 620 y 680 puntos.
82,8 % - 48,4 % = 34,4 = 34,4 % de los alumnos

Deciles
Los deciles de una distribucin de datos numricos son los 9
valores que la dividen en 10 partes iguales.
Los deciles se designan por D1 , D2 , D3 , ...........D9
Se leen: Decil 1 , decil 2 .......decil 9

D1 D2 D3 D4

D5 D6

D7 D8

D9

Para calcular deciles, se hace de la misma forma que los


percentiles.
Ejemplo: Considerar la siguiente tabla de distribucin para
calcular D3
Puntaje

frecuencia

Frec. Acum.

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

Para calcular el tercer decil (D3)


se tiene que tener en cuenta que
corresponde al 30 % inferior
de los datos de la distribucin.

Se calcula el 30% de 212

212 = 100%

30%

x = 63,6

Esta cantidad de datos corresponde a la clase 550 599


L r i = 549 + 550 = 549,5
2

f(acum. ante) = 39
f d = 31

c = 50

D3 = 549,5 + ( 63,6 39 ) 50
31
= 549.5 + 39,6
= 589,1
El 30 % de los 212 alumnos tiene un puntaje igual o menor que
589,1 puntos.

Calcular el D7

Respuesta:
El 70% de 212 = 148,4
f(acum. ant) = 70 f d = 80 c = 50
El lmite real inferior de la clase 600 649 es 599,5

148,4 70
.50
D7 = 599,5 +
80
D7 = 599,5 + 49
D7 = 648,5 puntos
NOTA: Se ha calculado D3 y D7 , entonces se puede concluir que
el 40% de los 212 alumnos obtuvo entre 589,2 y 648,5
puntos.

Cuartiles
Los Cuartiles de una distribucin de datos numricos son los
tres valores que la dividen en 4 partes iguales
Los cuartiles se designan por: Q1 , Q2 y Q3
Q1

Q2

Q3

Q1 es el primer cuartil y corresponde al 25% inferior


Q2 es el segundo cuartil y corresponde al 50% inferior
Q3 es el tercer cuartil y corresponde al 75% inferior
Los cuartiles se calculan de la misma forma que los
percentiles
y los deciles.

Calcular el tercer cuartil, de la siguiente distribucin

Respuesta:
Puntaje

frecuencia

Frec. Acum.

350 399

400 449

10

450 499

19

500 549

20

39

550 599

31

70

600 649

80

150

650 699

42

192

700 749

10

202

750 799

210

800 849

212

El 75% de 212 = 159


L r i q = 649,5 c = 50
f(acum. ant) = 150 f q = 42
159 150
Q3 = 649,5 + 42 .50

Q3 = 649,5 + 10,7
Q3 = 660,2

El 75% de los alumnos tiene un puntaje igual o inferior a 660,2 puntos,


lo que significa que el 25% de ellos tiene un puntaje igual o superior
a 660,2

Un curso rindi una prueba de Matemtica, Qu se puede

decir del resultado, si se sabe que en la distribucin de las


notas se obtuvo: Q2 = 5,8 y Q3 = 6,5 ?
Respuesta:
Es conveniente ver la situacin en forma grfica:

5,8

6,5
50%

25%

Se puede afirmar que:


* El 50% del curso obtuvo una calificacin superior a 5,8
* El 25% mejor preparado logr notas superiores al 6,5

Medidas de dispersin
Al grado en que los datos numricos tienden a extenderse
alrededor de un valor medio se le llama variacin o
dispersin
Las medidas de dispersin ms utilizadas son:
* Rango
* Desviacin media
* Desviacin tpica o estndar.

Rango
El rango de un conjunto de datos numricos es la diferencia
entre el mayor y el menor de ellos.
Ejemplo:
Un alumno obtuvo las siguientes notas parciales en
Matemtica:
2 - 3,9 - 5 - 5,9 - 6,2
El rango es 4,2 ya que es la diferencia entre 6,2 y 2
Qu significado tiene el rango de notas 4,2 respecto de
las
notas de otro alumno cuyo rango es 2,1?
En el primer caso las notas estn ms dispersas que en el
segundo. No se sabe en que caso son mejores; para
determinarlo es necesario ms informacin.

Desviacin Media
La desviacin de un puntaje x con respecto a la media
aritmtica x est dada por la diferencia d = x - x
Ejemplo:
Un alumno obtuvo las siguientes notas en la asignatura de
Biologa: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la desviacin
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5
5

Ahora se calcula la diferencia de cada nota con el promedio


d = 3,9 4,6 = - 0,7
d = 5 4,6 = 0,4
d = 5,9 4,6 = 1,3

d = 2 4,6 = - 2,6
d = 6,2 4,6 = 1,6

NOTA: La suma de las desviaciones de todos los datos con


respecto a la media aritmtica es igual a cero.
Ejemplo:
-0,7 + 0,4 + 1,3 + -2,6 + 1,6 = 0

La desviacin media de n datos numricos x1, x2, ......xn


es la media aritmtica de los valores absolutos de las
desviaciones de todos los datos con respecto a su
promedio.
Se designa por DM
n = frecuencia total
DM = |x1 x | + |x2 x | +.........|xn x |
n
Ejemplo:
DM = |-2,6 | + |-0,7 | + |0,4 | + |1,3 | + |1,6 | = 6,6 = 1,3
5
5
El valor 1,3 es la desviacin media de todas las notas dadas.

Un alumno obtuvo las siguientes calificaciones en la

asignatura de Ingls: 3,2 - 6 - 6,8 - 4,3 - 2,9 5,7


Calcular la desviacin media de las notas.
Respuesta:
x = 3,2 + 6 + 6,8 + 4,3 + 2,9 + 5,7 = 28,5 = 4,8
6
6
| 3,2 4,8 | = 1,6 | 6 4,8 | = 1,2 | 6,8 4,8 | = 2
| 4,3 4,8 | = 0,5

| 2,9 4,8 | = 1,9

| 5,7 4,8 | = 0,9

Luego, DM = 1,6 + 1,2 + 2 + 0,5 + 1,9 + 0,9 = 8,1 = 1,3


6
6
El valor 1,3 es la desviacin media de todas las notas dadas.

Desviacin media en datos


agrupados
La siguiente tabla muestra los puntajes obtenidos en Icfes
con un promedio de 614 puntos. Calcular la desviacin
media.
Primero se debe sacar

Puntajes

Frecuencia

|xx|

f |x x |

350 399

374,5

239.5

958

400 449

424,5

189.5

1137

450 499

474,5

139.5

1255.5

500 549

20

524.5

89.5

1790

550 599

31

574.5

39.5

1224.5

600 649

80

624.5

10.5

840

650 699

42

674.5

60.5

2541

700 749

10

724.5

110.5

1105

750 799

774.5

160.5

1284

800 849

824.5

210.5

421

212

12556

la marca de clase.
Se debe obtener la

desviacin |x x |
Se realiza el producto de la

frecuencia con la desviacin


Se obtiene la sumatoria
del producto
*Considerar la frecuencia
total.

Con todos los datos se aplica la frmula de la desviacin media


DM = f | x x |
n

DM = 12556 = 59,2 puntos


212

Se puede decir que los puntajes se desvan, en promedio, 59,2


puntos con respecto a la media.
Hay que considerar que algunos puntajes son inferiores a ella
y otros superiores.
Si los puntajes estuvieran ms agrupados en torno al promedio,
es decir, menos dispersos, el valor de DM sera menor.

Calcular la DM de la siguiente distribucin que representa

las horas diarias dedicadas al estudio de 20 alumnos

Horas

Frecuencia

fx

|xx|

f |x x |

02

3,7

18,5

35

28

0,7

4,9

68

42

2,3

13,8

9 - 11

10

20

5,3

10,6

20

95

Respuesta:
* Determinar el promedio

d) Frecuencia total
e) x = 95 = 4,7
20
* Determinar | x x |
* Determinar f |x x |
* Obtener f | x x |

47,8

* Finalmente se determina la DM
DM = 47,8 = 2,3
a) Obtener la marca de clase
20
Las horas diarias se desvan en 2,3
b) Multiplicar f x
puntos con respecto a la media.
c) Obtener f x

Calcula la desviacin media de las medidas de una pieza

de motores, dada por la siguiente tabla:

Intervalo

frecuencia

|xx |

f|xx|

100 109

104,5

418

24,2

96,8

110 119

17

114,5

1946,5

14,2

241,4

120 129

29

124,5

3610,5

4,2

121,8

130 139

18

134,5

2421

5,8

104,4

140 149

10

144,5

1445

15,8

158

150 159

154,5

772,5

25,8

129

160 169

164,5

329

85

xf

10942.5

Respuesta:
* Marca de clase (x)
* x = 10942,5 = 128,7
85

* Sumatoria del producto


DM = 923 = 10,8
85

Las medidas se desvan


35,8
71,6
en promedio de 10,8
puntos con respecto a
923
la media.
*Se calcula | x x
|
* Se calcula f | x x |

La desviacin tpica se simboliza por la letra S


La desviacin tpica o estndar expresa el grado de dispersin
de los datos con respecto al promedio y corresponde a la raz
cuadrada de la media del cuadrado de las desviaciones de dichos
datos con respecto a su media aritmtica.
En forma general:

Ejercicios
Calcular la desviacin tpica de las siguientes notas de

Matemtica: 2,0 - 3,9 - 5,0 - 5,9 - 6,2


Respuesta:
* Primero se debe obtener el promedio
x = 2,0 + 3,9 + 5,0 + 5,9 + 6,2 = 4,6
5
* Se calcula la desviacin tpica
2
2
2
2
2
(
2

4
,
6
)

(
3
,
9

4
,
6
)

(
5

4
,
6
)

(
5
,
9

4
,
6
)

(
6
,
2

4
,
6
)
S=
5

S=
=

6,7 0,4 0,1 1,6 2,5


5

2,2

11,3
5

1,4

Luego, la desviacin tpica de las notas es 1,4 con respecto


al promedio
Si de estas notas descartramos el 2, la nota ms alejada del
promedio, entonces la desviacin tpica sera S = 1,04 ;
este
valor es menor que 1,4.
Las notas consideradas, sin la nota 2, tendran una
dispersin
menor, es decir, estaran ms centradas.

Calcular la desviacin tpica de las siguientes notas:

5,2 - 4,9 - 5 - 5,1 - 5,2 - 5,3 - 4,9 - 5,2


Respuesta:
x = 5,1

* Se obtiene el promedio
*S=

0,1 0,2 0,1 0 0,1 0,2 0,2 0,1


8
2

0,02

= 0,1
S=
Este valor es considerablemente menor que el ejercicio anterior. Se
debe a que los datos son ms homogneos que en la otra distribucin,
presentan escasa dispersin con respecto al promedio.

Desviacin tpica en datos


agrupados
Calcular la S de la siguiente distribucin que representa

Horas

las horas diarias dedicadas al estudio de 20 alumnos, con un


promedio de 4,7
* f | x x | 2
Frecuencia

|xx|

02

3,7

13,69

68,45

35

0,7

0,49

3,43

68

2,3

5,29

31,74

9 - 11

10

5,3

28,09

| x x | 2 f | x x | 2

Primero se debe sacar la marca de clase.

* Se calcula S
S=

159,8
20

S=

7,9

56,18

159,8

* Determinar las desviaciones


S=
* Obtener la desviacin al cuadrado
* Producto de la frecuencia con la desviacin al cuadrado.

2,8

La siguiente tabla muestra los puntajes obtenidos en Icfes.


con un promedio de 614 puntos. Calcular la desviacin tpica
Puntajes

Frecuencia

|xx|

350 399

374.5

239.5

57360.25

229441

400 449

424.5

189.5

35910.25

215461.5

450 499

474.5

139.5

19460.25

175142.25

500 549

20

524.5

89.5

8010.25

160205

550 599

31

574.5

39.5

1560.25

48367.75

600 649

80

624.5

10.5

110.25

8820

650 699

42

674.5

60.5

3660.25

153730.5

700 749

10

724.5

110.5

12210.25

122102.5

750 799

160.5

25760.25

206082

800 849

210.5

44310.25

88620.5

774.5
824.5

| x x |2

f | x x |2

1407973

1407973
S=
212

= 6641.3
= 81,4
Entonces,
S = 81,4

* Calcular marca de clase


* determinar f |x x |2
* Calcular las desviaciones * Determinar la sumatoria del producto
* Determinar las desviaciones al cuadrado

La siguiente tabla muestra el nmero de brazadas dadas

por 100 nadadores en la prueba de 200 m. Calcular S


Brazadas

frecuencia

fx

|xx|

|xx|2

F |x x |2

200 204

202

1616

16.9

285.61

2284.88

205 209

12

207

2484

11.9

141.61

1699.32

210 214

15

212

3180

6.9

47.61

714.15

215 219

18

217

3906

1.9

3.61

64.98

220 224

16

222

3552

3.1

9.61

153.76

225 229

14

227

3178

8.1

65.61

918.54

230 234

10

232

2320

13.1

171.61

1716.1

235 239

237

1659

18.1

327.61

2293.27

Respuesta:
* Promedio
a) Marca de
clase
b) f x
c) f x

21895

21895
d) x =
= 218.9
100

9845

* Calcular las desviaciones


* Desviaciones al cuadrado
* f | x x |2

S=

9845
100

S = 98,45
S = 9,9
Las brazadas
estn a 9,9
puntos con
respecto al
promedio

* del producto

Varianza
La varianza de un conjunto de datos se define como el cuadrado
de la desviacin tpica
Se simboliza por S2
k n

S2 =

2
(
x

x
)

k 1

n
El clculo de la varianza es similar a la desviacin tpica

Un alumno obtuvo las siguientes notas en la asignatura de


Biologa: 3,9 - 2 - 5 - 6,2 - 5,9 Calcular la varianza
de ellas.
Respuesta:
Primero se debe calcular el promedio.
x = 3,9 + 2 + 5 + 6,2 +5,9 = 23 = 4,6
5
5
* Calcular las desviaciones
|3,9 4,6 | = 0,7 | 2 4.6 | = 2,6
| 5 4,6 | = 0,4
| 6,2 4,6 | = 1,6 | 5,9 4,6 | = 1,3
* Calcular las desviaciones al cuadrado
0,72 = 0,49 2,62 = 6,76 0,42 = 0,16 1,62 = 2,56 1,32 = 1,69
* Calcular S2
S2 = 0,49 + 6,76 + 0,16 + 2,56 + 1,69 = 11,66
5

= 2,3

Calcular la Varianza de la siguiente distribucin que representa

las horas diarias dedicadas al estudio de 20 alumnos, con un


promedio de 4,7
Horas

Frecuencia

|xx|

02

3,7

13,69

68,45

35

0,7

0,49

3,43

68

2,3

5,29

31,74

9 - 11

10

5,3

| x x | 2 f | x x | 2

28,09

56,18

159,8

f | x x | 2

* Se calcula S2
S =
2

159,8
20

S2 = 7,9

Primero se debe sacar la marca de clase.

Luego, la varianza es
* Determinar las desviaciones
7,9
* Obtener la desviacin al
cuadrado
* Producto de la frecuencia con la desviacin al cuadrado.

INDICE GINI

El Indice Gini (IG) puede tomar valores entre 0 y 1:


IG = 0 : concentracin mnima. La muestra est
uniformemente repartida a lo largo de todo su rango.
IG = 1 : concentracin mxima. Un slo valor de la
muestra acumula el 100% de los resultados.

Ejemplo: La compaa Catracas Geologa


extrajo de una cuenca sedimentaria ubicada
en el sur oriente de Colombia varios ncleos
de la formacin Cachemira, la firma cuenta
con laboratorios calificados para realizarle a
los ncleos las diferentes pruebas
petrofsicas. Una de las pruebas exigidas al
laboratorio fue la de permeabilidad, cuyos
resultados fueron reportados en la siguiente
tabla de frecuencias en milidarcy (md):

SOLUCION:

Los datos obtenidos se


tabulan en una tabla de
frecuencias

La Forma de la
distribucin
Otra caracterstica de un conjunto de datos es la forma,

es decir, la manera en que estn distribuidas las


observaciones.
La distribucin de los datos puede ser o no simtrica. Si

la distribucin de los datos no es simtrica, se llama


asimtrica o sesgada.
Para describir la forma se puede comparar la media y la

mediana.
Tambin puede observarse a travs del coeficiente de

asimetra Mide el grado de Simetra / Asimetra de la


distribucin

Medidas de forma: Coeficiente de


Asimetra
Asimetra
El concepto de asimetra se refiere a si la
curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha
de un valor central (media aritmtica)

Parmetros estadsticos

La Forma de la
distribucin
.
Media
Mdn

Si es + indicar muchos casos en los valores ms


bajos y pocos en los ms altos positivamente
asimtrica .
Media > Mediana: Positivos o con sesgamiento a la
derecha

La Forma de la
distribucin

Mdn
Media

Si es - indicar muchos casos en los valores ms altos y


pocos en los ms bajos negativamente asimtrica.
Media < Mediana: Negativos o con sesgaminto a la
izquierda.

La Forma de la
distribucin

Mdn = Media

En la distribucin Normal es 0 Simtrica


Media = Mediana: Simtricos o con sesgamiento cero.

La Forma de la
Otra manera de apreciar la forma de una distribucin es observar el nivel de
distribucin
apilamiento o llanura de la curva

leptocrtica
Platicrtica
(menor dispersin) (mayor dispersin)

mesocrtica

El coeficiente de kurtosis mide el grado de apuntamiento de la curva

La Forma de la distribucin
El coeficiente de kurtosis
Mide el grado de apuntamiento de la curva
En la distribucin Normal es 0 mesocrtica
Si es + indicar un grado de apilamiento mayor que en la
normal leptocrtica (menor dispersin)
Si es indicar que es ms aplanada que la normal
platicrtica (mayor dispersin)

Medidas de forma: Coeficiente


de Curtosis
El Coeficiente de Curtosis analiza el grado
de concentracin que presentan los valores
alrededor de la zona central de la
distribucin.

Medidas de forma: Coeficiente


de Curtosis
Se definen 3 tipos de distribuciones segn
su grado de curtosis:
Distribucin mesocrtica: presenta un
grado de concentracin medio alrededor de
los valores centrales de la variable (el
mismo que presenta una distribucin
normal).

Medidas de forma: Coeficiente


de Curtosis
Distribucin leptocrtica: presenta un
elevado grado de concentracin alrededor
de los valores centrales de la variable.
Distribucin platicrtica: presenta un
reducido grado de concentracin alrededor
de los valores centrales de la variable.

Parmetros estadsticos
Los resultados pueden ser los siguientes:
g1 = 0 (distribucin simtrica; existe la misma concentracin de
valores a la derecha y a la izquierda de la media)
g1 >0 (distribucin
asimtrica positiva; existe mayor concentracin de valores a la
derecha de la media que a su izquierda)
g1 <0 (distribucin asimtrica negativa; existe mayor
concentracin de valores a la izquierda de la media que a su
derecha
Ejemplo: Calcular el Coefiente de Asimetra de Fisher de la
serie de datos referidos a la estatura de un grupo de alumnos

Parmetros estadsticos

Parmetros estadsticos
Variable

Frecuencias absolutas

Frecuencias relativas

(Valor)

Simple

Acumulada

Simple

Acumulada

1,20

3,3%

3,3%

1,21

13,3%

16,6%

1,22

13,3%

30,0%

1,23

11

6,6%

36,6%

1,24

12

3,3%

40,0%

1,25

14

6,6%

46,6%

1,26

17

10,0%

56,6%

1,27

20

10,0%

66,6%

1,28

24

13,3%

80,0%

1,29

27

10,0%

90,0%

1,30

30

10,0%

100,0%
la media de esta
muestra es 1,253

Parmetros estadsticos

Parmetros estadsticos
Observaciones sobre puntuaciones tpicas
La media aritmtica de las puntuaciones tpicas es
0.
La desviacin tpica de las puntuaciones tpicas es
1.
Las puntuaciones tpicas son adimensionales, es
decir, son independientes de las unidades utilizadas.
Las puntuaciones tpicas se utilizan para comparar
las puntuaciones obtenidas en distintas
distribuciones.

Parmetros estadsticos

Вам также может понравиться