Академический Документы
Профессиональный Документы
Культура Документы
x =
f
1
x
1
+ f
2
x
2
+ + f
n
x
n
f
1
+ f
2
+ + f
n
=
n
i = 1
f
i
x
i
n
i = 1
f
i
=
n
i = 1
f
i
x
i
N
La media aritmtica (o por simplicidad, la media) es un valor en torno al cual
se concentra la distribucin, y se mide en las mismas unidades que los datos.
La varianza de X es Var =
2
=
n
i = 1
f
i
(x
i
x)
2
N
=
n
i = 1
f
i
x
i
2
N
x
2
0
La desviacin tpica de X es = Var 0.
Parmetros de centralizacin:
Media, moda, mediana,
cuartiles, percentiles
Parmetros de dispersin:
Varianza, desviacin tpica y
coefciente de variacin.
Vocabulario
x
i
f
i
x
1
f
1
x
2
f
2
x
n
f
n
Total N
x
i
f
i
f
i
x
i
0 2 0
1 5 5
2 5 10
3 1 3
4 2 8
Total N = 15 26
x
i
f
i
f
i
x
i
f
i
x
i
2
0 2 0 0
1 5 5 5
2 5 10 20
3 1 3 9
4 2 8 32
Total N = 15 26 66
La varianza se mide en unidades cuadradas, mientras que la desviacin tpica
lo hace en las mismas unidades que los datos.
A partir de la distribucin del ejemplo 3, multiplicando la columna
x
i
por la columna f
i
x
i
obtenemos f
i
x
i
2
, lo que nos permite calcular:
Var =
n
i = 1
f
i
x
i
2
N
x
2
=
66
15
26
15
2
1,3955...
= Var = 1,3955... = 1,1813...
Ejemplo 4
En la distribucin del margen se ha aadido una columna con
los valores de los productos f
i
x
i
, lo que facilita el clculo de la
media. Como N = 15 y
n
i = 1
f
i
x
i
= 26, la media es
x =
26
15
1,73...
Ejemplo 3
En la pestaa Actividades/
Unidad 11, encontrars la
actividad Relacin 2 unidad 11,
para calcular la media.
CD
206
11
COEFICIENTE DE VARIACIN B
La desviacin tpica representa una medida de la dispersin de los datos
respecto a la media. Ahora bien, como media y desviacin tpica tienen uni-
dades, el que la desviacin sea grande o pequea es poco relevante si
se desconoce lo grande o pequea que es la media. En particular, la des-
viacin tpica por s sola no permite comparar grados de dispersin de dos
distribuciones de datos. Para resolver este problema, se defne el coefciente
de variacin (o de dispersin).
El coefciente de variacin CV de una variable X es el cociente entre la
desviacin tpica y la media. Es decir, CV =
x
.
El coefciente de variacin
es una magnitud sin unidades
y representa una medida
relativa de la dispersin.
Ten en cuenta
Halla la media, la desviacin tpica y el coef-
ciente de variacin de estas distribuciones:
a) 27, 22, 29, 30, 21, 22, 27, 18, 23, 26, 33, 35, 20,
26, 29.
b) 26, 21, 27, 31, 19, 24, 26, 19, 20, 24, 31, 32, 18,
23, 30.
Cul de las dos distribuciones tiene mayor grado
de dispersin?
Calcula la media, la varianza, la desviacin
tpica y el coefciente de variacin de las distribu-
ciones asociadas a los ejercicios 7 y 8.
Estudia la variable estadstica continua
talla en centmetros, aplicada a dos grupos
distintos de tu clase, y calcula la media, la va-
rianza, la desviacin tpica y el coeficiente de
variacin. Decide en cul de los dos grupos es
mayor la dispersin en la talla.
Ejercicios
9 11
10
Dos vendedores de enciclopedias efectan, durante la l-
tima semana, las ventas siguientes:
Vendedor A 4, 3, 8, 0, 4, 6, 8
Vendedor B 4, 6, 4, 2, 1, 6, 6
Para decidir cul de los dos es ms regular en las ventas
se calculan los respectivos coefcientes de variacin. La
media, la desviacin tpica y el coefciente de variacin
de A son:
x
A
=
33
7
,
A
=
205
7
33
7
2
2,66
CV
A
=
A
x
A
2,66
4,714
0,56 = 56 %
La media, la desviacin tpica y el coefciente de variacin de B son:
x
B
=
29
7
,
B
=
145
7
29
7
2
1,88
CV
B
=
B
x
B
1,88
4,14
0,45 = 45 %
Como el coefciente de variacin CV
B
es menor que CV
A
,
se puede concluir que el vendedor B es ms regular que
el vendedor A en la venta de enciclopedias.
Ejemplo 5
Ventas
x
i
Vendedor A
f
i
f
i
x
i
f
i
x
i
2
0 1 0 0
3 1 3 9
4 2 8 32
6 1 6 36
8 2 16 128
Total N = 7 33 205
Ventas
x
i
Vendedor B
f
i
f
i
x
i
f
i
x
i
2
1 1 1 1
2 1 2 4
4 2 8 32
6 3 18 108
Total N = 7 29 145
207
F
n
= N
MEDIANA Y MODA C
Estudiamos en esta seccin la mediana y la moda. Para defnir y calcular la
mediana es necesario el concepto de frecuencia absoluta acumulada.
En una tabla de frecuencias, la frecuencia acumulada asociada a x
i
, repre-
sentada como F
i
, es la suma F
i
= f
1
+ f
2
+ + f
i
. El valor de F
i
es la suma de
las frecuencias absolutas de x
1
, x
2
, y x
i
.
Halla la media, la mediana y la desviacin
tpica de la distribucin: 3, 5, 2, 4, 6, 6, 4, 3, 5, 7, 4.
Calcula la mediana de las distribuciones del
ejercicio 11.
Ejercicios
12 13
Ten en cuenta
Para defnir la mediana, es
imprescindible que los datos
de la distribucin aparezcan
ordenados. Hecho esto, la
mediana deja el 50 % de la
poblacin antes de ella, y
detrs, el otro 50 %.
Refexiona
x
i
f
i
F
i
0 9 9
1 7 9 + 7 = 16
2 4 16 + 4 = 20
3 1 20 + 1 = 21
4 1 21 + 1 = 22
Consideremos la siguiente tabla de frecuencias a la que se aa-
de la columna de frecuencias absolutas acumuladas:
x
i
f
i
F
i
0 3 3
1 2 3 + 2 = 5
2 3 5 + 3 = 8
3 1 8 + 1 = 9
4 1 9 + 1 = 10
Ejemplo 6
La distribucin (ordenada) 1, 3, 5, 7, 10 tiene 5 datos. La mediana es el dato que ocupa la posi-
cin tercera. Esto es, Me = 5.
La distribucin 9, 10, 12, 15, 15, 16, 19, 24, 30, 45 consta de 10 datos. Los datos centrales, en
las posiciones quinta y sexta, son 15 y 16. Por tanto, la mediana es:
Me =
15 + 16
2
= 15,5
Ejemplo 7
En la tabla de frecuencias del margen, el nmero de datos es
N = 22, que es un nmero par. Como la mitad del tamao de la
poblacin es
N
2
= 11, las posiciones centrales son la 11. y 12., y
como ambas estn asociadas al valor x
i
= 1, la mediana es:
Me =
1 + 1
2
= 1
Ejemplo 8
Podemos abordar ya la defnicin de mediana de una distribucin de datos.
Supongamos que el nmero de datos es pequeo. Tras ordenar los datos en
orden creciente, la mediana Me es el dato que ocupa la posicin central. En
el caso en que el nmero de datos sea par, la mediana Me es la media de los
dos valores centrales.
208
11
Supongamos ahora que los datos se agrupan en intervalos. Denominamos
clase mediana al primer intervalo cuya frecuencia absoluta acumulada es
mayor o igual que la mitad del tamao de la poblacin. Designamos F
i
a esta
frecuencia absoluta acumulada, y x
i
a la marca de la clase mediana. Existen
dos posibilidades:
Si F
i
>
N
2
, entonces la mediana es Me = x
i
.
Si F
i
=
N
2
, entonces la mediana es Me =
x
i
+ x
i + 1
2
.
Otro parmetro que puede calcularse es la moda. A la vista de la tabla del
ejemplo anterior, se observa que la clase con mayor frecuencia absoluta es
[40, 60). Esta clase se denomina clase modal. La marca de la clase modal
se denomina moda. As pues, la moda de esta distribucin de alturas es
M
0
= 50 cm.
Si la distribucin de datos no necesita agrupacin por intervalos (variables
discretas con pocos valores), la moda M
0
es el valor (o valores) de la variable
con mayor frecuencia absoluta.
Halla la mediana y la moda de las distribucio-
nes A y B asociadas al ejemplo 5.
Inventa una distribucin de datos con media-
na 2 y moda 3.
Halla la mediana y la moda de las distribucio-
nes de los ejercicios 7 y 8.
Calcula la media, la mediana y la moda de la
distribucin: 3, 7, 5, 4, 3, 3, 6, 8, 10, 9.
Ejercicios
14 16
15 17
De este mismo modo, se
puede calcular la mediana
de una distribucin de
variable discreta con los datos
presentados en una tabla
de frecuencias.
Ten en cuenta
Altura x
i
f
i
F
i
[0, 20) 10 12 12
[20, 40) 30 16 28
[40, 60) 50 20 48
[60, 80) 70 4 52
x
i
f
i
F
i
0 3 3
1 2 5
2 3 8
3 1 9
4 1 10
N = 10
La tabla del margen proporciona la altura, en centmetros, de las
plantas de un invernadero.
La mitad de la poblacin es
N
2
= 26, por lo que la clase mediana
es [20, 40), con Fi = 28 >
N
2
.
La mediana es la marca de clase de [20, 40), esto es, Me = 30 cm.
Ejemplo 9
Consideramos la distribucin: 0, 1, 3, 0, 2, 1, 0, 2, 4, 2. Al elaborar
la tabla de frecuencias, situada al margen, se observa que los va-
lores 0 y 2 tienen frecuencia 3, que es la mayor de todas. Por tanto,
la distribucin tiene dos modas: M
0
= 0 y M
0
= 2.
Respecto a la mediana, teniendo en cuenta que
N
2
= 5 coincide
con la frecuencia absoluta acumulada F
2
de x
2
= 1, se sigue que:
Me =
x
2
+ x
3
2
=
1 + 2
2
= 1,5
Ejemplo 10
209
CUARTILES Y CENTILES D
Anteriormente se ha comentado que, tras ordenar los datos, la mediana divide
stos es dos partes iguales, dejando a su izquierda la mitad de los datos. Si
en vez de dividir la distribucin en dos partes iguales, lo hacemos en cuatro
partes iguales, los tres puntos de separacin asociados se denominan cuar-
tiles y se representan por Q
1
, Q
2
y Q
3
.
El primer cuartil, Q
1
, deja a su izquierda la cuarta parte de la distribucin,
es decir, el 25 %.
El segundo cuartil, Q
2
, deja a su izquierda la mitad de la distribucin y, por
tanto, coincide con la mediana, es decir, Q
2
= Me.
El tercer cuartil, Q
3
, deja a su izquierda tres cuartas partes de la distribucin,
es decir, el 75 %.
De la misma forma, si deseamos dividir una distribucin en 100 partes iguales,
aparecen 99 puntos de separacin denominados centiles o percentiles. El
percentil de orden k, representado como p
k
, deja a su izquierda k centsimas
partes de la distribucin.
Se verifca: p
25
= Q
1
, p
50
= Q
2
= Me y p
75
= Q
3
.
En el caso de las distribuciones con datos agrupados en intervalos, los cuartiles
se calculan de modo totalmente anlogo a como se hace con la mediana.
Por ejemplo, para calcular Q
1
se busca el primer intervalo cuya frecuencia
absoluta acumulada supera la cuarta parte de los datos. Hallado ste, se iden-
tifca Q
1
con su marca de clase. Anlogamente, se repite el mismo proceso
para Q
3
.
Halla los percentiles p
65
y p
93
para la distribu-
cin del ejemplo 11.
Halla los cuartiles Q
1
y Q
3
para las distribucio-
nes de los ejercicios 7 y 8.
Ejercicios
18 19
En realidad, los cuartiles y
percentiles as calculados son
slo aproximados. El clculo
exacto es algo ms complejo.
Ten en cuenta
Clase f
i
F
i
1 1 1
2 2 3
3 5 8
4 10 18
5 4 22
6 6 28
7 3 31
Total 31
Consideramos la distribucin defnida por la tabla del margen.
Vamos a calcular Q
1
, Q
2
, Q
3
y P
7
,
La cuarta parte de los datos es
31
4
= 7,75.
El primer valor cuya frecuencia absoluta acumulada supera la
cuarta parte de los datos es 3. Luego Q
1
= 3.
La mitad de los datos es 15,5, de donde se desprende que la
mediana es Me = Q
2
= 4.
Por ltimo, las tres cuartas partes de los datos son 3
31
4
= 23,25,
por lo que se tiene Q
3
= 6.
Veamos ahora cmo calcular, a modo de muestra, el percentil
p
7
. Siete centsimas partes de los datos son 7 % de 31 = 2,17. El
primer valor cuya frecuencia absoluta acumulada supera 2,17
es 2. Por tanto, p
7
= 2.
Ejemplo 11
http://www.aulademate.com/
contentid-255.html
Pgina interactiva, al introducir
los valores de la variable y
sus frecuencias, el programa
construye una tabla y calcula
los parmetros estadsticos.
WEB
210
11
Los grfcos son formas sencillas de representar las frecuencias absolutas y
relativas de una distribucin de datos asociada a cierto estudio estadstico.
Segn sea la variable que vamos a estudiar, se emplea uno u otro tipo de
grfcos.
4 GRFICOS ESTADSTICOS
DIAGRAMA DE BARRAS A
Los diagramas de barras se emplean, generalmente, para variables cuanti-
tativas con pocos valores diferentes. En unos ejes de coordenadas, sealamos
los valores de la variable en el eje de abscisas. Tras esto, sobre cada valor de la
variable se levanta una barra cuya altura sea la frecuencia (absoluta o relativa,
segn proceda) correspondiente.
Hemos preguntado a 36 parejas el nmero de veces que salen
a comer o cenar fuera mensualmente. Los datos aparecen re-
cogidos en la tabla:
N. de veces que salen 1 2 3 4 5 6
N. de parejas 3 9 2 8 10 4
El diagrama de barras asociado a esta distribucin es el del
margen.
Ejemplo 12
POLGONO DE FRECUENCIAS B
Al igual que los diagramas de barras, los polgonos de frecuencias se asocian
a variables de pocos valores. En unos ejes de coordenadas se representa un
punto por cada valor de la variable. La abscisa de cada punto representa el
valor de la variable, mientras que la ordenada representa la frecuencia. Unien-
do estos puntos mediante segmentos rectilneos se obtiene el denominado
polgono de frecuencias.
Es bastante habitual la representacin conjunta del diagrama de barras y el
polgono de frecuencias.
El grfco del margen es el polgono de frecuencias de la dis-
tribucin del ejemplo 12.
Ejemplo 13
Construye en tu cuaderno el diagrama de ba-
rras y el polgono de frecuencias de la distribucin
siguiente:
Valor 1 2 3 4 5
Frecuencia 2 5 9 0 7
La distribucin siguiente corresponde al n-
mero de hermanos que tiene cada alumno de una
clase. Construye en tu cuaderno el diagrama de
barras y el polgono de frecuencias asociados.
Hermanos 0 1 2 3 4
Frecuencia 6 9 7 4 1
Ejercicios
20 21
Valor 1 2 3 4 5 6
0
1
2
3
4
5
6
7
8
9
10
11
Frecuencia
1 2 3 4 5 6
0
1
2
3
4
5
6
7
8
9
10
11
Frecuencia
Valor
211
A un valor x
i
de frecuencia
relativa h
i
le corresponde un
sector circular con ngulo
central de
i
= 360 h
i
grados
sexagesimales.
Ten en cuenta
DIAGRAMA DE SECTORES C
El diagrama de sectores se emplea habitualmente con variables asocia-
das a caracteres cualitativos, aunque tambin es posible su uso con caracte-
res cuantitativos. En este grfco, se descompone un crculo en tantos sectores
circulares como valores tome la variable. El ngulo central de cada sector
es proporcional a la frecuencia del valor correspondiente. En este tipo de
grfcos se suele indicar el porcentaje asociado a cada sector.
Los 500 empleados de una ofcina acuden al trabajo en distintos medios de transporte.
Transporte hi pi Grados
i
= 360 h
i
Coche 200 0,40 40 % 144
Metro 150 0,30 30 % 108
Autobs 30 0,06 6 % 21,6
Bicicleta 20 0,04 4 % 14,4
A pie 100 0,20 20 % 72
Total 500 1 100 % 360
Ejemplo 14
Coche
Metro
Autobs
Bicicleta
A pie
40 %
30 %
6 %
4 %
20 %
HISTOGRAMA D
El histograma se emplea con variables cuantitativas de datos agrupados en
intervalos. Asumiendo que stos son de igual longitud, sobre cada uno se
levanta un rectngulo cuya altura es la frecuencia del intervalo correspon-
diente.
Pedro ha hecho un recuento del nmero de personas que viven en cada una de las calles de
un barrio de su pueblo. Los resultados aparecen agrupados en la tabla, y el histograma es:
Ejemplo 15
Personas f
i
[50, 55) 3
[55, 60) 2
[60, 65) 5
[65, 70) 4
Total 14
50 55 60 65 70
0
1
2
3
4
5
6
Frecuencia
Nmero de personas por calle
Construye el histograma asociado a la
distribucin siguiente:
5, 8, 13, 23, 4, 16, 7, 24, 21, 1, 0, 4, 15, 11, 9, 2,
4, 11, 22, 21, 7, 6, 2, 1, 0, 4, 9, 14, 12, 22, 25, 0
Dibuja un diagrama de sectores que represen-
te las preferencias literarias de 100 lectores:
Gnero Policiaco Aventuras Terror
Frecuencia 50 20 30
22 23
Ejercicios
212
EJERCICIOS RESUELTOS 11
Un jardinero revisa los rosales de su invernadero y anota las alturas
de los mismos, representando los datos obtenidos en este histograma.
Halla la media, la desviacin tpica, la mediana y la moda de la distribu-
cin de alturas.
1
Altura x
i
f
i
f
i
x
i
f
i
x
i
2
F
i
[20, 40) 30 10 300 9 000 10
[40, 60) 50 8 400 20 000 18
[60, 80) 70 12 840 58 800 30
[80, 100) 90 5 450 40 500 35
[100, 120) 110 7 770 84 700 42
Total N = 42 2 760 213 000
La clase modal es [60, 80), con frecuencia f
i
= 12. Por tanto, la moda, que es la
marca de clase de [60, 80), es M
0
= 70 cm.
Respecto a la mediana, observa que la mitad de la poblacin es
N
2
= 21. La
primera clase que supera
N
2
= 21 es tambin [60, 80), por lo que Me = 70 cm.
Por ltimo, la media es
x
n
i = 1
f
i
x
i
N
=
2 760
42
= 65,71 cm, y la varianza es:
2
n
i = 1
f
i
x
i
2
N
x
2
=
213 000
42
2 760
42
2
753,623 cm
2
, por lo que se tiene que
la desviacin tpica es:
=
2
753,623 27,452 cm.
20 40 60 80 100 120
0
Frecuencia absoluta
Altura de los rosales en cm
1
2
3
4
5
6
7
8
9
10
11
12
2 7 8 10 9
17 13 5 14 16
12 20 14 9 10
19 4 6 16 15
18 12 17 22 0
22 0 24 13 7
Venta de lavadoras
Los datos del margen corresponden a la venta de lavadoras de un
establecimiento cada da del ltimo mes.
a) Calcula el nmero medio de lavadoras vendidas en este periodo.
b) Halla la moda.
c) Halla la mediana, as como el primer y el tercer cuartiles.
2
Para calcular los parmetros estadsticos pedidos, es necesario elaborar la
tabla de frecuencias ampliada con las columnas adecuadas.
213
Lavadoras
vendidas por da
x
i
f
i
f
i
x
i
F
i
[0, 5) 2,5 4 10 4
[5, 10) 7,5 7 52,5 11
[10, 15) 12,5 8 100 19
[15, 20) 17,5 7 122,5 26
[20, 25) 22,5 4 90 30
Total 375
a) Puesto que los datos varan entre 0 y 24, para elaborar la tabla de frecuencias
parece razonable distribuirlos en las clases [0, 5), [5, 10), [10, 15), [15, 20) y
[20, 25). A la vista de la tabla de frecuencias, la venta media de lavadoras es:
x =
n
i = 1
f
i
x
i
N
=
375
30
= 12,5
b) La clase modal es [10, 15), con frecuencia 8. Por tanto, la moda es
M
0
= 12,5.
c) El nmero de datos es 30, y su mitad es 15. La clase mediana es [10, 15), ya
que su frecuencia absoluta acumulada excede por primera vez la mitad
de los datos. Tomamos como aproximacin de la mediana la marca de
esta clase, Me = 12,5.
La cuarta parte de los datos es 7,5. La clase que contiene el primer cuartil
es [5, 10), ya que su frecuencia absoluta acumulada excede por vez primera
la cuarta parte de los datos. Luego el primer cuartil es la marca de [5, 10),
es decir, Q
1
= 7,5. Anlogamente se halla Q
3
= 17,5.
A una proyeccin cinematogrfca asisten 50 nios, 75 jvenes,
60 adultos y 40 ancianos. Representa estos datos en un diagrama de
sectores.
Primero se elabora la tabla de frecuencias, incluyendo los grados:
Categora p
i
Grados
Nios 50 22 % 79,2
Jvenes 75 33 % 118,8
Adultos 60 27 % 97,2
Ancianos 40 18 % 64,8
Total 225 100 % 360
Ancianos
18 %
Nios
22 %
Adultos
27 % Jvenes
33 %
Para calcular los grados se puede emplear una regla de tres.
100 % 360
22 %
As, al 22 % se le asocia el ngulo =
7 920
100
= 79,2, y procedemos de igual
modo con el resto
3
214
EJERCICIOS PROPUESTOS 11
Nociones de Estadstica
A los empleados de una ofcina se les pregunta
por los aspectos siguientes:
Estado civil.
Nmero de libros que leen al mes.
Preferencias cinematogrfcas.
Color de pelo.
Aos de antigedad en la empresa.
Distancia entre la ofcina y su vivienda.
a) Indica si los caracteres anteriores son cualitativos o
cuantitativos.
b) Seala modalidades posibles de los caracteres cua-
litativos.
c) Seala posibles valores de la variable estadstica en
el caso de los caracteres cuantitativos.
Determina, para cada uno de los estudios esta-
dsticos siguientes, el individuo, la poblacin, la variable
estadstica, y si sta es continua o discreta:
a) Cuntos alumnos aprueban matemticas en tu clase?
b) Cuntos libros lee cada uno de los habitantes del
barrio en que vives?
c) Cul es el gasto mensual en comestibles de cada
uno de los vecinos de un bloque de pisos?
Disea un estudio estadstico relativo al uso de
medios de transporte. Describe una variable estadstica
relacionada con este estudio y la poblacin estudiada.
Inventa una variable estadstica discreta y una
variable estadstica continua, sealando los posibles va-
lores que pueden tomar.
Seala un carcter que pueda adoptar una for-
ma cualitativa y cuantitativa.
Tablas estadsticas
Construye la tabla de frecuencias para la si-
guiente distribucin de datos:
0 0 0 1 1 2 3 2 1 4 0
El nmero de hijos de los empleados de una
ofcina es el siguiente:
0 2 1 1 2 3 2 1 4 0
2 0 3 1 4 2 1 1 2 1
Elabora la tabla de frecuencias de esta distribucin de
datos.
Las calificaciones de matemticas de los 20
alumnos de una clase son:
0 2 4 5 5
1 7 5 2 8
7 5 1 1 3
8 4 4 3 0
Construye en tu cuaderno la tabla de frecuencias de esta
distribucin de datos.
La tabla siguiente corresponde al nmero de
cigarrillos que un grupo de fumadores (que intentan
dejar de fumar) consume al da:
N. de cigarrillos x
i
f
i
h
i
p
i
2 1
3 5 0,2
4 24 %
5
6 16 %
7 2
8 o ms 4 0,16
Total N = 25
Copia en tu cuaderno completando esta tabla y respon-
de a las cuestiones:
a) Cuntos fuman ms de 5 cigarrillos?
b) Qu porcentaje de fumadores fuma menos de 6 ci-
garrillos?
1
2
3
4
5
6
7
8
9
215
Copia en tu cuaderno y calcula las marcas de
clase asociadas a esta tabla:
Clase Marca de clase
[0, 5)
[5, 13)
[13, 19)
[19, 30)
Al fnal de una semana, una zapatera hace ba-
lance de sus ventas. La tabla siguiente refeja las ventas
segn el precio:
Clase Marca de clase
[40, 50) 60
[50, 60) 40
[60, 70) 65
[70, 80) 82
[80, 90) 120
[90, 100) 95
[100, 500) 54
Elabora la tabla de frecuencias, sin olvidar las marcas
de clase.
En el estudio de una variable continua X se ha
obtenido la siguiente tabla de frecuencias que, por des-
gracia, est incompleta. Seras capaz de completarla en
tu cuaderno?
En el reconocimiento mdico al que se somete
a los profesores de un pequeo colegio, se han medido
sus alturas. stos son los resultados obtenidos (en cen-
tmetros):
150 152 153 170 172 168
174 171 172 167 163 155
169 175 178 180 174 181
Agrupa los datos en intervalos y construye la tabla de
frecuencias, que debe incluir marcas de clase, frecuen-
cias absolutas y relativas, y porcentajes.
Clases Marca x
i
f
i
h
i
p
i
[0, 10) 0,20
[10, ) 12,5 30 %
[15, 20)
Total N = 50
Clases Marca x
i
f
i
h
i
p
i
[0, 10) 0,20
[10, ) 12,5 30 %
[15, 20)
Total N = 50
El empleado de un videoclub selecciona una
muestra de sus clientes y anota el nmero de pelculas
que cada uno de ellos ha sacado durante el ltimo tri-
mestre. Los datos que ha obtenido son:
12 14 11 20 24 19
16 21 17 25 29 28
23 24 29 21 20 13
15 15 24 23 26 24
Agrupa los datos de cinco en cinco y construye la tabla
de frecuencias.
Parmetros estadsticos
Calcula la media y la desviacin tpica de las
siguientes distribuciones:
a) 7, 3, 4, 5, 6, 9, 0, 3, 4, 2, 1
b) 2, 1, 8, 6, 5, 3, 3, 2, 10, 3, 7
Decide cul de las dos distribuciones tiene un mayor
grado de dispersin.
Calcula la mediana, los cuartiles y la moda de
las distribuciones del ejercicio anterior.
Calcula la media, la desviacin tpica, el coef-
ciente de variacin y los cuartiles de las distribuciones
de los ejercicios 6, 7 y 8.
Escribe en tu cuaderno una distribucin cuya
media sea 5.
Escribe en tu cuaderno una distribucin de me-
diana 4.
Escribe en tu cuaderno una distribucin de me-
dia 0 y me diana 3.
Calcula los parmetros estadsticos de la si-
guiente distribucin:
x
i
1 2 3 4 5 6 7
f
i
10 5 6 9 4 7 2
10
11
12
13
14
15
16
17
18
19
20
21
216
EJERCICIOS PROPUESTOS 11
Calcula la media, la desviacin tpica, el coef-
ciente de variacin, la mediana, los cuartiles y la moda
de las distribuciones de los ejercicios 13 y 14.
El nmero de faltas de ortografa cometidas por
un grupo de alumnos en una redaccin aparece refeja-
do en la tabla:
N. de faltas 0 1 2 3 4 5
N. de alumnos 3 7 8 7 9 6
a) Halla la media, la desviacin tpica y el coefciente de
variacin.
b) Halla la mediana y la moda.
c) Halla los cuartiles.
Dada la distribucin 2, 4, 5, 8, 2, 1, 0, calcula su
media. A continuacin, suma un valor constante a todos
los datos de la distribucin anterior y calcula la media de
estos nuevos datos. Qu observas?
Sea
x + k.
Halla los cuartiles y los percentiles p
10
y p
30
para
la distribucin del ejercicio 11.
Copia en tu cuaderno y completa la tabla sa-
biendo que
x = 1,75.
x
i
0 1 2 3 4
f
i
2 3 1 2
Calcula la media, la mediana y la moda de la
distribucin del ejercicio 11.
Halla la media, la desviacin tpica, la mediana
y la moda de la siguiente distribucin:
Intervalos [0 ,2) [2, 4) [4, 6)
Frecuencia 10 5 6
22
23
24
25
26
27
28
29
El tiempo, en minutos, que un grupo de socios
de una biblioteca dedica cada da a leer es:
30 45 11 90 123 67
52 56 60 69 29 89
23 145 96 100 126 34
a) Agrupa y construye la tabla de frecuencias.
b) Halla la media, la desviacin tpica y el coefciente de
variacin.
c) Halla la mediana y la moda.
d) Halla el primer y tercer cuartiles.
e) Cul es el percentil de una persona que dedica
60 minutos a leer?
f) Calcula un percentil que no coincida con ninguno de
los cuartiles.
J
u
l
i
o
V
e
r
n
e
El peso medio de los corredores de fondo de
un club de atletismo es 55 kg, y su desviacin tpica es
2,5 kg. Por otra parte, el peso medio de las corredoras
es 49 kg y la desviacin tpica es 2,1 kg. Compara la dis-
persin de los pesos de ambos grupos.
30
31
217
Grfcos estadsticos
En una poblacin de 30 familias se ha estudiado
el nmero de mviles de cada una de ellas. Los datos
recopilados son los siguientes:
2 3 0 4 1
5 1 2 2 3
3 4 6 3 2
3 2 1 2 5
2 2 0 1 3
6 2 1 2 6
a) Construye en tu cuaderno la tabla de frecuencias de
esta distribucin.
b) Traza el diagrama de barras.
c) Elabora el polgono de frecuencias.
d) Calcula la media y la desviacin tpica.
e) Halla la mediana y la moda.
f) Calcula los cuartiles Q
1
y Q
3
.
Hemos preguntado a un grupo de personas
cunto tiempo dedican semanalmente a la prctica de
algn tipo de ejercicio fsico. stos son los resultados
obtenidos:
N. de horas N. de personas
[0, 1) 6
[1, 2) 13
[2, 3) 20
[3, 4) 18
[4, 5) 120
[5, 8) 9
a) Construye en tu cuaderno la tabla de frecuencias
correspondiente.
b) Dibuja el histograma asociado.
c) Halla la media y la desviacin tpica.
d) Halla la mediana y la moda.
e) Qu porcentaje dedica menos de dos horas al ejer-
cicio fsico?
Construye en tu cuaderno el histograma aso-
ciado a los datos de los ejercicios 29 y 30.
33
34
35 Una clnica mdica que ofrece consultas de
distintas especialidades, anota el nmero de perso -
nas que acude a cada una de ellas una maana concre-
ta.
Especialidad N. de personas
Medicina general 30
Neumologa 15
Neurologa 14
Ginecologa 18
Medicina interna 7
Radiologa 20
a) Confecciona un diagrama de sectores para esta dis-
tribucin.
b) Qu tanto por ciento de personas acuden a Medici-
na general o a Radiologa?
Representa en tu cuaderno las distribuciones
de los ejercicios 13 y 14.
Analiza el histograma siguiente:
10 20 30 40 50 60
0
2
4
6
8
10
12
14
16
18
20
Frecuencia
a) Elabora la tabla de frecuencias asociada a este histo-
grama.
b) Calcula la media y la desviacin tpica. Cul es el
coefciente de variacin?
c) Halla los cuartiles Q
1
y Q
3
.
37
36
32
218
PARA REPASAR
EN GRUPO 11
Elabora con tu grupo de trabajo un esquema con los siguientes conceptos
de la Unidad y pon un ejemplo de cada uno de ellos.
CONCEPTO DEFINICIN
Poblacin Conjunto de individuos sometidos a estudio.
Muestra Es una parte de la poblacin.
Carcter estadstico Rasgo de una poblacin que nos interesa estudiar.
Variable estadstica
Conjunto de valores que toma un carcter. Se dividen en
cuantitativas y cualitativas.
Frecuencia absoluta Nmero de veces que se repite un valor determinado.
Marca de clase Valor central de cada intervalo de valores.
Media aritmtica
x =
n
i = 1
f
i
x
i
N
Varianza
Var =
2
=
n
i = 1
f
i
(x
i
x )
2
N
=
n
i = 1
f
i
x
i
2
N
x
2
Desviacin tpica
= Var 0
Coeciente
de variacin
Es el cociente CV =
x
.
Moda
Si la variable es discreta, es el valor con mayor frecuencia. Si
la variable es continua, es la marca de clase del intervalo de
mayor frecuencia.
Mediana
La mediana es el valor que divide los datos de una
distribucin en dos partes iguales.
Grcos
estadsticos
Son formas sencillas de representar las frecuencias de
una variable estadstica. Algunos tipos de grcos son
los diagramas de barras, los polgonos de frecuencias, los
diagramas de sectores y los histogramas.
En la pestaa Actividades/
Unidad 11, encontrars la
actividad Relacin 1 unidad 11,
para repasar los conceptos ms
importantes de la unidad.
En la pestaa Mapa del CD/
Unidad 11, encontrars el Test
de autoevaluacin.
En la pestaa Mapa del
CD/Juegos matemticos,
encontrars la Animacin de
Estadstica.
CD
CD
CD
219
CURIOSIDADES,
JUEGOS Y DESAFOS
El desconocimiento de la teora estadstica conduce, en muchas ocasiones,
a que amplios sectores de la poblacin den por buenas conclusiones que,
aunque a simple vista parecen correctas, son errneas.
Un buen ejemplo lo encontramos en un fenmeno denominado la paradoja
de Simpson, tambin conocido como efecto Yule-Simpson. Este fenmeno apa-
rece con frecuencia en estudios estadsticos de la Medicina, la Sociologa, etc.
Un caso real, y muy conocido, que ilustra la paradoja de Simpson tuvo lugar
cuando una prestigiosa universidad estadounidense fue demandada por
discriminacin contra las mujeres que solicitaban ingreso. Las cifras sobre
admisin en el otoo de 1973 mostraban que el porcentaje de admisin era
favorable a los hombres y, siendo la diferencia notable, se juzg que no se
deba al azar.
DESAFO MATEMTICO
Trata de encontrar una situacin real que ponga de manifesto la paradoja de
Simpson. Si lo necesitas, pide ayuda a tu profesor.
Hombres Mujeres
Departamentos Solicitantes % admitidos Solicitantes % admitidos
A 825 62 % 108 82 %
B 560 63 % 25 68 %
C 325 37 % 593 34 %
D 417 33 % 375 35 %
E 191 28 % 393 24 %
F 272 6 % 341 7 %
Sin embargo, al examinar las solicitudes distinguiendo los distintos depar-
tamentos, se observaba que ninguno discriminaba signifcativamente a las
mujeres y que, de hecho, la mayor parte de los departamentos favoreca,
en todo caso, a las mujeres.
N. de solicitantes % admitidos
Hombres 8 442 44 %
Mujeres 4 321 35 %
La explicacin resulta ser que las mujeres tendan a presentar solicitudes
en departamentos con bajos porcentajes de admisin, mientras que la ten-
dencia de los hombres era la contraria.
Al dividir los datos en especialidades, hemos introducido unas variables
(lurking variables, en la literatura cientfca) que, si son omitidas, pueden
conducirnos a una conclusin errnea.
La paradoja de Simpson pone de manifesto que debemos ser precavidos
cuando hagamos deducciones basndonos en la asociacin de dos varia-
bles. Es imprescindible tener en cuenta las lurking variables si se pretende
establecer relaciones de causa y efecto.
Edward H. Simpson, Karl
Pearson, Udny Yule, adems
de otros, describieron este
fenmeno.
Sabas que...