Вы находитесь на странице: 1из 20

Intervalo

El intervalo semiabierto por la


derecha [a, b) es el conjunto de
todos los nmeros reales mayores
o iguales que a y menores que b.
[a, b) = {x R| a x < b}
Sector circular y ngulo
central
Un sector circular es la porcin
de crculo comprendido entre
dos radios, y queda determinado
por el ngulo que forman estos
radios. Este ngulo se llama
central.
Estudio estadstico
y variable estadstica
Se hace un estudio estadstico
cuando se quiere obtener
informacin sobre algn tema
relacionado con un grupo de
elementos similares.
La informacin se obtiene a partir
de una pregunta llamada
variable estadstica.
Parmetros estadsticos
Son valores que sintetizan la
informacin contenida en una
variable estadstica. Algunos
de ellos son la media, la mediana,
la moda, la desviacin tpica,
etctera.
Recuerdas qu es?
11
TTULAR (PUEDE SER
DE DOS LNEAS)
Texto de introduccin (ajustar la mancha de
color al texto). Un libro de recetas de cocina
indica que, para la elaboracin de una tarta
de manzana para 4 personas se necesitan
los siguientes ingredientes: 200 g de masa,
6 manzanas reineta, 150 g de azcar, 3 cu-
charadas de mermelada de albaricoque y
200 g de crema pastelera. Si lo que se desea
es hacer una tarta para 8 personas, es lgico
suponer que la cantidad necesaria de cada
uno de los ingredientes es el doble de la indi-
cada para una tarta de 4 personas. Pero si se
quiere que la tarta sea de cinco, seis o siete
raciones, cul sera la cantidad necesaria
de cada ingrediente?
En esta Unidad, vas a ver cmo puedes cal-
cular la cantidad de cada uno de los ingre-
dientes para hacer una tarta con las raciones
que desees a partir de la receta dada.
(Objetivos o contenidos)
Los objetivos de esta Unidad son:
Que aprendas a determinar la constante
de proporcionalidad.
00. La Tierra
A. Los movimientos de la Tierra
11
ESTADSTICA
La Estadstica, o ciencia del Estado, se
emple en su origen para la descripcin de
datos. Resulta lgico que los Estados quieran
estudiar distintas caractersticas de las
poblaciones y sus recursos.
El primer objetivo de la Estadstica es hallar
procedimientos para representar y sintetizar
la informacin proporcionada por ciertos
datos. La rama denominada Estadstica
descriptiva se encarga de este objetivo.
Posteriormente, la Estadstica abord un
objetivo mucho ms ambicioso: realizar
predicciones fables sobre la poblacin
a partir de una muestra extrada. De ello se
encarga la llamada Estadstica inferencial.
El desarrollo de las tcnicas de anlisis
de muestras permite relacionar variables
fsicas y sociales, incluso antes de encontrar
el principio que explica su relacin.
Los objetivos de esta Unidad son:
Dominar los conceptos elementales
de la Estadstica descriptiva.
Aplicar las tcnicas y clculos estadsticos
a un conjunto de datos.
202
11
En la prctica, los trminos
carcter y variable se emplean
como si fueran equivalentes.
As, hablamos de variables
cualitativas y cuantitativas.
Otros aspectos asociados
a distintas poblaciones son,
por ejemplo, el nmero
de horas que entrenan unos
deportistas o la profesin de
los integrantes de un club
de ajedrez.
Supn, a modo de ejemplo, que deseamos estimar el tiempo que puede so-
brevivir una determinada especie vegetal sin ser regada. No parece razonable
dejar sin agua a todas las plantas de esa especie, pero s se puede seleccionar
un grupo de stas y someterlas a esta prueba. Pues bien, el conjunto de todas
las plantas de esa especie se denomina poblacin, y el grupo de plantas que
se somete a la prueba se denomina muestra. Del estudio de la muestra se
pretende obtener conclusiones referidas al total de la poblacin.
1 NOCIONES DE ESTADSTICA
Poblacin es un conjunto de elementos que, por un motivo u otro, estamos
interesados en estudiar.
Individuo es cada uno de los elementos de la poblacin.
Muestra es una parte de la poblacin.
La Estadstica es la ciencia que, mediante el uso de modelos matemticos,
organiza datos asociados a una cierta poblacin y permite obtener conclu-
siones a partir de muestras.
En una poblacin determinada se pueden estudiar distintos aspectos. As, en
el ejemplo que abre esta seccin, el aspecto que estudiamos es tiempo de
vida de una planta sin ser regada.
Los distintos aspectos o rasgos de una poblacin se llaman caracteres
estadsticos, o simplemente caracteres.
Un carcter es cualitativo si toma valores no numricos. Por ejemplo, el
lugar de nacimiento es un carcter cualitativo, pues los valores que toma,
Madrid, Segovia, Badajoz, no son numricos. Los valores que toma un ca-
rcter cualitativo reciben el nombre particular de modalidades.
Un carcter es cuantitativo si toma valores numricos. As, la edad de una
persona que toma valores como 5 aos, 6 aos, 30 aos, es un carcter
cuantitativo.
El conjunto de valores que toma un carcter estadstico se denomina va-
riable estadstica, o, si no hay confusin, variable.
Una variable cuantitativa es discreta si los valores que toma son aislados. Por
ejemplo, el nmero de hermanos o el nmero de pginas de un libro. Si
la variable puede tomar todos los valores de un intervalo, se denomina con-
tinua. Son variables continuas la talla, el peso o el tiempo que tarda un
corredor en concluir una maratn.
Pon dos ejemplos de variable discreta, e in-
dica los valores aislados que pueden tomar.
Piensa en dos ejemplos de variable continua,
e indica los valores que pueden tomar.
Pon dos ejemplos de carcter estadstico cua-
litativo y dos de carcter estadstico cuantitativo.
A unos alumnos se les pregunta por el depor-
te que practican. Es un carcter cuantitativo?
Ejercicios
1
2
3
4
Refexiona
Ten en cuenta
http://descartes.cnice.mec.
es/materiales_didacticos/
iniciacion_estadististica_
fjgarcia/01VariablesEstadisticas.
htm
En esta pgina de F. J.
Garca aparecen distintos
tipos de variables que hay
que identifcar, pudindose
comprobar la respuesta.
WEB
203
2 TABLAS DE FRECUENCIAS
El primer problema de la Estadstica es la ordenacin y tabulacin de los da-
tos obtenidos en ciertas observaciones para extraer conclusiones sobre las
caractersticas de una poblacin. Las tablas de frecuencia de una variable
estadstica permiten ordenar los datos estadsticos y proporcionar una lectura
clara de los mismos. Distinguiremos dos tipos de tablas.
VARIABLES DISCRETAS A
Supongamos una variable discreta que toma los valores x
1
, x
2
, ..., x
i
, ... Asocia-
dos a estos datos, defnimos:
Frecuencia absoluta del valor x
i
: es el nmero de veces que se repite el
valor x
i
. Se representa como f
i
.
Tamao de la poblacin: es N = f
1
+ f
2
+ ... + f
n
=
n
i = 1
f
i
.
Frecuencia relativa h
i
del valor x
i
: es el cociente entre la frecuencia
absoluta y el tamao de la poblacin o de la muestra, esto es, h
i
=
f
i
N
.
Porcentaje del valor x
i
es el tanto por ciento de aparicin del valor x
i
. Se
representa como p
i
, y se calcula con la expresin p
i
= 100 h
i
.
Con lo anterior, se construye la denominada tabla de frecuencias.
El conjunto de datos obtenidos
en un estudio estadstico se
llama distribucin de datos.
Defnicin
El smbolo , que no es ms
que la letra griega sigma, en
matemticas se llama sumatorio
y sirve para escribir de manera
abreviada sumas. As, la
expresin x
1
+ x
2
+ ... + x
n
se
abrevia como
n
i = 1
f
i
.
Defnicin
En el Ejemplo 1, el dato 0
aparece 2 veces, por lo que su
frecuencia es f
1
= 2. Igualmente
con el resto de datos.
Ten en cuenta
A un grupo de 20 socios de una biblioteca se les ha preguntado sobre el nmero de libros que
han ledo el mes pasado. Las respuestas son las siguientes:
4, 2, 1, 0, 3, 1, 4, 2, 0, 2, 1, 1, 2, 1, 2, 4, 3, 4, 1, 2.
El tamao de la poblacin es N = 20, y la tabla de frecuencias queda as:
x
i
f
i
h
i
p
i
0 2 2/20 = 0,1 10%
1 6 6/20 = 0,3 30%
2 6 6/20 = 0,3 30%
3 2 2/20 = 0,1 10%
4 4 4/20 = 0,2 20%
Total N = 20 1 100%
Ejemplo 1
Copia en tu
cuaderno y com-
pleta la tabla de
frecuencias de
las edades de los
miembros de un
club de ajedrez:
Construye la tabla de frecuencias de las si-
guientes distribuciones de datos, sealando situa-
ciones reales a las que se puedan asociar:
a) 4, 3, 2, 2, 0, 1, 4, 1, 1, 3, 0, 0, 0, 4, 5.
b) 18, 23, 22, 19, 23, 23, 24, 21, 23, 19, 18, 23, 23,
24, 23, 22, 23, 21.
Ejercicios
5 6
x
i
f
i
h
i
p
i
9 0,15
10 9
11 40 %
Total 20
204
11
VARIABLES CONTINUAS B
Si la variable es continua, o el nmero de valores distintos de la variable es
muy elevado, conviene elaborar una tabla de frecuencias agrupando los datos
en intervalos o clases.
El punto medio de cada clase se denomina marca de clase y se designa
como x
i
.
Una vez distribuidos los datos en intervalos y calculadas las marcas de clase,
el modo de proceder es anlogo al de las variables discretas, sustituyendo la
totalidad del intervalo por su marca de clase.
Los intervalos suelen ser
del mismo tamao, aunque
no siempre es as.
Ten en cuenta
A modo de ejemplo, la marca
de clase de [10,15) es:
10+15
2
= 12,5
Ten en cuenta
Copia y completa en tu cuaderno la siguiente
tabla de frecuencias:
Clases
Marca
x
1
f
1
h
1
p
i
[0, 10) 10 0,20
[10, 15) 30 %
[15, 20) 5
[20, 25)
[25, 30) 2 4 %
Total N = 50
El nmero de personas que acudieron a un
servicio mdico a lo largo del ltimo mes es:
24 26 30 29 31
23 35 43 27 35
28 32 27 21 32
41 22 28 40 38
22 25 41 24 43
22 26 34 29 40
Agrupa los datos anteriores en intervalos de am-
plitud 5 y elabora la tabla de frecuencias de esta
distribucin.
Ejercicios
7 8
Una fbrica elabora varillas de hierro de diferentes longitudes.
La longitud, en milmetros, de 30 de ellas es la siguiente:
15 12 11 14 24 17 10 6 10 23
10 15 17 18 19 16 12 23 12 19
24 18 12 13 24 8 21 15 11 14
Se trata de una distribucin de variable continua. El dato menor
es 6 mm y el mayor es 24 mm, por lo que podemos formar estas
cuatro clases: [5, 10), [10, 15), [15, 20) y [20, 25). Efectuando el
recuento de los datos y agrupndolos en estas clases, se elabora
la tabla de frecuencias:
Clases
Marca de
clase x
1
f
i
h
i
p
i
[5, 10) 7,5 2 2/30 6,66 %
[10, 15) 12,5 12 12/30 40 %
[15, 20) 17,5 10 10/30 33,33 %
[20, 25) 22,5 6 6/30 20 %
Total N = 30 1 100 %
Ejemplo 2
http://descartes.cnice.mec.
es/materiales_didacticos/
Recuento_y_agrupacion_datos/
organizacion_datos.htm
Pgina de J.A. Gonzlez que
permite la visualizacin de
la construccin paso a paso
de una tabla de frecuencias
fnalizando con el clculo
de la media.
http://descartes.cnice.
mec.es/materiales_
didacticos/iniciacion_
estadististica_fjgarcia/
02TablasDeFrecuencias.htm
Esta pgina de F. J. Garca
permite construir tablas de
frecuencia de variable discreta
controlando el tamao de los
intervalos.
WEB
205
3 PARMETROS ESTADSTICOS
Los parmetros estadsticos son un pequeo nmero de valores que resu-
men la informacin de una variable estadstica. Se dividen en parmetros de
centralizacin (los datos se agrupan en torno a stos) y parmetros de disper-
sin (informan sobre la intensidad con que se agrupan los datos en torno a
los valores centrales).
MEDIA, VARIANZA Y DESVIACIN TPICA A
Considera una variable estadstica X, de tamao N, con la tabla de frecuencias
del margen. Los valores x
1
, x
2
, x
i
, ... x
n
son los valores de la variable, si sta es
discreta, o las marcas de clase, si es continua.
La media aritmtica de X es:

x =
f
1
x
1
+ f
2
x
2
+ + f
n
x
n
f
1
+ f
2
+ + f
n
=
n
i = 1
f
i
x
i
n
i = 1
f
i
=
n
i = 1
f
i
x
i
N
La media aritmtica (o por simplicidad, la media) es un valor en torno al cual
se concentra la distribucin, y se mide en las mismas unidades que los datos.
La varianza de X es Var =
2
=
n
i = 1
f
i
(x
i

x)
2
N
=
n
i = 1
f
i
x
i
2
N

x
2
0
La desviacin tpica de X es = Var 0.
Parmetros de centralizacin:
Media, moda, mediana,
cuartiles, percentiles
Parmetros de dispersin:
Varianza, desviacin tpica y
coefciente de variacin.
Vocabulario
x
i
f
i
x
1
f
1
x
2
f
2


x
n
f
n
Total N
x
i
f
i
f
i
x
i
0 2 0
1 5 5
2 5 10
3 1 3
4 2 8
Total N = 15 26
x
i
f
i
f
i
x
i
f
i
x
i
2
0 2 0 0
1 5 5 5
2 5 10 20
3 1 3 9
4 2 8 32
Total N = 15 26 66
La varianza se mide en unidades cuadradas, mientras que la desviacin tpica
lo hace en las mismas unidades que los datos.
A partir de la distribucin del ejemplo 3, multiplicando la columna
x
i
por la columna f
i
x
i
obtenemos f
i
x
i
2
, lo que nos permite calcular:
Var =

n
i = 1
f
i
x
i
2
N

x
2
=
66
15

26
15

2
1,3955...
= Var = 1,3955... = 1,1813...
Ejemplo 4
En la distribucin del margen se ha aadido una columna con
los valores de los productos f
i
x
i
, lo que facilita el clculo de la
media. Como N = 15 y
n
i = 1
f
i
x
i
= 26, la media es

x =
26
15
1,73...
Ejemplo 3
En la pestaa Actividades/
Unidad 11, encontrars la
actividad Relacin 2 unidad 11,
para calcular la media.
CD
206
11
COEFICIENTE DE VARIACIN B
La desviacin tpica representa una medida de la dispersin de los datos
respecto a la media. Ahora bien, como media y desviacin tpica tienen uni-
dades, el que la desviacin sea grande o pequea es poco relevante si
se desconoce lo grande o pequea que es la media. En particular, la des-
viacin tpica por s sola no permite comparar grados de dispersin de dos
distribuciones de datos. Para resolver este problema, se defne el coefciente
de variacin (o de dispersin).
El coefciente de variacin CV de una variable X es el cociente entre la
desviacin tpica y la media. Es decir, CV =

x
.
El coefciente de variacin
es una magnitud sin unidades
y representa una medida
relativa de la dispersin.
Ten en cuenta
Halla la media, la desviacin tpica y el coef-
ciente de variacin de estas distribuciones:
a) 27, 22, 29, 30, 21, 22, 27, 18, 23, 26, 33, 35, 20,
26, 29.
b) 26, 21, 27, 31, 19, 24, 26, 19, 20, 24, 31, 32, 18,
23, 30.
Cul de las dos distribuciones tiene mayor grado
de dispersin?
Calcula la media, la varianza, la desviacin
tpica y el coefciente de variacin de las distribu-
ciones asociadas a los ejercicios 7 y 8.
Estudia la variable estadstica continua
talla en centmetros, aplicada a dos grupos
distintos de tu clase, y calcula la media, la va-
rianza, la desviacin tpica y el coeficiente de
variacin. Decide en cul de los dos grupos es
mayor la dispersin en la talla.
Ejercicios
9 11
10
Dos vendedores de enciclopedias efectan, durante la l-
tima semana, las ventas siguientes:
Vendedor A 4, 3, 8, 0, 4, 6, 8
Vendedor B 4, 6, 4, 2, 1, 6, 6
Para decidir cul de los dos es ms regular en las ventas
se calculan los respectivos coefcientes de variacin. La
media, la desviacin tpica y el coefciente de variacin
de A son:

x
A
=
33
7
,
A
=
205
7

33
7

2
2,66
CV
A
=
A

x
A

2,66
4,714
0,56 = 56 %
La media, la desviacin tpica y el coefciente de variacin de B son:

x
B
=
29
7
,
B
=
145
7

29
7

2
1,88
CV
B
=
B

x
B

1,88
4,14
0,45 = 45 %
Como el coefciente de variacin CV
B
es menor que CV
A
,
se puede concluir que el vendedor B es ms regular que
el vendedor A en la venta de enciclopedias.
Ejemplo 5
Ventas
x
i
Vendedor A
f
i
f
i
x
i
f
i
x
i
2
0 1 0 0
3 1 3 9
4 2 8 32
6 1 6 36
8 2 16 128
Total N = 7 33 205
Ventas
x
i
Vendedor B
f
i
f
i
x
i
f
i
x
i
2
1 1 1 1
2 1 2 4
4 2 8 32
6 3 18 108
Total N = 7 29 145
207
F
n
= N
MEDIANA Y MODA C
Estudiamos en esta seccin la mediana y la moda. Para defnir y calcular la
mediana es necesario el concepto de frecuencia absoluta acumulada.
En una tabla de frecuencias, la frecuencia acumulada asociada a x
i
, repre-
sentada como F
i
, es la suma F
i
= f
1
+ f
2
+ + f
i
. El valor de F
i
es la suma de
las frecuencias absolutas de x
1
, x
2
, y x
i
.
Halla la media, la mediana y la desviacin
tpica de la distribucin: 3, 5, 2, 4, 6, 6, 4, 3, 5, 7, 4.
Calcula la mediana de las distribuciones del
ejercicio 11.
Ejercicios
12 13
Ten en cuenta
Para defnir la mediana, es
imprescindible que los datos
de la distribucin aparezcan
ordenados. Hecho esto, la
mediana deja el 50 % de la
poblacin antes de ella, y
detrs, el otro 50 %.
Refexiona
x
i
f
i
F
i
0 9 9
1 7 9 + 7 = 16
2 4 16 + 4 = 20
3 1 20 + 1 = 21
4 1 21 + 1 = 22
Consideremos la siguiente tabla de frecuencias a la que se aa-
de la columna de frecuencias absolutas acumuladas:
x
i
f
i
F
i
0 3 3
1 2 3 + 2 = 5
2 3 5 + 3 = 8
3 1 8 + 1 = 9
4 1 9 + 1 = 10
Ejemplo 6
La distribucin (ordenada) 1, 3, 5, 7, 10 tiene 5 datos. La mediana es el dato que ocupa la posi-
cin tercera. Esto es, Me = 5.
La distribucin 9, 10, 12, 15, 15, 16, 19, 24, 30, 45 consta de 10 datos. Los datos centrales, en
las posiciones quinta y sexta, son 15 y 16. Por tanto, la mediana es:
Me =
15 + 16
2
= 15,5
Ejemplo 7
En la tabla de frecuencias del margen, el nmero de datos es
N = 22, que es un nmero par. Como la mitad del tamao de la
poblacin es
N
2
= 11, las posiciones centrales son la 11. y 12., y
como ambas estn asociadas al valor x
i
= 1, la mediana es:
Me =
1 + 1
2
= 1
Ejemplo 8
Podemos abordar ya la defnicin de mediana de una distribucin de datos.
Supongamos que el nmero de datos es pequeo. Tras ordenar los datos en
orden creciente, la mediana Me es el dato que ocupa la posicin central. En
el caso en que el nmero de datos sea par, la mediana Me es la media de los
dos valores centrales.
208
11
Supongamos ahora que los datos se agrupan en intervalos. Denominamos
clase mediana al primer intervalo cuya frecuencia absoluta acumulada es
mayor o igual que la mitad del tamao de la poblacin. Designamos F
i
a esta
frecuencia absoluta acumulada, y x
i
a la marca de la clase mediana. Existen
dos posibilidades:
Si F
i
>
N
2
, entonces la mediana es Me = x
i
.
Si F
i
=
N
2
, entonces la mediana es Me =
x
i
+ x
i + 1
2
.
Otro parmetro que puede calcularse es la moda. A la vista de la tabla del
ejemplo anterior, se observa que la clase con mayor frecuencia absoluta es
[40, 60). Esta clase se denomina clase modal. La marca de la clase modal
se denomina moda. As pues, la moda de esta distribucin de alturas es
M
0
= 50 cm.
Si la distribucin de datos no necesita agrupacin por intervalos (variables
discretas con pocos valores), la moda M
0
es el valor (o valores) de la variable
con mayor frecuencia absoluta.
Halla la mediana y la moda de las distribucio-
nes A y B asociadas al ejemplo 5.
Inventa una distribucin de datos con media-
na 2 y moda 3.
Halla la mediana y la moda de las distribucio-
nes de los ejercicios 7 y 8.
Calcula la media, la mediana y la moda de la
distribucin: 3, 7, 5, 4, 3, 3, 6, 8, 10, 9.
Ejercicios
14 16
15 17
De este mismo modo, se
puede calcular la mediana
de una distribucin de
variable discreta con los datos
presentados en una tabla
de frecuencias.
Ten en cuenta
Altura x
i
f
i
F
i
[0, 20) 10 12 12
[20, 40) 30 16 28
[40, 60) 50 20 48
[60, 80) 70 4 52
x
i
f
i
F
i
0 3 3
1 2 5
2 3 8
3 1 9
4 1 10
N = 10
La tabla del margen proporciona la altura, en centmetros, de las
plantas de un invernadero.
La mitad de la poblacin es
N
2
= 26, por lo que la clase mediana
es [20, 40), con Fi = 28 >
N
2
.
La mediana es la marca de clase de [20, 40), esto es, Me = 30 cm.
Ejemplo 9
Consideramos la distribucin: 0, 1, 3, 0, 2, 1, 0, 2, 4, 2. Al elaborar
la tabla de frecuencias, situada al margen, se observa que los va-
lores 0 y 2 tienen frecuencia 3, que es la mayor de todas. Por tanto,
la distribucin tiene dos modas: M
0
= 0 y M
0
= 2.
Respecto a la mediana, teniendo en cuenta que
N
2
= 5 coincide
con la frecuencia absoluta acumulada F
2
de x
2
= 1, se sigue que:
Me =
x
2
+ x
3
2
=
1 + 2
2
= 1,5
Ejemplo 10
209
CUARTILES Y CENTILES D
Anteriormente se ha comentado que, tras ordenar los datos, la mediana divide
stos es dos partes iguales, dejando a su izquierda la mitad de los datos. Si
en vez de dividir la distribucin en dos partes iguales, lo hacemos en cuatro
partes iguales, los tres puntos de separacin asociados se denominan cuar-
tiles y se representan por Q
1
, Q
2
y Q
3
.
El primer cuartil, Q
1
, deja a su izquierda la cuarta parte de la distribucin,
es decir, el 25 %.
El segundo cuartil, Q
2
, deja a su izquierda la mitad de la distribucin y, por
tanto, coincide con la mediana, es decir, Q
2
= Me.
El tercer cuartil, Q
3
, deja a su izquierda tres cuartas partes de la distribucin,
es decir, el 75 %.
De la misma forma, si deseamos dividir una distribucin en 100 partes iguales,
aparecen 99 puntos de separacin denominados centiles o percentiles. El
percentil de orden k, representado como p
k
, deja a su izquierda k centsimas
partes de la distribucin.
Se verifca: p
25
= Q
1
, p
50
= Q
2
= Me y p
75
= Q
3
.
En el caso de las distribuciones con datos agrupados en intervalos, los cuartiles
se calculan de modo totalmente anlogo a como se hace con la mediana.
Por ejemplo, para calcular Q
1
se busca el primer intervalo cuya frecuencia
absoluta acumulada supera la cuarta parte de los datos. Hallado ste, se iden-
tifca Q
1
con su marca de clase. Anlogamente, se repite el mismo proceso
para Q
3
.
Halla los percentiles p
65
y p
93
para la distribu-
cin del ejemplo 11.
Halla los cuartiles Q
1
y Q
3
para las distribucio-
nes de los ejercicios 7 y 8.
Ejercicios
18 19
En realidad, los cuartiles y
percentiles as calculados son
slo aproximados. El clculo
exacto es algo ms complejo.
Ten en cuenta
Clase f
i
F
i
1 1 1
2 2 3
3 5 8
4 10 18
5 4 22
6 6 28
7 3 31
Total 31
Consideramos la distribucin defnida por la tabla del margen.
Vamos a calcular Q
1
, Q
2
, Q
3
y P
7
,
La cuarta parte de los datos es
31
4
= 7,75.
El primer valor cuya frecuencia absoluta acumulada supera la
cuarta parte de los datos es 3. Luego Q
1
= 3.
La mitad de los datos es 15,5, de donde se desprende que la
mediana es Me = Q
2
= 4.
Por ltimo, las tres cuartas partes de los datos son 3
31
4
= 23,25,
por lo que se tiene Q
3
= 6.
Veamos ahora cmo calcular, a modo de muestra, el percentil
p
7
. Siete centsimas partes de los datos son 7 % de 31 = 2,17. El
primer valor cuya frecuencia absoluta acumulada supera 2,17
es 2. Por tanto, p
7
= 2.
Ejemplo 11
http://www.aulademate.com/
contentid-255.html
Pgina interactiva, al introducir
los valores de la variable y
sus frecuencias, el programa
construye una tabla y calcula
los parmetros estadsticos.
WEB
210
11
Los grfcos son formas sencillas de representar las frecuencias absolutas y
relativas de una distribucin de datos asociada a cierto estudio estadstico.
Segn sea la variable que vamos a estudiar, se emplea uno u otro tipo de
grfcos.
4 GRFICOS ESTADSTICOS
DIAGRAMA DE BARRAS A
Los diagramas de barras se emplean, generalmente, para variables cuanti-
tativas con pocos valores diferentes. En unos ejes de coordenadas, sealamos
los valores de la variable en el eje de abscisas. Tras esto, sobre cada valor de la
variable se levanta una barra cuya altura sea la frecuencia (absoluta o relativa,
segn proceda) correspondiente.
Hemos preguntado a 36 parejas el nmero de veces que salen
a comer o cenar fuera mensualmente. Los datos aparecen re-
cogidos en la tabla:
N. de veces que salen 1 2 3 4 5 6
N. de parejas 3 9 2 8 10 4
El diagrama de barras asociado a esta distribucin es el del
margen.
Ejemplo 12
POLGONO DE FRECUENCIAS B
Al igual que los diagramas de barras, los polgonos de frecuencias se asocian
a variables de pocos valores. En unos ejes de coordenadas se representa un
punto por cada valor de la variable. La abscisa de cada punto representa el
valor de la variable, mientras que la ordenada representa la frecuencia. Unien-
do estos puntos mediante segmentos rectilneos se obtiene el denominado
polgono de frecuencias.
Es bastante habitual la representacin conjunta del diagrama de barras y el
polgono de frecuencias.
El grfco del margen es el polgono de frecuencias de la dis-
tribucin del ejemplo 12.
Ejemplo 13
Construye en tu cuaderno el diagrama de ba-
rras y el polgono de frecuencias de la distribucin
siguiente:
Valor 1 2 3 4 5
Frecuencia 2 5 9 0 7
La distribucin siguiente corresponde al n-
mero de hermanos que tiene cada alumno de una
clase. Construye en tu cuaderno el diagrama de
barras y el polgono de frecuencias asociados.
Hermanos 0 1 2 3 4
Frecuencia 6 9 7 4 1
Ejercicios
20 21
Valor 1 2 3 4 5 6
0
1
2
3
4
5
6
7
8
9
10
11
Frecuencia
1 2 3 4 5 6
0
1
2
3
4
5
6
7
8
9
10
11
Frecuencia
Valor
211
A un valor x
i
de frecuencia
relativa h
i
le corresponde un
sector circular con ngulo
central de
i
= 360 h
i
grados
sexagesimales.
Ten en cuenta
DIAGRAMA DE SECTORES C
El diagrama de sectores se emplea habitualmente con variables asocia-
das a caracteres cualitativos, aunque tambin es posible su uso con caracte-
res cuantitativos. En este grfco, se descompone un crculo en tantos sectores
circulares como valores tome la variable. El ngulo central de cada sector
es proporcional a la frecuencia del valor correspondiente. En este tipo de
grfcos se suele indicar el porcentaje asociado a cada sector.
Los 500 empleados de una ofcina acuden al trabajo en distintos medios de transporte.
Transporte hi pi Grados
i
= 360 h
i
Coche 200 0,40 40 % 144
Metro 150 0,30 30 % 108
Autobs 30 0,06 6 % 21,6
Bicicleta 20 0,04 4 % 14,4
A pie 100 0,20 20 % 72
Total 500 1 100 % 360
Ejemplo 14
Coche
Metro
Autobs
Bicicleta
A pie
40 %
30 %
6 %
4 %
20 %
HISTOGRAMA D
El histograma se emplea con variables cuantitativas de datos agrupados en
intervalos. Asumiendo que stos son de igual longitud, sobre cada uno se
levanta un rectngulo cuya altura es la frecuencia del intervalo correspon-
diente.
Pedro ha hecho un recuento del nmero de personas que viven en cada una de las calles de
un barrio de su pueblo. Los resultados aparecen agrupados en la tabla, y el histograma es:
Ejemplo 15
Personas f
i
[50, 55) 3
[55, 60) 2
[60, 65) 5
[65, 70) 4
Total 14
50 55 60 65 70
0
1
2
3
4
5
6
Frecuencia
Nmero de personas por calle
Construye el histograma asociado a la
distribucin siguiente:
5, 8, 13, 23, 4, 16, 7, 24, 21, 1, 0, 4, 15, 11, 9, 2,
4, 11, 22, 21, 7, 6, 2, 1, 0, 4, 9, 14, 12, 22, 25, 0
Dibuja un diagrama de sectores que represen-
te las preferencias literarias de 100 lectores:
Gnero Policiaco Aventuras Terror
Frecuencia 50 20 30
22 23
Ejercicios
212
EJERCICIOS RESUELTOS 11
Un jardinero revisa los rosales de su invernadero y anota las alturas
de los mismos, representando los datos obtenidos en este histograma.
Halla la media, la desviacin tpica, la mediana y la moda de la distribu-
cin de alturas.
1
Altura x
i
f
i
f
i
x
i
f
i
x
i
2
F
i
[20, 40) 30 10 300 9 000 10
[40, 60) 50 8 400 20 000 18
[60, 80) 70 12 840 58 800 30
[80, 100) 90 5 450 40 500 35
[100, 120) 110 7 770 84 700 42
Total N = 42 2 760 213 000
La clase modal es [60, 80), con frecuencia f
i
= 12. Por tanto, la moda, que es la
marca de clase de [60, 80), es M
0
= 70 cm.
Respecto a la mediana, observa que la mitad de la poblacin es
N
2
= 21. La
primera clase que supera
N
2
= 21 es tambin [60, 80), por lo que Me = 70 cm.
Por ltimo, la media es

x
n
i = 1
f
i
x
i
N
=
2 760
42
= 65,71 cm, y la varianza es:
2

n
i = 1
f
i
x
i
2
N

x
2
=
213 000
42

2 760
42
2
753,623 cm
2
, por lo que se tiene que
la desviacin tpica es:
=
2
753,623 27,452 cm.
20 40 60 80 100 120
0
Frecuencia absoluta
Altura de los rosales en cm
1
2
3
4
5
6
7
8
9
10
11
12
2 7 8 10 9
17 13 5 14 16
12 20 14 9 10
19 4 6 16 15
18 12 17 22 0
22 0 24 13 7
Venta de lavadoras
Los datos del margen corresponden a la venta de lavadoras de un
establecimiento cada da del ltimo mes.
a) Calcula el nmero medio de lavadoras vendidas en este periodo.
b) Halla la moda.
c) Halla la mediana, as como el primer y el tercer cuartiles.
2
Para calcular los parmetros estadsticos pedidos, es necesario elaborar la
tabla de frecuencias ampliada con las columnas adecuadas.
213
Lavadoras
vendidas por da
x
i
f
i
f
i
x
i
F
i
[0, 5) 2,5 4 10 4
[5, 10) 7,5 7 52,5 11
[10, 15) 12,5 8 100 19
[15, 20) 17,5 7 122,5 26
[20, 25) 22,5 4 90 30
Total 375
a) Puesto que los datos varan entre 0 y 24, para elaborar la tabla de frecuencias
parece razonable distribuirlos en las clases [0, 5), [5, 10), [10, 15), [15, 20) y
[20, 25). A la vista de la tabla de frecuencias, la venta media de lavadoras es:

x =
n
i = 1
f
i
x
i
N
=
375
30
= 12,5
b) La clase modal es [10, 15), con frecuencia 8. Por tanto, la moda es
M
0
= 12,5.
c) El nmero de datos es 30, y su mitad es 15. La clase mediana es [10, 15), ya
que su frecuencia absoluta acumulada excede por primera vez la mitad
de los datos. Tomamos como aproximacin de la mediana la marca de
esta clase, Me = 12,5.
La cuarta parte de los datos es 7,5. La clase que contiene el primer cuartil
es [5, 10), ya que su frecuencia absoluta acumulada excede por vez primera
la cuarta parte de los datos. Luego el primer cuartil es la marca de [5, 10),
es decir, Q
1
= 7,5. Anlogamente se halla Q
3
= 17,5.
A una proyeccin cinematogrfca asisten 50 nios, 75 jvenes,
60 adultos y 40 ancianos. Representa estos datos en un diagrama de
sectores.
Primero se elabora la tabla de frecuencias, incluyendo los grados:
Categora p
i
Grados
Nios 50 22 % 79,2
Jvenes 75 33 % 118,8
Adultos 60 27 % 97,2
Ancianos 40 18 % 64,8
Total 225 100 % 360
Ancianos
18 %
Nios
22 %
Adultos
27 % Jvenes
33 %
Para calcular los grados se puede emplear una regla de tres.
100 % 360
22 %
As, al 22 % se le asocia el ngulo =
7 920
100
= 79,2, y procedemos de igual
modo con el resto
3

214
EJERCICIOS PROPUESTOS 11
Nociones de Estadstica
A los empleados de una ofcina se les pregunta
por los aspectos siguientes:
Estado civil.
Nmero de libros que leen al mes.
Preferencias cinematogrfcas.
Color de pelo.
Aos de antigedad en la empresa.
Distancia entre la ofcina y su vivienda.
a) Indica si los caracteres anteriores son cualitativos o
cuantitativos.
b) Seala modalidades posibles de los caracteres cua-
litativos.
c) Seala posibles valores de la variable estadstica en
el caso de los caracteres cuantitativos.
Determina, para cada uno de los estudios esta-
dsticos siguientes, el individuo, la poblacin, la variable
estadstica, y si sta es continua o discreta:
a) Cuntos alumnos aprueban matemticas en tu clase?
b) Cuntos libros lee cada uno de los habitantes del
barrio en que vives?
c) Cul es el gasto mensual en comestibles de cada
uno de los vecinos de un bloque de pisos?
Disea un estudio estadstico relativo al uso de
medios de transporte. Describe una variable estadstica
relacionada con este estudio y la poblacin estudiada.
Inventa una variable estadstica discreta y una
variable estadstica continua, sealando los posibles va-
lores que pueden tomar.
Seala un carcter que pueda adoptar una for-
ma cualitativa y cuantitativa.
Tablas estadsticas
Construye la tabla de frecuencias para la si-
guiente distribucin de datos:
0 0 0 1 1 2 3 2 1 4 0
El nmero de hijos de los empleados de una
ofcina es el siguiente:
0 2 1 1 2 3 2 1 4 0
2 0 3 1 4 2 1 1 2 1
Elabora la tabla de frecuencias de esta distribucin de
datos.
Las calificaciones de matemticas de los 20
alumnos de una clase son:
0 2 4 5 5
1 7 5 2 8
7 5 1 1 3
8 4 4 3 0
Construye en tu cuaderno la tabla de frecuencias de esta
distribucin de datos.
La tabla siguiente corresponde al nmero de
cigarrillos que un grupo de fumadores (que intentan
dejar de fumar) consume al da:
N. de cigarrillos x
i
f
i
h
i
p
i
2 1
3 5 0,2
4 24 %
5
6 16 %
7 2
8 o ms 4 0,16
Total N = 25
Copia en tu cuaderno completando esta tabla y respon-
de a las cuestiones:
a) Cuntos fuman ms de 5 cigarrillos?
b) Qu porcentaje de fumadores fuma menos de 6 ci-
garrillos?
1
2
3
4
5
6
7
8
9
215
Copia en tu cuaderno y calcula las marcas de
clase asociadas a esta tabla:
Clase Marca de clase
[0, 5)
[5, 13)
[13, 19)
[19, 30)
Al fnal de una semana, una zapatera hace ba-
lance de sus ventas. La tabla siguiente refeja las ventas
segn el precio:
Clase Marca de clase
[40, 50) 60
[50, 60) 40
[60, 70) 65
[70, 80) 82
[80, 90) 120
[90, 100) 95
[100, 500) 54
Elabora la tabla de frecuencias, sin olvidar las marcas
de clase.
En el estudio de una variable continua X se ha
obtenido la siguiente tabla de frecuencias que, por des-
gracia, est incompleta. Seras capaz de completarla en
tu cuaderno?
En el reconocimiento mdico al que se somete
a los profesores de un pequeo colegio, se han medido
sus alturas. stos son los resultados obtenidos (en cen-
tmetros):
150 152 153 170 172 168
174 171 172 167 163 155
169 175 178 180 174 181
Agrupa los datos en intervalos y construye la tabla de
frecuencias, que debe incluir marcas de clase, frecuen-
cias absolutas y relativas, y porcentajes.
Clases Marca x
i
f
i
h
i
p
i
[0, 10) 0,20
[10, ) 12,5 30 %
[15, 20)
Total N = 50
Clases Marca x
i
f
i
h
i
p
i
[0, 10) 0,20
[10, ) 12,5 30 %
[15, 20)
Total N = 50
El empleado de un videoclub selecciona una
muestra de sus clientes y anota el nmero de pelculas
que cada uno de ellos ha sacado durante el ltimo tri-
mestre. Los datos que ha obtenido son:
12 14 11 20 24 19
16 21 17 25 29 28
23 24 29 21 20 13
15 15 24 23 26 24
Agrupa los datos de cinco en cinco y construye la tabla
de frecuencias.
Parmetros estadsticos
Calcula la media y la desviacin tpica de las
siguientes distribuciones:
a) 7, 3, 4, 5, 6, 9, 0, 3, 4, 2, 1
b) 2, 1, 8, 6, 5, 3, 3, 2, 10, 3, 7
Decide cul de las dos distribuciones tiene un mayor
grado de dispersin.
Calcula la mediana, los cuartiles y la moda de
las distribuciones del ejercicio anterior.
Calcula la media, la desviacin tpica, el coef-
ciente de variacin y los cuartiles de las distribuciones
de los ejercicios 6, 7 y 8.
Escribe en tu cuaderno una distribucin cuya
media sea 5.
Escribe en tu cuaderno una distribucin de me-
diana 4.
Escribe en tu cuaderno una distribucin de me-
dia 0 y me diana 3.
Calcula los parmetros estadsticos de la si-
guiente distribucin:
x
i
1 2 3 4 5 6 7
f
i
10 5 6 9 4 7 2
10
11
12
13
14
15
16
17
18
19
20
21
216
EJERCICIOS PROPUESTOS 11
Calcula la media, la desviacin tpica, el coef-
ciente de variacin, la mediana, los cuartiles y la moda
de las distribuciones de los ejercicios 13 y 14.
El nmero de faltas de ortografa cometidas por
un grupo de alumnos en una redaccin aparece refeja-
do en la tabla:
N. de faltas 0 1 2 3 4 5
N. de alumnos 3 7 8 7 9 6

a) Halla la media, la desviacin tpica y el coefciente de
variacin.
b) Halla la mediana y la moda.
c) Halla los cuartiles.
Dada la distribucin 2, 4, 5, 8, 2, 1, 0, calcula su
media. A continuacin, suma un valor constante a todos
los datos de la distribucin anterior y calcula la media de
estos nuevos datos. Qu observas?
Sea

x la media de una distribucin de datos.


Prueba que si a cada uno de los datos de esta distribu-
cin le sumamos una constante k, la media de la nueva
distribucin es

x + k.
Halla los cuartiles y los percentiles p
10
y p
30
para
la distribucin del ejercicio 11.
Copia en tu cuaderno y completa la tabla sa-
biendo que

x = 1,75.
x
i
0 1 2 3 4
f
i
2 3 1 2
Calcula la media, la mediana y la moda de la
distribucin del ejercicio 11.
Halla la media, la desviacin tpica, la mediana
y la moda de la siguiente distribucin:
Intervalos [0 ,2) [2, 4) [4, 6)
Frecuencia 10 5 6
22
23
24
25
26
27
28
29
El tiempo, en minutos, que un grupo de socios
de una biblioteca dedica cada da a leer es:
30 45 11 90 123 67
52 56 60 69 29 89
23 145 96 100 126 34
a) Agrupa y construye la tabla de frecuencias.
b) Halla la media, la desviacin tpica y el coefciente de
variacin.
c) Halla la mediana y la moda.
d) Halla el primer y tercer cuartiles.
e) Cul es el percentil de una persona que dedica
60 minutos a leer?
f) Calcula un percentil que no coincida con ninguno de
los cuartiles.
J
u
l
i
o
V
e
r
n
e
El peso medio de los corredores de fondo de
un club de atletismo es 55 kg, y su desviacin tpica es
2,5 kg. Por otra parte, el peso medio de las corredoras
es 49 kg y la desviacin tpica es 2,1 kg. Compara la dis-
persin de los pesos de ambos grupos.
30
31
217
Grfcos estadsticos
En una poblacin de 30 familias se ha estudiado
el nmero de mviles de cada una de ellas. Los datos
recopilados son los siguientes:
2 3 0 4 1
5 1 2 2 3
3 4 6 3 2
3 2 1 2 5
2 2 0 1 3
6 2 1 2 6
a) Construye en tu cuaderno la tabla de frecuencias de
esta distribucin.
b) Traza el diagrama de barras.
c) Elabora el polgono de frecuencias.
d) Calcula la media y la desviacin tpica.
e) Halla la mediana y la moda.
f) Calcula los cuartiles Q
1
y Q
3
.
Hemos preguntado a un grupo de personas
cunto tiempo dedican semanalmente a la prctica de
algn tipo de ejercicio fsico. stos son los resultados
obtenidos:
N. de horas N. de personas
[0, 1) 6
[1, 2) 13
[2, 3) 20
[3, 4) 18
[4, 5) 120
[5, 8) 9
a) Construye en tu cuaderno la tabla de frecuencias
correspondiente.
b) Dibuja el histograma asociado.
c) Halla la media y la desviacin tpica.
d) Halla la mediana y la moda.
e) Qu porcentaje dedica menos de dos horas al ejer-
cicio fsico?
Construye en tu cuaderno el histograma aso-
ciado a los datos de los ejercicios 29 y 30.
33
34
35 Una clnica mdica que ofrece consultas de
distintas especialidades, anota el nmero de perso -
nas que acude a cada una de ellas una maana concre-
ta.
Especialidad N. de personas
Medicina general 30
Neumologa 15
Neurologa 14
Ginecologa 18
Medicina interna 7
Radiologa 20
a) Confecciona un diagrama de sectores para esta dis-
tribucin.
b) Qu tanto por ciento de personas acuden a Medici-
na general o a Radiologa?
Representa en tu cuaderno las distribuciones
de los ejercicios 13 y 14.
Analiza el histograma siguiente:
10 20 30 40 50 60
0
2
4
6
8
10
12
14
16
18
20
Frecuencia
a) Elabora la tabla de frecuencias asociada a este histo-
grama.
b) Calcula la media y la desviacin tpica. Cul es el
coefciente de variacin?
c) Halla los cuartiles Q
1
y Q
3
.
37
36
32
218
PARA REPASAR
EN GRUPO 11
Elabora con tu grupo de trabajo un esquema con los siguientes conceptos
de la Unidad y pon un ejemplo de cada uno de ellos.
CONCEPTO DEFINICIN
Poblacin Conjunto de individuos sometidos a estudio.
Muestra Es una parte de la poblacin.
Carcter estadstico Rasgo de una poblacin que nos interesa estudiar.
Variable estadstica
Conjunto de valores que toma un carcter. Se dividen en
cuantitativas y cualitativas.
Frecuencia absoluta Nmero de veces que se repite un valor determinado.
Marca de clase Valor central de cada intervalo de valores.
Media aritmtica

x =
n
i = 1
f
i
x
i
N
Varianza
Var =
2
=
n
i = 1
f
i
(x
i

x )
2
N
=
n
i = 1
f
i
x
i
2
N

x
2

Desviacin tpica
= Var 0
Coeciente
de variacin
Es el cociente CV =

x
.
Moda
Si la variable es discreta, es el valor con mayor frecuencia. Si
la variable es continua, es la marca de clase del intervalo de
mayor frecuencia.
Mediana
La mediana es el valor que divide los datos de una
distribucin en dos partes iguales.
Grcos
estadsticos
Son formas sencillas de representar las frecuencias de
una variable estadstica. Algunos tipos de grcos son
los diagramas de barras, los polgonos de frecuencias, los
diagramas de sectores y los histogramas.
En la pestaa Actividades/
Unidad 11, encontrars la
actividad Relacin 1 unidad 11,
para repasar los conceptos ms
importantes de la unidad.
En la pestaa Mapa del CD/
Unidad 11, encontrars el Test
de autoevaluacin.
En la pestaa Mapa del
CD/Juegos matemticos,
encontrars la Animacin de
Estadstica.
CD
CD
CD
219
CURIOSIDADES,
JUEGOS Y DESAFOS
El desconocimiento de la teora estadstica conduce, en muchas ocasiones,
a que amplios sectores de la poblacin den por buenas conclusiones que,
aunque a simple vista parecen correctas, son errneas.
Un buen ejemplo lo encontramos en un fenmeno denominado la paradoja
de Simpson, tambin conocido como efecto Yule-Simpson. Este fenmeno apa-
rece con frecuencia en estudios estadsticos de la Medicina, la Sociologa, etc.
Un caso real, y muy conocido, que ilustra la paradoja de Simpson tuvo lugar
cuando una prestigiosa universidad estadounidense fue demandada por
discriminacin contra las mujeres que solicitaban ingreso. Las cifras sobre
admisin en el otoo de 1973 mostraban que el porcentaje de admisin era
favorable a los hombres y, siendo la diferencia notable, se juzg que no se
deba al azar.
DESAFO MATEMTICO
Trata de encontrar una situacin real que ponga de manifesto la paradoja de
Simpson. Si lo necesitas, pide ayuda a tu profesor.
Hombres Mujeres
Departamentos Solicitantes % admitidos Solicitantes % admitidos
A 825 62 % 108 82 %
B 560 63 % 25 68 %
C 325 37 % 593 34 %
D 417 33 % 375 35 %
E 191 28 % 393 24 %
F 272 6 % 341 7 %
Sin embargo, al examinar las solicitudes distinguiendo los distintos depar-
tamentos, se observaba que ninguno discriminaba signifcativamente a las
mujeres y que, de hecho, la mayor parte de los departamentos favoreca,
en todo caso, a las mujeres.
N. de solicitantes % admitidos
Hombres 8 442 44 %
Mujeres 4 321 35 %
La explicacin resulta ser que las mujeres tendan a presentar solicitudes
en departamentos con bajos porcentajes de admisin, mientras que la ten-
dencia de los hombres era la contraria.
Al dividir los datos en especialidades, hemos introducido unas variables
(lurking variables, en la literatura cientfca) que, si son omitidas, pueden
conducirnos a una conclusin errnea.
La paradoja de Simpson pone de manifesto que debemos ser precavidos
cuando hagamos deducciones basndonos en la asociacin de dos varia-
bles. Es imprescindible tener en cuenta las lurking variables si se pretende
establecer relaciones de causa y efecto.
Edward H. Simpson, Karl
Pearson, Udny Yule, adems
de otros, describieron este
fenmeno.
Sabas que...

Вам также может понравиться