Вы находитесь на странице: 1из 24

TECSUP - PFR

Estadstica y Probabilidades

UNIDAD II

MEDIDAS RESUMEN
En esta etapa nos ocuparemos del clculo y estudio de los estadgrafos.

Tabla N 1

Estadgrafos.- Son nmeros que describen alguna caracterstica de la muestra y se


obtienen a partir de los datos muestrales o experimentales. Existen bsicamente dos
tipos de estadgrafos:
a)

Estadgrafos de Posicin: Localizan el centro de la distribucin de frecuencias.


Se denominan tambin medidas de tendencia central o de localizacin. Ejemplos:
media, mediana, moda, cuartiles, deciles, etc.

b)

Estadgrafos de Dispersin: Nos indican como estn dispersos los datos con
respecto a algn estadgrafo de posicin. Miden el grado de variabilidad de los
datos alrededor de alguna medida de tendencia central, por esta razn, se les
denomina tambin estadgrafos de variabilidad. Ejemplos: rango, la desviacin
media, varianza, desviacin tpica, coeficiente de variacin, rango intercuartlico,
etc.

1.

MEDIA ( x )
Llamada tambin media aritmtica o promedio aritmtico es un estadgrafo que
localiza el centro de la distribucin en base a su centro de gravedad y se
obtiene a partir de las siguientes frmulas.

27

Estadstica y probabilidades

TECSUP - PFR

Para datos no clasificados:


Sean x1 , x2 ,..., xn las variables matemticas que representan los

datos

muestrales, entonces:

x
i 1

Para datos clasificados:


k

xn

i i

i 1

x xi hi

i 1

Donde:

k : nmero de clases

x1 , x2 ,..., xk : marcas de clase

n: nmero total de datos n1 , n2 ,..., nk : frecuencias absolutas

h1 , h2 ,..., hk : frecuencias relativas.

Media Ponderada:
k

x P
i 1
k

i i

P
i 1

Siendo

pesos

P1 , P2 ,..., Pk

asociados

las

variables

x1 , x2 ,..., xk

respectivamente.

Media global:
Si una muestra de tamao n se particiona en k submuestras y x1 , x 2 ,..., x k
son

las

medias

de

las

submuestras

de

tamaos

n1 , n 2 ,..., n k

respectivamente.
k

Entonces:
particionada.

i 1

ni xi
n

se denomina la media global de la muestra

Ejemplos:

28

TECSUP - PFR

Estadstica y Probabilidades

Media de datos no clasificados:

x1 9 ,

x2 5 ,

x3 3 ,

x4 10 ,

x5 8

5
xi
x x2 x3 x 4 x5 9 5 3 10 8
x i 1 1

7
5
5
5

Media de datos clasificados:


Halle la velocidad media de los 30 carros que pasaron por un punto de
control de velocidad, del problema 2.
Use las frmulas que incluyen frecuencias absolutas y relativas.
Tabla N 2

Intervalos
de clase
[10, 26

ni

[26, 42

12

[42, 58

[58, 74

[74, 90

[90, 106

Total

30

xini
1356
i
x 1

45, 2
n
30

x xihi 45,15
i 1

Media ponderada:
Tabla N 3

Notas

Pesos

xi

Pi

xi Pi

05
13

1
3

5
39

44

Ex. Parcial
Ex. Final

k
xiPi
44
x i 1

11
k
4
Pi
i 1

29

Estadstica y probabilidades

TECSUP - PFR

Media Global:
Si una muestra de tamao 60 se divide en 5 sub-muestras de tamaos 8, 18,
12, 9, 13 con medias 15, 14, 12, 8,11 respectivamente. Entonces, la media
global ser:
xini
8 * 15 18 * 14 12 * 12 9 * 8 13 * 11 731
i
x 1

12,18
n
60
60

2.

MEDIANA

(Xm)

La mediana es un valor que divide a un conjunto de observaciones ordenadas en


forma ascendente o descendente en dos grupos de igual nmero de
observaciones.

Para datos no clasificados:


Sean x1 , x 2 ,..., x n los datos muestrales tales que x1 x 2 ... x n . Entonces:

Xm

x n 1

; si n es impar

1
( xn xn 2 )
2 2
2

; si n es par

En palabras: una vez ordenados los datos en orden creciente (o decreciente)


de sus magnitudes:
Si n es impar, la mediana es el valor del dato que equidista de los extremos.
Si n es par, la mediana es el promedio aritmtico de dos datos consecutivos
equidistantes de los extremos.
Ejemplos:
Hallar la mediana de los siguientes conjuntos de datos:
{ 10, 9, 3, 6, 14 }
Previamente ordenamos los datos:
x1 3

x2 6

x3 9

x 4 10

x5 14

como n es impar ( n = 5 )

X m x 5 1 x3 9
2

30

TECSUP - PFR

Estadstica y Probabilidades

{ 5, 10, 29, 43, 21, 17 }


Previamente ordenados los datos:
x1 5

x 2 10

x3 17

x 4 21 x5 29

x 6 43

como n es par ( n = 6 ) Xm 19

Para datos clasificados:


Est dada por la frmula:

N m 1

X m Lm Wm 2
nm

donde:

Lm

: Lmite inferior de la clase mediana (*)

: Nmero total de datos

N m 1 : Frecuencia absoluta acumulada hasta la clase inmediata


m 1

anterior a la clase mediana

N m 1 ni
i 1

nm

: Frecuencia absoluta de la clase mediana.

Wm

: Ancho de clase de la clase mediana:

Wm Lm 1 Lm

2.1 CLASE MEDIANA


Es el intervalo de clase que contiene el dato que ocupa la posicin media o
central. Se identifica observando las frecuencias acumuladas absolutas o
relativas y es aquella que hasta ese nivel acumul la mitad del nmero

n
total de datos ( 2 0,5) o super por primera vez a la mitad.
Clase mediana=

[ Lm , Lm 1 ;

X m [ Lm , Lm 1

Ejemplo:

31

Estadstica y probabilidades

TECSUP - PFR

Tabla N 4

Velocidades en
Km/h
[10, 26
[26, 42
[42, 58
[58, 74
[74, 90
[90, 106
Total

ni

Ni

Hi

4
12
7
4
2
1
30

4
16
23
27
29
30

0,133
0,533
0,766
0,899
0,966
1

n 30

15
2
2

La frecuencia absoluta acumulada correspondiente a la segunda clase (N2


= 16), supera por primera vez a 15; o la frecuencia relativa acumulada a la
segunda clase (H2 = 0,533), supera por primera vez a 0,5.
Luego la clase mediana es [26;42>.

Lm 26

n = 12

Wm 16
nm 12
N m 1 4
30

2 4
Xm 26 16
40, 67
12

Ni
30
25
20
15
10
5

10

26

32

42

58

74

90

106

Ii

TECSUP - PFR

Estadstica y Probabilidades

2.2 MEDIANA COMO UNA MEDIDA DE TENDENCIA CENTRAL MS


REPRESENTATIVA
La media es un estadgrafo bastante sensible a los valores extremos y
como medida del centro de gravedad de la distribucin tiende a inclinarse
a los datos de mayor valor. Si existen valores extremos que difieren
considerablemente del resto no localiza como se debe el centro de la
distribucin. En tanto que la mediana por no ser sensible a los valores
extremos y localizar el centro de la distribucin en base a la posicin
central que ocupa resulta siendo mejor que la media o ms representativa
en el sentido que localiza mejor el centro de la distribucin; pero, en
general, la media es ms representativa que la mediana, como estadgrafo
de localizacin:
Ejemplo:
Un empleador dice que el promedio mensual de salario pagado a los
ingenieros de su firma es de 3 500, esto sugiere que esta firma paga bien.
Sin embargo, un examen posterior indica que se trata de una pequea
compaa que emplea 5 jvenes ingenieros con 1 000 soles de haber
mensuales c/u y la renta del ingeniero Jefe es de 16 000 soles mensuales.
Ud. puede seguir afirmando que la firma paga bien?. No.
Halle la mediana y compare, cul de los estadgrafos es ms
representativo?

X 3500;
x1 1000,

x2 1000,

x3 1000,

x 4 1000,

x5 1000,

x 6 16 000

X m = 1000
En este caso, la mediana es la ms representativa en el sentido que localiza
mejor que la media el centro de los datos bajo consideracin.
Existe un valor extremo bastante discrepante o exagerado ( x6 16 000).
2.3 USOS DE LA MEDIA ARITMTICA

La media de la muestra se usa cuando se necesita una medida de


tendencia central que no vare mucho entre una y otra muestra
extrada de la misma poblacin, esta es la razn para preferirla
cuando se desea la mxima confiabilidad en la estimacin de la
media poblacional.

Tambin se usa la media cuando la distribucin de frecuencias de los


datos es simtrica o tiene poca asimetra.

Se calcula la media cuando en un estudio tambin se debe calcular la


varianza o la desviacin estndar.
33

Estadstica y probabilidades

TECSUP - PFR

2.4 USOS DE LA MEDIANA

3.

Se prefiere a la mediana como medida de concentracin, cuando en


los datos existen valores extremos muy grandes o muy pequeos, o
sea, valores muy altos o muy bajos que obligan a la media aritmtica a
desplazarse a la derecha o izquierda del punto medio de la
distribucin. En cambio la Mediana siempre seala al punto que divide
a los datos en dos partes iguales: 50% a un lado y 50% al otro, sin
importar donde se halle ese punto.

Cuando simplemente necesitamos conocer si los datos que nos


interesan estn dentro de la mitad superior o inferior de la distribucin
de los datos y no tiene importancia saber particularmente su
alejamiento con respecto al centro de la distribucin.

MODA ( M o )
La moda es un valor de la variable que tiene la ms alta frecuencia, esto es, es el
valor ms frecuente de la distribucin.
Si la distribucin de frecuencias tiene un solo mximo (mximo absoluto), se dice
que la distribucin es unimodal; en cambio si tiene ms de un mximo (mximos
relativos), se dice que la distribucin es multimodal.
Si todas las frecuencias son iguales se dice que la distribucin no tiene moda y se
trata de una distribucin uniforme.
a)

Para datos no clasificados

Determinar la moda del siguiente conjunto de datos:


2, 2, 3, 4, 5, 5, 6, 7, 7, 7, 9, 9, 12.
La moda es el nmero 7 porque es el dato ms repetido (3 veces).
Esta distribucin se llama unimodal porque slo posee una moda.

El siguiente conjunto de datos no tiene moda.


15, 19, 20, 35, 47, 58, 63.
Porque ninguno de ellos est repetido

La siguiente distribucin es bimodal es decir, tiene dos modas:


8, 9, 9, 13, 13, 13, 18, 20, 24,24,24, 33, 59, 78, 78.
Mo = 13 y tambin Mo = 24

34

TECSUP - PFR

Estadstica y Probabilidades

La siguiente distribucin es trimodal:


4, 8, 8, 8, 8, 15, 15, 15, 20, 20, 21, 21, 21, 21,32, 40, 40,40, 40, 80, 80,
90.
Mo = 8, Mo = 21, Mo = 40 Tiene tres modas.

b) Para datos clasificados

1
M o Li Wi
1 2

I i [ Li , Li 1 : clase modal, es aquella que tiene la frecuencia mxima


Li : lmite inferior de la clase modal.
Wi : ancho de la clase modal
1 ni ni 1 : exceso de la frecuencia modal sobre la frecuencia de la clase
contigua inferior.
2 ni ni 1 : exceso de la frecuencia modal sobre la frecuencia de la clase
contigua superior.
Ejemplo:
Determinar la moda de la siguiente distribucin de frecuencias:
Tabla N 5

Ii

ni

[12,5

20,5

[20,5

28,5

[28,5 36,5

22

[36,5 44,5

26

[44,5 52,5

20

[52,5 60,5

12

[60,5 68,5

[68,5

76,5

TOTALES

La clase modal ser: I = [36,5; 44,5


Adems es una distribucin unimodal.

35

Estadstica y probabilidades

TECSUP - PFR

1 =

26 -22 = 4

2 =

26 -20 = 6

1
4
Mo 36,5 W
36,5 8
39,7

4 6
1
2
ni

Ii

4.

CUARTILES (QI)
Son medidas de posicin que dividen en cuatro partes iguales al conjunto de
valores ordenados en una distribucin de frecuencias. Estas medidas son: el
primer Cuartil Q1, el segundo Cuartil Q2 y el tercer Cuartil Q3
25%

Q1

Q2

25%

Q3
75%

Las frmulas para calcular los cuartiles se derivan de la frmula utilizada para
calcular la mediana y los pasos para el clculo son los mismos:
Para el primer cuartil: Para el tercer cuartil:

N i 1

Q1 Li Wi 4
ni

3n

N i 1

Q3 Li Wi 4
ni

Ejemplo
A partir de la siguiente tabla determinar el 25% inferior y el 25% superior.

36

TECSUP - PFR

Estadstica y Probabilidades

Tabla N 6

Altura en pulgadas

ni

Ni

Hi

[60, 63

0,05

[63, 66

18

23

0,23

[66, 69

42

65

0,65

[69, 72

27

92

0,92

[72, 75

100

TOTALES

Para determinar el 25% inferior debemos calcular el primer cuartil.


Para determinar el 25% superior debemos calcular el tercer cuartil
Clculo de Q1 :
n 100

25 . Luego tomamos la clase: I = [66; 69


4
4

Luego:
100

4 23
Q1 66 3
66,14
42

Clculo de Q3 :
3n 3x100

75 . Luego tomamos la clase: I = [69; 72


4
4

Luego:
3x100

4 65
Q3 69 3
70,11
27

5.

DECILES ( DI )
Son medidas de posicin que dividen en 10 puntos iguales al conjunto de los
valores ordenados de una distribucin de frecuencias. Estas medidas son: el
primer decil D1, el segundo decil D2 y as sucesivamente hasta el noveno decil D9.
El primer decil distribuye al lado izquierdo el 10% de los datos y al otro lado el
90%, es decir, ocupa la posicin n/10.
En igual forma para los dems deciles hasta el noveno decil 9n/10 que deja a la
izquierda el 90% de los datos y a la derecha el 10%.

37

Estadstica y probabilidades

TECSUP - PFR

30%

D1

D2

D3

D4

D5

10%

D6

D7

D8

D9

90%

Entre cada dos deciles consecutivos debe encontrarse comprendido el 10%


del nmero de datos.
La frmula para calcular deciles es:

rn

N i 1

Dr Li Wi 10

ni

Donde:
Dr = el decil buscado.
Li = lmite inferior del intervalo donde se halla el decil buscado
r = indica el decil. Por ejemplo si queremos el tercer decil r = 3.

rn
indica la situacin del decil, es decir, la clase donde est el decil
10
Los dems signos: n , Ni-1 , Wi , ni tienen los mismos significados que para
el caso de la mediana.
Ejemplo
Se presenta la distribucin de frecuencias de los puntajes obtenidos por 250
alumnos en una prueba de rendimiento de Fsica. Determinar qu puntajes
deben tener los que se hallen en el 20% inferior y cules puntajes los que
se encuentren en el dcimo superior.

38

TECSUP - PFR

Estadstica y Probabilidades

Tabla N 7

Intervalos

40; 45
45; 50
50; 55
55; 60
60; 65
65; 70
70; 75
75; 80
80; 85
85; 90
Totales

ni

Ni

10

14

18

32

25

57

46

103

53

156

37

193

29

222

18

240

10

250

250

Primero debemos determinar el segundo decil a fin de determinar el 20%


inferior.
Clculo de D2:
2n 2x250

50 ; Luego el segundo decil est en la clase: I = [55, 60


10
10
50 32
Por frmula:
D 55 5
58, 6
25

Para hallar los que se encuentran en el dcimo superior calculamos el


noveno decil.
Clculo de D9:
9n 9x250

225 ; Luego el noveno decil est en la clase: I = 80; 85


10
10
225 222
Por frmula:
D 80 5
80,83
18

CARACTERSTICAS DE DISPERSIN
Las dos siguientes series de datos:

39

Estadstica y probabilidades

TECSUP - PFR

Tienen la misma media aritmtica y la misma mediana (100). Sin embargo


difieren profundamente. Lo que las hace diferentes es lo que, en estadstica,
se llama dispersin; la segunda serie es mucho ms dispersa que la primera.
Es pues importante resumir una serie estadstica no slo por caractersticas
de tendencia central, sino por caractersticas de dispersin. Veremos de dos
tipos: las ligadas a la media: desviacin tpica; las ligadas a la mediana:
intervalo intercuartlico, intervalo interdeclico.
6.

MEDIDAS DE DISPERSIN

Varianza ( S x2 V( x ) )
Se define:

V( x )

n
2
( xi x)
i 1

2
n
Sx k
( xi x) 2 ni
i 1

, datos no clasifcados

, datos clasificados

Se interpreta como la media aritmtica de los cuadrados de las desviaciones


de las xi con respecto a x .
A menudo el clculo de la varianza es muy laborioso, sobre todo si la media
no es entera, para facilitar los clculos podemos usar una segunda forma:
k

V( x )

n x

2
i i

i 1

x ; datos clasificados

Desviacin Tpica

S x

S x V( x )
Una idea sencilla del significado de la desviacin tpica se obtiene cuando se
comparan dos series de la misma naturaleza: la que posee una desviacin
tpica ms alta es la ms dispersa.

Coeficiente de variacin (C.V.)

C.V .

Sx
x

40

TECSUP - PFR

Estadstica y Probabilidades

Generalmente se expresa en porcentajes. Es til para la comparacin en


trminos relativos del grado de concentracin en torno a la media de dos
distribuciones distintas.

Rango o extensin (e)


Indica la extensin del intervalo en donde se halla toda la poblacin
estudiada.
e = Lk L1 =l(A)
Por ejemplo de la Tabla N8, tenemos e = 90 - 40 = 50

Rango interdeclico = D9 D1
Rango intercuartlico = Q3 Q1
Por ejemplo, a partir de la tabla N8, tenemos:
Rango intercuartil = 74,26 60.97 = 13,99
Rango interdeclico = 80,83 53,06 = 27,77
7.

GRFICAS DE CAJA
Los histogramas transmiten impresiones un tanto generales sobre un conjunto
de datos, mientras que un resumen nico tal como la media o la desviacin
estndar se enfoca en slo un aspecto de los datos. En aos recientes, se ha
utilizado con xito un resumen grfico llamado grfica de caja para describir
varias de las caractersticas ms prominentes de un conjunto de datos. Estas
caractersticas incluyen 1) el centro, 2) la dispersin, 3) el grado y naturaleza de
cualquier alejamiento de la simetra y 4) la identificacin de las observaciones
extremas o apartadas inusualmente alejadas del cuerpo principal de los datos.
Como incluso un solo valor extremo puede afectar drsticamente los valores de x y s, una grfica de caja est basada en medidas resistentes a la presencia de
unos cuantos valores apartados, la mediana y una medida de variabilidad
llamada dispersin de los cuartos.
Se ordenan las observaciones de la ms pequea a la ms grande y se separa la
mitad ms pequea de la ms grande; se incluye la mediana Xm en ambas
mitades si n es impar. En tal caso el cuarto inferior es la mediana de la mitad
ms pequea y el cuarto superior es la mediana de la mitad ms grande. Una
medida de dispersin que es resistente a los valores apartados es la dispersin
de los cuartos fs o tambin conocido como rango intercuartilico, dada por:
fs = cuarto superior cuarto inferior

41

Estadstica y probabilidades

TECSUP - PFR

Ejemplo
Se utiliz ultrasonido para reunir los datos de corrosin adjuntos de la placa de
piso de un tanque elevado utilizado para almacenar petrleo crudo (Statistical
Analysis of UT Corro- sion Data from Floor Plates of a Crude Oil Aboveground
Storage Tank, Materials Eval; 1994: 846-849); cada observacin es la
profundidad de picadura ms grande en la placa, ex- presada en milsimas de
pulgada.
40 52 55 60 70 75 85 85 90 90 92 94 94 95 98 100 115 125 125
El resumen de cinco nmeros es como sigue:
xi ms pequea = 40
xi ms grande = 125
cuarto inferior = 72.5
cuarto superior = 96.5
Mediana = Xm = 90
La figura muestra la grfica de caja resultante. El lado derecho de la caja est
mucho ms cerca a la mediana que el izquierdo, lo que indica una asimetra
sustancial en la mitad derecha de los datos. El ancho de la caja (fs) tambin es
razonablemente grande con respecto al rango de datos (distancia entre las
puntas de los bigotes).

Figura 1. Grfica de caja de los datos de corrosin

8.

ASIMETRA
Es la deformacin horizontal de las curvas de frecuencias.
Cuando la curva est inclinada o alargada hacia la derecha se denomina
asimetra a la derecha o asimetra positiva (Fig.2). Observamos que la media
aritmtica queda hacia el lado ms largo (el derecho) y que x X m M o .
Cuando la curva est inclinada o alargada al lado izquierdo se denomina
asimetra a la izquierda o negativa (Fig.3). Notamos que la media aritmtica est
del lado ms largo (el izquierdo) y que x X m M o .

42

TECSUP - PFR

Estadstica y Probabilidades

En la Fig. 4 observamos que la curva est igualmente inclinada a los dos lados
por eso se llama curva simtrica. En este caso: x X m M o

Fig. 1

Fig. 2

Mo Md x

Fig. 3

x Md Mo

x
Md
Mo

Primer coeficiente de Asimetra de Pearson

AS1

Media Moda
desviacin estndar

AS1

x Mo
Sx

Notar que el valor del Primer coeficiente de Asimetra de Pearson nos indica el
tipo de asimetra que tendr la curva.
Ejemplo:
Considerando la tabla del Problema 1, calcular: la varianza, la desviacin tpica,
el coeficiente de variacin, el rango, el rango intercuartil, el rango interdeclico y
con ayuda del primer coeficiente de Pearson indicar que tipo de asimetra
presenta a la curva.
Tabla N 9

Ii

10; 26
26; 42
42; 58
58; 74
74; 90
90;106
Total

ni

xi

xi X 2 ni

xi.ni

ni xi2

18

2959,36

72

1296

12

34

1505,28

408

13872

50

161,28

350

17500

66

1730,56

264

17424

82

2708,48

164

13448

98

2787,84

98

9604

11852,8

1356

73144

30

43

Estadstica y probabilidades

V(x)

TECSUP - PFR

11852,8
395,09
30

Sx

V(x)

395,09 19,88

19,88
C.V.

0, 44
45, 2
X
e l(A) 105 10 95

30

4 4
Q1 26 16
30, 67
12

90

4 16
Q3 42 16
56,86
7

RIQ Q3 Q1 56,86 30,67 26,19

30

10 0
D1 10 16
22
4

270

10 23
D9 58 16
74
4

RID D9 D1 74 22 52

AS1

1356
45, 2
30

8
M0 26 16
35,85
8 5

Sx

AS1

73144
45, 22 395,09
30

X Mo
Sx
45, 2 35,85
0, 47
19,88

44

TECSUP - PFR

Estadstica y Probabilidades

Asimetra a la derecha o positiva.


9.

VALORES APARTADOS O ANMALOS


Grficas de caja que muestran valores apartados
Una grfica de caja puede ser embellecida para indicar explcitamente la
presencia de valores apartados. Muchos procedimientos inferenciales se basan
en la suposicin de que la distribucin de la poblacin es normal (un cierto tipo
de curva en forma de campana). Incluso
DEFINICIN
Cualquier observacin a ms de 1.5 fs del cuarto ms cercano es un valor
apartado (o atpico). Un valor apartado es extremo si se encuentra a ms de
3fs del cuarto ms cercano y moderado de lo contrario.
Un solo valor apartado extremo que aparezca en la muestra advierte al
investigador que tales procedimientos pueden ser no confiables y la presencia de
varios valores apartados transmite el mismo mensaje.
Modifquese ahora la construccin previa de una grfica de caja trazando un
bigote que sale de cada extremo de la caja hacia las observaciones ms
pequeas y ms grandes que no son valores apartados. Cada valor apartado
moderado est representado por un crculo cerrado y cada valor apartado
extremo por uno abierto. Algunos programas de computadora estadsticos no
distinguen entre valores apartados moderados y extremos.
Ejemplo
Los efectos de descargas parciales en la degradacin de materiales para
cavidades aislantes tienen implicaciones importantes en relacin con las
duraciones de componentes de alto voltaje. Considrese la siguiente muestra de
n = 25 anchos de pulso de descargas lentas en una cavidad cilndrica de
polietileno. (Estos datos son consistentes con un histograma de 250
observaciones en el artculo Assessment of Dielectric Degradation by Ultrawideband PD Detection, IEEE Trans. on Dielectrics and Elec. Insul., 1995: 744-760.)
El autor del artculo seala el impacto de una amplia variedad de herramientas
estadsticas en la interpretacin de datos de descarga.
5.3
94.3
101.4

8.2
13.8 74.1 85.3
94.8 94.9 95.5 95.8
103.7 106.0 113.5

88.0
95.9

90.2
96.6

91.5
96.7

92.4
98.1

Las cantidades pertinentes son:


x = 94.8

cuarto inferior = 90.2

cuarto superior = 96.7

fs = 6.5

1.5fs = 9.75

3fs = 19.50

45

92.9 93.6
99.0

Estadstica y probabilidades

TECSUP - PFR

Por lo tanto, cualquier observacin menor que 90.2 - 9.75 = 80.45 o mayor
que 96.7 + 9.75 = 106.45 es un valor apartado. Hay un valor apartado en el
extremo superior de la muestra y cuatro en el extremo inferior. Debido a que
90.2 - 19.5 = 70.7, las tres observaciones 5.3, 8.2 y 13.8 son valores
apartados extremos; los otros dos son moderados. Los bigotes se extienden
a 85.3 y 106.0, las observaciones ms extremas que no son valores
apartados. La grfica de caja resultante aparece en la figura. Existe una gran
cantidad de asimetra negativa en la mitad media de la muestra as como
tambin en toda la muestra.

Grfica 2. Grfica de caja de los datos de ancho de pulso que


muestra valores apartados

10. PROBLEMAS PROPUESTOS


1.

Los siguientes datos son los tiempos de ignicin de ciertos materiales


expuestos al fuego, dados a la ms cercana centsima de segundo:
2,58

5,50

6,75

2,65

7,60

6,25

3,78

4,90

5,21

2,51

6,20
3,87
1,52
1,38

5,92
6,90
4,56
2,46

5,84
4,72
8,80
7,40

7,86
9,45
4,71
6,25

8,79
7,41
5,92
9,65

4,79
2,45
5,33
8,64

3,90
3,24
3,10
6,43

3,75
5,15
6,77
5,62

3,49
3,81
9,20
1,20

4,04
2,50
6,43
1,58

a)
b)
c)
2.

Construya una distribucin de frecuencias utilizando un intervalo de


clase de 2 minutos.
Represente la distribucin de frecuencias por medio de un polgono de
frecuencias.
Calcule la mediana mediante un mtodo grfico.

Se le pide a un analista experimentado la evaluacin de dos mtodos


diferentes para la determinacin de trazas de plomo en cido actico glacial,
y se le entrega una muestra que contiene precisamente 1.282 ppm. de Pb,
por litro (dato des- conocido por el analista). Se realizaron cinco
determinaciones mediante cada mtodo, que dieron los siguientes resultados
para la concentracin del plomo, en partes por milln (ppm):

46

TECSUP - PFR

Estadstica y Probabilidades

Mtodo A:
Mtodo B:

1,34
1,30

1,33
1,26

1,32
1,30

1,34
1,33

1,31
1,24

Compare ambos mtodos.


3.

En un laboratorio se prepar una serie de compuestos que contienen las


siguientes masas de nitrgeno y oxgeno (en gramos):

Compuesto
A
B
C
D
E
F
G

a)
b)
c)
4.

N2
16,8
17,1
33,6
25,4
27,9
14,3
35,2

O2
19,2
39,0
57,3
28,2
26,1
45,8
53,5

Calcule e interprete la masa de nitrgeno promedio de los compuestos.


Calcule e interprete la mediana de la masa de oxgeno de los
compuestos.
Cul elemento de los compuestos presenta una menor variabilidad
relativa? Justifique la respuesta.

Si el salario promedio semanal de n obreros es de 150 soles y cada obrero


recibe un aumento general de 7,5 soles semanales y una bonificacin
semanal del 1,5% del salario incrementado.
Cul es el salario promedio actual semanal de los obreros?

5.

En una fbrica trabajan 20 mujeres y 45 hombres, el salario promedio


semanal de las mujeres es de 100 soles y el de los hombres 120 soles.
Cul es el promedio del salario semanal de todos los trabajadores de la
fbrica?

6.

Para los siguientes datos:


55.31

81.47

64.90

70.88

86.02

77.25

76.76

84.21

84.92

90.23

78.01

88.05

73.37

87.09

57.41

85.43

74.76

86.51

86.37

76.15

88.64

84.71

66.05

83.91

a)

Calcular la mediana antes de clasificar los datos.

47

56.02

Estadstica y probabilidades

b)
7.

TECSUP - PFR

Agrupar los datos en una tabla de frecuencias cuyas marcas de clase


sean: 60, 70, etc. y calcular la desviacin tpica y la mediana.

El salario medio semanal pagado a los trabajadores de una compaa es de


300 soles. Los salarios medios semanales pagados a hombres y mujeres de
la compaa son 315 y 240 soles respectivamente. Determinar el porcentaje
de hombres y mujeres que trabajan en la compaa.
Un estudio final realizado determin que existen 800 trabajadores, Cuntos
son hombres?

8.

Sea la siguiente distribucin de lados X en mm medidos en 10 piezas: 1,20


2,40 6,00 7,20 12,00 13,20 16,80 21,60 22,80 y 25,20 mm.
a)
b)

9.

Determinar la media x y la desviacin tpica Sx de la variable X.


Tras emplear el cambio de variable Y 5 X 54 / 6 determinar la media
y y la desviacin tpica Sy de la nueva variable Y.

Los siguientes datos son las temperaturas registradas en grados Farenheit:


415

510

460

475

420

490

480

450

435

485

470

465

500

455

435

Encontrar x y Sx a partir de los datos.


10. La siguiente tabla muestra la distribucin de salarios de 150 trabajadores de
TECSUP durante el mes de Abril del ao 2001.
Haberes

Nmero de
trabajadores
15

600 , 900
900 , 1400
1400 , 1700
1700 , 2100
2100 , 2400

24
29
38
24

2400 , 2600

20

Tabla N 8

Por incremento del costo de vida se plantean dos alternativas de aumento


para el mes siguiente. La primera propuesta consiste en un aumento general
de 350 soles mensuales.
La segunda propuesta consiste en un aumento del 30% de los salarios de
Abril a los trabajadores que ganan menos de 2100 soles y del 5% a los

48

TECSUP - PFR

Estadstica y Probabilidades

trabajadores que ganan ms de 2100 soles y un aumento adicional de 100


soles para todos los trabajadores.
a)

Cul de las propuestas convendra a los trabajadores?

b)

Para los trabajadores que ganan menos de 2100 soles Qu propuesta


les convendra?

11. El ingreso per cpita anual de un pas es de 9000 dlares. El sector obrero
1
que constituye el 60% de la poblacin percibe 5 del ingreso total. Calcular
el ingreso per cpita del sector no obrero.
12. La distribucin siguiente corresponde a las lecturas con un contador Geiger
del nmero de partculas emitidas por una sustancia radiactiva en 100
intervalos sucesivos de 40 segundos:
Nmero de partculas

Frecuencia

5-9
10-14
15-19
20-24
25-29
30-34
35-39
a)
b)
c)
d)
e)

1
10
37
36
13
2
1

Calcule la frecuencia absoluta acumulada a menos de y la frecuencia


relativa a ms de. Interprete el valor de la tercera clase de ambas
frecuencias acumuladas.
Represente grficamente la distribucin de frecuencias por medio de un
histograma.
Calcule e interprete: el promedio aritmtico, la moda y la mediana.
Calcule la desviacin estndar y el coeficiente de variacin.
Calcule e interprete el percentil 75%.

13. El artculo (A Thin-Film Oxygen Uptake Test for the Evaluation of


Automotive Crankcase Lubricants, Lubric. Engr.,1984: 75-83) report los
siguientes datos sobre tiempo de induccin de oxidacin (min) de varios
aceites comerciales:
87 103 130 160 180 195 132 145 211 105 145
153 152 138
87
99
93 119 129
a.
b.

Calcule la varianza muestral y la desviacin estndar.


Si las observaciones se volvieran a expresar en horas, cules seran
los valores resultantes de la varianza de la muestra y la desviacin
estndar muestral?

49

Estadstica y probabilidades

TECSUP - PFR

14. Se seleccion una muestra de 20 botellas de vidrio de un tipo particular y se


determin la resistencia a la presin inter- na de cada botella. Considere la
siguiente informacin parcial sobre la muestra:
mediana = 202.2

cuarto inferior = 196.0

cuarto superior = 216.8

Las tres observaciones ms pequeas 125.8 188.1 193.7


Las tres observaciones ms grandes
a.

221.3 230.5 250.2

Hay valores apartados en la muestra? Algunos valores apartados


extremos?
b. Construya una grfica de caja que muestre valores apartados y comente
sobre cualesquiera caractersticas interesantes.

50

Вам также может понравиться