You are on page 1of 34

Medidas de Resumen

Entre las medidas que permiten resumir informacin proveniente de una


poblacin o muestra, podemos considerar: medidas de posicin, de dispersin o
variabilidad, de forma y de asociacin

Medidas de posicin: Tendencia Central - Percentiles


Tendencia Central:

Moda - Promedio - Mediana

Son ndices de localizacin central, empleados en la descripcin de las


distribuciones de frecuencias. Las ms usadas son la moda, la mediana y el
promedio.
Moda (Mo) : Es el valor de la variable que ocurre ms frecuentemente
Ejemplo (variable cualitativa): En una empresa se ha medido la satisfaccin
laboral de una muestra de empleados.
Satisfaccin Laboral

N de empleados

Muy satisfechos

20

Satisfechos

25

Moderadamente satisfechos

22

Insatisfechos

18

Muy insatisfechos

10

En este caso la moda corresponde a la categora satisfechos. Mo = satisfechos


Si la variable se encuentra es cuantitativa, la moda ser la magnitud ms frecuente.
Ejemplo (variable cuantitativa) : En la medicin de responsabilidad en un grupo de
postulante a un cargo de ejecutivo, se han encontrado los siguientes puntajes : 81, 83,
83, 85, 86, 86, 87, 88, 90, 91, 92, 94, 95, 95, 95, 95, 96, 96, 97, 99, 101, 105, 107, 108,
109, 110, 115, 118, 120.
En este caso, la moda corresponde al puntaje 95.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 40

Y si los datos estn agrupados en intervalos de clase, la moda ser el punto medio del
intervalo ms frecuente. La moda para datos agrupados en intervalos en tablas de
frecuencia, no es un valor exacto porque vara con las diferentes maneras de agrupar
una distribucin.
Ejemplo: El sueldo mensual de un grupo de trabajadores textiles se distribuye como
indica la tabla a continuacin.

300.000 350.000

Marca de clase
xi
325.000

N de trabajadores
ni
13

350.000 400.000

375.000

18

400.000 450.000

425.000

24

450.000 500.000

475.000

20

500.000 550.000

525.000

15

Sueldo

En este caso la moda es 425.000 pesos, por ser el punto medio del intervalo ms
frecuente.
A menudo encontramos distribuciones bimodales (con dos modas).
Limitacin de la moda: no sabemos qu ocurre con el resto de la distribucin de
datos.

Promedio Aritmtico (o media Aritmtica)


La media aritmtica o promedio aritmtico:
En general se utiliza letras maysculas para denotar a las variables, y
letras minsculas para los valores que toma las variables (datos).
Sea X la variable cuantitativa de inters y sea x1, x2, , xn los n valores
que posee dicha variable. El promedio aritmtico se obtiene sumando los
valores de X y dividiendo luego por el nmero de datos.
n

x +x +x ...+x n
x= 1 2 3
=
n

Cecilia Larran R.

Estadstica Descriptiva

xi
i =1

total
n

Pgina 41

Ejemplo: Los siguientes valores indican el tiempo necesario en minutos para


llegar a su trabajo de un grupo (muestra) de 15 empleados de un ministerio
pblico.
25 30 50 60 35 65 48 90 75 50

22 45 25 35 50

X = Tiempo necesario en min. para llegar al trabajo


n = 15

Sumatoria = x i = 705

705
15

x=

i 1

= 47 min

Observacin: La media de la poblacin se define de la misma forma que


la media muestral pero se utiliza el smbolo para denotarla:
N

x
i 1

x1 +x 2 +x 3 ...+x N total

N
N

Si los datos se encuentran en una distribucin de frecuencias, es


k

necesario modificar la frmula: x

x n
i

i 1

donde xi

representa el

valor de la variable si es discreta o la marca de clase si los datos


estn tabulados en k intervalos.
Ejemplo: En un estudio de consumo de frutas, se entrevist a 250 personas, una
de las preguntas realizadas fue aproximadamente, cuantas frutas consumes
diariamente? La informacin obtenida a esa pregunta se muestra

continuacin:
Cantidad de frutas
Xi

n de personas
ni

0
1
2
3
4
5

22
50
90
49
26
13
n = 250

Total
Cecilia Larran R.

Estadstica Descriptiva

x i ni
0
50
180
147
104
65

n = 250
xini
i

x =
= 2,184 frutas

Pgina 42

Ejemplo: Datos agrupados en intervalos (datos secundarios)


Sueldo mensual (X) de un grupo de trabajadores textiles.
Sueldo
(miles de $)
300 350

Marca de clase
xi
325

N de trabajadores

350 400

375

18

400 450

425

24

450 500

475

20

500 550

525

15

7875

90

38550

ni
13

Total

xini
4225

X = Sueldo mensual
n
90

Total =

xini

38550

38550
= 428,33
90

$428.333

Propiedades de la media aritmtica o promedio aritmtico:


i. mnimo < x < mximo
ii.
El promedio de una constante es la constante. (demostracin tarea)
iii. Si a los valores de una variable se les suma una constante, el promedio aumenta en
esa misma magnitud. (demostracin tarea)
iv. Si los valores de una variable son multiplicados por una constante, el promedio se
amplificarn en la misma magnitud constante.

Y = a + bX Y = a + bX ; a, b ctes.
(Demostracin tarea)

Del ejemplo anterior: Si a los trabajadores de la empresa textil le aumentan el sueldo en:
Complete
(Caso 1)

(Caos 2)

(caso 3)

$50.000,0

15%

7% + un bono fijo de

Sueldo actual

$30.000

Y(1) = X + 50

Y(2) = 1,15X

Y(3) = 1,07X + 30

Y(1) = 428,333 + 50

Y(3) = 1,1*428,333

Y(3) =

x = 428,333

(m $)

1,07*428,333 + 50

Y = Sueldo aumentado

Cecilia Larran R.

Estadstica Descriptiva

Pgina 43

Mediana (Me)
Mediana: es un valor tal que, ordenados en magnitud los n datos de una
variable X, el 50% es menor o igual que ella, y el 50% es mayor o igual.
Para el clculo de la mediana la variable debe ser por lo menos ordinal
En datos no agrupados (directos), con n impar, el valor central es la mediana.
Ejemplo: 3, 5, 7, 8, 9, 12, 13, 15, 20.

n = 9 datos.

La mediana es el valor 9.

Se puede observar que la mediana es el valor que ocupa el lugar

1+ n
2

En datos no agrupados con n par, el valor de la mediana ser el punto medio


entre los dos valores centrales.
Ejemplo: 5, 7, 9, 10, 14, 16, 17, 18.

n = 8 datos;

la mediana es el valor 12.

Es preciso ordenar los datos de menor a mayor para hacer el clculo.

Ejemplo: Datos tabulados. Variable discreta


"X: Nmero de avera diarias en un taller
Frec. abs.

Frec. abs. acum.

ni

Ni

0
1
2
3
4
5
6
Total

40
26
14
6
3
0
1
n = 90

40
66

Me es el valor que ocupa el


1+ n
lugar
= 45,5
2

Mediana = 1

avera.

Interpretacin:

El valor de la mediana en datos tabulados (agrupados) en intervalos


se analizar junto con el tema PERCENTILES. El clculo de la Me es
aproximado y se determina a travs de una frmula que se obtiene de
la tabla de distribucin de frecuencias acumuladas.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 44

Comparacin entre

, Me y M o

Desde un punto de vista descriptivo las tres medidas

proporcionan

informacin complementaria, sus propiedades son distintas:


Estadsticos de tendencia central
-

Media
aritmtica

xi
x=

i =1

total
n

Mediana
Me

Es un valor tal que, ordenados


en magnitud los n datos de
una variable X, el 50% es
menor o igual que ella, y el
50% es mayor o igual.

Moda
Mo

Es el valor de la variable que


ocurre ms frecuentemente

Observaciones
El nivel de medicin de la
variable X sea por lo menos en
escala de intervalos.
La media es muy sensible
cuando existen datos atpicos
o extremos.
Es preferible utilizar el promedio
aritmtico
como medida de
resumen si los datos son
homogneos.
La mediana
utiliza menos
informacin que la media, ya
que solo tiene en cuenta el
orden de los datos y no su
magnitud, por lo tanto, para
poder calcular la mediana el
nivel de medicin de la variable
X debe ser por lo menos en
escala ordinal.
La mediana se ve menos
alterada por los datos atpicos o
extremos.
Para el clculo de la moda la
variable puede tener cualquier
nivel de medicin, luego es la
nica medida de tendencia
central que se puede calcular si
el nivel de medicin de la
variable X es en escala nominal.

X Mediana asimetra, lo que sugiere heterogeneidad en los datos.


en este caso la Mediana es la medida de tendencia central
adecuada para resumir los datos.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 45

Simtrica

Asimetra positiva

Asimetra Negativa

10

10

Simtrica

8
10

8
6

6
4

4
4

2
2

0
2.5

7.5

12.5

17.5

22.5

27.5

32.5

0
2.5

7.5

12.5

17.5

22.5

27.5

32.5

2.5

7.5

12.5

17.5

22.5

27.5

32.5

X = Me = Mo

Mo < Me < X

X < Me < Mo

Ejercicios III
Ejercicio III-1
Un fabricante de un dispositivo para cierto artculo electrnico informa en su propaganda
que la vida til de su producto es superior a 5 aos.
Una muestra aleatoria de 90 unidades vendidas hace 10 aos, revel la siguiente
distribucin de las duraciones:
Duracin
0- 2
24
46
68
8 10

Frecuencia
10
20
25
22
13

a. Determine la duracin promedio


b. Qu porcentaje de unidades duraron ms de 5 aos? Aprox.
Ejercicio III-2
En la fabricacin de semiconductores, a menudo se utiliza una sustancia qumica para
quitar el silicio de la parte trasera de las obleas antes de la metalizacin. En este proceso es
importante la rapidez con la que acta la sustancia. Se han comparado dos soluciones
qumicas, utilizando para ello dos muestras de obleas para cada solucin. La rapidez de
accin observada es la siguiente
Solucin 1:
Solucin 2:

9,9 9,4 9,3 9,6 10,2 10,6 10,3 10,0 10,3 10,1
10,2 10,6 10,7 10,4 10,5 10,0 10,2 10,7 10,4 10,3

a. Indique cuales son las variables involucradas en el problema y clasifquelas.


b. Complete el cuadro siguiente (realice comentarios):

Solucin

Promedio

Mediana

1
2

aaaaaaa

Cecilia Larran R.

Estadstica Descriptiva

Pgina 46

Ejercicio III-3
Media Ponderada o Promedio Ponderado

Sean x1 ,x2,....,xn , n datos y sea los nmero w1 ,w2,....,wn, los pesos correspondiente a
cada xi i = 1,2,....n; con a lo menos un wi > 0. Entonces el promedio ponderado de los

datos, est dado por:


Si cada observacin tiene la misma ponderacin, entonces el promedio y el promedio
ponderado son iguales.
Ejemplo: Las notas parciales de Estadstica I de un alumno son:

P1 (25%)

P2 (35%)

P3 (40%)

4,2

5,7

2,1

Promedio =
Ejercicio III-4

Promedio estratificado
X = Sueldo mensual (miles de $)
Planta
Promedio
N de trabajadores

Santiago (1)
Concepcin (2)
x1 = 568,320
x 2 = 665,210
n1 = 215
n2 = 180
n = n1 + n2+ n3

Antofagasta (3)
x3 = 480,715
n3 = 96

(suponga que se observ una muestra representativa de cada planta)


k

n x
i

X estr =

i=1

Cecilia Larran R.

Estadstica Descriptiva

Pgina 47

Cuartiles Quintiles Deciles - PERCENTILES


Son medidas estadsticas que dividen una serie ordenada de observaciones en
4, 5, 10, 100 partes iguales.
Si dividimos en 4 partes iguales, tenemos los cuartiles (Qk) 1, 2 y 3. Cada parte
le corresponde un 25%.
|

25%

25%

Mn

Q1

25%

Q2

25%

|
Q3

|
Mx

Si dividimos en 5 partes iguales, tenemos los quintiles (qk) 1, 2, 3 y 4. Cada


parte le corresponde un 20%.
20%
| 20%
| 20% | 20% | 20%
|
|
Mn

q1

q2

q3

q4

Mx

Si dividimos en 10 partes iguales tenemos los deciles (Dk)


Los Percentiles Pp son los valores que dividen un conjunto de datos
ordenados de menor a mayor en 100 partes con igual (aproximadamente)
nmero de datos.
p%
|
Pp

|
x(1)

(100 - p)%
|
x(n)

Mn

Mx

Si dividimos en 10 partes iguales tenemos los deciles (D) y en 100 partes


iguales, los percentiles (Pp).
p%

(100 - p)%

x(1)

Pp

x(n)

Mn.
Entre mn y Pp se encuentra el p% de los datos

Mx.
o

entre Pp y mx se

encuentra el (100 p)% de los datos.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 48

Recordemos se dividimos la serie de datos ordenada en dos partes iguales, tenemos


la mediana (Me)
Tenemos: Q1 = P25

Me = Q2 = D5 = P50

Q3 = P75

q1 = D2 = P20
q2 =
q3 =
q4 =

Clculo de Percentiles (datos directos)


Ejemplo: Los siguientes datos corresponden a los puntajes obtenidos por 14
alumnos en un examen de Fsica II. (0 100 puntos)
84 52 85 61 74 77 65 63 57 64 72 55 68 76
Diagrama de puntos

Puntaje

Clculo percentiles Pp
En la definicin de percentil en un conjunto de datos es el valor tal que el p% de los
datos es menor o igual que l y el (100 p)% de los datos es superior o igual a l,
puede que ningn valor cumpla exactamente la definicin. Existen diversas formas de
interpolar para el clculo del Pp, en este curso vamos a utilizar el mtodo AEMPIRAL
explicado en la pgina 22 de texto Probabilidad y Estadstica. Douglas C. Montgomery
y George C. Runger (1996)
1ro) Se ordenan los n datos de menor a mayor
np
. El mtodo AEMPIRAL asigna la media
100
de x(j) y x(j+1) cuando j es un nmero entero, y asigna el valor que ocupa la
np
posicin siguiente a la parte entera de j cuando j =
es un nmero decimal
100

2do) Pp es el valor que ocupa el lugar j =

Del ejemplo:
lugar j=

14 50
100

P50
=7

n = 14
P50 =

p = 50 percentil 50 est se encuentra en el

65 68
= 66,5 = Me el 50% de los estudiante
2

obtuvieron puntaje entre 52 y 66,5 puntos

Cecilia Larran R.

Estadstica Descriptiva

Pgina 49

- Entre qu valores e encuentra el 25% de los mejores puntajes?


-

Determine el percentil 75 e interprete.

(Resp: P75 = 76 AEMPIRAL)

Clculo de percentiles datos tabulados en intervalos:


Los valores que toman los percentiles cuando tenemos la informacin agrupada
(intervalos reales) en una tabla de frecuencias de una variable cuantitativa son

aproximados.
Mediante interpolacin lineal en el grfico de frecuencias acumulada (ojiva) se
llega a la frmula del percentil.
Puntaje en un test de aptitud
Puntaje
X

15 20
20 25
25 30
30 35
35 40
40 45

N de
sujetos
ni
8
7
14
6
3
2
n = 40

Frecuencias acumuladas
Ni
Fi
(absoluta)

(relativa)

8
15
29
35
38
40

0,200
0,375
0,725
0,875
0,950
1,000

n = 40
lugar

np n 50
=
20
100 100

el percentil 50 o
mediana
aproximadamente se
encuentra en el lugar 20,
observando la columna Ni
de frec. acumuladas o el
grfico ojiva, el valor que
ocupa el lugar 20 se
encuentra en el tercer
intervalo.
P50 = Me [25, 30)

DISTRIBUCIN DE FRECUENCIA ACUMULADA

Puntaje
X
< 15
< 20
< 25
< 30
< 35
< 40
< 45

Cecilia Larran R.

Frec. Abs. Acumulada


Ni
0
8
15
29
35
38
40

Estadstica Descriptiva

Pgina 50

OJIVA (POLGONO DE FRECUENCIAS ACUMULADAS)

Interpolando
Linealmente, se
obtiene

Puntaje
P50 [25, 30) 25 es el lmite inferior del intervalo j
30 25 = 5 es la amplitud del intervalo j
intervalo j

Hay 14 sujetos (frec, abs.) con puntaje en el intervalo j


frec. abs. acumulada anterior al intervalo j es 15

La frmula que entrega la interpolacin lineal para el clculo de percentiles con


datos agrupados en intervalos reales es:

Pp = liminf j

np
- Nj-1
100
+amplitud j

nj

Se utiliza
cuando no se
tienen los
datos de
cada unidad
de
observacin

Aplicando la frmula de percentil para datos agrupados

20 15
P50 25 5
26,79 puntos
14
Interpretacin .
-

Suponga que al 15% de los puntajes ms altos pasan a una segunda etapa,
a partir de qu puntaje se va a realizar el corte para seleccionar a dichos
sujetos?.

- Determine e interprete el valor del percentil 10.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 51

Ejercicio
En una industria, se realizan peridicamente un anlisis de la medicin del trabajo con el
fin de determinar el tiempo requerido para generar una unidad de produccin. En una
planta de procesamiento se registr durante 20 das el nmero de horas-trabajador
totales requeridas para realizar cierta tarea. Los datos recogidos son:
128 119 95 97 113 109 124 132 146 128 103
124 131 133 131 100 112 111 150

135

a) Determine las medidas de tendencia central. Interpreta resultados.


b) Cunto tiempo (horas-trabajador) requieren como mximo el 25% de los das que
demoraron menos en realizar la tarea?. Cunto tiempo (horas-trabajador) requieren
como mnimo el 25% de los das con mayor demora en realizar la tarea?
c) Indique qu medida de tendencia central puede ser representativa
d) Determine el valor de (cuartil 3 cuartil 1). Cmo puede interpretar esa diferencia?
e) Construya un diagrama de caja (grfico basado en los cuartiles)

Grfico de cajas (Tukey fue su creador)


Es un grfico que suministra informacin sobre los valores mnimo y mximo, los
cuartiles de Tukey Q1, Q2 o mediana Q3, la existencia de valores atpicos y la
simetra de la distribucin.
Se sabe que un dato es atpico, si su
valor no se encuentra en el intervalo
(Q1 1,5RI , Q3 + 1,5RI)
RI = Q3 Q1

Es necesario tener datos directos (sin agrupar en intervalos) para realizar


el grfico de cajas.
Este grfico es til para hacer comparaciones rpidas entre 2 o ms
conjuntos de datos.
La primera bisagra de Tukey (similar al cuartil 1) es el valor que ocupa la
posicin intermedia entre la mediana el valor ms pequeo de la
distribucin; la segunda bisagra es la mediana; la tercera bisagra (similar
al cuartil 3) es el valor que ocupa la posicin intermedia entre la mediana y
el valor ms grande de la distribucin.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 52

MEDIDAS DE DISPERSIN ( O VARIABILIDAD)


Las medidas de tendencia central (promedio, mediana, moda) y los percentiles,
dan informacin incompleta, acerca de las observaciones.
Ejemplo: Los puntajes (X) obtenidos en una Test que mide capacidad de
abstraccin por 2 grupos de alumnos son los siguientes:
Grupo 1
4
3
5
6
4
5
5
7
5
6
Grupo 2
1
4
3
5
6
8
2
7
5
9
En ambos casos el promedio aritmtico o media aritmtica es 5 (x = 5) , pero sus
grficos son distintos
Diagramas de puntos

Los diagramas de ambos grupos muestran que los puntajes se distribuyen


simtricamente respecto al 5, pero en el grupo 1 existe una menor dispersin
que en el grupo 2, es decir, los grupos tienen igual promedio pero la variabilidad
de los puntajes respecto a la media es distinta.
Las medidas de variabilidad indican la dispersin de los datos obtenidos por los
sujetos o las unidades de medicin. Cuando los datos estn con baja dispersin
se dice que es homogneo. Cuando estn altamente dispersos se dice que es
heterogneo.
Las medidas de dispersin ms utilizadas son las siguientes:
Amplitud o rango o recorrido, rango intercuartlico, desviacin estndar,
varianza y coeficiente de variacin.
Rango o recorrido: Es la distancia en la escala de medidas entre los valores
mayor y menor.
Rango = valor mximo valor mnimo
En el grupo 1: rango es 7 3 = 4 y en el grupo 2 rango es 9 1 = 8 lo que implica que
el segundo grupo tiene puntajes ms dispersos.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 53

El rango utiliza poco debido a marcada inestabilidad. Si hay un valor extremo en la


distribucin se tendr la impresin de que la dispersin es grande, cuando en realidad
si omitisemos ese valor podramos concluir que es una distribucin compacta.

Rango Intercuatlico (RI): se define como la diferencia entre el tercer y el primer


cuartel, RI = Q3 Q1, es la longitud del 50% central de la distribucin de datos
Q3 = P75

Q1 = P25

RI se usa con mayor frecuencia acompaando a la mediana cuando la


presencia de valores extremos hace poco recomendable el uso del
promedio.
Defectos. No permite hacer una interpretacin precisa de un valor dentro de una
distribucin.
No interviene en relaciones matemticas importantes en la inferencia estadstica.

Desviacin estndar o desviacin tpica


(medida de dispersin asociada al promedio aritmtico)

Es la raz cuadrada de la media de las desviaciones al cuadrado.


Dado un conjunto (o muestra) de datos x1, x2, ,xn de una variable X con nivel
de medicin en escala de intervalos o de razn, se define la desviacin
estndar o desviacin tpica como el promedio de las desviaciones di de los
valores xi respecto a su promedio aritmtico.
n

Las desviaciones
di = (xi - x )
se elevan al cuadrado para
convertirlas
en
positivas,
adems recuerde que

(xi - x)2
Desviacin estndar: s =

i =1

La desviacin estndar toma valores no


negativos y mide la dispersin: a mayor
desviacin estndar mayor dispersin.

(xi - x) = 0
i =1

y se extrae la raz cuadrada


para que la medida resultante
tenga la misma unidad de
medicin de la variable.

El cuadrado de la desviacin estndar s2, se denomina varianza.


n

s2

Cecilia Larran R.

(x
i 1

x) 2

Estadstica Descriptiva

Pgina 54

Del ejemplo Puntaje de un Test:


Grupo 1

Total

Grupo 2

x-x

(x - x)

3
4
4
5
5
5
5
6
6
7
50

-2
-1
-1
0
0
0
0
1
1
2
0

4
1
1
0
0
0
0
1
1
4
12

x-x

(x - x)2

1
2
3
4
5
5
6
7
8
9
50

-4
-3
-2
-1
0
0
1
2
3
4
0

16
9
4
1
0
0
1
4
9
16
60

Desviacin
estndar

Varianza

Grupo

Promedio

10

50
5 ptos
10

12
= 1,0954 ptos
10

(1,0954)2

10

50
5 ptos
10

60
= 2,4495 ptos
10

(2,4495)2

Se observa que ambos grupos tienen igual promedio pero los datos del grupo dos tienen mayor
dispersin o variabilidad.

Ventajas de la desviacin estndar


- Permite una interpretacin precisa de los valores dentro de una distribucin.
- La desviacin como el promedio pertenece a un sistema matemtico que
permite su uso en mtodos estadsticos ms avanzados.

Propiedades de la desviacin estndar (demostracin tarea)


- Si se suman a todos los valores de la variable un valor constante, el
promedio queda aumentado en ese valor, pero la desviacin estndar
permanece igual.
- Si se multiplica cada valor original por una constante, tanto el promedio
como la desviacin estndar queda amplificados por ese valor.
- La desviacin estndar de una constante es cero.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 55

Observaciones:
N

)2

(x i

Notacin de la varianza poblacional 2

i 1

N
media de la poblacin, N tamao de la poblacin

- En algunos textos de Estadstica la frmula de la varianza (S2)


de la muestra viene dada por:
n

Llamada varianza corregida o cuasivarianza y


se utiliza en Inferencia Estadstica como la
estimacin de la varianza poblacional 2, es

(xi -x)

= i=1

n -1

la frmula que vamos a utilizar en este


curso como varianza muestral.
2

s =
2

i=1

xi

n
2
i

(xi -x)

i=1

x -

i=1

n -1

n-1

Si los datos se encuentran tabulados


desviacin estndar son:

las frmulas de la varianza y

(xi
2
Varianza s x

x)2ni

i 1

n-1
k

(x -x) n
2

Desviacin estndar: s

i 1

xi es el valor de la variable discreta en una tabla


intervalo i (datos agrupados en intervalos reales)

n-1
o la marca de clase en el

Ejemplo: Cierto tipo de resistencias de pelcula de xido metlico son agrupadas


en paquetes de 50 unidades. Se seleccionaron 60 paquetes y se cont el
nmero de resistencias que no cumplan con las especificaciones, resultando la
siguiente tabla

Cecilia Larran R.

Estadstica Descriptiva

Pgina 56

X = N de resistencia defectuosas en cada paquete


xi ni
ni
(x i - x)2 n i

0
1
2
3
4
5
6

5
10
16
15
9
3
2

0
10
32
45
36
15
12

31,25
22,50
4,00
3,75
20,25
18,75
24,50

Total

n = 60

150

125,00

x=

Desviacin estndar s =

150
60

s2 =

125
59

= 2,119 varianza

varianza
2,119 1, 456

Varianza: Datos tabulados


2

s =
2

i=1

xi ni

(xi -x)2 ni
n -1

x
=

2
i

i=1

ni -

i=1

n-1

Desviacin estandar: Datos tabulados


2

s=

Cecilia Larran R.

i=1

x i ni

(xi -x)2 ni
n -1

x
=

2
i

ni -

i=1

i=1

Estadstica Descriptiva

n -1

Pgina 57

Del ejemplo de resistencia de pelcula de xido metlico:

xn

i i

= 150 ;

x n
2

= 500

(150)2
60 1,456
59

500

Coeficiente de variacin (CV):


Es una medida relativa de variabilidad
CVX =

sX
|x|

Se utiliza para comparar

la

dispersin

de variables

que

aparecen en unidades distintas de medicin o que toman valores de


magnitudes muy diferentes, ya que no depende de la unidad de medicin
de las variables.
Ejemplo: La tabla siguiente muestra el peso en kg y la estatura en cm de 10 sujetos
sujeto
Estatura (X)
Peso (Y)

1
2
3
4
5
6
7
8
9
10
172 175 168 178 159 166 176 180 179 171
78 75 70 68 44 66 72 95 70 74

Para analizar cul distribucin de datos es ms homognea, se debe determinar los


coeficientes de variacin de cada variable
Variable

Media

Desv. tp.

100*CV

CV

(% de variabilidad)

Peso (Y)
71,20
12,541
0,176
17,614%
Estatura (X)
172,40
6,620
0,038
3,840%
Interpretacin: La variable estatura es ms homognea (menor % de variabilidad)
Medidas de Forma
Coeficiente de asimetra de Fisher

Apuntamiento o curtosis CAp

Mide lo puntiaguda que es la distribucin

n (x i -x) 3
CA= g1 =

n(n+1) (x i -x) 4

i=1

(n-1)(n-2)
s3

CA p = g 2 =

CA = 0; si la distribucin es perfectamente
simtrica
CA > 0; si hay asimetra positiva
CA < 0; si hay asimetra negativa
Un coeficiente de asimetra mayor que 1
en valor absoluto puede considerarse
alto.

Cecilia Larran R.

i=1

(n-1)(n-2)(n-3)s 4

(n-1) 2
-3
(n-2)(n-3)

Los
valores positivos de CAp
indicarn un fuerte
apuntamiento (leptocrtica),
valores negativos indican una
distribucin ms plana (platicrtica) y si los valores son
cercanos a cero el histograma o polgono de frecuencias
tiene una forma parecida a una campana (mesocrtica)

Estadstica Descriptiva

Pgina 58

Estadstica Descriptiva Bivariada


Los datos que tratamos de analizar pueden incluir valores de dos variables
relacionadas entre s, por lo que es interesante su estudio conjunto.
Los elementos de una muestra o de una poblacin pueden clasificarse con dos
criterios o variables diferentes.
Observacin: Se pueden analizar en forma conjunta ms de dos variables.

Caso 1: Descripcin conjunta de dos variables cualitativas


- Tabla de doble entrada o tabla de contingencia
Existen dos tipos de tablas de contingencia:
i)
Cuando el objetivo es analizar la posible relacin entre dos
variables cualitativas
ii)
Comparar dos o ms grupos en una variable cualitativa
- Grficos adecuados: Barras agrupadas, Sectorial, Barras divididas.
- Medidas de resumen: Asociacin (se estudiarn en la unidad de Inferencia)
Ejemplo i) La informacin que se presenta a continuacin en la tabla y grfico,
corresponde a una parte de un estudio realizado con una muestra de
400 trabajadores de una industria metalrgica con el objeto de
investigar si el desempeo en el programa de capacitacin y el
rendimiento en el trabajo estn relacionados.
Tabla 1
Desempeo en el
Calificacin
programa de capacitacin
Total
en el trabajo
Bajo
Medio
Alto
23
Deficiente
60
29
112
Promedio
28
79
60
167
Muy buena
9
49
63
121
60
400
Total
188
152
- De los trabajadores que obtuvieron bajo desempeo en el programa de
capacitacin, qu porcentaje tiene calificacin deficiente en el trabajo?
- De los trabajadores que obtuvieron un desempeo alto en el programa de
capacitacin, qu porcentaje tiene calificacin muy buena en el trabajo?
- De los trabajadores que obtuvieron un desempeo alto en el programa de
capacitacin, qu porcentaje tiene calificacin deficiente en el trabajo?

Cecilia Larran R.

Estadstica Descriptiva

Pgina 59

Ejemplo ii) Se desarrollan dos mtodos para fabricar discos de un material


superconductor. Se elaboran 50 discos con cada mtodo y se
comprueba su superconductividad al enfriarlos con nitrgeno lquido.

Mtodo 1
Mtodo 2
Total

Cecilia Larran R.

Superconductores
(Si fallas)
31
42
73

Estadstica Descriptiva

Fallas

Total

19
8
27

50
50
100

Pgina 60

Caso 2: Una variable cuantitativa y una variable cualitativa (grupo)


Tabla de de distribucin de frecuencias (si n es grande)
Grficos adecuados:
- Diagrama de puntos paralelos (muestras pequeas)
- Polgonos de frecuencias en un mismo grfico (hay que tener los
datos tabulados en intervalos, para comparar los grupos es
conveniente utilizar porcentaje)
- Diagramas de cajas paralelas (datos directos, es un grfico
basado en los cuartles)
Medidas de resumen: Tendencia central, Percentiles, Dispersin

Ejemplo: Los datos que se muestran a continuacin son los grados de dureza
Brinell obtenidos para muestras de dos aleaciones de magnesio:
Y = grado de dureza Brinell
Aleacin 1
66,3 63,5 64,9 61,8 64,3 64,7 65,1 64,5 68,4 63,2
Aleacin 2
71,3 60,4 62,6 63,9 68,8 70,1 64,8 68,9 65,8 66,2

ALEACION

1
2

Percentiles (bisagras de tukey)


25
50
75
63,5
64,6
65,1
63,9
66,0
68,9

RI
1,6

1,5RI
2,4

(P25 1,5RI, P75 + 1,5RI)

(61,1 ; 67,5)

Interpretacin: ___________________

Cecilia Larran R.

Estadstica Descriptiva

Pgina 61

ALEACION
1
2
Total

n
10
10
20

Informe: dureza Brinell


Media
Desv. tp. C. V.
64,670
1,787
66,280
3,484
65,475
2,818

Mn.

Mx.

Ejemplo: Una industria metalrgica compra grandes cantidades de alambre de


acero en rollos de 150 metros, hasta la fecha esta compra la realiza en
la empresa Alfha, otra empresa llamada Delta quiere tambin vender
sus productos y hace una oferta bastante interesante porque el precio
de cada rollo es muy inferior.
Sin embargo es importante considerar la resistencia a la traccin (Y).
Por ello se toman muestras al azar de rollos de acero provenientes de
ambas empresas.
Los resultados se presentan en la tabla siguiente:

Resistencia
(en Newton)
10,00 10,25
10,25 10,50
10,50 10,75
10,75 11,00
11,00 11,25
11,25 11,50
11,50 11,75

yi
10,125
10,375
10,625
10,875
11,125
11,375
11,625

Empresa
Alfha Delta

Y = resistencia a la traccin del alambre


Empresa

yn

y n

514,25
799,00

5514,5
8636,90625

i i

2
12
14
11
5
4
0

0
17
25
11
9
9
3

Alfha
Delta

48
74

2
i

- Grfico adecuado para representar la distribucin de la resistencia de los


alambres de acero fabricado por cada una de las empresas.
Polignos de frecuencias.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 62

- Si la variabilidad de la resistencia del alambre de la empresa Delta no es


superior a la de la empresa Alfha y adems la resistencia promedio es superior
en al menos 1,5 Newton sera aconsejable cambiar de proveedor.
Qu decisin se debera tomar en base a la informacin obtenida?
Fundamente con clculo de medidas adecuadas.
EMPRESA
Alfha
Delta

Media
(promedio)

10,71354

n
48

Desv.
C.V.
estandar
0,32815 0,03063

% de variabilidad
3,063%

Respuesta: _______________
- Qu porcentaje de los rollos de alambre de acero de la empresa Delta
supera la resistencia media de los rollos de alambre de acero de la empresa
Alfha

Cecilia Larran R.

Estadstica Descriptiva

Pgina 63

Caso 3 : 2 variables cuantitativas


Grfico adecuado: Diagrama de dispersin
Medida de resumen conjunta: Coeficiente de correlacin lineal de
Pearson

Descripcin conjunta de dos variables cuantitativas


Es frecuente que se pueda determinar el grado de relacin entre 2 (o ms)
variables cuantitativas, ya que al tener este conocimiento, se puede predecir una
variable a partir de la otra.
Para expresar cuantitativamente el grado en que dos variables estn
relacionadas, es necesario calcular un coeficiente de correlacin.
Coeficiente de correlacin lineal poblacional :
Coeficiente de correlacin lineal muestral: r
Un coeficiente de correlacin para variables cuantitativas: es un nmero
que indica el grado de asociacin y la direccin de esa asociacin. Indica
cmo vara o cambia una caracterstica cuando la otra caracterstica o
variable asociada cambia.
Sin el conocimiento de cmo una cosa vara con otra sera imposible hacer
predicciones. La prediccin slo es posible basndose en el conocimiento de la
relacin que hay entre 2 variables.
Un coeficiente de correlacin lineal (con variables por lo menos ordinales) nos
proporciona 3 datos principales:
- La existencia o no de una relacin entre las variables estudiadas.
- La direccin de la relacin.
- El grado de esta relacin.
Como por ejemplo:
estatura y peso
el ingreso familiar y los gastos en educacin
Para el clculo de r (correlacin muestral) es preciso tener 2 conjuntos de
medidas de los mismos individuos (o parejas de individuos que tengan alguna
forma de relacin)
Tabla de datos:
Sujeto 1
Variable X x1
Variable Y y1

2
x2
y2

3
x3
y3

n
xn
yn

La tabla contiene n
pares ordenados

Grfico adecuado: Diagrama de dispersin, muestra si hay relacin lineal entre


las variables

Cecilia Larran R.

Estadstica Descriptiva

Pgina 64

Ejemplos
a) Una correlacin lineal positiva perfecta
X
2
4
5
6
7
8
9
10
12
13

Y
4
6
7
8
9
10
11
12
14
15

r=1

b) Una correlacin lineal elevada positiva (+0,76) (relacin directa)


X
13
12
10
10
8
6
6
5
3
2

Y
11
14
11
7
9
11
3
7
6
1

En general, personas con alto puntaje en x tambin tendrn alto puntaje en y.


c) Una baja correlacin lineal positiva (+0,14)
X
13
12
10
8
7
6
6
4
3
1

Y
7
11
3
7
2
12
6
2
9
6

Cecilia Larran R.

Estadstica Descriptiva

Pgina 65

d) Un caso de alta correlacin lineal negativa (-0,70) (relacin inversa)


X
Y
12
7
10
3
9
8
8
5
7
7
7
12
6
10
5
9
4
13
2
11
El signo algebraico del coeficiente de correlacin tiene que ver, por lo tanto, con
la direccin de relacin entre dos cosas, ya sea directa o inversa.

Significado de la correlacin
El valor de de la correlacin puede variar desde -1 (lo que indica
correlacin negativa perfecta), pasando por el 0 (que indica independencia
completa o ninguna relacin), hasta +1 (que significa perfecta correlacin
positiva)
La magnitud se relaciona con la intensidad o estrechez de la relacin.
Coeficiente de correlacin lineal de Pearson

r
n

sxy

(x -x)(y -y)
i 1

n -1

s xy

; -1 < r < 1

sxs y

covarianza de una muestra (representativa de la


poblacin objeto), indica la direccin de la relacin.
X e Y variables cuantitativas

COVARIANZA

n n
x i yi
n
n
(x i -x)(yi -y)
x i yi - i=1 i=1

n
sxy i=1
= i=1
n -1
n-1

Cecilia Larran R.

Estadstica Descriptiva

Pgina 66

Ejemplo:
sujeto
1
2
3
4
5
6
7
8
9
10

x
13
12
10
10
8
6
6
5
3
2

y
11
14
11
7
9
11
3
7
6
1

(x - x )
5,5
4,5
2,5
2,5
0,5
-1,5
-1,5
-2,5
-4,5
-5,5

Total

75

80

promedio

x =7,5

y = 8,0

Desviacin estndar de Y: s y =

sxy

(x - x )2 (y - y )2
30,25
9
20,25
36
6,25
9
6,25
1
0,25
1
2,25
9
2,25
25
6,25
1
20,25
4
30,25
49

124,5

Desviacin estndar de X: s x =

Covarianza de (x,y):

(y - y )
3
6
3
-1
1
3
-5
-1
-2
-7

(x - x)

n-1

(y - y)
n-1

(x -x)(y -y)
n-1

124,5
3, 719
9

144
4, 000
9

102
=
= 11,333
9

Coeficiente de correlacin lineal de Pearson: rxy

(x - x )(y - y )
16,5
27
7,5
-2,5
0,5
-4,5
7,5
2,5
9
38,5

144

102

Covarianza positiva
Interpretacin: si hubiese
relacin lineal, esta sera
directa

11,333
= 0,762
(3,719)(4,000)

Interpretacin: _________________________________________

Cecilia Larran R.

Estadstica Descriptiva

Pgina 67

Ejercicios V
Ejercicio V-1
Para determinada tarea en una fbrica, donde se necesita mucha destreza, se quiere
investigar si
la productividad en el trabajo debe ser mayor al aumentar los aos de
experiencia. Se seleccionaron al azar diez empleados de entre lo que tienen ese trabajo.
Los datos de aos de experiencia y medicin de productividad son los siguientes:
Empleado
Aos de experiencia
Productividad

01
4
80

02
6
82

03
10
88

04
2
81

05
12
92

06
6
85

07
5
83

08
10
86

09
13
91

10
9
90

a. Realice el diagrama de dispersin y calcular el coeficiente r de Pearson.


b. Interprete los resultados.
Ejercicio V-2
El tiempo de respuestas (en nanosegundos) de un circuito lgico en fro (X) y el tiempo de
respuesta tras una hora de uso intensivo (Y), para una muestra de 12 mquinas es el
siguiente:
Mquina
Tiempo de respuesta en fro (X)
Tiempo de respuesta tras una hora
de uso (Y)

1 2
6 5

3
8

4 8 15

4 5 6 7 8
14 7 4 5 9
8

9
6

9 6 9 6 11

10 11 12
5 7 6
7

a.

Se desea pronosticar el tiempo que tardar un determinado circuito lgico tras una hora
de funcionamiento intensivo, utilizando informacin del tiempo de respuesta en fro.
Para un pronstico fiable, las variables deben estar fuertemente relacionadas, utilizando
una mediada estadstica adecuada, qu concluira usted?

b.

Se sabe que un dato es atpico, si su valor no se encuentra en el intervalo


(Q1 1,5RI , Q3 + 1,5RI)
Detecte los posibles valores atpico en Y.
(Qk cuartil k

RI Amplitud (rango) intercuartlica)

Ejercicio V-3
Se estn estudiando dos tipos de tubos para la utilizacin en cierta aplicacin industrial. Se
seleccionaron 12 ejemplares de cada tipo y se anot su duracin en semanas.
Tubo

Semanas de duracin

Tipo 1
Tipo 2

26,3 32,7 29,6 25,6 34,6 40,3 39,1 32,3 28,2 36,7 32,6 38,8
38,9 27,6 23,6 25,0 33,7 31,4 29,5 32,5 30,6 20,0 31,8 29,3

Analice en forma descriptiva ambos tipos de tubos e indique cul debera seleccionarse para la
aplicacin industrial (Justifique con medidas de tendencia central y de dispersin)

Cecilia Larran R.

Estadstica Descriptiva

Pgina 68

Ejercicio V-4
Se realizan mediciones del contenido de oxigeno en un una mina subterrnea, para
analizar la factibilidad de explotarla sin riesgos para los trabajadores. Se mide entonces el
contenido de oxigeno en miligramos/litro a diferentes profundidades (metros), obtenindose
la siguiente informacin:
Profundidad
Contenido O

15
6,5

20
5,6

30
5,4

40
6,0

50
4,6

25
5,0

35
5.0

45
4,8

65
1,0

60
1,4

70
0,1

a. Determine e interprete la intensidad de la relacin lineal entre las variables en estudio.


b. Introduciendo ciertos sondajes, mediante tuberas especiales, la cantidad de oxgeno
en cada punto observado aumenta en 10%. El costo de esta operacin es de 40 en
miles de $ por metro de profundidad. Cul es la media, mediana y varianza del
costo de la operacin para lograr este aumento de oxigeno?
Ejercicio V-5
Se analizan dos catalizadores para determinar la forma en que afecta el rendimiento de un
proceso qumico. El catalizador 1 es el que se viene empleando en la fbrica y se quiere
averiguar si se puede sustituir por el catalizador 2, ms barato, pero que, segn el
fabricante provoca un descenso del rendimiento. Se llevan a cabo 24 reacciones
obteniendo para cada catalizador los rendimientos en porcentaje:
Catalizador

Y = rendimiento (%)

2
i

93,1
92,0
93,8

91,7
94,0
90,3

99,9
98,2
92,8

90,3
96,1
91,1

96,2
97,9
91,1

92,7
87,0
89,4

92,7
89,4
94,2

89,0
92,6
102,1

2237,6

208924,80

91,5
87,2
90,6

89,2
90,9
88,2

92,8
91,3
87,8

95,3
92,6
89,9

95,1
91,4
90,4

96,4
91,5
90,6

87,0
91,4
91,0

91,7
95,5
97,0

2196,3

201164,17

a.

Se aceptara el cambio de catalizador, si los resultados de la pruebas arrojan una


diferencia promedio de ambos catalizadores inferior a 4 (%) y el catalizador
alternativo debe tener rendimiento ms homogneo del que se utiliza actualmente.
Con los resultados muestrales, es aconsejable realizar el cambio?

b.

Sabiendo que el 75% de las reacciones obtenidas con el Catalizador 2 tienen un


rendimiento igual o superior a 90,15. Determine si existe algn resultado (reaccin)
atpica. Utilice regla de Tukey.

Cecilia Larran R.

Estadstica Descriptiva

Pgina 69

Ejercicio V-6
En una planta embotelladora de bebidas de fantasa, utilizan envases fabricados
con 2 tipos de plstico, de similares condiciones. ( A y B ).
Con muestras de 25 botellas fabricadas con cada tipo de plstico se midi la
resistencia (en psi). Algunos resultados parciales se encuentran a continuacin:
Resist_A Stem-and-Leaf Plot

Resist_B Stem-and-Leaf Plot

Freq

Freq

1,00
2,00
1,00
4,00
7,00
4,00
2,00
1,00
2,00
1,00

Stem & Leaf


18 .
18 .
19 .
19 .
20 .
20 .
21 .
21 .
22 .
22 .

2
59
0
5679
1222234
5689
01
9
14
5

Stem & Leaf

1,00 Extremes (=<171)


2,00
17 . 38
3,00
18 . 349
11,00
19 . 22344556679
5,00
20 . 35668
2,00
21 . 05
1,00
22 . 4
Stem width:
10
Each leaf:
1 case(s)

Stem width:
10
Each leaf:
1 case(s)

Atpico = 171

X = Resistencia
Plstico A
Plstico A

5087
4898

1038093
963332

a.

Se estima que las botellas fabricadas con el plstico B presentan una


resistencia ms homognea, que las fabricadas con el plstico A. Utilizando
una medida estadstica adecuada, qu puede comentar de esta estimacin?

b.

Determine para cada tipo de envase entre que valores (psi) se encuentran el
50% de las botellas con mayor resistencia

Cecilia Larran R.

Estadstica Descriptiva

Pgina 70

TALLER. ESTADSTICA APLICADA


I.

Colinesterasa srica

La colinesterasa srica consisten pruebas para enzimas acetilcolinesterasa


(tambin conocida como colinesterasa en glbulos rojos sanguneos) y
seudocolinesterasa (tambin conocida como butilcolinesterasa o colisterasa en
plasma) que actan para descomponer la acetilcolina. La acetilcolina es un
qumico que desempea un papel crtico en la transmisin de impulsos
nerviosos. La acelcolinesterasa se encuentra en los tejidos nerviosos y en
glbulos rojos y la seudocolinesterasa se encuentra principalmente en el hgado.
Las pruebas para estas enzimas se realizan con el fin de identificar la exposicin
a un grupo de qumicos conocidos como organofosfatos (utilizados como
pesticidas), los cuales inactivan las colinesterasas y el nivel de estas enzimas
sirve como indicador de la exposicin y de riesgos de toxicidad.
Se dispone de la siguiente informacin acerca de una muestra aleatoria de
personas de una comunidad agroindustrial en donde se encontraron empleados
de una fbrica de plaguicidas con alto grado de exposicin, agricultores
expuestos por varias semanas cada ao (exposicin moderada) y personas sin
exposicin conocida a plaguicidas, adems se indag el gnero (M: masculino,
F: femenino). Se efectuaron las determinaciones de acelticolinesterasa de
muestras de sangre de cada persona con los resultados siguientes:
Gnero

M
F
F
F
F
M
M
F
M
M
F
M
F
F
F
M
M
M
F
F
M
Cecilia Larran R.

Nivel de
exposicin

Acetilcolinesterasa

Gnero

Nivel de
exposicin

Acetilcolinesterasa

Alto
Moderado
Nulo
Moderado
Alto
Nulo
Moderado
Alto
Nulo
Moderado
Moderado
Nulo
Nulo
Alto
Alto
Nulo
Nulo
Alto
Nulo
Moderado
Nulo

6,4
6,5
7,3
6,8
6,6
7,5
7,0
6,8
7,8
7,1
9,7
7,9
10,8
6,9
9,5
6,9
8,5
6,1
9,4
6,2
4,6

F
M
M
M
F
M
F
M
F
M
M
F
F
F
F
F
M
M
M
M
M

Nulo
Alto
Nulo
Alto
Nulo
Moderado
Alto
Nulo
Moderado
Moderado
Alto
Alto
Moderado
Nulo
Nulo
Nulo
Alto
Moderado
Moderado
Moderado
Nulo

5,6
7,5
9,1
8,2
8,4
7,7
4,1
7,9
8,4
4,2
5,7
5,5
6,8
9,8
6,2
8,5
6,5
5,6
7,4
7,5
8,2

Estadstica Descriptiva

Pgina 71

Con la informacin obtenida:


a. Cuntas personas de las investigadas presentan niveles nulos de exposicin?
b. Qu porcentaje de las personas en la muestra presentan niveles de exposicin alto
o moderado?
c. De las mujeres indagadas, qu porcentaje presentan nivel de exposicin
moderado?
d. Qu porcentaje de personas con niveles altos de exposicin son hombres?
e. Complete la tabla siguiente, muestre la informacin graficamente y realice
comentarios.
Y = cantidad de acetilcolinesterasa
Gnero
Femenino
Masculino

f.

Promedio

Desviacin estndar

Coeficiente de variacin

Complete la tabla siguiente, muestre la informacin graficamente y realice


comentarios
Y = cantidad de acetilcolinesterasa
Nivel de
exposicin

Promedio

Desviacin estndar

Coeficiente de variacin

Nulo
Moderado
Alto
II.

Los elevados valores de la lipoprotena de baja intensidad (LDL) representan


un notable riesgo de patologa cardiovascular. Los investigadores de la
Facultad de Medicina de una universidad piensan que la sustitucin de la
grasa animal de la leche por grasa vegetal puede disminuir los valores de
LDL. Con el objeto de evaluar para una poblacin infantil, se dise un
estudio en el cual, tras un periodo de lavado con placebo, una muestra de 49
nios se alimentaron durante un periodo de seis meses con leche de vaca
entera (grasa animal) y otra muestra de 54 nios con un preparado lcteo, el
cual consista en sustituir la grasa animal por grasa vegetal..
Finalizando el periodo de tratamiento, se determinaron los valores de la LDL
(Y)
LDL (Y)
40 60
60 80
80 100
100 120
120 140
140 160
160 180
Total

Cecilia Larran R.

Nmero de nios
Leche entera (1)
Leche vegetal (2)
0
2
8
13
10
14
16
16
6
7
7
1
2
1
49
54

Estadstica Descriptiva

Pgina 72

a.

Muestre la informacin de la tabla en un grfico adecuado:

b.

Complete e interprete la tabla siguiente:


y
Leche
n
s

CV

Entera (1)
Vegetal (2)
Utilice tres decimales
c. Para que se compruebe lo planteado por los investigadores la informacin

observada en las muestras debe cumplir con la siguiente regla (obtenida


a travs de un mtodo estadstico).

(n1 -1)s12 + (n 2 -1)s 22 1 1


y1 - y 2 1,66
+
n1 +n 2 -2
n1 n 2
Los resultados muestrales, apoyan la hiptesis de los investigadores?
d.

Determine el rango intercuartlico de ambos grupos.


resultado.

Interprete el

AGREGAR GRFI
III. Los siguientes datos muestran la relacin existente entre la alcoholemia

medida a travs muestras de sangre (en g de alcohol por litro de sangre)


(variable X) y la concentracin en g/L de sangre que se obtiene al aplicar
el alcohotest por soplado (variable Y):
X
Y
a.
b.

0,15 0,23 0,32 0,40 0,53 0,65 0,70 0,85 0,90 1,03
0,12 0,24 0,30 0,39 0,51 0,65 0,73 0,81 0,94 1,01
Muestre la informacin grficamente
Calcule e el coeficiente de correlacin de Pearson (indique el tipo de
relacin lineal existente entre las variables y la fuerza de correlacin
encontrada).

Cecilia Larran R.

Estadstica Descriptiva

Pgina 73