Вы находитесь на странице: 1из 49

Medidas Descriptivas

Medidas de Tendencia Central


Medidas de Variabilidad
Medidas de Posicin
Medidas de Forma

Medidas Descriptivas
Tendencia central
Media
Mediana
Moda

Posicin
Cuartiles
Percentiles
Puntuacin Z

37

Variabilidad o de
Dispersin
Rango
Varianza
Desviacin
estndar
Coeficiente de
variacin

Forma
Simetra
Apuntamiento

Caso 1
Interpretacin fsica de la Media

Sistema de masas de datos

0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
38

Caso 2
Interpretacin de la media

0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
39

Caso 3
Interpretacin de la media

0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
40

Promedio o Media Aritmtica


Media aritmtica de una
poblacin de tamao N
N

9 10

X =
0

9 10

x
i =1

N
12

41

9 10

Calificacin en la escala del uno al diez

X =

x
i =1

12

=6

Media:
Interpretacin y propiedades
Punto de equilibrio del sistema de
masas datos
Representante del conjunto de datos
Valor comprendido entre el mnimo y
mximo
No siempre coincide con un valor
observado
Es nica
42

Variabilidad Dispersin
Rango = xmx xmn

R=0
0

9 10

R = 10
0

9 10

R=2
0

9 10

R = 10

R = 10
0

43

9 10

9 10

Rango
Diferencia entre el valor mximo y el valor
mnimo observado
Es la ms simple de las medidas de
dispersin
Slo para datos numricos
No nos cuenta sobre la distribucin de los
datos dentro del mismo
Es nico
44

Medicin de la dispersin
Cunto se alejan los datos del
punto de equilibrio?

0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
45

Medicin de la dispersin
La desviacin respecto de la media
como medida de dispersin

( xi X )

0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
46

Inconvenientes de la desviacin

9 10

9 10

La suma de las desviaciones


respecto de la media es
siempre igual a cero
N

(x
i =1

47

9 10

Calificacin en la escala del uno al diez

)=0

Varianza y Desviacin Estndar


N

=
2

(x
i

i =1

Varianza Poblacional:
Promedio de las
desviaciones cuadrticas
respecto de la media

X =
48

( xi X )
i =1

Desviacin Estndar
Poblacional: Surge de la
necesidad de volver a la
unidad de medida de la
variable en estudio

Para pensar ...


Cul es la estatura promedio de las
personas presentes?
Cul es la desviacin estndar de las
personas presentes?
Comparemos:
Estatura de los adultos
Estatura de adolescentes (13 a 17 aos)
Cul tiene mayor desviacin estndar?

Comparemos media y desviacin estndar:


49

Estatura de los adultos


Estatura de las modelos de Pancho Dotto

Valores numricos de

50

9 10

X = 0

9 10

X = 0, 71

9 10

X = 4,32

Calificacin en la escala del uno al diez

Tabla: valores de

51

Grupo 1

Grupo 2

Grupo 3

Grupo 4

Grupo 5

Grupo 6

Grupo 8

10

11

12

Media =

DE Pob=

0,4082

0,5774

0,7071

0,8165

0,9129

Grficos: valores de
=0
0

= 0,82
0

9 10

9 10

= 0,41
0

9 10

= 0,91
0

9 10

= 0,58
52

9 10

=1
0

9 10

Caso 4
Los datos, en promedio, cunto se
alejan a un lado y al otro de la media?

=1
0 1 2 3 4 5 6 7 8 9 10

53

Caso 5
Los datos, en promedio y aproximadamente,
cunto se alejan a un lado y al otro de la media?

= 2,082
0 1 2 3 4 5 6 7 8 9 10

= 3,055
0 1 2 3 4 5 6 7 8 9 10
54

Interpretacin de
Sistema real

En ambos sistemas:

9 10

Sistema equivalente
2,5

X = 7
X = 2,5

2,5
En promedio, las
calificaciones se alejan de
la media, 2,5 puntos

55

9 10

Resumen de frmulas (Poblacin)


Poblacin de tamao N
N

Media
Poblacional

Desviacin
Estndar
Poblacional
56

X =

x
i =1

N
N

X =

(x
i =1

Resumen de frmulas (Muestra)


Muestra de tamao n
n

Media Muestral

X=

Desviacin
Estndar Muestral
57

i =1

n
n

SX =

(x X )
i =1

n 1

Coeficiente de Variacin
Medida de dispersin relativa
Permite efectuar comparaciones entre
variables medidas en la misma unidad o en
unidades de medida diferentes
Expresa la dispersin como proporcin o
porcentaje respecto de la media del conjunto
de los datos
Frmula de clculo:
Poblacional

Muestral
58

X
CV =
X
SX
CV =
X

Capacidad estadstica vs.


Pensamiento estadstico
Anlisis de la Variabilidad

Caso 1: Tiempos
Variable en estudio:
Tiempo requerido para realizar una tarea

Se desea comparar el tiempo empleado por


un grupo de personas para realizar una tarea
X, con el tiempo empleado por otro grupo de
personas para realizar una tarea Y.
Desviacin estndar (X): X = 0,04 min
Desviacin estndar (Y): Y = 2880 min (dos das)

Qu tiempos estn ms dispersos, los de la


tarea X o los de la tarea Y?
60

Caso 2: Derrames
Variable en estudio:
Derrame Medio Anual (hm)

Se desea comparar el volumen de agua que


anualmente aportan dos ros, denominados
genricamente X e Y.
Desviacin estndar (Ro X): X = 546 hm
Desviacin estndar (Ro Y): Y = 113.121 hm

Cules son los derrames que estn ms


dispersos, los del Ro X o los del Ro Y?
61

Caso 3: Estaturas y Pesos


Variables en estudio:

Estatura (X) y Peso (Y)

Se desea comparar las estaturas con los


pesos de un grupo de personas, en trminos
de variabilidad.
Desviacin estndar estaturas: X = 8,6 cm
Desviacin estndar pesos: Y = 13,7 kg

Qu datos estn ms dispersos, las


estaturas o los pesos de las personas del
grupo?

62

Caso 4: Tiempos
Variable en estudio:
Tiempo requerido para realizar una tarea

Se desea comparar el tiempo empleado por


los hombres (H) con el tiempo empleado por
las mujeres (M) para realizar la misma tarea.
Desviacin estndar (hombres): H = 4,69 min
Desviacin estndar (mujeres): M = 1,70 min

Qu tiempos estn ms dispersos, los de los


hombres o los de las mujeres?
63

Otras medidas de
tendencia central
Mediana (Me) y Moda (Mo)

Mediana
Definicin:
Es un valor de la variable que ocupa la posicin
central en un conjunto ordenado de datos.

Determinacin de la mediana:
Si el nmero de observaciones es impar, es el
valor observado que ocupa la posicin central de
los datos, una vez que stos han sido ordenados
de manera creciente.
Si el nmero de observaciones es par, se calcula
como el promedio aritmtico de las dos
observaciones centrales, una vez que stos han
sido ordenados de manera creciente.
65

Determinacin de la Mediana (1)


Cuando el nmero de datos es IMPAR

Orden

66

Observacin

200

Mediana = x%= x n +1

200

200

200

400

450

650

Me = 400

800

Media = 1000

5900

2
Orden de la mediana: 5
Valor que ocupa la posicin central

Moda = 200

Determinacin de la Mediana (2)


Cuando el nmero de datos es PAR

Orden Observacin

67

xn + xn

200

x%=

200

200

400

Orden de la mediana:

450

Entre el 4 y 5

650

800

5900

+1

Mediana = Promedio de los


valores centrales
Me = (400+450)/2 = 425
Media = 1100

Propiedades de la Mediana
La mediana de un conjunto de datos es nica
NO es sensible a la presencia de datos
apartados o valores extremos
En un conjunto de datos, la mitad de ellos son
iguales o menores que la mediana y la otra
mitad son iguales o mayores que la mediana

68

Moda
Definicin:
Es el valor de las observaciones que aparece con
mayor frecuencia

Propiedades de la Moda:
Se puede determinar tanto para datos numricos
como para datos no numricos
No se ve afectada por datos apartados o valores
extremos
La moda puede o no existir; cuando existe,
puede no ser nica
69

Dificultades de la Moda
Conjunto pequeo de datos
Media = 5,42
Moda = 10
Mediana = 5,5
Desviacin estndar = 3,3
0 1 2 3 4 5 6 7 8 9 10
Calificacin en la escala del uno al diez
70

Clases Modales (datos agrupados)


Histogram for Calzado

percentage

40
30
20

Nmero de calzado

10
0
34

36

38

40

42

44

46

Calzado

Histogram for ANTIG


30

percentage

25

Antigedad en la
empresa

20
15
10
5
0
0

10

15

20

25

30

ANTIG

71

35

40

45

50

Medidas de Posicin
Cuartiles y Percentiles
Valor Z
Grfico de caja

Interpretacin de los cuartiles


Se forman cuatro grupos con igual cantidad de datos
La cuarta parte de
los datos asume
valores iguales o
inferiores a 2,2

La mitad de los datos


(dos cuartos) asume
valores iguales o
inferiores a 3,6

Q2 = Me = 3,6

Tres cuartas partes de


los datos asume valores
iguales o inferiores a 7,8

Q3 = 7,8

Q1 = 2,2
Rango Intercuartil: RI = Q3 Q1

xmn = 1,1

73

3
4
5
6
7
8
Escala graduada de la variable en estudio

xmx = 9,9

10

Interpretacin de los percentiles


Se forman cien grupos con igual cantidad de datos
El 25% de los datos El 50% de los datos (la
son iguales o
mitad) son iguales o
inferiores a 2,2
inferiores a 3,6

P50 = Me = 3,6

El 75% de los datos son


iguales o inferiores a
7,8

P75 = 7,8

P25 = 2,2
xmx = 9,9

xmn = 1,1

74

Escala graduada de la variable en estudio

10

Para pensar ...


El cuartil inferior, puede resultar igual a la mediana?
1

10

El percentil 20, puede resultar mayor que el cuartil


superior?
1

10

Sofa Puertas
75

Valor Z
Describe la posicin de un valor individual de la
variable en estudio, respecto de la media del
grupo al cual pertenece.
Indica a qu distancia de la media del grupo se
encuentra, sea por encima (signo positivo) o
por debajo de la misma (signo negativo),
medida en unidades de desviacin estndar.
Frmula de clculo:

z=

76

xz == x + xz
S

Valor z (poblacin)
Valor z (muestra)

Interpretacin del Valor Z


Un valor Z negativo
indica que la observacin est por debajo de la
media

Un valor Z positivo
indica que la observacin est por encima de la
media

Un valor Z igual a cero


qu indica?

77

z=

xx
z=
S

Transformacin X Y
L

-3

-2

-1

G
2

Y = X+1
3Y =4X 5

X = 2

y = x+1
y = (x Media)

L
-3
-3
78

-2
-2

-1
-1

M
0

A1

Y = 0
Y = X

Transformacin X W
L

-3

-2

w = (x / constante)
constante = 2

-3
79

-2

-1

-1

X = 2
X = 2,16

MAG
0

W = X / constante = 1
W = X / constante = 1,08

Transformacin X Z
y = (x Media)
x

L
-3

-3

-2

-2

-1

M
-1

A
1

Y = 0

-3
80

-3

-2

-2

1 =
2 2 3
X

Y = X = 2,16
X = 2,16

Media)
Media)/ sigma
z y==(x
y (x
/constante
constante = sigma

L M MA G
A G

-1

-1

0Y / sigma = 0
YZ==0

1Y / sigma = 1
Y Z==
X

Ilustracin
Ver uso de EXCEL

Grfico de Caja
Datos apartados: atpico y
anmalos

Construccin del Grfico de Caja


REF1
REF2
REF3
REF4

=
=
=
=

Q1 3 RI
Q1 1,5 RI
Q3 + 1,5 RI
Q3 + 3 RI

REF1

xmn

atpicos

Q3

xmx

REF2

anmalos

Q1

REF3

Q2=Me

REF4

atpicos

10

anmalos

11

Variable Numrica

Datos No Apartados
Datos apartados
83

12

Datos apartados

Construccin del Grfico de Caja


Primer dato no apartado por debajo de la REF 3

REF1
REF2
REF3
REF4

=
=
=
=

Q1 3 RI
Q1 1,5 RI
Q3 + 1,5 RI
Q3 + 3 RI

REF1
anmalos

Q1

xmn

Q3

xmx

REF2

REF3

atpicos

REF4

atpicos

anmalos

Q2=Me
0

10

11

Variable Numrica

Datos No Apartados
Datos apartados
84

12

Datos apartados

Вам также может понравиться