Вы находитесь на странице: 1из 11

10

11
11
13
14
14
15
COMO VALIDAR EL SUPUESTO DE
15
NORMALIDAD?
15
15 Mtodos:
16
16
1. Pruebas grficas
16
1.1
Histograma
1.2
Q-Q Plot (grfico de probabilidad normal)
17
1.3
Boxplot, Tallo y Hojas
17
17
2. Pruebas de Bondad de Ajuste (prueba
18
estadstica)
18
18

19
19
19
20
20
20
21
21
21
22
22
23
23
23
24
26
26
26
27
29
30
30
31
32
32
33
33
34
34
35
35
36
37
37
37
39
40

1.1

Histograma

Adicionalmente, los coeficientes de Asimetra y Curtosis


aportan informacin complementaria a la inspeccin visual
del histograma.
Ejercicio 1: Realice uno a uno los pasos para realizar un
histograma al siguiente conjunto de
datos. Una vez
construido anlice el grfico utilizando herramientas de
estadstica descriptiva.
Edades de las Personas que Asisten a Cine &%&
Muestra de datos

_______________________________________________________________
Recordemos
Un histograma es un resumen grfico de la variacin de un conjunto
de datos. La naturaleza grfica del histograma nos permite ver pautas
que son difciles de observar en una simple tabla numrica. Esta
herramienta se utiliza especialmente en la bsqueda de un modelo
de distribucin de probabilidades para una variable.

Cmo interpretar los histogramas:


Sabemos que los valores varan en todo conjunto de datos. Esta
variacin sigue cierta pauta. El propsito del anlisis de un
histograma es, por un lado, identificar y clasificar la pauta de
variacin, y por otro desarrollar una explicacin razonable y relevante
de la pauta. La explicacin debe basarse en los conocimientos
generales y en la observacin de las situaciones especficas y debe
ser confirmada mediante un anlisis adicional. Las caractersticas de
variacin ms comunes son en la distribucin de los datos es: si hay
forma de

campana, simetra, con dos picos, plana, sesgada,

truncada, con un pico aislado, o con un pico en el extremo.


Construccin de un histograma:
PASO 1
Determinar el rango de los datos: RANGO es igual al dato mayor
menos el dato menor;
Rango=Mximo-Mnimo
PASO 2
Obtener en nmero de clases, existen varios criterios para determinar
el nmero de clases ( o barras). Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de como estn los datos y cuntos sean. Un criterio
usado frecuentemente es que el nmero de clases debe ser
2

aproximadamente a la raz cuadrada del nmero de datos, por


ejemplo, la raz cuadrada de 66 ( nmero de artculos) es 8.12, por lo
que se seleccionan ocho clases.

PASO 3
Establecer la longitud de clase o Incremento: es igual al rango entre
el nmero de clases.
PASO 4
Construir los intervalos de clases: Los intervalos resultan de dividir el
rango de los datos en relacin al resultado del PASO 2 en intervalos
iguales.
PASO 5

Graficar el histograma: se hace un grfico de barras, las bases de las


barras son los intervalos de clases y altura son la frecuencia de las
clases. Si se unen los puntos medios de la base

VARIACIONES:
1. En el eje y puede ir las frecuencias absolutas o las relativas o
tambin se puede utilizar una escala de densidad que se
consigue haciendo:
Area (rectgulo) = Base * Altura

Frecuencia Relativa Incremento


Altura (densidad) = Frecuencia Relativa / base
La ventaja es que

histogramas construidos en esta forma

son

comparables ya que las reas siempre suman 1.


Calculos en Excel:
Frecuen Frec.
Intervalo de clase cia
Relativa
0,1515151
10
15,5
10
52
0,2727272
15,5
21
18
73
0,1363636
21
26,5
9
36
0,1060606
26,5
32
7
06
0,1515151
32
37,5
10
52
0,1060606
37,5
43
7
06
0,0454545
43
48,5
3
45
0,0303030
48,5
54
2
3
Suma
66

Frec. Rel.
Acum.
0,15151515
2
0,42424242
4
0,56060606
1
0,66666666
7
0,81818181
8
0,92424242
4

Densida
d
0,027548
21
0,049586
78
0,024793
39
0,019283
75
0,027548
21
0,019283
75
0,008264
0,96969697
46
0,005509
1
64

NOTA: A MENUDO VEREMOS OTRAS FORMAS DE PRESENTAR UN


HISTOGRAMA
Ejemplos de otros tipos de representaciones grficas:
(a): bases en el eje horizontal, centros en las marcas de clase y
longitudes iguales a los tamaos de los intervalos de clase
(b): reas proporcionales a las frecuencias de clase.

Polgonos de frecuencia:
El polgono de frecuencias es una representacin grfica de la
distribucin de frecuencias que resulta esencialmente equivalente al
histograma y se obtiene uniendo mediante segmentos los centros de
las bases superiores de los rectngulos del histograma (es decir, los
puntos de las marcas de clase).

Ojiva:
La misma idea de unir los centros de las bases superiores de los
rectngulos de la distribucin del histograma de frecuencias
acumuladas, da lugar al polgono de frecuencias acumuladas u ojiva.

1.2

Realizar un Q-Q plot

Los grficos de probabilidad normal constituyen otra importante


herramienta grfica para comprobar si un conjunto de datos puede
considerarse o no procedente de una distribucin normal. La idea
bsica consiste en enfrentar, en un mismo grfico, los datos que han
sido observados frente a los datos tericos que se obtendran de una
distribucin gaussiana. Si la distribucin de la variable coincide con la
normal, los puntos se concentrarn en torno a una lnea recta, aunque
conviene tener en cuenta que siempre tender a observarse mayor
variabilidad en los extremos.
En los grficos P-P se confrontan las proporciones acumuladas de
una variable con las de una distribucin normal. Los grficos Q-Q se
obtienen de modo anlogo, esta vez representando los cuantiles
respecto a los cuantiles de la distribucin normal.
Adems de permitir valorar la desviacin de la normalidad, los
grficos de probabilidad permiten conocer la causa de esa
desviacin. Una curva en forma de "U" o con alguna curvatura,
significa que la distribucin es asimtrica con respecto a la gaussiana,
mientras que un grfico en forma de "S" significar que la distribucin
tiene colas mayores o menores que la normal, esto es, que existen
pocas o demasiadas observaciones en las colas de la distribucin.

Ejercicio: 1. Utilice los datos los datos de las personas que asisten al
cine para ilustrar paso a paso como construir un grfico de este tipo.

J
1
2
3

Dato
Observad
o
10
11
11

65
76

51
54

Nivel de
Probabilida Cuantil en
d
Z
0.0075
-2.42
0.0227
0.0378
0.9772
0.9772

Para hallar Nvel de probabilidad


haga (j-1/2)/n As en el caso de
j=1 (1-1/2)/66= 0.0075
Para hallar el cuantil en la
distribucin de Z es decir en la
N(0,1) utilice la funcin
DISTR.NORM.ESTAND.INV.
As para el primer cuantil se halla
DISTR.NORM.ESTAND.INV(0.00
75)=-2.42

Luego graficar en Excel Nivel de Probabilidad vs Cuantil en Z (o en


la escala de la variable. Ejemplo: en la escala de la variable Edad,
que sera una normal con media 26.84 y desviacin estndar 11 el
nvel de probabilidad 0.0075 es acumulado por 0.1162, el nvel
0.0227 por 4.83 , etc.)

Q-Q Plot Variable Edad


3
2
1
0
-1
-2
-3

Q-Q Plot Variable Edad


60
50
40
30
20
10
0

G
r

f
i
c
o
Q
N
o
r
m
a
l
d
e
E
D
A
6
0
5
0
4
0

V
a
lo
rN
m
a
le
s
p
ra
d
o

En SPSS slo debe entrar la variable no tabular nada.

3
0
2
0
1
0
01
02
0
3
0
4
05
06
0
V
a
lo
rb
s
e
rv
a
d
o

1.3
Construir otros grficos como Boxplot o tallo y hojas y
analizar caractersticas como simetra, nmero de modas, sesgos,
vacos en la distribucin, presencia de valores extremos.
2 Realizar una prueba de Bondad de Ajuste (PRUEBAS
ESTADISTICAS)
Muchos de los resultados tericos y prcticos de la estadstica
paramtrica descansan en la distribucin normal. El investigar si una
muestra aleatoria de tamao n proviene de una distribucin normal
resulta de inters, y de hecho existen muchas pruebas estadsticas al
respecto entre las que destacan las siguientes:

Prueba de Smirnov Kolmogorov, descansa en los desvos de la


distribucin terica y emprica.

Prueba de Karl Pearson, basada en la distribucin chi cuadrada


y que corresponde a una prueba de bondad de ajuste.

Prueba de Cramer-Von Mises, es til para pequeas muestras y


usa los momentos como criterio.

Prueba de Gram-Charlier, usa la distribucin de mismo nombre


para inferir si la muestra es normal.

Prueba de Jarque y Bera, utiliza un estadstico en prueba que


involucra la curtosis y la asimetra.

Prueba de R.C. Geary, usa los cumulantes muestrales y sus


medias y desviaciones estndar.

Otras, como la de Shapiro- Wilk y aqullas basadas en mtodos


numricos.

Prueba de Bondad de ajuste (chi-cuadrado)

Ejercicio 2: Realice prueba de normalidad a los datos del precio en la


base motos utilizando SPSS .
All debe utilizar la secuencia Analizar, Estadsticos Descriptivos,
Explorar, en el cuadro de dilogo seleccionar la variable y luego al dar
clic en el botn Grficos activar la opcin Grficos con pruebas de
normalidad.

10

Slida de SPSS
Pruebas de normalidad
Kolmogorov-Smirnov(a)
Estadstico
gl
Sig.
Precio
,192
42
,000
a Correccin de la significacin de Lilliefors

Shapiro-Wilk
Estadstico
,849

gl
42

Sig.
,000

11

Вам также может понравиться