Вы находитесь на странице: 1из 19

www. practicaestadisticas.blogspot.

com | 0980700611 | Guayaquil - Ecuador

En este documento encontrars:

Elaboracin de una tabla de distribucin de frecuencias.


Grficas: Histograma Polgono de frecuencias Ojiva.
Medidas de tendencia central para datos no agrupados. Media Mediana Moda.
Medidas de tendencia central para datos agrupados. Media Mediana.
Medidas de dispersin. Varianza Desviacin estndar.

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

La Srta. Kathryn Ball es miembro del equipo de alta gerencia de Applewood Auto Group, ella es
responsable de rastrear y analizar los precios de venta y la rentabilidad de los vehculos. A ella
le gustara resumir las ganancias obtenidas de la venta de los vehculos en tablas y grficas que
pudiese revisar cada mes. Para iniciar con el anlisis, ella ha tabulado la ganancia de cada uno
de los 180 vehculos que se vendieron el mes pasado en Applewood Auto Group.

Precios de vehculos vendidos el mes pasado en Applewood Auto Group


1387

2148

2201

963

820

2230

3043

2584

2370

1754

2207

996

1298

1266

2341

1059

2666

2637

1817

2252

2813

1410

1741

3292

1674

2991

1426

1040

1428

323

1553

1772

1108

1807

934

2944

1273

1889

352

1648

1932

1295

2056

2063

2147

1529

1166

482

2071

2350

1344

2236

2083

1973

3082

1320

1144

2116

2422

1906

2928

2856

2502

1951

2265

1485

1500

2446

1952

1269

2989

783

2692

1323

1509

1549

369

2070

1717

910

1538

1206

1761

1638

2348

978

2454

1797

1536

2339

1342

1919

1961

2498

1238

1606

1955

1957

2700

443

2357

2127

294

1818

1680

2199

2240

2222

754

2866

2430

1115

1824

1827

2482

2695

2597

1621

732

1704

1124

1907

1915

2701

1325

2742

870

1464

1876

1532

1938

2084

3210

2250

1837

1174

1626

2010

1688

1940

2639

377

2279

2842

1412

1761

2165

1822

2197

842

1220

2626

2434

1809

1915

2231

1897

2646

1963

1401

1501

1640

2415

2119

2389

2445

1461

2059

2175

1752

1821

1564

1766

335

2886

1731

2338

1118

2058

2487

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Ordenamiento de datos.
Lo primero antes de realizar un anlisis descriptivo, es ordenar los datos, lo cual nos ayudar a
determinar con mayor facilidad ciertos valores y sobre todo a construir una tabla de frecuencias
con mayor rapidez.

Precios de vehculos vendidos el mes pasado en Applewood Auto Group (Datos


ordenados)
294

1059

1344

1606

1807

1951

2148

2350

2646

323

1108

1387

1621

1809

1952

2165

2357

2666

335

1115

1401

1626

1817

1955

2175

2370

2692

352

1118

1410

1638

1818

1957

2197

2389

2695

369

1124

1412

1640

1821

1961

2199

2415

2700

377

1144

1426

1648

1822

1963

2201

2422

2701

443

1166

1428

1674

1824

1973

2207

2430

2742

482

1174

1461

1680

1827

2010

2222

2434

2813

732

1206

1464

1688

1837

2056

2230

2445

2842

754

1220

1485

1704

1876

2058

2231

2446

2856

783

1238

1500

1717

1889

2059

2236

2454

2866

820

1266

1501

1731

1897

2063

2240

2482

2886

842

1269

1509

1741

1906

2070

2250

2487

2928

870

1273

1529

1752

1907

2071

2252

2498

2944

910

1295

1532

1754

1915

2083

2265

2502

2989

934

1298

1536

1761

1915

2084

2279

2584

2991

963

1320

1538

1761

1919

2116

2338

2597

3043

978

1323

1549

1766

1932

2119

2339

2626

3082

996

1325

1553

1772

1938

2127

2341

2637

3210

1040

1342

1564

1797

1940

2147

2348

2639

3292

Con los datos ordenados podemos determinar con facilidad, cual es el valor mnimo o mximo
del conjunto de datos, es decir, podemos responder las siguientes preguntas:

a. Cul es la ganancia ms alta?


Observando la tabla de datos ordenada, podemos afirmar que la ganancia obtenida ms
alta por la venta de un vehculo es $ 3292.
GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Utilizando Excel, sin importar si los datos estn ordenados, podemos utilizar la siguiente
frmula para responder:
=MAX(Rango de datos) = 3292

b. Cul es la ganancia ms baja?


Observando la tabla de datos ordenada, podemos afirmar que la menor ganancia
obtenida por la venta de un vehculo es $ 294.
Utilizando Excel sin importar si los datos estn ordenados, podemos utilizar la siguiente
frmula para responder:
=MIN(Rango de datos) = 294

Tabla de Distribucin de Frecuencias.


Para construir una tabla de frecuencias es necesario realizar lo siguiente:
1. Definir el nmero de intervalos o clases:
Una regla para determinar el nmero de intervalos (k) es utilizar la regla en la cual k es
el mnimo valor que cumple:
2 >

Donde n es el nmero de observaciones (cantidad de datos).


En nuestro caso particular n=180, por tanto, el valor mnimo de k sera 8.
Por tanto, el nmero de intervalos recomendados es 8. Este valor debe tambin estar
sujeto a criterio del investigador.
2. Definir el intervalo o ancho de clase:
El ancho de clase debe ser igual para cada uno de los intervalos que conforman la tabla
de frecuencias. Y se define con la siguiente frmula:

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Donde:
i: ancho de clase.
H: mayor valor observado.
L: menor valor observado.
k: nmero de intervalos o clases.

.
En la prctica, el valor de i obtenido se redondea dependiendo de los datos y el criterio
del investigador. Para nuestro ejemplo, vamos a definir i=400.
3. Establecer los lmites de clase.
Lo siguiente a realizar es donde comienza el primer intervalo. A modo de ejemplo se
muestra una tabla comparativa:

Intervalo Empezando en 0
1

GPARRALES

[0 - 400)

Empezando en 200
[200 - 600)

Empezando en 294
[294 - 694)

[400 - 800)

[600 - 1000)

[694 - 1094)

[800 - 1200)

[1000 - 1400)

[1094 - 1494)

[1200 - 1600)

[1400 - 1800)

[1494 - 1894)

[1600 - 2000)

[1800 - 2200)

[1894 - 2294)

[2000 - 2400)

[2200 - 2600)

[2294 - 2694)

[2400 - 2800)

[2600 - 3000)

[2694 - 3094)

[2800 - 3200)

[3000 - 3400)

[3094 - 3494)

Si empezamos el primer intervalo en 0 podemos observar que ni siquiera


cubrimos la totalidad del conjunto de datos puesto que existen valores por
encima de 3200.
Si tomamos el valor mnimo de nuestro conjunto de datos como el lmite inferior
de nuestro primer intervalo podramos llevar a cabo sin ningn inconveniente
la realizacin de la tabla de distribucin de frecuencias.

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Una mejor opcin es redondear los lmites a un valor conveniente, esto


depender de los datos, as como del criterio del investigador, en este caso
hemos utilizado como lmite inferior del primer intervalo el valor de 200. Esto
nos permite cumplir con los 8 intervalos con un ancho de clase de 400 unidades.

Por tanto, los lmites de clase estarn dados por:


[200 - 600)
[600 - 1000)
[1000 - 1400)
[1400 - 1800)
[1800 - 2200)
[2200 - 2600)
[2600 - 3000)
[3000 - 3400)

El smbolo [ indica que el valor del lmite inferior est incluido.


El smbolo ) indica que el valor del lmite superior no est incluido.

4. Contar los elementos que corresponden a cada intervalo o clase.


El siguiente y ltimo paso es cuantificar los elementos del conjunto de datos que
corresponden a cada intervalo.
Entonces, la tabla de distribucin de frecuencias para nuestro ejemplo estara dada por:

Clase
[200 - 600)

[600 - 1000)

11

[1000 - 1400)

23

[1400 - 1800)

38

[1800 - 2200)

45

[2200 - 2600)

32

[2600 - 3000)

19

[3000 - 3400)

Total

GPARRALES

Frecuencia

180

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Con la tabla mostrada anteriormente, podemos afirmar lo siguiente:

Las ganancias por vehculo vendido oscilan entre $200 y $3400.


La mayor cantidad de vehculos vendidos proveen ganancias entre $1800 y $2200.

Tabla de Frecuencias Relativas.


Una vez obtenidas las frecuencias, podemos aadir las frecuencias relativas, las mismas que se
obtienen dividiendo cada una de las frecuencias para el total de datos observados, en nuestro
caso, n=180.

Clase

Frecuencia

Frec. Relativa

[200 - 600)

0,04

[600 - 1000)

11

0,06

[1000 - 1400)

23

0,13

[1400 - 1800)

38

0,21

[1800 - 2200)

45

0,25

[2200 - 2600)

32

0,18

[2600 - 3000)

19

0,11

[3000 - 3400)

0,02

180

Total

Esta tabla nos permite interpretar valores en funcin de porcentajes. Por ejemplo:

La mayor cantidad de vehculos vendidos proveen ganancias entre $1800 y $2200 y


representan el 25%.
Slo el 2% de las ganancias son obtenidas en los vehculos cuyas ganancias oscilan entre
$3000 y $3400.

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Representacin grfica de una Distribucin de Frecuencias.


Es frecuente representar una tabla de frecuencias a travs de un grfico, usualmente utilizando
un histograma. Lo cual efectuamos en un plano cartesiano, en el eje horizontal se representarn
los intervalos y en el eje vertical las frecuencias.
En la hoja de datos de Excel, definimos en una columna cualquiera los valores de los lmites
inferiores de cada clase, para nuestro ejemplo sera:

Podemos utilizar la herramienta Anlisis de datos que nos proporciona Excel en la pestaa
correspondiente a Datos en la cinta de opciones:

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Elegimos la opcin Histograma:

En Rango de entrada seleccionamos la matriz de datos.


En Rango de clases seleccionamos los valores de los lmites que previamente definimos.
Marcamos la opcin Crear grfico.

GPARRALES

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Como resultado obtendremos en una nueva hoja lo siguiente:


Frecuencia

200

600

1000

11

1400

23

1800

38

2200

45

2600

32

3000

19

3400

y
mayor...

Histograma
Frecuencia

Clase

50
40
30
20
10
0

38

45

23
0

32
19

11

Clase

Es una grfica lo ms cercana posible a un Histograma que se pueda realizar en Excel, dado que
la funcin Anlisis de datos no define los intervalos como nos gustara y por ende tampoco los
define correctamente en el eje horizontal de la grfica.

Polgono de Frecuencias.
El polgono de frecuencias al igual que el histograma es una representacin visual del conjunto
de datos y til sobre todo cuando se deben hacer comparaciones entre diferentes grupos de
datos.
Para graficar un polgono de frecuencias necesitamos calcular el punto medio de cada intervalo,
para ello utilizamos la siguiente formula:

Donde:
pm: punto medio de cada clase.
ls: lmite superior de cada intervalo.
li: lmite inferior de cada intervalo.

GPARRALES

10

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Efectuando los clculos mencionados:


Clase

Frecuencia

Frec. Relativa

Punto medio

[200 - 600)

0,04

[600 - 1000)

11

0,06

800

[1000 - 1400)

23

0,13

1200

[1400 - 1800)

38

0,21

1600

[1800 - 2200)

45

0,25

2000

[2200 - 2600)

32

0,18

2400

[2600 - 3000)

19

0,11

2800

[3000 - 3400)

0,02

3200

180

Total

400

Para realizar el polgono de frecuencias utilizamos los puntos medios en el eje horizontal y para
el eje vertical utilizamos las frecuencias.
Como propiedad relativa al polgono de frecuencias, este debe ser un polgono cerrado, para lo
cual aadimos valores ficticios a fin de cumplir con tal propiedad, por ello aumentamos dos
coordenadas: (0,0) y (3600,0).

Polgono de Frecuencias
50
45

45

40

38

35
32

30
25

23

20

19

15
11

10

GPARRALES

500

1000

1500

2000

2500

3000

3500

4000

11

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Ojivas.
Una ojiva representa grficamente la frecuencia acumulada de un conjunto de datos. Para
llevar a cabo una distribucin de frecuencias acumulativas se van sumando las frecuencias
relativas para cada intervalo.
Clase

Frecuencia

Frec. Relativa

Punto medio

F. R. Acumulada.

[200 - 600)

0,04

400

0,04

[600 - 1000)

11

0,06

800

0,10

[1000 - 1400)

23

0,13

1200

0,23

[1400 - 1800)

38

0,21

1600

0,44

[1800 - 2200)

45

0,25

2000

0,69

[2200 - 2600)

32

0,18

2400

0,87

[2600 - 3000)

19

0,11

2800

0,98

[3000 - 3400)

0,02

3200

1,00

180

Total

Para realizar la grfica, el eje horizontal va a estar formado por el lmite superior de cada clase
y el eje vertical contendr la Frecuencia Relativa acumulada correspondiente. Como propiedad
de la ojiva, sta debe empezar con un valor 0 en el eje vertical, para ello utilizamos un primer
par ordenado ficticio con las coordenadas (200,0).

Ojiva
1,2
1

0,98

1,00

0,87

0,8
0,69

0,6
0,44

0,4
0,23

0,2
0
200

GPARRALES

0,04

600

0,10

1000

1400

1800

2200

2600

3000

3400

12

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

La utilidad de este grfico es muy prctica, por ejemplo, podemos afirmar lo siguiente:
aproximadamente el 70% de las ganancias obtenidas fueron por ventas de vehculos cuyas
ganancias fueron hasta $2200.
En Excel se puede obtener la grfica utilizando la funcin Anlisis de datos marcando la opcin
Porcentaje acumulado en el procedimiento utilizado para construir el histograma.

Medidas de tendencia central y dispersin.


Las medidas de tendencia central nos sirven como puntos de referencia para describir cuales
son los valores centrales de un conjunto de datos. Para este ejercicio vamos a considerar tres
medidas: media, mediana y moda, tanto para grupos no agrupados (datos en bruto) como para
datos agrupados (tablas de frecuencia).

1. Media
La media aritmtica o tambin conocida como promedio, es la medida de ubicacin
ms conocida y utilizada. La denotaremos con la letra griega .
Para datos no agrupados, se obtiene sumando cada uno de los elementos del conjunto
de datos y dividiendo para el nmero de sumandos, es decir:

GPARRALES

13

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Donde:

: cada uno de los elementos del conjunto de datos.


: es el nmero de observaciones (cantidad de datos).
En nuestro ejemplo particular, utilizando la primera tabla:
=

1387 + 1754 + 1817 + 1040 + + 2434 + 1640 + 1821 + 2487


180

= .

Podemos utilizar Excel para determinar la media de un conjunto de datos a travs de la


siguiente funcin:
=PROMEDIO(Rango de datos)
Para datos agrupados, el clculo de la media es un poco ms complejo, utilizaremos la
siguiente frmula:
=1( )( )
=

Donde:

: es la frecuencia de cada clase.


: es el punto medio relativo a cada clase.
: es el nmero de observaciones (cantidad de datos).

Entonces para el conjunto de datos relacionados a Applewood Auto Group, tenemos:


Clase

Frecuencia

Punto medio

[200 - 600)

400

[600 - 1000)

11

800

[1000 - 1400)

23

1200

[1400 - 1800)

38

1600

[1800 - 2200)

45

2000

[2200 - 2600)

32

2400

[2600 - 3000)

19

2800

[3000 - 3400)

3200

Total

GPARRALES

180

14

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

(8)(400) + (11)(800) + (23)(1200) + (38)(1600) + (45)(2000) + (32)(2400) + (19)(2800) + (4)(3200)


180

333200
180

= .

2. Mediana
La mediana corresponde al valor del elemento central del conjunto de datos.
Para datos no agrupados simplemente procedemos a ordenar los datos y tomamos el
elemento que se encuentra en la mitad del conjunto, bajo la siguiente regla:
Si la cantidad de elementos es par , la mediana estar dada por el promedio de los

elementos que se encuentran en las posiciones +


Si la cantidad de elementos es impar, la mediana estar dada por el elemento que se
encuentra en la posicin

En nuestro ejemplo debemos promediar los elementos que se encuentran en las


posiciones:

+ =

Si buscamos las posiciones en el conjunto de datos ordenados, la posicin 90


corresponde al valor 1876 y la posicin 91 corresponde al valor 1889, entonces:

1876 + 1889
2

= .

Podemos utilizar Excel para determinar la mediana de un conjunto de datos a travs de


la siguiente funcin:
=MEDIANA(Rango de datos)

GPARRALES

15

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Para el clculo de la mediana de datos agrupados realizamos el siguiente


procedimiento:
a) Determinar la clase de la mediana.
Utilizamos la distribucin de frecuencias acumuladas para determinar en cual
intervalo se encuentra la mediana. Dado que la mediana se encuentra en las
posiciones 90 y 91 buscamos en la columna de frecuencia acumulada el valor
que contenga dichas posiciones:
Clase

Frecuencia

F. Acumulada

[200 - 600)

[600 - 1000)

11

19

[1000 - 1400)

23

42

[1400 - 1800)

38

80

[1800 - 2200)

45

125

[2200 - 2600)

32

157

[2600 - 3000)

19

176

[3000 - 3400)

180

Total

180

b) Determinar el nmero de elemento que representa la mediana.


Dado que existen dos valores que conforman la mediana (posicin 90 y 91)
entonces tenemos que determinar esos dos elementos para los datos
agrupados.
Elemento 1:
(Posicin Mediana F. Acumulada del intervalo anterior a la clase de la
mediana)
90 80 = 10
Entonces el elemento nmero 90 es la observacin nmero 10 de la clase de la
mediana [1800 - 2200]
Elemento 2:
(Posicin Mediana F. Acumulada del intervalo anterior a la clase de la
mediana)
91 80 = 11

GPARRALES

16

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Entonces el elemento nmero 91 es la observacin nmero 11 de la clase de la


mediana [1800 - 2200]
c) Determinar el ancho de los pasos iguales en la clase de la mediana.
Para calcular el ancho de los 45 (frecuencia de la clase de la mediana) pasos
iguales desde 1800 hasta 2200 procedemos de la siguiente manera:



400
=
= 8.889

45
Por tanto, el ancho de cada paso es de 0.694
d) Determinar el valor estimado de la mediana.
Si existen 45 pasos de 8.889 cada uno y se necesitan 9 pasos para llegar al
elemento nmero 10, entonces:
(8.889 x 9) + 1800 =1880.001
Luego el elemento nmero 11 estar un paso ms adelante:
1880.001 + 8.889 = 1888.89
Dado que la mediana real de este conjunto de datos es el promedio de los
elementos 90 y 91, entonces:
. + .
.
=
= .

Por tanto, la mediana estimada de este grupo de datos es: 1884.4455


3. Moda
La moda es el valor que se repite con mayor frecuencia en un conjunto de datos.
Pueden existir ms de una moda y en ese caso se dice que el conjunto de datos es
multimodal.
Para nuestro ejemplo, existen dos valores que se repiten dos veces cada uno, por
tanto, existen dos modas en el grupo de datos:
Moda 1 = 1761
Moda 2 = 1915
GPARRALES

17

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

4. Varianza y Desviacin estndar


Para datos no agrupados, la varianza poblacional se puede calcular de la siguiente
manera:
=

=( )

Donde:
: es la media poblacional.
: cada uno de los elementos de la poblacin.
: cantidad de elementos de la poblacin.
Entonces, para calcular la varianza de los datos de Applewood Auto Group:

2 =

= ( . )

(1387 1843.267)2 + (1754 1843.267)2 + + (1821 1843.267)2 + (2487 1843.267)2


180

= .

En Excel se puede utilizar la siguiente funcin para determinar la varianza:


=VAR.P(Rango de datos)

La desviacin estndar es la raz cuadrada de la varianza. Por tanto:


= .

En Excel se puede utilizar la siguiente funcin para determinar la desviacin estndar:


=DESVEST.P(Rango de datos)

GPARRALES

18

www. practicaestadisticas.blogspot.com | 0980700611 | Guayaquil - Ecuador

Para datos agrupados, la varianza poblacional se puede calcular de la siguiente manera:


=

=( )( )

Donde:
K: es el nmero de intervalos.
: es la frecuencia del intervalo correspondiente.
: es el punto medio del intervalo correspondiente.
: es la media poblacional.
N: tamao de la poblacin.

Utilizando la tabla de datos ordenados de nuestro ejemplo, tenemos:

()( . ) + ()( . ) + + ()( . ) + ()( . )

2 =

76169780
180

= .

= .

GPARRALES

19

Вам также может понравиться