Вы находитесь на странице: 1из 12

Sumario:

Descripcin de datos:
Tablas y distribuciones de frecuencias.
Medidas numricas: Media, Mediana y Moda.
Medidas de dispersin.
Presentacin y anlisis de datos:
Diagrama de puntos.
Diagrama de tallo y hojas.
Diagrama de puntos
Los diagramas de puntos agrupan los datos lo menos posible y evita la
prdida de identidad de cada observacin. Para crear un diagrama de puntos
se coloca un punto que representa a cada observacin a lo largo de una recta
numrica horizontal, lo cual indica los valores posibles de los datos. Si hay
observaciones idnticas o las observaciones se encuentran muy prximas, los
puntos se apilan uno sobre otro para que puedan verse de manera individual.
Esto permite distinguir la forma de la distribucin, el valor en torno al cual
tienden a acumularse los datos y las observaciones mxima y mnima. Los
diagramas de puntos son ms tiles en el caso de conjunto de datos pequeos,
mientras que los histogramas lo son para conjuntos grandes de datos.
Considere el siguiente diagrama.

Ilustracin 1 Diagrama de puntos

En el diagrama de puntos no se pierde la identidad de cada observacin,


ejemplo si son llamadas telefnicas.
Porque recibe el nombre de Diagrama de puntos?
Recibe el nombre de diagrama de puntos porque:
Agrupa datos pequeos.
No pierde la identidad de la informacin.
Cuantas observaciones hay en el estudio?
Existen 15 observaciones o valores (puntos).

Cuantos datos tenemos?


Existen 7 datos.
Cules son los valores mximo y mnimo?
Mximo 7, mnimo 1.
En torno a que datos tienden a acumularse las observaciones?
En los datos 2 y 3 se acumulan o apilan las observaciones.
En el siguiente diagrama de puntos muestra el nmero de empleados en
cada una de las 142 tiendas de Home S.A. ubicadas al sureste de la provincia
del guayas.
Grafico de puntos

Tiendas /Observaciones

79

84

89

94

99

104

Indicador estadstico.
106
=0.746 100=74.6
146
Diagrama de tallo y hojas
Es una tcnica que se utiliza para representar informacin cuantitativa
en forma condensada. Una ventaja de este diagrama sobre la distribucin de
frecuencias, consiste en que no se pierde la identidad de cada observacin.
Ejercicio 01
Cantidad de espacios publicitarios
comprados
90 100

Frecuencias
7

En el ejemplo anterior no se conoce la identidad de los valores entre 90


y 100, no me da mayor detalle pues el 7 no me dice nada.

Suponga que las 7 observaciones entre 90 y 100 son: 96, 94, 93, 94, 95,
96, 97, la frecuencia solamente suma el numero de eventualidades es decir son
7 datos solo muestra 7 de frecuencia, el diagrama de tallo y hojas detalla los
valores dentro de estas frecuencias.
El valor de tallo es el primer numero principal, el valor de hoja son los
dems numeros.
Valor de tallo: 9
Valor de hoja: 6, 4, 3, 4, 5, 6, 7
93 4 4 5 6 6 7

Cuantos nmeros de espacios comprados hay entre 93 y 97?


5 espacios.
La primera fila del diagrama de tallo y hojas es la siguiente.
621 3 27 9

Cul es el posible rango de los valores de esta fila?


Mximo 629, mnimo 620

Cuntos valores de datos hay en esta fila?


5 valores de datos.

Haga una lista de los valores reales de esta fila de datos.


621, 623, 622, 627, 629.

Ejercicio 02
El siguiente diagrama de tallo de hojas, donde muestra el nmero de
unidades producidas por da en una fbrica.
1
1
2
9
<7>
9
7
2

3
4
5
6
7
8
9
10

8
6
0
0
5
0
3

1 3 3 5 9
2 3 6 7 8
9
0 1 5 6
6

En un da entre los valores que se producen en un da se realizan 8


producciones (unidades) al da.

Cuntos das hay en el proceso de produccin?


Cada valor es un da (8) es un da (6) es otro da, en total son 25 das.

Cuntas observaciones hay en la primera clase?


Son 38 observaciones, es decir 3 es el tallo y 8 es la hoja.

Cul es el valor mnimo y el valor mximo?


38 (3 | 8) y 106 (10 | 6)

Elabore una lista de los valores reales de la cuarta fila.


60, 61, 63, 63, 65, 65, 69.

Elabore una lista de los valores reales de la segunda fila.


Solamente est el tallo solamente el 4, no existen valores en la hoja.

Cuntos valores son menores que 70?


Son 9 valores.

Cuntos valores son iguales a 80 0 ms?


Son 9 valores.

Cul es la mediana?
Para conocer la mediana se usan los valores del tallo, lo que puede ser
entre 7 6 o 6 7 (6.5).

Cuntos valores hay entre 60 y 89 inclusive?


Son 16 valores.

OTRAS MEDIDAS DE POSICIN


Un mtodo consiste en determinar la ubicacin de los valores que dividen un
conjunto de observaciones en partes iguales. Estas medidas incluyen en:
-Cuartiles
-Deciles
-Percentiles
CUARTILES: Dividen a un conjunto de observaciones en 4 partes iguales.

DECILES: Dividen a un conjunto de observaciones en 10 partes iguales.

PERCENTILES: Hablamos de la unidad de porcentaje que es el 100% de las


observaciones.

Nota: El cuartil no viene en frmula sino en relacin de elementos variables.


A continuacin aparecen las comisiones que gan el ltimo mes una muestra
de quince corredores burstiles.
$1460 $1471 $1637 $1721 $1758 $1787 $1940 $2038
$2047 $2054 $2097 $2205 $2287 $2311 $2406
1er Paso: Ordenar:
Hallar la Mediana: $2038
P
25
Primer Cuartil: Ln=( n+1 ) 100 : L25=( 15+1 ) 100 : L n=( 16 ) 0.25=4
Tercer Cuartil:
75
L75=( 15+1 )
; L =12 ; L75=$ 2.205
100 75
La Empresa GASA S.A es un distribuidor de generadores S.A. Como en
cualquier negocio el tiempo que emplea los clientes para pagar sus recibos es
importante. En la sgte lista, en orden de menor a mayor aparece el tiempo en
das, de una muestra de facturas de GAS S.A.

1. Halle el 1er y 3er Cuartil

34 31= 3
3 x 0.75= 2.25
31+2.25= 33.25 1er Cuartil
El 25% de las facturas se realizan en menos de
33.25 das de pago.
3=23,25 Posicin
L75 o Q
50 51= 1
1 x 0.25= 0,25
50+0.25= 50,25 3er Cuartil
El 75% de las facturas se efectuaron en menos de
50.25% das para pagar servicio de GAS.
Sacar un Decil
2
2
D2=( n+1 ) : D2=( 10+1 ) : D 2=2,2
10
10
27 y 31(31-27) = 4
4 x 0,20= 0,80
0,80+27= 27,80
Se concluye que el 20% de las facturas en menos 27.80 das Y el 80% se ubica
en 27.80 das.
8
D8=( n+ 1 ) ; D8= (10+ 1 ) 0,80 ; D8=8,8
10
5 y 3= 2
2 x 0,80= 1,60
51+160= 52,60
Se concluye que el 20% de las facturas en menos 52,60 das. Y el 20% se
ubica en 52,60 das.
Determine el 67avo
67
P67=( 30+1)
100
P67=20.77
El 67% de las facturas se ubican en posicin de 20.77 das y el negocio factur
a menos de 47 das y el 33% mayor a 47 das.
Medidas de Posicion
Diagrama de Caja

Es una representacin bsica basada en cuartiles, que ayuda a presentar un


conjunto de datos. Para construir un diagrama de caja solo necesita 5
estadsticos:
1. Es el valor mnimo,
2. El primer cuartil,
3. La mediana,
4. Tercer cuartil,
5. El valor mximo.
Pizza S.A. realiza entregas gratuitas de su producto a 15 millas a la
redonda, Pablo, el propietario, desea informacin relacionada con la entrega.
Cunto tiempo tarda una entrega tpica? Este margen de tiempo debe
completarse la mayora de las entregas. En el caso de la muestra de 20
entregas, Pablo recopilo la siguiente informacin.
Valor mnimo
L25 Q1

13 minutos
15 minutos

Mediana
L75 Q3

18 minutos.
22 minutos.

Valor mximo

30 minutos.

El rango inter cuartilico viene de la diferencia entre Q1 y Q2, 22 15 es


decir el rango intercuartlico es de 7 minutos.
El 50% de los valores se encuentra en ese rango inter cuartlico, es decir
entre 15 y 22 minutos.
El sesgo es positivo cuando la cantidad de valores de Q3 y el mximo
hay mayor cantidad de observaciones que el Q2 y el mnimo o cuando la
mediana est ms cerca de Q1.

Una empresa tiene registrada la edad mediana de los compradores en 46 aos;


25% tena menos de 40 aos de edad y 25% ms de 52.75 aos.
Basndose en una informacin resumida se puede concluir lo sgte 50% estn
entre los 40 y los 52.75 aos
La contribucin de edades es simtrica existe dos razones para esta
conclusin. La longitud del vigote x encima de 52.75 aos (Q3) Tiene
aproximadamente el mismo ao que el vigote q est x debajo de los 40 aos
(Q1), as mismo, el rea de la caja entre los 40 aos y la mediana de 46 aos
es ms o menos la misma que el rea entre la mediana y los 52.5 aos.
Hay 3 asteriscos por encima de los 70 aos.

DATO ATIPICO: Es un valor que no concuerda con el resto de los datos. Se


define como un valor ms de 1.5 veces la amplitud de rango intercuartil ms
pequeo que Q1, o mayor que Q3.
Dato Atpico >Q1+1,50(Q3-Q1)
Dato
Atpico
>Q3+1,50(Q3-Q1)
40-1,50(52.75-40)
52.75+1.50
(52.75-40)
Dato Atpico 20.875 Aos
Dato Atpico
>=71.875 aos
Con base a estos datos presentados se concluye que hubo compradores
mayores a 72 aos y ninguno menor de 21 aos.
OTRA MEDIDA DE POSICIN: SESGO

Sesgo Simtrico: En un conjunto simtrico de observaciones la media, moda y


la mediana son iguales.
Un conjunto de valores sesgado a la derecha o positivamente sesgado si existe
un solo pico y los valores se extienden mucho ms all a la derecha del pico y
a la izquierda de este.
Una distribucin Bimodal tendr 2 o ms picos con frecuencia este es el caso
cuando los valores provienen de dos o ms poblaciones.
Medidas de posicin
SESGO
Coeficiente de Pearson
3 ( x mediana )
SK =
S
Pearson dijo: el 99.9 de los datos se encuentra en desviacin estndar a la
derecha y el 99.9 de los datos se encuentran en desviacin estndar a la
izquierda, es decir abarca la mayor parte de los datos.
De acuerdo con esta expresin, el sesgo puede variar de -3 a 3. Un valor
prximo a -3 como -2.57 indica un sesgo negativo considerable. Un valor como
1.63 indica un sesgo positivo moderado. Un valor de 0 ocurre cuando la media
y la mediana son iguales, indica que la distribucin es simtrica y no se
presenta ningn sesgo.
Esta consideracin permite comprender una o la idea del sesgo, esta idea
recibe el nombre de estandarizacin, observe que el resultado consiste en la
diferencia entre cada valor y la media en unidades de desviacin estndar. Si la
diferencia es positiva, el valor particular es ms grande que la media; si la
variacin es negativa, la cantidad estandarizada es menor que la media.
Cuando lo eleva al cubo estos valores, conserva la informacin relativa a la
diferencia.
Si el conjunto de valores de datos es simtrico, al elevar al cubo los valores
estandarizados y sumar todos los valores, el resultado se aproximara a cero.
Si varios valores grandes claramente separados unos de otros, la suma de las
diferencias al cubo sera un valor positivo grande. Valores mucho menores dan
como resultado una suma al cubo negativa.
Coeficiente de sesgo con software
SK =

n
(n1)( n2)

( xS x )

UPA: Utilidad por Accin.


Ejemplo:
Enseguida aparecen las utilidades por accin que obtuvo una muestra de 15
compaas de software durante el ao 2014. Las utilidades por accin se
encuentran ordenadas de menor a mayor.

0,09
3,18
16,40

0,13
3,50

0,41
6,36

0,51
7,83

1,12
8,92

1,20
10,13

1,49
12,99

Calcule la media, la mediana y la desviacin estndar. Determine el coeficiente


de sesgo utilizando los dos mtodos que concluye respecto de la frmula de la
distribucin.
1. Media aritmtica:

x =

74.26
=4.95
15

Si decimos que el promedio de la industria es 6, podemos decir que la media


aritmtica puede darse por problemas comerciales, poco rendimientos
comerciales.
2. Mediana
0,09
0,13
0,41
0,51
1,12
1,20
1,49
3,18
3,50
6,36
7,83
8,92
10,13
12,99
16,40
3. Moda: no se repiten valores.

16,40
12,99
10,13
8,92
7,83
6,36
3,50
3,18
1,49
1,20
1,12
0,51
0,41
0,13
0,09

4. Desviacin estndar: Para hallar a la desviacin estndar de los datos


vamos a utilizar una muestra de los datos con la frmula de desviacin
estndar.

S=

( xx )2
n1

( 0.094.95 )2 + ( 1.204.95 )2+ ( 1.494.95 )2+ ( 0.514.95 )2+

151

S=

( 1.124.95 )2+ ( 0.134.95 )2+ ( 0.414.95 )2+ ( 3.184.95 )2 +

151

( 3.504.95 )2 + ( 6.364.95 )2 + ( 7.834.95 )2+ ( 8.924.95 )2+

151

( 10.134.95 ) + ( 12.994.95 ) + ( 16.404.95 )


=5.22UPA
151

Digamos que 8 es el valor de la industria entonces 5.22 / 8 vendra a ser


0,6525 lo que quiere decir que me acerco a 1 que no es malo pero tampoco es
bueno lo ideal es que el resultado sea 1.
5. Coeficiente de Pearson
SK =

3 ( 4.953.18 )
=1.017
5.22

Esto indica que existe un sesgo positivo moderado en los datos de las
utilidades por accin (UPA).
6. Coeficiente de sesgo
n
SK =
(n1)( n2)

[ ( ) ]
x x
S

0.094.95 3
=0.93103 =0.8070
5.22

El total de esos valores es la primera parte del grafico que se multiplica por.
15
(151)(152)

Вам также может понравиться