Академический Документы
Профессиональный Документы
Культура Документы
20
15
10
0
11
12
14
16
17
19
I.
1.1
Introduccin ................................................................................................................................... 4
1.2
1.3
1.4
1.5
1.6
Definiciones bsicas.................................................................................................................... 8
1.7
A.
B.
C.
II.
2.1.
A.
B.
C.
D.
2.2.
A.
B.
D.
2.3.
E.
F.
Grficos Estadsticos............................................................................................................................ 72
Clasificacin De Los Grficos ............................................................................................................. 72
CAPITULO Medidas de Resumen .............................................................................................. 87
III.
3.1
3.2
3.3
3.3.1
1.
3.
5.
IV.
4.1.
A.
B.
C.
D.
V.
5.1.
A.
B.
C.
D.
E.
VI.
VII.
A.
B.
C.
D.
E.
CAPITULO Qu es la Estadstica?
1.1 Introduccin
La importancia de la estadstica en la actualidad, no se pone en discusin. Casi
todos los programas profesionales universitarios incluyen en su currculo, al menos
un curso de estadstica. En muchos pases, inclusive en el Per, la estadstica forma
parte del currculo de la educacin secundaria e inclusive se incluyen algunos
tpicos en la educacin primaria.
La dinmica del mundo moderno, exige que todo ciudadano, para ejercer sus
derechos y comprender su entorno, requiera de una alfabetizacin en estadstica.
1.2
Le parece a usted que podramos definir a la estadstica como la ciencia que nos
proporciona los elementos de juicio necesarios para llegar a tomar decisiones
adecuadas?, si est de acuerdo reflexione sobre las razones que le llevan a estarlo;
si no lo est tambin reflexione sobre la definicin adecuada y regrese al texto para
constatarlo.
La segunda razn para tomar el curso de Estadstica es que las tcnicas estadsticas se utilizan para tomar decisiones que afectan nuestra vida diaria. Esto quiere
decir que afectan a nuestro bienestar personal. He aqu algunos ejemplos:
Las compaas de seguros utilizan anlisis estadsticos para establecer las tarifas
de los seguros de casa, automvil, vida y salud. Existen tablas que resumen la
probabilidad de que una mujer de 25 aos de edad viva el ao siguiente, los siguientes cinco aos, etc. Las primas del seguro de vida se pueden establecer
basndose en estas probabilidades.
La Agencia de Proteccin al Medio Ambiente est interesada en la calidad del
agua en el Lago Ene. Peridicamente toman muestras de agua para establecer el
nivel de contaminacin y mantener el nivel de calidad.
Los investigadores mdicos estudian las tasas de cura de enfermedades, basndose en el uso de diferentes medicamentos y distintas formas de tratamiento. Por
ejemplo, cul es el efecto de tratar cierto tipo de dao a la rodilla con ciruga o
con terapia fsica? Si se toma una aspirina diaria, se reducir el riesgo de sufrir un
ataque cardiaco?
Figura N 01
MUESTRA (n)
Muestreo
Inferencia
Figura N 02
8 Mg. Miguel Angel Macetas Hernndez
Variable
Rendimiento acadmico
Valores o atributo
12, 14, 17, 20
Genero
Masculino, femenino
Calidad
de
atencin
de
restaurante
Peso de alumnos
Nmero de hijos
1, 2, 3,
b) Variables Cuantitativas.
Gnero:
Femenino
Masculino
SI
NO
NO
No sabe
tiene algn atributo verdadero, A (x). Entonces, para cualquier par de atributos en
el conjunto
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
Operaciones Admisibles
Ya que en una escala nominal la clasificacin puede estar igualmente bien
representada por cualquier conjunto de smbolos, se dice que la escala nominal
es "nica hasta una transformacin de uno a uno". Los smbolos que designan las
variadas subclases en la escala pueden ser intercambiados si esto se hace de
manera cabal y consistentemente. Por ejemplo:
Cuando se emiten nuevas placas para automviles, el cdigo que previamente
perteneca a una ciudad puede ser intercambiado con el de otra ciudad. La
escala nominal podra preservarse si este cambio se ejecutara cabal y
consistentemente en la emisin de todas las placas.
Ya que los smbolos que designan los variados grupos de una escala nominal
pueden ser intercambiados sin alterar la informacin esencial en la escala, el
nico tipo de estadsticos descriptivos admisibles son aquellos que pueden ser
12 Mg. Miguel Angel Macetas Hernndez
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
c) La escala de Intervalo
Cuando una escala tiene todas las caractersticas de una escala ordinal y cuando
adems tienen sentido las distancias o diferencias entre cualesquiera dos
nmeros de la escala, se ha logrado una medicin considerablemente ms fuerte
que la ordinal. En tal caso, la medicin ha sido lograda en el sentido de una
escala de intervalo. Esto es, si nuestro mapeo de varias clases de objetos es tan
preciso que conocemos cun grandes son los intervalos (distancias) entre todos
los objetos de la escala, y estos intervalos tienen significado sustantivo, entonces
hemos logrado una medida de intervalo. Una escala de intervalo est
caracterizada por una unidad comn y constante de medida que asigna un
nmero a todos los pares de objetos en el orden establecido. En esta clase de
medicin, la razn de cualesquiera dos intervalos es independiente de la unidad
de medida y del punto cero. En la escala de intervalo, el punto cero y la unidad de
medida son arbitrarios. Por ejemplo
Medimos la temperatura en una escala de intervalo. De hecho, comnmente se
usan dos diferentes escalas: Celsius y Fahrenheit. Al medir la temperatura, la
unidad de medida y el punto cero son arbitrarios; son diferentes en ambas
escalas. Sin embargo, las dos escalas contienen la misma cantidad y la misma
clase de informacin. Esto es as debido a que estn linealmente relacionadas.
15 Mg. Miguel Angel Macetas Hernndez
Donde
F = nmero de grados en la escala Fahrenheit
C = nmero de grados en la escala Celsius
Se puede mostrar que las razones de las diferencias de temperatura (intervalos)
son independientes de la unidad de medida y del punto cero. Por ejemplo, el
punto de "congelacin" ocurre en 0 en la escala Celsius, y el punto de "ebullicin" ocurre en los 100. En la escala Fahrenheit, la "congelacin" ocurre en los
32 y la "ebullicin" en 212. Algunas otras lecturas de la misma temperatura en
las dos escalas son las siguientes:
Celsius
18
Fahrenheit
10
30
100
32
50
86
212
Ntese que la razn de las diferencias entre las lecturas de temperatura en una
escala, es igual a la razn entre las diferencias equivalentes en la otra escala. Por
ejemplo,
En la escala Celsius la razn de las diferencias entre 30 y 10, y 10 y 0 es (30
10) / (10 0) = 2. Para las lecturas comparables en la escala Fahrenheit, la
razn es (86 50) / (50 32) = 2. En ambos casos las razones son las
mismas; a saber, 2. En otras palabras, en una escala de intervalo, la razn de
cualesquiera dos intervalos es independiente de la unidad usada y del punto
cero, siendo ambos arbitrarios.
verdaderos de los objetos existen en alguna relacin unos con otros, adems de
sus equivalencias dentro de las categoras. Esto es:
( )
( )
( )
( )
( )
( ))
Entonces, una escala de intervalo es un sistema clasificatorio de los objetos L (x)
que tienen las propiedades de una escala ordinal y, adems
( )
( )
Ntese que en este caso, la diferencia entre los atributos de los dos objetos es
proporcional a la diferencia entre las asignaciones de clasificacin:
( )
( )
( )
( )
. (En el ejemplo de la
Ya hemos notado que en una escala de intervalo el punto cero es arbitrario. Esto
es inherente al hecho de que la escala est sujeta a transformaciones que
consisten en agregar una constante a los nmeros que constituyen la escala.
d) La escala de razn
Cuando una escala tiene todas las caractersticas de una escala de intervalo y,
adems, tiene un punto cero verdadero en su origen, se llama escala de razn.
En una escala de razn, la razn de cualesquiera dos puntos es independiente de
la unidad de medida. Por ejemplo
Medimos la masa o el peso en una escala de razn. La escala de onzas y libras
tiene un punto cero verdadero, al igual que la escala de gramos. La razn entre
los
contraejemplos
abundan.
Consideramos
dos.
Notamos
verdadero de los objetos existe con alguna relacin entre cada uno de ellos,
adems de la equivalencia dentro de las categoras. Esto es
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
y la razn de las clasificaciones asignadas es igual a la razn de los atributos
verdaderos.
Operaciones Admisibles
Los nmeros asociados con los valores de la escala de razn son nmeros "verdaderos" con un cero verdadero: slo la unidad de medida es arbitraria. As, la escala de razn es nica hasta la multiplicacin por una constante positiva. Esto es,
las razones entre cualesquiera dos nmeros se preservan cuando los valores de
la escala son todos multiplicados por una constante positiva y, adems, tal
transformacin no altera la informacin contenida en la escala.
Cualquier prueba estadstica paramtrica puede usarse cuando se han logrado
medidas de razn y se encuentran las suposiciones adicionales concernientes a
la distribucin. Ms an, existen algunos estadsticos que se aplican slo a datos
que descansan en una escala de razn; debido a la fuerza de las suposiciones
que sub- yacen a la escala, la mayora de estas pruebas son pararntricas.
Variables Categricas
Variables numricas
Naturaleza
CUALITATIVAS
CUANTITATIVAS
Escala
Atributos de la
escala
Orden
Caracterstica
Posee
categoras
ordenadas,
pero
no
permite
cuantificar
la
distancia
entre
una
categora y otra.
Ejemplos
Gnero
Masculino
Valor Final
Observaciones
Femenino
Estado Civil
Instruccin
Intensidad
Soltero
Primaria
Leve
Casado
Secundaria
Conviviente
Superior
Distancia
Origen
Hora del da
Distancia
Origen
Tiene
intervalos
constantes entre valores;
adems de un origen real.
El
cero
significa
la
ausencia de la variable.
Peso.
Hijos
-10 C
00 Horas
00.00 Kg
Uno
Moderado
0C
10 Horas
10.24 Kg
Dos
Severo
20 C
20 Horas
20.00 Kg
Tres
b)
c)
Categoras:
01) Sol tero (a).
02) Casado (a).
03) Conviviente.
04) Viudo (a).
05) Divorciado (a).
06) Separado (a).
d)
e)
Medidas de Porcentajes
Resumen Tasa de nupcialidad que indica la frecuencia de matrimonios, etc.
Ejemplo 2:
a) Nombre : Ingresos
b) Definicin Son los recursos monetarios
: Ingreso promedio.
Dispersin de los ingresos. etc.
.
XN = dato de la N sima observacin
C. Cuadros estadsticos
En una investigacin, despus que los datos han sido recogidos, revisados y
almacenados en una base de datos, se procede a la presentacin de los
resultados en forma tabular o grfica y al anlisis estadstico de la informacin.
La facilidad de su construccin y el rpido efecto en la transmisin de los
contenidos, han hecho de los cuadros estadsticos los recursos idneos para la
24 Mg. Miguel Angel Macetas Hernndez
2. Ttulo.
3. Encabezamiento o conceptos.
8. Elaboracin.
QUE
DONDE
COMO
CUANDO
Es el cdigo o elemento de
identificacin que permite
ubicar el cuadro en el interior
de un documento
Que
CAJAMARCA: POR NIVEL EDUCATIVO SEGN RAMAS DE ACTIVIDAD. CENSO DE POBLACIN 2009
Donde
Cuando
Expresa en qu unidades
estn las variables
Como
7
(Distribucin porcentual)
Ramas de Actividad
PEA de
15 aos
y ms
TOTAL
N i v e l d e Educacin
Sin
Nivel*
Primaria
Secundaria
Sup. No
Univer.
Superior
No Especificado
Univer.
100,0
5,89
42,11
35,87
5,67
8,66
1,80
100,0
14,97
64,05
15,59
0,70
1,30
3,40
100,0
0,75
41,13
39,59
5,79
12,63
0,11
3. Industrias Manufactureras.
100,0
3,60
43,57
41,60
2,94
6,70
1,59
100,0
0,00
21,95
48,29
8,29
20,49
0,98
5. Construccin.
100,0
4,78
64,36
24,99
1,05
3,54
1,28
100,0
6,95
45,04
39,66
2,06
4,39
1,91
100,0
1,34
45,18
46,87
2,28
3,15
1,18
100,0
0,64
11,60
48,71
9,28
29,25
0,52
100,0
2,10
26,56
43,35
11,46
15,22
1,30
100,0
9,35
44,70
34,99
3,55
4,97
2,43
100,0
1,94
25,75
56,97
6,70
7,94
0,71
7. Transportes, Almacenamiento y
Comunicaciones.
8. Establecimientos Financieros,
Seguros, Bienes Inmuebles y
Servicios a las Empresas
9. Servicios Comunales, Sociales y
Personales.
4
Es el
contenido
numrico
del cuadro
Porcentaje de
Pacientes
( hi % )
5.5
18.2
20.0
23.6
18.2
14.5
100.0
E. Caractersticas:
1. La cuadro estadstica debe ser lo ms simple posible.
2. Si se utilizan smbolos, abreviaturas, etc., deben explicarse detalladamente en
notas de pie de pgina.
3. Deben ser incluidas las unidades especficas de medida que corresponden a los
datos.
4. Debern consignarse los totales.
5. Si los datos no son originales debe quedar explcita la fuente de donde se ha
tomado.
6. Cuando se utilizan escalas cualitativas hay que tener cuidado si se desea
comparar datos de una cuadro con otra, ya que en los criterios de clasificacin de
la variable puede que el entendimiento nuestro de un concepto no coincida
totalmente con el de otro investigador.
7. Una cuadro estadstica puede ser completada con las frecuencias acumuladas,
frecuencias relativas (porcentajes, promedios o razones), etc.
F. Tipos de cuadros.
En su forma ms general los cuadros pueden dividirse en simples y
compuestas.
a) Cuadros Simples. Clasifican un fenmeno segn una nica variable. Ejemplo
27 Mg. Miguel Angel Macetas Hernndez
T O T A L
Reaccin positiva
76
72
148
Reaccin negativa
120
20
140
T O T A L
196
92
288
2.
5y
+
T O T A L
19
24
29
34
39
44
49
a l
CUADRO 07
PERSONAS CON TBC SEGN EDAD, CONDICIN LABORAL Y SEXO - DISTRITO DE
CAJAMARCA - 2007
EDAD
TRABAJADORES
NO TRABAJADORES
T O T A L
Hombr Mujere
Hombr Mujere
Hombr Mujer
Total
Total
Total
es
s
es
s
es
es
15 19
20 24
25 29
.
.
.
50 54
55 59
60 +
TOTAL
29 Mg. Miguel Angel Macetas Hernndez
hi
ni
CUADRO N 7.8
NUMERO DE NACIMIENTOS EN EL DEPARTAMENTO DE LAMBAYEQUE,
POR PROVINCIAS 2004
Nmero de
Provincias
Porcentaje de Nacimientos
Nacimientos
Lambayeque
n1 = 325
Chiclayo
n2 =330
Ferreafe
n3 = 289
Total
n = 944
n1 325x100
34,43
n
944
n
330x100 35,96
h2 2
n
944
n
289x100 30,61
h3 3
n
944
h1
100,00
Categora
Aire acondicionado
Guardera
Oferta permanente
Park ing amplio
Tarjeta de crdito
Guardera
14.3%
Oferta permanente
22.9%
10
Conteo
6
5
4
Parking amplio
Razn de visita
Guardera
Aire acondicionado
12
11
10
Conteo
8
6
5
4
2
0
1
Nmero de hijos
335
587
613
400
424
466
565
393
453 650
407
376
470
560
321
500
528
526
570 430
618
537
409
600
550
432
591
428
440 340
558
460
560
607
382
667
512
492
450 530
501
471
660
470
364
634
580
450
574 509
462
380
518
480
625
507
645
382
Datos:
n =60 trabajadores
a) Raz cuadrada
b) Regla de Sturges m =
1 + 3.322 Log(n)
1 + 3.322 Log(60)
7 intervalos
c) Regla de Stockes
( )
( )
ci
49,4285.......
m
7
Se puede redondear a 50
4. Construir los intervalos. Como Ci = 50, el recorrido se divide en 7 intervalos o
segmentos, cuyo extremos son:
I1
320
370
I2
I3
420
I4
470
I5
520
I6
570
I7
620
670
y4
y7
47 Mg. Miguel Angel Macetas Hernndez
470 520
495
2
620 670
645
2
c) Frecuencia
absoluta
acumulada
(Ni):
ni
n
Se
denomina
frecuencia
absoluta
Ni
.
N
suma de las frecuencias absolutas sin acumular es igual al nmero total de los (
,= N)
Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
Frecuencias
Relativas
Frecuencias Relativas
Acumuladas
Li]
xi
ni
Ni
hi
Hi
<L 1 L 2 ]
x1
n1
Intervalos
de clases
<Li-1
<L2, L3]
<L3, L4]
x2
x3
n2
n3
N1=n1
h1=
N2 = n1+n2
N3 =n1+n2+n3
.
.
.
.
.
.
.
.
.
.
.
.
<Lk-1, L k]
xk
nK
Nk = n1+...+nK=n
Total
ni =n
n1
N
n
h2=
H2=
H3=
N
N
.
.
.
hk =
N1
N
n
h3=
H1=
.
.
.
nk
Hk =
Nk
=1.00
hi =1
(0)
()
Informe no disponible.
1 + 3.322 Log(n)
1 + 3.322 Log(60)= 6.907
=1+3.322*LOG(CONTAR(A2:A61))
Para
redondear
un
entero
=MULTIPLO.SUPERIOR(D7,1)
50 Mg. Miguel Angel Macetas Hernndez
superior
se
utiliza
la
siguiente
funcin
7 intervalos
ci
49,4285.......
m
7
320
I2
370
I3
420
I4
470
I5
I6
I7
520
570
620
670
lmite superior
Figura:
Frecuencia
Absolutas
Li>
ni
n1
N1=n1
[L2, L3>
n2
N2 = n1+n2
[L3, L4>
n3
N3 =n1+n2+n3
.
.
.
.
.
.
.
.
.
Lk-1, L k>
nK
Nk = n1+...+nK=n
Total
Frecuencias
Absolutas
Acumuladas
Ni
ni =n
Li>
L1 = L1 +IC = 48.4>
L2 = 66.8>
L3 = 85.2>
L4 = 103.6>
L5 = 122.0>
L7 = 140.4>
= 48.4
= 66.8
= 85.2
= 103.6
= 122.0
Li>
Frecuencia Frecuencia
absoluta ni relativa hi %
Frecuencia
acumulada
absoluta Ni
Frecuencia
acumulada
relativa Hi %
[ 30.0 48.4>
[ 48.4 66.8>
[ 66.8 85.2>
[ 85.2 103.6>
[103.6 122.0>
2
8
10
7
5
5.71
22.86
28.57
20.00
14.29
2
10
20
27
32
5.71
28.57
57.14
77.14
91.43
[122.0 140.4]
8.57
35
100.00
Figura N
24: Cuentas de variables individuales
Porcentaje
20
15
10
30
45
60
75
90
Gasto semanal
105
120
135
Amplitud del
intervalo
Observacin
Mnima
Observacin
Mxima
Porcentaje
20
15
10
5
0
30.0
48.4
66.8
85.2
103.6
Gasto semanal
122.0
140.4
Frec. Rela
h = 0.00
Frec. Rela
h = 0.00
Frec. Rela
20
15
10
5
0
20
40
60
80
100
Marca de clase
120
140
160
Frec. Rela
20
15
10
5
0
20
40
60
80
100
Marca de clase
120
140
160
Porcentaje acumulado
100
80
60
40
20
30
45
60
75
90
Gasto semanal
105
120
135
Porcentaje acumulado
100
80
60
40
20
30.0
48.4
66.8
85.2
103.6
Gasto semanal
122.0
140.4
hiptesis nuevas.
divisiones
semi-equidistantes:
logartmico.
Cuadriculado
logartmico
semi-
C.
D.
Las frecuencias (ni, hi, Ni, Hi) siempre son cantidades no negativas ( 0), por lo tanto el
grafico de las frecuencias sean para variables discretas como para variables
Abscisas continuas, se construye en el primer cuadrante del plano cartesiano o rectangular. En
eje de las abscisas (horizontal) se indican los valores de la variable (sean puntos o
intervalos), y en el eje de las ordenadas (vertical) se anota el valor de la respectiva
frecuencia.
i.
2
0
Frecuencia Absolutas
1
8
1
5
Opinin
de los
Clientes
A
G
O
P
V
Total
1
2
1
0
1
0
6
5
2
0
Frecuenc Frecuen
ia
cia
absoluta Relativa
ni
hi %
6
12,5
10
20,8
18
37,5
2
4,2
12
25,0
48
100,0
Marca
de
clase
Xi
21,5
32,5
43,5
54,5
65,5
76,5
87,5
Frecuenci
Frecuen
as
cia
Absolutas
Absolut
Acumula
as
das
ni
Ni
3
3
5
8
10
18
3
21
8
29
7
36
4
40
40
Frecuencias Absolutas
Acumuladas
Ordenadas
E.
45
40
35
30
25
20
15
10
5
0
0
20
40
60
Marca de Clase
80
100
Frecuencia Absoluta
18
18
16
14
12
10
8
6
4
2
0
12
10
6
2
Opinin
de los
Clientes
12,5
360 x12,5
En
Grad
os
45.0
100
10
20,8
360 x20,8
12.5%
25.0%
74.9
100
O
P
V
Total
360xhi %
100
ii.
18
2
12
48
20.8%
37,5
4,2
25,0
100,0
135.0
16.3
91.8
4.2%
37.5%
Intervalo
s de
clases
(Li-1 L i ]
Frecuencia Absolutas
10
8
6
4
2
0
0
16
27
38
49
60
Lmite inferior
71
82
93
16 27
27 38
38 49
49 60
60 71
71 82
82 93
Total
Frecuen
cia
Absoluta
s
ni
3
5
10
3
8
7
4
40
Otro grfico que se usa para representar las frecuencias es el Polgono de Frecuencias,
que se construye como sigue: en cada punto medio o marca de clase (X i) de cada intervalo
se levanta un segmento de altura igual a la respectiva frecuencias Absolutas (ni hi), luego
une los extremos con una lnea poligonal, resultando el Polgono de Frecuencias. Para
completar los extremos, se extiende el polgono en media amplitud de cada extremo.
Li ]
10.5
21,5
32,5
43,5
54,5
65,5
76,5
87,5
98.5
16 27
27 38
38 49
49 60
60 71
71 82
82 93
Total
12
10
8
6
4
2
0
0
10.5
21.5
32.5
43.5
54.5
65.5
76.5
87.5
98.5
Marca de clase
Por su parte, las frecuencias acumuladas (Absolutas o Relativas) se grafican mediante los
Polgonos Acumulativos de Frecuencias (Ojiva). De igual manera, en el eje horizontal
se ubican los extremos los intervalos y en el eje vertical lo valores de N i, Hi. En el extremo
superior de cada intervalo se levanta un segmento de altura igual a la respectiva frecuencia
absoluta, luego partiendo del extremo inferior del primer intervalo se une, con segmentos
de recta, los extremo de los segmentos verticales, obteniendo una lnea poligonal que, a
partir de la ltima frecuencia acumulativa, se extiende paralelamente al eje horizontal,
obtenindose la grfica del Polgono Acumulativo de Frecuencias
35
30
16 27
21,5
27 38
32,5
38 49
43,5
10
18
49 60
54,5
21
60 71
65,5
29
71 82
76,5
36
82 93
87,5
40
20
15
10
40
27
38
49
60
71
82
93
Intervalo
de Clase
2003
2002
2001
2000
1999
1998
1997
1996
16
1995
Aos
1990
1991
1992
1993
1994
1995
1996
1997
2008
1999
2000
2001
2002
2003
Total
25
1994
Ni
40
1993
ni
1992
Xi
45
1991
Intervalos
de clases
<Li-1 Li]
Frecuencia
Frecuenci
s Absolutas
a
Acumulada
Absolutas
s
1990
Marca
de clase
Frecuencias Absolutas
Acumuladas
(Li-1
Frecuen
cia
Absoluta
s
ni
0
3
5
10
3
8
7
4
0
40
Marca
de
clase
Xi
Frecuencia Absoluta
Intervalo
s de
clases
0
1
I
S
C
BARRAS SIMPLES
BARRAS AGRUPAS
T
8
R
E
T
30
25
20
5
4
15
10
1
0
0
1
A
S
SECTOR CIRCULAR
100
BARRAS
COMPUESTAS
90
80
70
60
50
40
30
20
10
0
1
C
O
N
T
I
N
U
A
S
I
N
T
E
R
V
A
L
O
HISTOGRAMA
40
CORRELACIN
32
30
30
28
26
20
24
22
10
20
18
0
16,0
18,0
20,0
22,0
24,0
26,0
28,0
30,0
32,0
16
0
10
20
30
O
R
A
Z
O
N
POLGONO DE
FRECUENCIAS
LINEAL
60
60
50
50
40
40
30
30
20
20
10
10
0
1
9 10 11 12
0
1
b)
Pas 2. Vers la pirmide. Deja los datos como estn y pulsa Siguiente.
Pas 3. Escribe el ttulo de tu grfico (p.e., Per 2001). Deja los otros cuadros en
blanco, y pulsa el botn Siguiente.
Pas 4. Selecciona el botn En una hoja nueva (llama a esta hoja como desees) y
pulsa el botn Finalizar.
Arreglar las barras. Haz doble clic en una de las barras del grfico. En el cuadro de
dilogo Formato de la serie de datos, selecciona la pestaa Opciones. Configura
79 Mg. Miguel Angel Macetas Hernndez
Arreglar el eje vertical (desplazar las etiquetas de edades hacia la izquierda). Haz
doble click en los datos del eje vertical. En el cuadro de dilogo Formato de ejes,
elige la pestaa Tramas y configura los botones de marca de graduacin a Ninguno
y el botn de rtulos a Inferior.
Arreglar el eje horizontal (eliminar los valores negativos del eje hombres). Haz
doble clic sobre los datos del eje horizontal. En la pestaa Nmero selecciona
Categora: Personalizada y escribe en Tipo: 0;0.
Edades
Hombres
Mujeres
Totales
Edades
0-4
1266429
1203652
2470081
0-4
-5.5
5.2
5-9
1352926
1298331
2651257
5-9
-5.9
5.6
10-14
1269705
1243519
2513224
10-14
-5.5
5.4
15-19
1154745
1145976
2300721
15-19
-5.0
5.0
20-24
1072826
1097428
2170254
20-24
-4.7
4.8
25-29
918063
958505
1876568
25-29
-4.0
4.2
30-34
857675
894850
1752525
30-34
-3.7
3.9
35-39
768107
816358
1584465
35-39
-3.3
3.5
40-44
691549
729825
1421374
40-44
-3.0
3.2
45-49
561907
592190
1154097
45-49
-2.4
2.6
50-54
449661
471292
920953
50-54
-2.0
2.0
55-59
296106
319847
615953
55-59
-1.3
1.4
60-64
238627
261898
500525
60-64
-1.0
1.1
65-69
177284
204213
381497
65-69
-0.8
0.9
70-74
139265
163512
302777
70-74
-0.6
0.7
75-79
92800
113044
205844
75-79
-0.4
0.5
80 - +
136901
95194
232095
80 - +
-0.6
0.4
Totales
11444576
11609634
23054210
Totales
-49.6
50.4
Hombres Mujeres
Hombres
80- +
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
8.0000
6.0000
4.0000
2.0000
0.0000
2.0000
4.0000
6.0000
8.0000
Sprite
Coke Classic
Pepsi-Cola
Coke Classic
Coke Classic
Pepsi-Cola
Diet Coke
Coke Classic
Diet Coke
Coke Classic
Coke Classic
Coke Classic
Diet Coke
Pepsi-Cola
Coke Classic
Coke Classic
Dr. Pepper
Dr. Pepper
Sprite
Diet Coke
Coke Classic
Diet Coke
Pepsi-Cola
Pepsi-Cola
Coke Classic
Pepsi-Cola
Pepsi-Cola
Coke Classic
Pepsi-Cola
Coke Classic
Coke Classic
Pepsi-Cola
Dr. Pepper
Pepsi-Cola
Pepsi-Cola
Coke Classic
Coke Classic
Coke Classic
Coke Classic
Sprite
Dr. Pepper
Diet Coke
Diet Coke
Pepsi-Cola
Coke Classic
Pepsi-Cola
Sprite
Sprite
Dr. Pepper
2. Segn Nielsen Media Research, los cinco programas de TV ms vistos a las 8:00 P.M.
del 14 de octubre de 2012 fueron Congo, The X-Files, Holliday in Your Heart, Ellen
Foster y Unhappily Ever After. La lista siguiente es una encuesta entre 50
espectadores.
Unhappily
Ellen
Congo
X-Files
Congo
Ellen
Ellen
X-Files
Ellen
Holliday X-Files
X-Files
Congo
Holliday Congo
Ellen
Congo
Holliday
X-Files
Ellen
Ellen
X-Files
X-Files
X-Files
Ellen
Holliday
Ellen
Ellen
Unhapily
X-Files
Holliday
X-Files
X-Files
Congo
Holliday
Ellen
Holliday
Ellen
Holliday X-Files
Congo
Congo
Holliday
Ellen
Ellen
Ellen
X-Files
Alumnos
Administracin
55
Contabilidad
51
Finanzas
28
Mercadotecnia
82
Nmero de
viviendas
Proporciones
Porcentajes
Adobe
3 184
0.499
49.9
Tabique
1 547
0.242
24.2
Madera
558
0.087
8.7
Embarro
495
0.078
7.8
Mampostera
171
0.027
2.7
76
0.012
1.2
349
0.055
5.5
Total
6 380
1.000
100.0
siguientes representan
horas
o 9:00. Los
de entrada
que
seleccionaron.
7:00
8:30
9:00
8:00
7:30
7:30
8:30
8:30
7:30
7:00
8:30
8:30
8:00
8:00
7:30
8:30
7:00
9:00
8:30
8:00
7. .Durante los primeros 11 meses de 1997, los coches Honda Accord, Chevy Cavalier,
Toyota Camry, Honda Civic y Ford Taurus fueron los coches nuevos ms vendidos
en USA. Se presentan los datos de 50 compras de automvil en Cleveland, Ohio.
Taurus
Civic
Civic
Camry
Camry
Taurus
Civic
Taurus
Taurus
Camry
Civic
Cavalier
Camry
Camry Camry
Civic
Taurus
Civic
Civic
Accord Civic
Accord
Civic
Taurus
Camry
Ramo
Compaa
Ramo
IBP
Alimentos
Borden
Alimentos
Intel
Electrnica
McDonnell Douglas
Aeroespacial
Coca-Cola
Bebidas
Norton International
Prod. Qumicos
Unin Carbide
Prod. Qumicos
Quaker Oats
Alimentos
Pepsico
Bebidas
Motorola
Electrnica
Maytag
Electrnica
Kellogs
Alimentos
Textron
Aeroespacial
Dow Chemical
Prod. Qumicos
Sara Lee
Alimentos
Harris
Electrnica
Ralston Purina
Eaton
Electrnica
Alimentos
dichos ejecutivos.
10. Cuando se les pidi clasificar la destreza que se requiere para obtener una alta
calificacin en un nuevo juego de computadoras como principiante,
aprendiz,
aprendiz,
maestro,
experto,
maestro,
maestro,
maestro,
experto,
experto,
experto,
competidor,
maestro,
maestro,
experto,
correspondientes
estas
clasificaciones
de
destreza
que
se
2009
2010
2011
Agropecuaria
65.4
58.3
54.3
1.8
1.2
1.2
Electricidad
0.2
0.3
0.4
Manufacturero
9.0
11.8
13.8
Construccin e instalacin
1.8
2.7
3.6
Transporte
2.5
2.5
3.2
Comercio
9.4
8.3
9.1
Otras
9.9
14.9
14.3
Total
100.0%
100.0%
100.0%
5857
8273
11 202
En este tema te presentamos las medidas de resumen para variables cualitativas que
se utilizan con mayor frecuencia en los estudios que realizas en el nivel primario de
atencin de salud.
Supongamos que de los 600 recin nacidos (RN) de un hospital en cierto perodo, 300
presentaron los ojos oscuros (OO), en tanto que slo 100 los tenan claros (OC).
Aplicando la expresin general, la razn OO/OC es
Pero, qu significa este resultado? Expresa que hay tres recin nacidos con ojos
oscuros por cada recin nacido de ojos claros en ese hospital y en ese perodo.
. Si
Tasas
Siempre que necesites medir el riesgo de que acontezca cierto fenmeno en una
poblacin determinada, dispones de un indicador valioso y nico: las tasas
Esta es una medida que expresa el riesgo de ocurrencia del evento estudiado en el
numerador en la poblacin involucrada, en el tiempo y lugar establecidos.
Las tasas que ms importancia revisten para nuestro desempeo en el campo de la
Salud son las siguientes:
Una particularidad realmente til de las tasas es que puedes calcularlas tanto para la
totalidad de la poblacin, como para parte de ella (por ejemplo, para el grupo de edad
de cinco a nueve aos, para los estudiantes, para los residentes del rea rural, y as
por el estilo); por otra parte, puedes calcular las tasas para todas las causas, o
solamente para una de ellas (o un grupo de ellas). De este modo, tendrs calculadas
tasas brutas, crudas, generales o globales si se tratara de tasas que involucren a toda
la poblacin o al total de causas; al tiempo que habrs calculado tasas especficas si
incluan a una parte de la poblacin o a una causa o grupo de ellas.
Tambin haz de saber que las poblaciones estn sometidas a constantes cambios en
lo que a su nmero atae, determinados por los nacimientos y defunciones y por
los movimientos migratorios (emigracin e inmigracin), que provocan que no sea la
misma a lo largo de todo el ao. De ah que, por convenio, se tome la poblacin
existente a mediados del perodo 11 o poblacin media para el clculo de las tasas.
Por otra parte, debes tener especial cuidado al calcular tasas para poblaciones
pequeas, como la que usualmente manejan los Consultorios, pues suelen volverse
inestables, ya que cualquier evento mueve mucho la tasa, y a veces no guarda
relacin el resultado obtenido con la magnitud del evento acontecido.
Ahora nos tropezamos con una contrariedad: la poblacin expuesta al riesgo es muy
difcil de definir, ya que tener un hijo no involucra a toda la parte femenina de la
poblacin, y va ms all, pues otros factores de ndole psicosocial actan en tal
decisin. Por estas razones, vers que se han buscado soluciones alternativas a esta
situacin.
Bien, ya tienes el nmero calculado. Pero, es suficiente con eso? Claro que no,
necesitas saber qu significa, a fin de manejarlo apropiadamente. En primer lugar,
debes informar el resultado de la siguiente forma: La tasa bruta de natalidad de Per
en 2008 fue de 14 nacidos vivos por cada 1000 habitantes, ello significa que durante
2008 en Cajamarca nacieron como promedio 14 nios por cada 1 000 habitantes.
Interpretacin: En Per, durante 2008, nacieron como promedio 49 nios por cada
1000 mujeres en edad frtil (15 a 49 aos).
Interpretacin: Durante 2008 en Per nacieron como promedio 56 nios por cada
1000 mujeres de 15 a 49 aos de edad.
Tasas de mortalidad
Entrando en la materia que nos ocupa, te decimos a continuacin las tasas que
podrs calcular.
92 Mg. Miguel Angel Macetas Hernndez
Esta tasa expresa el riesgo que tienen todos los habitantes de cierta poblacin, en un
momento dado, de morir por cualquier causa.
Esto significa que en 2008, en Per fallecieron como promedio 7 personas por cada
1000 habitantes.
En nuestro pas, durante 2008 la tasa de mortalidad del sexo femenino fue:
Interpretacin: en Per, en 2008 fallecieron como promedio 6 mujeres por cada 1000
fminas.
93 Mg. Miguel Angel Macetas Hernndez
En Per, durante 2008 la tasa de mortalidad por enfermedades del corazn fue:
Ello significa que en 2008, en Cuba fallecieron como promedio 7 nios por cada 1000
nacidos vivos.
Este indicador tiene la singularidad de que puede descomponerse en varios
indicadores, que miden con ms especificidad el comportamiento de la mortalidad en
el menor de un ao. Estos componentes son los siguientes:
94 Mg. Miguel Angel Macetas Hernndez
La TMM fue de 47.7 por 100 000 NV en 2008 para nuestro pas. Esto quiere decir que
por cada 100 000 nacidos vivos, murieron en promedio 48 mujeres por causas
directamente relacionadas con el embarazo, parto y puerperio durante 2008 en Per.
Tasas de morbilidad
La morbilidad, entendida como el patrn de enfermedades que sufren los habitantes
de alguna regin, puede ser estudiada numricamente mediante las tasas de
morbilidad. Ellas son la tasa de incidencia, la tasa de prevalencia y la tasa de
letalidad.
La tasa de incidencia (TI) mide el riesgo que tiene una persona que habita en un lugar
y tiempo determinados, de contraer o adquirir cierta enfermedad, visto esto en funcin
del tiempo. Por su lado, la tasa de prevalencia (TP) mide el riesgo de tener la
enfermedad, o sea, de estar enfermo; y la tasa de letalidad (TL) expresa la gravedad
de la enfermedad.
96 Mg. Miguel Angel Macetas Hernndez
Comparacin de tasas
En ocasiones, pretendemos comparar los riesgos de morir, de enfermar, etc. entre
distintas poblaciones o entre distintas categoras o clases de una variable. Para ello,
lo ms conveniente es utilizar la tipificacin, bien por el mtodo directo o por el
indirecto; tcnicas que no se expondrn en este curso, pues se abordarn en cursos
posteriores. Esta tcnica solo sirve para comparar, sus resultados no miden en modo
alguno el riesgo de ocurrencia de los eventos estudiados en la poblacin
Resumen
En este tema estudiaste que:
MEDIDAS RESUMEN VARIABLES CUALITATIVAS 41
1. Las medidas de resumen para datos cualitativos ms frecuentemente utilizadas
son las razones, las proporciones y las tasas.
2. Cada uno de esos indicadores tiene diferente interpretacin. As, los ms
refinados son las tasas, pues expresan el riesgo de ocurrencia del evento
consignado en su numerador.
3. Debes tener cuidado al calcular las tasas para poblaciones pequeas, por
ejemplo, en el Consultorio Mdico de la Familia, porque suelen ser inestables.
4. Las tasas pueden dividirse en generales y especficas.
5. En el mbito sanitario, las tasas ms usadas son las de natalidad, mortalidad y
morbilidad.
1. La Media Aritmtica
Es la medida de tendencia central con la cual probablemente est usted ms
familiarizado es la media aritmtica; se conoce tambin como media o promedio; se
representa como x y se conoce como "x barra"; la frmula para calcularla es:
1.1. Para Datos Sin Agrupar
media x
media x
29 31 24 29 30 25 168
28 das
6
6
media x
xini
Frecuencia absoluta
Total de Observaciones
Intervalos
Marca de
de clases
clase
(Li-1
Li]
a
Absolutas
xi ni
xi
ni
16 27
21,5
64,5
27 38
32,5
162,5
38 49
43,5
10
435
49 60
54,5
163,5
60 71
65,5
524
71 82
76,5
535,5
82 93
87,5
350
40
2235
Total
media x
Frecuenci
55,875
40
40
: constante
M []
a) M [k] = k
b) M [x + k] = M[x] + k
c) M[kx] = kM[x]
d) M [x y] = M[x] M [y]
e) M[x - ] = 0
f) f) M ((X M)2) es mnimo si K = X
La media aritmtica es un indicador de posicin sensible a valores extremos.
2. La Mediana (Me)
Otra medida de tendencia central es la mediana; como se ver es especialmente til
cuando los datos estn sesgados.
Mediana significa a la mitad y la mediana es el valor a la mitad de una serie de datos
que han sido colocados en orden. Especficamente, la mediana es el valor que divide
una serie de datos en dos mitades con una mitad de las observaciones mayores que
sta y la otra mitad menores a la mediana.
Para Datos Sin Agrupar
Ejemplo Al tener los siguientes datos de presin arterial sistlicas: 110, 120, 122, 130,
180 Mm. de Hg.
En este ejemplo, hay dos observaciones mayores y dos menores que 122, luego
entonces, la mediana es 122 Mm. de Hg., el valor de la 3 observacin. Al obtener la
media (132) sta sera mayor que 4 de los 5 valores.
Paso Uno
Paso Dos
n 1
Paso Tres
13, 7, 9, 15, 11
n 1 5 1 3
Rango mediano 2=
n = 6:
n 1 6 1 3,5
Rango mediano 2=
Mediana =2
10,5
2 N j1
Me L ji c j
nj
Donde
103 Mg. Miguel Angel Macetas Hernndez
Nj
Nj-1
Lj-1
IMe
nj
Cj
Ejemplo
Calcular el puntaje de rendimiento mediano en la lnea de accin educativa de
Lenguaje de una muestra de 40 alumnos de un determinado centro educativo
Paso Uno
Aqu n = 40 luego
40
20
2
observando en la tabla este valor no coincide con algn Ni, est entre 18 y 21,
es decir:
18 < 20 < 21 N j1
Nj
2
Intervalos de Frecuencia
clases
(Li-1
IMe=
Lj-1
Absolutas
Li ]
Frecuencias
Absolutas
Acumuladas
ni
Ni
I1
16 27
n1 = 3
N1 = 3
I2
27 38
n2 = 5
N2 = 8
I3
38 49
n3 = 10
N3 = 18
Nj-1
I4
49 60
n4 = 3
N4 = 21
Nj
I5
60 71
n5 = 8
N5 = 29
I6
71 82
n6 = 7
N6 = 36
I7
82 93
n7 = 4
N7 = 40
Total
40
2 18
Me 49 11
56,33
3
Me 56,33
nj
d1
Mo L j1 Ci
d1 d2
42,5833
10 5 10 3
Mo 38 11
10 5
Donde
Lj-1
Cj =
d1 =
nj nj1
d2 =
nj nj+1
Ejemplo
Calcular el puntaje de rendimiento ms frecuente en la lnea de accin
educativa de Lenguaje de una muestra de 40 alumnos de un determinado
centro educativo
Intervalos de Clases
(Li-1
Li ]
Frecuencia
Absolutas
ni
I1
16 27
n1 = 3
I2
27 38
n2 = 5
nj-1
IMo=
I3
38 49
n3 = 10
nj
Lj-1
I4
49 60
n4 = 3
nj+1
I5
60 71
n5 = 8
I6
71 82
n6 = 7
I7
82 93
n7 = 4
Total
40
42,5833
10 5 10 3
Mo 38 11
10 5
caractersticas cuantitativas.
2. En su clculo se toman en cuenta todos los valores de la variable.
3. Es lgica desde el punto de vista algebraico.
4. La media aritmtica es altamente afectada por valores extremos.
5. No puede ser calculada en distribuciones de frecuencia que tengan clases
abiertas.
6. La media aritmtica es nica, o sea, un conjunto de datos numricos tiene una
y solo una media aritmtica.
Mediana
1. En su clculo no se incluyen todos los valores de la variable.
2. La Mediana no es afectada por valores extremos.
3. Puede ser calculada en distribuciones de frecuencia con clases abiertas.
4. No es lgica desde el punto de vista algebraico.
Moda
1. En su clculo no se incluyen todos los valores de la variable.
2. El valor de la moda puede ser afectado grandemente por el mtodo de
designacin de los intervalos de clases.
3. No est definida algebraicamente.
4. Puede ser calculada en distribuciones de frecuencia que tengan clases abiertas.
5. No es afectada por valores extremos.
Mes
Plan 1
Plan 2
Enero
1657,0
4735,0
Febrero
2008,0
5012,0
Marzo
2267,0
5479,0
Abril
3432,0
5589,0
2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual
lleva comidas calientes a enfermos confinados en casa, desean evaluar sus
servicios. El nmero de comidas diarias que suministran aparece en la siguiente
tabla de frecuencia. Calcular la media, mediana y la moda e intrprete.
Nmero de das
0-5
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
3. Bill Karl compr 20 acciones a $ 15 cada una, 50 acciones a $20 cada una,100
acciones a $30 cada una y 75 acciones a $35 cada una.
Cul es el precio
4. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20.
Determine la media de los datos.
ni
Xi
Ni
X i ni
880
1950
35
1800
13
200)
4
70
14
12
10
8
6
4
2
0
4
10
12
14
Notas
Li Ls
ni
10 30
20
30 50
50 70
70 - 90
20
Li Ls
ni
16 32
48 64
64 80
3n
80 - 96
Li Ls
ni
20 30
30 40
40 50
50 60
60 70
11. Una compaa minera tiene 100 trabajadores. Para los nombrados el haber
mximo es 450 dlares y el mnimo 60 dlares. Hay un 5% de eventuales (en
prueba) que trabajan ad-honorem o perciben compensaciones inferiores a $60.
Quince trabajadores nombrados perciben haberes inferiores a $250 y el 85% ganan
haberes inferiores a $400. Con esta informacin, calcule las medidas de tendencia
central posibles.
Porcentaje
Menos de 206
20 %
206 214
25%
214 222
18%
222 230
15%
230 238
13%
Ms de 238
9%
13. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. se divide en dos
grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg.
Cuntos estudiantes hay en cada grupo?.
14. En una clase hay 35 estudiantes varones con una edad media de 17. 5 aos y 15
estudiantes mujeres las que en promedio son 12% ms Jvenes. Cul es la edad
media de la clase?.
15. Las temperaturas registradas en una ciudad, en grados Fahrenheit (F), fueron: 51,
60, 58, 62, 57, 49, 52, 62, 61 y 63. Determinar la Media en grados centgrados (C)
sabiendo que: C=(5/9)(F-32).
16. De una muestra de tamao tres se sabe: la suma de los cubos de las tres
observaciones es 1971, la media aritmtica es 7 y la mediana es 6. Calcular el
valor de cada una de las observaciones.
19. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46,
9.20, 9.80, 9.77, 9.00, 9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es
3 veces su costo de fabricacin menos 5 soles, calcular la utilidad media por objeto.
20. De las edades de cuatro personas, se sabe que la media es igual a 24 aos, la
mediana es 23 y la moda es 22. Encuentre las edades de las cuatro personas.
21. Para calcular el suministro de agua que una ciudad requiere mensualmente, se
escogen 15 familias de la ciudad, resultando los siguientes consumos en metros
cbicos; 11.2, 21.5, 16.4, 19.7, 14.6, 16.9, 32.2, 18.2, 13.1. 23.8, 18.3, 15.5, 18.8,
22.7, 14.0. Si en la ciudad hay 5,000 familias, cuntos metros cbicos de agua se
requieren mensualmente si el consumo promedio por familia permanece igual?.
22. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos
alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo ms 10 soles a
cada uno. Si la empresa dispone a lo ms de S/. 94,000 para pagar sueldos, cul
alternativa es ms conveniente?.
23. Al calcular la media de 125 datos, result 42. Un chequeo posterior mostr que en
lugar del valor 12.4 se introdujo 124. Corregir la media.
28. Al tabular las calificaciones de un examen se obtuvieron las siguientes notas: 07,
08, 09, 10, 11, 12, 13, 14, 15, 16, 17 y las frecuencias del nmero de alumnos
respectivas: 1, 1, 1, 1, 1, 6, 8, 16, 18, 20, 2. Cunto es la media, la mediana y la
moda de las notas?, qu valor escogera como el promedio?.
29. Los sueldos en una empresa varan de $300 a $800 distribuidos en forma simtrica
en 5 intervalos de igual amplitud, con el 15%, 20%, y 30% de casos en el primer,
segundo y tercer intervalo respectivamente. Calcule los diferentes indicadores de
tendencia central.
X G n x1 , x2 ,...xn Xi
i 1
n
1
n
b) Datos agrupados
X G x , x ...x
n1
1
n2
2
nm
m
. Xi ni
i 1
l
n
XG
1 m
ni log Xi log Xi
n i 1
Entonces:
X G 10 log x
La media geomtrica se utiliza los datos tienen crecimiento geomtrico: poblacin, montos de
capital, produccin
1.3.3. Propiedad:
XG < X
114 Mg. Miguel Angel Macetas Hernndez
Ejemplo
La media geomtrica es til en el clculo de tasas de crecimiento; por ejemplo, si el
crecimiento de las ventas en un pequeo negocio son 3%, 4%,8%,9% y 10%, hallar la media
de crecimiento.
( )( )( )( )(
Respuesta: 6.128%
Utilizando logaritmo
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Ventas
500
550
600
700
800
850
Solucin:
Es necesario calcular el porcentaje que las ventas de cada mes representan respecto de los
obtenidos el mes anterior.
Mes
Porcentaje del
mes anterior
Ventas
Enero
500
Febrero
550
550/500=1,100
Marzo
600
600/550=1,091
Abril
700
700/600=1,167
Mayo
800
800/700=1,143
Junio
850
850/800=1,063
)(
)(
)(
)(
Donde:
ni = frecuencia absoluta de cada dato xi
Ejemplo
Calcular la media geomtrica para las siguientes calificaciones de Estadstica:
xi
ni
10
10
Solucin:
Se llena la siguiente tabla, realizando los clculos respectivos:
xi
ni
log x i
log x i ni
0.602
3.010
0.778
6.225
0.903
8.128
10
0.954
9.542
10
1.000
8.000
Total
40
34.906
Es un promedio que se utiliza para el clculo del costo promedio y todo tipo de variables
expresadas en tasas o porcentajes. como por ejemplo: velocidad/distancia,
productividad/tiempo, etc
La media armnica no est definida en el caso de la existencia en el conjunto de
valores nulos.
Cuando la unidad constante o unidad de evaluacin es igual a la unidad del numerador
de una razn,
se usa el promedio armnico, y si es igual a la unidad del denominador se usa el
promedio aritmtico.
XH
n
n
Xi
i 1
Ejemplo:
La velocidad de produccin de azcar de tres mquinas procesadoras son 0,5, 0,3 y 0,4
minutos por kilogramo. Hallar el tiempo promedio de produccin despus de una jornada de
4800 minutos del proceso
Solucin:
Como en la razn minutos/kilogramos (min/kg) cada mquina trabaja 4800 min, la razn
contante es el tiempo de trabajo (4800 min), es decir la contante es la unidad del numerador,
por lo tanto se debe emplear el promedio armnico
b) Datos Agrupados:
Se emplea cualquiera de las siguientes ecuacion
n
XH n
ni
i 1 Xi
Propiedad:
XH < XG < X
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en horas que se demoran en
realizar la misma obra determinados obreros. Calcular el tiempo promedio que se demora en
realizar la obra un obrero tipo (un obrero promedio).
Tiempo
Obreros
XH
n
ni
i 1 Xi
n
Ejemplo:
En la siguiente tabla se presentan los datos sobre el tiempo en minutos que se demoran
para resolver una prueba de Estadstica determinados estudiantes. Calcular el tiempo
promedio que se demora en resolver la prueba un estudiante tipo.
Tiempo
Estudiantes
[40-50)
[50-60)
[60-70)
10
[70-80)
[80-90]
11
Solucin:
Realizando los clculos respectivos se obtiene:
ni
[40-50)
45
ni/xi
0,089
[50-60)
55
0,145
[60-70)
10
65
0,154
[70-80)
75
0,093
[80-90]
11
85
0,129
Total
40
xi
0,611
A. Los Cuartiles
Para Datos No Agrupados
La posicin o ubicacin de los cuartiles se encuentra aplicando la siguiente ecuacin:
Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Encuentre los cuartiles dada la siguiente distribucin, y represntelos grficamente
mediante un diagrama de caja y bigotes: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los cuartiles se ordena los datos de menor a mayor
6
12
12
12
15
17
Como la posicin del cuartil 1 es 2.5, su valor es el promedio de los datos segundo y
tercero
O tambin la posicin 2.5 dice que el cuartil 1 est ubicado al 50% del trayecto
comprendido entre el segundo dato, que es 9 y el tercer dato que es 9, es decir, Q1=
9+0.5 (9-9) = 9
Interpretacin: Este resultado indica que el 25% de los datos es inferior a 9
( )( )
[
O tambin la posicin 4.5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
Q2= 12+0,5(12-12) = 12
Interpretacin: Este resultado indica que el 50% de los datos es inferior a 12
Aplicando la ecuacin para el cuartil tres se obtiene:
( )( )
[
O tambin la posicin 6,5 dice que el cuartil 2 est ubicado al 50% del trayecto
comprendido entre el doceavo dato, que es 12 y el quinceavo dato que 15, es decir,
Q3= 12+0,5(15-12)
Q3= 12+0.5 (3)=12+1,5=13,5
Interpretacin: Este resultado indica que el 75% de los datos es inferior a 13,5
jn
4 N J 1
Q j L i 1 C j
nj
Donde
Lj-1 =
Cj =
j =
n =
Nj =
Nj-1
nj =
jn
4
jn
Aqu n = 40 y j =1 luego
1x 40 10
observando
En la tabla este valor no coincide con algn Ni, est entre 8 y 10, es decir: 8 < 10 <
18
Intervalos de
clases
(Li-1
I1
IQ1=
Lj-1
Li ]
16 27
Frecuencia
Absolutas
ni
Frecuencias
Absolutas
Acumuladas
n1 = 3
Ni
N1 = 3
I2
27 38
n2 = 5
N2 = 8
I3
38 49
n3 = 10
N3 = 18
I4
49 60
n4 = 3
N4 = 21
I5
60 71
n5 = 8
N5 = 29
I6
71 82
n6 = 7
N6 = 36
I7
82 93
n7 = 4
N7 = 40
Total
124 Mg. Miguel Angel Macetas Hernndez
40
Nj-1
Nj
nj
jn
2x 40 20
En la tabla este valor no coincide con algn Ni, est entre 18 y 21, es decir:
18 < 20 < 21
Intervalos de
clases
(Li-1
IQ2=
Lj-1
Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
ni
Ni
Li ]
I1
16 27
n1 = 3
N1 = 3
I2
27 38
n2 = 5
N2 = 8
I3
38 49
n3 = 10
N3 = 18
Nj-1
I4
49 60
n4 = 3
N4 = 21
Nj
I5
60 71
n5 = 8
N5 = 29
I6
71 82
n6 = 7
N6 = 36
I7
82 93
n7 = 4
N7 = 40
Total
nj
40
4 18
Q 49 11
56,33
2
3
Paso Uno
3x 40 30
4
IQ3=
Frecuencia
Absolutas
Frecuencias
Absolutas
Acumuladas
ni
Ni
Li ]
I1
16 27
n1 = 3
N1 = 3
I2
27 38
n2 = 5
N2 = 8
I3
38 49
n3 = 10
N3 = 18
I4
49 60
n4 = 3
N4 = 21
I5
60 71
n5 = 8
N5 = 29
Nj-1
I6
71 82
n6 = 7
N6 = 36
Nj
82 93
n7 = 4
N7 = 40
nj
Lj-1
I7
Total
40
4 29
Q 71 11
39,57
3
7
Interpretacin Que el 75% del total de alumnos, es decir 30 de ellos tienen una puntuacin
inferior o igual a 39,57 puntos, y los 10 restantes, o sea el 25% de trabajadores, tienen un
puntaje superior a 39,57 puntos.
126 Mg. Miguel Angel Macetas Hernndez
Donde
n = Nmero total de datos
K = Nmero del cuartil
Ejemplo
Ejemplo:
Calcular el quinto decil de la siguiente distribucin: 6, 9, 9, 12, 12, 12, 15 y 17
Solucin:
Para calcular los deciles se ordena los datos de menor a mayor.
6
12
12
12
15
17
O tambin la posicin 4,5 dice que el decil 5 est ubicado al 50% del trayecto
comprendido entre el cuarto dato, que es 12 y el quinto dato que tambin es 12, es
decir,
D5= 12+0,5(12-12) = 12
En Excel se calcula de la siguiente manera:
jn
10 N J 1
D j Li 1 C j
nj
Donde
Lj-1 =
Cj =
j =
n =
Nj =
Nj-1
nj =
10
jn
10
Donde:
n = nmero total de datos
k = nmero del percentil
Ejemplo:
Calcular los percentiles de orden 20 y 33 del peso de diez personas que pesan (en
kg) 80, 78, 65, 73, 65, 67, 72, 68, 70 y 72
Solucin:
Se ordena los datos de menor a mayor se tiene:
65
65
67
68
70
72
72
73
78
80
)(
)(
jn
100 N J 1
Pj Li 1 C j
nj
Donde
Lj-1 =
Cj =
n =
Nj =
Es un inmediato superior a
Nj-1
nj =
jn
100
jn
100
Frecuencias
50 y menos de 55
55 y menos de 60
13
60 y menos de 65
15
65 y menos de 70
10
70 y menos de 75
75 y menos de 80
Consumo
($miles)
N de casos
46
68
8 10
10 12
12 14
17
26
14
9
11
xi
ni
50- 70
70- 90
90 - 110
110 - 130
130 150
60
80
100
120
140
2
15
8
12
3
orden
de
percentil
representa
la
Q3 Q1
2
x x n
xn
x n
n 1
s2
2
i
n 1
Propiedades de la varianza:
Sean:
X : variables
k : constante
V( ): Operador varianza
a) V (X) 0
b) V (k) = 0
c) V (x + k) = V(x)
d) V (kx) = K2 V(X)
Si tenemos una muestra tamao n la dividimos en r sub muestras determinando en
cada una de ellas sus respectivas medias, entonces la media total se determina por la
formula siguiente:
r
XT
S 2 ni
i 1
(X
X t )ni
i 1
Intravarianza + Intervarianza
[Li-1 Li)
Xi
ni
xi ni
x i2ni
0,2 7,2
3,7
11,1
41,07
7,2 14,2
10,7
53,5
572,45
14,2 21,2
17,7
141,6
2506,32
21,2 28,2
24,7
123,5
3050,45
28,2 35,2
31,7
10
317
10048,9
35,2 42,2
38,7
154,8
5990,76
42,2 49,2
45,7
228,5
10442,45
40
1030
32652,4
Total
s2
1030
32652,4
40 1
40
157,1769
V X s
157,1769 12,5370221
Es uno de los estadgrafos de dispersin de mayor uso, en si cual las unidades de
la variable ya no estn elevadas al cuadrado. La desviacin estndar, al igual que
la varianza, es no negativa (s 0), puesto que es la raz cuadrada positiva de la
varianza. A mayor dispersin le corresponder una mayor desviacin estndar.
CV
S
100
x
CV
12,537100 48,68746446%
25,75
Altamente representativa.
5%<CV<10%,
Representativa de su serie.
10%<CV<15%,
moderadamente representativa
15%<CV<30%,
CV>30%,
Mo
Me = X = Mo
Curva
hipottica
Normal
Curva Unimodal
Me = X = Mo
X = Me
Mo
Curva hipottica en
U
Curva Bimodal
X = Me
X = Me
Curva
hipottica
Rectangular
Curva sin moda
X = Me
Mo
Me
Curva Unimodal
Mo < Me < X
Mo
Hernndez
135 Mg. Miguel Angel MacetasMe
Curva Unimodal
Mo > Me > X
Mo
3 Me 2 X
C. Importancia de la Asimetra.El conocimiento de la asimetra es importante por el hecho de que la teora estadstica
se basa a menudo en el supuesto de una distribucin normal. Por lo tanto una medida
de asimetra de una distribucin es necesario para preservarnos de las consecuencias
de esta suposicin (La condicin necesaria de una distribucin normal es que sea
simtrica).
D. Coeficiente de Asimetra.
Consideramos varias frmulas para el clculo de la medida de asimetra:
Coeficiente de Asimetra en base a Momentos.
m
1 ( xi - x ) ni
n s3
3
AS =
AS1
A.
B.
AS2
X Mo
; Denominado primer coeficiente de Parson.
S
3(X Me)
; Denominado segundo coeficiente de Pearson.
S
AS
Q 3 2Q 2 Q1
Q 3 Q1
Decisin:
D. Mesocrtica (Normal )
D. Platicrtica
K
Donde:
Los percentil P90 y P10 se calcula con la
siguiente frmula:
rn
100 N J 1
Pr L i 1 C j
nj
Decisin:
Q3 Q1
2P90 P10
Lj-1=Limite inferior del Intervalo del Percentil
Cj =Amplitud del intervalo Percentilico
r = El nmero de Percentill r = 1,2,3,,99
n = Nmero total de observaciones o datos.
Nj = Es un inmediato superior a
jn
100
jn
100
Li]
xi
Xini
X ni
(X i X) 3 n i (X i X) 4 n i
35
45
40
200
8000
-158773.1481
5027816.358
45
55
50
350
17500
-71199.0741
1542646.605
55
65
60
11
660
39600
-17467.5926
203788.5802
65
75
70
14
980
68600
-64.8148
108.0246914
75
85
80
640
51200
4629.6296
38580.24691
85
95
90
630
56700
43134.2593
790794.7531
95
105
100
400
40000
90981.4815
2577808.642
105
115
110
4
60
440
48400
4300
330000
Total
(x
) 3 ni
Coeficiente Asimetra =
n
8
(x
225314.8148 8637067.901
116555.556 18818611.111
116555.56
= 0.2799,
60 * (19.076) 3
) 4 ni
18818611.1111
= 2.3686
n *
60 * (19.076) 4
Por tanto se puede afirmar que la distribucin emprica es:
Aprox. Simtrica, puesto que AS = 0.28
0
Coeficiente Kurtosis =
L i>
xi
ni
Ni
hi
Hi
[620 698>
659
4
4
0,0667
0,0667
[698 776>
737
7
11
0,1167
0,1833
[776 854> 815
23
34
0,3833
0,5667
[854 932>
893
15
49
0,2500
0,8167
[932 1010> 971
5
54
0,0833
0,9000
[1010 1088> 1049
6
60
0,1000
1,0000
Total
60
1,0000
El Polgono de Frecuencias Absolutas.
Para graficar el polgono de frecuencias se realiza algunos clculos
Marca de Nmero de
clase
Bombillas
xi
ni
581
0
659
4
737
7
815
23
893
15
971
5
1049
6
1127
0
60
[Li-1
[620
[698
[776
[854
[932
[1010
L i>
698>
776>
854>
932>
1010>
1088>
Total
Nmero de bombillas
GRAFICO N 01
POLGONO DE FRECUENCIA DE LA VIDA TIL EN HORAS DE UNA MUESTRA
ALEATORIA DE 60 BOMBILLAS DE LUZ DE 100 WATTS
25
23
20
15
15
10
0
581
0
681
781
881
981
1081
L i>
ni
hi
hi %
[620 698>
4
0,0667
6,667
[698 776>
7
0,1167
11,667
[776 854>
23
0,3833
38,333
[854 932>
15
0,2500
25,000
[932 1010>
5
0,0833
8,333
[1010 1088>
6
0,1000
10,000
Total
60
1,0000
100,000
Calculamos el nmero de observaciones pedido:
(
)
698 a 776
11,66667
78
11,6667
698 a 700
x
2
x
Para encontrar el valor 698 a 700 = 11,6666667 0,2991453 = 11,3675214
(
)
932 a 1010
8,3333
78
8,333
932 a 1000
x
68
x
Para encontrar el valor 700 y 1000 horas. = 11,368 + 38,333 + 25,000 + 7,265 =
81,966%
El 15 % ms durables en la categora A
Basta calcular el percentil 15 y el percentil 85
(
(
)
)
Varianza S 2 xi2 hi X
89,37 9 2 8,37
(
(
)
)
No podemos concluir que la distribucin sea simtrica. En efecto, como la media est a la
derecha de la moda la distribucin es sesgada a la derecha y usando el primer Coeficiente
de Pearson tenemos:
Nmero de Familias
Nivel
Frecuencia
socioeconmico Absoluta
Medio
8
Bajo
9
Alto
3
Total
20
10
Frecuencia
Relativa
40,0
45,0
15,0
100
Alto
15%
8
6
3
4
2
0
Medio
Bajo
Alto
Nivel Socioecnomico
Bajo
45%
Medio
40%
Y b0 b1 X ................Modelo.de.regresin .estimada
El trmino de error es la diferencia entre los valores reales observados Y i y los valores
estimados por la ecuacin de la recta. Se trata de que estos sean mnimos, para lo cual
se utiliza el mtodo de mnimos cuadrados.
Se trata de minimizar la suma de todos los errores o residuos:
Las frmulas resultado de la minimizacin de lo cuadrados del error se aplicarn en el
siguiente ejemplo por claridad. Se tienen los siguientes supuestos:
Yest
Error
38.9376
364.1533
10.9199
0.9408
1.099872
0.0576
21.0021
28.3362 15.1022
31.75
7.499472
7.6176
7.3832
37.0443 28.0292
10
35.00
10.502272
3.0976
35.6075
34.1416
25.02
0.963072
0.0576
16.1026
28.3362 10.9969
16.86
51.612672
17.9776
148.1771
16.7253
14.38
91.433472
38.9376
214.7045
10.9199 11.9721
9.60
121.260672
38.9376
377.6337
10.9199
24.35
-3.558928
0.5776
21.9286
31.2389 47.4563
27.50
0.367872
0.0576
2.3495
28.3362
X Servicios
Y Tiempo
(Xi-X)*(Yi-Y)
9.95
119.076672
24.45
11
(Xi-X) 2
0.7369
0.0181
1.7422
0.6991
17.08
50.679872
17.9776
142.8694
16.7253
0.1258
11
37.00
21.989472
7.6176
63.4763
37.0443
0.0020
12
41.95
48.568672
14.1376
166.8541
39.9470
4.0121
11.66
108.406272
38.9376
301.8142
10.9199
0.5477
21.65
31.303072
17.9776
54.5057
16.7253 24.2523
17.89
47.245472
17.9776
124.1620
16.7253
20
69.00
470.014272
10.30
135.625472
52.4176
350.9178
8.0172
5.2111
10
34.93
10.379072
3.0976
34.7770
34.1416
0.6216
15
46.59
118.686672
45.6976
308.2553
48.6551
4.2646
15
44.88
107.127072
45.6976
251.1337
48.6551 14.2512
16
54.12
194.676672
60.2176
629.3676
51.5578
6.5649
17
56.63
241.751472
76.7376
761.6054
54.4605
4.7068
22.13
15.462272
5.0176
47.6486
22.5307
0.1606
21.15
25.540272
10.4976
62.1385
19.6280
2.3164
206
725.82
2,027.7132
698.5600
6,105.9447
220.0926
Sxy
Sxx
Syy = SST
SSE
Y Promedio
Xi-X)*(Yi-Y)
(Xi-X)^2
(Yi-Y)^2
Sxy
Sxx
Syy
1.3564
X
promedio
Si todos los puntos estuvieran completamente sobre la recta la ecuacin lineal sera
y = a + bx. Como la correlacin no siempre es perfecta, se calculan a y b de tal forma que
se minimice la distancia total entre puntos y la recta. Los clculos tomando las sumas de
cuadrados siguientes se muestran a continuacin:
Sxy = 2027.71
Sxx
= 698.56
Syy
= 6105.94
b1 b1
( Xi X )(Yi Y ) S
S
( Xi X )
XY
= 2.902704421
XX
b1 X i
n
Y bX = 5.114515575
r2 1
SST
SST
SST
r r 2 = 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los puntos a la lnea
recta indicando el nivel de influencia de una variable en la otra. El factor de correlacin r es
un nmero entre 1 (correlacin negativa evidente) y +1 (correlacin positiva evidente), y r
= 0 indicara correlacin nula.
Ajuste Mq.
Y
21.6
4
1.8
1
1
0.8
3.8
7.4
4.3
36.2
a. Trazar un diagrama de dispersin
X
11.15
15.7
18.9
19.4
21.4
21.7
25.3
26.4
26.7
29.1
2. En base al porcentaje de puntualidad se trata de ver si hay correlacin con las quejas
en una lnea area. Las quejas son por cada 100000 pasajeros.
%puntos Quejas a. Trazar un diagrama de dispersin
Aerolnea
A
B
C
D
E
F
G
X
81.8
76.6
76.6
75.7
73.8
72.2
70.8
Y
0.21
0.58
0.85
0.68
0.74
0.93
0.72
68.5
1.22
las
quejas
para
un
porcentaje
de
puntualidad de 80%
d. Obtener los intervalos de prediccin y de confianza
para una altura de 63"
e. Obtener el coeficiente de correlacin y de
determinacin