Вы находитесь на странице: 1из 50

ESTADISTICA

abr.-18 ARITMETICA 1
CEPRE-UNI
OBJETIVOS
•Saber qué significa Estadística y sus campos de estudio.

•Diferenciar entre una variable cualitativa y una variable cuantitativa.

•Organizar los datos en una distribución de frecuencias.

•Presentar datos empleando histogramas y otros gráficos.

•Calcular la media aritmética, la mediana y la moda para datos


agrupados y no agrupados.

•Calcular otras medidas de centralización como la media ponderada,


media geométrica y armónica.

abr.-18 ARITMETICA 2
CEPRE-UNI
NOTA HISTÓRICA

Desde la antigüedad, reyes y emperadores se preocuparon por


conseguir datos sobre sus posesiones. El censo, por ejemplo, es un
vasto proyecto de recopilación de datos y no es una idea nueva;
hace 2 mil años el emperador Augusto mandó realizar una gran
encuesta sobre las riquezas del imperio Romano: soldados, navíos,
recursos, rentas, etc. Mucho antes los egipcios habían registrado
información numérica que aún se estudia, al igual que los
misteriosos quipus que almacenaban información para la
administración del imperio Inca.

Durante mucho tiempo se entendió por “estadística” a la información


relacionada con el gobierno. La palabra se deriva del latín
“statisticus” que significa “del Estado” y este término pasó a
referirse, durante el siglo XIX, a otros tipos de información numérica
y más tarde a los métodos para analizar dicha información.

abr.-18 ARITMETICA 3
CEPRE-UNI
ESTADÍSTICA

Definición:

Es la parte de la matemática que estudia los fenómenos


que se pueden cuantificar y generan un conjunto de
datos. El especialista en esta área debe simplificar al
máximo la información disponible para que pueda ser
clara y útil; y cuando sea posible tratará de inferir las
leyes que explique el comportamiento de este fenómeno.

abr.-18 ARITMETICA 4
CEPRE-UNI
El estudio de la estadística puede dividirse en dos áreas principales:

Estadística descriptiva:
Comprenden las técnicas que se emplean para la recopilación,
organización, resumen y presentación de los datos (o información).

Estadística inferencial:
Comprende técnicas que basado únicamente en una muestra o
subconjunto de la población sometida a observación, se toma
decisiones sobre toda la población. Dado que esta decisión se toma en
condiciones de incertidumbre, supone el uso de conceptos de
probabilidad.

abr.-18 ARITMETICA 5
CEPRE-UNI
 Unidad Elemental
Es cada persona o cada objeto de la cual se requiere alguna
información.

 Dato (observación)
Es el resultado de observar o medir una característica de una
unidad elemental.

 Población
Es el conjunto de las unidades elementales.

 Muestra
Es un sub-conjunto representativo de la población,
tomado aleatoriamente, el cual sirve para hacer
inferencias acerca de dicha población.

abr.-18 ARITMETICA 6
CEPRE-UNI
 Tamaño de la Muestra
Es la cantidad de elementos de una muestra.

 Variables estadísticas:
Son las distintas formas en que se puede
expresar una observación.

abr.-18 ARITMETICA 7
CEPRE-UNI
CLASES DE VARIABLES ESTADÍSTICAS

I) Variable Cuantitativa: cuando representa una cantidad.


Discreta : cuando se obtiene por conteo, puede tomar
solo valores enteros.
Ejemplo: El estudio del número de hijos de cada
familia del distrito de Pueblo Libre.
Continua : cuando se obtiene por medición, puede
asumir cualquier valor real dentro de un cierto
intervalo.
Ejemplo: La estatura de los alumnos de CEPRE UNI.

II) Variable Cualitativa: cuando representa cualidad.


Ejemplo: Estado civil de una persona.

abr.-18 ARITMETICA 8
CEPRE-UNI
PRESENTACIÓN Y ORDENACIÓN DE
DATOS
Frecuencia absoluta (f) designa al número de
veces que el valor correspondiente aparece en el
conjunto de datos .

Frecuencia relativa (h) es la frecuencia


expresada como fracción o porcentaje del total.
Si N es en número de datos, la frecuencia
relativa h está dado por:
f
h
n

abr.-18 ARITMETICA 9
CEPRE-UNI
PRESENTACION DE DATOS NO AGRUPADOS

Ejemplo 1:
Se realizó una encuesta entre los 50 empleados de una
empresa, consultando sobre el número de hijos en edad
escolar que tenía cada empleado, a fin de estimar el pago de
una bonificación por gastos escolares que proyecta hacer la
empresa. Estos fueron los resultados:

0 2 1 0 3 2 0 1 1 0
0 1 1 2 4 1 0 1 1 0
2 1 0 0 3 0 0 1 2 1
0 0 2 4 1 1 0 1 2 0
1 1 0 3 5 1 2 1 3 2

abr.-18 ARITMETICA 10
CEPRE-UNI
PRESENTACION DE DATOS NO AGRUPADOS

Frecuenci
No de hijos a Frecuencia
Conteo
X absoluta relativa (h)
(f)
0 \\\\ \\\\ \\\\ \ 16 16/50 = 0.32 = 32%
1 \\\\ \\\\ \\\\ 18 18/50 = 0.36 = 36%
\\\
2 \\\\ \\\\ 9 9/50 = 0.18 = 18%
3 \\\\ 4 4/50 = 0.08 = 8%
4 \\ 2 2/50 = 0.04 = 4%
5 \ 1 1/50 = 0.02 = 2%
n = 50 Total = 100%

Tabla 1. No de hijos por empleados de una empresa

abr.-18 ARITMETICA 11
CEPRE-UNI
REPRESENTACIONES GRAFICAS

GRAFICA DE DE SECTORES
No beben
24%

Beben
76%
No beben Beben

abr.-18 ARITMETICA 12
CEPRE-UNI
Diagrama de Barras
Asignan a cada valor de la variable una barra de
altura proporcional a su frecuencia

Gráfico 1. No de hijos en edad escolar de los 50


em pleados de una em presa

20
18
16
15
Empleados

9
10

4
5
2
1
0
0 1 2 3 4 5
No de hijos
abr.-18 ARITMETICA 13
CEPRE-UNI
90
80
70
60
50
Este
40 Oeste
30 Norte
20
10
0
1er trim. 2do 3er trim. 4to trim.
abr.-18
trim. ARITMETICA
CEPRE-UNI
14
PRESENTACIÓN DE DATOS AGRUPADOS

Cuando los datos consisten en solo unos cuantos


valores distintos (es el caso de los datos del
ejemplo anterior que tomaba solo los valores 0,
1, 2, 3, 4 y 5), podemos organizarlos fácilmente
y determinar cualquier tendencia, sin embargo
cuando los datos consisten en muchos valores
en su mayoría no repetidos es conveniente
agrupar los datos y determinar las frecuencias
absolutas y relativas de cada grupo que
llamaremos clase.

abr.-18 ARITMETICA 15
CEPRE-UNI
DEFINICIONES PREVIAS:
Rango Recorrido (R).
Es la diferencia entre el mayor de los datos xmáx y el
menor de los datos xmin.

R = xmax – xmin

Intervalo de clase [a, b>


Son cada una de las categorías excluyentes (o clases) en los
que se pueden clasificar los datos. Los extremos de un
intervalo [ai, bi son ai y bi, donde
•ai = límite inferior del intervalo de clase
•bi = límite superior del intervalo de clase
Cada intervalo es cerrado por la derecha y abierto por la
izquierda

abr.-18 ARITMETICA 16
CEPRE-UNI
Marca de clase (xi)

Son los puntos medios de cada clase, así en el intervalo


la marca de clase xi será: a ,b
 i i

ai  bi
xi 
2

Número de intervalos (k)

No existen reglas fijas para establecer el valor de k. Una


regla sugiere que sea un número próximo a N y otra dice
que el número ideal es 1 + 3,3 logN (Regla de Sturges),
siendo N el total de datos. En muchos casos, entre 5 y 10
intervalos puede ser el número adecuado.

abr.-18 ARITMETICA 17
CEPRE-UNI
Amplitud del intervalo (A)

Es la diferencia entre sus extremos. Es conveniente que


todos los intervalos tengan la misma longitud A

R
A
k
Es preferible redondear el valor de “A” por exceso para no
perder datos.

Frecuencia absoluta (fi)


Es el número de datos que corresponden al i-ésimo intervalo
de clase.

abr.-18 ARITMETICA 18
CEPRE-UNI
Frecuencia acumulada (Fi)
Se define para cada i-ésimo intervalo de clase, como la
suma de todas las frecuencias absolutas fi desde el
primero hasta el i-esimo intervalo:
Fi  f1  f2  ...  fi

Frecuencia relativa (hi)


Es el cociente entre la frecuencia absoluta del i-ésimo
intervalo y el número total de datos

fi
hi 
n

abr.-18 ARITMETICA 19
CEPRE-UNI
Frecuencia relativa acumulada (Hi)

Es el cociente entre la frecuencia acumulada absoluta


correspondiente al i-ésimo intervalo y el número total
de datos.
Fi
Hi 
n

abr.-18 ARITMETICA 20
CEPRE-UNI
Ejemplo 2: El administrador del gimnasio ABC
está interesado en conocer la distribución de las
edades de las 42 personas inscritas y recopiló las
siguientes edades:
26 16 21 34 45 18 41 38 22
48 27 22 30 39 62 25 25 38
29 31 28 20 56 60 24 61 28
32 33 18 23 27 46 30 34 62
49 59 19 20 23 24

La distribución de frecuencias requiere los


siguientes cálculos:
abr.-18 ARITMETICA 21
CEPRE-UNI
Determinación del rango:
El dato mayor es 62 y el menor 16, por lo tanto
R = 62 – 16 = 46 años

Número de intervalos: Según una de las reglas elegimos


K = 6 intervalos, un valor próximo a
42
Amplitud: el cociente por exceso de R entre K:
R 46
  7,6  A  8
K 6
Intervalos de clase: elegimos el menor dato como límite
inferior del primer intervalo 16;.....

 , el límite superior
se obtiene al sumarle la amplitud: 16 + 8 = 24, queda así
establecido 16 ; 24 como primer intervalo; 24 ; 32


el segundo y así sucesivamente.

abr.-18 ARITMETICA 22
CEPRE-UNI
Marca de
i Intervalo Conteo Frecuencia
clase
16 ; 24 \\\\ \\\\ \
1  20 11
24 ; 32 \\\\ \\\\ \\\
2  28 13
3 32; 40 \\\\ \\ 36 7

4 40 ; 48 \\\ 44 3


5 48 ; 56 \\ 52 2


6 56 ; 64 \\\\ \ 60 6


 

Tabla 2. Edades de asistentes al gimnasio

abr.-18 ARITMETICA 23
CEPRE-UNI
Marca de clase: se obtiene por la fórmula
ai  bi
xi 
2
16  24 24  32
x1   20 x2   28 etc.
2 2
La frecuencia de cada intervalo se obtiene contando las
marcas que resultan del conteo.
Si se consideran además las frecuencias relativas y las
frecuencias acumuladas, se obtiene la siguiente tabla:

abr.-18 ARITMETICA 24
CEPRE-UNI
I Intervalo xi fi Fi hi Hi
16 ; 24
1 
 20 11 11 0,26 0,26
24 ; 32
2  28 13 24 0,31 0,57

3 32 ; 40 36 7 31 0,17 0,74




4 40 ; 48 44 3 34 0,07 0,81




5 48 ; 56 52 2 36 0,05 0,86




6 56 ; 64 60 6 42 0,14 1,00


 

n = 42 1,00

Tabla 3. Edades de asistentes al gimnasio


abr.-18 ARITMETICA 25
CEPRE-UNI
Histogramas
Son gráficos específicos para datos agrupados por
intervalos. Los histogramas asocian a cada intervalo un
rectángulo de superficie proporcional a la frecuencia. Los
límites de clase se marcan en el eje horizontal y
determinan las bases de los rectángulos y las frecuencias
se anotan en el eje vertical y determinan sus alturas.

abr.-18 ARITMETICA 26
CEPRE-UNI
abr.-18 ARITMETICA 27
CEPRE-UNI
Polígono de frecuencias

abr.-18 ARITMETICA 28
CEPRE-UNI
Ojiva
Frecuencias
acumuladas Frecuencias
acumuladas
relativas (en %)

abr.-18 ARITMETICA 29
CEPRE-UNI
Observación
Si “f” es la frecuencia en el intervalo de clase [a, b> y se
considera que los datos se distribuyen de manera
“uniforme” en ese intervalo, entonces podemos considerar
por ejemplo que en el intervalo [a, c] contenido en [a, b>
existen aproximadamente:

c a
f 
/
.f
ba

abr.-18 ARITMETICA 30
CEPRE-UNI
Ejemplo: En el intervalo [24; 32> la frecuencia es 13
(hay 13 datos), luego en el intervalo [24; 27] habrá

27  24
f'  .13  4.875  5 datos
32  24

Igualmente para una frecuencia relativa h:

ca
h 
/
.h
ba

abr.-18 ARITMETICA 31
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN

Los números que describen de manera concisa el


comportamiento y las características generales de un
conjunto de datos son los parámetros estadísticos.

Los parámetros que miden la tendencia central de los


datos se llaman medidas de centralización y los más
representativos son la media, la mediana y la moda.

abr.-18 ARITMETICA 32
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
MEDIA ARITMÉTICA

Se calcula dividiendo la suma de los valores de


todos los datos entre el número de datos

Para datos no agrupados: x  x i

Para datos agrupados: x


 f x'
i i

n
En la última fórmula fi es la frecuencia de cada
intervalo y x’i es la marca de clase.

abr.-18 ARITMETICA 33
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN

MEDIA ARITMÉTICA PONDERADA

Se aplica cuando no todos los datos tienen la misma


importancia o peso. Su fórmula es similar a la de los
datos agrupados, cambiando fi por los pesos pi y el
denominador N por la suma de todos los pesos; en este
caso xi sería el valor de cada dato.

xp 
 xp
i i

x1p1  x 2p 2  ...  x k pk
p i p1  p 2  ...  pk

abr.-18 ARITMETICA 34
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
MEDIANA
Es el valor del dato que ocupa la posición central cuando
éstos se ordenan de menor a mayor (o viceversa). Divide
a la lista de datos en dos grupos de igual número de
elementos.
Si el número de datos es par la mediana es la media de
los dos que ocupan las posiciones centrales.
Si el número de datos es impar la mediana es el dato
central.
Ejemplo:
Sean los datos: 9, 7, 8, 10, 8, 11; al ordenar se tiene:
7, 8, 8, 9, 10, 11. La mediana es: 8  9
 8,5
2
abr.-18 ARITMETICA 35
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
Para datos agrupados debe encontrarse primero
el intervalo mediano, y luego ubicar en dicho
intervalo la mediana (Me) con la fórmula:
N
 Fi1
Me  a i  2 .A
fi

ai = límite inferior del intervalo mediano


N = número de datos
i = el menor intervalo que cumple Fi > n/2
Fi-1 = frecuencia acumulada del intervalo i-1
fi = frecuencia absoluta del intervalo mediano
A = amplitud del intervalo
abr.-18 ARITMETICA 36
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
Ejemplo: En el caso de la gente que va al gimnasio, de
la tabla 3, la mediana es:
42
 11
Me  24  2 .8  30.15
13
Es decir, la mitad de las personas tienen 30
años o menos y la otra mitad supera esta edad

abr.-18 ARITMETICA 37
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
 Moda
Se define como el valor que más veces se repite en el
conjunto de datos. Si hay dos valores que se repiten
mayoritariamente y con igual frecuencia, la distribución
se llama bimodal.
d1
Para datos agrupados la moda es: Mo  a i  .A
d1  d2

ai =límite inferior de la clase modal (la que tiene la mayor frecuencia)


d1 =exceso de la frecuencia modal sobre la frecuencia de la clase
inmediatamente anterior a la clase modal
d2 =exceso de la frecuencia modal sobre la frecuencia de la clase que
sigue inmediatamente a la clase modal
A = amplitud del intervalo de clase modal.

abr.-18 ARITMETICA 38
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN

Ejemplo: En el caso de la gente del gimnasio la clase


modal es la segunda

2
Mo  24  .8  26
26
Es decir tienen 26 años la mayoría de las personas que
va a ese gimnasio

abr.-18 ARITMETICA 39
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN

 Media Geométrica
Es la raíz n-ésima del producto de los n datos.

MG  n x 1  x 2  x 3  .......... .....  x n

la media geométrica es siempre menor o igual que la


media aritmética

abr.-18 ARITMETICA 40
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
Media Armónica
Es el inverso de la media aritmética de los inversos de los
datos. Sus fórmulas son; para n datos:
n 1
MH  
1 1 1 1
  ... 
x1 x 2 xn
x
i

Para datos que se repiten: MH 


n
1
 fi x
i

(fi es el número de veces que cada valor xi se repite)


La media armónica es siempre menor o igual que la media
geométrica.
abr.-18 ARITMETICA 41
CEPRE-UNI
MEDIDAS DE CENTRALIZACIÓN
Ejemplo: en los datos: 7; 8; 8; 9; 10; 11
• La media aritmética es: 53
 8,833
6

• La media geométrica es: 6


7.8.8.9.10.11  8,73

6
• La media armónica es:  8,63
1 1 1 1 1 1
    
7 8 8 9 10 11
abr.-18 ARITMETICA 42
CEPRE-UNI
MEDIDAS DE DISPERSIÓN
Las medidas de tendencia central determinan el centro de
los datos estadísticos, pero no nos indican nada acerca
de la posición respecto al centro. Por lo tanto se necesita
una medida que nos indique el grado de dispersión o
variación respecto al centro con la finalidad de tener una
comparación y ampliar la descripción de los datos.
Las medidas de dispersión son:
El rango, rango intercuartil, la varianza, la desviación
estándar y el coeficiente de variación.
En este curso solo veremos la varianza y la desviación
estándar.

abr.-18 ARITMETICA 43
CEPRE-UNI
MEDIDAS DE DISPERSIÓN
VARIANZA Y DESVIACIÓN ESTÁNDAR
Definición:
La varianza es una medida que indica el grado de
dispersión o variación de los valores de una variable
cuantitativa respecto a la media aritmética.
• Si los valores de la variable tienden a acercarse
alrededor de la media, la varianza es pequeña.
• Si los valores de la variable tienden a estar lejos de
la media, la varianza es grande.

abr.-18 ARITMETICA 44
CEPRE-UNI
MEDIDAS DE DISPERSIÓN
Definición Matemática
La varianza es la media aritmética de los cuadrados de las
diferencias de los datos respecto a su media aritmética.
Sus unidades están elevadas al cuadrado.

Definición Matemática
La desviación estándar es la raíz cuadrada positiva de la
varianza.
La varianza calculada a partir de una muestra se denota
s2 y la desviación estándar es
s s
2

abr.-18 ARITMETICA 45
CEPRE-UNI
MEDIDAS DE DISPERSIÓN
Varianza para datos no tabulados
Si x1, x2, ...., xn son variables estadísticas cuantitativas y

x es su media, entonces la varianza es:


n n
 (xi  x) 2
aplicando propiedades de
 xi
2

s2  i1 sumatorias, se obtiene: 2

n
s 
2 i1
x
n
Ejemplo:
Si: 18, 19, 20, 16, 17, 22 son datos no tabulados que
representan las edades de los alumnos del CEPRE-UNI.
La varianza y la desviación estándar es:
abr.-18 ARITMETICA 46
CEPRE-UNI
MEDIDAS DE DISPERSIÓN
Resolución
n = 6,
n 2
x  112 x  18,6 n

i1
i
x
i1
i  2114

Luego la varianza es:


n

 xi
2
2 2114
s 
2 i1
x   18,6 2  6,373 años 2
n 8

La desviación estándar es:

S  s  6,373  2,52 años


2

abr.-18 ARITMETICA 47
CEPRE-UNI
MEDIDAS DE DISPERSIÓN

Varianza para datos tabulados por Intervalos

Si x1’, x2’, ............. x


xk’, son las marcas de clase de k
intervalos, f1, f2, ...., fk, son las frecuencias absolutas de
una variable x y es la media, entonces la varianza s2
es:

k aplicando k

 f ( x'  x)  f x'
2 2
i i propiedades i i
de sumatoria S  x
2 i 1 2
S  2 i 1
n
n se obtiene:
abr.-18 ARITMETICA 48
CEPRE-UNI
Ejemplo:
El siguiente cuadro representa el número de hijos de una
urbanización A, se desea saber, cuál es la varianza y
desviación estándar.

fi
li x’i X’i fi fi x’i2
 de hijos
[0,2> 1 15 15 15
[2,4> 3 12 36 108
5 7 35 175
[6,8>
7 1 7 49
[8,10> 9 3 27 243
[10,12> 11 2 22 242

40 142 832
abr.-18 ARITMETICA 49
CEPRE-UNI
k k
n  40 , k  6,  f x'  142  f x'  832
2
i i i i
i 1 i1

142
x  3,55 hijos
40
Luego la varianza es:
k

i
f x ' 2

832
S  i 1
x   3,552  8,1975 hijos 2
2 2

n 40
La desviación estándar es:

s  s 2  8,1975  2,86 hijos

abr.-18 ARITMETICA 50
CEPRE-UNI

Вам также может понравиться