Академический Документы
Профессиональный Документы
Культура Документы
La población puede ser finita o infinita, los empleados de una empresa forman una
población finita, mientras que la población formada con todos los posibles resultados
que se obtienen en lanzadas sucesivas de un dado, es infinita.
MUESTRA: Es una parte o subconjunto de la población o universo.
VARIABLE: Las observaciones sobre un determinado fenómeno en una población o en
una muestra generan un conjunto de datos, los cuales son tomados de acuerdo a
características particulares susceptibles de análisis, que se denominan variables.
Las variables pueden ser: cualitativas llamadas también atributos y cuantitativas.
Variables cualitativas o atributos son aquéllas en que las observaciones sobre un
determinado fenómeno se describen sólo como poseedoras o no, de ciertas
cualidades o propiedades, a menudo pueden ser expresadas numéricamente.
Las profesiones de los profesores de una universidad, las diferentes marcas de
cigarrillos existentes en el mercado, etc., son ejemplos de variables cualitativas.
Variables cuantitativas son aquellas en que las observaciones de un determinado
fenómeno, pueden hacerse sobre características que pueden ser transformadas en
datos numéricos por simple medición o conteo.
1
Por ejemplo: número de hijas hembras por matrimonio, montos de préstamos
hipotecarios, número de llamadas recibidas en una central telefónica en una hora,
estaturas, etc.
Las variables cuantitativas se clasifican en discretas y continuas.
Son variables discretas todas aquéllas que sólo toman valores enteros, como: número
de empleados de distintas empresas, cantidad de clientes que llegan a la taquilla de
un banco en una hora, número de habitaciones por apartamento, etc. Mientras que las
variables continuas pueden tomar valores enteros o no enteros, como: precios,
ingresos, temperaturas, velocidades, etc.
UNIDAD ESTADÍSTICA:
La unidad estadística es el sujeto en particular sobre el cual se está observando la
variable.
Por ejemplo: al considerar los diámetros de la producción de tornillos, el tornillo es la
unidad estadística y el diámetro es la variable. Si analizamos el precio actual de la
vivienda, la vivienda es la unidad estadística y un precio un valor particular de la
variable.
MASA DE DATOS:
Es el conjunto formado con las unidades estadísticas.
DATO ESTADÍSTICO:
Es el indicador estadístico, en otras palabras, es aquel elemento elaborado que surge
de la aplicación de métodos cuantitativos a las observaciones de un fenómeno en
estudio. Por ejemplo el precio promedio de una acción en el mercado de valores, la
proporción de venezolanos de bajos ingresos, la desviación de los pesos de un
determinado compuesto con respecto al peso promedio etc.
PROBLEMA:
Se realiza un estudio en la Parroquia Antímano del Municipio Libertador sobre el tipo
de transporte utilizado por sus residentes, para lo cual se encuestó a un grupo de
ellos, obteniéndose:
TIPO DE TRANSPORTE NÚMERO DE RESIDENTES
Auto particular 82
Taxi 44
Metro 84
Auto por puesto 104
Autobús 74
Otros 50
¿Cuál es: a) la población b) la muestra c) la variable y de qué tipo es? d) la unidad
estadística.
PROBLEMA:
Una fábrica produce tornillos para los cuales existen estrechos márgenes de
tolerancia en sus diámetros. El departamento de Control de calidad selecciona la
producción de un día y la somete a proceso de control.
2
¿Cuál es: a) la población? b) la muestra? c) la variable y de qué tipo es? d) la unidad
estadística?
ESTADÍSTICA DESCRIPTIVA:
Es el conjunto de métodos cuantitativos que permiten organizar y analizar
observaciones de un fenómeno en estudio, cuyas conclusiones no trascienden sobre
un conjunto mayor de observaciones (población).
ESTADÍSTICA INDUCTIVA:
Es el conjunto de métodos cuantitativos que permiten organizar y analizar
observaciones de un fenómeno en estudio, con el objeto de obtener conclusiones
sobre un conjunto mayor (población) que dio origen a dichas observaciones (muestra).
DISTRIBUCIÓN DE FRECUENCIAS:
El análisis de una variable requiere de un procedimiento previo, que consiste en
recopilar, ordenar y clasificar la información que arroja dicha variable.
3
Es la diferencia entre el valor mayor observado ( X M
) y el valor menor observado (
X m
) en una serie de datos.
I T
X M
- X m
CLASES:
Es el fraccionamiento que se hace del intervalo total en recorridos parciales de la
variable.
Las clases constan de un límite superior ( L S
) y un límite inferior ( L I
).
INTERVALOS DE CLASES ( i c
):
Es la amplitud o distancia entre el límite superior y el límite inferior de la clase y se
determina a través de su diferencia:
L S
- L i
En algunos casos se determina por la diferencia de los límites inferiores de dos clases
consecutivas.
FRECUENCIA ABSOLUTA ( f i
):
Es el total de valores iguales o diferentes que están comprendidos dentro de los
límites de una clase.( las veces que se repite un dato o clase)
PUNTO MEDIO O MARCA DE CLASE ( X CI
): o (Xm)
Es el valor que se supone más representativo de todos los comprendidos dentro de
los límites de clase, los cuales se consideran uniformemente distribuidos, se
determina por la semisuma de los límites de la clase:
Li
LS
x ci
2
CONSTRUCCIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS:
Se puede realizar por la aplicación del método de Sturges o a través del método
empírico o práctico.
Fórmula de Sturges:
i I T
c
1 3,322logN
4
20 30 35 20 40 23 33 37 36 39
40 32 40 25 24 29 39 27 20 23
24 39 24 22 21 34 24 23 38 25
20 25 28 29 31 37 24 38 33 20
30 32 35 34 36 28 34 34 33 36
34 27 32 30 30 22 36 38 37 32
TIPOS DE FRECUENCIAS:
FRECUENCIA ABSOLUTA ( f i
):
Es el número de veces que se repite un valor en una serie.
FRECUENCIAS RELATIVAS ( h ): i
n
Es el cociente entre la frecuencia absoluta y el número total de datos ( N f
i 1
i
)
h f
n
i
i
h i
1
N i 1
FRECUENCIAS ACUMULADAS:
Cuando la frecuencia absoluta o relativa de un determinado valor de la variable,
expresa la suma de las frecuencias (absolutas o relativas) de todos los valores de la
variable precedente y la suya propia, la frecuencia se denomina, frecuencia
acumulada. La frecuencia acumulada absoluta se denota por F i
y con H i
la
F
H i
frecuencia acumulada relativa; donde .
i
N
5
Gráficamente podemos representar una distribución de frecuencias a través de
histogramas o polígonos, usando indiferentemente frecuencias (absolutas o relativas)
absolutas o acumuladas.
Un histograma es un gráfico formado por rectángulos que tienen por base el intervalo
de clases de la distribución y por altura la frecuencia (absoluta o acumulada)
correspondiente a la clase.
Un polígono de frecuencias absolutas es una figura que se forma al unir los puntos
que se determinan levantando en el punto medio de cada clase, una altura igual a la
frecuencia absoluta correspondiente a la clase. Los extremos del polígono se cierran
en puntos situados, antes de la primera clase y a continuación de la última clase, a
una distancia igual a la mitad del intervalo de clase de la serie.
Una ojiva, se obtiene uniendo el límite inferior de la primera clase, con los puntos que
se determinan, levantando en el límite superior de cada clase, una altura igual a la
frecuencia acumulada correspondiente a la clase.
Para determinar el porcentaje de datos menores que un valor de variable dado “r” se
utiliza la fórmula:
f ( r - L i ) 100
P ( x r ) Fa a i
i c n
donde:
P (x < r): porcentaje de datos menores a un determinado valor “r” dado de la variable.
Faa: frecuencia acumulada anterior a la clase que contiene el valor dado “r”.
R: valor de variable dado.
Li: límite inferior de la clase que contiene a “r”.
Ic: intervalo de clase de la clase que contiene a “r”.
N: número total de datos.
Calcule:
a) El porcentaje de personas con pesos inferiores a 62Kg.
b) ¿Cuántas personas pesan entre 65 y 74 Kilogramos?
c) El número de personas con pesos superiores a 62 Kilogramos.
d) P(x <?) = 75%.
7
MEDIDAS DE TENDENCIA CENTRAL:
El estudio de la tendencia central es la primera etapa del análisis estadístico
propiamente dicho.
De un conjunto de datos, sea una simple lista o una distribución de frecuencias, se
puede obtener un elemento representativo de ese conjunto.
Existen varios elementos que pueden representar todos los datos de los cuales se han
extraído. Los dividiremos en dos categorías:
MEDIAS (promedios matemáticos)
MEDIDAS DE POSICIÓN (promedios no matemáticos).
Las medias al igual que las medidas de posición, son estadísticos representativos de
la serie de datos y reflejan su convergencia, por lo que se llaman medidas de
tendencia central.
MEDIAS
MEDIA ARITMÉTICA
La media aritmética es el valor de la tendencia central que más frecuentemente se usa
para representar los datos de una serie.
La media aritmética es igual al cociente que resulta de dividir la suma de todos los
datos de la serie por el número de ellos.
PROPIEDADES:
Si a todos los valores de la variable se les suma un mismo número “k” entonces, la
media aritmética queda aumentada (disminuida) en el valor “k”.
Si todos los valores de la variable se multiplican por un mismo número “k” la media
aritmética de esos valores quedará multiplicada por “k”.
N2 “ “ “ “ “ “ “ “ “ x 2
“ “ “ “ “ “ “ “ “ “ .
. “ “ “ “ “ “ “ “ “ .
. “ “ “ “ “ “ “ “ “ .
Nn “ “ “ “ “ “ “ “ “ x n
Y N = N1 + N2 + . . . . Nn, la media aritmética total será:
Nx
n
x
N x N x ... N x
1 1 2 2 n n
=
11 i i
N N ..... N N
n
1 2 n i 1 i
8
8. - Los siguientes valores:
MEDIA GEOMÉTRICA:
Si los “n” valores de una variable son x1, x2,......., xn, con xi > o (i = 1, 2,3,...., n), su
media geométrica representada por “G” viene dada por:
G n x . x .............. x
1 2 n
Ejemplo:
Halle la media geométrica de 5; 9; 20 y 39
9
Una de las aplicaciones de uso frecuente de la media geométrica es su utilización
para el cálculo de tasas de crecimiento interperíodos, ya que se asume que la
evolución en el tiempo de series es geométrica, y por tanto quien interpreta la
tendencia central de esos crecimientos es la media geométrica.
La tasa promedio de crecimiento se calcula a través de la siguiente fórmula.
in PF
-1
P o
siendo:
i: tasa promedio de crecimiento
n: número de períodos
PF : valor final de la serie
Po: valor inicial de la serie.
De acuerdo a coeficientes técnicos, por cada 1000 habitantes debe instalarse una
cama, ¿cuántas camas debe tener dicho hospital para el año 2.016?
10. - Se tiene la distribución del ingreso familiar mensual en una comunidad “A” en la
forma siguiente:
INGRESO FAMILIAR MENSUAL Nº DE FAMILIAS
500 1000 12
1000 1500 24
1500 2000 28
2000 2500 20
2500 3000 16
Para otra comunidad “B” el ingreso promedio mensual es de 1450 y dicha comunidad
está formada por 120 familias. La información anterior para ambas comunidades
corresponde al año 1998. Sí la comunidad “A” crece en 4% interanual y la comunidad
“B” en un 2% interanual. ¿Cuál será el ingreso promedio total para 2008 de ambas
comunidades, si los valores de los ingresos promedios de ambas comunidades se
incrementan en un 98%?
MEDIDAS DE POSICIÓN:
LA MEDIANA:
10
Este promedio quizás sea uno de los que más responde intuitivamente al concepto del
valor medio y en la práctica es uno de los más usados.
La mediana, denotada por Md es el valor central de “n” datos x1, x2, x3.,.....,xn
dispuestos en forma creciente, si “n” es impar, por ejemplo: para los datos 105; 98;
137; 82; 36; 84; 72, se ordenan en forma creciente 36; 72; 82; 84; 98; 105; 137 en
donde Md = 84.
En el caso de que “n” sea par, la mediana será la semisuma de los datos centrales,
por ejemplo: para los valores ordenados 15; 18; 20; 24; 31; 35, se obtiene
20 24
Md = 22
2
Para el caso de datos agrupados en clases usaremos la fórmula:
f
2
i
F
aa
M d Li * ic
f i
REMUNERACIONES Nº DE PROFESIONALES
30000 36000 6
36000 42000 10
42000 48000 20
48000 54000 22
54000 60000 18
60000 66000 14
66000 72000 10
Determine la mediana.
MODO:
Llamaremos modo o moda, al valor que se presenta más frecuentemente en una
serie, en otras palabras es el dato afectado de la mayor frecuencia.
11
5 7 6 5 4 3 5 4 3 6 6 5
se obtiene la serie:
xi fi
3 2
4 2
5 4
6 3
7 1
La moda es el valor 5.
M o Li
1
* ic
1 2
En donde:
FRACTILES:
Dentro de los estadísticos de posición se encuentran unos muy importantes para
indicar el fraccionamiento de una distribución de datos, que se denominan fractiles, de
los cuales los más usuales son: los deciles, los cuartiles y los percentiles.
12
Los cuartiles fraccionan la distribución en cuatro partes iguales: 25% de los valores
serán menores que el cuartil uno (Q1).
Siendo:
Los deciles fraccionan la distribución en 10 partes iguales. Por ejemplo, el 70% de los
valores serán menores que el decil 7 (D7).
i f i
- F aa
Di L 10 * ic
i
f i
Los percentiles fraccionan la distribución en 100 partes iguales. Por ejemplo, el 37%
de los valores serán menores que P37.
La fórmula para calcular los percentiles Pi, con i = 1, 2, 3,............., 99 es:
i f i
- F aa
P L 100 * ic
i i
f i
13
800 --- 900 160
900 --- 1000 50
1000 ---1100 60
a) Determine el alquiler que se presenta más frecuentemente b) determine el alquiler
más barato de los comprendidos en el 40% más caro c) ¿Cuál es el alquiler más
alto del 15% de las viviendas de más bajo alquiler? (D) ¿Cuántas viviendas pagan
de alquiler 650$.por mes, o menos?
Cuando se dice que una medida de la tendencia central es un valor que está
representando a una masa de datos, es necesario conocer, si realmente este valor
cumple con tal papel. En este estudio es imprescindible conocer la variabilidad
existente entre los diferentes valores de la serie con respecto al valor central, para
llegar a tal conclusión.
Por ejemplo si consideramos las series:
Serie 1: 52 54 56 61 62
Serie 2: 15 22 25 103 120
Ambas tienen la misma media aritmética 57, pero las dos son muy diferentes,
mientras una de ellas (serie 1) está formada por valores parecidos al promedio; la otra
(serie 2) sus valores son poco parecidos al valor promedio.
Entonces se hace necesaria una medida que refleje la disposición de la variable en
torno a la medida de la tendencia central, es decir que indique cuan representativa es
ella de la serie.
14
Los principales estadísticos de dispersión absolutos son:
a) Recorrido, rango o intervalo total, que es la diferencia existente entre el valor
mayor y el menor de la serie.
I T
X M
- X m
b) Desviación media, que es el promedio aritmético de los valores absolutos de las
desviaciones de los valores de la serie con respecto a la medida de la tendencia
central; las cuales son:
Datos no agrupados:
x i
- x
D x
N
Datos agrupados:
x -x f i
D i
x
f i
Datos no agrupados: x i
Md
D Md
N
Datos agrupados:
x i
-M d f
D i
f
Md
i
En una distribución simétrica, aproximadamente el 58% de los datos están
comprendidos en el intervalo:
x D Md
15
(C) Desviación típica o estándar (), es la raíz cuadrada de la media aritmética de los
cuadrados de los desvíos de los valores de la serie con respecto a su media
aritmética.
Datos no agrupados:
xi - x 2
ó
x
2
i
- x
2
N n
Datos agrupados:
xi -x 2
f i ó f i xi
2
- x
2
f i
f i
primer cuartil ( Q 1
) D Q
Q 3
- Q 1
f) Que cubre el 50% central de los datos de la distribución.
Q
Q 3
Q 1
2
CV . 100
x
B) Coeficiente de variación medianal (CVM), es el cociente entre la desviación cuartil
y la mediana, se expresa en porcentaje.
CVM
D Q
.100
M d
16
TEOREMA: Si el coeficiente de variación (CV ó CVM) es 20%, se dice que el
promedio es representativo de los datos.
VARIABLE TIPIFICADA:
Una variable de valores z i
carente de unidades, que se obtiene mediante la fórmula:
x -x
, Se denomina variable tipificada.
z i
i
tipificado ( z i
), en donde cada z i
representará la desviación de un dato específico (
16. – Una encuesta realizada entre dos grupos de familias arrojó la información
siguiente:
GRUPO 1 GRUPO 2
Gastos Medios por mes 1.200 1.400
Desviación típica por mes 30 40
17
Se conoce que una familia del grupo 1, tiene un gasto que corresponde en variable (
z i
) al valor –1,4 y otra del grupo 2 que corresponde a 0,8. ¿Cuál es el gasto por mes
de cada familia?
COSTOS
Bs./Km. Bs./Km.
MARCAS x
A 0,12 0,025
B 0,10 0,04
18. – Dos empresas filiales “A” y “B” desean premiar al vendedor de cualquiera de
ellas que obtuvo mejores ventas durante el mes, para el premio hay dos candidatos,
uno de la empresa “A” y otro de la empresa “B”; se tiene la información siguiente:
18
19
20