Вы находитесь на странице: 1из 19

HISTORIA DE LA ESTADISTICA

Como bien sabemos los orígenes de la estadística se encuentran en tiempos remotos. En el antiguo
Egipto, ya existía una administración pública que recopilaba regularmente datos sobre tierras cultivadas y
producción. De la época Babilónica se han encontrado testimonios donde además de datos sobre
producción y comercio, se encuentra información sobre impuestos. Los romanos la aplicaron con el fin de
hacer sus censos y empadronamientos, en todas las provincias romanas. En la Biblia encontramos citas
de censos entre los que se cuentan uno llevado a cabo por Moisés (Números, 1,2-1.46) y un
empadronamiento en la época del nacimiento de Cristo (Lucas, 2.1). También fue usada por los chinos,
unos 2.000 años antes de Cristo, así como también por los persas, asirios y griegos.
Sin embargo, la estadística moderna, metódica y científica se atribuye al inglés Jhon Graunt (1620-1670)
quien publicó los primeros resultados de sus estudios, que analizaban las causas de muerte en Londres,
en el año 1662. Se considera también uno de los indicadores de la estadística como ciencia a Godofredo
Anchersen (1749). De aquí en adelante, muchos matemáticos contribuyeron a darle un fundamento
teórico, transformándola finalmente en una rama de la matemática.
El desarrollo de la estadística no ha concluido; todos los días se crean diferentes métodos para el manejo
de datos, su interpretación y la relación entre ellos. La computación, actualmente en desarrollo, ha hecho
un gran aporte al procesamiento de la información.
No es fácil definir lo que se entiende por estadística. Podemos decir que es la ciencia que se ocupa de la
recolección, clasificación y análisis del conjunto de datos procedentes de la observación o la
experimentación.

IDEAS O CONCEPTOS PRELIMINARES

Estadística: La estadística es la ciencia que se ocupa de la recolección, clasificación y análisis del


conjunto de datos procedentes de la observación o la experimentación con el fin de obtener conclusiones
validas, que sirvan para orientar una determinada actividad.

Población: Conjunto total de elementos, de donde se puede obtener información del fenómeno en
estudio.

Muestra: Se llama muestra a un subconjunto finito de la población en estudio. Se usa una muestra cuando
es imposible (o poco práctico) estudiar a todos los individuos de una población. En cualquier investigación
o análisis que se haga es fundamental que la muestra sea lo más representativa de la población de donde
proviene.
2. TIPOS DE VARIABLES.

Lo que se estudia en una muestra o población es una serie de variables en cada individuo o
elemento. Lo usual es considerar primero las variables una a una, sin plantearse problemas de asociación
entre ellas, por lo que podemos pensar sólo en una variable de cuyos datos imaginamos disponer en una
muestra (el número de datos es el llamado Tamaño de Muestra, para el que habitualmente se utiliza la
letra n). Los tipos de variables, y consecuentemente las clases de datos que se pueden encontrar, son
básicamente las siguientes:

A) Variables CUALITATIVAS, también llamadas CARACTERES, VARIABLES CATEGÓRICAS o


ATRIBUTOS, que son aquellas que no necesitan números para expresarse. Por ejemplo, el sexo de una
persona, nacionalidad, nacionalidad, estado civil, etc. Entre las variables cualitativas cabe distinguir:

1) las variables cualitativas ORDINALES, son las que teniendo más de dos modalidades tienen
establecido un orden natural entre las mismas ascendente o descendente y no de otra manera. Por
ejemplo, la variable “gravedad del pronóstico de lesiones traumáticas” podría tener como orden natural
entre sus modalidades “leve”, “moderado”, “grave”, etc., pero nunca diríamos “grave”, “leve”, “moderado”,
etc. en este orden.

2) las variables cualitativas PURAS, que no tienen un orden natural preestablecido entre sus
modalidades, y podemos utilizar cualquier ordenación para ellas, como por ejemplo el grupo sanguíneo,
nacionalidad de una persona, color de los ojos, sexo, profesión.

B) Variables CUANTITATIVAS o NUMERICAS, son aquellas que necesitan números para ser
expresadas, como la edad, o el número de páginas de un libro, número de hijos, cantidad de alumnos
aprobados, etc. Se pueden distinguir al menos dos subtipos:

1) las variables cuantitativas DISCRETAS, cuyos valores son aislados (habitualmente números
enteros), de forma que pueden enumerarse y existen valores “consecutivos” entre los que no puede haber
otro; Por ejemplo, un resumen puede tener 349 ó 350, pero no 349.17 palabras. Ej N° hijos, N° cargas
familiares, N° alumnos inscritos, etc

2) las variables cuantitativas CONTINUAS, que pueden tomar cualquier valor numérico, entero o
decimal, de forma que teóricamente entre dos valores posibles siempre se pueden encontrar otros (entre
65.3 Kg. y 65.4 Kg. de peso siempre está 65.37 Kg., por ejemplo). Ej Peso, Tiempo de llegada, Altura,
temperatura, altitud, etc.

La finalidad de algunos estudios estadísticos es la de Toma de Decisiones, puesto que después de


analizar y concluir a veces es necesario hacer algo al respecto.

Toma de decisiones: Una de las actividades fundamentales que realiza una persona que dirige, ya sea
una empresa o un grupo de trabajo, es la toma de decisiones.
Para tomar una buena decisión habría que seguir, por lo menos, las siguientes etapas:

a) Definir claramente el problema. Esto implica, entre otras cosas, especificar la población en estudio
y las variables, asociadas a los objetivos del estudio.

b) Obtener la información necesaria, usando por ejemplo: encuestas, fichas, entrevistas personales,
etc.

c) Describir la información obtenida, usando por ejemplo: cuadros, gráficos, medidas de resumen.

d) Interpretar los resultados obtenidos en la etapa anterior.

e) Elaborar conclusiones y Tomar las decisiones, más adecuadas, de acuerdo al análisis anterior.

La estadística, nos va a proporcionar los métodos y técnicas para describir e interpretar la información que
se tiene de algún fenómeno, de tal modo que esto sirva como una base objetiva para tomar alguna
decisión relacionada con él.
DESCRIPCION DE LA INFORMACION RELACIONADA CON UNA CARACTERISTICA DE UNA
POBLACION

Para describir la información que se obtiene de una característica de un fenómeno, se usan una serie de
instrumentos estadísticos, Entre los instrumentos más usados están los cuadros de frecuencias y los
gráficos. En esta oportunidad consideraremos los siguientes casos: información relacionada con una
variable Cualitativa o atributo y con una variable cuantitativa (discreta y continua).

1- Descripción de la información relacionada con una variable Cualitativa o atributo.


Cuando la información se refiere a atributos, los cuadros y gráficos son relativamente fáciles de realizar y,
las distintas formas de hacerlo, depende fundamentalmente de la habilidad e imaginación de la persona
que realiza el trabajo. Por ejemplo:

La empresa “EMELARI S.A.” cuenta con tres secciones: TRABAJO EN TERRENO, ADMINISTRACION y
SERVICIOS. Los directivos de la empresa desean un informe sobre la distribución de sus empleados
durante el mes de diciembre del 2017. Para realizar este análisis se eligió una muestra aleatoria de 136
empleados

DISTRIBUCION DEL PERSONAL “EMELARI S.A. “DIC. 2017

SECCION Nº DE PERSONAS PORCENTAJE


TRAB. EN TERRENO 64 47.06
ADMINISTRACIÖN 42 30.88
SERVICIOS 30 22.06
n=136 100%

Esta misma información también se puede describir en gráficos como los que a continuación se presentan.

El primero es un gráfico de barras y el segundo un gráfico circular

Barras: DISTRIBUCION DEL PERSONAL DE “EMELARI S.A”. DIC. 2014

Personas Porcentaje

64 47.06 %

42 30.88 %

30 22.06 %

TRAB. EN TERRENO ADMINISTRATR. SERVICIOS

Interpretación 2° barra: “Hay 42 personas que pertenecen a la sección de Administración, lo que


corresponde al 30,88% del total”
Circular: DISTRIBUCION DEL PERSONAL DE “EMELARI S.A” ARICA S.A. DIC. 2014

ADMINIST.
30.8%
TRABAJO EN TERRENO

47.06%
SERVICIOS
22.06%

Interpretación del sector mayor: “El 47,06% personal pertenece a la sección de Trabajo en terreno”

Tanto en el cuadro como en los gráficos, es posible apreciar que, en cuanto a personal, sería
relativamente más importante la sección TRABAJO EN TERRENO.

Se recomienda, en la construcción de cuadros y gráficos tener presente ciertas formalidades que faciliten
su comprensión y permitan interpretar correctamente los resultados. Por ejemplo que el encabezamiento
contenga la información mínima necesaria para entender claramente lo que allí se describe. Lo mismo
debe hacerse en los encabezamientos de columnas de los cuadros y en los ejes de los gráficos.

2- Descripción de la información relacionada con una variable Cuantitativa discreta.

Para organizar los datos, de una variable discreta, utilizaremos una Tabla de Frecuencias que contiene
cinco columnas que presentaran la información de la siguiente manera:
a. Encabezamiento, donde se indica toda la información mínima necesaria para entender
claramente lo que se describe.

b. Primera columna, donde se indican los distintos valores de la variable que se presentan en la

masa de datos. Se designan i Y= Clases o Categorías


c. Segunda columna, donde se indica el número de veces que aparece cada clase en la masa de

datos. Se designan como i f= Frecuencias Absolutas


d. Tercera columna, donde se indican, mediante porcentajes, las frecuencias absolutas. Se designan

como
h=
i Frecuencias Relativas
e. Cuarta y Quinta columna, aquí se indican las Frecuencias Absolutas y Relativas acumuladas. Se
designan:

i=k
F k=∑ f i
i=1 =Frecuencia Absoluta Acumulada

i=k
H k = ∑ hi
i=1 = Frecuencia Relativa Acumulada
Ejemplo- (Siempre trabajando con dos decimales y aproximado)
Supongamos que los directivos de la Fundación “INTEGRA.”, la cual tiene 5100 Integrantes, desean un
informe del “Número de Cargas Familiares” de sus empleados, porque la Fundación desea implementar un
sistema de bonificación de acuerdo con el comportamiento de dicha variable. Para hacer este análisis, se
eligió una muestra aleatoria de 60 empleados y se obtuvo así una masa de 60 datos, los que se dan a
continuación:

MASA DE DATOS.

3 2 0 2 4 3 1 4 5 0 0 1
5 3 2 4 3 3 2 1 5 4 3 2
2 4 1 1 3 3 3 2 1 3 2 4
3 5 4 5 4 3 2 5 1 6 2 3
4 6 0 1 2 5 6 1 2 4 3 1

TABLA DE FRECUENCIAS:

TITULO: “CARGAS FAMILIARES POR EMPLEADOS “INTEGRA.”

CARGAS EMPLEADOS PORCENTAJES EMPLEADOS PORCENTAJES


FAMILIARES
yi fi hi %
(ACUMULADOS)
Fi
(ACUMULADOS)
Hi %
0 4 6,67% 4 6,67%
1 10 16,67% 14 23,34%
2 12 20% 26 43,34%
3 14 23,33% 40 66,67%
4 10 16,67% 50 83,34%
5 7 11,67% 57 95,01%
6 3 5% 60 100,01%

Algunas Interpretaciones:

y4 = “Algunos empleados, de la Fundación “INTEGRA”, tienen 3 cargas familiares cada uno.”

f3 = “Hay 12 empleados, de la Fundación “INTEGRA, que tienen 2 cargas familiares cada uno.”

h5 = “El 16,67% que corresponde a 10 empleados de la Fundación “INTEGRA, tienen 4 cargas


familiares cada uno.”

F3 = “Hay 26 empleados, de la Fundación “INTEGRA, que tienen 0, 1 ó 2 cargas familiares cada uno.”
H 4 = “El 66,67% que corresponde a 40 empleados, de la Fundación “INTEGRA, tienen 0, 1, 2 ó 3
cargas familiares cada uno.”

Otra forma de describir la información, relacionada con una variable discreta, es mediante los gráficos de
barra, para las frecuencias absolutas, y los gráficos en escalera para las frecuencias acumuladas. Estos
gráficos describen en forma geométrica, lo mismo que se resume en el cuadro de frecuencias. El grafico
de barra se presenta a continuación:
GRÁFICO DE BARRAS:

En este gráfico, cada barra es ubicada en la clase


yi a una altura equivalente a la frecuencia absoluta

fi .

CARGAS FAMILIARES POR EMPLEADOS FUNDACIÓN “INTEGRA.”


Empleados Porcentajes

14 20,75

12 20%

10 16,67%

7 11,67%

4 6,67%

3 5%

0 1 2 3 4 5 6

Cargas Familiares
Interpretación de la tercera barra: “Hay 12 empleados de la FUNDACIÓN tienen 2 cargas familiares, que
representan al 20% del total de empleados”
GRAFICO DE ESCALERA:
En este grafico se describe lo que corresponde a las frecuencias absolutas y relativas acumuladas. En

este grafico, cada punto esta ubicado frente a la clase


yi a una altura equivalente a la frecuencia

acumulada
Fi .

CARGAS FAMILIARES POR EMPLEADOS FUNDACIÓN “INTEGRA.” (ACUMULADOS)

Empleados Porcentajes

60 100,01%
57 95,01%

50 83,34%

40 66,67%

26 43,34%

14 23,34%

4 6,67%

0 1 2 3 4 5 6
Cargas Familiares
Interpretación del tercer escalón: “26 empleados tienen cada uno 0, 1 ó 2 cargas familiares que
representan al 43,34% del total de empleados de la Fundación INTEGRA”.

3- Descripción de la información relacionada con una variable Cuantitativa continúa.

Veremos la forma de describir el comportamiento de un conjunto de datos de una variable continua,


mediante los correspondientes cuadros de frecuencia y gráficos.
En este caso, la información, se va a describir mediante un cuadro de frecuencias, donde los datos serán
clasificados de acuerdo a “intervalos de clase”, que son de igual amplitud.

Definición de los intervalos:

1. Se ubica el valor máximo y valor mínimo de la muestra, para proceder a realizar la resta entre
ambos valores. El valor que se obtiene lo denominaremos rango real:

X (máx . )−X ( min .)=Rangoreal


2. Dividiremos el rango real por el número de intervalos. Definiendo como amplitud (c) al entero
inmediatamente superior a la división realizada:

rangoreal
c≈
k
3. Posteriormente corregiremos el rango real, realizando la multiplicación entre la amplitud y el
número de intervalos, obteniendo el rango corregido.
c⋅k =rangocorregido
4. Finalmente realizaremos la resta entre el rango corregido y el rango real. La diferencia se repartirá
entre los extremos en forma más o menos equitativa, si sobra se repartirá más al extremo inferior
del intervalo.

rangocorregido−rangoreal=N °

NOTACION USADA
n: tamaño de la muestra
k: números de intervalos
X (máx.): valor máximo
X (min.): valor mínimo
c: amplitud de los intervalos

Ejemplo-
Se ha realizado un estudio sobre el Consumo Mensual de Electricidad (en Kw/hr), en los departamentos
de los edificios del sector Norte de Arica. Para esto, se eligió una muestra aleatoria de 40 departamentos,
de la población en estudio consistente en 3500 departamentos. El propósito de este análisis, es tomar
alguna decisión sobre rebajas en las tarifas de consumo, de acuerdo con el comportamiento de la variable
en estudio.

123 135 111 186 115 123 141 117 97 132


154 151 91 110 158 61 68 59 154 143
108 86 122 94 76 94 65 119 85 132
82 173 75 81 85 101 98 125 130 178

1) X(máx.) – X(min.) = 186-59 =127 (rango real)

rangoreal 127
= =25 , 4≈26
2) k 5 (amplitud “c”) Siempre de aproximando al entero superior.

3) c⋅k =26⋅5=130 (rango corregido)


2 1
4) Rangocorregido−rangoreal=130−127=3
57 59 186 187

Ahora podemos definir los intervalos:

I 1 =]57 ;83 ] ;
I 2 =]83 ;109 ] ;
I 3 =]109 ;135 ] ;
I 4 =]135 ;161] ;
I 5 =]161 ;187 ]

CONSUMO MENSUAL DE ELECTRICIDAD POR DEPARTAMENTO

CONS. MENS. DEPARTAMENTOS PORCENTAJES DEPARTAMENTOS PORCENTAJES


(kw/hr)
fi hi (ACUMULADOS) (ACUMULADOS)
] y j−1 ; y j ] % Fi Hi %
57-83 8 20,0 8 20,0
83-109 10 25,0 18 45,0
109-135 13 32,5 31 77,5
135-161 6 15,0 37 92,5
161-187 3 7,5 40 100,0

Algunas Interpretaciones:

I 2 =]83 ;109 ] “Algunos departamentos consumen, cada uno, entre 83 y 109 kw/hr de electricidad
al mes”
f 3= “Hay 13 departamentos que consumen, cada uno, entre 109 y 135 kw/hr de electricidad al mes”
h4 = “El 15% de los departamentos consume, cada uno, entre 135 y 161 kw/hr de electricidad al mes”
F3 = “Hay 31 departamentos que consumen, cada uno, entre 57 y 135 kw/hr de electricidad al mes”
H 2 = “El 45% de los departamentos consume, cada uno, entre 57 y 109 kw/hr de electricidad al mes”
La descripción de la información, relacionada con una variable continua, se puede hacer geométricamente
a través de gráficos. A continuación veremos dos de ellos: uno para las frecuencias absolutas
(HISTOGRAMA) y otro para las frecuencias acumuladas (OJIVA)

GRAFICO HISTOGRAMA:

Para construir el histograma, se levanta, en cada intervalo de clase


Ii una barra de altura equivalente

a la frecuencia absoluta
fi .

CONSUMO MENSUAL DE ELECTRICIDAD POR DEPARTAMENTO


Departamentos Porcentajes

13 32,5

25,0
10

8 20,0

6 15,0

3 7,5

57 83 109 135 161 187


Consumo Mensual [kw/hr]

Interpretación de la cuarta barra: “Hay 6 departamentos que consumen cada uno entre 135 y 161 Kw/hr
y representan al 15% del total de departamentos”.
GRAFICO DE OJIVA:

La ojiva se construye ubicando un punto en el extremo superior de cada intervalo


Ii a una altura

equivalente a la frecuencia acumulada


Fi . Luego se unen los puntos en una poligonal.

CONSUMO MENSUAL DE ELECTRICIDAD POR DEPARTAMENTO (ACUMULADOS)

Departamentos Porcentajes

40 100.0
37 92.5

31 77.5

18 45.0

8 20.0

57 83 109 135 161 187


Consumo Mensual [kw/hr]

Interpretación del tercer punto: “Hay 31 departamentos que consumen cada uno entre 57 y 135 Kw/hr
y representan al 77.5% del total de departamentos”.

Nota: Como es acumulado, la interpretación parte desde el comienzo de los consumos “57 kw/hr”
MEDIDAS DE RESUMEN

Las medidas de resumen son ciertos valores de la variable que sirven para caracterizar el comportamiento
de una población, principalmente a dos aspectos: la tendencia y la variabilidad.

La tendencia se puede entender como un valor alrededor del cual se ubican la mayoría de los datos de
una población, en general se mide con la media aritmética o promedio.

La variabilidad tiene que ver con el hecho que la información o los datos, que se obtienen son diferentes
en general, varían. La variabilidad se mide mediante la desviación típica y coeficiente de variación, entre
otras.

Generalmente se responden las siguientes preguntas:

a. ¿Alrededor de qué valor se agrupan los datos?

b. Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy
dispersos?

Medidas de Tendencia Central

La Media Aritmética (x)


Es la medida de resumen más frecuente. Se usa para caracterizar el comportamiento de la variable en
relación a la “Tendencia” que tienen que ver con la forma como los datos tendrían a agruparse alrededor
de un valor teórico.

a) Para datos agrupados por valores puntuales: Supongamos que los datos corresponden a una
variable discreta y la información está disponible en una tabla, como la siguiente:
K
yi fi
y1 f1 ∑
y i⋅f i Calcular
Ejemplo- e interpretar la media en ejercicio entregado
i=1anteriormente
y2 f x=
2 n
CARGAS EMPLEADOS
0⋅4+1⋅10+ 2⋅12+ 3⋅14+ 4⋅10+5⋅7+ 6⋅3
FAMILIARES
yk fk f x=
yi i 60
0 4 x=2.82
1 10 x≈3 Cargas Familiares
2 12
3 14
4 10
5 7
6 3 Nota: Como son cargas familiares siempre se debe aproximar al
entero para interpretar. No puede haber 2,82 cargas
n=60

Interpretación: “El promedio de cargas familiares por empleado de INTEGRA sería de 3 cargas”.
b) Para datos agrupados por intervalos: Supongamos que los datos se refieren a una variable

continua, clasificada en intervalos


I i =] y i−1 ; y i ] , entonces la media se calcula de la siguiente
manera:

k
∑ M i⋅f i
x= i=1
n

Donde
Mi es la marca de clase y corresponde al punto medio del intervalo
Ii . Está dado por la
expresión:

y i−1 + y i
M i=
2 (Es el promedio o punto medio del intervalo)

Ejemplo- Calcular e interpretar la media en ejercicio entregado anteriormente

MARCA DE CLASE CONS. MENS. DEPARTAMENTOS

Mi (kw/hr)
] y i−1 ; y i ]
fi
70 57-83 8
96 83-109 10
109-135 13
122
135-161 6
148 161-187 3
174

n=40

70⋅8+96⋅10+ 122⋅13+148⋅6+ 174⋅3


x=
40
4516
x=
40
x=112,9
Interpretación: “El consumo mensual de electricidad, por departamento, sería de 112,9 kw/hr”.
La Mediana e(M )
La mediana se designa como aquel valor de la variable en estudio que deja por debajo de el al 50% del
total de observaciones. O sea seria un valor de la variable que debería estar ubicado en el centro de la
distribución.

a) Para datos agrupados por valores puntuales: Para calcular la mediana se procede de la
siguiente manera:

1. Se calculan las frecuencias absolutas acumuladas


Fi
n
vd = Fi
2. Se calcula el valor determinante 2 y se ubica en la frecuencia acumulada , cuyo

valor sea inmediatamente a la frecuencia


Fi
3. Entonces, la mediana será la clase
yi , asociada a la frecuencia
Fi .

Ejemplo- Calcular e interpretar la mediana en ejercicio entregado anteriormente

CARGAS EMPLEADOS 60
FAMILIARES ACUMULADOS vd= =¿30∈ y 4
2
yi Fi
Fi
0 4 (Buscar en la columna de los acumulados donde está
1 12 contenido el v.d)
2 26
3 40 M =3
Cargas familiares
e
4 50
5 57
6 60
Interpretación: “El 50% de los empleados de INTEGRA tendrían 0, 1 , 2 o 3 cargas familiares”.

b) Para datos agrupados por intervalos: Para calcular la mediana en este caso, se procede en

forma análoga a como se hizo en el ejemplo anterior, hasta la determinación de


Fj , que nos
I
permite ubicar el intervalo i , que contiene a la mediana e . M
Una vez ubicado este intervalo se procede a calcular la mediana, usando la siguiente fórmula:
v . d −F i−1
M e= y i−1 +c j⋅
F i −F i−1

n
vd =
El valor determinante para el cálculo de la mediana es 2 . Este valor permite ubicar el
Fi .
Ejemplo- Calcular e interpretar la media en ejercicio entregado anteriormente

CONS. MENS. DEPARTAMENTOS


(kw/hr) (ACUMULADOS) 40
vd= =20∈ y 3
] y i−1 ; y i ] Fi 2
57-83 8 (Buscar donde está contenido el v.d)
83-109 18
109-135 31
135-161 37
161-187 40 Intervalo
Me donde está contenido
el valor de la mediana
v . d−F i−1
M e= y i−1 +c i⋅
Fi −Fi −1

20−18
M e=109+26⋅
31−18

M e=109+4

M e=113 kw/hr

Interpretación: “El 50% de los departamentos consume mensualmente entre 57 y 113 kw/hr de
electricidad al mes”.

La Moda y Modo ( Mo)

La moda que designaremos


M
o , se define como aquel valor de la variable en estudio, que se presenta
con mayor frecuencia en la distribución de los datos. Una distribución puede tener más de una moda.

a) Para datos agrupados por valores puntuales: Para calcular la moda, en este caso, se ubica la

frecuencia absoluta máxima que llamaremos


fi . Entonces la moda es el valor correspondiente a
la clase
yi .

Ejemplo- Calcular e interpretar la Moda en ejercicio entregado anteriormente

CARGAS EMPLEADOS
FAMILIARES
yi fi M o =3

0 4 Interpretación: “El número de cargas


1 10
familiares más frecuente, entre los
2 12
3 14 empleados de INTEGRA, sería de 3 cargas
4 10 familiares”
5 7
6 3
n=60
b) Para datos agrupados por intervalos: Tal como en el caso anterior, para calcular la moda, se ubica

primero la frecuencia absoluta máxima


fi . Entonces, la moda pertenece al intervalo
I i =] y i−1 ; y i ] que llamaremos intervalo modal. Entonces, la moda se calcula la siguiente fórmula:
f i−f i−1
Mo= y i−1 + ci
( f i−f i−1 )+( f i−f 1+1 )

Ejemplo- Calcular e interpretar la Moda en ejercicio entregado anteriormente

CONS. MENS. DEPARTAMENTOS


(kw/hr)
] y i−1 ; y i ]
fi
57-83 8
83-109 10
109-135 13
135-161 6
161-187 3
n=40

13−10
M o =109+26⋅
(13−10 )+(13−6 )
3
M o =109+26⋅
10
M o=116, 8

Interpretación: “El consumo mensual de electricidad más frecuente será de 116,8 Kw. /hr”.

Medidas de Dispersión

La desviación típica o standard (s) : la medida de dispersión más frecuente es la desviación típica. La
desviación típica, es una medida de dispersión absoluta, que se usa para cuantificar el aspecto
variabilidad dentro del comportamiento de una variable en estudio. Nota: se debe conocer el valor de la
media aritmética (promedio)

a) Para datos agrupados por valores puntuales: Supongamos de la muestra corresponden a una
variable discreta entonces la desviación típica, se define:

CARGAS EMPLEADOS
FAMILIARES
yi
0
fi
4
s=
√ ∑ ( y i −x )2⋅f i
n−1

1 10
2 12
3 14
4 10
5 7
6 3

s=
√ (0−2. 82 )2⋅4+(1−2. 82 )2⋅10+. .. . .. .. . .+(6−2. 82 )2⋅3
60−1 s= 1,60 ≈ 2 cargas

Interpretación: “El promedio de la diferencia con respecto a la media Aritmética, sería de 2 cargas
familiares”.
n=60

b) Para datos agrupados por intervalos: Consideremos que los datos de la muestra corresponde a
una variable continua, entonces la desviación típica se define:

s=
√ ∑ ( M i −x )2⋅f i
n−1

s=

(70−112. 9 )2⋅8+(96−112 . 9)2⋅10+. .. .. . .. ..+(174−112 .9 )2⋅3
40−1
s= 30,9 Kw /hr.

MARCA DE CONS. MENS. DEPARTAMENTOS


CLASE (kw/hr)
fi
Mi ] y i−1 ; y i ]
70 57-83 8
96 83-109 10
122 109-135 13
148 135-161 6
174 161-187 3

Interpretación: “El promedio de las diferencias con respecto a la media seria de 30,9 Kw. /hr”.

El coeficiente de variación (cv) : El coeficiente de variación es una medida de dispersión relativa que
se define para una variable, en la siguiente forma:
s
cv= ⋅100
x S=desv. Típica
x = Media Aritmética

El coeficiente de variación se utiliza para medir el grado de “homogeneidad” o de “parecido” de los


elementos de la población en estudio. Así, dicha población será más homogénea en la medida que el
coeficiente de variación sea más cercano a cero.

s 1, 60
cv= ⋅100 cv= ⋅100
a) Ejemplo de las “cargas familiares” x 2, 88 cv= 55,56 %
Interpretación: “El grado de homogeneidad o de parecido a la muestra sería de un
55,56 %”.

s 30 ,90
cv= ⋅100 cv= ⋅100
b) Ejemplo de las “Consumo de Electricidad” x 112 ,9 cv=
27,37 %

Interpretación: “El grado de homogeneidad o de parecido a la muestra sería de un


27,37 %”.

Conclusión: “Si comparamos ambas poblaciones “Cargas familiares” y “Consumo de electricidad”,


podemos concluir que en el consumo de electricidad la población es más Homogénea, ósea el consumo
de electricidad por departamento es más parecido entre ellos, ya que el Coef. de variación es más cercano
a cero”.

El percentil de orden k: Se define como aquel valor de la variable que deja por debajo de él, a lo más, al

K% del total de los datos. Se designa


Pk . La mediana se puede considerar como un caso particular de

percentil, es el
P50 .

a) Para datos agrupados por valores puntuales: Para calcular el percentil k, se procede en forma
nk
análoga a como se hizo para el cálculo de la mediana, pero el valor determinante v.d = 100 .

Ejemplo- Calcular e interpretar el percentil 63 para ejercicio entregado anteriormente

CARGAS EMPLEADOS
FAMILIARES (ACUMULADOS) P63=3
yi Fi n⋅k
Interpretación: “El 63% de los empleados de Integra tendrían
vd = 0, 1, 2 o 3 cargas familiares”
0 4
100 k = es el percentil pedido
1 12 60⋅63
2 26 b) Para datos
vd =
agrupados por
100 intervalos: Para calcular el
3 40 percentil k, se procede en forma análoga a como se hizo
4 50 para el cálculo devdla=37 ,8≈38pero(Buscar
mediana, el valor donde está contenido
determinante
5 57 nk en la columna de los acumulados)
6 60
v.d = 100 . Así para datos agrupados por intervalos:

v . d−F i−1
Pk = y i−1 + c j⋅
F i−F i−1

Ejemplo- Calcular e interpretar el percentil 84 para ejercicio entregado anteriormente

CONS. MENS. DEPARTAMENTOS


n⋅k
(kw/hr) (ACUMULADOS) vd =
Fi 100
] y i−1 ; y i ] 40⋅84
57-83 8 vd =
83-109 18
100
109-135 31 vd=33,6
135-161 37
161-187 40
(Como el valor determinante está ubicado en el intervalo ]135-161], esto implica que el valor del percentil
debe estar entre esos números)

33 . 6−31
P84=135+26⋅ P84=135+11 ,3 P84=146 ,27
37−31
Interpretación: “El 84% de los departamentos tendría un consumo mensual entre 57 y 146,27 Kw. /hr”.

Casos Especiales “Fractiles”.

Estas medidas de posición, que son llamados T - iles o Fractiles, están basados en los diferentes
porcentajes ( % ) en que puede dividirse el número total de datos de la población.

1.- Los CUARTILES representan la división en cuartos de la población, luego cada una de esas partes
contiene al 25% del total de datos de la población. Existen 3 cuartiles que se denotan C1 (25%) , C2
(50%), C3 (75%)

2.- Los QUINTILES dividen a la población en cinco partes iguales, cada una de ellas contiene al 20% de
los datos de la población. Existen 4 quintiles que se denotan por Q1 (20%), Q2 (40%), Q3 (60%), Q4
(80%)

3.- Los DECILES dividen a la población en diez partes iguales, cada una de ellas contiene al 10% de los
datos de la población. Existen 9 deciles que se denotan por D1 (10%), D2 (20%),......,D7 (70%), D8 (80%),
D9 (90%).

4.- Los PERCENTILES son 99 y contienen al 1% de la población y se denominan P1 (1%), P2 (2%),.., P98
(98%), P99 (99%).

Nota: El percentil 50 o Cuartil 1, coinciden con la Mediana, ya que la Mediana es el 50%


de los datos de la población.

Ejercicio.
En la población P, se han obtenido los datos de la Variable: sueldo de empleados, medidos en miles
de $, que están indicados en la tabla siguiente,

102 412 698 125 365 254 458 668 378 402
204 236 279 235 269 754 418 387 565 142
369 549 348 547 267 658 700 501 440 264
587 537 264 358 158 468 301 408 600 540
658 369 549 348 269 754 267 658 700 987
387 565 142 204 236 279 235 358 158 468
458 635 789 200 195 321 487 265 125 145
458 258 149 378 892 957 678 695 712 845

1. Hacer la tabla de frecuencias con 4 intervalos de clase.


2. Determinar e interpretar la media aritmética, desv. Típica, coeficiente de variación.

3. Determinar e interpretar la mediana y la moda.

4. Determinar e interpretar las medidas de posición C3 , Q2 , D8 , P95

Вам также может понравиться