Вы находитесь на странице: 1из 16

ESTADÍSTICA GENERAL LIC. ELÍAS A.

TORRES ARMAS

CAPÍTULO
PRINCIPALES DEFINICIONES
1. ESTADÍSTICA. Ciencia que trata de la recopilación, organización, presentación,
análisis e interpretación de datos, proporcionando los métodos pertinentes, leyes
que lo rigen, asociación de las variables; que permiten realizar predicciones y
una optima toma de decisiones frente a la incertidumbre. Es una ciencia que
nos proporciona un conjunto de métodos, técnicas o procedimientos para:
Recopilar, Organizar (clasificar, agrupar), presentar, y Analizar, datos con
el fin de describirlos o de realizar generalizaciones válidas.
2. DIVISIÓN DE LA ESTADÍSTICA: La estadística de divide en dos partes: ESTADÍSTICA
DESCRIPTIVA O DEDUCTIVA: Su estudio incluye el de las técnicas de colectar, presentar,
analizar e interpretar los datos. ESTADÍSTICA INFERENCIAL O INDUCTIVA: Es el método y
conjunto de técnicas empleadas para determinar algo acerca de una población, teniendo como
base una muestra.
3. OBJETIVOS GENERALES DE LA ESTADÍSTICA: La estadística tiene tres objetivos: Describir
colecciones de datos empíricos. Inferir las propiedades de una población. Realizar predicciones
sobre el comportamiento de fenómenos.
5. CONCEPTOS BÁSICOS. La estadística usa diversos términos con un significado especial. Para
ello es conveniente especificar el significado de algunos de los más importantes y frecuentes. A
continuación se incluyen algunos términos.
5.1. DATO: Es el valor que toma una variable en cada unidad de análisis.
5.2. UNIVERSO: Es el conjunto de unidades o elementos que tienen
características comunes (personas, animales, fenómenos) bien definidos y
delimitados en el tiempo, espacio y contenido. Ejemplo:
 Conjunto de alumnos de la Universidad Peruana en el año 2004.
 Conjunto de pacientes con Sida del Hospital de Apoyo de Chachapoyas.
año 2003
 Docentes del magisterio regional de Amazonas. 2004
 Turistas nacionales y extranjeros que visitaron kuelap en el periodo 200-
2003
5.3. POBLACIÓN: Es el conjunto de datos o medidas tienen una o más
características en común de los elementos del universo. Se denota con la letra
N. Ejemplos:
 Las edades de los estudiantes de la UNAS matriculados el 2001-II
 Los promedios semestrales de los alumnos de la FIA-UNAT-A
matriculados el 2002-II
5.4. VARIABLE: Es una característica que se va ha investigar y que pueden
tener diferentes valores en los distintos elementos o individuos de un conjunto.
Se clasifican en:
POR SU NATURALEZA
a. VARIABLE CUALITATIVAS. Son variables cuyos valores son cualidades
que presenta la población. Por ejemplo:
Variable: valores:
PROFESIÓN Administrador, Estadístico,
Economista, Contador Público,
ESTADO CIVIL Soltero, casado, viudo, divorciado.
b. VARIABLE CUANTITATIVAS: Estas variables surgen cuando se puede
establecer cuanto o en que cantidad se posee una determinada
característica. Ejemplo: El consumo familiar, El ingreso familiar, Sueldo de
los obreros, Notas promedios de los estudiantes, Temperatura de horneado,
Oferta, demanda, etc. Las variables cuantitativas se dividen en:

1
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

DISCRETAS: Solo cuando puede tomar valores enteros. Por ejemplo,


número de hijos por familia. CONTINUAS: Si la variable puede tomar
cualquiera de todos los valores, teóricamente posible, entre dos valores
dados. Por ejemplo, el peso, la estatura, el tiempo de servicio, etc.
POR SU RELACION DE DEPENDENCIA
a. INDEPENDIENTES Explican el comportamiento de la variable dependiente
b. DEPENDIENTES Es la variable de estudio o variable objetivo
c. CONFUSORAS Son otros factores (variables) explicativos de la variable
dependiente
CAUSA (Variable independiente) EFECTO (Variable dependiente)
(Educación de madres) (La desnutrición: alta, media, baja, etc.
Rendimiento de los hijos: aprobado,
Desaprobado)

OTROS FACTORES
(Ingreso familiar, etc.)
Variables Confusoras
DE ACUERDO AL NUMERO DE VARIABLES
UNIDIMENSIONAL, BIDIMENSIONAL, MULTIDIMENSIONAL
POR SU ESCALA DE MEDICION
a. NOMINALES: Indican categorías (cualidades) en sus valores sin orden entre
ellas. Ejemplos: Variable: valores:
Estado civil soltero, casado, viudo, divorciado, etc.
Deporte favorito fútbol, basketbol, natación, etc.
Religión católico, protestante, adventista, etc.
Enfermedades sida, TBC, sífilis, etc.
b. ORDINALES: Establecen un orden en sus valores sin guardar igual distancia
entre ellas. Ejemplos: Variable: valores:
Grado de instrucción inicial, primaria, secundaria, superior.
Etapas de desarrollo Infancia, niñez, adolescencia, juventud, etc
Grado de desnutrición moderada, grave, etc.
c. DE INTERVALO: Establecen un orden, IGUAL DISTANCIA en sus valores,
pero no tiene un origen natural único. Ejemplo:
Variable: valores:
Coeficiente de inteligencia 78, 79, 80, etc.
Temperatura 10º, 20º, 30º, 40º, etc.
Test de aptitud 5, 7, 9, 11, etc.
d. DE RAZON: Indican un orden, igual distancia en sus valores y tienen un
origen natural único. Ejemplo:
Variable: valores:
Edad 0-5, 6-10, 11-15, etc.
Nº de hijos 0, 1, 2, 3, 4, 5, 6, etc.
Peso en kg. 0-10, 10-20, 20-30, etc.
Ingreso en soles 0-100, 100-200, 200-300, etc.
6. LA INVESTIGACIÓN ESTADÍSTICA. Es toda operación orientada a la recopilación de
información sobre una población. La investigación puede ser tan simple como la recopilación de
datos estadísticos obtenidos de informaciones provenientes de fuentes oficiales a nivel
institucional o de publicaciones de organismos altamente especializados en estas materias, o tan
complejas que requiera de la colaboración de especialistas en diferentes materias, como ocurre,
por ejemplo, en los censos de población de un país.
7. EXPERIMENTO ESTADÍSTICO. Es en general, el estudio de una situación creada, en donde la
población es inexistente o mejor dicho hipotética; el objeto del experimento es establecer, los
métodos estadísticos, algunas características de la población si esta existiera.

2
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

8. MÉTODOS PARA RECOLECTAR DATOS: Existen tres principales métodos con los cuales el
investigador puede obtener los datos: El investigador puede recudir a datos ya publicados por
fuentes gubernamentales, industrias, compañías o individuales. El investigador puede diseñar un
experimento para obtener los datos necesarios. Puede efectuar una encuesta.
8.1. FUENTES DE INFORMACIÓN: Es el lugar, la institución, la persona, donde están los datos
que se necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de
datos pueden ser: FUENTES PRIMARIAS, FUENTES SECUNDARIAS.
8.2. DISEÑO DE EXPERIMENTO: Es un segundo método de recolección de la información. Los
diseños experimentales deben utilizarse siempre que sea posible cuando se desee construir
modelos explicativos.
8.3. ENCUESTAS: Proceso de recopilar la información a través de una muestra.

CAPÍTULO II
PRESENTACIÓN DE DATOS

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS: En esta etapa los datos son


evaluados, organizados, tabulados y presentados en forma de tablas o gráficos.
Debemos detallar el modo en que los datos son presentados.
FORMA DE PRESENTAR LOS DATOS: Existen dos formas de presentar los datos
estadísticos: En forma tabular o numérica y en forma gráfica.
A. EN FORMA TABULAR O CUADRO ESTADÍSTICO: Toda presentación tabular
o numérica consiste en ordenar los datos que se desea mostrar, en filas y en
columnas. Un cuadro estadístico tiene las siguientes partes principales:
1. NÚMERO: Es el código de identificación que permite ubicar el cuadro en el interior de un
documento.
2. TÍTULO: Todo cuadro debe tener un título claro y conciso que responda a las siguientes
interrogantes: QUE, CÓMO, DÓNDE Y CÚANDO SE HIZO.
Por ejemplo: ENCUESTA SOBRE LOS INGRESOS MENSUALES DE LAS FAMILIAS DEL PJ.
BELLA DURMIENTE EN LA CIUDAD DE TINGO MARIA. JULIO DEL 2001.
¿QUE ES? Es una investigación sobre los ingresos mensuales. ¿CÓMO SE HIZO? Mediante
una encuesta. ¿DÓNDE SE REALIZO? En el PJ. Bella Durmiente de la ciudad de Tingo María.
¿CUÁNDO SE HIZO? En el mes de Julio del 2001.
3. ENCABEZAMIENTO: Es la descripción de las filas y columnas del cuadro estadístico. Se ubica en
la parte superior del cuerpo. Indica las variables y sus categorías o intervalos.
4. CUERPO DEL CUADRO: Viene a ser el contenido numérico del cuadro. Corresponde a la
distribución de los datos según la clasificación en categorías de las variables.
5. PIE DEL CUADRO: Se utiliza para indicar si el cuadro fue tomado de otra publicación, haciendo
mención sobre la fuente, autor, etc.
6. FUENTE: Sirve para nombrar la publicación, entidad, departamento, oficina, de donde se
obtuvieron los datos utilizados para la elaboración del cuadro.
B. EN FORMA GRÁFICA: Una vez presentado los datos estadísticos en forma
tabular, es conveniente construir su gráfico respectivo los cuales permiten una
rápida y fácil comprensión de la información realizada en la investigación.
GRÁFICOS SEGÚN EL TIPO DE VARIABLE
PARA VARIABLES CUALITATIVAS: Se utiliza los siguientes gráficos: Gráficos
de barras. Gráficos de sectores circulares, Gráficos de pictográmas.
PARA VARIABLES CUANTITATIVAS: Se utiliza los siguientes gráficos:
2.1 PARA VARIABLES CON DATOS ORIGINALES. Gráficos de Bastones
2.2 PARA VARIABLES CON DATOS AGRUPADOS. Gráficos de Histogramas.
Gráficos de Polígonos de Frecuencias.
ELEMENTOS O PARTES DE UN GRAFICO:
1. Título: Que indique la situación estudiada, la época y el sitio.
2. Las escalas con respectivas unidades de medida y cuerpo.
3. La indicación del as convenciones adoptadas (generalmente de una misma situación en dos a
más regiones o en fechas diferentes (leyenda).
4. La fuente de la información de donde se extrajeron los valores.

3
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

ORGANIZACIÓN Y PRESENTACIÓN DE INFORMACIÓN ESTADÍSTICA DE


DATOS CUALITATIVOS.

CUADROS Y GRÁFICOS ESTADÍSTICOS. Se tiene barras o columnas, sectores


circulares. Ejemplo: Una encuesta a 99 alumnos sobre puntualidad de sus
profesores universitarios, reportó los siguientes datos, con los que se construyó un
cuadro y los gráficos respectivos.
11. ¿Tus profesores llegan puntualmente a dictar sus clases?
3 3 3 1 1 3 1 3 1 3 1 3 1 1 1 3 1 3 2 1
3 2 1 1 1 3 3 3 1 3 3 1 1 3 1 3 1 3 3 3
3 3 3 3 1 1 3 3 1 3 1 3 1 3 3 1 1 3 3 3
3 2 3 3 1 1 1 3 1 3 1 3 1 3 3 1 1 3 2 1
3 1 3 1 1 1 3 1 1 1 1 3 1 1 1 3 3 1 3
Si=1 No=2 Más ó menos=3
CUADRO: Obsérvese que el cuerpo tiene tres columnas, la primera hace referencia
a la variable puntualidad del profesor a clase, la segunda a los elementos (alumnos)
de la muestra quienes contestan la encuesta y la tercera refiere la cifra porcentual.
11. ¿Tu s profesores lleg an p untu almente a
di ctar su s clases?
Es puntual
Alumnos %
Si 46 46.5
No 4 4.0
Más ó menos 49 49.5
Total 99 100.0

GRÁFICOS DE BARRAS 11. ¿TUS PROFESORES LLEGAN

HORIZONTALES: PUNTUALMENTE A DICTAR SU CLASE?

Una variante de este gráfico es el de Si 46

barras ilustra yuxtapuestas y representa la No

relación entre los valores o categorías


Más ó menos 49
individuales y el total.
GRÁFICO DE COLUMNAS 0 10 20 30 40 50 60

11. ¿TUS PROFESORES LLEGAN %


Ilustra comparaciones entre categorías.
Muestra las alteraciones que sufren los PUNTUALMENTE A DICTAR SU CLASE?
60
%

datos en un intervalo de tiempo. Cada


50
categoría está representada por un 46
49

40
rectángulo de área proporcional a su valor
30
(si los rectángulos tuvieran la misma base,
20
es suficiente considerar la
10
proporcionalidad en relación con las 0 4

alturas Si No Más ó menos

También tiene una variante de las columnas yuxtapuestas, representa la relación


que hay entre los valores ó categorías individuales y el total. Ejemplo, los gráficos
que podría generarse para los siguientes datos:
CUADRO N° 7: VENTA DE
EQUIPOS
Meses Radio Televisión
Enero 100 50
Febrero 120 50
Marzo 130 45
Abril 110 60
Mayo 50 20
Junio 10 70

4
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

GRAFICO N° 7: VENTA DE EQUIPOS


GRAFICO N°8: VENTA DE EQUIPOS
200

180 100%
160
90%
80%

Número de equipos
140
70%
120 60% Televisión

%
Televisión 50%
100
Radio 40% Radio
80
30%
60 20%
40 10%
0%
20

o
o

o
ri l
er
er

ay

ni
Ab
ar
0

br

Ju
En

M
M
Fe
ro

o
ro

nio
il
z

ay
br
re
ne

ar

Ju
A
eb

M
M
E

F
Meses
Me s

11. ¿TUS PROFESORES LLEGAN


GRÁFICO DE SECTORES CIRCULARES PUNTUALMENTE A DICTAR SU CLASE?
Se usa cuando se quiere comparar el total de cada Más ó menos

categoría con el conjunto total. Cuando la 49.5%

representación tuviera como objetivo analizar la


Si
participación de cada categoría en relación con el 46.5%

total. Pues los sectores permiten establecer la No

comparación entre los valores y el total 4.0%

GRÁFICO DE BARRAS AGRUPADAS GRAFICO 1. PORCENTAJE DE CALIFICACION PROMEDIO


ALCANZADO POR ASIGNATURAS DE LOS ESTUDIANTES
ORPIAN VERSUS REGULAR. UNAT-A. 2002-2005. (Esca la 0-20)

Si se trata de comparar solamente las 80

70

componentes o las frecuencias en cada 60

50

modalidad, se puede usar gráfico de % 40

30
orpian
regular

barras agrupadas. En cada modalidad 20

10

se trazan tantas barras adjuntas como 0


Matemàtic a Comun ic ac iòn
y lenguaje
A ntropologìa

As ignatur a/Or pian-Re gular


Ps ic ologìa A nàlis is de
realidad

componentes hay.

EL GRÁFICA DE BARRAS COMPONENTES


a) Si se quiere resaltar a la vez el total y las frecuencias de cada componente en
cada modalidad, entonces, se traza una barra cuyo largo es proporcional al total
de sus datos.
b) Si se trata de destacar la importancia relativa de sus componentes, todas las
barras son de igual longitud y equivalente al 100% en cada categoría

Existe otra gran variedad de gráficos o diagramas para mostrar datos o relaciones
entre varios grupos de datos. Aquí la imaginación del dibujante juega un papel muy
importante.

ORGANIZACIÓN Y PRESENTACIÓN DE INFORMACIÓN ESTADÍSTICA DE


DATOS CUANTITATIVOS.

DATOS: LISTADO SIMPLE DE DATOS. (ESTADÍSTICA TIPO I)

CUADROS Y GRÁFICOS ESTADÍSTICOS DE DATOS ORIGINALES


(ESTADÍSTICA TIPO II)
Para la presentación de los datos estadísticos en forma tabular es importante tener
presente los siguientes conceptos:
FRECUENCIA: Es el número exacto de veces que se repite el valor de una variable
FRECUENCIA ABSOLUTA (fi) ó (ni): Es el número de veces que se repite un valor
de una variable.
m
0  fi  n f
i 1
i  n n : número total de datos

5
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

FRECUENCIA ACUMULADA (Fa) O (Ni): Es la suma de una frecuencia absoluta y


todas las anteriores a ella.
F1=f1 F2=fi+f2 F3=f1+f2+f3 F4=F3+f4 F5=F4+f5 …
m
FI   fi f i  FI  n
i 1
FRECUENCIA RELATIVA (hi): Es el cociente de la frecuencia absoluta fi y el
número total de datos n.
m

hi = fi /n 0  hi  1 i  1,2,3,... h
i 1
i

FRECUENCIA RELATIVA ACUMULADA (Hi). Es la suma de una frecuencia (hi)


dada y todas las anteriores a ella
h1  H I  1 h1  H 1 Hm 1
Por ejemplo: Calcular H 3. Solución: H 3 = = h 1 + h 2 + h 3
FRECUENCIAS PORCENTUALES SIMPLES Y ACUMULADAS

Ejemplo. Para estudiar la producción de artículos de una fábrica se tomaron 100


lotes de 250 artículos cada uno. El número de artículos defectuosos fue como sigue:
DATOS: (ESTADÍSTICA TIPO I)
1 3 4 5 7 1 7 7 8 2 5 4 5 2 2 4 4 4 3 4
1 2 4 5 7 6 5 3 5 4 6 6 3 4 2 4 3 2 4 5
2 2 1 3 4 4 4 5 2 6 4 3 5 5 3 2 4 2 6 4
4 2 4 7 4 1 2 4 6 4 5 5 3 3 5 3 5 6 3 5
4 8 6 3 5 5 6 6 3 5 3 3 3 2 4 5 8 5 5 3
CUADRO: Obsérvese que en la primera columna, los valores de la variable están
representado un único valor en cada clase; eso hace que el cuadro se le denomine
CON DATOS ORIGINALES pues no admite modificación como se verá en caso de
los intervalos.
CUADRO N° 01. NÚMERO DE ARTÍCULOS
DEFECTUOSOS DE UNA FABRICA

fi Xi % %acum
1.00 5 5.0 5.0
2.00 14 14.0 19.0
3.00 18 18.0 37.0
4.00 24 24.0 61.0
5.00 21 21.0 82.0
6.00 10 10.0 92.0
7.00 5 5.0 97.0
8.00 3 3.0 100.0
Total 100 100.0

Fuente: Departamento de producción GRAFICO DE BASTONES:

CUADROS Y GRÁFICOS ESTADÍSTICOS DE DATOS MODIFICADOS POR


INTERVALOS. (ESTADÍSTICA TIPO III)

RECORRIDO O RANGO (R): Es el recorrido de la variable y se calcula restando el


número menor del número mayor. R = Nº MAYOR - Nº MENOR
NUMEROS DE INTERVALOS (m): En la práctica m se determina atendiendo varios
factores tales como: finalidad del estudio, grado de variabilidad de los datos,

6
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

necesidad de efectuar comparaciones: Se recomienda que el número de intervalos


no sea menor de 5 ni mayor de 15. Algunas veces es necesario tener el número de
intervalos aplicando la regla de STURGES, con la cual se obtiene una aproximación
aceptable necesaria para agruparlos, la fórmula es la siguiente: m = 1 + 3,322 Log n.
En el simposio de matemática 1985. Universidad San Agustín de Arequipa se
propuso la fórmula (LEY DE PORTUGAL)
m=1+3,322logn; n  50
m=1,8914+3,9910log n; 50<n  100
m=2,5760+5,8154log n; n>100
Método de la raíz: m=2,5(n)1/4, m=n1/2

No es conveniente señalar reglas generales en esta materia, ya que la información


del cuadro depende, en primer lugar, del tamaño de la muestra, o el número de
datos disponibles, y en forma muy importante, de los objetivos que se persiguen.
Esto es preponderante la experiencia del estadístico, el que en última instancia,
debe ser quién determine la presentación del cuadro (O’Ottone 1967. pp. 36).

TAMAÑO DE CLASE O AMPLITUD DE CLASE (C): La amplitud de clase no es


necesario que sea igual para todos los intervalos, sin embargo se puede considerar
el valor de C constante para todos los intervalos, son la siguiente fórmula: C = R/m
Se procede a elaborar la tabla de frecuencias.
MARCA DE CLASE (X i): Es la semisuma del límite superior y el límite inferior de un
intervalo. Xi = (LI + LS )/2

Ejemplo: Supongamos una muestra de 60 empleados de la Empresa Carolina S.A,


cuyos sueldos mensuales en nuevos soles, están dados por los valores siguientes:
308 325 425 530 375 305 410 330 460 270 425 557
265 425 315 410 460 500 370 410 341 308 425 250
354 355 341 355 320 410 400 385 452 460 452 500
375 410 256 354 385 355 510 400 400 385 385 265
338 300 400 355 350 280 210 500 312 365 525 338
Construir una tabla de frecuencias que muestre la distribución de los sueldos
mensuales por intervalos.

DESARROLLO: Para construir la tabla de frecuencias se sigue los siguientes pasos:


1. IDENTIFICAR: Muestra: 60 empleados, n = 60. Variable: X, sueldo mensuales de
los empleados.
2. IDENTIFICAR: El mayor valor de X: N º mayor = 557 (sueldo más alto). El menor
valor de X: Nº menor = 210 (sueldo más bajo)
3. CALCULAR EL RANGO (R): R = 557 - 210 = 347 NUEVOS SOLES.
4. Determinar el número de intervalos (m), mediante la siguiente formula.
m=1+3.32 Log (60) m = 6.90. Como m es número de intervalos, debe ser un
entero, por lo tanto debe redondearse al entero inmediato superior, es decir m=
7 intervalo.
5. Determinar la amplitud C de los intervalos. La amplitud de intervalo es la
diferencia entre sus valores extremos. En la práctica la amplitud se calcula
dividiendo el rango entre el número de intervalos. C = R/m. Reemplazando los
valores de R y m se obtiene C = 347/7= 49.57, Entonces C lo aproximamos a
50.
Se procede a elaborar la tabla de frecuencias.

7
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

CUADRO Nº 02: DISTRIBUCIÓN DE 60 EMPLEADOS SEGÚN SUS SUELDOS EN LA EMPRESA


CAROLINA S.A. SEPTIEMBRE DEL 2001 TINGO MARÍA.
SUELDOS fi Fi hi Hi
[210 260] 3 3 0.05 0.05
<260 310] 9 12 0.15 0.20
<310 360] 15 27 0.25 0.45
<360 410] 17 44 0.28 0.73
<410 460] 9 53 0.15 0.88
<460 510] 4 57 0.07 0.95
<510 560] 3 60 0.05 1.00
60 … 1.00 …
TOTAL
FUENTE: PLANILLA DE HABERES DE LA EMPRESA CAROLINA S.A.
f 4 = 17 empleados tienen sueldos entre 360 y menos de 410 nuevos soles. F3 = 27
empleados tienen sueldos entre 210 y menos de 360 nuevos soles. h4 = 0.28, 28 %
de los empleados tienen sueldos entre 360 y menos de 410 nuevos soles. H5 =0.88,
88 % de los empleados tienen sueldos entre 210 y menos de 410 nuevos soles.
El siguiente cuadro fue generado mediante STATGRAPHICS Plus. Obsérvese que
genera intervalos del tipo <….] por ello, dependerá del calculista y su experiencia
para hacer la presentación, pues el recorrido de la variable es del tipo [….].
Además, podría asumir intervalos del tipo […..>.
CUADRO Nº 02: DISTRIBUCIÓN DE 60 EMPLEADOS SEGÚN SUS SUELDOS EN LA EMPRESA
CAROLINA S.A. SEPTIEMBRE DEL 2001 TINGO MARÍA.
-----------------------------------------------------------------------------------------------------------------------------------
Límite Límite Frecuencia Frecuencia Frecuencia
Clase Inferior Superior Marca Frecuencia Relativa Acumulativa Acum.Rel.
-----------------------------------------------------------------------------------------------------------------------------------
Menor o igual 210.0 1 0.0167 1 0.0167
1 210.0 260.0 235.0 2 0.0333 3 0.0500
2 260.0 310.0 285.0 9 0.1500 12 0.2000
3 310.0 360.0 335.0 15 0.2500 27 0.4500
4 360.0 410.0 385.0 17 0.2833 44 0.7333
5 410.0 460.0 435.0 9 0.1500 53 0.8833
6 460.0 510.0 485.0 4 0.0667 57 0.9500
7 510.0 560.0 535.0 3 0.0500 60 1.0000
Mayor 560.0 0 0.0000 60 1.0000
-----------------------------------------------------------------------------------------------------------------------------------
Media = 378.6 Desviación típica = 76.2794
GRAFICOS PARA DATOS AGRUPADOS POR INTERVALOS, se tiene: gráfico de
puntos, histogramas, polígonos, etcétera.
HISTOGRAMA DE FRECUENCIAS SIMPLES HISTOGRAMA DE FRECUENCIAS ACUMULADAS

CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA. CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA.

18 100

15 80
E m pleados
E m p le a d o s

12
60
9
40
6
20
3

0 0
210 310 410 510 610 210 310 410 510 610
Sueldos
Sueldos

POLÍGONO DE FRECUENCIAS ACUMULADAS POLÍGONO DE FRECUENCIAS SIMPLES


CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA.

CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA.


18
60
15
E m pleados

50
E m pleados

12
40
9
30
6
20
3
10

0 0
210 310 410 510 610 210 310 410 510 610

Sueldos Sueldos

8
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

GRÁFICA DE LÍNEA. Sí se quiere resaltar variaciones de los datos a través del


tiempo, se utiliza una gráfica de líneas, la misma que se obtiene uniendo con
segmentos, puntos de la forma: (tiempo, frecuencias) en cada modalidad y para una
o más de las partes componentes.
GRAFICO N°9: V ENTA DE EQUIPOS

140

120

100

o
80
Radio

Número
Televisión
60

40

20

ro

o
ro

o
li
z

ay

ni
br
re
ne

ar

Ju
A
eb

M
M
E

F
Meses

CAPÍTULO III: MEDIDAS DE RESUMEN

MEDIDAS DE TENDENCIA CENTRAL

Medidas de tendencia central. Son valores representativos del conjunto de datos.


Las medidas de tendencia central indican el punto medio del recorrido de los datos.
También reciben el nombre de medidas de localización o posición. Se usan para
describir y sintetizar con un número único, denominado promedio, la posición de un
valor en la variable, en tal forma que represente al conjunto de valores en estudio.
Las medidas de tendencia central más importantes son:
La media aritmética, media o promedio. Mediana. Moda. Media Geométrica.
Media Armónica. Los cuantiles (cuartiles, deciles, y percentiles).
Medidas de dispersión. Son medidas estadísticas que muestran como se distribuye
o dispersan las observaciones de un conjunto de datos respecto a un valor central,
generalmente la media aritmética. Las medidas de variabilidad que se estudiará en
este capítulo son: la desviación estándar, la varianza y el coeficiente de variación.
MEDIDAS DE SESGO O ASIMETRIA. Hay ocasiones en que es deseable calcular
una medida que muestre la dirección de la dispersión con respecto al centro de la
distribución. Las medidas de asimetría indican la deformación horizontal de las
curvas de frecuencias, tal como se muestra en las figuras anteriores.
MEDIDAS DE KURTOSIS O APUNTAMIENTO. Se entiende por kurtosis al grado de
deformación vertical (apuntamiento) de una distribución de frecuencias y se mide en
relación a la altura de la curva.

PARA DATOS SIN TABULAR (LISTADO DE DATOS)


ESTADÍSTICA TIPO I

LA MEDIA ARITMETICA. Es el cociente entre la suma de todos los valores de una


población o muestra y el número de observaciones con que cuenta la población o
muestra.
MUESTRA POBLACIÓN
n N

X i X i

X  i 1  i 1

n N

9
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

Ejemplo: Se tiene los siguientes pesos de 8 alumnos se pide calcular el peso


promedio. 68, 72, 65, 70, 69, 70, 71, 70.
Solución: X = (68+ 72+ 65+ 70+ 69+ 70+ 71+ 70)/8=68.38 kilogramos. El peso
promedio de los 8 alumnos es de 68.38 Kg.
MEDIANA. Es la medida de tendencia central que divide un conjunto ordenado, ya
sea creciente o decreciente, en dos grupos iguales de modo que la mitad de las
observaciones tendrá valores que son menores que la mediana y la otra mitad
alcanzará valores mayores que ésta.
Cuando n es impar.- La mediana es el valor central de la serie ordenada de la
variable. Ejemplo: 19, 22, 25, 23, 21, 20, 25 n = 7. Calcular la edad mediana se
ordena de menor a mayor. 19, 20, 21, 22, 23, 25, 25. Me = 22 Años.
Cuando n es par.- La mediana es la semisuma de los valores centrales de la serie
ordenada de la variable. Ejemplo: 400, 480, 520, 580, 650, 700.
Me(x)=(520 + 580)/2= 550
MODA O VALOR MODAL: (Mo). Es otra medida de tendencia central, se define
como el valor que ocurre con más frecuencia. Se usa cuando se quiere señalar el
valor más común de una serie de datos. La moda es una medida menos importante
que la mediana, por ser ambigua. La moda no siempre existe y si existe no siempre
es única.
Ejemplo: 2, 2, 5, 5, 7, 7, 7, 7, 9, 9, 9, 10; Mo = 7 y 9 Serie bimodal
Ejemplo: 6, 5, 6, 6, 3, 4, 6, 6, 7 Mo = 6 Serie Unimodal
Ejemplo: 13, 15, 12, 11, 20, 22 No tiene Moda o se dice que cada dato es una moda
LA VARIANZA. Es la media aritmética de los cuadrados de las diferencias de los
valores de la variable y su media aritmética. Se expresa en unidades distintas a las
de la variable original, si la variable se expresa en kilogramos, entonces la varianza
queda expresada en kilogramos cuadrados; unidad que no tiene significado real. Por
tanto se utiliza el estadígrafo siguiente 2
 n

n n


 xi 

 ( xi  x)²  xi 
N

  Xi   ²
2 i 1

n
Muestra : s 2  i1  i1 Población :  2 i 1

n 1 n 1 N
LA DESVIACIÓN ESTÁNDAR. Que se define como la raíz cuadrada positiva de la
varianza
EL COEFICIENTE DE VARIACIÓN. Es un número abstracto obtenido como
cociente entre la desviación estándar y la media aritmética. Se usa cuando las
variables de dos distribuciones se expresan en unidades diferentes y hay sentido
comparar algunos estadígrafos presentados, pues ellos quedan influenciados por el
valor numérico de dichas unidades. Tiene como finalidad de comparar la variabilidad
de dos o más series de datos. El coeficiente de variación se expresa en términos
porcentuales cv  (s / x)100%
Ejemplo: Se tomó una muestra de tamaño n=12 observaciones del precio de la
papa por quintal en el mercado Yancen, y los valores que se han obtenido son los
siguientes valores en nuevos soles. 10, 20, 30, 40, 50, 60, 40, 50, 20, 30, 10, 10.
(10  30.83) 2    (10  30.83) 2
s  299.24  17.30n.s.
x  30.83 n.s. n 1
17.30
cv  100  56.1%
30.83

10
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

DATOS TABULADOS ORIGINALES


ESTADÍSTICA TIPO II

LA MEDIA ARITMETICA. Es el cociente entre la suma de todos los productos de


cada valor xi de la variable con sus frecuencia f i correspondiente de una población o
muestra y el número de observaciones con que cuenta la población o muestra.
Muestra Población
n N

x i fi X i fi
x  i 1
  i 1
n N

MEDIANA. Es la medida de tendencia central que divide un conjunto ordenado, ya


sea creciente o decreciente, en dos grupos iguales de modo que la mitad de las
observaciones tendrá valores que son menores que la mediana y la otra mitad
alcanzará valores mayores que ésta.
 n
 Si F j 1   M e  x j
n  2
Se debe verificar que : F j 1   Fj  
2 Si F  n  M  x j 1  x j


j 1
2
e
2
MODA O VALOR MODAL: (Mo). Es otra medida de tendencia central, se define
como el valor que ocurre con más frecuencia. Si f j  es máximo  M 0  x j
LA VARIANZA. Es la media aritmética de los cuadrados de las diferencias de los
valores de la variable y su media aritmética (xi- x )2 multiplicado por su frecuencia
correspondiente fi. Se expresa en unidades distintas a las de la variable original, si la
variable se expresa en kilogramos, entonces la varianza queda expresada en
kilogramos cuadrados; unidad que no tiene significado real. Por tanto se utiliza el
2
estadígrafo siguiente  n 
  xi f i 
( xi  x)² f i  xi f i   i 1 
n n


N

  Xi   ² fi
2

n
Muestra : s 2  i 1  i 1 Población :  2  i 1
n 1 n 1 N
LA DESVIACIÓN ESTÁNDAR. Que se define como la raíz cuadrada positiva de la
varianza
EL COEFICIENTE DE VARIACIÓN. Es un número abstracto obtenido como
cociente entre la desviación estándar y la media aritmética. Tiene como finalidad de
comparar la variabilidad de dos o más series de datos. El coeficiente de variación se
expresa en términos porcentuales cv  (s / x)100%
Ejemplo: El siguiente cuadro presenta 100 pacientes según los días de
hospitalización por leucemia, calcular media, mediana, moda, varianza, desviación
estándar y coeficiente de variación:
CUADRO 10: DIAS DE HOSPITALIZACIÓN
DE PACIENTES CON LEUCEMIA

Pacientes %
8.00 11 11.0
12.00 32 32.0
15.00 30 30.0
16.00 14 14.0
17.00 4 4.0
18.00 2 2.0
19.00 7 7.0
Total 100 100.0

11
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

CUADRO AUXILIAR DE CÁLCULO


Elaborado en Excel para el uso de fórmulas y cálculos auxiliares
xi fi xi*fi xi^2*fi Fi
8 11 88 704 11
12 32 384 4608 43 Fj-1 n/2=50
15 30 450 6750 73 Fj
Mediana
16 14 224 3584 87
17 4 68 1156 91
18 2 36 648 93
19 7 133 2527 100
Total 100 1383 19977
n

MEDIA ARITMÉTICA x f i i
1383
x i 1
  13.83
n 100
VARIANZA, DESVIACIÓN ESTÁNDAR y COEFICIENTE DE VARIACIÓN
2
 n 
  xi f i 
xi2 f i   i 1 
n

 n
19977 
1912689
100  8.586969...
s 2  i 1 
n 1 99
s  8.586969...  2.93035...
2.93035
cv  100  21.19%
13.83

MEDIANA: Calcular primero las frecuencias absolutas acumuladas, luego n/2; en


tercer lugar, ubicar el valor de n/2 entre las frecuencias acumuladas calculadas e
identifique Fj, Fj-1. La mediana se encuentra en la columna de la variable en la
dirección de Fj. En éste ejemplo Fj=73 y la mediana Me=15
MODA: La frecuencia absoluta simple más grande indica el valor de la variable que
es la moda. En éste ejemplo fmáx=32 y entonces la Moda Mo=12.
Ejemplo: El siguiente cuadro presenta 100 pacientes según los días de
hospitalización por leucemia, calcular media, mediana, moda, varianza, desviación
estándar y coeficiente de variación:
CUADRO N°11: EDAD (EN AÑOS) DE LOS
PACIENTES CON LEUCEMIA, HOSPITALIZADOS

fi Fi
12 20 20.0
16 20 40.0
17 10 50.0
20 10 60.0
21 15 75.0
24 12 87.0
25 13 100.0
Total 100

xi fi xi*fi xi^2*fi Fi
12 20 240 2880 20
16 20 320 5120 40
Xj-1=17 10 170 2890 50 Fj-1=n/2=50
Xj= 20 10 200 4000 60 Fj
21 15 315 6615 75
24 12 288 6912 87
25 13 325 8125 100
Total 100 1858 36542

12
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

2
 n 
n
  xi f i 
x f n
xi2 f i   i 1 
 3452164
i i
x i 1

1858
 18.58años 36542 
n 100  .
n 100 s 2  i 1 
n 1 99
s  ...  ...
Mediana Me=(17+20)/2=18,5 años Moda Mo: existe dos modas 12 y 16

DATOS TABULADOS MODIFICADOS POR INTERVALOS


(ESTADÍSTICA TIPO III)

LA MEDIA ARITMETICA. Es el cociente entre la suma de todos los productos de


cada valor punto medio o marca de clase x i' de la variable con sus frecuencia f i
correspondiente de una población o muestra y el número de observaciones con que
cuenta la población o muestra.
n N

 xi' f i X '
f
i i
Muestra : x  i 1
Población :   i 1

n N
MEDIANA. Es la medida de tendencia central que divide un conjunto ordenado, ya
sea creciente o decreciente, en dos grupos iguales de modo que la mitad de las
observaciones tendrá valores que son menores que la mediana y la otra mitad
alcanzará valores mayores que ésta.
 Calcular n/2, el lugar de la mediana.
 Determinar las frecuencias acumuladas y elegir Fj y Fj-1 de modo que:
 n
Si F j 1   Me  L j
2

n  n 
F j 1   Fj  
2 n   F j 1 
Si F j 1   Me  L j   2 C j
 2  fj 

  
Donde: Lj = Limite inferior del intervalo de mediano, n = Tamaño de la muestra,
Fj–1=Frecuencia acumulada anterior al intervalo mediano.

MODA O VALOR MODAL: (Mo). Es otra medida de tendencia central, se define


como el valor que ocurre con más frecuencia.
1° Ubicar el intervalo modal a aquel que tiene la mayor frecuencia.
2° Aplicar la fórmula:
 d1 
M 0  Li   C1 Donde: d1 = fi– fi –1 , d2 = fi – fi +1
 d1  d 2 
LA VARIANZA. Es la media aritmética de los cuadrados de las diferencias de los
valores de la variable y su media aritmética. Se expresa en unidades distintas a las
de la variable original, si la variable se expresa en kilogramos, entonces la varianza
queda expresada en kilogramos cuadrados; unidad que no tiene significado real. Por
tanto se utiliza el estadígrafo siguiente
2 Población
 n ' 
  xi f i 
 X 
N

( xi  x)² f i  ( xi ) f i   i 1    ² fi
n n


'
' ' 2
i
Muestra : s 2  i 1  i 1
n  2
 i 1
n 1 n 1 N

13
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

LA DESVIACIÓN ESTÁNDAR. Que se define como la raíz cuadrada positiva de la


varianza
EL COEFICIENTE DE VARIACIÓN. Es un número abstracto obtenido como
cociente entre la desviación estándar y la media aritmética. Tiene como finalidad de
comparar la variabilidad de dos o más series de datos. El coeficiente de variación se
expresa en términos porcentuales cv  (s / x)100%
Ejemplo: Supongamos una muestra de 60 empleados de la Empresa Carolina S.A,
cuyos sueldos mensuales en nuevos soles, están dados en la siguiente tabla:
CUADRO Nº 02: DISTRIBUCIÓN DE 60 EMPLEADOS SEGÚN SUS SUELDOS EN LA EMPRESA
CAROLINA S.A. SEPTIEMBRE DEL 2001 TINGO MARÍA.
SUELDOS fi Fi hi Hi
[210 260] 3 3 0.05 0.05
<260 310] 9 12 0.15 0.20
<310 360] 15 27 0.25 0.45
<360 410] 17 44 0.28 0.73
<410 460] 9 53 0.15 0.88
<460 510] 4 57 0.07 0.95
<510 560] 3 60 0.05 1.00
60 … 1.00 …
TOTAL
FUENTE: PLANILLA DE HABERES DE LA EMPRESA CAROLINA S.A.
Calcular media, mediana, moda, varianza, desviación estándar y coeficiente de
variación: CUADRO AUXILIAR DE CÁLCULO
Li Ls X’i fi xifi xi2fi
210 260 235 3 705 165675
260 310 285 9 2565 731025
310 360 335 15 5025 1683375
360 410 385 17 6545 2519825
410 460 435 9 3915 1703025
460 510 485 4 1940 940900
510 560 535 3 1605 858675
TOTAL 60 22300 8602500
MEDIA ARITMÉTICA n

x f '
i i
22300
x i 1
  371.67n.s.
n 60
2
VARIANZA  n ' 
  xi f i 
 i 1 
n
(22300) 2
 ( x ' 2
i ) f i 
n
8602500 
60
s 
2 i 1

n 1 60  1
s 2  5327.683616
DESVIACIÓN ESTÁNDAR s  5327.683616  72.99098311

COEFICIENTE DE VARIACIÓN

s 72.99098311
cv  100%  100  19.63882954  19.84%
x 371.6666667

14
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

MEDIANA Li Ls fi Fi
210 260 3 3
260 310 9 12
310 360 15 27 n/2
Intervalo mediano 360 410 17 44
410 460 9 53
460 510 4 57
510 560 3 60
TOTAL 60
n/2= 30

n 
n n  2  F j 1 
F j 1   Fj  27  30  44  F j 1   Me  L j   C j
2 2  fj 
 
 30  27 
Me  360   50  368.8235294  368.82n.s.
 17 
MODA
Li Ls fi
210 260 3
260 310 9
310 360 15
Intervalo modal 360 410 17 frec. máxima
410 460 9
460 510 4
510 560 3
TOTAL 60
 d1  2
M 0  Li   C1  360  508( )  370n.s. d1  17  15  2 d 2  17  9  8
 d1  d 2  28
PROPIEDADES DE LA MEDIA ARITMETICA
1. La media aritmética es muy sensible a todo valor extremo ya sea muy alto muy bajo influyendo
notablemente en el resultado
2. La media de una constante es igual ala misma constante: M (K) = K. Ejemplo: La edad de los
niños de un nido: 5, 5, 5, 5, 5. La media aritmética es 5 años
3. La suma total de n valores es igual a nx: n X   xi fi n X   xi

4. La suma algebraica de las desviaciones de n datos xi con respecto a su media aritmética es igual a
cero.
( xi  x) fi  0  ( xi  x)  0
6. Si cada uno de los n valores de xi es transformado yi = axi + b, siendo a y b constantes, entonces,
la media aritmética de los n valores yi es:
y  ax  b
si a 0 y b n
si a 1 b  0  y  x  b
X   hiXi
i 1
si a  0  b  0  y  ax
7. La media aritmética de datos tabulados (originales o agrupados) se calcula también usando las
frecuencias relativas.

15
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS

8. La media aritmética ponderada esta definida por: m


 wi xi
X  i 1
m
W 1, w2, w3, ..., wk son los pesos o ponderaciones  wi
X1, x2, x3, ..., xk valores de la variable o marcas de clase. i 1

9. Media aritmética a partir de submuestras.- La media de una muestra es igual a la k


media ponderada de sus submuestras donde los pesos son los tamaños respectivos,  ni xi
X  i 1
esto es: Si una muestra de n datos de variable x contiene k submuestra: n 1,n2, n3, ..., k
nk respectivamente, entonces la media de toda la muestra es:  ni
i 1

La media aritmética puede ser calculada en distribuciones de frecuencias con intervalos de diferente
amplitud inclusive, siempre que se pueda determinar los puntos medios de los intervalos.
PROPIEDADES DE LA MEDIANA
La suma de los valores absolutos de las desviaciones tiene un valor mínimo cuando se considera las
desviaciones con respecto a la mediana. La mediana puede calcularse para distribuciones con intervalos
de diferente amplitud, siempre que se pueda determinar el límite inferior del intervalo mediano. La
mediana depende del número de datos y no del valor de los datos como la media. Por esto no es afectada
por valores extremos.
PROPIEDADES DE VARIANZA
a) La varianza nunca es negativa, siempre es positiva. V (x) > 0
b) La varianza de una constante es igual a cero. V(k) = 0
c) La varianza de una variable más una constante positiva o negativa, es igual a la varianza de la
variable. V(x  k ) = V (x). Si sumamos o restamos a cada valor de la variable una constante, la
varianza no cambia.
d) La varianza de una constante multiplicado por una variable es igual a la constante al cuadrado por la
2
varianza de la variable. V(kx) = k V(x). Si multiplicamos a cada valor de la variable por una constante,
la varianza de los nuevos datos es igual a la varianza de los antiguos valores multiplicado por el
cuadrado de la constante
e) La varianza y la desviación estándar pueden ser calculadas de una distribución de frecuencias de
intervalos de distinta amplitud siempre que pueda calcularse su punto medio. La varianza y la
desviación estándar de cada uno de los datos son sensibles a la variación de cada uno de los datos.
“Basta que uno de los datos varíe para que cambie la varianza y la desviación estándar.
MEDIDAS DE SESGO O ASIMETRIA
Hay ocasiones en que es deseable calcular una medida que muestre la dirección de la
dispersión con respecto al centro de la distribución. Las medidas de dispersión sólo
indican la magnitud de las variaciones, pero no proveen información a cerca de la
dirección hacia donde tienden a ocurrir las variaciones. Las medidas de asimetría
indican la deformación horizontal de las curvas de frecuencias, tal como se muestra en
las figuras anteriores.
COEFICIENTE DE ASIMETRÍA DE PEARSON
Cuando se dispone de los valores de la media, mediana, moda y desviación estándar.
x  Mo 3( x  Me)
As  As 
s s
1. Simetría. As=0
2. Asimétrica positiva. As>0
k
3. Asimétrica Negativa. As<0 M4 f i ( xi  x ) 4
K   i 1
3
S4 nS 4
MEDIDAS DE KURTOSIS O APUNTAMIENTO Si K  0  Curva normal ó MESOCURTICA
Si K  0  Curva LEPTOCURTICA
Se entiende por kurtosis al grado de deformación
Si K  0  Curva PLATICURTI CA
vertical (apuntamiento) de una distribución de
frecuencias y se mide en relación a la altura de la
curva.
Normal Platicúrtica Leptocúrtica

16

Вам также может понравиться