Академический Документы
Профессиональный Документы
Культура Документы
TORRES ARMAS
CAPÍTULO
PRINCIPALES DEFINICIONES
1. ESTADÍSTICA. Ciencia que trata de la recopilación, organización, presentación,
análisis e interpretación de datos, proporcionando los métodos pertinentes, leyes
que lo rigen, asociación de las variables; que permiten realizar predicciones y
una optima toma de decisiones frente a la incertidumbre. Es una ciencia que
nos proporciona un conjunto de métodos, técnicas o procedimientos para:
Recopilar, Organizar (clasificar, agrupar), presentar, y Analizar, datos con
el fin de describirlos o de realizar generalizaciones válidas.
2. DIVISIÓN DE LA ESTADÍSTICA: La estadística de divide en dos partes: ESTADÍSTICA
DESCRIPTIVA O DEDUCTIVA: Su estudio incluye el de las técnicas de colectar, presentar,
analizar e interpretar los datos. ESTADÍSTICA INFERENCIAL O INDUCTIVA: Es el método y
conjunto de técnicas empleadas para determinar algo acerca de una población, teniendo como
base una muestra.
3. OBJETIVOS GENERALES DE LA ESTADÍSTICA: La estadística tiene tres objetivos: Describir
colecciones de datos empíricos. Inferir las propiedades de una población. Realizar predicciones
sobre el comportamiento de fenómenos.
5. CONCEPTOS BÁSICOS. La estadística usa diversos términos con un significado especial. Para
ello es conveniente especificar el significado de algunos de los más importantes y frecuentes. A
continuación se incluyen algunos términos.
5.1. DATO: Es el valor que toma una variable en cada unidad de análisis.
5.2. UNIVERSO: Es el conjunto de unidades o elementos que tienen
características comunes (personas, animales, fenómenos) bien definidos y
delimitados en el tiempo, espacio y contenido. Ejemplo:
Conjunto de alumnos de la Universidad Peruana en el año 2004.
Conjunto de pacientes con Sida del Hospital de Apoyo de Chachapoyas.
año 2003
Docentes del magisterio regional de Amazonas. 2004
Turistas nacionales y extranjeros que visitaron kuelap en el periodo 200-
2003
5.3. POBLACIÓN: Es el conjunto de datos o medidas tienen una o más
características en común de los elementos del universo. Se denota con la letra
N. Ejemplos:
Las edades de los estudiantes de la UNAS matriculados el 2001-II
Los promedios semestrales de los alumnos de la FIA-UNAT-A
matriculados el 2002-II
5.4. VARIABLE: Es una característica que se va ha investigar y que pueden
tener diferentes valores en los distintos elementos o individuos de un conjunto.
Se clasifican en:
POR SU NATURALEZA
a. VARIABLE CUALITATIVAS. Son variables cuyos valores son cualidades
que presenta la población. Por ejemplo:
Variable: valores:
PROFESIÓN Administrador, Estadístico,
Economista, Contador Público,
ESTADO CIVIL Soltero, casado, viudo, divorciado.
b. VARIABLE CUANTITATIVAS: Estas variables surgen cuando se puede
establecer cuanto o en que cantidad se posee una determinada
característica. Ejemplo: El consumo familiar, El ingreso familiar, Sueldo de
los obreros, Notas promedios de los estudiantes, Temperatura de horneado,
Oferta, demanda, etc. Las variables cuantitativas se dividen en:
1
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
OTROS FACTORES
(Ingreso familiar, etc.)
Variables Confusoras
DE ACUERDO AL NUMERO DE VARIABLES
UNIDIMENSIONAL, BIDIMENSIONAL, MULTIDIMENSIONAL
POR SU ESCALA DE MEDICION
a. NOMINALES: Indican categorías (cualidades) en sus valores sin orden entre
ellas. Ejemplos: Variable: valores:
Estado civil soltero, casado, viudo, divorciado, etc.
Deporte favorito fútbol, basketbol, natación, etc.
Religión católico, protestante, adventista, etc.
Enfermedades sida, TBC, sífilis, etc.
b. ORDINALES: Establecen un orden en sus valores sin guardar igual distancia
entre ellas. Ejemplos: Variable: valores:
Grado de instrucción inicial, primaria, secundaria, superior.
Etapas de desarrollo Infancia, niñez, adolescencia, juventud, etc
Grado de desnutrición moderada, grave, etc.
c. DE INTERVALO: Establecen un orden, IGUAL DISTANCIA en sus valores,
pero no tiene un origen natural único. Ejemplo:
Variable: valores:
Coeficiente de inteligencia 78, 79, 80, etc.
Temperatura 10º, 20º, 30º, 40º, etc.
Test de aptitud 5, 7, 9, 11, etc.
d. DE RAZON: Indican un orden, igual distancia en sus valores y tienen un
origen natural único. Ejemplo:
Variable: valores:
Edad 0-5, 6-10, 11-15, etc.
Nº de hijos 0, 1, 2, 3, 4, 5, 6, etc.
Peso en kg. 0-10, 10-20, 20-30, etc.
Ingreso en soles 0-100, 100-200, 200-300, etc.
6. LA INVESTIGACIÓN ESTADÍSTICA. Es toda operación orientada a la recopilación de
información sobre una población. La investigación puede ser tan simple como la recopilación de
datos estadísticos obtenidos de informaciones provenientes de fuentes oficiales a nivel
institucional o de publicaciones de organismos altamente especializados en estas materias, o tan
complejas que requiera de la colaboración de especialistas en diferentes materias, como ocurre,
por ejemplo, en los censos de población de un país.
7. EXPERIMENTO ESTADÍSTICO. Es en general, el estudio de una situación creada, en donde la
población es inexistente o mejor dicho hipotética; el objeto del experimento es establecer, los
métodos estadísticos, algunas características de la población si esta existiera.
2
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
8. MÉTODOS PARA RECOLECTAR DATOS: Existen tres principales métodos con los cuales el
investigador puede obtener los datos: El investigador puede recudir a datos ya publicados por
fuentes gubernamentales, industrias, compañías o individuales. El investigador puede diseñar un
experimento para obtener los datos necesarios. Puede efectuar una encuesta.
8.1. FUENTES DE INFORMACIÓN: Es el lugar, la institución, la persona, donde están los datos
que se necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de
datos pueden ser: FUENTES PRIMARIAS, FUENTES SECUNDARIAS.
8.2. DISEÑO DE EXPERIMENTO: Es un segundo método de recolección de la información. Los
diseños experimentales deben utilizarse siempre que sea posible cuando se desee construir
modelos explicativos.
8.3. ENCUESTAS: Proceso de recopilar la información a través de una muestra.
CAPÍTULO II
PRESENTACIÓN DE DATOS
3
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
40
rectángulo de área proporcional a su valor
30
(si los rectángulos tuvieran la misma base,
20
es suficiente considerar la
10
proporcionalidad en relación con las 0 4
4
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
180 100%
160
90%
80%
Número de equipos
140
70%
120 60% Televisión
%
Televisión 50%
100
Radio 40% Radio
80
30%
60 20%
40 10%
0%
20
o
o
o
ri l
er
er
ay
ni
Ab
ar
0
br
Ju
En
M
M
Fe
ro
o
ro
nio
il
z
ay
br
re
ne
ar
Ju
A
eb
M
M
E
F
Meses
Me s
70
50
30
orpian
regular
10
componentes hay.
Existe otra gran variedad de gráficos o diagramas para mostrar datos o relaciones
entre varios grupos de datos. Aquí la imaginación del dibujante juega un papel muy
importante.
5
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
hi = fi /n 0 hi 1 i 1,2,3,... h
i 1
i
fi Xi % %acum
1.00 5 5.0 5.0
2.00 14 14.0 19.0
3.00 18 18.0 37.0
4.00 24 24.0 61.0
5.00 21 21.0 82.0
6.00 10 10.0 92.0
7.00 5 5.0 97.0
8.00 3 3.0 100.0
Total 100 100.0
6
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
7
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA. CUADRO N°2: SUELDO DE EMPLEADOS DE LA EMPRESA CAROLINA SA.
18 100
15 80
E m pleados
E m p le a d o s
12
60
9
40
6
20
3
0 0
210 310 410 510 610 210 310 410 510 610
Sueldos
Sueldos
50
E m pleados
12
40
9
30
6
20
3
10
0 0
210 310 410 510 610 210 310 410 510 610
Sueldos Sueldos
8
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
140
120
100
o
80
Radio
Número
Televisión
60
40
20
ro
o
ro
o
li
z
ay
ni
br
re
ne
ar
Ju
A
eb
M
M
E
F
Meses
X i X i
X i 1 i 1
n N
9
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
Xi ²
2 i 1
n
Muestra : s 2 i1 i1 Población : 2 i 1
n 1 n 1 N
LA DESVIACIÓN ESTÁNDAR. Que se define como la raíz cuadrada positiva de la
varianza
EL COEFICIENTE DE VARIACIÓN. Es un número abstracto obtenido como
cociente entre la desviación estándar y la media aritmética. Se usa cuando las
variables de dos distribuciones se expresan en unidades diferentes y hay sentido
comparar algunos estadígrafos presentados, pues ellos quedan influenciados por el
valor numérico de dichas unidades. Tiene como finalidad de comparar la variabilidad
de dos o más series de datos. El coeficiente de variación se expresa en términos
porcentuales cv (s / x)100%
Ejemplo: Se tomó una muestra de tamaño n=12 observaciones del precio de la
papa por quintal en el mercado Yancen, y los valores que se han obtenido son los
siguientes valores en nuevos soles. 10, 20, 30, 40, 50, 60, 40, 50, 20, 30, 10, 10.
(10 30.83) 2 (10 30.83) 2
s 299.24 17.30n.s.
x 30.83 n.s. n 1
17.30
cv 100 56.1%
30.83
10
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
x i fi X i fi
x i 1
i 1
n N
N
Xi ² fi
2
n
Muestra : s 2 i 1 i 1 Población : 2 i 1
n 1 n 1 N
LA DESVIACIÓN ESTÁNDAR. Que se define como la raíz cuadrada positiva de la
varianza
EL COEFICIENTE DE VARIACIÓN. Es un número abstracto obtenido como
cociente entre la desviación estándar y la media aritmética. Tiene como finalidad de
comparar la variabilidad de dos o más series de datos. El coeficiente de variación se
expresa en términos porcentuales cv (s / x)100%
Ejemplo: El siguiente cuadro presenta 100 pacientes según los días de
hospitalización por leucemia, calcular media, mediana, moda, varianza, desviación
estándar y coeficiente de variación:
CUADRO 10: DIAS DE HOSPITALIZACIÓN
DE PACIENTES CON LEUCEMIA
Pacientes %
8.00 11 11.0
12.00 32 32.0
15.00 30 30.0
16.00 14 14.0
17.00 4 4.0
18.00 2 2.0
19.00 7 7.0
Total 100 100.0
11
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
MEDIA ARITMÉTICA x f i i
1383
x i 1
13.83
n 100
VARIANZA, DESVIACIÓN ESTÁNDAR y COEFICIENTE DE VARIACIÓN
2
n
xi f i
xi2 f i i 1
n
n
19977
1912689
100 8.586969...
s 2 i 1
n 1 99
s 8.586969... 2.93035...
2.93035
cv 100 21.19%
13.83
fi Fi
12 20 20.0
16 20 40.0
17 10 50.0
20 10 60.0
21 15 75.0
24 12 87.0
25 13 100.0
Total 100
xi fi xi*fi xi^2*fi Fi
12 20 240 2880 20
16 20 320 5120 40
Xj-1=17 10 170 2890 50 Fj-1=n/2=50
Xj= 20 10 200 4000 60 Fj
21 15 315 6615 75
24 12 288 6912 87
25 13 325 8125 100
Total 100 1858 36542
12
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
2
n
n
xi f i
x f n
xi2 f i i 1
3452164
i i
x i 1
1858
18.58años 36542
n 100 .
n 100 s 2 i 1
n 1 99
s ... ...
Mediana Me=(17+20)/2=18,5 años Moda Mo: existe dos modas 12 y 16
xi' f i X '
f
i i
Muestra : x i 1
Población : i 1
n N
MEDIANA. Es la medida de tendencia central que divide un conjunto ordenado, ya
sea creciente o decreciente, en dos grupos iguales de modo que la mitad de las
observaciones tendrá valores que son menores que la mediana y la otra mitad
alcanzará valores mayores que ésta.
Calcular n/2, el lugar de la mediana.
Determinar las frecuencias acumuladas y elegir Fj y Fj-1 de modo que:
n
Si F j 1 Me L j
2
n n
F j 1 Fj
2 n F j 1
Si F j 1 Me L j 2 C j
2 fj
Donde: Lj = Limite inferior del intervalo de mediano, n = Tamaño de la muestra,
Fj–1=Frecuencia acumulada anterior al intervalo mediano.
( xi x)² f i ( xi ) f i i 1 ² fi
n n
'
' ' 2
i
Muestra : s 2 i 1 i 1
n 2
i 1
n 1 n 1 N
13
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
x f '
i i
22300
x i 1
371.67n.s.
n 60
2
VARIANZA n '
xi f i
i 1
n
(22300) 2
( x ' 2
i ) f i
n
8602500
60
s
2 i 1
n 1 60 1
s 2 5327.683616
DESVIACIÓN ESTÁNDAR s 5327.683616 72.99098311
COEFICIENTE DE VARIACIÓN
s 72.99098311
cv 100% 100 19.63882954 19.84%
x 371.6666667
14
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
MEDIANA Li Ls fi Fi
210 260 3 3
260 310 9 12
310 360 15 27 n/2
Intervalo mediano 360 410 17 44
410 460 9 53
460 510 4 57
510 560 3 60
TOTAL 60
n/2= 30
n
n n 2 F j 1
F j 1 Fj 27 30 44 F j 1 Me L j C j
2 2 fj
30 27
Me 360 50 368.8235294 368.82n.s.
17
MODA
Li Ls fi
210 260 3
260 310 9
310 360 15
Intervalo modal 360 410 17 frec. máxima
410 460 9
460 510 4
510 560 3
TOTAL 60
d1 2
M 0 Li C1 360 508( ) 370n.s. d1 17 15 2 d 2 17 9 8
d1 d 2 28
PROPIEDADES DE LA MEDIA ARITMETICA
1. La media aritmética es muy sensible a todo valor extremo ya sea muy alto muy bajo influyendo
notablemente en el resultado
2. La media de una constante es igual ala misma constante: M (K) = K. Ejemplo: La edad de los
niños de un nido: 5, 5, 5, 5, 5. La media aritmética es 5 años
3. La suma total de n valores es igual a nx: n X xi fi n X xi
4. La suma algebraica de las desviaciones de n datos xi con respecto a su media aritmética es igual a
cero.
( xi x) fi 0 ( xi x) 0
6. Si cada uno de los n valores de xi es transformado yi = axi + b, siendo a y b constantes, entonces,
la media aritmética de los n valores yi es:
y ax b
si a 0 y b n
si a 1 b 0 y x b
X hiXi
i 1
si a 0 b 0 y ax
7. La media aritmética de datos tabulados (originales o agrupados) se calcula también usando las
frecuencias relativas.
15
ESTADÍSTICA GENERAL LIC. ELÍAS A. TORRES ARMAS
La media aritmética puede ser calculada en distribuciones de frecuencias con intervalos de diferente
amplitud inclusive, siempre que se pueda determinar los puntos medios de los intervalos.
PROPIEDADES DE LA MEDIANA
La suma de los valores absolutos de las desviaciones tiene un valor mínimo cuando se considera las
desviaciones con respecto a la mediana. La mediana puede calcularse para distribuciones con intervalos
de diferente amplitud, siempre que se pueda determinar el límite inferior del intervalo mediano. La
mediana depende del número de datos y no del valor de los datos como la media. Por esto no es afectada
por valores extremos.
PROPIEDADES DE VARIANZA
a) La varianza nunca es negativa, siempre es positiva. V (x) > 0
b) La varianza de una constante es igual a cero. V(k) = 0
c) La varianza de una variable más una constante positiva o negativa, es igual a la varianza de la
variable. V(x k ) = V (x). Si sumamos o restamos a cada valor de la variable una constante, la
varianza no cambia.
d) La varianza de una constante multiplicado por una variable es igual a la constante al cuadrado por la
2
varianza de la variable. V(kx) = k V(x). Si multiplicamos a cada valor de la variable por una constante,
la varianza de los nuevos datos es igual a la varianza de los antiguos valores multiplicado por el
cuadrado de la constante
e) La varianza y la desviación estándar pueden ser calculadas de una distribución de frecuencias de
intervalos de distinta amplitud siempre que pueda calcularse su punto medio. La varianza y la
desviación estándar de cada uno de los datos son sensibles a la variación de cada uno de los datos.
“Basta que uno de los datos varíe para que cambie la varianza y la desviación estándar.
MEDIDAS DE SESGO O ASIMETRIA
Hay ocasiones en que es deseable calcular una medida que muestre la dirección de la
dispersión con respecto al centro de la distribución. Las medidas de dispersión sólo
indican la magnitud de las variaciones, pero no proveen información a cerca de la
dirección hacia donde tienden a ocurrir las variaciones. Las medidas de asimetría
indican la deformación horizontal de las curvas de frecuencias, tal como se muestra en
las figuras anteriores.
COEFICIENTE DE ASIMETRÍA DE PEARSON
Cuando se dispone de los valores de la media, mediana, moda y desviación estándar.
x Mo 3( x Me)
As As
s s
1. Simetría. As=0
2. Asimétrica positiva. As>0
k
3. Asimétrica Negativa. As<0 M4 f i ( xi x ) 4
K i 1
3
S4 nS 4
MEDIDAS DE KURTOSIS O APUNTAMIENTO Si K 0 Curva normal ó MESOCURTICA
Si K 0 Curva LEPTOCURTICA
Se entiende por kurtosis al grado de deformación
Si K 0 Curva PLATICURTI CA
vertical (apuntamiento) de una distribución de
frecuencias y se mide en relación a la altura de la
curva.
Normal Platicúrtica Leptocúrtica
16