Академический Документы
Профессиональный Документы
Культура Документы
2. ESTADISTICA DESCRIPTIVA
2.1 INTRODUCCION
Las razones de las variaciones externas a este patrón mencionado pueden ser
descubiertas y corregidas; pero para ello es necesario establecer el patrón de
variación del atributo de calidad y éste es uno de los aspectos de mayor utilidad de
la Estadística en el Control de la Calidad.
El Control de Calidad de los productos manufacturados era una función que existía
antes de que se aplicaran los métodos estadísticos al análisis de datos de calidad,
pero éstos facilitaron enormemente la labor.
2.1.1 Definiciones
Variable. Es una magnitud que puede asumir valores dentro de un conjunto numérico
dado el cual se denomina su dominio.
Datos digitales; Proceden de una operación de conteo y su valor tiene una total
exactitud, están representados por números enteros, por ejemplo, el número de
personas que entran a un recinto, el número de vehículos que atraviesan un puente
en un determinado tiempo, el número de repeticiones de una experiencia.
Estos errores afectan las mediciones de la misma manera y son susceptibles de ser
corregidos, lo que significa que pueden ser eliminados o de algún modo minimizados
mediante el suficiente cuidado en la graduación, en los controles, en los ensayos
patrón y otras condiciones de la experiencia.
21,1 21,1
-------- = 4,22 ------- = 1,05
5 20
D) Determinar las marcas de clase. Para cada intervalo se calcula el punto medio.
CATEG. INTERVALOS MARCAS DE CLASE
[K] [ IK ] [ XK ]
[k] [ Ik ] [ Xk ] [ fk ]
Límites de clase. Son los extremos correspondientes a cada intervalo de clase y hay
que distinguir entre:
Límites verdaderos. Son los valores matemáticos que separan los intervalos de clase
y conviene que no correspondan con datos existentes, avanzan una posición
respecto del redondeo que tengan los datos. También se denominan fronteras de
clase.
Límites aparentes. Son los valores convencionales para los extremos de los
intervalos de clase, con ellos se evita la ambiguedad que pueda surgir al asignar un
dato extremo a una categoría
Marcas de clase. [XK] Son los valores correspondientes al punto medio de cada
intervalo de clase.
fK
fRK = ------ x 100
N
FK
FRK = ------- x 100
N
FK
FRK = ------- x 100
N
Una vez se tienen los datos tabulados en las formas establecidas, puede
procederse a su representación en varias formas; las más usuales son:
- Histograma absoluto
- Histograma relativo
BASES : IK
ALTURAS : fK o fRK
Polígonos de frecuencia. Son la línea quebrada que resulta de unir los puntos que
tienen las siguientes coordenadas, abscisa las marcas de clase y ordenada, las
correspondientes frecuencias de clase; absolutas o relativas según sea el polígono
buscado. Los polígonos se completan en sus extremos con líneas punteadas
hasta las marcas de clase anteriores y posteriores a las consideradas y
frecuencias cero.
ABSCISAS : XK
ORDENADAS : fK o fRK
Ojivas ascendentes. Son la línea quebrada que resulta de unir los puntos que
tienen las siguientes coordenadas, abscisa el limite superior verdadero de cada
intervalo de clase y ordenada la correspondiente frecuencia acumulada
ascendente; absoluta o relativa según sea la ojiva buscada. La ojiva se completa a
la izquierda con línea punteada que va hasta el limite superior del intervalo anterior
al primero considerado y frecuencia cero.
ORDENADAS : FK o FRK
Ojivas descendentes. Son la línea quebrada que resulta de unir los puntos que
tienen las siguientes coordenadas, abscisa el limite inferior verdadero de cada
intervalo de clase y ordenada la correspondiente frecuencia acumulada
descendente; absoluta o relativa según sea la ojiva buscada. La ojiva se completa
a la derecha con línea punteada que va hasta el limite inferior del intervalo de
clase posterior al último considerado y frecuencia cero.
ORDENADAS : FK o FRK
Estadística cual es la mediana. Tanto los polígonos de frecuencia como las ojivas
pueden trazarse uniendo los puntos con curvígrafo y pasan llamarse perfiles o
polígonos u ojivas suavizadas.
60
61
Las medidas de posición son valores que resumen la distribución y dan una idea
cuantitativa del comportamiento de la variable que están representando los datos.
Las principales medidas de posición son: la media (en sus distintas formas), la moda,
la mediana, los cuartiles, los deciles y los percentiles.
_ X1 + X2 + X3 + .... + Xn XK
X = -------------------------------- = -------
n n
_ X1 f1 + X2 f2 + X3 f3 + .... + Xn fn XK fK
X = ------------------------------------- --- = ----------
f1 + f2 + f3 + .... + fn fK
( K desde 1 hasta n )
62
f1 + f2 + f3 + ... + fn = N
2.4.2 Moda
La moda ( X )se define como el dato o el valor de la variable que presenta una
mayor frecuencia.
1
X = LiK + C ---------
1 + 2
donde :
2.4.3.1 Mediana
La mediana (X) se define PARA DATOS SIMPLES, como el dato que ocupa la
posición central en un ordenamiento ascendente de los datos si el número total de
datos es impar. En el caso de que el número total de datos es par, la mediana
será el promedio de los dos datos centrales del ordenamiento.
(N/2) - FK-1
X = LiK + C ---------------
fK
donde :
K : indicativo de la categoría en la cual se ubica
acumulativamente la mitad de los datos
LiK : Límite verdadero inferior del intervalo de clase en el cual se ubica
acumulativamente la mitad de los datos
C : Tamaño del intervalo de clase
N : Número total de datos
FK-1 : Frecuencia acumulada ascendente hasta la categoría
inmediatamente anterior a la que acumula la mitad
de los datos
fK : Frecuencia del intervalo que acumula la mitad de
los datos
2.4.3.2 Cuartiles
q (N/4) - FK-1
Qq = LiK + C ------------------- (q : 1, 2, 3)
fK
donde :
K : indicativo de la categoría en la cual se ubica
acumulativamente 1/4 , 2/4 o 3/4 de los datos
LiK : Límite verdadero inferior del intervalo de clase en el cual se ubica
acumulativamente 1/4 , 2/4 o 3/4 de los datos
C : Tamaño del intervalo de clase
N : Número total de datos
FK-1 : Frecuencia acumulada ascendente hasta la categoría
inmediatamente anterior a la que acumula 1/4 , 2/4
o 3/4 de los datos
fK : Frecuencia del intervalo que acumula 1/4 , 2/4 o
3/4 de los datos
64
2.4.3.3 Deciles
d (N/10) - FK-1
Dd = LiK + C --------------------- (d : 1, 2, ... , 9)
fK
donde :
K : indicativo de la categoría en la cual se ubica
acumulativamente 1/10 , 2/10 ,..., 9/10 de los datos
LiK : Límite verdadero inferior del intervalo de clase en el cual se ubica
acumulativamente 1/10 , 2/10 ,..., 9/10 de los datos
C : Tamaño del intervalo de clase
N : Número total de datos
FK-1 : Frecuencia acumulada ascendente hasta la categoría
inmediatamente anterior a la que acumula 1/10 , 2/10
... , 9/10 de los datos
fK : Frecuencia del intervalo que acumula 1/10 , 2/10 , ... ,
9/10 de los datos
2.4.3.4 Percentiles
P(N/100)- FK-1
Pp = LiK + C --------------------- (p : 1, 2, ... , 99)
fK
donde :
K : indicativo de la categoría en la cual se ubica
acumulativamente 1/100 , 2/100 , ... ,99/100
de los datos
LiK : Límite verdadero inferior del intervalo de clase en el cual se
ubica acumulativamente 1/100 , 2/100 , ... , 99/100 de los datos
C : Tamaño del intervalo de clase
65
Cuando se da que,
_
(X-X)>0
[K] [ IK ] [ XK ] [ fK [ XK fK ] FK
]
_ XK fK 24434,00
X = --------- = --------------- = 305,42 g/L
N 80
Moda.
1 (13-11)
X = LiK + C --------- = 303,95 + 2 ----------------------
1 + 2 (13-11) + (13-12)
X = 305,28 g/L
Mediana.
67
X = 305,34 g/L
Cuartiles.
Q1 = 301,95 g/L
Q3 = 308,75 g / L
Deciles.
D2 = 300,95 g/L
Percentiles.
10(N/100) – F3-1 (8 - 4)
P10 = Li3 + C------------------------ = 297,95 + 2 ----------
f3 8
90(N/100) - F10-1 72 - 71
P90 = Li10 + C ------------------------ = 311,95 + 2 -----------
f10 5
Puede definirse como la distancia entre los valores extremos de la variable que
aportan los datos. Su expresión más sencilla es;
69
DP = P90 - P10
_
| XK - X | fK
DM = ------------------ ( K desde 1 hasta n)
fK
(( XK - X )2 fK )1/2
S = -------------------- ( K desde 1 hasta n )
fK
S
CV =----- X 100
X
Existe una relación aproximada que establece con propósitos estimativos que;
DM 4/5 S
Recorrido.(R)
Distancia semi-intercuartil.(DSIC)
Distancia percentil.(DP)
71
Desviación media.(DM)
_
| XK - X | fK
DM = ------------------ ( K desde 1 hasta n)
fK
_
( X = 305,42 )
K XK fK | XK - X | | XK – X | fK
313,76
DM = ---------- = 3,92 g/L
80
Desviación normal.(S)
(( XK - X )2 fK)1/2
S = -------------------- ( K desde 1 hasta n )
fK
72
S = 4,80 g/L
Varianza.(S2)
S2 = 23,02 (g/L)2
Coeficiente de variación
S 4,80
CV = ------ 100 = ---------- 100 = 1,57 %
X 305,42
En consecuencia, para poder concluir que una distribución dada puede considerarse
aproximadamente Normal se examinan estas tres condiciones dentro de una
flexibilidad razonable; por ejemplo:
Simetría.
_
X-X 305,42 - 305,28
= -------- 100 = --------------------- 100 = 2,9 %
S 4,8
Apuntamiento.
p (N/100) - FK-1
Pp = LiK + C ------------------------ (p : 1, 2, ... , 99)
fK
p (80/100) - 66
310,22 = 309,95 + 2 ----------------------
5
===> p = 83,34
_
( X+S ) corresponde al percentil 83,34
p (80/100) - 12
300,62 = 299,95 + 2 ----------------------
8
===> p = 18,35
_
( X - S ) corresponde al percentil 18,35
_ _
===> El 65 % de los datos se agrupan entre (X-S) y (X+S).