Вы находитесь на странице: 1из 35

PROBABILIDAD

Y
ESTADSTICA
Ingeniera

2012






Cecilia Larran R. Estadstica Descriptiva Pgina 2

Introduccin
Qu es la Estadstica: La estadstica es una ciencia que tiene como finalidad
facilitar la solucin de problemas en los cuales es necesario conocer algunas
caractersticas sobre el comportamiento de algn suceso o evento.

conocer o mejorar el conocimiento de ese suceso
predecir el comportamiento de sucesos iguales o similares sin que estos
ocurran

La Estadstica posee un conjunto de tcnicas que se emplean para la
recopilacin, organizacin, presentacin, anlisis e interpretacin de los datos
para tomar decisiones y resolver problemas.


Por qu hay que estudiar Estadstica?
Si se revisan las mallas curriculares de las distintas carreras profesionales,
veremos que en la mayora existe por lo menos una asignatura de Estadstica.
Bsicamente los contenidos de un primer curso de Estadstica en diferentes
carreras son los mimos, la mayor diferencia radica en los ejemplos utilizados.

La principal razn es que el rol ms destacado de la Estadstica es la
recopilacin, presentacin, anlisis de un conjunto de datos, a partir de los
cuales se obtienen conclusiones y se toman decisiones.


Saber Estadstica es de gran utilidad en cualquier rea del conocimiento y en
particular en Ingeniera.

Ejemplos:
- Diseo y desarrollo y mejora en los proceso productivos como control de
calidad, control de la variabilidad del proceso,
- Estudios de materiales en cuanto a duracin, dureza, elasticidad, .
- Control de inventarios, con la estadstica se analiza la tendencia de flujo
de ciertos materiales y ciertos productos.
- Comparar los tiempos de ejecucin de 3 algoritmos de ordenacin
(algoritmo de la burbuja, de seleccin, de insercin, quicksort, treesort)
-





Cecilia Larran R. Estadstica Descriptiva Pgina 3

La mayor contribucin de la Estadstica en la resolucin de problemas en
ingeniera es su utilizacin como herramienta de aprendizaje. El aprendizaje
que se obtiene mediante la estadstica forma parte del denominado Mtodo
Cientfico
El mtodo cientfico es la estrategia de la investigacin cientfica: afecta a todo
ciclo completo de investigacin y es independiente del tema en estudio.
Al ser la Ingeniera la aplicacin del conocimiento cientfico, todo proyecto en
ingeniera debe contener los rasgos del mtodo cientfico.



La estadstica se puede clasificar como:
Estadstica
descriptiva
Tiene como objetivo caracterizar, describir y extraer
conclusiones sobre una muestra de datos o de la poblacin
de inters.

Probabilidad
Mide la incertidumbre, deduce las leyes que rigen a los
fenmenos que se investigan.
Es la herramienta a partir de la que se desarrolla la
inferencia estadstica
Estadstica
Inferencial
Implica realizar inferencias acerca de la de la poblacin a
partir de datos muestrales y requiere clculo de
probabilidades.
La inferencia de conclusiones generales a partir de datos de muestrales
es siempre incierta Uno de los objetivos principales de la
estadstica es medir esa incertidumbre














Cecilia Larran R. Estadstica Descriptiva Pgina 4














CONCEPTOS FUNDAMENTALES
Poblacin: Conjunto de elementos a los que se les estudia una caracterstica
Tamao poblacin: N
- Los estudiantes de La USACH
- Las personas activa en Chile (poblacin activa)
- La flota de aviones de aviones de una compaa area
Censo: estudio completo de la poblacin
A las medidas de resmenes poblacionales como la media poblacional ,
desviacin estndar poblacional , , se les denominan parmetros.

Muestra: subconjunto de elementos de la poblacin sobre el cual se va a llevar el
estudio).
Tamao muestra: n

Debera ser representativo
Est formado por miembros seleccionados de la poblacin (individuos,
unidades de estudio, unidades de obseservacin, unidades
experimentales).
A las medidas de resmenes muestrales como la media de la muestra
x, desviacin estndar de la muestra s, se les denomina
estadsticos.
De una poblacin existen muchas muestras posibles, pero slo observamos una!
La Estadstica Descriptiva utiliza, tablas,
grficos y resmenes numricos

Para realizar cualquier estudio estadstico,
hay que tener en cuenta:
Cmo y de donde se recolect la
informacin
Qu se midi atributos o cantidades?




Cecilia Larran R. Estadstica Descriptiva Pgina 5


Nota: A la hora de decidir sobre la forma de recoger la informacin de la muestra se utilizan
distintos criterios, originando distintos tipos de muestreos. (Anexo 2)
Encuesta: Tcnica de investigacin para obtener informacin de grupos de
personas mediante el uso de instrumentos como cuestionarios diseados en
forma previa.

Diseo de experimentos: Metodologa estadstica que permite identificar y
cuantificar las causas de un efecto en un estudio experimental. El objetivo del
diseo de experimento es estudiar si utilizar un determinado tratamiento produce
mejora en el proceso o no.

Variable: una variable es una caracterstica observable que vara entre los
diferentes individuos de una poblacin. La informacin que disponemos de cada
individuo es resumida en variables.


En la poblacin de alumnos de Ingeniera de una universidad, es variable:

- El gnero: {Femenino, Masculino} var. cualitativa dicotmica
- Especialidad :{Informtica, Industrial, Obras Civiles, } var. cualitativa politmica

- El nmero de asignatura aprobadas: {0,1,2,3,...} var. cuantitativa discreta
- Nivel de Educ. del padre: {Bsica, Media Superior} var. cualitativa ordinal
- La altura (en cm.): {162 , 156, 170 ...} var. cuantitativa continua
- Edad (aos): {17, 18, 19, } var. cuantitativa continua
.
.
.





Obs.: Se acostumbra denotar a las variables con letras maysculas. X, Y, Z


Dato: valor de la variable asociado a un elemento de la poblacin o muestra.
(los valores de las variables se denotan con letras minsculas)
HAY QUE CONOCER EL TIPO DE
VARIABLE PARA UTILIZAR LA
HERRAMIENTA ESTADSTICA
ADECUADA



Cecilia Larran R. Estadstica Descriptiva Pgina 6

Ejemplo: (archivo de datos)
Sujeto Sexo Edad Especialidad
(X
1
) (X
2
) (X
3
)


01 M 21 IND observacin 1
02 M 22 INF
03 F 31 OC
. . . .
. . . .
. . . .
La primera observacin indica que el sujeto es de sexo masculino, tiene 21 aos y
estudia Ingeniera Industrial. Cada una de estas tres mediciones es un dato para
cada una de las variables medidas para el sujeto 1.
El alumno de Ingeniera es la unidad de observacin

Datos primarios
Son aquellos que el investigador obtiene directamente de la realidad,
recolectndolos con sus propios instrumentos.

Datos secundarios
Son registros escritos que proceden tambin de un contacto con la prctica,
pero que ya han sido elegidos y procesados por otros investigadores.
Las fuentes son informacin de datos secundarios deben ser fidedignas.

Los datos primarios y secundarios no son dos clases esencialmente diferentes
de informacin, sino partes de una misma secuencia: todo dato secundario ha
sido primario en sus orgenes, y todo dato primario, a partir del momento en
que el investigador concluye su trabajo, se convierte en dato secundario para
los dems.






Cecilia Larran R. Estadstica Descriptiva Pgina 7

Clasificacin de variables
Para realizar un anlisis de datos, es indispensable saber cmo es la variable
que consideramos, pues ello determina el tipo de mtodo estadstico que se
debe utilizar. Las variables se clasifican como:






























Segn su naturaleza
Cualitativas o atributos
No toman valores numricos
(modalidades) y describen
cualidades. (no se pueden hacer
operaciones algebraicas con ellos).
Ejemplos: Estado Civil
Profesin

Cuantitativas
Sus valores son numricos (tiene
sentido hacer operaciones
algebraicas con ellos).
Ejemplos: Estatura
Nmero de errores
Segn tamao del recorrido
Dicotmicas
Toman uno de
dos valores.

Ejem.: Sexo

Discretas
Corresponden en general a
contar el nmero de veces
que ocurre un suceso.
Tienen un recorrido finito o
infinito numerable.
Ejem.: Nmero de cargas
familiares.
.


Continuas
Entre dos valores,
son posibles infinitos
valores intermedios
Ejemplo: Altura (cm)




Cecilia Larran R. Estadstica Descriptiva Pgina 8

Segn el nivel de medicin
La medicin es el proceso mediante el cual se les asignan valores numricos
a objetos siguiendo unas determinadas reglas. Los instrumentos que se
utilizan para llevar a cabo tal medicin se les denominan escalas de medicin.
El criterio utilizado convencionalmente para clasificar las escalas de medida es
el propuesto por Stevens (1946), quien establece cuatro tipos de escala:
nominal, ordinal, de intervalo y de razn.


































N
NNO
OOM
MMI
IIN
NNA
AAL
LL
ORDINAL
INTERVALAR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN

nicamente permiten
establecer relaciones de
igualdad/desigualdad
entre los objetos que se
estn midiendo.

NO INDICA ORDEN O
JERARQUA

Ejemplos
SEXO:
Masculino (1)
Femenino (2)

PROFESIN:

Ingeniero (1)
Profesor (2)
Mdico (3)





Cecilia Larran R. Estadstica Descriptiva Pgina 9









































NOMINAL
O
OOR
RRD
DDI
IIN
NNA
AAL
LL
INTERVALAR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Adems de permitir relaciones
de igualdad /desigualdad,
permite establecer relaciones
de orden (mayor o menor que)
entre los objetos que se estn
midiendo.
EXISTE UN ORDEN O
JERARQUA

Ejemplo
NIVEL EDUCACIONAL:

Univ. con doctorado (5)
Univ. con Magister (4)
Superior (3)
Media (2)
Bsica (1)





Cecilia Larran R. Estadstica Descriptiva Pgina 10











































NOMINAL
ORDINAL
I
IIN
NNT
TTE
EER
RRV
VVA
AAL
LLA
AAR
RR
RAZN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Al igual que los dos tipos de escalas anteriores (nominal u ordinal), esta escala
permite establecer relaciones de igualdad /desigualdad y de orden entre los objetos
que se miden. Los intervalos entre los nmeros de la escala son iguales, por lo
tanto se puede realizar las operaciones suma y resta. Este tipo de escala carece de
un cero absoluto, por lo que no estn permitidas ni la multiplicacin ni la divisin
entre los nmeros de la escala. Una escala de intervalo es, por ejemplo, la utilizada
para medir la temperatura. Como los intervalos de la escala son iguales, se puede
afirmar que la diferencia de temperatura que existe entre 25 y 28 grados es la
misma que existe entre 30 y 33 grados. Sin embargo, dado que el punto 0 de la
escala es arbitrario -no existe ausencia de temperatura- no se puede afirmar,
por ejemplo, que 20 grados es exactamente la mitad de 40 grados.



Cecilia Larran R. Estadstica Descriptiva Pgina 11













































NOMINAL
ORDINAL
INTERVALAR
R
RRA
AAZ
ZZ
N
NN
E
EES
SSC
CCA
AAL
LLA
AAS
SS D
DDE
EE M
MME
EED
DDI
IIC
CCI
II
N
NN
Es la escala que permite el nivel ms alto de medicin.
Adems de las operaciones que permiten las escalas
anteriores, en una escala de razn existe el cero (0)
emprico, por lo cual se puede efectuar cualquier operacin
aritmtica con los nmeros de la escala. El tiempo de
reaccin, por ejemplo es una variable medida en escala
de razn. No slo se puede afirmar que la diferencia entre
3 y 6 segundos es la misma que entre 6 y 9 segundos
(afirmacin vlida tambin en la escala de intervalos), sino,
adems, que 6 s es el doble de 3 s Afirmacin que es
posible establecer gracias a que en la escala de tiempo de
reaccin existe el cero absoluto: cero significa ausencia de
tiempo de reaccin.



Cecilia Larran R. Estadstica Descriptiva Pgina 12


Clasificacin de variables segn su funcin











Ejemplo: Los hbitos de estudios influyen en el rendimiento acadmico de los
Estudiantes

VI = hbitos de estudio
VD = Rendimiento acadmico
V interv. = Aptitud personal
Nivel nutricional
.
Ejercicios I
Ejercicio I-1
Determine en cada caso, si se trata o no de una variable.

- La edad mnima para poder votar por primera vez en Chile.
- Nmero de errores diarios en una central telefnica.
- Tiempo (en aos) de experiencia laboral.
- Profesin de los clientes de un banco.
- Sueldo de los Ingenieros.



VI
Independiente
Introduce o manipula el
investigador

VD
Dependiente
Se observa y se miden los
cambios

Interviniente
Es la que puede mediar en la
relacin entre VI y VD y que
puede influir en los resultados




Cecilia Larran R. Estadstica Descriptiva Pgina 13

Ejercicio I-2
Se quiere analizar el nmero de horas de estudio semanal que dedican los alumnos
postgrado del rea Ingeniera de esta Universidad. Para ello se selecciona a 35 alumnos
que estn participando en postgrado.
Indique cual es la:

Poblacin:
Variable:
Muestra:


Ejercicio I-3

El coeficiente intelectual (CI) promedio en la poblacin adulta chilena es 100 puntos. Un
investigador educacional est interesado en probar que las personas adultas que hablan
ms de un idioma tienen un CI superior a la media poblacional.
En una muestra de 250 personas que hablan ms de un idioma se obtuvo un
promedio (CI medio) de 102.

Complete:

Variable de inters (nombre)
X
Clasificacin de la variable
Naturaleza Recorrido Medicin


Promedio
poblacional

Promedio
muestral
x





Ejercicio I-4
Qu situaciones se representan estadsticamente con una variable discreta y cules con una
variable continua?
a. El nmero de defectuosos en la fabricacin
b. Los tipos de defectos encontrados
c. El tiempo de vida de las unidades que se fabrican
d. El costo de fabricacin
e. El nivel de satisfaccin de los clientes
f. N de pedidos que se hacen al mes
g. El tiempo que transcurre desde que llega un pedido hasta que llega el
siguiente





Cecilia Larran R. Estadstica Descriptiva Pgina 14

Ejercicio I-5
En el departamento de personal de una empresa con 10.000 trabajadores se quiere estimar los
gastos familiares en salud de sus empleados para determinar la posibilidad de proporcionarles un
plan de seguro mdico.
Si el gasto mensual ($) en salud de 10 empleados elegidos al azar fue:

71.060 233.852 158.916 54.910 329.460 134.368 111.758 274.550 204.136 115.634

Indique:
Poblacin: _______________________ Tamao N =
Unidad de observacin:
Variable: X =
Muestra: _________________________ Tamao: n =
Interprete
1
n
i
i
x

Calcule
2
1
i
n
i
x




FMS














Cecilia Larran R. Estadstica Descriptiva Pgina 15

Ejemplo 1 .Estadstica descriptiva
Ejemplo 1 (ArmadoA12.xls): El reporte de la inspeccin final de defectos de 150
productos para la lnea de armado A12 se muestra en la tabla siguiente:
Producto Defecto Producto Defecto Producto Defecto Producto Defecto Producto Defecto
1 Rayado 31 Manchado 61 Manchado 91 Manchado 121 Manchado
2 Abollado 32 Rayado 62 Astillado 92 Doblado 122 Manchado
3 Astillado 33 Rayado 63 Rayado 93 Manchado 123 Rayado
4 Astillado 34 Manchado 64 Astillado 94 Manchado 124 Manchado
5 Otros 35 Manchado 65 Astillado 95 Astillado 125 Abollado
6 Manchado 36 Doblado 66 Manchado 96 Rayado 126 Astillado
7 Rayado 37 Manchado 67 Rayado 97 Manchado 127 Manchado
8 Astillado 38 Manchado 68 Rayado 98 Abollado 128 Manchado
9 Doblado 39 Manchado 69 Manchado 99 Manchado 129 Astillado
10 Rayado 40 Rayado 70 Manchado 100 Manchado 130 Doblado
11 Rayado 41 Astillado 71 Manchado 101 Doblado 131 Abollado
12 Manchado 42 Rayado 72 Manchado 102 Astillado 132 Manchado
13 Manchado 43 Otros 73 Manchado 103 Astillado 133 Rayado
14 Otros 44 Astillado 74 Otros 104 Rayado 134 Doblado
15 Abollado 45 Rayado 75 Rayado 105 Manchado 135 Astillado
16 Manchado 46 Rayado 76 Manchado 106 Astillado 136 Manchado
17 Rayado 47 Rayado 77 Manchado 107 Rayado 137 Rayado
18 Manchado 48 Doblado 78 Rayado 108 Manchado 138 Rayado
19 Otros 49 Manchado 79 Astillado 109 Manchado 139 Astillado
20 Rayado 50 Manchado 80 Rayado 110 Abollado 140 Manchado
21 Doblado 51 Manchado 81 Astillado 111 Manchado 141 Rayado
22 Doblado 52 Rayado 82 Manchado 112 Abollado 142 Rayado
23 Rayado 53 Otros 83 Manchado 113 Rayado 143 Rayado
24 Manchado 54 Rayado 84 Doblado 114 Manchado 144 Rayado
25 Manchado 55 Doblado 85 Manchado 115 Manchado 145 Manchado
26 Rayado 56 Manchado 86 Astillado 116 Astillado 146 Rayado
27 Abollado 57 Rayado 87 Manchado 117 Rayado 147 Manchado
28 Manchado 58 Rayado 88 Manchado 118 Rayado 148 Rayado
29 Rayado 59 Doblado 89 Manchado 119 Manchado 149 Rayado
30 Rayado 60 Rayado 90 Astillado 120 Astillado 150 Astillado

Identifique
Unidad de estudio: ______________
Variable de Inters: ___________________ y clasifquela segn:
Naturaleza:____________ T Recorrido:___________ N Medicin:_________


Cecilia Larran R. Estadstica Descriptiva Pgina 16



Defectos en lnea de armado A12
(150 productos examinados)

F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0
6
45
56
12
23
8
Defecto del producto
Otro Rayado Manchado Doblado Astillado Abollado















































Reporte de la inspeccin final de
defectos de 150 productos para la
lnea de armado A12.
Rayado Manchado Manchado Manchado
Abollado Astillado Doblado Manchado
Astillado Rayado Manchado Rayado
Astillado Astillado Manchado Manchado
Otros Astillado Astillado Abollado
Manchado Manchado Rayado Astillado
Rayado Rayado Manchado Manchado
Astillado Rayado Abollado Manchado
Doblado Manchado Manchado Astillado
Rayado Manchado Manchado Doblado
Rayado Manchado Doblado Abollado
Manchado Manchado Astillado Manchado
Manchado Manchado Astillado Rayado
Otros Otros Rayado Doblado
Abollado Rayado Manchado Astillado
Manchado Manchado Astillado Manchado
Rayado Manchado Rayado Rayado
Manchado Rayado Manchado Rayado
Otros Astillado Manchado Astillado
Rayado Rayado Abollado Manchado
Doblado Astillado Manchado Rayado
Doblado Manchado Abollado Rayado
Rayado Manchado Rayado Rayado
Manchado Doblado Manchado Rayado
Manchado Manchado Manchado Manchado
Rayado Astillado Astillado Rayado
Abollado Manchado Rayado Manchado
Manchado Manchado Rayado Rayado
Rayado Manchado Manchado Rayado
Rayado Astillado Astillado Astillado














Defectos en lnea de armado A12
(150 productos examinados)
Defecto del
producto Frecuencia Porcentaje
Abollado
8 5,3
Astillado
23 15,3
Doblado
12 8,0
Manchado
56 37,3
Otros
6 4,0
Rayado
45 30,0
Total
150 100,0


El defecto ms frecuente en la
lnea de armado es Manchado

Moda = manchado







Cecilia Larran R. Estadstica Descriptiva Pgina 17

Ejemplo 2: : Datos sobre el nmeros de averas en Febrero.2012 de 40 centrales elctricas.

0 1 0 0 2 0 0 1 1 0
2 1 3 1 1 3 1 1 1 0
0 1 1 3 1 0 2 3 4 2
2 0 0 0 1 2 0 3 2 2

Identifique
Unidad de estudio: ______________
Variable de Inters: ___________________ y clasifquela segn:
Naturaleza:____________ T Recorrido:___________ N Medicin:_________































Nmeros de averas en
Febrero.2012 de 40 centrales
Elctricas.

0 1 0 0 2
2 1 3 1 1
0 1 1 3 1
2 0 0 0 1
0 0 1 1 0
3 1 1 1 0
0 2 3 4 2
2 0 3 2 2

Tabla de frecuencias

N de
averas Frecuencia Porcentaje
Porcentaje
acumulado
0
13 32,5 32,5
1
13 32,5 65,0
2
8 20,0 85,0
3
5 12,5 97,5
4
1 2,5 100,0
Total
40 100,0

Centrales elctricas (40). Febrero 2012
Grfico

Centrales elctricas (40). Febrero 2012

N de averas
4 3 2 1 0
R
e
c
u
e
n
t
o
14
12
10
8
6
4
2
0
1
5
8
13
13

Centrales elctricas (40). Febrero 2012

Estadsticos (Medidas de resumen)
N de averas
40
0
1,20
1,00
0
a
1,114
,637
,374
-,445
,733
0
4
,00
1,00
2,00
Vlidos
Perdidos
n
Media
Mediana
Moda
Desv. tp.
Asimetra
Error tp. de asimetra
Curtosis
Error tp. de curtosis
Mnimo
Mximo
25
50
75
Percentiles
Existen varias modas. Se mostrar el menor de los
valores.
a.



Cecilia Larran R. Estadstica Descriptiva Pgina 18





































Grficos
Nota de Estadstica
Semestre 2 - 2011



Nota
7,0 6,0 5,0 4,0 3,0 2,0 1,0
F
r
e
c
u
e
n
c
i
a
100
80
60
40
20
0
61
86
96
74
53
30
Histograma
Ejemplo 3
Nota de Estadstica
400 alumnos
Semestre 2 - 2011



Tabla de frecuencias


Semestre 2 - 2012
Nota de Estadstica
30 7,5 7,5
53 13,3 20,8
74 18,5 39,3
96 24,0 63,3
86 21,5 84,8
61 15,3 100,0
400 100,0
1 - 2
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7
Total
Vlidos
Frecuencia Porcentaje
Porcentaje
acumulado

Medidas de resumen

Nota de Estadstica
Semestre 2 - 2011



Cecilia Larran R. Estadstica Descriptiva Pgina 19

Identifique (ejemplo 3)
Unidad de estudio: ______________
Variable de Inters: ___________________ y clasifquela segn:
Naturaleza:____________ T Recorrido:___________ N Medicin:_________


Ejemplo 4: Grafico de tendencia

Consumo humano de leche de cabra en Espaa. (millones de litro)

Ao 1990 1991 1992 1993 1994 1995 1996 1997 1998
Consumo 62,5 29,9 31,3 25,2 20,8 16,1 15,8 15,9 16,6
Ao 1999 2000 2001 2002 2003 2004 2005 2006

Consumo 16,2 17,1 15,5 17,6 11,9 11,8 12,3 13,1


- El consumo anual de leche de cabra en el ao 1991 disminuy en 52,16% con
respecto al consumo del ao 1990 (variacin porcentual)
- Determine la variacin porcentual entre los aos 2001 y 2002.

Variacin porcentual =
Final
- 1 100
Inicial



Cecilia Larran R. Estadstica Descriptiva Pgina 20

1Estadstica Descriptiva Univariada
Organizacin de los datos
La estadstica descriptiva, entrega las tcnicas que permiten condensar grandes
grupos de datos mediante el uso de tablas de frecuencias, grficos y medidas
de resumen como media, desviacin estndar, correlacin.

Nota: Para resumir los datos siempre hay que tener en cuenta de que tipo es la variable
que queremos analizar

Datos en bruto o directos
Cuando la informacin es recolectada, sea de una muestra o de una poblacin,
esta se organiza en la secuencia en que fue obtenida. Esta secuencia de datos
registrados se encuentra desorganizada, lo que no permite extraer informacin
fcilmente, siendo difcil detectar cualquier patrn de variabilidad o estructura de
los datos.
Datos en bruto: Datos registrados en la secuencia en que fueron
recolectados, antes de ser procesados u ordenados.

Ejemplo pg. 15: (ArmadoA12.xls): El reporte de la inspeccin final de defectos de
150 productos para la lnea de armado A12 se muestra en la tabla siguiente:

Ejemplo 2 pg. 17: : Datos sobre el nmeros de averas en Febrero.2012 de 40
centrales Elctricas.

0 1 0 0 2 0 0 1 1 0
2 1 3 1 1 3 1 1 1 0
0 1 1 3 1 0 2 3 4 2
2 0 0 0 1 2 0 3 2 2









Cecilia Larran R. Estadstica Descriptiva Pgina 21

Ejemplo 3: En abril. 2012 se recolect informacin sobre la edad (en aos) de 50
estudiantes diurnos seleccionados de una universidad. El valor de los datos, en el
orden en que fueron recolectados se presenta a continuacin.
21 24 29 26 36
18 19 19 25 25
25 31 23 23 23
22 21 22 21 19
25 18 27 21 21
19 25 34 27 33
20 22 19 22 23
19 19 18 19 26
28 20 22 20 21
23 36 23 25 24














Tabla o distribucin de La presentacin grfica
frecuencias puede revelar de un
Es una tabla que constituye vistazo las
el resumen bsico de principales
los datos caractersticas
de un conjunto
de datos

Descripcin estadstica de una variable cualitativa
Grficos

- Sectorial
- Barras
Separadas
- Diagrama
de Pareto

- Pictograma










Medida de resumen
Moda: es el dato o
modalidad de mayor
frecuencia dato
ms representativo








Cecilia Larran R. Estadstica Descriptiva Pgina 22

Ejemplo 1: (p 15) El reporte de la inspeccin final de defectos para la lnea de armado A12
se muestra en la tabla siguiente:
Defectos_Linea A12

Defectos del
producto
Frecuencia absoluta
n
i

Frecuencia Relativa
f
i
=
i
n
n

Porcentaje
%
Abollado 8 0,05 5,33
Astillado 23 0,15 15,33
Doblado
Manchado 56 37,33
Rayado
Otros
Total 150 1,00 100%

Complete la tabla de frecuencias
Frecuencia absoluta (n
i
): Nmero de veces que ocurre la modalidad i. i = 1,2, ,k

Frecuencia relativa (f
i
): Es la proporcin de la categora o modalidad respecto del total
de datos. 0 < f
i
< 1 ; i = 1,2, ,k
Grfico sectorial:

Crculo dividido en
porciones que
representan las
frecuencias relativas o
porcentajes de una
poblacin o muestra
perteneciente a diferentes
categoras.

Como sabemos, un crculo
contiene 360 grados. Para
construir un grfico sectorial,
se multiplica por 360 la
frecuencia relativa de cada
categora, para obtener la
medida del ngulo
correspondiente

Defectos en lnea de armado A12
(150 productos examinados)



Defectos del producto

Cul es Defecto ms frecuente?

Cunto mide el de sector Defecto Manchado?






Abollado
5,33%
Astillado
15,33%
Doblado
8,00%
Manchado
37,33%
Rayado
30,00%
Otros
4,00%


Cecilia Larran R. Estadstica Descriptiva Pgina 23

Grfico de Barras Separadas

Defectos en lnea de armado A12
(150 productos examinados)
Diagrama de Pareto

Herramienta bsica de la mejora de calidad. Muy til para priorizar los problemas
o las causas que los generan.
Su fundamento parte de considerar que un pequeo porcentaje de las causas
producen la mayora de los efectos. Se tratar de identificar ese pequeo
porcentaje de causas vitales para actuar prioritariamente sobre l.

Centrales elctricas (40). Febrero 2011


F
r
e
c
u
e
n
c
i
a
60
50
40
30
20
10
0
6
45
56
12
23
8
Defecto del producto
Otro Rayado Manchado Doblado Astillado Abollado


Cecilia Larran R. Estadstica Descriptiva Pgina 24

Defecto frecuencia % frec. Acum. % acumulado

Manchado 56 37,33 56 37,33
Rayado 45 30,00 101 67,33
Astillado 23 15,33 124 82,67
Doblado 12 8,00 136 90,67
Abollado 8 5,33 144 96,00
Otros 6 4,00 150 100
TOTAL 150 100,0%


Se calculan solamente para el diagrama
Pareto (en este tipo de variable)

Descripcin estadstica de una variable cuantitativa
TABLAS Y GRFICOS

Si las observaciones en un conjunto de datos cuantitativos son discretos
(contables) o si los valores de la variable asumen slo unos pocos valores
distintos, puede ser apropiado armar tablas de frecuencia con valores nicos.

La distribucin de frecuencias (tabla)

- La distribucin de frecuencias para variables cuantitativas discretas es
similar a la de variables cualitativas. Los valores que toma la variable se
ordenan de de menor a mayor lo que permite registrar en la tabla las
frecuencias acumuladas. La representacin grfica que se utiliza para este
tipo de variables es barras separadas
Distribucin de frecuencias de la variable X
Nombre de la
variable
X
Frec.
Absoluta
n
i
Frec. Relativa
i
i
n
f =
n

Frec. Abs.
Acumulada
N
i
Frec. Relat.
Acumulada
i
i
N
F=
n

x
1
n
1
f
1
N
1
= n
1
F
1

x
2
n
2
f
2 N
2
= n
1
+ n
2

F
2

x
3
n
3
f
3 N
3
= n
1
+ n
2
+ n
3

F
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
k
n
k
f
k
N
k
= n F
k
= 1
Total n 1

x
i
= valor que toma la variable. i= 1,2, ,k



Cecilia Larran R. Estadstica Descriptiva Pgina 25

Variable X =
Unidad de observacin =
Cuntas centrales tienen menos de 2 averas?
Qu porcentajes de centrales tienen 3 o menos averas?
Qu porcentaje de centrales tienen ms de 3 averas?
Interprete:
n
2

f
3

N
4

F
4













N de averas
4 3 2 1 0
1
5
8
13 13
N


d
e

c
e
n
t
r
a
l
e
s
12
10
8
5
2
0

Ejemplo 2: (p 18) Datos sobre el nmero de averas de 40 centrales elctricas
en Feb.2012 se resumen en la tabla siguiente:

N de averas Frec.
Absoluta
n
i
Frec.
Relativa
f
i
Frec. Abs. Acumulada
N
i
Frec. Relat.
Acumulada
F
i
0 13 13 0,325
1 13 26
2
3 5
4 1 40
Total 40 1,000

GRFICO DE BARRAS SEPARADA



















Cuando la variable es continua o el nmero de valores posibles de una
variable discreta sea grande, para construir la tabla de frecuencias,


Cecilia Larran R. Estadstica Descriptiva Pgina 26

conviene agrupar los datos intervalos reales. stos agrupan todos
aquellos casos contenidos entre dos valores, conocidos como el lmite
superior e inferior.


Ejemplo: (p 21) En abril. 2012 se recolect informacin sobre la edad (en aos) de 50
estudiantes seleccionados de una casa de estudio superior. El valor de los datos, en el
orden en que fueron recolectados se presenta a continuacin. (Este es un ejemplo de
datos cuantitativos en bruto)

21 24 29 26 36
18 19 19 25 25
25 31 23 23 23
22 21 22 21 19
25 18 27 21 21
19 25 34 27 33
20 22 19 22 23
19 19 18 19 26
28 20 22 20 21
23 36 23 25 24

Construyendo tablas de frecuencias
Al construir tablas de frecuencias es necesario tomar las siguientes 3 decisiones:
i) Nmero de clases (intervalos)
Usualmente el nmero de intervalos de una distribucin de frecuencias vara
entre 5 y 20, dependiendo principalmente del nmero de casos con los cuales se
cuente. La decisin del nmero de clases es decidida arbitrariamente por quien
organiza la informacin.
Reglas que puede ayudar a decidir el nmero de clases o intervalos:
- Nmero de intervalos = n ; n = nmero de datos, o
- Nmero de intervalos = [1 + 3,3 log n] (frmula de Sturge)
ii) Amplitud de intervalo: Aunque no es comn tener clases o intervalos
de diferentes tamaos o amplitud, la mayora del tiempo es preferible
tener la misma amplitud de intervalo en todos ellos.

Para determinar esta amplitud cuando las clases o intervalos tienen el mismo
tamao, primero se debe encontrar la diferencia entre el mayor y el menor de los
datos en los datos. Luego, la amplitud aproximada es obtenida dividiendo esta
diferencia por el nmero deseado de clases o intervalos.



Cecilia Larran R. Estadstica Descriptiva Pgina 27

valor mximo - valor mnimo
Amplitud del intervalo =
nmero de intervalos




iii) Lmite inferior de la primera clase o punto de partida
Cualquier nmero que sea igual o menor que el ms bajo de los valores del
conjunto de datos ser conveniente para ser usado como el lmite inferior del
primer intervalo.
En el ejemplo (Edad): n = 50 mx = 36 mn = 18
Si utilizamos nmero de intervalos = [1 + 3,3 log (50)] = 6
Amplitud =
36 18
= 3
6


Se lee

Edad

n de alumnos
14 alumnos con edades entre 18 y menos de 21 aos
18 21 14
17 alumnos con edades entre 21 y menos de 24 aos
21 24 17

24 27 10

27 30 4

30 33 1
4 alumnos con edades entre 33 y 36 aos
33 36 4

Total = 50

Frecuencias relativas y porcentaje
Es posible calcular la frecuencia relativa y el porcentaje de las distribuciones cuantitativas del
la misma forma que en las distribuciones cualitativas o discretas.

Edad Marca de clase
x
i
Frec. Absoluta
n
i
Frec. Relativa
f
i
Porcentaje
18 21 19,5 14 0,28 28
21 24 22,5 17 0,34 34
24 27 25,5 10 0,20 20
27 30
30 33
33 36
Total = 50 1,00 100%
Tambin se pueden registrar las frecuencias acumuladas




limite inferior +limite superior
marca de clase =
2





Cecilia Larran R. Estadstica Descriptiva Pgina 28


Representacin grfica de distribuciones de frecuencias con datos en intervalos
Las representaciones grficas ms frecuentes de una tabla de frecuencias donde los
datos han sido agrupados en intervalos son el histograma o el polgono de
frecuencias.

Edad en aos

Muestra de 50 estudiantes de una universidad (abril 2012)

Donde cada rectngulo corresponde con una clase y la altura es proporcional
a la frecuencia de dicha clase o intervalo.
Formas de histogramas
Un histograma puede asumir diferentes formas. Las ms comunes son: simtricos,
asimtricos y uniforme o rectangular.
Simtrico Asimetra Positiva Asimetra Negativa








Interprete los tres histogramas
Edad
39 36 33 30 27 24 21 18 15
N


e
s
t
u
d
i
a
n
t
e
s
20
15
10
5
0
4
1
4
10
17
14
Histograma
x
32.5 27.5 22.5 17.5 12.5 7.5 2.5
Simtrica
10
8
6
4
2
0
X
32.5 27.5 22.5 17.5 12.5 7.5 2.5
10
8
6
4
2
0
X
32.5 27.5 22.5 17.5 12.5 7.5 2.5
10
8
6
4
2
0


Cecilia Larran R. Estadstica Descriptiva Pgina 29

Observacin: Describir datos utilizando grficos puede ayudar a iluminarnos acerca de
las caractersticas principales de la informacin. Desafortunadamente, tambin pueden
ser utilizados, casual o intencionadamente, para distorsionar informacin y desorientar
a quien la recibe. Las siguientes son dos formas de hacerlo:
1. Cambiar la escala en uno o en ambos ejes (esto es alargando o acortando los ejes)
2. Truncando las frecuencias, es decir, comenzando el eje en un nmero mayor que
cero.
Polgono de frecuencias
Grfico alternativo al histograma
Los polgonos de frecuencias se realizan trazando los puntos formados por las marcas
de clase y las frecuencias, y unindolos mediante segmentos.

Polgono de frecuencias (Edad en aos)

Muestra de 50 estudiantes de una universidad (abril 2012)










Edad
39,0 37,5 36,0 34,5 33,0 31,5 30,0 28,5 27,0 25,5 24,0 22,5 21,0 19,5 18,0 16,5 15,0
N


a
l
u
m
n
o
s
20
15
10
5
0
0
4
1
4
10
17
14
0


Cecilia Larran R. Estadstica Descriptiva Pgina 30

Ejercicios II
En cada uno de los siguientes ejercicios debe indicar cul es: unidad de observacin, la
variable de inters y clasificarla segn naturaleza, T_recorrido y N_medicin.

Ejercicio II-1
El Ingeniero a cargo del control de calidad del agua de una ciudad, es responsable del nivel
de cloracin del agua. Dicho nivel debe acercarse bastante al que exige el Departamento de
Sanidad. Para vigilar el cloro, sin necesidad de verificar cada galn de agua que sale de la
planta, el Ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y
saca una conclusin sobre el nivel promedio de cloracin que tiene el agua tratada ese da.
La tabla anexa exhibe las concentraciones de cloro correspondiente a 30 galones
seleccionados como muestra de un da. A partir de esta muestra diaria el Ingeniero obtiene
sus conclusiones respecto a la poblacin total a la que se le aplic la cloracin.
Diagrama de tallo-hojas
Tabla de Concentraciones de Cloro
en partes por milln (ppm)

16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.2
15.7 16.6 15.8 16.2 15.9 15.9 15.6 15.8
16.1 15.9 16.0 15.6 16.3 16.8 15.9 16.3
16.9 15.6 16.0 16.8 16.0 16.3




(Utilice una amplitud de 0.3 ppm).

Construya una tabla de distribucin de frecuencias y un grfico adecuado.

Ejercicio II-2
En un centro de computacin, el nmero de veces que el computador se detiene, por error
de mquina, diariamente, fue recolectado por un perodo de 70 das. Los datos obtenidos
fueron los siguientes.

N de detenciones del computador por da.
0
1
0
2
0
0
8
3
2
1
2
5
1
0
6
0
0
1
0
4
0
0
0
0
3
0
4
1
1
3
3
3
0
2
1
3
0
1
1
2
0
6
1
2
4
0
2
0
0
0
1
0
2
0
2
0
2
2
5
0
0
3
1
2
0
0
0
0
1
4

- Tabule y grafique los datos adecuadamente.
- Cul es la proporcin de das en que ocurren ms de 3 detenciones?
-



Stem-and-Leaf Plot

Frequency Stem & Leaf

,00 15 .
1,00 15 . 2
1,00 15 . 4
5,00 15 . 66677
7,00 15 . 8889999
5,00 16 . 00001
5,00 16 . 22333
2,00 16 . 44
1,00 16 . 6
3,00 16 . 889

Stem width: 1,0
Each leaf: 1 case(s)



Cecilia Larran R. Estadstica Descriptiva Pgina 31

Ejercicio II-3

Un fabricante de envases de plstico desea analizar cules son las causas que generan los
envases defectuosos que se producen. Se observan 248 envases defectuosos obteniendo:

Coloque los n
i
en las barras. Interprete el grfico

Ejercicio II-4
En un proceso de fabricacin de circuitos integrados las causas ms comunes de fallas son: la
contaminacin (1), xido(2), metalizacin (3), la corrosin(4), doping (5) ,los defectos del silicio (6) y
varios (7). En un proceso de control de calidad de estos circuitos las causas de falla de 31 de ellos
han resultado las siguientes:
corrosin xido contaminacin xido
xido varios xido contaminacin
metalizacin xido contaminacin contaminacin
xido contaminacin contaminacin contaminacin
corrosin silicio varios contaminacin
contaminacin contaminacin varios contaminacin,
contaminacin doping xido xido
metalizacin contaminacin contaminacin

Se pide: Construir una distribucin de frecuencias y confeccione dos grficos adecuados.



Defectos
Color Fuera de
medida
Rosca Rotura Desbalanceo Aplastamiento
F
r
e
c
u
e
n
c
i
a
100
80
60
40
20
0
P
o
r
c
e
n
t
a
j
e
100%
80%
60%
40%
20%
0%
100,00% 99,60%
97,18%
92,34%
76,61%
60,48%
Diagrama de Pareto


Cecilia Larran R. Estadstica Descriptiva Pgina 32

Ejercicio II-5
Al responsable en control de industrial de una empresa, debe analizar informacin entregada en un
histograma de la duracin (tiempo hasta fallo en horas) de un test de fiabilidad 150 dispositivos
electrnicos idnticos.

a. Construya la tabla de frecuencias (absolutas, relativas, absolutas acumulada y relativas
acumulada)
b. Aproximadamente, cul es la duracin ms frecuente?
c. Qu porcentaje de dispositivos duraron entre 600 y menos de 1400 horas?
d. Qu porcentaje de dispositivos duraron menos de 900 horas? (aprox.)
e. Qu porcentaje de dispositivos duraron entre 400 y 1500 horas? (aprox.)
f. Determine entre que valores de duracin se encuentran el 50% de los dispositivos con
mayor duracin.
|
50%
|
50%
|
Duracin (hrs)

0 1600
Mn Mx

g. Complete la tabla siguiente y realice un grfico adecuado:

Duracin Frecuencia Porcentaje
Poca ( < 400 h)
Media (400 y menos de 1000 h)
Bastante ( > 1000 h)
Total 150 100


Duracion
2000 1800 1600 1400 1200 1000 800 600 400 200 0
N


d
e

d
i
s
p
o
s
i
t
i
v
o
s
60
50
40
30
20
10
0
3 3
6
18
21 21
27
51
Histograma


Cecilia Larran R. Estadstica Descriptiva Pgina 33

Ejercicio II-6
Se seleccionaron de un proceso de fabricacin, aleatoriamente 270 ladrillos y se llev a
cabo una prueba para determinar la resistencia transversal de stos. Se obtuvieron los
siguientes datos:
Resistencia (MN/m
2
)
X

n
i
1.5 3.5
3.5 4.5
4.5 5.5
5.5 6.5
6.5 7.5
7.5 8.5
8.5 9.5
9.5 10.5
10.5 11.5
11.5 14.5
2
4
24
81
78
51
18
9
2
1

Construya un grfico adecuado
El histograma es especialmente adecuado para representar tablas de frecuencias en el
caso de variables de de nivel por lo menos intervalar (o discretas con un gran nmero de
valores observados distintos). Este grfico consiste en una serie de barras adyacentes
cuyas superficies son proporcionales a la frecuencia del intervalo sobre el cual se levantan.
Si los intervalos son de igual amplitud, los rectngulos sern de altura proporcional a la
frecuencia correspondiente. Es decir, si la amplitud del i-simo intervalo es a
i
y su
frecuencia n
i
la barra deber tener una altura h
i
que satisfaga:

i i i
i
i
i
ah = kn
n
h = k
a

donde k es cualquier constante, aunque la misma para cada intervalo.
n
i
frecuencia absoluta del intervalo i; h
i
frecuencia absoluta corregida

Se corrige la frecuencia solamente para graficar el histograma, cuando
existen intervalos de distinta amplitud (no es usual intervalos de distinta amplitud)

Determine el porcentaje de ladrillos con resistencia inferior a 8,5 MN/m
2


Determine el porcentaje de ladrillos con resistencia superior a 5 MN/m
2







Cecilia Larran R. Estadstica Descriptiva Pgina 34

Ejercicio II-7
En un estudio sobre el nivel de ruido en un concierto de rock se toma una muestra de 60
valores, medidos en decibelios y en distintos momentos del concierto.
Los datos obtenidos se encuentran el el diagrama tallo-hojas siguiente

NIVEL DE RUIDO

Frequency Stem & Leaf

1,00 8 . 3
3,00 8 . 789
22,00 9 . 0000111123333334444444
21,00 9 . 555566677777777889999
11,00 10 . 00001122234
2,00 10 . 57

Encuentre:
Valor mnimo
Valor mximo
El % de mediciones inferior a 91 db.
El % de mediciones superior a 100 db.

Ejercicio II-8

Con el propsito de mejorar el tiempo de entrega desde una embotelladora de refrescos a mquinas
vendedoras de una universidad, se ha obtenido 40 datos.

X:Tiempo de entrega en minutos
9,45 24,45 31,75 35,00 25,02 16,86 14,38 9,60 24,35 37,50
17,08 37,00 41,95 11,66 21,65 17,89 69,45 10,30 34,93 46,59
44,88 54,12 56,63 22,13 21,15 10,02 14,88 16,97 17,73 21,84
24,45 33,66 37,10 39,73 44,29 55,12 56,63 29,41 24,45 9,45

Organice los datos en una tabla de frecuencias con igual amplitud y confecciones un grfico
adecuado

Tiempo de
entrega
(min)

xi
Frecuencia
Absoluta
ni
Porcentaje
9,45 - 19,45 14,45 13 32,5




59,45 - 69,45 64,45 1 2,5
Total 40 100,0





Cecilia Larran R. Estadstica Descriptiva Pgina 35

Ejercicio II-9

En el departamento de montaje de una industria se producen diariamente cierta
cantidad de productos defectuosos. Para estudiar ese fenmeno se decidi realizar
un anlisis de Pareto.
Durante cuatro meses de observacin se recogieron datos sobre el tipo de defectos
de los productos y se contabilizaron un total de 350 defectos.




a. Qu representa el 84% (polgono)?

b. Complete la tabla de frecuencias siguiente:
Tipo de defectos N de defectos porcentaje
Piezas errneas

Revestimiento araado

Montaje defectuoso

Pieza faltante

Rugosidad superficial

Otras causas

Total




N


d
e

d
e
f
e
c
t
o
s
100
80
60
40
20
0
P
o
r
c
e
n
t
a
j
e
100%
80%
60%
40%
20%
0%
100%
98%
92%
84%
74%
42%
Tipos de defectos
Otras causas Rugosidad
superficial
Pieza faltante Montaje
defectuoso
Revestimiento
araado
Piezas
errneas

Вам также может понравиться