Вы находитесь на странице: 1из 41

ESTADISTICA

Jorge Urrutia D.
ESTADÍSTICA INGENIERO CONSTRUCTOR
1.- OBJETIVO: El objetivo general de este curso es que el
alumno pueda interpretar la información estadística, procesar,
analizar y evaluar datos. Aplicar la estadística a la solución de
problemas de ingeniería.

2.1- INTRODUCCIÓN
La estadística como ciencia
Problemas que resuelve la estadística
El modelo estadístico

2.2.- LA DESCRIPCIÓN DE DATOS


Descripción estadística de una variable
Descripción conjunta de varias variables
2.3.- MODELOS DE DISTRIBUCIÓN DE PROBABILIDAD
Probabilidad y sus propiedades
Variables aleatorias
Modelos univariantes de distribución de probabilidad
Modelos multivariantes
Distribuciones asociadas a la normal

2.4.- ESTIMACIÓN DEL MODELO.


Introducción a la inferencia estadística
Muestreo
La estimación Puntual
Propiedades de los estimadores
Estimadores de máxima verosimilitud
Estimación de los parámetros en poblaciones normales
2.5 CONTRASTE DE HIPÓTESIS
Introducción
Contraste de significación
Enfoque de Neyman y Pearson
Intervalos de Confianza y contrastes de Hipótesis
Contraste de la razón de verosimilitudes

2.6.- CONTROL DE CALIDAD


Introducción
Conceptos de proceso bajo control
Control de fabricación de variables
Control de Fabricación por atributos
Control de Fabricación por número de defectos
Gráficos de control como herramientas de mejora de procesos
Control de recepción.
3.- METODOLOGÍA
Clases teóricas, expositivas

4.- EVALUACIÓN
Certámenes, informes grupales

5.- BIBLIOGRAFÍA:
5.1.- Canavás, G, “Probabilidad y Estadística, Aplicaciones y
Métodos 1era edición, McGraw Hill, 1988
5.2.- Zuwaylif, F., Estadística General Aplicada”, 1era edición,
Fondo Educativo Interamericano SA., 1977
5.3.- Kreiszig, E., “Introducción a la Estadística Matemática,
Principios y Métodos, Limusa, 1981
5.4.- Meyer, P., “Probabilidad y Aplicaciones Estadísticas “, 1era
Edición, Adisson Wesley, Iberoamericana, 1992.
Bibliografía:

1.- “Estadística, Teoría y Problemas Resueltos”. Horacio D’Ottone


2.- Leonard J. Kazmier, “Estadística Aplicada a la Administración y
la Economía”, Ed. Mc.Graw Hill, Schaum, 3era. Ed. 1998.
3.- Murray R. Spiegel, “Probabilidad y Estadística”, Mc. Graw Hill,
4- Hitoshi Kume, “Herramientas Estadísticas Básicas para el
Mejoramiento de la Calidad”.
5.- “Probabilidad y Estadística Aplicada a la Ingeniería”, Douglas
C. Montgomery y George Runyer, Mc Graw Hill, 1996
6.- “Estadística”. Murray Spiegel y Larry Stephens. Schaum

Nota Final =
Mapa de la Estadística
Análisis
Estadístico

Est. Descriptiva Est. Inferencial

Distr. de Frecuencia Distrib. Muestrales

Medidas de Tendencia Central


Medias

Datos no agrupados Proporción

Datos agrupados Intervalos de Confianza

Medidas de Dispersión
Medias y Proporción

Datos Agrupados
Una Población
Datos no agrupados
Dos Poblaciones
Principios de Probabilidad
Prueba de Hipótesis

Fórmula de la Suma
Media y Proporción
Fórmula de la Mult.

Distribuciones de Probabilidad Una Población

Dos Poblaciones
Datos Discretos
Análisis de Varianza
Datos Continuos
Análisis de Regresión y Correlación

Distrib. Normal
Regresión Simple

Regresión Múltiple

Pruebas No Paramétricas

Análisis de Series temporales

Números Indices

Técnicas de Control de Calidad


I. Estadística Descriptiva
1.1.- Principios y Fundamentos.
1.2.-Representación gráfica de los datos:
1.3.-Estadígrafos de Tendencia Central.
1.4.- Estadígrafos de Dispersión:
1.5.- Uso de Herramientas computacionales
ESTADISTICA
1.1.- Principios y Fundamentos:
1.- Que es la estadística
2.- El rol de la estadística en la ingeniería
3.- Ejemplos de uso de la estadística.
4.- Definiciones básicas:
•Tipos de datos
•Población
•Muestra
•Procedimientos de muestreo
•Muestra aleatoria simple
•Muestra sistémica
•Muestreo estratificado
•Error muestral.
I.- Principios y Fundamentos.:

Que es la estadística: La estadística es una ciencia que tiene como


finalidad facilitar la solución a problemas en los cuales necesitamos
conocer algunas características sobre el comportamiento de algún
suceso o evento.

Estas características nos permiten conocer o mejorar el


conocimiento de ese suceso. Además, nos permiten predecir el
comportamiento de sucesos iguales o similares sin que estos
ocurran.

La Estadística posee un conjunto de técnicas que se emplean para la


recopilación, organización, presentación, análisis e interpretación de
los datos para tomar decisiones y resolver problemas.
Dentro de la estadística se tienen dos áreas: La Descriptiva y la
Inferencial.

La Est. Descriptiva es aquella que se preocupa de resumir y


describir datos numéricos, partiendo de la base que estos datos
fueron previamente recopilados, por lo tanto hay que organizarlos y
presentarlos de una forma significativa, descriptiva y útil.

La Est. Inferencial son un conjunto de técnicas con las que, en


base únicamente a una muestra se toman decisiones en
condiciones de incertidumbre, donde se supone el uso de conceptos
de probabilidad.
El papel de la estadística en la Ingeniería.

El fuerte aumento de la competencia en la industria y la importancia


que tiene actualmente el aumento de la calidad de los productos y la
productividad global de la empresa (disminuir cantidad de
productos defectuosos, mejorar procesos, requerimientos de
inspección y pruebas, pérdidas por garantía, mejorar la satisfacción
del consumidor, etc.) hacen de la estadística un elemento
fundamental para describir y comprender el concepto de
variabilidad.
Virtualmente todos los procesos y sistemas de la vida
real presentan variabilidad (por diferencias de
muestreos, cambios en las condiciones de trabajo,
propiedades de los materiales, sistemas de medición
utilizados, etc.) Por lo tanto, en base a las
probabilidades se puede usar la Estadística Inferencial
(estimación puntual de parámetros, estimación por
intervalos de confianza y pruebas de hipótesis).
Esto nos da la posibilidad de tomar decisiones acertadas y a
tiempo, así como realizar proyecciones de algún evento. Esto es
debido a que solo realizamos los cálculos y el análisis con los datos
obtenidos de una muestra de la población y no con toda la
población. Pues realizarlo con todos los datos o población en
algunos casos seria muy difícil y en otros casos casi imposible por
la gran cantidad datos existentes.

La materia prima de la estadística consiste en conjuntos de datos


(números) obtenidos al contar o medir cosas. Al recopilar datos
estadísticos se ha de tener especial cuidado para garantizar que la
información sea completa y correcta.
Ejemplos de uso de la estadística.
• En la industria farmacéutica. A fin de determinar la efectividad de un
remedio antes de enviarlos al mercado.
• Para determinar el rating de TV (people meter)
• El SII evalúa las declaraciones de impuestos en forma aleatoria.
• Se realizan auditorías en forma selectiva y dependiendo del grado de error
encontrado se realiza en forma más exhaustiva.
• En la agricultura, a fin de determinar producciones y proyecciones de algún
tipo de producción/consumo.
• En el gobierno, para estimar el crecimiento industrial, del PIB, consumo,
tendencias, etc.
• En educación, a fin de ver el nivel alcanzado en ciertas materias. Puede ser
muestral o poblacional.
• Para controlar la calidad del agua, del aire, niveles de contaminantes, etc.
• En marketing, antes de lanzar un producto, para ver al grado de aceptación
de un nuevo producto, para ver si el cliente “recuerda una marca” o con que
asocia un tipo de marca.
• En psicología, con el fin de determinar patrones sicológicos de un grupo o
población.
• En el sector industrial, a fin de mejorar la calidad de los productos, para
mantener un estándar o por exigencias de un cliente.
Definiciones básicas:

Tipos de datos:
Variables: Una variable es la característica de la muestra o de la
población que se observa. Esta característica depende del tipo de
problema que se desea estudiar: kilómetros, edades, ingresos,
altura, peso, diámetro, etc.
Discretas
(valores
enteros)

Cuantitativa

Continuas
Variables
(números
Se tiene: reales)

Nominales
Cualitativa o
Atributos

Ordinales
Si las observaciones se pueden representar por medio de números
se trata de una variable cuantitativa. Por ejemplo; las estaturas en
centímetros de los alumnos de ésta clase. Además pueden ser
discretas, es decir toman valores enteros dentro de un cierto rango
o pueden ser continuas; las que pueden tomar cualquier valor
dentro de un rango especificado. (dependiendo del instrumento de
medición y de la sensibilidad requerida)

En cambio, una variable cualitativa se mide por medios no


numéricos. Por ejemplo; estado civil, nombre, apellidos, color de
pelo, etc.
Dentro de las variables cualitativas se tienen las nominales;
que se utilizan para organizar los datos en categorías
separadas y distintas. Por ejemplo;

Bebidas alcohólicas Refrescos;


Cerveza CocaCola.
Vino Fanta
Pisco Sprite
Jeréz
Las variables cualitativas ordinales dan un orden jerárquico o de
ordenamiento basada en un determinado criterio. Por ejemplo ;

• Inversión Riesgo
• Pesos Arg. Alto
• Pesos Colomb. Alto
• Dólar Moderado
• Euro Moderado
• Bonos Chilenos Bajo
• Oro Bajo
Población: Llamado también Universo, es la colección completa
(todas) de las observaciones de interés o que están bajo estudio.
Por ejemplo; la altura de todos los alumnos de una clase o
universidad, los ingresos de un país, o los ingresos superiores a x$
de una región. Cuando se tiene el resultado de la observación, este
pasa a ser un parámetro o valor poblacional.

Muestra: Es una proporción representativa de la población bajo


estudio, que se selecciona porque la población es demasiado
grande para analizarla en su totalidad. Por ejemplo; determinar el
nivel de aceptación o rechazo de un medicamento en un grupo de
pacientes. El valor que se obtiene se denomina estadístico,
estimador o valor muestral.

Por que se realizan muestreos: Por Costo, Tiempo, Pruebas


destructivas, población muy grande
Procedimientos de Muestreo: Se debe garantizar que cualquier
elemento de una población tiene la misma probabilidad de ser
elegida. Se asegura de esta forma que estos elementos sean
seleccionados sin sesgos de ninguna clase y puedan ofrecer una
base estadística confiable para la est. Inferencial

Muestra aleatoria Simple: Es aquella donde los elementos son


seleccionados al azar. Se utilizan los números aleatorios o tablas
de números aleatorios.

Muestra sistemática: Es una muestra aleatoria cuyos elementos


se seleccionan de la población a intervalos uniformes en una lista
ordenada. Puede inducir a errores por factores periódicos o
cíclicos.
Muestreo estratificado: Se clasifican primeramente los
elementos de la población en grupos, subgrupos o estratos, sobre
la base de alguna característica importante. Posteriormente, en
cada estrato se toma una muestra aleatoria simple. Sirve para
garantizar la representación proporcional de los subgrupos de la
población. Además se reduce el tamaño de la muestra requerida,
con lo que bajan los costos y el tiempo requerido.

Error muestral: Es la diferencia que existe entre el valor real y


el estadístico obtenido en la muestra. Este error muestral se puede
deber al azar en el proceso de muestreo (no sale ninguna pieza
defectuosa), mala selección de muestras, bajo de número de
muestras, mal cálculo de la población y a un sesgo muestral
(cuando existe una tendencia a seleccionar determinados
elementos de la muestra en lugar de otros)
Números
Aleatorios.
Filas/Columnas 1 2 3 4 5 6 7 8
1 81080 67493 23666 22251 17616 60716 77125 18653
2 83272 18379 46498 60045 80649 35179 3185 57068
3 82844 85553 16852 57931 84063 57516 46529 47030
4 33097 46244 16769 48531 56618 90035 88363 4097
5 48477 33067 76572 84835 96208 68558 23560 89245
6 61186 63971 20547 14846 77137 62636 88927 34322
7 92545 83866 6895 28019 8547 4275 79277 28833
8 5172 25637 13665 86725 45970 42670 35291 22685
9 73850 99275 97475 11064 93492 5362 57562 99582
10 77978 42899 65518 48688 96755 83554 76916 15224
11 16463 350 44697 94868 22697 33740 60701 4034
12 56564 40277 66044 78417 52968 52982 82340 92970
13 26355 51841 1235 15986 65898 74181 51391 11313
14 87582 80276 88583 30633 50721 65017 48735 4476
15 15659 86285 9579 7969 17850 88197 14309 25013
I.- Estadística Descriptiva
1.2.- Representación gráfica de datos
Gráficos:
• Circulares
• De barras: horizontales y verticales
• X-Y
• De Puntos
• Hoja y Tallos
• De Cajas
• Histogramas
Descripción del Conjunto de Datos

Descripción del
Conjunto de Datos

Distribución de Tabla de Visualizaciones Diseño de


Frecuencias Contingencia Gráficas "Tallo y Hoja"

Dist. de Frecuencias Histograma


Acumulada

Dist. de Frecuencia Polígono de Frecuencia


Relativa

Dist. de Frecuencias Ojivas


Relativas Acumuladas

Diagramas de Barras

Gráficos Circulares

Gráficos Lineales
Tallo y Hojas
Notas del primer certamen de estadística
58 88 65 96 85
74 69 63 88 65
85 91 81 80 90
65 66 81 92 71
82 98 86 100 82
72 94 72 84 73
76 78 78 77 74
83 82 66 76 63
62 62 59 87 97
100 75 84 96 99

Tallo y Hojas
Tallo Hojas
5 89
6 2233555669
7 122344566788
8 011222344556788
9 012466789
10 00
Tallo y Hoja
121 131 137 147
125 132 139 148
126 133 141 153
128 134 141 205
130 135 144 213
Tallo Hoja
12 1568
13 01234579
14 11478
15 3
16
17
18
19
20 5
21 3
Diagrama de Cajas
Los diagramas de Tallo y Hoja y el Histograma dan una buena
representación visual del conjunto de datos, mientras que el
promedio, moda y mediana son valores puntuales sobre una
característica del conjunto de datos.
El Diagrama de Caja representa el 75% de los datos
representados por una caja. En esta se señala el promedio y
posee dos líneas que representan los valores extremos.

Son muy útiles para hacer comparaciones rápidas entre 2 o


más conjuntos de datos.
Ej. Se tienen índices de calidad de fabricación de un
mismo componente en tres plantas diferentes.

120

110

100

90

80

70
Planta 1 Planta 2 Planta 3
Diagrama de Pareto(20/80)

Defecto N# % %Acumulado
Ensamble 98 49 49
Pintura 60 30 79
Electrico 20 10 89
Golpes 12 6 95
Otros 10 5 100

Diagrama de Pareto

120 120

100 100

80 80

% acumulado
N# defectos

60 60

40 40

20 20

0 0
Ensamble Pintura Electrico Golpes Otros
Tipo de Defecto
Distribución de Frecuencia e Histograma.
Ejemplo.

Edades de los alumnos de un curso vespertino.

30 31 29 28
28 27 34 27
23 28 27 32
26 36 25 31
31 29 26 38
30 36 36 25
35 26 24 33
27 25 27 28
Rango Frontera Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frec. Marca de
(xi) (ni) relativa(fi) relativa Acumulada Relativa Relativa clase
porcentual (Ni) acumulada acumulada (mi)
(fi%) (FI) porcentual
(FI%)
1 22,5 – 25,5 6 0.1875 18.75 6 0.1875 18.75 24
2 25,5 – 28,5 9 0.28125 28.125 15 0.46875 46.875 27
3 28,5 – 31,5 10 0.3125 31.25 25 0.78125 78.125 30
4 31,5 – 34,5 4 0.125 12.5 29 0.90625 90.625 33
5 34,5 -- 38,5 3 0.09375 9.375 32 1 100 36

Donde Marca de Clase es la mitad del intervalo o frontera . Por ejemplo, para el rango 1 la marca de clase es:
(25,5 – 22,5) /2 = 1,5
Marca de clase = 22,5 + 1,5 = 24
HISTOGRAMA

Histograma

15
Frecuencia

10
5
0
22,5 – 25,5 25,5 – 28,5 28,5 – 31,5 31,5 – 34,5 34,5 -- 38,5
Edades
Polígono de Frecuencias
Se obtiene a partir de las coordenadas (mi,ni) [marca de clase,
frecuencia], teniendo cuidado de cerrar el gráfico al inicio y al
final agregando una nueva marca de clase.

Polígono de Frecuencia
Frecuencia

10
8
6
4
2
0
22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Marca de clase
La Ojiva es la representación de
las frecuencias acumuladas. Se
Rango Intervalo Frec.
Acumulada debe cerrar el gráfico (partir)
0 22.5 0
1 25.5 4 desde el valor inferior de primer
2 28.5 13
3 31.5 23
intervalo.
4 34.5 29
5 38.5 32

Ojiva (Polígono de Frecuencia)

35
Frecuencia Acumulada

30
25
20
15
10
5
0
20 22 24 26 28 30 32 34 36 38 40
Intervalo (valor superior)
Distribución de Frecuencias e Histograma.

El histograma ofrece un resumen más compacto y de mejor visualización que la mayoría de los gráficos. Para
utilizar un histograma se deben agrupar los datos en marcas de clase o intervalos de clases. Posteriormente se
obtiene la cantidad de valores que caen dentro de este intervalo (Frecuencia). A continuación de determina la
frecuencia relativa y la acumulada y finalmente se grafica.

Ejemplo.

Edades de los alumnos de un curso vespertino.


30 31 29 28
28 27 34 27
23 28 27 32
26 36 25 31
31 29 26 38
30 36 36 25
35 26 24 33
27 25 27 28
Pasos en la construcción de un Histograma.

1ero. Determinar el valor inferior y superior: 23 y 38 respectivamente


2do. Determinar el número de clases o intervalos a utilizar.

Este número de clases o intervalos es arbitrario. En general, un histograma puede tener entre 5 y 20 clases. Si
el númeo de clases es bajo, el gráfico final no aporta ninguna información y por el contrario, si son
demasiadas clases puede ocacionar confusión. La regla más sencilla es determinar un valor “c” en 2 c >= n .

Donde “n” corresponde al número de datos u observaciones que se tiene. El valor de “c” se aproxima a la
potencia necesaria para obtener “n”. No es regla absoluta, se puede aproximar hacia arriba o abajo si
conviene.

En nuestro ejemplo se tiene que “n” = 32. Entonces 2c >=32 …. c ln2 = ln32 …c = 5

(Ej 2. Si n= 150 …2c >=150……c = 7,66 ~~~ c = 8)

Otra regla (Sturgers) dice que el número de clases (k) debe estar entre 4 <= k >= 20 y utiliza la fórmula k= 1
+ 3,3 log(n) …..k= 1 + 3,3log(32) = 5.9667 ~~ k = 6. Diferente al anterior, pero igual de válida.
3ero. Es necesario determinar el intervalo de clases. Corresponde al “ancho” o rango que cubre cada
intervalo. Se calcula como

Valor máx imo  Valor mín imo 38  23


IC   3
Número _ de _ clases _ deseado 5

Es posible ajustar este valor si da un resultado incómodo.

4to.- Se crean los intervalos (5) con su rango o intervalo de clases

Tabla-1
Rango Intervalo
1 23 – 26
2 26 –29
3 29 – 32
4 32 – 35
5 35 -- 38
5to.- Como se observa en la Tabla-1, el rango 1 comprende los valores de 23 a 26 y el rango 2 de 26 a 29.
Para los valores 26, 29,32, etc. se ajusta el límite superior de cada rango, quedando de esta forma:

Tabla-2 Tabla-3
Rango Intervalo Rango Intervalo Frontera
1 23 – 25 1 23 – 25 22,5 – 25,5
2 26 –28 2 26 –28 25,5 – 28,5
3 29 – 31 3 29 – 31 28,5 – 31,5
4 32 – 34 4 32 – 34 31,5 – 34,5
5 35 – 38 5 35 – 38 34,5 -- 38,5

En el caso de existir decimales y a fin de mantener la continuidad de los rangos, se determinan los valores
frontera, que corresponde a los valores de los intervalos de los rangos +/- un cierto valor. En este caso se
tienen números enteros, por lo que basta sumar/restar 0.5 a cada intervalo, se obtiene así la Tabla-3:
6to.- Se determina a continuación la frecuencia de valores que tiene cada intervalo. Esto da:

Rango Frontera Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frec. Marca de


(xi) (ni) relativa(fi) relativa Acumulada Relativa Relativa clase
porcentual (Ni) acumulada acumulada (mi)
(fi%) (FI) porcentual
(FI%)
1 22,5 – 25,5 6 0.1875 18.75 6 0.1875 18.75 24
2 25,5 – 28,5 9 0.28125 28.125 15 0.46875 46.875 27
3 28,5 – 31,5 10 0.3125 31.25 25 0.78125 78.125 30
4 31,5 – 34,5 4 0.125 12.5 29 0.90625 90.625 33
5 34,5 -- 38,5 3 0.09375 9.375 32 1 100 36

Donde Marca de Clase es la mitad del intervalo o frontera . Por ejemplo, para el rango 1 la marca de clase es:
(25,5 – 22,5) /2 = 1,5

Marca de clase = 22,5 + 1,5 = 24

La interpretación de este histograma es:

Para el rango 2: Existen 9 alumnos que están entre los 25,5 y 28,5 años de edad y su promedio es 27 años.
Represntan además el 28,125% del total de los alumnos (32). Se sabe también que 48,875% de los alumnos
(15) están entre las edades de 22,5 a 28,5 años y su promedio de edad es inferior o igual a 27 años.
Ejemplo de Histograma con Ojiva

Salario intervalo = (358 - 242)/6 = 19.33 ~~ 20


semanal Límites
Límites de exactos de Frecuencia Marca de Clase
clases clases ni mi

240 - 259 239.5 - 259.5 7 250


260 - 279 259.5 - 279.5 20 270
280 - 299 279.5 - 299.5 33 290
300 - 319 299.5 - 319.5 25 310
320 -339 319.5 - 339.5 11 330
340 - 359 339.5 - 359.5 4 350

Вам также может понравиться