Вы находитесь на странице: 1из 26

UNIVERSIDAD DE SANTANDER

ESTADISTICA DESCRIPTIVA Giampaolo Orlandoni Merli

Bucaramanga, Febrero 2014


GIAMPAOLO ORLANDONI MERLI. 2014

ESTADISTICA
Ross, Sheldon. Probabilidad y Estadstica para Ingenieros, 2Ed.
Walpole, Myers, Myers, Ye. Probability and Statistics for Engineers and Scientists. 9th Ed. Prentice Hall. Devore,J. (2005). Probabilidad y Estadstica para Ingeniera y Ciencias. 6a Ed. Thomson. Canavos, G. (1988). Probabilidad y Estadstica. Aplicaciones y Mtodo.

ESTADISTICA
Mtodos y procedimientos para recoger, clasificar, resumir, y analizar los datos correspondientes a determinado estudio o investigacin
Realizar Inferencias a partir de esos datos, con la finalidad de ayudar a la toma de decisiones.

ESTADISTICA
ESTADSTICA MATEMTICA INVESTIGACIN MODELOS INCERTIDUMBRE VARIABILIDAD FENMENO DETERMINSTICO FENMENO ALEATORIO O ESTOCSTICO

Mtodos Estadsticos
Procedimientos para

1-Disear Estudios de Investigacin


2-Colectar Datos 3-Resumir y presentar datos 4-Inferir conclusiones a la poblacin a partir de la muestra de datos obtenidos de esa poblacin.

Debido a la complejidad de los estudios, usualmente se hace un gran nmero de mediciones sobre las unidades observacionales (UO) o sujetos en estudio.
En estas situaciones complejas, la metodologa sistemtica proporcionada por la estadstica ayuda a ordenar y aclarar las relaciones de complejidad subyacentes.

METODOLOGIA ESTADISTICA
1-METODOLOGIA ESTADISTICA 2-DATOS ESTADISTICOS
1.1-CONCEPTO Y NATURALEZA. 1.2-CLASIFICACION: TEMPORALES, ATEMPORALES 1.3-ESCALAS DE MEDIDA: NOMINAL, ORDINAL, INTERVALOS

3-VARIABLES ESTADISTICAS
2.1-VARIABLES CATEGORICAS O CUALITATIVAS 2.2-VARIABLES CUANTITATIVAS: DISCRETAS, CONTINUAS

4-ANALISIS DECRIPTIVO DE LOS DATOS ESTADISTICOS


3.1-GRAFICOS: HISTOGRAMAS, CAJAS, TENDENCIA, DISPERSION 3.1-DISTRIBUCION DE FRECUENCIAS. ABSOLUTA. RELATIVA. 3.2-MEDIDAS DESCRIPTIVAS: 1-TENDENCIA CENTRAL 2-POSICION 3-DISPERSION 4-FORMA 5-ASOCIACION

METODOLOGIA ESTADISTICA
IDENTIFICACION DEL PROBLEMA D E S C R I P T I V A OBTENCION DE DATOS PROCESAMIENTO Y SINTESIS DE DATOS

DATOS de la POBLACION
Conjunto total de mediciones de la caracterstica del proceso

DATOS de la MUESTRA
Subconjunto representativo de la poblacin (grupo de mediciones)

CARACTERISTICAS POBLACIONALES (PARAMETROS) Valores desconocidos de la Poblacin Se estiman con base en muestras

CARACTERISTICAS MUESTRALES (ESTIMADORES) Funcin de la muestra Se infieren a la poblacin

LA ESTADSTICA: Estudia Fenmenos Aleatorios: Fenmenos parcialmente predecibles debido a su variabilidad inherente. Identifica y Analiza la Variabilidad Inherente de los Fenmenos Aleatorios. Proporciona mtodos para recolectar, organizar, resumir y analizar informacin con fines descriptivos e inferenciales.

PROBLEMAS, INFORMACION Y DATOS ESTADISTICOS


REALIDAD UNIDADES EXPERIMENTALES MEDIDAS RELEVANTES DATOS ESTADISTICOS INFORMACION UTIL INDISPENSABLE:

Planificar la recoleccin de datos dentro del marco de las preguntas que deben contestarse. Datos correctos y exactos, recopilados mediante elaborados diseos muestrales o experimentales, son intiles si no permiten resolver las preguntas de inters.

PROCESO GENERADOR DE INFORMACION UTIL PARA LA SOLUCION DE PROBLEMAS:


1. FORMULACION DEL PROBLEMA O PREGUNTAS QUE DEBEN RESOLVERSE 2. RECOPILAR DATOS RELATIVOS A LAS CUESTIONES PLANTEADAS DISEO EXPERIMENTAL

3. ORGANIZAR Y ANALIZAR LOS DATOS EN FORMA ADECUADA:


1. ANALISIS GRAFICO 2. ANALISIS NUMERICO

DATOS ESTADISTICOS
RESULTADO NUMERICO DE MEDIDAS SOBRE UNIDADES EXPERIMENTALES OBSERVACIONES DISPONIBLES PARA EL ANALISIS ESTADISTICO INFORMACION: ESTA BASADA EN DATOS. PERMITE RESOLVER PROBLEMAS CLASIFICACION DE LOS DATOS: 1-DATOS TEMPORALES: SERIES CRONOLOGICAS DATOS DE UN MISMO ELEMENTO EN DISTINTOS PERIODOS DE TIEMPO EJEMPLO: DiamPiston.sf6 2-DATOS ATEMPORALES: MATRICES DE DATOS DATOS DE DIFERENTES ELEMENTOS EN UN MISMO PERIODO DE TIEMPO EJEMPLO: Carros.sf6
X1 X2 ... Xj ......... Xp

ESCALAS DE MEDIDA
1. 2. 3. 4. NOMINAL ORDINAL INTERVALO RELACION

MATRIZ de DATOS

Xij

ESCALAS DE MEDIDA
ESCALA CARACTERISTICAS 1.IDENTIFICACION Y CLASIFICACION DE UNIDADES NOMINAL 2.LOS NUMEROS INDICAN LA CLASE O CATEGORIA. NO INDICAN CANTIDAD DE LA CARACTERISTICA DE LAS UNIDADES EJEMPLOS 1.CLASIFICACION POR SEXO 2.CLASIFICACION POZOS PETROLEROS 1.PORCENTAJES 2.MODA MEDIDAS ESTADISTICAS

(PRODUCTIVO, SECO)

1.ORDENAMIENTO Y POSICION RELATIVA DE LAS UNIDADES


2.INDICA SI UNA UNIDAD TIENE MAS O MENOS CANTIDAD DE LA CARACTERISITICA QUE OTRA UNIDAD 3.NO INDICA LA MAGNITUD DE LAS DIFERENCIAS ENTRE LAS UNIDADES 4.PERMITE MEDIR OPINIONES, ACTITUDES, PREFERENCIAS 1.FRACTILES 1.CLASE ECONOMICA SOCIAL 2.CALIDAD DEL CRUDO: (PESADO, LIVIANO)

ORDINAL

2.MEDIANA

1.MEDIA
1.LAS DIFERENCIAS ENTRE UNIDADES PUEDEN COMPARARSE. INTERVALOS 2.LAS DISTANCIAS IGUALES EN LA ESCALA REPRESENTAN VALORES IGUALES EN LA CARACTERISTICA QUE SE MIDE 3.EL PUNTO CERO ES ARBITRARIO 1.EL PUNTO CERO ES FIJO RELACION 1.EDAD 2.LA RELACION ENTRE LOS VALORES DE LA 2.INGRESO 3.COSTOS ESCALA SE PUEDE CALCULAR 1.TEMPERATURA (F, C) 2.OPINIONES 3.INDICES 2.RANGO 3.VARIANZA 4.DESVIACION ESTANDAR 5.COEFICIENTE

CORRELACION
1.MEDIA GEOMETRICA 2.COEFICIENTE VARIACION

VARIABLES ESTADISTICAS
CUALITATIVAS CUANTITATIVAS

Vernier

No PASA

PASA

Tiempo
ON OFF

TEMPERATURA

Circuito Elctrico

Termmetro
11

VARIABLE ESTADISTICA
VA: REPRESENTA CARACTERISTICAS DE LOS ELEMENTOS QUE CONFORMAN LA POBLACION O MUESTRA CLASIFICACION: CUALITATIVAS, CUANTITATIVAS

Variable
CUALITATIVA CATEGRICA

Ejemplos
Bueno Malo (Calidad Aparato, Servicio) Pasa - No pasa Defecto- No Defecto Color N. Pozos Perforados Nmero Defectos, Accidentes, Fallas Nivel Educativo Categora Profesional

Caractersticas
Atributos Cualidades Valores Enteros Nmero Casos

Grficos
BARRAS SECTORES MOSAICOS

BARRAS MOSAICOS ASOCIACION HISTOGRAMA POLIGONO CAJAS TENDENCIA ASOCIACION 12

CUANTITATIVA DISCRETA

CUANTITATIVA CONTINUA

Temperatura Presin Tiempo,Edad Volumen de Crudo Extrado Dureza Presin Arterial Precios

Valores Reales

VARIABLES DISCRETAS
DIAGRAMA de BARRAS. GRAFICOS DE SECTORES

Class

Frecuencia Frec. Acumulada CIL Absoluta Relativa Absoluta Relativa 1 4 104 0.689 104 0.689 2 6 30 0.199 134 0.887 3 8 17 0.113 151 1.000

PROCEDIMIENTO STATGRAF: ANALYZE ATTRIBUTE DATA ONE FACTOR TABULATION

VARIABLES CONTINUAS
HISTOGRAMA de FRECUENCIAS. DIAGRAMA de CAJA. DISTRIBUCION de FRECUENCIAS
22 19 20

El Histograma indica la mezcla de tres poblaciones (origen) El anlisis debe hacerse por grupo de origen
DISTRIBUCION DE FRECUENCIAS
Limite Clase 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Total Limite Punto Medio 14.3 16.9 19.4 22.0 24.6 27.1 29.7 32.3 34.9 37.4 40.0 42.6 45.1 47.7 Frecuencia Absoluta 1 11 19 10 12 20 14 18 22 11 5 3 3 1 150 Relativa 0.0067 0.0733 0.1267 0.0667 0.0800 0.1333 0.0933 0.1200 0.1467 0.0733 0.0333 0.0200 0.0200 0.0067 Frecuencia Acumulada Absoluta 1 12 31 41 53 73 87 105 127 138 143 146 149 150 Relativa 0.0067 0.0800 0.2067 0.2733 0.3533 0.4867 0.5800 0.7000 0.8467 0.9200 0.9533 0.9733 0.9933 1.0000 Inferior Superior 13.0 15.6 15.6 18.1 18.1 20.7 20.7 23.3 23.3 25.9 25.9 28.4 28.4 31.0 31.0 33.6 33.6 36.1 36.1 38.7 38.7 41.3 41.3 43.9 43.9 46.4 46.4 49.0

DIAGRAMA DE CAJA (BOX Plot) Sntesis grfica de los datos. Indica: ubicacin, dispersin, asimetra Los lados de la caja representan el primer y tercer quartil Q1, Q3. La lnea media de la caja representa la mediana o segundo quartil Q2. Los valores mximo y el mnimo no outliers se grafican como puntos al final de las lneas Rango Intercuartil RI=(Q3 - Q1): medida de la dispersin del 50% central de los datos
Min Valor No Outlier = Max[X(1), Q1-1.5(Q3-Q1)]
1.5(Q3-Q1)

Q1

Q1 = 25%

X
Q2

RI = (Q3 - Q1)

Q2 = 50%

Q3

Q3 = 75%

1.5(Q3 - Q1)

Max Valor No Outlier = Min[X(n), Q3+1.5(Q3-Q1)]


VALORES EXTREMOS (0, *)

15

GRAFICOS DE TENDENCIA Anlisis de patrones y tendencias Visualiza el comportamiento de los datos en el tiempo

Tendencia creciente

Tendencia decreciente

Corrida de proceso

Valores anormales

Ciclos

Variabilidad creciente
16

SINTESIS DESCRIPTIVA DE LOS DATOS ESTADISTICOS

1-TENDENCIA CENTRAL
2-POSICION

3-DISPERSION
4-FORMA 5-ASOCIACION

GIAMPAOLO ORLANDONI MERLI. 2012

A-GRAFICOS Y TABLAS
GRAFICOS
TABLAS

UNIVARIANTES. MULTIVARIANTES
TABLAS DE FRECUENCIAS TABLAS CRUZADAS MEDIA ARITMETICA

B-MEDIDAS DESCRIPTIVAS
1. TENDENCIA CENTRAL MEDIANA MODA

MAXIMO
2. POSICION (ORDEN) MINIMO CUANTILES (CUARTILES, PERCENTILES)

RANGO, RANGO INTERCUARTILICO


3. DISPERSION (VARIABILIDAD) VARIANZA, DESVIACION ESTNDAR COEFICIENTE DE VARIACION

ASIMETRIA (SESGO)
4. FORMA CURTOSIS (ACHATAMIENTO) COVARIANZA

5. ASOCIACION

CORRELACION

18

1-MEDIDAS DE TENDENCIA CENTRAL

Media Acotada Conjunto Total Datos (Media Recortada) (%Menor + %Mayor)


Media Geomtrica G= (X1*X2**Xn)1/n (G) Log(G) =(log(Xi))/n

Se elimina un porcentaje (5-10%) de los valores ms altos y bajos del conjunto de datos (datos outliers)
Escala de Medida No Lineal.

19

2-MEDIDAS DE POSICION (MEDIDAS DE ORDEN)

MEDIDAS ESTADISTICAS DE ORDEN: CUANTILES (CUARTILES, PERCENTILES)

Los valores muestrales se ordenan en forma creciente: X(1), X(2),,X(n)


Estadstica MIN Percentil 1 Primer Quintil Mediana = Quintil 2 Tercer Quintil Percentil 99 MAX Rango Total Rango InterCuartil Valor 15.5 16.2 22.4 29.3 34.3 44.6 46.6 31.1 11.9 Expresin X(1) P1 Q1 Q2 = P25 Q3 = P75 P99 X(n) = X(150) R = X(n) X(1) = 46.6 15.5 RI = Q3 Q1= 34.3 22.4

TABLA DE CUARTILES Y PERCENTILES Percentil Cuartil Pi (i=1,99) Qj (j=1,2,3) % 1 16.2 5 17.6 10 18.9 25 22.4 Q1 50 29.3 Q2 75 34.3 Q3 90 38.0 95 40.9 99 44.6

0.75 0.5 0.25

22.4 Q1

29.3 Q2=Md

34.3 Q3

21

3-MEDIDAS DE DISPERSION (VARIABILIDAD)

DESVIACION ESTANDAR (S)


Raz cuadrada positiva de la Varianza. Medida de dispersin ms comn
Se expresa en las mismas unidades que la Variable Estadstica. Estandariza los valores de la VE (VE con media cero y desviacin estndar unitaria) Z = (X ) / ~ (0;1)

Permite calcular la proporcin de datos contenido en cierto intervalo alrededor de la media: El Intervalo ( K) contiene al menos (1-1/K2), K>1

COEFICIENTE DE VARIACIN: Medida de Dispersin Relativa


UNIDAD Tiempo Espera Salario Minutos Bs F Media 78.7 1000.0 Desv Est 12.14 215.35 CV (%) 12.05 21.53 1-Comparacin de muestras con distintas unidades de medida y diferentes promedios

2-Comparacin de muestras con las mismas unidades de medida, y diferentes promedios

Temperatura A
Temperatura B

C
C

1100
800

225
200

20.45
25.00
23

4-MEDIDAS DE FORMA

24

HISTOGRAMAS y FORMAS

NORMAL

BIMODAL

INTERVALO VACIO

ASIMETRIA POSITIVA

ASIMETRIA NEGATIVA

UNIFORME

DATOS OUTLIERS

AREAS BAJO LA CURVA NORMAL

-3s

-2s

-s

68.26%
95.44% 99.73%

+s

+2s

+3s

26

Вам также может понравиться