Вы находитесь на странице: 1из 28

Métodos

Estadísticos
para los
Negocios
Dr. Jorge Muro Arbulú

Métodos Estadísticos – J. Muro Arbulú 1

No se puede mostrar la imagen en este momento.

Medias
Medianas
Modas…

(Medidas de Tendencia Central)

Métodos Estadísticos - J. Muro Arbulú 2

1
Medias [ Promedio() ] [ =Media.geom() ]

Media Aritmética 

Media Geométrica 

(Promedio de %, Ratios, Índices, Tasas)


¿Aumento de 5% este Año y 15% el Próximo = 20%?

MG =
Métodos Estadísticos - J. Muro Arbulú 3

Mediana, Moda [=Mediana (); Moda()]

Mediana = Punto Medio de los Valores al Ordenarlos


de Menor a mayor o Viceversa De < a > De > a <
$60 $275
65 80
¿Par? 70  Mediana  70
80 65
275 60

Moda = El Valor de la Observación que Aparece con


Más Frecuencia

Moda
Métodos Estadísticos - J. Muro Arbulú 4

2
Medias, Medianas, Modas (Ej. Dpto. en Miles)

De < a > De > a <


$60 $275
65 80
70  Mediana  70 =Mediana() = 70
80 65
275 60

Media Aritmética  =$110 000


=Promedio() = 110
$275 000 Distorsiona Media

Métodos Estadísticos - J. Muro Arbulú 5

Promedio, Mediana, Moda ¿Cuál?

Métodos Estadísticos - J. Muro Arbulú 6

3
¿Qué Debe ver un Gerente?
Sobrecarga de Información:

• Costos de Inventario
• Planilla
• Volumen de Producción
• Utilización de Activos
• …

Métodos Estadísticos - J. Muro Arbulú 7

¿Qué Hacer Primero?

Agrupar la Data

Graficarla para Visualizar Algún Patrón

Ver Data en Forma Gráfica Puede Aumentar Nuestro

Entendimiento de la Situación

que Describe

Métodos Estadísticos - J. Muro Arbulú 8

4
Valores Atípicos (Outliers)

Data Como Este No


Concuerda con el Resto:
Outliers

¿Cómo los Interpretamos?

Métodos Estadísticos - J. Muro Arbulú 9

Valores Atípicos (Outliers)


Típicamente, una de Siguientes Acciones:

1)Dejar el Outlier Solo


2)— Muy Raramente— Removerlo
3)Cambiarlo a su Valor Correcto
4) Usar la Mediana

Métodos Estadísticos - J. Muro Arbulú 10

5
Valores Atípicos (Outliers)
Excluir o Cambiar la Data con Cuidado:

1)Nunca Hacerlo Para que la Data “Encaje”


Con a Conclusiones a priori
2) Cambios en la Data Deben ser
Caso por Caso
3) Investigar Cada Situación

Métodos Estadísticos - J. Muro Arbulú 11

Valores Atípicos (Outliers)


01-abr 13 Inventario (Unidades)
02-abr 20 90

03-abr 12 80
80
04-abr 18
70
05-abr 15
06-abr 16 60

07-abr 10 50
08-abr 17
40
09-abr 17
10-abr 17 30

11-abr 14 20
12-abr 17
10
13-abr 80
14-abr 17 0

15-abr 17
16-abr 11
Métodos Estadísticos - J. Muro Arbulú 12

6
Notar que Días 12 y 14 el Inventario fue de 17 y 17
Respectivamente

Outliers (Error de Tipeo)

Valor Muy Improbable

Métodos Estadísticos - J. Muro Arbulú 13

Outliers

Métodos Estadísticos - J. Muro Arbulú 14

7
No se puede mostrar la imagen en este momento.

Medidas de Dispersión
(Sin Data Relacionada
Probabilísticamente)

Métodos Estadísticos - J. Muro Arbulú 15

Medidas de Tendencia Central


• Media Sentido del Centro de la Data
• Mediana
Ninguna Indica la Dispersión
• Moda
Dos Conjuntos de Data pueden Tener Igual Promedio (Media) y
Mediana y Estar Distribuidos Alrededor del Centro en Forma Diferente

¡Es Necesario Medir la Variabilidad de la Data!

Métodos Estadísticos - J. Muro Arbulú 16

8
Varianza (muestral)

Dada una variable aleatoria X con Media μ = E(X), se


Define su Varianza, Var(X) (también representada
como o, simplemente σ2):

Var (X)= = E [X - μ]2

= Corrección de Bessel
Grados de Libertad…
Solo es n-1 en D.E. por Muestreo, que
Introduce Variación Aleatoria

17

¿Cómo se Aparta la Data del Medio?

Varianza:
En un Hotel, Cada Sábado el
Número de Pedidos es
Alrededor de 172, la Media.

Varianza = Suma los


Cuadrados de Diferencias

¿Por qué los


Cuadrados?

Distancia de la Media

Métodos Estadísticos - J. Muro Arbulú 18

9
¿Cómo se Aparta la Data del Medio?

Varianza: =VAR.S() o =VAR()

Si Solo Sumamos:
Positivas y Negativas Pueden
Cancelarse

Métodos Estadísticos - J. Muro Arbulú 19

“La Distancia Típica de un Valor del Promedio es…”

Desviación Estándar (DE) =DESVEST()

La DE Nos Dice Qué Tanto está Expandida la Data Alrededor


de la Media [=PROMEDIO()].

Una Gran DE Indica Que la Data está Ampliamente Dispersa.

Una Pequeña DE Indica Que la Data está más Arracimada o


Junta.

Métodos Estadísticos - J. Muro Arbulú 20

10
No se puede mostrar la imagen en este momento.

Medidas de Dispersión
(Con Data Relacionada
Probabilísticamente)

Métodos Estadísticos - J. Muro Arbulú 21

Varianza, D. E. y Probabilidades
Se Ha Visto Varianza y D. E. de Arreglos de Data de
Cantidades Inciertas Independientes.

Es Cierto, Siempre y Cuando Éstas sean Cantidades


Inciertas sean Probabilísticamente Independientes .

22

11
Valor Esperado

El Valor Esperado de una Cantidad Incierta


es el Promedio Ponderado de Todos sus
Valores Posibles x Prob. de Ocurrencia
(Distrib. de Probabilidad)

X  {x1, x2, ..., xn}


VE o E de X = x1P(X= x1)+ x2 P(X=x2)+ ... +xnP(X=xn)

= E(X)= E(x1)+ E(x2)+…+E(xn)


23

Valor Esperado

VE de X = Promedio Ponderado de X

E(X)

“Mejor Suposición” del Resultado de una


Variable Aleatoria o Cantidad Incierta

Si Y=a +bX E(Y)=a +bE(X) (sólo lineal)

24

12
Varianza y D. E. (Más)

(0,24)
$20
(0,47)
$35
A
(0,29)
$50
(0,25)
-$9
(0,35)
B $0
(0,40)
$95

25

Resultados

E(Utilidad / A) = $35,75

E(Utilidad / B) = $35,75

Var(Utilidad / A) = (20-35,75)2(0,24)+...
=$118,69  =$10,89

Var(Utilidad / B) = $2 352,19  =$48,50

26

13
Afortunadamente…

A Mano Excel
Varianza
2 Var()
Var.S()

Desviación Desvest()
Estándar

27

Análisis de
Dos Variables
(Correlación)

28

14
Dos Variables ¿Están Relacionadas? Atletas:
1ro: Visualizar la Data: Dispersión

Atletas más Altos Tienden a Ser más Pesados


En Negocios, las Relaciones tienden a ser más Sutiles
29

Series de Tiempo

Queremos comprar Memorias (PC’s) pero Precios son Muy Volátiles


¿Qué hacemos? ¿Compramos o Esperamos?

Series de Tiempo son Muy Útiles:


Data en Orden Temporal
Muestran Cambio a Través del Tiempo
Patrones Estacionales o Anuales
Pero… No hay que Confiar Solo en lo que Visualizamos 30

15
Series de Tiempo (Más)

31

Visualización
Supongamos que Tratamos de Saber si hay Una Relación
Lineal

Intuitivamente, Notamos cuando la Data está Cerca a

Una Línea en un Diagrama de Dispersión

Mientras Más Cerca los Puntos de Datos a Línea, Más

Confianza de Relación Lineal entre las Dos Variables


32

16
Coeficiente de Correlación , Mide Fortaleza de
Relación Lineal en Escala de -1 a 1
Diagrama de Dispersión: Diagrama de Dispersión: Diagrama de Dispersión:
Visualiza la Relación Visualiza la Relación Visualiza la Relación

Variable 2
Variable 2

Variable 2
Variable 1
Variable 1 Variable 1

-1 0 1 -1 0 1 -1 0 1
 = -1  =0  =1

Métodos Estadísticos - J. Muro Arbulú 33

Coeficiente de Correlación ¿0?

Coeficiente de Correlación

(= 0; ¿No Hay Relación Entre la Data?)

34

17
Modelos No Lineales…

Aun Cuando el Coeficiente de Correlación sea Cero, Puede Existir


una Relación, Solo que No Lineal.

Diagramas de Dispersión Pueden Revelar Patrones y Ayudar a


Entender Mejor los Contextos de Negocios que la Data Describe

35

¿Y el -1, …, 1? ¿De Dónde lo Sacamos?

Volvamos a la Altura y Peso de los Atletas…

=COEF.DE.CORREL(Rango 1; Rango 2)

Correlación , que, Matemáticamente es:

Promed. de X * Promed. de Y

El Orden de las dos Datas (Peso y Altura) No Importa…


Siempre que Pertenezcan a la Misma Persona

36

18
Regresión
Lineal

Métodos Estadísticos - J. Muro


Arbulú 37

Requisitos

Premisa: Existe Data Histórica

Construir Distrib. de Probab. (DdP) con la Data

Data: Entender y Modelizar Relaciones

Data en Conjunción con DdP Teóricas

Métodos Estadísticos - J. Muro


Arbulú 38

19
Usos
Poderosa Herramienta Estadística
Usada Siempre en Negocios:

En Finanzas

Predicción de Demanda

Investigación de Mercados

…Por Nombrar Solo Algunas Áreas

Métodos Estadísticos - J. Muro


Arbulú 39

Ecuación del un Modelo Lineal

Modelo Lineal:

y = Variable Dependiente (o Respuesta)


x = Variable Independiente (o Explicativa)
a= Recta Intercepta y
b= Pendiente de la Recta
y
 = Variable Error

y
b= y/x
a x
x
40

20
Regresión Lineal:
Herramienta Estadística: Ayuda a Caracterizar la
Estructura de la Relación Entre Dos Variables

Línea de la Regresión:
Estructura de la Relación

Variable 2

Variable 1

Métodos Estadísticos - J. Muro


Arbulú 41

Ejemplo: ¿Cómo influye la


Publicidad en las Ventas?

Niveles de Publicidad Influencian Ventas, Pero no


se Conoce Cómo es la Relación
Ventas (en $Millones)

Publicidad (en $Miles)


Métodos Estadísticos - J. Muro
Arbulú 42

21
Publicidad y Ventas?
Data en Publicidad y Ventas en los Últimos 10 Años

Coeficiente de correlación
 =0,93

La Relación Parece Métodos


Razonablemente
Estadísticos - J. Muro
Lineal
Arbulú 43

¿Cuál Línea?

¿Qué Línea Encaja Mejor con la Data?


Nuestros Ojos y Mente “Ven” Cómo Están
Relacionadas, pero ¿Cómo lo Formalizamos?

¿Cuál?
Métodos Estadísticos - J. Muro
Arbulú 44

22
Método de Cuadrados Mínimos: Regresión y Errores 
Se Toma Cuadrado de Cada Distancia y Luego se Suman
todos los Cuadrados (Similar a Como Calculamos la Varianza)

Suma de Cuadrados Residuales (SCR), o Suma de


Cuadrados de los Errores: Cuan Precisa Una Línea Describe

un Conjunto de Datos  SCR Que sea Mínima. O:


Ventas (en $Millones)

SCR
SCE

(Se lo Dejamos a
la PC)
Máximo o Mínimo

Publicidad (en $Miles)


Métodos Estadísticos - J. Muro
Arbulú 45

Regresión: En Práctica Data  Análisis de Datos

Métodos Estadísticos - J. Muro


Arbulú 46

23
Regresión: En Práctica Data  Análisis de Datos
A B C

Variable Dependiente

Variable Independiente
(o Explicativa)

Métodos Estadísticos - J. Muro


Arbulú 47

Data  Análisis de Datos  Regresión: Resultados


Resumen

Estadísticas de la regresión

Coeficiente de
correlación
múltiple 0,93
Etiqueta “Publicidad ($)”. Ha Sido
Coeficiente de
determinación Puesta por Excel de la Columna
R^2 0,86
Original de Datos.
R^2 ajustado 0,84
Error típico 376153,16

Observaciones 10
Pendiente (b)
ANÁLISIS DE VARIANZA
Grados de Promedio de los Valor crítico de
libertad Suma de cuadrados cuadrados F F
Regresión 1 6881255000000,91 6881255000000,91 48,63 0,00
Residuos 8 1131929600999,09 141491200124,89
Total 9 8013184601000,00

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -333831,15 470558,58 -0,71 0,50 -1418941,18 751278,87 -1418941,18 751278,87
Publicidad 50,00 7,17 6,97 0,00 33,47 66,53 33,47 66,53

Ventas=-333 831 + 50 x (Publicidad)


Métodos Estadísticos - J. Muro
Arbulú 48

24
Resultados: Significado de la Ecuación

A B C
Línea de Regresión Ajustada
5,000,000
4,500,000
4,000,000
3,500,000
3,000,000

Ventas
2,500,000
Ventas
2,000,000
Pronóstico Ventas
1,500,000
1,000,000
500,000
-
- 20,000 40,000 60,000 80,000 100,000
Publicidad

Ecuación de Regresión:
Ventas = -333 831 + 50 x Publicidad
$1 en Publicidad  $ 50 en Ventas
$10 000 en Publicidad  $ 500 000 en Ventas
Métodos Estadísticos - J. Muro
Arbulú 49

Resultados: ¿Hasta Dónde?


Cuidado
Cuidado

No extrapolar Línea Lejos de Datos Históricos

Implica Presumir que Toda Data (pasada y Futura) es


Métodos Estadísticos - J. Muro
Lineal Arbulú 50

25
Resultados y Precauciones

Línea
Líneade
deRegresión
Regresión
Rango
Rango de
de

Ventas (en Miles)


Data
DataHistórica
Histórica

Publicidad (en Miles)


Métodos Estadísticos - J. Muro
Arbulú 51

R2  Proporción de Variación Total de la


Variable Dependiente es Explicada por Línea de
Regresión
Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,93

R2
Coeficiente de determinación R^2 0,86
R^2 ajustado 0,84
Error típico 376153,16

Observaciones 10

ANÁLISIS DE VARIANZA

Grados de Promedio de los


libertad Suma de cuadrados cuadrados F Valor crítico de F
Regresión 1 6,88E+12 6881255000000,91 48,63 0,00
Residuos 8 1,13E+12 141491200124,89

Total 9 8,01E+12

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -333831,15 Métodos Estadísticos - -0,71
470558,58 J. Muro 0,50 -1418941,18 751278,87

Publicidad ($) 50,00 7,17Arbulú 6,97 0,00 33,47 66,5352

26
Regresión: En Práctica / Data  Análisis de Datos

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,93

Coeficiente de determinación R^2 0,86 Valor-p 0,0001  Un 99.99% de


R^2 ajustado 0,84 Confianza que Pendiente (b) es
Error típico 376153,16
a0
Observaciones 10

ANÁLISIS DE VARIANZA

Grados de Promedio de los


libertad Suma de cuadrados cuadrados F Valor crítico de F

Regresión 1 6881255000000,91 6881255000000,91 48,63 0,00

Residuos 8 1131929600999,09 141491200124,89

Total 9 8013184601000,00

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción -333831,15 470558,58 -0,71 0,50 -1418941,18 751278,87

Publicidad ($) 50,00 7,17 6,97 0,00 33,47 66,53

Métodos Estadísticos - J. Muro


Arbulú 53

Regresión: Versión Rápida


A B C Insertar  Gráfico Dispersión

Ecuación de Regresión:
Ventas = -333 831 + 50 x Publicidad
Métodos Estadísticos - J. Muro
Arbulú 54

27
Sumario o Resumen

Medias, Medianas, Modas

Medidas de Dispersión y Utilidad

Correlación en la Data y su Medida

Método de Cuadrados Mínimos (Algoritmos)

Regresión Lineal

Metodología y Límites de Regresión Lineal

Métodos Estadísticos - J. Muro


Arbulú 55

28

Вам также может понравиться