Вы находитесь на странице: 1из 59

Estadstica Empresarial

Medidas de dispersin y tendencia central


Media
Mediana Moda

Varianza
Desviacin estndar

Medidas de dispersin y tendencia central


Percentil. El percentil p es un valor tal que por lo menos el p por ciento de las observaciones estn por debajo de ese valor y el restante (100 p) est por encima de ese valor.
Utilidad: supongamos que un alumno obtiene 540 puntos en un examen; por s slo, el dato no dice mucho; sin embargo si decimos que dicho alumno est por encima del percentil 90, nos da una mejor idea de qu tan bien o mal le fue, en relacin a los dems.

Medidas de dispersin y tendencia central


Forma de clculo:
Ordenar los datos en orden ascendente Calcular el ndice i: i = (p/100)*n

Donde p es el percentil deseado y n es el nmero de observaciones.


Si i no es nmero entero, se deber redondear al entero prximo Si i es un nmero entero se deber obtener el promedio entre los valores de las observaciones i e (i+1)

Medidas de dispersin y tendencia central


Ejemplo. Obtener el percentil 80 de las siguientes productividades de los trabajadores en una fbrica y el percentil 50 en cuanto a ventas.
Trabajador
1 2 3 4 5 6 7 8

Productividad
88% 90% 75% 70% 80% 76% 85% 89%

Ventas
100 120 80 60 80 70 110 120

9
10 11 12

92%
77% 94% 98%

140
70 130 150

Medidas de dispersin y tendencia central


Cuartiles. Los cuartiles dividen al nmero de observaciones en 4 partes iguales, donde cada uno contiene el 25%. Para su clculo se procede a calcular los percentiles 25, 50 y 75. Ejemplo Ventas.

Medidas de dispersin y tendencia central


Otras medidas de variabilidad son las siguientes:
Rango: Mayor valor - Menor valor Rango intercuartil: tercer cuartil (Q3) primer cuartil (Q1) Ejemplo productividades

Diagrama de Caja. Es un resumen grfico de distintas medidas de variabilidad y tendencia central: Valores mnimos y mximos, rango intercuartil y mediana. Generalmente sirve para ver grficamente la dispersin o concentracin de las observaciones.

Medidas de dispersin y tendencia central


Ejemplo:
xtile nueva_var = var, n(x)
Ao
1997

Costos anuales
750

1998
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

760
755 780 790 785 785 400 500 800 795 805 1000 950 810

Medidas de asociacin entre dos variables


Covarianza. Es una medida de asociacin entre dos variables. Si su valor absoluto es cercano a uno, la asociacin es grande. Si es cercano a cero, la asociacin es nula.
Ejemplos grficos:
Asociacin fuerte positiva (covarianza positiva) Asociacin dbil positiva (covarianza positiva y cercana a 0) Asociacin fuerte negativa (covarianza negativa) Asociacin dbil negativa (covarianza negativa y cercana a 0)

Medidas de asociacin entre dos variables


Frmula para el clculo de la covarianza:

Ejemplo:

Mes
1 2 3

oC

Agua
22 22 23

15 13 17

4
5 6 7 8 9

19
25 26 27 25 22

25
29 32 30 31 28

10

19

26

Medidas de asociacin entre dos variables


Agua
35 30

25
Agua 20 15 10 5 0 0 5 10 15 Grados Centrigrados 20 25 30

Medidas de asociacin entre dos variables


Clculo de covarianza

Consideracin con respecto a la covarianza:


Depende de la escala de medicin. Por ejemplo, la covarianza en el ejemplo anterior es distinta si se mide en metros cuadrados que en centmetros cuadrados

Medidas de asociacin entre dos variables


Para solventar esta cuestin, existe otro indicador para medir la asociacin entre dos variables, independientemente de la escala:
Coeficiente de correlacin:
Donde xy es la covarianza entre X y Y. x es la desviacin estndar de X, y y es la desviacin estndar de Y.

Estadstica Empresarial
Probabilidad

Probabilidad
La probabilidad es una medida numrica de la posibilidad de que ocurra un evento.
Dicha medida se encuentra entre el rango de 0 a 1, siendo mayor la probabilidad entre ms cercano se encuentre del 1.
Conjunto de resultados. Ejemplo: Probabilidad de obtener guila en un lanzamiento de una moneda. Probabilidad de tener 1 punto al lanzar un dado.

Probabilidad
Supongamos 4 libros: Espaol, Matemticas, Sociales, Naturales:
Probabilidad de sacar el libro de matemticas en el primer intento. Si saco dos libros al mismo tiempo, Cul es la probabilidad de haber sacado el libro de matemticas? Si saco dos libros al mismo tiempo, Cul es la probabilidad de haber sacado el libro de matemticas y espaol? Si saco dos libros al mismo tiempo, Cul es la probabilidad de haber sacado el libro de matemticas o el de espaol?

Distribuciones de Probabilidad
Una Variable Aleatoria es una descripicin numrica del resultado de un experimento. Pueden ser de dos tipos:
Discreta: valores enteros. Continua: cualquier nmero real.

Ejemplos:
Cuando al lanzar una moneda cae guila se le asigna el valor de 1; cuando cae sol, el valor de 0 Cuando un producto es defectuoso 0 y cuando es bueno el valor de 1 Los distintos tipos de climas en un da (variable aleatoria):
Caluroso, la variable aleatoria toma el valor de 1 Nublado, la variable aleatoria toma el valor de 2 Lluvioso, la variable aleatoria toma el valor de 3

Distribuciones de Probabilidad
Ejemplos:
Nmero de clientes en un da (variable aleatoria): 0,1,2,3 Nmero de radios con algn defecto: 0,1,2,3

Variable aleatoria continua, ejemplos:


Variables relacionadas con el tiempo, peso, estatura, distancia, etc. Tiempo de llegada entre cada cliente en un banco Tiempo que se tarda en llenar un refresco una mquina Metros entre un poblado y otro Suma de los pesos en un equipo de americano Promedio de las estaturas en la liga de basquetbol

Distribuciones de Probabilidad
Una distribucin de probabilidad de una v.a. describe cmo se distribuyen las probabilidades entre los valores de una variable aleatoria. Es decir, qu probabilidad le toca a cada valor.
Dicha funcin de probabilidad est definida por una funcin de probabilidad, denotada por f(x) Ejemplo: supongamos que se tienen las ventas de autos por da, de los ltimos 300 das.

Distribuciones de Probabilidad
En 57 de esos 300 das no se vendi ningn auto Hubo 117 das en los que se vendi slo un auto Hubo 72 das en los que se vendieron dos autos Hubo 42 das en los que se vendieron tres autos Hubo 12 das en los que se vendieron cuatro autos Hubo 3 das en los que se vendieron cinco autos

Cul es la probabilidad de cada evento? De manera grfica tenemos la funcin de probabilidad que relaciona la probabilidad con el nmero posible de autos vendidos

Distribuciones de Probabilidad
Funcin de probabilidad uniforme discreta:
f(x) = 1/n para x=1,2,3,n Ejemplo, lanzar un dado: f(x) = 1/6 para x=1,2,3,4,5,6

Grficamente:

Distribuciones de Probabilidad
Funcin de probabilidad binomial (para variables de la forma xito o fracaso):

Donde:
f(x) es la probabilidad de x xitos en n intentos n=nmero de intentos

p es la probabilidad de xito 1-p es la probabilidad de fracaso

Distribuciones de Probabilidad
Ejemplo: Cul es la probabilidad de que se obtengan exactamente 1, 2, 3, 4 y 5 piezas defectuosas de un total de 100? Si se sabe que la probabilidad de obtener una pieza defectuosa es de 0.01 (1%)
n=100 X=1, 2, 3, 4 y 5 p= 0.01 1-p= 0.99

Grfica

Distribuciones de Probabilidad
Otras funciones de probabilidad discreta:
Poisson Hipergeomtrica

Distribuciones de Probabilidad
Funciones de Probabilidad Continuas
Funcin de densidad de probabilidad uniforme

Ejemplo: Una empresa est interesada en obtener la funcin de probabilidad en cuanto al retraso en la entrega de insumos. La empresa sabe que los insumos tardan entre 0 y 40 minutos antes de llegar a su proceso de elaboracin; y quiere calcular la probabilidad de que los insumos lleguen despus de los 30 minutos

Distribuciones de Probabilidad
Funcin de distribucin normal. Nos ayuda a determinar qu tan probables son los resultados obtenidos en un muestreo.
La funcin de probabilidad es la siguiente:

Donde:
es la desviacin estndar

es la media poblacional

Distribuciones de Probabilidad

Distribuciones de Probabilidad
Consideraciones:
Toda la familia de distribuciones normales se diferencia por dos parmetros: Media y la desviacin estndar El punto ms alto de la curva normal se encuentra sobre la media, la cual coincide con la moda y la mediana La media de la distribucin puede tener cualquier valor. La distribucin es simtrica La desviacin determina qu tan plana y ancha es la curva. Si calculamos el rea bajo la curva, es igual a 1.

Distribuciones de Probabilidad

Distribuciones de Probabilidad
Un caso especial de la funcin de distribucin normal es cuando la desviacin estndar es igual a uno y la media igual a cero.
Se le llama funcin normal estndar.

Clculo de probabilidades. Ejercicios

Muestreo
En muchas ocasiones no es posible obtener los datos que necesitamos para cada uno de los individuos de la poblacin objetivo.
Falta de recursos econmicos. Falta de tiempo.

Por ello, lo ms usual es tomar muestras; es decir, escoger una determinada cantidad de individuos u objetos de estudio para analizar sus caractersticas y poder realizar inferencias acerca de la poblacin.

Muestreo
Qu es inferencia?
Ejemplo: Se desea saber el promedio de edades de los alumnos de las maestras de la UAF. Dado que no se tiene el suficiente tiempo, se decide realizar un muestreo (escoger una muestra).

El grupo que fue escogido fue la MA de 2do, con ello se pretende hacer una inferencia sobre el promedio de edades de todos los alumnos de las maestras.

Por lo tanto, para hacer inferencias es muy importante tener claro y bien delimitados dos conceptos:

Muestreo
Poblacin objetivo: es la totalidad de individuos u objetos de estudio. Ejemplos
En una investigacin de mercado sobre productos Bimbo, la poblacin objetivo son todos los consumidores de Bimbo. En un estudio sobre alumnos de secundaria, la poblacin objetivo son todos los alumnos de las secundarias del pas. Si se desea hacer una investigacin sobre las condiciones socioeconmicas de los estudiantes de la UAF, la poblacin objetivo son todos los estudiantes de la UAF. Si deseamos saber la calidad de nuestros productos, la poblacin objetivo son todos los productos producidos

Muestreo
Muestra: parte de esa poblacin sobre la que se recopilar informacin para hacer inferencias.
Por tanto, la informacin que se recopile a travs de la muestra ser representativa para el resto de la poblacin. Ejemplo: Si una empresa produce 100 artculos diarios y decide escoger una muestra de 10 productos, de los cuales 2 salieron con algn defecto; se puede inferir que dentro de los 100 artculos producidos habr aproximadamente 20 con algn defecto.

Muestreo
La cuestin es saber el tamao de muestra que debemos escoger para hacer una buena inferencia y la forma en que debemos escoger a las unidades de nuestra muestra.
Por lo que los posibles problemas a enfrentar son:
Falta de representatividad Sesgo en los estimadores

Muestreo
Por lo tanto, para el valor de un parmetro poblacional, se hace a travs del clculo de los datos de una muestra, a esto se le conoce como estadstico muestral.
Ejemplo: estadsticos muestrales y poblacionales.
Seleccin de la muestra, comando: sample nm, count
Porcentaje de personas que tienen un empleo Gasto semanal de cada una de estas personas Desviacin estndar del gasto semanal

Muestreo
Poblacional Estadstico Promedio Gastos Desviacin estndar de Gastos Porcentaje de personas con un empleo $1,676.55 Muestra 1 con 20 individuos Muestra 2 con 20 individuos Muestra 3 con 20 individuos

$2,579.52

92.42%

Muestreo
Si graficramos todos los promedios de gastos que se obtienen de hacer el ejercicio de muestreo una y otra vez, obtendramos algo parecido a la siguiente grfica de frecuencias:

$1,676.55

Muestreo
Poblacional Estadstico Promedio Gastos Desviacin estndar de Gastos Porcentaje de personas con un empleo $1,676.55 Muestra 1 con 2000 individuos Muestra 2 con 2000 individuos Muestra 3 con 2000 individuos

$2,579.52

92.42%

Muestreo
Si graficramos todos los promedios de gastos que se obtienen de hacer el ejercicio de muestreo una y otra vez, obtendramos algo parecido a la siguiente grfica de frecuencias:

$1,676.55

Muestreo
Muestra grande Muestra pequea

$1,676.55

$1,676.55

Muestreo
Qu importancia tiene la muestra?
Definamos la relacin entre la desviacin poblacional y desviacin estndar muestral: estndar

Si la desviacin estndar poblacional es de $2,579.52, y la muestra es de 20 individuos, Cul ser la desviacin estndar muestral?
Si la desviacin estndar poblacional es de $2,579.52, y la muestra es de 2,000 individuos, Cul ser la desviacin estndar muestral?

Muestreo
Calcular la probabilidad de que la media poblacional de los gastos caiga entre 1,500 y 1,750, para cada uno de los casos del tamao de muestra.
Calcular la probabilidad de que la media poblacional de los gastos caiga entre $1,576 y $1,776, para cada uno de los casos del tamao de muestra.

Muestreo
Para calcular la desviacin estndar de una proporcin, aplicamos la siguiente frmula:

donde p es la proporcin. Cul ser la probabilidad de que la proporcin de personas con empleo sea entre 92% y 94%. Si se obtiene una muestra de 2000 personas

Muestreo
Otros tipos de muestreo:
Muestreo aleatorio estratificado Muestreo por conglomerados Muestreo sistemtico

Intervalos de Confianza
Estimacin por intervalos.
Cuando se calculan estadsticos muestrales en ocasiones es ms til y ms intuitivo referirse a intervalos de valores, que a probabilidades.

Es por ello que frecuentemente se calculan intervalos de confianza, los cuales nos indican el rango o intervalo dentro del cual es probable caiga un valor poblacional.
Ese intervalo se calcula a partir de valores obtenidos de una muestra.

Intervalos de Confianza
Estimacin por Intervalo para la media poblacional.
El objetivo es hacer inferencia de la media poblacional a partir de datos muestrales. Por ejemplo, supongamos que queremos saber el promedio de ingresos de los alumnos de la UAF para establecer una poltica sobre las becas. Para ello, decidimos hacer un muestreo para hacer inferencia sobre el promedio poblacional (es decir el de TODOS los alumnos de la UAF)

Intervalos de Confianza
Con base en los valores que nos resulten de la muestra, nosotros podemos crear un intervalo, a partir del cual podamos decir, con un cierto grado de confianza, que el la media poblacional se encuentra entre esos valores:
Con un 90% de confianza, la media poblacional del ingreso de los estudiantes de la UAF se encuentra entre $7,500 y $10,000 mensuales.

Cmo se calcula ese intervalo de confianza? De donde viene 90% de confianza? Tenemos dos posibilidades: conocer o no conocer la varianza poblacional.

Intervalos de Confianza
Si conocemos la varianza poblacional.
Como toda variable aleatoria, el promedio tambin tiene una distribucin, con una varianza y una media:

Intervalos de Confianza
Sabemos que podemos conocer el rea debajo de la curva bajo cierto intervalo; en especial, si calculamos la varianza, podemos expresar ese intervalo en trminos de desviacin estndar.

Intervalos de Confianza

Intervalos de Confianza
Por lo tanto, cuando conocemos la desviacin estndar poblacional, la frmula para calcular el intervalo de confianza, dentro del cual cae el (1-)% de las observaciones, es la siguiente:

donde es el porcentaje de error esperado; que en el ejemplo anterior era igual a 5% = 0.05

Intervalos de Confianza
Calcula el intervalo de confianza dentro del cual estara el promedio poblacional de los ingresos de los estudiantes de la UAF si se sabe que la desviacin estndar poblacional es de $200. Calclalo al 95% de confianza (es decir con un error del 5%); al 99% de confianza y al 90% de confianza.
Estudiante 1 2 Ingreso 2,000 5,000 3,500 4,200 5,500 2,500 3,200 2,800 4,400

Datos muestrales

3 4 5 6 7 8 9

Intervalos de Confianza
Cuando se desconoce la desviacin estndar poblacional.
En este caso ya no se usa la distribucin normal estndar. sta se cambia por una distribucin llamada distribucin t. La lectura en tablas, es distinta, ahora tenemos dos variables en que fijarnos: grados de libertad y el rea de bajo la curva o probabilidad.

Intervalos de Confianza

Los grados de libertad = nmero de observaciones -1

Intervalos de Confianza
La frmula para calcular el intervalo de confianza cuando desconocemos la desviacin estndar es:

Ejemplo:
Estudiante Ingreso

1
2 3

2,000
5,000 3,500 4,200 5,500 2,500

Datos muestrales

4 5 6

7
8 9

3,200
2,800 4,400

Intervalos de Confianza
Ejemplo 2. Base de datos Stata

Clculo del tamao de la muestra


Hemos visto que las estimaciones de los estadsticos dependen del tamao de muestra que escojamos, Pero cmo determinamos el nmero de unidades a escoger para nuestra muestra?
Se aplica la siguiente frmula: donde E es margen de error que se desea aceptar, medido en unidades. Entre menos error se quiera, mayor ser la muestra. Generalmente Z/2 es 1.96 (95% de confianza)

Clculo del tamao de la muestra


Supongamos que desea realiza un estudio sobre los salarios de ejecutivos en empresas de telecomunicaciones.
Se sabe que la desviacin estndar es de $300. Usted est dispuesto a aceptar un margen de error de $100. Cul ser el nmero de ejecutivos que deber tener en su muestra?

Вам также может понравиться