Definicin y presentacin de datos Al finalizar la clase el estudiante: Discrimina las variables estadsticas Sesin 1 CASO 1: Uso de redes sociales Una empresa comercializadora de ropa juvenil ha decidido comenzar una agresiva publicidad a travs de las diferentes redes sociales. El jefe comercial de la empresa necesita tomar decisiones para ser ms efectiva la publicidad. Qu tipo de informacin necesitamos para tomar esta decisin? Cmo nos ayudara la estadstica descriptiva y la inferencial en este caso? Preguntas de reflexin En qu ocasiones ha escuchado el trmino estadstica en su vida diaria o a travs de los medios de comunicacin? Mencione algunos ejemplos. Conoce la utilidad de la estadstica? Por qu considera que la estadstica podra ser importante para la toma de decisiones en las empresas? Qu es la estadstica? D e s c r i p t i v a Encargada de la recoleccin y presentacin eficaz de informacin numrica expuesta como conjunto de datos. I n f e r e n c i a l Se encarga a su vez, del desarrollo o utilizacin de tcnicas que sirven para deducir el comportamiento general de una poblacin en base a la informacin de una muestra. Estadstica es la ciencia que estudia la recoleccin, tabulacin, anlisis e interpretacin de datos de una poblacin o muestra representativa. Divisin: Poblacin y muestra Poblacin (population) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. Muestra (sample) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales). CASO 1: Uso de redes sociales (continuacin) Considerando los datos del caso 1: Cul son las caractersticas de la poblacin a considerar? Cmo podramos tomar la muestra para esta poblacin? Variables Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. En los individuos de la poblacin de jvenes limeos, de uno a otro es variable: Tipo de msica que escucha {Baladas, rock, cumbia, salsa} Var. Cualitativa Nivel educativo alcanzado {Primaria, secundaria, superior} Var. Ordinal Cantidad de cuentas de correo {0,1,2,3,...} Var. Numrica discreta Altura en metros del individuo {1.65; 1.66; 1.78; etctera} Var. Numrica continua Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos) Nominales: Si sus valores no se pueden ordenar Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No) Ordinales: Si sus valores se pueden ordenar Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos) Discretas: Si toma valores enteros Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos Continuas: Si entre dos valores, son posibles infinitos valores intermedios. Altura, Presin intraocular, Dosis de medicamento administrado, edad Tipos de variables CASO 1: Redes sociales (continuacin) Suponga que se han planteado algunas variables para poder tomar algunas decisiones en el caso 1, se le pide categorizar cada una en cualitativa ordinal, cualitativa nominal, cuantitativa discreta y cuantitativa continua: Edad Gnero Gasto mensual en servicio de Internet. Red social preferida Cantidad de cuentas en las redes sociales Tiempo diario dedicado a las redes Nivel de uso (bajo, medio o alto) CASO 1: Redes sociales (continuacin)aria Mencione 2 ejemplos adicionales para cada tipo de variable que le sirva al jefe comercial que le sirva al jefe comercial conocer el comportamiento de los jvenes en las redes sociales. Tabulacin, grfica e interpretacin de resultados Al finalizar la clase el estudiante: Interpreta datos cualitativos y discretos, organizados en tablas de frecuencias. Sesin 2 Caso 2: Entidad bancaria Con la finalidad de conocer mejor a sus clientes una agencia bancaria ha realizado una encuesta a 400 de sus principales clientes. Se ha considerado en esta encuesta variables tales como: Edad, Ingresos, Gastos en tarjetas de crdito, cantidad de dependientes, etctera. Es prctico trabajar con las encuestas para un correcto anlisis? Cmo podramos presentar tanta informacin? Tabulacin e interpretacin de una variable continua Al finalizar la clase el estudiante: Interpreta datos continuos, organizados en tablas de frecuencias. Sesin 3 Tabulacin de variable continua Una variable continua es la que puede tomar cualquier valor en un rango de datos. Por ejemplo, tomando el tiempo de demora en el conteo de cierta cantidad de dinero a 50 cajeros los resultados pueden ser diversos. (ver libro) Cmo podramos representar todos estos resultados a travs de una tabla? Ordenar data de menor a mayor Calcular la cantidad de intervalos Calcular la amplitud de cada intervalo Calcular los lmites de cada intervalo Construir la tabla Graficas e interpretacin de una variable continua Histograma y polgono de frecuencias Al finalizar la clase el estudiante: Interpreta grficos estadsticos. Sesin 4 Histograma Luego de la tabulacin de los datos a travs de una tabla de distribucin de frecuencias, es posible presentar estos datos de una manera grfica? cul sera la forma ms adecuada? Interpretacin del histograma Qu informacin nos puede dar la forma del histograma? MEDIDAS DE TENDENCIA CENTRAL La media aritmtica La mediana La moda Al finalizar la clase el estudiante: Interpreta los resultados de las medidas de tendencia central. Sesin 5 Medidas de tendencia central Utilizando la edades de los estudiantes del aula, es posible responder las siguientes preguntas: Cul es el promedio de edades de los estudiantes? Cul es la edad mxima de la mitad de los estudiantes? Cul es la edad que ms se repite? Es posible calcular las medidas de tendencia central a partir de la informacin de la siguiente tabla? Intervalo (Depsitos a plazo en soles) Marca de Clase Frecuencia Absoluta Frecuencia Absoluta Acumulada Frecuencia Relativa [5,000 - 10,000> 7,500 320 320 7.24% [10,000 - 15,000> 12,500 950 1270 21.49% [15,000 - 20,000> 17,500 1,370 2640 31.00% [20,000 - 25,000> 22,500 1,080 3720 24.43% [25,000 - 30,000] 27,500 700 4420 15.84% Total 4,420 100.00% Qu relacin existe entre las medidas de tendencia central y la forma del histograma? Distribucin MEDIDAS DE POSICION O CUANTILES Los cuartiles Los deciles Los percentiles Al finalizar la clase el estudiante: Interpreta los resultados de las medidas de posicin o cuantiles Sesin 6 Medidas de posicin La mediana nos permite verificar el valor mximo del 50% (la mitad) de un grupo de datos una vez ordenados de menor a mayor. Es posible saber el dato mximo del 25% (cuarta parte) inferior de los datos? Es posible conocer el mximo dato del 80% de los datos? Es posible conocer el mximo dato del 80% de los datos? Medidas de posicin Los ingresos de un grupo de 1200 familias, presentan las siguientes de medidas de tendencia central y de posicin: Media: S/. 1,300.00 Mediana: S/. 1,297.00 Moda: S/. 1,298.00 Tercer Cuartil: S/. 1,450.00 Tercer Decil: S/. 1,188.00 Percentil 95 : S/. 1,670.00 Cul es la interpretacin de estos datos? MEDIDAS DE DISPERSIN Varianza - Desviacin Estndar - Coeficiente de Variacin Al finalizar la clase el estudiante: Interpreta los resultados de las medidas de dispersin. Sesin 7 Qu medida de tendencia central podra utilizar para comparar las notas de ambos grupos? Grupo 1 Estudiante Nota de Examen Parcial Armestar, Fabrizio 15 Rojas, Rosa 14 Mirlos, Paco 16 Takaro, Yoshio 14 Baca, Zoila 16 Mucho, Toms 16 Pachas, Reyna 16 Paredes, Armando 14 Rosado, Tony 15 Tanga, Lucila 14 Grupo 2 Estudiantes Nota de Examen Parcial Quito, Esteban 16 Bruyet, Yuli 16 Lazo, Elba 12 Mento, Lola 15 Brito, Alan 19 Zurita, Elba 16 Castro Aquiles 14 Castro, Yola 13 Castillo, Henry 17 Quispe, Jhon 12 Cul de los dos grupos es mejor en estadstica? Dispersin Tomando en cuenta los datos del caso anterior, cul de los dos grupos tiene el ms alto promedio? Cul de los dos promedios es ms representativo para cada grupo? por qu? Qu entiende por dispersin? Cmo podemos medir la dispersin? Recuerde la dispersin es importante porque proporciona informacin adicional que permite juzgar la confiabilidad del promedio (media). Si los datos se encuentran ampliamente dispersos, el promedio es menos representativo de los datos. Cul es el ms disperso si los promedios son distintos? Precio de las acciones Ao Empresa A Empresa B 2004 0.59 128 2005 7.58 120 2006 8.84 141 2007 5.26 131 2008 2.57 127 2009 0.28 149 2010 9.94 137 2011 6.25 137 2012 5.99 121 2013 9.80 137 Caso: Compra de acciones Debe elegirse aquella empresa que presente el precio de las acciones menos voltiles (dispersas). Cul de las empresas tiene un precio menos disperso? Qu indicador nos ayudara? Cmo se calcula? CORRELACIN Y REGRESIN LINEAL Variable dependiente y variable independiente La lnea de regresin de mnimos cuadrados Coeficiente de correlacin y de determinacin Al finalizar la clase el estudiante: Aplica la correlacin y regresin lineal, en la resolucin de problemas comerciales. Sesin 8 -10 Relacin entre variables Ingreso mensual por Familia (S/.) Gastos mensuales en alimentos (S/.) 1030 829 1269 1030 1165 933 1112 871 1079 905 1266 998 1224 983 964 779 1039 874 945 751 Qu relacin cree usted que pueda existir entre el ingreso y el gasto en alimentos, directa o inversa? Es posible medir la relacin lineal entre estas dos variables? Segn su opinin, el ingreso depende del gasto o el gasto depende del ingreso? Informacin obtenida en una encuesta para 10 familias: Frmula del coeficiente de correlacin Ecuacin de Regresin Lineal Y = a + b X Frmulas para Mnimos Cuadrados Ordinarios PROBABILIDADES NOCIONES BSICAS Experimento aleatorio Espacio muestral Suceso o evento Al finalizar la clase el estudiante: Discrimina entre espacio muestral y suceso. Sesin 11 Cul es la probabilidad de ganar la Tinka? Quin alguna vez no ha soado despierto de como gastara el dinero de la Tinka? Pero, es posible ganarla? An ms, es posible calcular la probabilidad de que esto ocurra? Conceptos previos: Experimento: Proceso que conduce a que ocurra un resultado de varios resultados posibles. Espacio muestral: Conjunto de todos los posibles resultados individuales de un experimento. Suceso: Conjunto de uno o ms resultados de un experimento. Para cada experimento: Indique el espacio muestral y mencione uno o ms sucesos de ejemplo. Lanzar dos monedas. Lanzar un dado. Verificar el gnero de un alumno. Elegir 6 nmeros de 45 posibles en el juego de la tinka. Posibles resultados al lanzar un nuevo producto. Verificar el nivel socioeconmico de las familias en el distrito de Los Olivos. Verificar los depsitos a plazo de los clientes de una entidad bancaria. Verificar los consumos de los clientes de una tarjeta de crdito. El crecimiento econmico del pas este ao. La temperatura de maana. PROBABILIDAD Probabilidad Propiedades de la probabilidad Probabilidad condicional Eventos independientes Al finalizar la clase el estudiante: Aplica el concepto de probabilidad en la resolucin de problemas comerciales.. Sesin 12 Cul es la probabilidad de? tomar un estudiante al azar y que este sea hombre? tomar un estudiante al azar sea mujer y tenga pareja? que una estudiante no tenga pareja? que un estudiante de cualquier gnero no tenga pareja? ...que un estudiante que no tiene pareja, sea hombre? Se hizo una encuesta a 120 estudiante del IFB y preguntndoseles si tiene o no pareja, estos fueron los resultados resumidos: Tiene pareja No tiene Pareja Total Hombre 14 16 30 Mujer 26 64 90 Total 40 80 120 DISTRIBUCIONES Variables aleatorias: discreta y continua Distribuciones: binomial y normal Al finalizar la clase el estudiante: Aplica la distribucin binomial y normal en la resolucin de problemas comerciales. Sesin 13 - 15 Distribucin discreta Cul es la probabilidad de que al lanzar dos monedas, ambas sean cara? Cul es la probabilidad de que al lanzar tres monedas por lo menos una moneda salga cara? Distribucin continua Suponga que se tiene la informacin que los ingresos de nuestros clientes se distribuyen de manera normal, con un promedio de S/. 1,800 y con una desviacin estndar de S/. 200. cmo aplicaramos esta informacin para construir intervalos? PRUEBA DE HIPTESIS Muestreo Estimacin y Prueba de hiptesis Al finalizar la clase el estudiante: Aplica la prueba de hiptesis en la resolucin de problemas comerciales. Sesin 16 -17 Caso: Disponibilidad a pagar Una empresa desea importar una nueva tablet al mercado limeo, para lo cual debe saber si la disponibilidad a pagar promedio por el producto es de S/. 700. Se ha tomado una muestra de 150 personas, de la cual se ha obtenido un promedio de 680, con una desviacin estndar de S/. 25. Con un nivel de significancia del 5%, podramos afirmar que el promedio de disponibilidad a pagar es S/. 700? Hiptesis: Enunciado acerca de una poblacin elaborado con el propsito de poner a prueba. Procedimiento de 5 pasos para contrastar una hiptesis