Вы находитесь на странице: 1из 64

ESTADSTICA

LVARO VALENCIA OROZCO

ESTADSTICA Tabla de Contenido . Introduccin 1. Conceptos preliminares 1.1 Breve historia de la estadstica 1.2 Dimensin actual de la estadstica 1.3 Qu es estadstica 1.4 Finalidad de la estadstica 1.5 Ramas de la estadstica 1.6 Variables. 1.7 Poblacin y muestras 1.8 La medida en la estadstica 1.9 Redondeo de datos Ejercicios propuestos 2. Etapas del Mtodo Estadstico 2.1 Planteamiento del problema 2.2 Fijacin de los objetivos 2.3 Formulacin de las hiptesis 2.4 Definicin de la unidad de observacin y de la unidad de medida 2.5 Determinacin de la poblacin y de la muestra 2.6 La recoleccin 2.7 Crtica, clasificacin y ordenacin 2.8 La tabulacin 2.9 La presentacin 2.10 El anlisis 2.11 Publicacin . 3. Distribucin de Frecuencias 3.1 Distribucin de frecuencias simple Ejercicios 3.2 Distribucin de frecuencias por intervalo 3.3 Reglas empricas para la construccin de Intervalos Cuestionario y ejercicios propuestos . 4. Representacin Grfica 4.1 Definicin 4.2 Componentes de una grfica 4.3 Principales tipos de grficos 4.3.1 Grfico de lneas 4.3.2 Grfico de lneas compuesto 4.3.3 Grfico de barras 4.3.4 Grfico de barras compuesto 4.3.5 Grfico de sectores circulares 4.3.6 Histograma de frecuencias 4.3.7 Polgono de frecuencias 4.3.8 Histograma de frecuencias acumuladas Cuestionario y ejercicios propuestos . 5. Medidas de Tendencia Central 5.1 Media aritmtica 5.1.1 Propiedades de la media aritmtica 1

ESTADSTICA

LVARO VALENCIA OROZCO

5.1.2 Media aritmtica con cambio origen y de escala 5.1.3 Media aritmtica ponderada 5.2 Mediana 5.2.1 La mediana cuando los datos no estn agrupados en intervalos 5.2.2 La mediana cuando la informacin est agrupada en intervalos 5.3 La Moda 5.3.1 La moda cuando los datos no estn agrupados en intervalos 5.3.2 Clculo de la moda con la informacin agrupada en intervalos Cuestionario y ejercicios propuestos . 6. Medidas de Posicin (Percentiles) 6.1 Cuartiles 6.2 Quintiles 6.3 Deciles 6.4 Centiles 6.5 Resumen Cuestionario y ejercicios propuestos . 7. Medidas de Dispersin 7.1 Rango o recorrido 7.2 Desviacin media 7.3 Varianza 7.4 Coeficiente de variabilidad Cuestionario y ejercicios propuestos 8. Regresin y Correlacin Lineal 8.1 Tablas de doble entrada 8.2 Correlacin 8.3 Regresin lineal 8.3.1 Ajuste rectilneo (mtodo de los mnimos cuadrados) 8.3.2 Ajuste parablica (mtodo de los mnimos cuadrados) Cuestionario y ejercicios propuestos . 9. Tasas e ndices 9.1 Tasa 9.2 ndice 9.2.1 ndice simple 9.2.1.1 ndice de base fija 9.2.1.2 ndice de base mvil 9.2.2 ndices compuestos (globales) 9.2.2.1 ndice de Laspeyres 9.2.2.2 ndice de Passche 9.2.2.3 ndice ideal de Fisher Cuestionario y ejercicios propuestos . 10. Nociones de Probabilidad (Eventos) 10.1 Nociones de conteo 10.1.1 Principio fundamental 1 10.1.2 Principio fundamental 2 10.1.3 Permutaciones 10.1.4 Variaciones 10.1.5 Combinaciones 10.1.6 Permutaciones con repeticin 10.1.7 Variaciones con repeticin Ejercicios propuestos 2

ESTADSTICA

LVARO VALENCIA OROZCO

10.2 Definicin de probabilidad 10.2.1 Probabilidad a priori 10.2.2 Probabilidad a posteriori 10.2.3 Probabilidad subjetiva 10.3 Axiomas de la teora de probabilidades 10.4 Probabilidad condicional e independencia estadstica Cuestionario y ejercicios propuestos 10.5 Variable aleatoria 10.6 Funcin de probabilidad 10.6.1 Funcin de probabilidad 10.6.2 Funcin de distribucin Cuestionario y ejercicios propuestos 10.7 Valor esperado (esperanza matemtica) 10.7.1 Media aritmtica poblacional 10.7.2 Varianza poblacional Cuestionario y ejercicios propuestos . 11. Distribuciones Especiales 11.1 Distribucin de Bernoulli 11.2 Distribucin binomial, tablas binomiales 11.3 Distribucin de Poisson, tablas de Poisson 11.4 Distribucin normal 11.5 Distribucin normal estndar, tablas normales Cuestionario y ejercicios propuestos 11.6 El tamao de la muestra Referencias Bibliogrficas Alatorre, et al., Introduccin a los mtodos estadsticos, Mxico, UPN. Azorn, Poch. Francisco. Curso de muestreo y aplicaciones, Aguilar, 1969. Barahoma, Abel y otro. Metodologa de trabajos cientficos, Ipler, 1979. Bencardino M., Ciro. Estadstica, Apuntes y 600 Problemas Resueltos , 2a Edicin, Ecoe, 1982. Castillo, Juana, Estadstica inferencial bsica, Mxico, CCH, UNAM. CHAO. Lincoln L. Estadstica para Ciencias Administrativas, 2a Edicin, MCGRAWHILL, 1980. Dixon, Wilfrid J y otro. Introduccin al Anlisis Estadstico, 2a Edicin, MCGRAWHILL, 1965. Doms, Fernan P. La Estadstica Qu Sencilla, 2a Edicin, Paraninfo, 1969. Downie, N. M. y otro. Mtodos Estadsticos Aplicados. Harper Row Publishers Inc., 1970. Giardina, Basilio. Manual de Estadstica, 3 Edicin, 1972. Haber, Audrey. Estadstica General, Fondo Educativo Interamericano, 1973. Hoel, Paul G. Estadstica elemental, Mxico, CECSA. Johnson, Robert, Estadstica elemental, Buenos Aires, Grupo Editorial Iberoamericana. Kazmier, Leonard J. Estadstica Aplicada a la Administracin y la Economa, MCGRAW-HILL, 1978. Leitold Louis. El Clculo con Geometra Analtica , 2a Edicin, Harla S.A., 1973. Levin Yack. Fundamentos de Estadstica en la Investigacin Social, 2a Edicin, Harla S., 1977. Llerena, Len, Ricardo y otro. Curso de Estadstica General, U. de A., 1981. Meja V., William. Bioestadstica General, Escuela Nal. De Salud Pblica, U. de A., 3

ESTADSTICA

LVARO VALENCIA OROZCO

1980. National Council of Teachers. Of. Mathematics USA. Recopilacin, Organizacin e interpretacin de Datos, Trilla, 1970. Portilla, Ch. Enrique. Estadstica, Primer Curso. Interamericano, 1980. Richards, Larry E. Y otro. Estadstica en los Negocios. por qu y cundo?, MCGRAW-HILL,1978. Seymour, Lipschutz, Teora y problemas de probabilidad, Mxico, McGraw-Hill. Shao, Stephen P. Estadstica para Economistas y Administradores de Empresas, 15a Edicin, 1979. Spiegel, Murray R. Estadstica, MCGRAW-HILL, 1970. Spiegel, Murray, Teora y problemas de estadstica, Mxico, McGraw-Hill. Stevenson, William, Estadstica, Mxico, Harla. Yamane, Taro, Estadstica, Mxico, Harla.

ESTADSTICA

LVARO VALENCIA OROZCO

ESTADSTICA INTRODUCCIN Las acciones que acometemos hoy se basan en un plan de ayer y las expectativas del maana. La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin, conservacin, y tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban sus sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las matemticas, utilizando sus herramientas en el proceso del anlisis e interpretacin de la informacin. Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin mayores restricciones legales. El febril jugador De Mr consult al famoso matemtico y filosofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el juego de los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar con el tmido Pierre de Fermat (1601-1665, funcionario pblico apasionado por las matemticas; clebre porque no publicaba sus hallazgos) dando origen a la teora de la probabilidad, la cual se ha venido desarrollando y constituyndose en la base primordial de la estadstica. En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de observaciones muestrales o histricas, crean modelos lgico-matemticos que se "aventuran" describir o pronosticar un determinado fenmeno con cierto grado de certidumbre medible. El presente texto no pretende teorizar el saber estadstico, desde luego, no es un libro para estadsticos, ya que, adrede se obvia el rigor cientfico de lo expuesto en beneficio de la sencillez necesaria para el nefito; con un lenguaje coloquial se conduce al lector a travs del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados. El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo de la estadstica, sobre todo en la manipulacin de la informacin, pues en el mercado existen paquetes estadsticos de excelente calidad, como el SAS, SPSS, SCA, STATGRAPHICS, amn de otros, que "corren" en un ordenador sin mayores exigencias tcnicas, permitiendo el manejo de grandes volmenes de informacin y de variables. La estadstica, entonces, dej de ser una tcnica exclusiva de los estados, para convertirse en una herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante desuniformidad en las definiciones de los diferentes autores, ya que cada estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones como que: la estadstica es la tecnologa del mtodo cientfico, o que es el conocimiento relacionado con la toma de decisiones en condiciones de incertidumbre, o que la estadstica son mtodos para obtener conclusiones a partir de los resultados de los experimentos o procesos, o que es un mtodo para describir o medir las propiedades de una poblacin. En fin, no se trata de discutir si la estadstica es una ciencia, una tcnica o una herramienta, sino de la utilizacin de sus mtodos en provecho de la evolucin del conocimiento. La estadstica hace inferencias sobre una poblacin, partiendo de una muestra representativa de ella. Es a partir del proceso del diseo y toma de la muestra desde donde comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones, hechas, preferentemente, con un mnimo costo y mnimo error posible..

ESTADSTICA

LVARO VALENCIA OROZCO

1. CONCEPTOS PRELIMINARES. 1.1 BREVE HISTORIA DE LA ESTADSTICA. Godofredo Achenwall, profesor y economista alemn (1719 a 1772) es considerado por algunos investigadores el fundador de la Estadstica. Siendo profesor de la Universidad de Leipzig, escribi un artculo sobre el descubrimiento de una nueva ciencia que llam Estadstica y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado. Achenwall y sus seg uidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones a partir de los conceptos de inventarios y censos que ya se realizaban desde la antigedad. Los juegos de azar dieron origen a la teora de las probabilidades desarrollada por Pascal y Fermat a mediados del siglo XVII. La curva Normal de mucha importancia en el desarrollo de la Estadstica fue publicada originalmente en 1733 por De Moivre, quien no supo como aplicar sus resultados a observaciones experimentales. Su escrito permaneci desconocido hasta que Karl Pearson lo encontr en 1924. Sin embargo, al mismo resultado llegaron los astrnomos y matemticos Laplace (1749 a 1827) y Gauss (1777 a 1855), independientemente el uno del otro. En el siglo XIX, se hizo necesaria una base ms slida para la estadstica. Karl Pearson (1857 a 1936) aplic las matemticas a la evolucin, como resultado del entusiasmo que gener Darwin en la Biologa y construy durante medio siglo una investigacin estadstica rigurosa, fund la revista Biometrika y una escuela de estadstica. Gosset (1876 a 1937), consideraba insuficientes los desarrollos matemticos para encontrar distribuciones exactas de la desviacin estndar y otros parmetros; sus escritos sobre sus resultados aparecieron con el seudnimo de Student en la revista Biometrika; Hoy, la distribucin t-Student es instrumento fundamental de la estadstica. R. A. Fisher (1890 a 1962) recibi influencias de Pearson y de Student e hizo numerosas e importantes contribuciones a la Estadstica, entre las que se destaca la teora sobre la verificacin o prueba de hiptesis estadstica, presentada en 1936 con J. Neuman. 1.2 DIMENSIN ACTUAL DE LA ESTADSTICA La estadstica ha tenido un desarrollo extraordinario, que ha hecho que muchos problemas que antes no tenan una clara solucin, hoy la tengan. Para que podamos hacernos una idea de la diversidad de campos en los que la Estadstica juega un papel importante, se presentan a continuacin algunas situaciones. Prueba de una vacuna. Se quiere determinar la efectividad de una vacuna; para ello se disea un experimento en el cual participa un gran conjunto de nios de cierta edad, los cuales son clasificados al azar en 2 grupos, al primer grupo se le aplica la vacuna y al segundo grupo no. Se les hace un seguimiento durante un periodo adecuado de tiempo para comparar la incidencia de la enfermedad problema en cada grupo. Cul debe ser la diferencia mnima en el nmero de afectados para aceptar que la vacuna es efectiva?. Determinacin de la etiologa de una enfermedad. Para que una enfermedad se produzca es preciso una combinacin adecuada de las condiciones de tres elementos que son: el agente, el ambiente y el husped. Al proceso constituido por las interrelaciones entre estos tres elementos que caracteriza y explica la presencia de la enfermedad, se conoce como historia natural de la enfermedad. La epidemiologa se dedica en gran parte a la determinacin de la historia natural de las enfermedades ya que conociendo sta, es posible determinar cul etapa del desarrollo de la enfermedad es ms factible de interrumpir para evitar la misma. No es fcil en la mayora de los casos, determinar la historia natural de una enfermedad, y en ello la estadstica juega un papel muy importante al proporcionar herramientas para comparar 6

ESTADSTICA

LVARO VALENCIA OROZCO

la distribucin de la enfermedad en grupos con diversas caractersticas socioeconmicas (sexo, edad, condiciones geogrficas, raza, hbitos, etc.), con el nimo de ir acotando las condiciones ambientales y del husped que conduzcan a la explicacin de la historia natural de la enfermedad. Determinacin de la dosis de una droga. Para lanzar una nueva droga al mercado, es necesario superar una serie de etapas y pruebas que son ms o menos rigurosas dependiendo de las leyes del pas en cuestin. Generalmente el consumo de una droga puede producir efectos colaterales que pueden ser ms o menos graves. Por tal razn es necesario disear experimentos para determinar niveles de sensibilidad y la dosis adecuada que permita atacar la enfermedad y no producir molestias. (Ntese que estos aspectos varan de persona a persona). Caracterizacin de la demanda por el servicio de Urgencia Hospitalaria. La demanda por el servicio de Urgencia Hospitalaria es variable de mes a mes, de semana a semana, da a da, e inclusive en las horas de un mismo da. El conocimiento de dicha distribucin es de mucho inters para la determinacin de los recursos humanos y materiales y para su programacin. Un acercamiento a la distribucin de la demanda puede conseguirse recolectando informacin y realizando algunos anlisis estadsticos. Fase de planeacin. La planeacin es en cierta forma mirar hacia el futuro con los ojos del pasado. En el proceso de planeacin se requiere disponer de la informacin cuantitativa y cualitativamente adecuadas para tomar decisiones ahora, que tendrn implicaciones en el futuro. Una empresa debe hacer proyecciones de demanda del artculo que produce, pues con base en ella, se har la programacin de la produccin y todo lo que ella trae consigo. Dicha demanda puede ser estimada a travs de modelos estadsticos de SERIES DE TIEMPO. Control de calidad. La calidad con que se produce un artculo es muy importante para cada industria. Esta constituye un factor bsico de competencia en el peor de los casos, porque en el caso de drogas o alimentos se trata de la integridad e incluso de la vida de las personas. En la prctica es muy costoso y a veces imposible inspeccionar el 100% de la produccin o de la materia prima; se puede en estos casos disear un plan estadstico de muestreo, y unos instrumentos que permitan tomar decisiones muy confiables sobre la calidad de un lote de produccin a partir de la observacin de unos pocos artculos, economizando de esta manera dinero y tiempo. Comparacin de la eficiencia de dos procesos. Se desea decidir sobre cul de 2 procedimientos utilizar para la realizacin de una actividad intermedia en la produccin de un artculo, tomando como criterio la eficiencia. Se disea el experimento y se realizan observaciones durante corto tiempo con base en las cuales se deber decidir con cierta confiabilidad cul procedimiento es mejor. Produccin Agrcola. Se van a sembrar grandes reas de terreno con papa china, se requiere por tanto disear un experimento para determinar entre otras cosas: Cul debe ser la distancia entre plantas?, Cules deben ser los niveles de agua y de nutrientes a usar?, Hay o no interaccin entre la distancia entre plantas y los niveles de nutrientes? Todo ello para conseguir ptima produccin. Econometra. Determinacin de las principales caractersticas socioeconmicas que generan la inflacin y cmo influye cada una de ellas, presentando esto a travs de un modelo de Regresin. Anlisis actuarial.

ESTADSTICA

LVARO VALENCIA OROZCO

Una empresa de seguros de vida, desea determinar cunto debe cobrar al ao por una pliza, segn la edad. Para ello, debe realizar un estudio estadstico sobre los riesgos y las frecuencias de muertes por grupos de edad. 1.3 QU ES ESTADSTICA? Es un sistema o mtodo cientfico, que estudia el comportamiento de los fenmenos de masa, mediante la recopilacin, organizacin, clasificacin, presentacin, anlisis, e interpretacin de datos que interesan al investigador, para sacar conclusiones generales, destinadas a mejorar las polticas que rigen los procesos que se cumplen en la naturaleza y en la vida social. 1.4 FINALIDAD DE LA ESTADSTICA La estadstica tiene por finalidad suministrar informacin, cuya utilidad depende del objeto para el cual se realiza la estadstica y la forma en que se realiza la obtencin de los datos. Algunas aplicaciones de la estadstica que podemos nombrar en forma general son: Conocer la realidad de una observacin o de un fenmeno. Ejemplo: si se cumple o no la produccin programada para un artculo. Determinar lo tpico o normal de una observacin. Ejemplo: el promedio de edad de los estudiantes de un grado determinado. Determinar los cambios que presenta un fenmeno. Ejemplo: un cambio en cantidad de ventas de un producto. Determinar las causas que originan un fenmeno. Ejemplo: la disminucin de valor de un producto por efectos de la oferta y la demanda. Estimativos sobre el comportamiento futuro de un fenmeno. Ejemplo: la proyeccin de ventas de un artculo dependiendo del aumento de poblacin. 1.5 RAMAS DE LA ESTADSTICA La estadstica dispone de dos tipos de usos diferentes: La Estadstica descriptiva o deductiva y la Estadstica inferencial o inductiva. La Estadstica descriptiva o deductiva permite obtener conclusiones sobre un conjunto de datos, a partir de los mismos, sin sobrepasar el conjunto de conocimientos que stos proporcionan. Sus mtodos disponen las tcnicas de recolectar, presentar, analizar e interpretar datos. La estadstica inferencial es un proceso inductivo que permite inferir a toda la poblacin, proposiciones basadas en las observaciones y resultados proporcionados por la muestra. Incluye un factor de incertidumbre que no evita el error pero lo cuantifica. 1.6 VARIABLES. Son caractersticas de las personas u objetos de una muestra o poblacin que se observa. Las variables pueden ser cuantitativas o cualitativas. Si las observaciones se pueden expresar mediante nmeros, se trata de una variable cuantitativa como por ejemplo el nmero de kilmetros que tienen que conducir cada noche quienes acuden en su coche a la universidad, la cantidad de usuarios por hora en un cajero automtico o las calificaciones que los estudiantes obtienen en una evaluacin determinada. Y si la variable se mide por medios no numricos, se trata de una variable cualitativa como por ejemplo el estado civil de los solicitantes de prstamos en un banco, el lugar de procedencia de los estudiantes de la Universidad o la raza, el color de cabello y preferencia religiosa de una poblacin. Adems, las variables tambin pueden ser continuas o discretas. Una variable continua es aquella que puede tomar cualquier valor dentro de un determinado rango, cuando se realizan mediciones u observaciones. Por ejemplo, al realizar un estudio de la relacin existente entre el peso y la estatura de los nios de preescolar, se puede encontrar cualquier valor dentro de un rango para las variables de estudio. Y una variable discreta es aquella que da lugar a valores 8

ESTADSTICA

LVARO VALENCIA OROZCO

separados y no continuos dentro de un determinado rango, esto es, solo pueden tomar algunos valores del rango y generalmente son aquellas cuya observacin depende de la enumeracin o del conteo. Por ejemplo, el nmero de usuarios que visita diariamente una web, el nmero de estudiantes de la clase de estadstica. 1.7 POBLACIN Y MUESTRAS Cada investigacin que recurre al uso de mtodos Estadsticos inicialmente define si se puede o debe recurrir al conjunto de todos los datos o slo a una parte de ste. 1.7.1 POBLACIN. Conjunto de todos los elementos, individuos u objetos que tienen una caracterstica en comn y adems son objeto de un estudio. Una poblacin o universo consiste en todos los posibles valores de una variable. Cuando se disponen todos los valores de una poblacin es posible describirla sin ambigedad. Estos valores no tienen que ser todos diferentes ni en nmero infinito. Son ejemplos: La edad de los nios Colombianos que cursan el quinto grado, El nmero de hijos por familia en el municipio de Candelaria. El nmero de vehculos que cruzan por un semforo cada minuto. MUESTRA Es una parte de una poblacin que se utiliza frecuentemente para hacer inferencia acerca de la poblacin. Por esta razn es particularmente importante definir la poblacin que se estudia y obtener una muestra representativa de la poblacin definida, lo que no es cosa trivial. Toda muestra representativa debe cumplir el principio de la aleatoriedad (cada elemento de la poblacin tiene una oportunidad igual e independiente de ser elegido), consistente en un proceso que asegure que los sesgos individuales conocidos o desconocidos, no influyan en la seleccin de la muestra y tener cualquier tamao, pero que cumpla con unos objetivos planeados en la estadstica y con un margen de error tolerable y un nivel de confianza que la hagan aceptable para la poblacin.

1.7.2

1.7.3 MUESTREO Es el proceso de recoger una muestra. Existen diferentes mtodos de muestreo: Aleatorio: Cada elemento de la poblacin tiene la misma oportunidad de ser elegido. No aleatorio: Cuando se hace de manera deliberada, dirigida o por cuotas No restringido: No hay condicin que restrinja a los elementos de la poblacin. Restringido: Existen condiciones que restringen a la poblacin. Estratificado: La poblacin se divide en grupos homogneos. Estratificado igual: Si de cada estrato se saca igual cantidad de elementos para la muestra. Estratificado proporcional: Si de cada estrato se saca en forma proporcional (por conveniencia) para formar la muestra. Sistemtico: Los elementos de la poblacin estn dispuestos ordenadamente por listados o registros. Censo: La recoleccin de la informacin incluye la poblacin. 1.8 LA MEDIDA EN LA ESTADSTICA El material de trabajo en estadstica son los datos. Las escalas de medida se asocian a las caractersticas de los datos, con la intencin de manipularlos. Dada la necesidad de emplear mediciones numricas, o una serie de nmeros en el anlisis de los datos, los investigadores han desarrollado mediciones para aplicarla a una gama muy amplia de fenmenos, incluyendo aspectos no cuantificables, tales como: prestigio ocupacional, actitudes, autoritarismo, alienacin, inteligencia, prejuicio, dogmatismo, conformidad, 9

ESTADSTICA

LVARO VALENCIA OROZCO

realizacin, etnocentrismo, religiosidad, armona matrimonial, fertilidad, status socioeconmico. Dependiendo del nivel de medida empleada, los nmeros tienen por lo menos tres funciones importantes para el investigador: Categorizan el nivel nominal de la medicin. Determinan el rango de orden al nivel ordinal de la medicin. Permiten obtener montajes al nivel cardinal (de intervalo, razn o proporcin) de la medicin. 1.8.1 ESCALAS NOMINALES Este nivel se utiliza para clasificar los objetos y numerar las clases. El valor numrico de una clase no cuantifica nada sobre ella, es decir que el nmero asignado a una clase sea mayor o menor que el de otra, no refleja nada sobre las propiedades del objeto, sino simplemente el hecho de que son distintas. De acuerdo con la zona en que viven, la poblacin de un pas puede dividirse en urbana, suburbana y rural; las cuales podran llamarse clases 1,2 y 3. La escala nominal establece una relacin de equivalencia y todos los eventos u objetos que pertenecen a una categora tienen una caracterstica igual. El nmero de eventos que pertenecen a una caracterstica se llama frecuencia. 1.8.2 ESCALA ORDINAL Cuando las propiedades de los objetos pueden ser ordenadas segn algn criterio. Esta escala establece una relacin de orden entre las variables. Los nmeros por su propiedad de orden nos permite establecer relaciones tales como: mayor que; igual a; menor que; ms importante; etc. El nivel ordinal da informacin acerca de la organizacin de las categoras, pero no indica la magnitud de la diferencia entre los nmeros. El valor numrico se usa para indicar en orden relativo el lugar que ocupa el elemento. Por ejemplo, ordenar de la ms importante a la menos importante, cada una de las necesidades de empleo, vivienda, salud, servicios pblicos y educacin utilizando 1 para la ms importante y as sucesivamente en orden de importancia. 1.8.3 ESCALA CARDINAL Cuando las propiedades de los objetos son cuantificables y se pueden hacer operaciones aritmticas. Es la de mayor uso en el Mtodo Cientfico. Ejemplo: medida de distancias, tiempo, dinero, masas, fuerza, etc. Cuando se desea entregar una informacin como resultado de un estudio realizado utilizando la escala cardinal, dicha informacin la podemos entregar en trminos de intervalos, razones o proporciones Intervalos: En contraste con el nivel ordinal, la medicin por intervalos indica el orden de las categoras y la diferencia entre ellas. Emplean unidades de medicin tales como das, metros, horas. Ejemplos son: El nmero de respuestas acertadas en las pruebas Icfes por cada uno de los aspirantes que se presentaron, El tiempo de duracin de los bombillos de un fabricante, el tiempo requerido para enviar cada uno de los paquetes de datos de un conjunto. Razn: Son tambin llamadas de cociente, ya que es el cociente entre dos cantidades independientes es decir son partes de un todo. Ejemplo: En un grupo de 50 personas 40 son adultos y 10 son nios La razn de nios es:

existen 0.25 nios por cada adulto, sin embargo en trminos prcticos para algunos casos como este, es preferible entregar el resultado como enteros, es decir, existe un nio por cada 4 adultos. 10

10 40

1 4

0.25 lo cual podemos interpretar como que en tal grupo

ESTADSTICA

LVARO VALENCIA OROZCO

La razn de adultos es:

40 10

4 lo que significa que existen 4 adultos por cada nio.

Proporcin: En la proporcin tambin se halla un cociente, pero las cantidades que se relacionan no son independientes, es decir, calculamos el cociente entre una parte y el total Ejemplo: Con respecto al grupo del anterior ejemplo deseamos saber la proporcin de adultos, y la proporcin de nios, luego: La proporcin de nios es:

existen 0.2 nios por cada persona, o que el 20% de las personas en dicho grupo son nios. La proporcin de adultos es:

10 50

0.20 lo cual podemos interpretar como que en tal grupo 40 50

0.80 lo que significa que existen 0.8 adultos por cada

persona, o que el 80% de las personas del grupo son adultos. 1.8.4 PARMETRO Se llamar parmetro a una caracterstica medible de la poblacin. Por ejemplo, el ingreso promedio de los estudiantes de la Universidad, el porcentaje de hombres en la Ciudad de Cali. Un parmetro es una constante para la poblacin. 1.8.5 ESTADGRAFO O ESTADSTICO Se denominar estadgrafo a una caracterstica medible en la muestra y que sirve para estimar el parmetro correspondiente de la poblacin, por ejemplo la edad promedio de una muestra de estudiantes de una escuela, o el porcentaje de varones en la muestra. 1.9 REDONDEO DE DATOS Para realizar el redondeo de cantidades continuas con aproximaciones, tendremos en cuenta los siguientes criterios: Incrementar en una unidad el ltimo dgito fijado, si el que sigue es mayor o igual que 5. No cambiar el ltimo dgito fijado, si el que sigue es menor que 5. Ejemplo: Dados los siguientes nmeros, redondear a 2 dgitos decimales (centsimas). a. 45,32854 45,33 b. 0,39425 0,39 c. 1,29632 1,30 d. 4,325 4,33 e. 8,435 8,44 EJERCICIOS: En los siguientes ejercicios encuentre las razones, las proporciones y porcentajes sugeridos 1. Supongamos que una empresa tiene clasificados sus empleados por ao y por sexo SEXO AO Hombres 1995 2000 780 880 Mujeres 320 620 1100 1500 Total

11

ESTADSTICA

LVARO VALENCIA OROZCO

Encuentre para cada uno de los aos: La razn de feminidad La razn de masculinidad La proporcin de feminidad La proporcin de masculinidad 2. Suponga que se dispone de cierta informacin por sexo, sobre personas portadoras de un virus: VIRUS X SEXO Portadores Hombres Mujeres Total Encuentre: La razn de feminidad entre portadores La razn de masculinidad entre portadores La razn de feminidad entre no portadores La razn de masculinidad entre no portadores La proporcin de feminidad entre portadores La proporcin de masculinidad entre portadores La proporcin de feminidad entre no portadores La proporcin de masculinidad entre no portadores La proporcin de portadores La proporcin de no portadores 3. Las prdidas en una fbrica de papel, (en miles de dlares), debidos a las rupturas de la hoja se pueden dividir de acuerdo con el producto en: Papel higinico Toallas Servilletas Pauelos 132 85 43 50 3500 7200 No portadores 5600.000 9200.000 Total

Encuentre: Qu porcentaje de las prdidas se obtiene al hacer c/u de los productos? La razn de prdidas al hacer papel higinico con respeto a c/u de los otros productos La razn de prdidas al hacer servilletas con respeto a los otros productos La proporcin de prdidas de cada uno de los productos. 4. Redondear cada uno de los siguientes nmeros a la exactitud que se indica: 48,6 aproximar a las unidades. 136,5 aproximar a las unidades. 2,484 aproximar a las centsimas. 0,0435 aproximar a las milsimas. 143,95 aproximar a las dcimas. 368 aproximar a las centenas. 24448 aproximar a las unidades de millar. 24581562 aproximar a las unidades de milln. 12

ESTADSTICA

LVARO VALENCIA OROZCO

48,6 aproximar a las decenas. 2. Etapas del Mtodo Estadstico El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que acten libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas: 2.1 Planteamiento del problema. 2.2 Fijacin de los objetivos. 2.3 Formulacin de la hiptesis. 2.4 Definicin de la unidad de observacin y de la unidad de medida. 2.5 Determinacin de la poblacin y de la muestra. 2.6 La recoleccin. 2.7 Crtica, clasificacin y ordenacin. 2.8 Tabulacin. 2.9 Presentacin. 2.10 Anlisis. 2.11 Publicacin. 2.1 PLANTEAMIENTO DEL PROBLEMA Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se pretende estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible sobre el o los fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones bsicas a un anlisis lgico; es decir, se debe hacer una ubicacin histrica y terica del problema. 2.2 FIJACIN DE LOS OBJETIVOS Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe, adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los objetivos generales y los especficos. 2.3 FORMULACIN DE LAS HIPTESIS Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada. Una hiptesis estadstica debe ser susceptible de docimar, esto es, debe poderse probar para su aceptacin o rechazo. Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis contraria se le llama Hiptesis Alternativa (H1). 2.4 DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la poblacin estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin de cuentas, es a ellas a las que se les har la medicin. La unidad de observacin puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja.

13

ESTADSTICA

LVARO VALENCIA OROZCO

El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qu unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la informacin. 2.5 DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes; una poblacin puede estar constituida por los habitantes de un pas o por los peces de un estanque, as como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado como infinito. Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar las propiedades del conjunto del cual es obtenida. En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la poblacin. Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para asegurar la objetividad de la investigacin. 2.6 LA RECOLECCIN Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha de partir, a menos que se tenga experiencia con muestras anlogas, de una o varias muestras piloto en las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de los parmetros con la precisin establecida. El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica, etc. Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado. 2.7 CRITICA, CLASIFICACIN Y ORDENACIN Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin por parte de quien depura para poder detectar falsedades en las respuestas, incomprensin a las preguntas, respuestas al margen, amn de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario. Separado el material de "desecho" con la informacin depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces 14

ESTADSTICA

LVARO VALENCIA OROZCO

necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de las diferentes variables que intervienen en la investigacin. El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo. 2.8 LA TABULACIN Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un titulo adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subttulos internos y la cuantificacin de los diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los crditos a la fuente de la informacin. 2.9 LA PRESENTACIN Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos redundantes que, antes que claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe hacerse no slo en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe. 2.10 EL ANLISIS La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisin. Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin, el ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar las conclusiones definitivas. 2.11 PUBLICACIN Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca de l. 3. Distribucin de Frecuencias Despus de recoger toda la informacin correspondiente a la investigacin, es decir, al agotar todo el trabajo de campo, nuestro escritorio se llena de un cmulo de datos y cifras desordenadas los cuales, al ser tomados como observaciones individuales, dicen muy poco sobre la poblacin estudiada; es, entonces, tarea del investigador hacer hablar las cifras, comenzando por la clasificacin y ordenacin, consignando la informacin en tablas inteligibles que denominamos distribuciones de frecuencias. 3.1 DISTRIBUCIN DE FRECUENCIAS SIMPLE Para una mayor sencillez, en la exposicin del tema, nos valemos del siguiente ejemplo: Supongamos que en la fbrica de confecciones La Hilacha, ha estallado un conflicto laboral y sus cincuenta operarias solicitan un aumento en el salario integral diario sopena de paralizar la fbrica. El Gerente-propietario recoge la informacin respecto a la variable salario diario de sus 50 operarias y la relaciona en la tabla No 1.

15

ESTADSTICA

LVARO VALENCIA OROZCO

Tabla No.1 SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) OBRER A 1 2 3 4 5 6 7 8 9 10 SALARI O 52 54 55 54 53 56 54 58 51 54 OBRER A 11 12 13 14 15 16 17 18 19 20 SALARI O 54 51 54 55 54 56 52 54 53 55 OBRER A 21 22 23 24 25 26 27 28 29 30 SALARI O 55 55 52 55 53 57 54 55 53 55 OBRER A 31 32 33 34 35 36 37 38 39 40 SALARI O 56 53 57 54 53 50 55 52 53 54 OBRER A 41 42 43 44 45 46 47 48 49 50 SALARI O 52 57 56 51 58 55 53 54 53 56

Tabla No. 2 SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) SALARIO SALARIO SALARIO SALARIO SALARIO 52 54 55 56 52 54 51 55 53 57 55 54 52 57 56 54 55 55 54 51 53 54 53 53 58 56 56 57 50 55 54 52 54 55 53 58 54 55 52 54 51 53 53 53 53 54 55 55 54 56

Tabla No. 3 SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) SALARIO SALARIO SALARIO SALARIO SALARIO 50 53 54 55 56 51 53 54 55 56 51 53 54 55 56 51 53 54 55 56 52 53 54 55 56 52 53 54 55 57 52 53 54 55 57 52 53 54 55 57 52 54 54 55 58 53 54 54 55 58

16

ESTADSTICA

LVARO VALENCIA OROZCO

Tabla No. 4 SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) SALARIO CONTEO REPETICIN 50 I 1 51 III 3 52 IIIII 5 53 IIIIIIIII 9 54 IIIIIIIIIIII 12 55 IIIIIIIIII 10 56 IIIII 5 57 III 3 58 II 2 SUMA 50 Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y el ordenamiento y agrupamiento de la tabla No. 4. . .Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbologa: n: El tamao de la muestra, es el nmero de observaciones. xi: La variable; es cada uno de los diferentes valores que se han observado. La variable xi, toma los x1, x2... xm valores. fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se repite la variable xi; as f1, es el nmero de veces que se repite la observacin x1, f2 el nmero de veces que se repite la observacin x2, etc. fa: La frecuencia absoluta acumulada, se obtiene acumulando la frecuencia absoluta. fr: La frecuencia relativa; es el resultado de dividir cada una de las frecuencias absolutas por el tamao de la muestra. fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamao de la muestra. .Veamos el ejemplo que venimos trabajando: Tabla No. 5 DISTRIBUCIN DE FRECUENCIAS DEL SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) SALARIO FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA Xi ABSOLUTA ABSOLUTA RELATIVA RELATIVA fi ACUMULADA fr ACUMULADA fa fra 50 1 1 1/50=0.02 1/50=0.02 51 3 4 3/50=0.06 4/50=0.08 52 5 9 5/50=0.10 9/50=0.18 53 9 18 9/50=0.18 18/50=0.36 54 12 30 12/50=0.24 30/50=0.60 55 10 40 10/50=0.20 40/50=0.80 56 5 45 5/50=0.10 45/50=0.90 17

ESTADSTICA

LVARO VALENCIA OROZCO

57 58 SUMAS

3 2 50

48 50

3/50=0.06 2/50=0.04 1.00

48/50=0.96 50/50=1.00

En la prctica, cuando se tiene confianza en el ordenamiento, no son necesarias tantas tablas; se puede pasar de la tabla No 1 directamente a la tabla No 6. Tabla No. 6 DISTRIBUCIN DE FRECUENCIAS DEL SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA (DATOS EN MILES DE PESOS POR DA) SALARIO FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA Xi ABSOLUTA ABSOLUTA RELATIVA RELATIVA fi ACUMULADA fr ACUMULADA fa fra 50 1 1 0.02 0.02 51 3 4 0.06 0.08 52 5 9 0.10 0.18 53 9 18 0.18 0.36 54 12 30 0.24 0.60 55 10 40 0.20 0.80 56 5 45 0.10 0.90 57 3 48 0.06 0.96 58 2 50 0.04 1.00 SUMAS 50 1.00 Analizando las columnas porcentuales fr y fra se obtienen, entre otras las siguientes conclusiones: Slo el 4% de las obreras gana el mximo salario/da de la fbrica, el cual corresponde a $58.000.00 El salario diario mnimo ($50.000.00) lo gana nicamente una obrera, lo que constituye el 2% del personal asalariado. El 62% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00 El 60% de las obreras tiene un salario/da de $54.000.00 o menos. El 64% tiene un ingreso diario de $54.000.00 o ms. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Qu es frecuencia absoluta? 2. Cmo se obtiene: 2.1 La frecuencia acumulada? 2.2 La frecuencia relativa? 2.3 La frecuencia relativa acumulada 3. En una distribucin de frecuencias se pueden establecer conclusiones porcentuales, utilizando solamente la frecuencia relativa? Por qu? 4. La siguiente tabla relaciona las ausencias al trabajo de 50 obreras, durante el mes de octubre, en la fbrica de confecciones "la hilacha". 1 3 1 4 2 0 2 1 0 4 2 4 0 2 2 1 2 1 3 1 3 0 0 2 3 1 3 0 0 1 4 1 1 0 2 3 2 2 2 1 2 0 1 5 0 5 2 3 2 2 18

ESTADSTICA

LVARO VALENCIA OROZCO

4.1 Construir una distribucin de frecuencias simple. 4.2 Sacar 3 conclusiones. 5. Aos de experiencia de las 50 operarias de la fbrica de confecciones "la hilacha" 4 5 7 6 4 6 5 9 7 6 5 8 3 7 8 6 8 2 7 5 4 8 7 8 6 6 6 4 3 6 5 9 5 6 7 5 6 7 6 5 6 5 7 7 7 5 7 3 6 4

Ordenar la Informacin y responder: 5.1 Qu porcentaje de las obreras tiene experiencia inferior o igual a 6 aos? 5.2 Qu porcentaje tiene experiencia entre 5 y 7 aos (incluyendo los extremos)? 3.2 DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de frecuencias simple, debido a que se encuentran distribuidos a travs de todo el recorrido y el nmero de veces que se repite cada observacin no es significativo en todos los casos, y en la mayora de ellos su frecuencia es baja. Una tabla de frecuencias construida en estas condiciones, no presenta ninguna utilidad. Ilustraremos el caso a travs de un ejemplo, para ello, supon gamos que la fbrica de baldosas De las casas, con el objeto de ofrecer una garanta de su producto, desea hacer un estudio tcnico de su produccin, para lo cual extrae una muestra de 100 baldosas, cada una de las cuales se somete a una prueba de resistencia, destructiva cuyos datos expresados en Kg/cm2, se relacionan a continuacin: Tabla No 7 REISTENCIA EN KG/CM DE 100 BALDOSAS DE LA FBRICA DE LAS CASAS 478 339 666 313 415 210 419 425 425 420 391 487 540 458 694 239 644 291 480 459 655 436 422 569 610 504 683 478 398 495 621 223 418 487 634 282 460 470 542 780 498 720 122 253 433 351 135 450 439 308 469 369 736 310 648 521 763 444 361 370 223 449 477 392 448 537 533 368 746 437 183 345 479 321 463 517 591 592 586 531 323 360 383 282 161 452 367 359 555 549 321 472 575 559 259 578 337 444 251 527

La clasificacin en una distribucin de frecuencias simple dara como resultante un ordenamiento de por lo menos 80 items; la mayora de ellos con frecuencia unitaria. Se hace necesario el agrupamiento en intervalos o clases que haga ms compacta, manejable y presentable la informacin. El nmero de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el conocimiento que posea de la poblacin, la necesidad de hacer comparacin con otras investigaciones y la presentacin de la informacin. Sin embargo, se recomienda que la informacin no sea demasiado compacta, lo cual le restara precisin, ni demasiado dispersa, ya que no se tendra claridad.

19

ESTADSTICA

LVARO VALENCIA OROZCO

En trminos generales, es usual que el nmero de intervalos no sea inferior a 5 ni superior a 15. Sturges propone que el nmero de clases o intervalos sea determinado por la expresin m = 1 + 3.3 log(n).* La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con clases abiertas. 3.3 REGLAS EMPRICAS PARA LA CONSTRUCCIN DE INTERVALOS Cuando no se tiene experiencia en el manejo de la informacin es aconsejable seguir los pasos que se dan a continuacin: 3.3.1 Determinar los datos de mayor y menor valor Xmax, Xmin. 3.3.2 Calcular el rango o recorrido (R). R = Xmx Xmn 3.3.3 Determinar el nmero de intervalos (m) y la amplitud de clase (A): m = 1 + 3.3 log(n), debe tenerse presente que m es un nmero natural. Luego se busca la amplitud A: 3.3.4 Calcular el rango ampliado: Ra 3.3.5 Establecer la diferencia a

R m

m. A
R , es decir la cantidad en que ha sido alterado el recorrido, la

Ra

cual no debe ser superior a la amplitud. ( a ) Tambin puede ser definida como la cantidad positiva ms pequea que le hace falta al rango o recorrido para ser divisible exactamente por la amplitud. 3.3.6 Distribuir adecuadamente la cantidad a de la siguiente manera: Al valor Xmin se le resta aproximadamente (es un poco ms)

obteniendo el lmite inferior del primer intervalo y el lmite superior del ltimo, respectivamente.

a y la parte restante se le suma a Xmax, 2

Xmn

a LIPI (Lmite inferior del primer intervalo) 2 a Xmx LSUI (Lmite superior del ltimo intervalo) 2

3.3.7 Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento de frecuencias. Con el fin de prever dobles conteos, quien clasifica deber especificar si los intervalos son abiertos a la derecha o abiertos a la izquierda, en estas notas, trabajaremos con intervalos abiertos a la derecha; es decir, del tipo a X b , donde el lmite superior no est incluido dentro de la clase. Retomemos el ejercicio de la Tabla No. 7 y construyamos una distribucin de frecuencia por intervalos. 1. Valores mximo y mnimo: Xmx 2. Rango: R 780 122 658 3. Nmero de intervalos:

780 y Xmn 122

m 1 3.3 log n 1 3.3 log100 1 3.3 * 2 7.6


No es lgico tener 7.6 intervalos, por lo tanto se procede a aproximar el nmero de intervalos a un nmero natural cercano, luego m=7, y busquemos la amplitud

R A m,

658 94 7

20

ESTADSTICA

LVARO VALENCIA OROZCO

Ya determinado el nmero de clases en m=7 encontramos que la amplitud debe ser mayor que 94. Fijmosla, entonces, en A = 100, que hace ms manejable y presentable la tabla con la informacin. 4. Rango ampliado: Ra 7 * 100 700 Hemos alterado el rango original 5. Tenemos por tanto, que

R 658 , cambindolo por el rango ampliado Ra diferencia est representada por a Ra R o sea a 700 658 42
distribuir adecuadamente la diferencia entre los

700 . La
rangos

a Xmn LIPI ; 122 22 100 LIPI 2 a Xmx LSUI ; 780 20 800 LSUI 2
Como se dijo antes, no estamos hablando de restar o sumar estrictamente sino una cantidad aproximada que brinde una buena presentacin. Construccin de los intervalos. Tabla No. 8 CONSTRUCCIN DE LOS INTERVALOS PARA LA RESISTENCIA DE LAS BALDOSAS Intervalos 100 200 200 300 300 400 400 500 500 600 600 700 700 - 800 Marcas de clase Xi 150 250 350 450 550 650 750

Se puede desde luego, proceder a agrupar la informacin en los respectivos intervalos, haciendo la salvedad de que ninguno de los lmites superiores de clase son considerados dentro de los intervalos. Tabla No 9 DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS DE LA RESISTENCIA DE 100 BALDOSAS DE LA FBRICA DE LAS CASAS KG/CM Xi fi fa fr fra 100 200 150 4 4 0.04 0.04 200 300 250 10 14 0.10 0.14 300 400 350 21 35 0.21 0.35 400 500 450 33 68 0.33 0.68 500 600 550 18 86 0.18 0.86 600 700 650 9 95 0.09 0.95 700 - 800 750 5 100 0.05 1.00 SUMAS 100 1.00 Conclusiones: El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/cm El 86% de las baldosas resiste menos de 600Kg/cm. Slo el 5% resiste 700 o ms Kg/cm. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Por qu se recurre al agrupamiento en distribuciones de frecuencias por intervalos? 2. Cmo se determina el nmero de intervalos y la amplitud de ellos? 21

ESTADSTICA

LVARO VALENCIA OROZCO

3. Qu es una marca de clase? 4. La siguiente tabla presenta el consumo de agua, en m, de 184 familias en un barrio residencial de una ciudad durante el mes de octubre 4 16 6 23 10 23 10 12 17 21 14 12 14 5 14 15 24 8 16 23 12 31 2 21 23 13 27 16 5 20 20 20 25 15 8 29 11 23 11 26 9 8 21 21 19 13 14 28 10 2 24 13 17 23 17 26 17 30 26 13 9 17 17 6 17 25 9 11 15 23 10 22 22 15 13 8 16 26 17 7 9 21 12 24 22 20 3 21 18 5 21 18 28 26 24 24 12 13 4 32 25 10 10 17 21 27 5 14 34 8 18 8 5 14 22 33 15 12 21 19 25 6 27 18 29 17 16 9 10 20 1 10 12 25 15 14 9 10 22 17 16 18 4 29 18 16 14 16 6 25 16 22 18 18 18 13 13 20 29 18 13 33 16 25 21 9 22 17 17 29 13 13 30 9 16 2 12 21 12 20 20 17 13 7

Construir una distribucin de frecuencias por intervalos. 4.1 Asumiendo el nmero de intervalos m = 8 4.2 Asumiendo el nmero de intervalos m = 9 4.3 Comparar las dos distribuciones y las conclusiones que de ellas se deriven. 4. REPRESENTACIN GRFICA A pesar de la gran ayuda que prestan las tablas y cuadros con informacin organizada, no todos los pblicos alcanzan a comprenderla o no disponen del tiempo suficiente para analizarla. Es por ello que la mayora de los investigadores acostumbran a reforzar la descripcin a travs de dibujos, generalmente con formas geomtricas, que ayudan a visualizar el comportamiento de las variables tratadas. 4.1 DEFINICIN Una grfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las variables all relacionadas. 4.2 COMPONENTES DE UNA GRFICA Una grfica, al igual que un cuadro o una tabla, debe constar de: 4.2.1 Ttulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: Qu relaciona, cundo y dnde se hicieron las observaciones. 4.2.2 El cuerpo: o grfico en s, cuya eleccin debe considerar el o los tipos variables a relacionar, el pblico a quien va dirigido y el diseo artstico del grfico. 4.2.3 Notas de pie de grfico: Donde se presentan aclaraciones respecto al grfico, las escalas de los ejes, o se otorgan los crditos a las fuentes respectivas. Es de anotar que por medio de grficos tendenciosos se pueden deformar o resaltar situaciones o estados, que presentados en un grfico apropiado, mostraran un comportamiento normal.

22

ESTADSTICA

LVARO VALENCIA OROZCO

4.3 PRINCIPALES TIPOS DE GRFICOS Existe una gran cantidad de grficos para la representacin de datos estadsticos, ya que de ellos depende el diseo artstico de quien los elabora, as como de su imaginacin al combinar varios tipos de ellos, como forma de presentar una informacin. Entre los grficos ms comunes tenemos: 4.3.1 Grfico de Lneas: Usado bsicamente para mostrar el comportamiento de una variable cuantitativa a travs del tiempo. El grfico de lneas consiste en segmentos rectilneos unidos entre s, los cuales resaltan las variaciones de la variable por unidad de tiempo. Para su construccin ha de procederse de la siguiente manera: en el eje de las ordenadas se marcan los puntos de acuerdo con la escala que se est utilizando. En el caso de una escala aritmtica, distancias iguales en el eje, representan distancias iguales en la variable. Variacin de La Inflacin en Colombia 1995-2000 1997 1998 17.68 16.7 Grfico No. 1 Variacin de La Inflacin en Colombia 1995-2000 25

1995 19.46

1996 21.63

1999 9.23

2000 7.81

20
PORCENTAJES 15 10 5 0

1994

1995

1996

1997

1998

1999

2000

2001

AOS El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el nmero de tems que ha de presentarse, as como la longitud del eje. Es de anotar la conveniencia de mostrar la interrupcin y acercamiento del eje a su origen cuando esto haya ocurrido. 4.3.2 Grfico de Lneas Compuesto: Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un slo grfico, el cual es el resultado de representar varias variables en un mismo plano. Variacin de la Inflacin y el Salario de la Hilacha 1995-2000 23

ESTADSTICA

LVARO VALENCIA OROZCO

1995 19.46 15.00

1996 21.63 20.00

1997 17.68 15.00

1998 16.7 15.00

1999 9.23 7.00

2000 7.81 5.00

Grfico No. 2 Variacin de la Inflacin y el Salario de la Hilacha 1995-2000 25

20
PORCENTAJES 15 10 5 0 INFLACIN SALARIO

1994 1995 1996 1997 1998 1999 2000 2001


AOS 4.3.3 Grfico de Barras: El grfico de barras, como su nombre lo indica, est constituido por barras rectangulares de igual ancho, conservando la misma distancia de separacin entre s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el nmero de tems es reducido. " GRFICO No 3 Aos de experiencia de 50 Obreras en "La Hilacha" 14 12 10 OBRERAS 8 6 4 2 0 1 2 3 4 5 6 7 8 9

AOS DE EXPERIENCIA

24

ESTADSTICA

LVARO VALENCIA OROZCO

stos grficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal. 4.3.4 Grfico de Barras Compuesto Variacin de la Inflacin y el Salario de la Hilacha 1995-2000 1995 19.46 15.00 1996 21.63 20.00 1997 17.68 15.00 1998 16.7 15.00 1999 9.23 7.00 2000 7.81 5.00

Grfico No 4 Variacin de la Inflacin y el Salario de la Hilacha 1995-2000 25 20 PORCENTAJE 15 10 INFLACIN SALARIO

5
0 1995 1996 1997 1998 1999 2000

AOS

4.3.5 Grfico de Sectores Circulares Usualmente llamado grfico de pastel, debido a su forma caracterstica de una circunferencia dividida en cascos, por medio de radios que dan la sensacin de un pastel tajado en porciones. Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el nmero de tems no es superior a 5 y se quiere resaltar uno de ellos. Para su construccin se procede de la siguiente forma: La circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder al total de la informacin, es decir al 100%; luego, para determinar el nmero de grados correspondiente a cada componente se multiplica el porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un transportador para formar los casquetes de los diferentes tems.

25

ESTADSTICA

LVARO VALENCIA OROZCO

Grfico No 5 SALARIO DIARIO DE 50 OPERARIAS EN LA FBRICA DE CONFECCIONES LA HILACHA

58 57

50
51 52

56 53

55
54

4.3.6 Histograma de Frecuencias: Para la construccin de un histograma de frecuencias de fcil interpretacin y que no falsee la informacin, debe disponerse de una distribucin de frecuencias por intervalos con amplitud igual para cada clase o intervalo. En el eje de las abscisas procedemos a representar los intervalos de la variable, y en el eje de las ordenadas las frecuencias de cada clase. El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias respectivas. GRFICO No 6. Histograma de Frecuencias de la Resistencia de 100 baldosas

26

ESTADSTICA

LVARO VALENCIA OROZCO

35 30 25 FRECUENCIA 20 15 10 5 0 150 250 350 450 550 650 750

RESISTENCIA KG/CM

4.3.7 Polgono de Frecuencias GRFICO No 7. Polgono de Frecuencias de la resistencia de 100 baldosas 35 30 FRECUENCIA 25 20 15 10 5 0 50 150 250 350 450 550 650 750 850

RESISTENCIA KG/CM Para la construccin de un polgono de frecuencias, se marcan los puntos medios de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos de recta. 4.3.8 Histograma de Frecuencias Acumuladas. El histograma de frecuencias acumuladas tambin es obtenido a partir de una distribucin de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo. GRFICO No 8. Histograma de Frecuencias acumuladas de la Resistencia de 100 baldosas

27

ESTADSTICA

LVARO VALENCIA OROZCO

120 100 FRECUENCIA 80 60

40
20 0 150 250 350 450 550 RESISTENCIA KG/CM 650 750

GRFICO No 9. Frecuencias acumuladas de la Resistencia de 100 baldosas Ojiva Creciente 120 100 FRECUENCIA 80 60 40 20

0
100 200 300 400 500 600 700 800

RESISTENCIA KG/CM

GRFICO No 10. Histograma de Frecuencias acumuladas de la Resistencia de 100 baldosas Ojiva Decreciente

28

ESTADSTICA

LVARO VALENCIA OROZCO

120 100 FRECUENCIA 80 60 40 20 0 100 200 300 400 500 600 700 800

RESISTENCIA KG/CM

CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Cul es el objetivo de un grfico? 2. Describa los componentes de una grfica. 3. Cules son las principales causas de distorsin de la informacin de un grfico? 5. Para el ejercicios 4 del captulo 3, construir: 5.1 Un histograma de frecuencias 5.2 Un polgono de frecuencias. 5.3 Un histograma de frecuencias acumuladas 5.4 Un polgono de frecuencias acumuladas

5. MEDIDAS DE TENDENCIA CENTRAL En los captulos anteriores, nos referimos a la clasificacin, ordenacin y presentacin de datos estadsticos, limitando el anlisis de la informacin a la interpretacin porcentual de las distribuciones de frecuencia. El anlisis estadstico propiamente dicho, parte de la bsqueda de parmetros sobre los cuales pueda recaer la representacin de toda la informacin. Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de la informacin, son de gran importancia en el manejo de las tcnicas estadsticas, sin embargo, su interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la representatividad de ellas est asociada con el grado de concentracin de la informacin. Las principales medidas de tendencia central son: 5.1 Media aritmtica. 5.2 Mediana 5.3 Moda. 5.1 MEDIA ARITMTICA Cotidiana e inconscientemente estamos utilizando la media aritmtica. Cuando por ejemplo, decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que contiene un paquete sino que es el resultado de la observacin, es decir, dicho sujeto puede consumir 18, un da; 19 otro; 20, 21, 22; pero segn nuestro criterio, el nmero de unidades estar alrededor de 20.

29

ESTADSTICA

LVARO VALENCIA OROZCO

Matemticamente, la media aritmtica se define como la suma de los valores observados dividida entre el nmero de observaciones.
n

x1

x2

x3 ... x n n

xi
1

X : Media aritmtica de la variable X


x i : Valores de la variable X n : Nmero de observaciones
: Signo de sumatoria, indica que se debe sumar Ejemplo: Cantidad de cigarrillos consumidos por un fumador en una semana. Lunes: 18 Martes: 21 Mircoles: 22 Jueves: 21 Viernes: 20 Sbado: 19 Domingo: 19 Entonces la media aritmtica es:
n

X X

xi x3 ... x n 1 n n 18 21 22 21 20 19 19 7 x1 x2

140 7

20

El fumador consume en promedio 20 cigarrillos diarios. Cuando la variable est agrupada en una distribucin de frecuencias, la media aritmtica se calcula por la frmula:
m

X
Ejemplo 1:

x1 f1

x2 f 2

x3 f 3 ... x m f m n

xi f i
1

Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada CANTIDAD Xi 18 19 20 21 22 FRECUENCIA Fi 1 2 1 2 1

18(1) 19(2) 20(1) 21(2) 22(1) 7

18 38 20 42 22 140 7 7

20

30

ESTADSTICA

LVARO VALENCIA OROZCO

Ejemplo 2: Calculo de La Media Aritmtica. El Salario/da de 50 Operarias SALARIO Xi 50 51 52 53 54 55 56 57 58 SUMAS


9

FRECUENCIA ABSOLUTA fi 1 3 5 9 12 10 5 3 2 50

Xifi 50 153 260 477 648 550 280 171 116 2705

xi f i X
1

50

2705 54.1 50

Es decir que, el salario promedio diario de las operarias en la fbrica de confecciones La hilacha es de $54100 pesos/da. Si la informacin est relacionada en una distribucin de frecuencias por intervalos, se toman como valores de la variable las marcas de clase de los intervalos, entindase por marca de clase el punto medio entre los lmites de cada clase o intervalo. Ejemplo 3: Clculo de La Media Aritmtica de la Resistencia de 100 Baldosas KG/CM 100 200 200 300 300 400 400 500 500 600 600 700 700 - 800 SUMAS Xi 150 250 350 450 550 650 750 fi 4 10 21 33 18 9 5 100 Xifi 600 2500 7350 14850 9900 5850 3750 44800

xi f i X
1

La resistencia promedio de las 100 baldosas es de 448 Kg/Cm. 5.1.1 Propiedades de la Media Aritmtica 5.1.1.1 La suma de las diferencias de los datos con respecto a la media aritmtica es igual cero. 5.1.1.2 La suma de las diferencias cuadrticas de los datos, con respecto a la Media Aritmtica, es mnima. 31

100

44800 100

448

ESTADSTICA

LVARO VALENCIA OROZCO

Quiere decir esta propiedad que cualquier otro parmetro p, diferente a la media aritmtica hace mayor la expresin 5.1.1.3 Si a cada uno de los resultados le sumamos o le restamos una constante C , la Media Aritmtica queda alterada en esa constante. 5.1.1.4 Si cada uno de los datos se multiplica por una constante k, entonces la media aritmtica queda multiplicada por esa constante. 5.1.2 Media Aritmtica Ponderada Hemos visto que la Media Aritmtica se calcula con base a la magnitud de los datos, otorgndole igual importancia a cada uno de ellos. Sin embargo en muchas ocasiones la magnitud del dato esta ponderada con un determinado peso que lo afecta relativamente. La Media Aritmtica ponderada tiene en cuenta la importancia relativa de cada uno de los datos, para lo cual la definimos con la siguiente expresin:
n

xi wi XW
Donde
1 n

wi
1

X w : Media aritmtica ponderada X i : Valor de la variable X wi : Ponderacin del tem xi


Ejemplo 1: Las calificaciones de un estudiante estn conformadas por los siguientes factores: Un examen cuyo valor es 40% en el cual obtuvo una nota de 4.5, un trabajo de consulta con ponderacin del 10% y calificacin de 1.0, una exposicin equivalente al 15% con nota de 2.0, y por ltimo una investigacin con valor del 35% calificada con 3.5. Entonces la nota definitiva es:
n

xi wi XW
1 n

wi
1

4.5(0.40) 1.0(0.10) 2.0(0.15) 3.5(0.35) 0.40 0.10 0.15 0.35

1.8 0.1 0.3 1.225 1

3,425

...... 5.2 LA MEDIANA Otra medida de tendencia central, utilizada principalmente en estadstica no paramtrica, es la mediana, la cual no se basa en la magnitud de los datos, como la media aritmtica, sino en la posicin central que ocupa en el orden de su magnitud, dividiendo la informacin en dos partes iguales, dejando igual nmero de datos por encima y por debajo de ella. 5.2.1 La Mediana Cuando los datos no estn Agrupados en Intervalos. Partiendo de la informacin bruta, ordenamos los datos ascendente o descendentemente: x1 , x 2 , x3 ,....., xi ,....., x n se define Mediana =

Me

n 1 2

, si n es impar

32

ESTADSTICA

LVARO VALENCIA OROZCO

x
Mediana = Me

n 2

x 2

n 1 2

, si n es par

En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes 18, martes 21, mircoles 22, jueves 21, viernes 20, sbado 19, y domingo 19. Ordenando ascendentemente: x1=18, x2=19, x3=19, x4=20, x5=21, x6=21, x7=22 Como n, es impar, entonces

Me

n 1 2

7 1 2

x4

20

Veamos cuando n es par: .Consumo mensual de agua, en m3, por la fbrica de confecciones la hilacha. Enero= 10,. Febrero= 12, Marzo= 15, Abril= 18, Mayo= 14, .Junio= 19, Julio= 17, Agosto= 18, Septiembre= 18, , Octubre= 22, , Noviembre= 15, , Diciembre= 13 x1=10, x2=12, x3=13, x4=14, x5=15, x6=15, x7=17, x8=18, x9=18, x10=18, x11=19, x12=22

x
Mediana = Me

n 2

x 2

n 1 2

12 2

x 2

12 1 2

x6 2

x7

Como se puede observar, en este caso la mediana no es un dato perteneciente a la informacin, es un parmetro que divide la informacin dejando el 50% por encima y el 50% por debajo de ella. 5.2.2 La Mediana Cuando la Informacin se Encuentra Agrupada en Intervalos Si la informacin esta agrupada en intervalos iguales, entonces la mediana se calcula segn la siguiente expresin:

15 17 2

16

Me

LI

n 2

fa i fi

Me: Mediana LI: Lmite inferior del intervalo donde se encuentra la mediana (intervalo mediano), el cual se determina observando en que clase se encuentra la posicin n/2.) n: Nmero de observaciones fa i 1 : Frecuencia acumulada anterior al intervalo mediano

f i : Frecuencia del intervalo mediano


A: Amplitud del intervalo Ejemplo 1: Resistencia de 100 Baldosas de la Fbrica De Las Casas KG/CM 100 200 200 300 300 400 400 500 500 600 600 700 700 - 800 SUMAS Xi 150 250 350 450 550 650 750 fi 4 10 21 33 18 9 5 100 fa 4 14 35 68 86 95 100

Intervalo mediano

En la columna de frecuencia acumulada advertimos que la observacin nmero 50 se halla en el cuarto (4) intervalo.

33

ESTADSTICA

LVARO VALENCIA OROZCO

Me

LI

n 2

fa i fi

100 35 15 2 400 .100 400 .100 400 45.45 445.45 33 33

Se concluye que el 50% de las baldosas resiste menos de 445.45 Kg/Cm y el 50% resiste ms de 445.45 Kg/Cm. ...... 5.3 LA MODA La moda, como su nombre lo indica, es el valor ms comn (de mayor frecuencia) dentro de una distribucin. Una informacin puede tener una moda y se llama unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la informacin no posea moda. 5.3.1 La Moda Cuando los datos no estn Agrupados en Intervalos Salario de 50 Operarias de la Fabrica de Confecciones "La Hilacha" SALARIO FRECUENCIA Xi ABSOLUTA fi 50 1 51 3 52 5 53 9 54 12 55 10 56 5 57 3 58 2 SUMAS 50 El valor que ms veces se repite es 54 con una frecuencia de 12, entonces decimos que la moda es Mo = 54.000.00 pesos diarios. . Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada CANTIDAD FRECUENCIA Xi Fi 18 1 19 2 20 1 21 2 22 1 Los valores de mayor frecuencia corresponden a 19 y 21, por lo tanto se trata de una distribucin bimodal con Mo1=19 y Mo2=21 5.3.2 Clculo de la Moda Cuando la Informacin est Agrupada en Intervalos Cuando la informacin se encuentra agrupada en intervalos de igual tamao la moda se calcula con la siguiente expresin.

Mo

LI

fm 2 fm fm

fm
1

fm

A , donde:
1

Mo: Moda 34

ESTADSTICA

LVARO VALENCIA OROZCO

LI: Lmite inferior del intervalo modal fm: Frecuencia de la clase modal f(m-1) : Frecuencia de la clase premodal f(m+1) : Frecuencia de la clase posmodal A : Amplitud de los intervalos Ejemplo: Resistencia de 100 Baldosas de la Fbrica De Las Casas KG/CM 100 200 200 300 300 400 400 500 500 600 600 700 700 - 800 SUMAS Xi 150 250 350 450 550 650 750 fi 4 10 21 33 18 9 5 100

Clase premodal Clase modal Clase posmodal

Mo

LI

fm 2 fm fm

fm
1

fm

A
1

400

33 21 12 *100 400 2(33) 21 18 27

444,44 Kg/cm

A pesar que el valor 444.44 no es un dato real de la informacin asumimos ese parmetro como el de mayor ocurrencia. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Qu es una medida de tendencia central? 2. Cules son las principales medidas de tendencia central? 3. Defina: media aritmtica mediana y moda. 4. Cundo se utiliza la media aritmtica ponderada? 5. Enuncie las propiedades de la media aritmtica 6. Para cada informacin de los ejercicios del captulo 3, calcular e interpretar la media aritmtica, la mediana y la moda. 7. La tripulacin de un avin, en su itinerario compra los siguientes galones de gasolina: Ciudad X 200 galones a 4000 pesos el galn, Ciudad Y 250 galones a 3500 pesos el galn, Ciudad Z 300 galones a 3000 pesos el galn. Cul es el costo promedio de la gasolina comprada? 6. MEDIDAS DE POSICIN (PERCENTILES) En el Capitulo anterior, vimos lo referente a las medidas de tendencia central, las cuales, a su vez, son tambin medidas de posicin ya que, de todas maneras ocupan un lugar dentro de la informacin. Nos ocuparemos ahora de ciertos parmetros posicionales muy tiles en la interpretacin porcentual de la informacin. 6.1 CUARTILES Las cuartillas o cuartiles son valores posicionales que dividen la informacin en cuatro partes iguales, el primer cuartil deja el 25% de la informacin por debajo de l, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la informacin en dos partes iguales, y por ltimo el tercer cuartil deja el 75% por debajo de s, y el 25% por encima.

35

ESTADSTICA

LVARO VALENCIA OROZCO

Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automticamente determinada.

Qk

LI

kn 4

fa i fi

1,2,3 , donde:

k : Oden del cuartil k = 1,2,3 LI:.Lmite inferior del intervalo que contiene el cuartil fa(i-1): Frecuencia acumulada hasta el intervalo anterior al que contiene el cuartil fi : Frecuencia del intervalo que contiene el cuartil n : Nmero de observaciones A : Amplitud de los intervalos Ejemplo: Resistencia de 100 Baldosas de la Fbrica De Las Casas KG/CM 100 200 200 300 300 400 400 500 500 600 600 700 700 - 800 SUMAS Primer cuartil: Xi 150 250 350 450 550 650 750 fi 4 10 21 33 18 9 5 100 fa 4 14 35 68 86 95 100

Contiene a Q1 Contiene a Q2 Contiene a Q3

acumulada, para determinar que clase contiene este cuartil.

kn 4

1(100) 4

25 , posicin que debe ser ubicada en la frecuencia

Qk

LI

kn 4

fa i fi

Q1

1(100) 14 4 300 *100 352,38 Kg/Cm 21

El 25% de las baldosas resiste menos de 352.38 Kg/Cm y el 75% tiene una resistencia superior. Como el segundo cuartil es lo mismo que la mediana: Me=Q2=445.45Kg/Cm Calculemos la tercera cuartilla k=3 . .

Qk

LI

kn 4

fa i fi

Q1

3(100) 68 4 500 *100 538,88 Kg/Cm 18

El 75% de las baldosas tiene una resistencia inferior a 538.88 Kg/Cm y el 25% una resistencia superior. 6.2 QUINTILES Los quintiles o quintillas dividen la informacin en cinco partes iguales, agrupndolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro parmetros:

Qk

LI

kn 5

fa i fi

1,2,3,4

Calculemos por ejemplo la segunda quintilla para el ejercicio que traemos:

36

ESTADSTICA

LVARO VALENCIA OROZCO

k=2,

Qk

LI

kn 5

fa i fi

Q1

400

2(100) 35 5 *100 415,15 Kg/cm 33

El 40% de las baldosas resiste menos de 415.15kg/cm2 y el 60% resiste ms. 6.3 DECILES Similarmente, los deciles o decillas dividen la informacin en diez partes iguales, en cantidades porcentuales de 10 en 10.

Dk

LI

kn 10

fa i fi

1,2,3,4,....., 9

6.4 CENTILES Obviamente los centiles dividen la informacin en 100 partes, lo cual facilita la interpretacin porcentual de una distribucin de frecuencias.

Ck

LI

kn 100 fi

fa i

1,2,3,4,....., 99

6.5 RESUMEN En general para calcular cualquier percentil:

Qk

LI

kn r

fa i fi

A , donde:

r: Nmero de partes en que se divide la informacin k: Orden del percentil k = 1,2,.....,r-1 LI: Lmite inferior del intervalo que contiene el percentil fa(i-1): Frecuencia acumulada hasta el intervalo anterior al que contiene el percentil fi: Frecuencia del intervalo que contiene el percentil n: Nmero de observaciones A: Amplitud de los intervalos En nuestro ejercicio, si el gerente de la fbrica de baldosas desea ofrecer un garanta de resistencia mnima. Basado en la muestra que se ha obtenido, si no quiere remplazar ninguna pieza, lgicamente debe afirmar que el producto resiste 100 o ms Kg/Cm. Pero si est dispuesto a reemplazar el 5% de su produccin, entonces:

r 100,

5,

n 100,
1

A 100,

kn r

5(100) 100

5,

LI

200

Qk

LI

kn r

fa i fi

Q5

200

5 4 *100 200 10 10

210 Kg/cm

Se debe dar una garanta de 210kg/cm de resistencia mnima. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Para qu se utilizan los percentiles? 2. En cuntas partes se divide la informacin con: 2.1 Los cuartiles 2.2 Los quintiles 37

ESTADSTICA

LVARO VALENCIA OROZCO

2.3 Los deciles 2.4 Los centiles 3. Para la informacin del ejercicio 4 de la seccin 3.2 calcular e interpretar; 3.1 La primera y tercera cuartilla 3.2 El segundo y cuarto quintil 3.3 Qu porcentaje hay entre la primera y tercera quintilla? 3.4 Qu porcentaje hay entre la primera cuartilla y la segunda quintilla? 3.5 Qu porcentaje hay entre la tercera cuartilla y el noveno decil? ...... 7. MEDIDAS DE DISPERSIN En el anlisis estadstico no basta el clculo e interpretacin de las medidas de tendencia central o de posicin, ya que, por ejemplo, cuando pretendemos representar toda una informacin con la media aritmtica, no estamos siendo absolutamente fieles a la realidad, pues suelen existir datos extremos inferiores y superiores a la media aritmtica, los cuales, en honor a la verdad, no estn siendo bien representados por este parmetro. En dos informaciones con igual media aritmtica, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmtica, y mediana que los valores 49, 50,51; sin embargo, para la primera informacin la media aritmtica, se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la segunda informacin que posee igual media aritmtica y mediana, vemos entonces que la primera informacin es mas heterognea o dispersa que la segunda. Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes indicadores: 7.1 Rango o recorrido 7.2 Desviacin media 7.3 Varianza y desviacin tpica o estndar 7.4 Coeficiente de variabilidad. 7.1 RANGO O RECORRIDO Es la medida de dispersin ms sencilla ya que solo considera los dos valores extremos de una coleccin de datos, sin embargo, su mayor utilizacin est en el campo de la estadstica no paramtrica. R = X max Xmin Xmax, Xmin son el mximo y el mnimo valor de la variable X, respectivamente. En el ejemplo introductorio, vemos que el rango para la primera informacin es R1=95-5=90, mientras que R2=51-49=2, se hace pues manifiesta la gran dispersin de la primera informacin contra la homogeneidad de la segunda. 7.2 DESVIACIN MEDIA La desviacin media, mide la distancia absoluta promedio entre cada uno de los datos, y el parmetro que caracteriza la informacin. Usualmente se considera la desviacin media con respecto a la media aritmtica:
m

xi DM
1

x * fi n
, donde

DM : Desviacin media xi : Diferentes valores de la variable x fi : Nmero de veces que se repite la observacin xi

38

ESTADSTICA

LVARO VALENCIA OROZCO

x : Media aritmtica de la informacin n : Tamao de la muestra. m : Nmero de agrupamientos o intervalos Ejemplo: Salario de 50 Operarias de la Fabrica de Confecciones La Hilacha SALARIO FRECUENCIA Xi ABSOLUTA xi x fi 50 1 4.1 51 3 3.1 52 5 2.1 53 9 1.1 54 12 0.1 55 10 0.9 56 5 1.9 57 3 2.9 58 2 3.9 SUMAS 50
m

xi

x * fi
4.1 9.3 10.5 9.9 1.2 9.0 9.5 8.7 7.8 70

xi DM
1

x * fi n

1.400 es el error promedio que se comete al remplazar los ingresos diarios de cada una de las 50 obreras por 54.100 pesos. 7.3 VARIANZA El problema de los signos en la desviacin media, es eludido tomando los valores absolutos de las diferencias de los datos con respecto a la media aritmtica. Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser ms elegante, aparte de que es supremamente til en el ajuste de modelos estadsticos que generalmente conllevan formas cuadrticas. La varianza es uno de los parmetros ms importantes en estadstica paramtrica, se puede decir que, teniendo conocimiento de la varianza de una poblacin, se ha avanzado mucho en el conocimiento de la poblacin misma. Numricamente definimos la varianza, como desviacin cuadrtica media de los datos con respecto a la media aritmtica:
m

70 1.4 50

xi S2
1

x * fi n
, donde:

S2 : Varianza Xi : Valor de la variable X x : Media aritmtica de la informacin fi : Frecuencia absoluta de la observacin xi n : Tamao de la muestra. m : Nmero de agrupamientos o intervalos Salario/dia de 50 Operarias en la Fbrica de Confecciones La Hilacha (Miles de Pesos) SALARIO FRECUENCIA Xi ABSOLUTA Xifi 39

ESTADSTICA

LVARO VALENCIA OROZCO

fi 50 51 52 53 54 55 56 57 58 SUMAS 1 3 5 9 12 10 5 3 2 50
m

xi
50 153 260 477 648 550 280 171 116

xi

xi

x * fi
16.81 28.83 22.05 10.89 0.12 8.10 10.05 25.23 30.42 160.50

-4.1 -3.1 -2.1 -1.1 0.1 0.9 1.9 2.9 3.9

16.81 9.61 4.41 1.21 0.01 0.81 3.61 8.41 15.21

xi S2
1

x * fi n

Como los datos estn expresados en miles de pesos y la varianza se encuentra en forma cuadrtica obtenemos una varianza de 3.210.000 pesos. Sin embargo para una mejor comprensin debemos recurrir a la desviacin tpica o estndar (S) definida como la raz cuadrada de la varianza:
m 2

160.50 50

3.21

xi S S2
1

x * fi n S 3,21 1,791

El error estndar es de 1.791 pesos/diarios. En el ejemplo de las baldosas: KG/CM Resistencia de 100 Baldosas de La Fbrica De Las Casas Xi fi xifi x x x x
i

xi

x * fi

100 y menos de 200 200 y menos de 300 300 y menos de 400 400 y menos de 500 500 y menos de 600 600 y menos de 700 700 y menos de 800 SUMAS

150 250 350 450 550 650 750

4 10 21 33 18 9 5 100
2

600 2500 7350 14850 9900 5850 3750 44800

-298 -198 -98 2 102 202 302

88804 39204 9604 4 10404 40804 91204

355216 392040 201684 132 187272 367236 456020 1959600

xi S S2
1

x * fi n S

1959600 100

19596 140 Kg/cm

El error estndar es de 140 Kg/cm 7.4 COEFICIENTE DE VARIABILIDAD Generalmente interesa establecer comparaciones de la dispersin, entre diferentes muestras que posean distintas magnitudes o unidades de medida.

40

ESTADSTICA

LVARO VALENCIA OROZCO

El coeficiente de variabilidad tiene en cuenta el valor de la media aritmtica, para establecer un nmero relativo, que hace comparable el grado de dispersin entre dos o ms variables, y se define como:

CV

S *100% x

Comparemos la homogeneidad de las dos informaciones anteriores, las cuales tienen diferente unidad de medida.

1791 *100% 3.3% 54.1 140 Para la resistencia: CVR *100% 31.25% 448
Para el salario:

CVs

Concluimos que es mucho ms dispersa la informacin correspondiente a la resistencia de las baldosas. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Cul es la utilidad de las medidas de dispersin? 2. Cuales son las principales medidas de dispersin? 3. Cul es la medida adecuada para comparar la dispersin entre varias variables que posean diferente magnitud o diferente unidad de medida? 4. Para cada una de las informaciones de los ejercicios de los captulos anteriores, calcular e interpretar: 4.1 Rango 4.2 Desviacin media 4.3 Coeficiente de variabilidad 8. REGRESIN Y CORRELACIN LINEAL Hasta ahora hemos hecho la tabulacin y el anlisis para una sola variable. Pero los investigadores, adems de analizar una informacin en forma individual, generalmente se interesan en establecer cruces y buscar relaciones entre diferentes variables. 8.1 TABLAS DE DOBLE ENTRADA Para la presentacin bidimensional de las variables "X, Y" se procede de la siguiente manera: Se ordenan las variables "X, Y" respectivamente Se tabulan los valores X horizontalmente, y los valores Y verticalmente. Se buscan las frecuencias para cada par ordenado (xi, yj). Se suma horizontalmente para obtener las frecuencias de Y fyj, y verticalmente para obtener las frecuencias de X fxi . xi : Valores de la variable X, i=1,2,....m yj : Valores de la variable Y, j=1,2,... k fxi : Frecuencia de la observacin xi fyj : Frecuencia de la observacin yj fij : Frecuencia conjunta de los valores (xi, yj) faxi : Frecuencia acumulada de la variable X, en el item i fayj : Frecuencia acumulada de la variable Y, en el item j frxi : Frecuencia relativa para la variable X, en el item i fryj : Frecuencia relativa para la variable Y, en el item j fraxi : Frecuencia relativa acumulada para la variable X frayj : Frecuencia relativa acumulada para la variable Y. Tabla de Doble Entrada para la Representacin de dos Variables X, Y X Y X1 X2 Xi Xm Fyj Fayj Fryj Frayj

41

ESTADSTICA

LVARO VALENCIA OROZCO

Y1 Y2 . . yj . . yk fxi Faxi Frxi Fraxi

F11 F12 . . F1j . . F1k Fx1 Fax1 Frx1 Frax1

F21 F22 . . F2j . . F2k Fx2 Fax2 Frx2 Frax2

. . . .

Fi1 Fi1 . . Fij . . Fik Fxi Faxi Frxi Fraxi

. . . .

Fm1 Fm2 . . Fmj . . Fmk Fxm n Frxm 1.00

Fy1 Fy2 . . Fyj . . Fyk n 1.00

Fay1 Fay2 . . Fayj . . n

Fry1 Fry2 . . Fryj . . Fryk 1.00

Fary1 Fary2 . . Frayj . . 1.00

Como se puede advertir en la disposicin de las frecuencias, la interpretacin de la variable Y, puede hacerse analizando los relativos propios en forma horizontal, en tanto que el anlisis de la variable X se hace en forma vertical. Ejemplo

X Y 50 51 52 53 54 55 56 57 58 Fx1 Faxi Frxi Farxi

2 1

Experiencia Laboral y Salario Diario de 50 Obreras de la Fbrica De Confecciones La Hilacha. X: Experiencia en Aos, Y: Salario Miles de Pesos 3 4 5 6 7 8 9 Fyj Fayj 3 5 8 2 1 9 3 1 7 3 1 3 5 9 12 10 5 3 2 50 1.00 1 4 9 18 30 40 45 48 50

Fryj 0.02 0.06 0.10 0.18 0.24 0.20 0.10 0.06 0.04 1.00

Faryj 0.02 0.08 0.18 0.36 0.60 0.80 0.90 0.96 1.00

1 1 0.02 0.02

3 4 0.06 0.08

5 9 0.10 0.18

10 19 0.20 0.38

13 32 0.26 0.64

11 43 0.22 0.86

2 2 1 5 48 0.10 0.96

1 1 2 50 0.04 1.00

Analizando los relativos para cada una de las variables podemos sacar, entre otras, las siguientes conclusiones: El 64% tiene una experiencia igual o inferior a 6 aos. El 68% tiene una experiencia entre 5 y 7 aos incluyendo sus extremos. El 60% gana 54.000 pesos diarios o menos. El 62% gana entre 53.000 y 55.000 pesos incluyendo sus extremos. Las tablas de doble entrada tambin pueden usarse para variables cualitativas, o combinarse variables cualitativas con cuantitativas. Ejemplo: Estado Civil y Nmero de Hijos de 50 Obreras de la Fabrica La Hilacha" X: Estado Civil, Y : Nmero De Hijos. X Y casada soltera Unin libre Viuda Fi Fa Fr Fra

42

ESTADSTICA

LVARO VALENCIA OROZCO

0 1 2 3 4 Total %

4 5 1 10 0.20

11 9 9 1 30 0.60

2 2 1 5 0.10

1 2 2 5 0.10

11 12 17 9 1 50 1.00

11 23 40 49 50

0.22 0.24 0.34 0.18 0.02 1.00

0.22 0.46 0.80 0.98 1.00

Realice la interpretacin y anlisis de esta tabla. 8.2 CORRELACIN En el anlisis conjunto para dos o ms variables es bsica la bsqueda del tipo y grado de la relacin que pueda existir entre ellas, o si por el contrario, las variables sean independientes entre s y la relacin que puedan mostrar se debe nicamente al azar, o a travs de terceras variables. El sondeo del tipo y grado de la correlacin, parte desde la misma presuncin del investigador, teniendo presente que la bsqueda de relaciones entre variables debe ser lgica, es decir relacionar lo que sea razonable y no datos cuya asociacin sea desde cualquier punto de vista absurda. Veamos algunas variables susceptibles de relacionar: El peso y estatura de un grupo de adultos. Edad y peso de un grupo de nios. Ingresos y gastos de arrendamiento de un grupo de familias. Escolaridad e ingreso mensual de un grupo de empleados. Ventas y utilidades de un almacn de variedades. En el cuestionario aplicado a las obreras de la "Hilacha", parece que se indaga por ciertas variables que puedan explicar el salario devengado por ellas; como podra ser, los aos de experiencia, los aos de estudio, las ausencias al trabajo, la evaluacin del desempeo por parte de su supervisor, amn de otras variables que pueden tener influencia en la asignacin salarial. Para fortalecer el indicio de correlacin inicial, se grafica cada uno de los pares ordenados de las variables (xi, yj) en un plano cartesiano, para observar la nube de puntos o diagrama de dispersin, donde se advierte la tendencia o no, de la informacin representada. A continuacin grafiquemos las relaciones entre cada par de variables asi: 1. Relacin entre el salario y la escolaridad de cada una de las 50 obreras de la hilacha 2. Relacin entre el salario y las ausencias de cada una de las 50 obreras de la hilacha durante el mes de octubre. 3. Relacin entre la edad y los gastos en educacin de cada una de las 50 obreras de la hilacha

43

ESTADSTICA

LVARO VALENCIA OROZCO

1. RELACIN ENTRE EL SALARIO Y LA ESCOLARIDAD DE LAS 50 OBRERAS DE "LA HILACHA" ESCOLA SALARI ESCOLA SALARI ESCOLA SALARI ESCOLA SALARI ESCOLA SALARI RI O RI O RI O RI O RI O DAD DAD DAD DAD DAD 5 52 6 54 8 55 6 56 3 52 5 4 4 3 8 3 9 3 3 54 55 54 53 56 54 58 51 54 3 7 7 5 8 3 4 4 9 51 54 55 54 56 52 54 53 55 6 3 6 3 9 5 5 4 4 55 52 55 53 57 54 55 53 55 4 8 5 3 3 5 3 4 4 53 57 54 53 50 55 52 53 54 9 8 3 9 5 5 4 5 6 57 56 51 58 55 53 54 53 56

44

ESTADSTICA

LVARO VALENCIA OROZCO

2. RELACIN ENTRE EL SALARIO Y LAS AUSENCIAS DE LAS 50 OBRERAS DE "LA HILACHA" EN EL MES DE OCTUBRE AUSENCIAS SALARIO AUSENCIAS SALARIO AUSENCIAS SALARIO AUSENCIAS SALARIO AUSENCIAS SALARIO 1 3 1 4 2 0 2 1 0 4 52 54 55 54 53 56 54 58 51 54 2 4 0 2 2 1 2 1 3 1 54 51 54 55 54 56 52 54 53 55 3 0 0 2 3 1 3 0 0 1 55 55 52 55 53 57 54 55 53 55 4 1 1 0 2 3 2 2 2 1 56 53 57 54 53 50 55 52 53 54 2 0 1 5 0 5 2 3 2 2 52 57 56 51 58 55 53 54 53 56

3. RELACIN ENTRE LA EDAD Y LOS GASTOS EN EDUCACIN DE LAS 50 OBRERAS DE "LA HILACHA" EDAD GASTOS EDAD GASTOS EDAD GASTOS EDAD GASTOS EDAD GASTOS 24 24 5 6 28 25 3 6 28 31 4 4 33 32 4 6 26 38 11 3

45

ESTADSTICA

LVARO VALENCIA OROZCO

27 25 24 28 29 35 30 27

8 9 3 1 2 0 10 9

27 30 27 36 26 29 26 28

1 1 2 3 2 5 5 4

22 25 25 40 39 38 35 33

7 3 7 3 13 8 8 9

32 31 30 23 30 26 28 27

2 3 6 7 6 6 8 8

38 31 39 36 35 29 28 29

5 6 3 4 2 3 7 3

A pesar de la ilustracin visual que ofrecen las grficas, solo podemos percibir la tendencia, mas no el grado o fortaleza de la relacin, entre la variable independiente X y la variable dependiente Y. Para cuantificar la calidad de la dependencia, entre las dos variables, el indicador ms acostumbrado es el Coeficiente de correlacin, que denotaremos con la letra , que nos permite valorar si sta es fuerte o dbil, positiva o negativa, y que vara entre -1 y 1. Los signos se utilizan para la correlacin lineal positiva y la correlacin lineal negativa, respectivamente. El coeficiente de correlacin lineal est dado por la expresin en donde y

Cuando r toma un valor extremo, ya sea r=1 r=-1 existe una correlacin perfecta positiva o negativa segn el signo, como lo podemos corroborar en el siguiente ejemplo: Aspiracin Salarial, de Acuerdo a La Experiencia de las Obreras de la Fabrica de Confecciones La Hilacha Salario (Miles de $) Y 56 -5 -10 50 25

Experiencia (Aos) X 0

100 46

ESTADSTICA

LVARO VALENCIA OROZCO

1 2 3 4 5 6 7 8 9 10

58 60 62 64 66 68 70 72 74 76

-4 -3 -2 -1 0 1 2 3 4 5

-8 -6 -4 -2 0 2 4 6 8 10

32 18 8 2 0 2 8 18 32 50

16 9 4 1 0 1 4 9 16 25

64 36 16 4 0 4 16 36 64 100

X X 5

55 Y

Y 66

726

xy

220

x2

110

y2

440

Hallemos ahora el coeficiente de correlacin,

220 110 * 440

220 48400

220 1 , Correlacin perfecta positiva 220

Entre la experiencia y el salario actual hay una excelente correlacin positiva. Sin embargo, no todas las relaciones son tan ideales, en el comn de los casos 1< r <1. Empricamente se afirma que: 1. Si 2. Si 3. Si 4. Si 5. Si 6. Si

r 1Correlacin perfecta 0.9 r 1 1 r 0.9 Correlacin excelente 0.8 r 0.9 0.9 r 0.8 Correlacin buena 0.6 r 0.8 0.8 r 0.6 Correlacin regular 0.3 r 0.6 0.6 r 0.3 Correlacin mala 0.3 r 0.3 No hay correlacin

Existen desde luego, pruebas estadsticas que miden la bondad de un coeficiente de correlacin con un determinado nivel de confiabilidad, pero no son tema de este curso. EJERCICIOS 1. La siguiente tabla muestra el ingreso mensual (en cien miles de pesos) por las ventas realizadas (en cien miles de pesos) para un grupo de personas en un periodo determinado: Ventas X 150 201 225 305 370 380 450 510 560 Ingresos Y 15 17 20 21 19 23 21 22 25

47

ESTADSTICA

LVARO VALENCIA OROZCO

600 685 725 735 a. b. c. d. e. 2.

24 27 30 27

Realice el diagrama de dispersin Construir una recta que se aproxime a los datos Hallar la ecuacin de la recta que se aproxime a los datos. Halle el coeficiente de correlacin lineal. Estime el ingreso de una persona cuyas ventas fueron de $50.000.000 Una compaa que tiene 15 tiendas ha recopilado datos en relacin con los metros cuadrados de rea de ventas respecto a los ingresos mensuales. Trace una grfica de los datos, y si parece apropiado un modelo lineal determine la ecuacin de regresin y el coeficiente de correlacin lineal.. Tienda 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Metros 2 X 55 80 85 90 90 110 130 140 180 180 200 200 215 260 300 Ingreso Y 45 60 75 75 80 95 95 110 120 105 115 130 140 170 200

3.

Determine una ecuacin que describa la relacin correlacin lineal X 3.10 4.00 4.40 5.20 6.40 6.50 7.00 8.00 Y 900 800 600 450 500 300 200 150

con su respectivo coeficiente de

48

ESTADSTICA

LVARO VALENCIA OROZCO

4.

Determine una ecuacin predictiva para calcular el monto del seguro, en funcin del ingreso anual con su respectivo coeficiente de correlacin lineal para los siguientes datos: Ingreso Prima X 13 16 17 18 20 25 26 32 38 40 42 Y 5 15 20 10 10 12 15 30 40 50 40

9. TASAS E NDICES Como ya se dijo, el anlisis de un fenmeno basado en las cifras absolutas, ofrece una idea general de su tendencia o comportamiento; pero para efectos de establecer comparaciones adecuadas del mismo fenmeno con otra regin, o su ocurrencia a travs del tiempo, se utilizan ciertos indicadores denominados tasas e ndices. 9.1 TASA Una tasa es la resultante de una fraccin, en donde el numerador est contenido dentro del denominador: Ejemplos: 1. D: Tasa de desercin escolar. R: Nmero de retiros durante el ao. M: Nmero total de matriculados durante el ao. 2. TE: Tasa de empleo. PEAO: Poblacin econmicamente activa ocupada. PEA : Poblacin econmicamente activa. Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual generalmente es 100, 1000 o mltiplos de ellos, con el fin de convertirlos en porcentajes, por millares etc. En demografa, las tasas son de uso frecuente, entre otras, mencionaremos las siguientes: 3. Donde: TM : Tasa de mortalidad. D : Nmero de defunciones en un periodo y rea dada. P : Poblacin total en esa rea a mitad del periodo. 4. 49

ESTADSTICA

LVARO VALENCIA OROZCO

Donde TN : Tasa de natalidad N : Nmero de nacidos vivos ocurridos en un periodo y rea dada P : Poblacin total del rea a mitad del periodo. 5. Donde: TC : Tasa de nupcialidad. M : Nmero de matrimonios efectuados en un periodo y rea dada. P : Total de la poblacin a mitad del periodo. El siguiente cuadro muestra la evolucin de la tasa de desempleo en Colombia, resultados obtenidos de la encuesta nacional de hogares para los periodos comprendidos entre los aos 1.990 2.000 Tasas de Desempleo en Colombia 1.990-2.000 TASA AO 10.1 1995 10.9 10.2 1996 10.6 10.8 10.8 9.8 1997 9.5 10.8 11.2 9.2 1998 9.8 9.7 9.1 7.8 1999 7.8 10.2 9.9 7.6 2000 8.0 8.1 9.0

AO 1990

1991

1992

1993

1994

1995

MES Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio

MES Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre Marzo Junio Septiembre Diciembre

TASA 8.7 9.5 10.2 11.6 12.0 11.3 12.3 13.4 12.1 12.0 14.4 15.9 15.0 15.6 19.5 19.9 20.1 18.0 20.3 20.4 20.5 19.7

9.2 NDICE Un nmero ndice, como comnmente se le llama, es un indicador de los cambios relativos de una o ms variables a travs del tiempo. Entre las principales aplicaciones de los nmeros ndice, est la de establecer comparaciones entre los indicadores de las diferentes zonas geogrficas, profesiones, grupos tnicos etc. Para la construccin de un nmero ndice, se procede ante todo, a fijar el periodo de referencia o "periodo base" de la serie temporal, teniendo presente que debe ser un periodo normal, esto es, que no se hayan presentado situaciones fortuitas (guerras, terremotos, incendios u otro tipo de imprevisto), que incidan en el valor de la variable para ese periodo. Adems debe considerarse un periodo reciente que haga comparables los diferentes valores de las variables consideradas.

50

ESTADSTICA

LVARO VALENCIA OROZCO

9.2.1 ndice Simple Un nmero ndice simple, es aquel que se calcula para una sola variable, dividiendo cada uno de los valores de la serie cronolgica, por el valor correspondiente al "periodo base" previamente definido. 9.2.1.1 ndice de Base Fija , si la variable se refiere a precios , si la variable se refiere a cantidades : ndice de precios : Precio del artculo en el periodo n : Precio del artculo en el periodo base : ndice de cantidades : Cantidad del artculo en el periodo n : Cantidad del artculo en el periodo base Precio Promedio del Kilovatio/Hora 1995-2001 Pagado por la Fabrica de Confecciones La Hilacha PRECIO NDICE Kw/hora 1995 = 100% 9 1.00 12 1.33 15 1.67 19 2.11 24 2.67 30 3.33 37 4.11 Consumo Promedio de Energa en La Fbrica de Confecciones La Hilacha CANTIDAD NDICE Kw/mes 1995 = 100% 3.333,33 1.00 6.666,67 2.00 4.666,667 1.40 6.842,11 2.05 5.833,33 1.75 4.666,67 1.40 4.324,32 1.30

AO 1995 1996 1997 1998 1999 2000 2001

NDICE 1998 = 100% 0.47 0.63 0.79 1.00 1.26 1.58 1.95

AO 1995 1996 1997 1998 1999 2000 2001

NDICE 1998 = 100% 0.49 0.97 0.68 1.00 0.85 0.68 0.63

En la primera tabla hemos calculado los ndices de precios simples, con base en 1995 y 1998 respectivamente, pero no se han tenido en cuenta las cantidades, mientras que en la segunda tabla se han calculado los ndices de cantidades sin considerar los precios. Calculemos, ahora los ndices del valor relativo, que considere tanto los precios como las cantidades:

Precio y Consumo Promedio de Energa en 51

ESTADSTICA

LVARO VALENCIA OROZCO

AO 1995 1996 1997 1998 1999 2000 2001

PRECIO Kw/h 9 12 15 19 24 30 37

La Fbrica de Confecciones La Hilacha CANTIDAD NDICE Kw/mes pq 1995 = 100% 3.333,33 30.000 1.00 6.666,67 80.000 2.67 4.666,67 70.000 2.33 6.842,11 130.000 4.33 5.833,33 140.000 4.67 4.666,67 140.000 4.67 4.324,32 160.000 5.33

NDICE 1998 = 100% 0.23 0.62 0.54 1.00 1.08 1.08 1.23

9.2.1.2 ndice de Base Mvil Solo hemos considerado, los ndices simples de base fija, esto es, con un periodo base determinado. Es comn que interese comparar un ndice con el ndice del periodo inmediatamente anterior, en consecuencia se debe fijar el periodo base en el periodo anterior al referenciado, y as sucesivamente hasta completar la serie, al cual se le nombra ndice de base mvil. Variaciones del Salario Promedio Diario en La Fbrica de Confecciones La Hilacha MILES NDICE NDICE AO $/da 1995 = 100% 100% = ao VARIACIN anterior 1995 18.70 1.00 1996 23.80 1.27 1.27 0.273 1997 30.80 1.65 1.29 0.297 1998 38.50 2.06 1.25 0.250 1999 47.00 2.51 1.22 0.221 2000 50.20 2.68 1.07 0.068 2001 54.10 2.89 1.08 0.078 9.2.2 ndices Compuestos (Globales) Un nmero ndice compuesto, muestra los cambios de un conjunto de variables, aunque sus unidades de medidas, cantidades y precios, en el tiempo, sean diferentes entre s. Cuando hablamos por ejemplo de los ndices indicadores del costo de la canasta familiar, se toman en cuenta muchos artculos cuyos consumos inciden en el costo de vida, con una ponderacin o importancia diferente en cada caso. Colectivamente no es lo mismo un cambio en el precio de la carne, huevos o leche, que un cambio en el precio de los perfumes, joyas o cualquier otro artculo suntuoso. 9.2.2.1 ndice de Laspeyres Este ndice asume como ponderaciones, en el clculo del ndice global, las cantidades de los artculos en el periodo base.

Donde: : ndice de precios global (Laspeyres). : Cantidad del periodo base. : Precio del artculo en el periodo base : Precio del artculo en el periodo n ndice de Precios de Cuatro Artculos Valor de Precios 1998 1999 2000 2001 1998 1999 a los precios de 2000 2001 52

Cantidad Ao 1998

ESTADSTICA

LVARO VALENCIA OROZCO

Artculo A B C D Sumas ndice

5 10 15 20

10 20 10 25

12 24 10 27

14 25 11 28

15 25 12 30

50 200 150 500 900 1.00

60 240 150 540 990 1.10

70 250 165 560 1045 1.16

75 250 180 600 1105 1.23

9.2.2.2 ndice de Paasche El estadstico Paasche, sugiere que las ponderaciones sean las cantidades utilizadas en el periodo n. Se obtiene entonces el siguiente indicador:

Este ndice, es poco utilizado debido al dinamismo de que se cambia de periodo.

, necesitando nuevas ponderaciones cada vez

9.2.2.3 ndice ideal de Fisher Se propone el promedio geomtrico entre los dos ndices anteriores:

Una de las principales aplicaciones de los ndices de precios, es la de medir la deflacin e inflacin, que es la variacin que existe en el poder adquisitivo del dinero. Tambin podemos utilizar, los ndices de precios al consumidor para determinar el salario real de un grupo de personas.

AOS 1994 1995 1996 1997 1998 1999 2000

Salario Promedio Nominal y Real en la Fabrica La Hilacha NDICE VARIACIN MILES/DA 1998 = 100% ANUAL NOMINAL 50.10 22.59 18.7 59.86 19.46 23.8 72.81 21.63 30.8 85.69 17.68 38.5 100.00 16.70 47.0 109.27 9.23 50.2 118.79 7.81 54.1

MILES/DA REAL 37.32 39.76 42.30 44.93 47.00 45.94 45.54

Dado el deterioro del salario real en los dos ltimos aos debera considerarse un generoso aumento. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Qu es una tasa? 2. Qu es un ndice? 3. Para qu se utilizan los nmeros ndices? 4. Cmo se construye un nmero ndice simple? 5. Cmo se construye un nmero ndice compuesto?

53

ESTADSTICA

LVARO VALENCIA OROZCO

6. Los precios y las cantidades de un artculo X vienen dados en la siguiente tabla: AO 1995 1996 1997 1998 1999 2000 PRECIOI 1200 1500 1800 2200 2600 3000 CANTIDAD 400 400 410 430 430 440

Tomando como ao base 1995, calcular para los otros aos: 6.1 Los ndices de precios. 6.2 Los ndices de cantidades. 6.3 Los ndices de valores. 7. A continuacin se relacionan los precios y las cantidades del ao base, de cuatro artculos diferentes: CANTIDAD AO ARTCULO A B C D 1997 180 100 400 120 1997 200 50 100 20 1998 250 60 120 30 PRECIOS 1999 300 70 130 30 2000 350 80 150 40 2001 400 90 180 40

Calcular el ndice de Laspeyres 8. Salario Mnimo Legal Diario en Colombia e ndice de Precios al Consumidor para el Ao 2.000-2001 (Periodo Base Diciembre de 1998). MES VALOR NDICE SALARIO NOMINAL 1 110.64 260000 2 113.19 260000 3 115.12 260000 4 116.27 260000 5 116.88 260000 6 116.85 260000 7 116.81 260000 8 117.18 260000 9 117.68 260000 10 117.86 260000 11 118.24 260000 12 118.79 260000 1 120.04 286000 2 122.31 286000 3 124.12 286000 4 125.54 286000 5 126.07 286000 6 126.12 286000

AO 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2000 2001 2001 2001 2001 2001 2001

Calcular el salario real para cada uno de los meses.

54

ESTADSTICA

LVARO VALENCIA OROZCO

10. PROBABILIDAD INTRODUCCIN La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento. Ejemplo: tiramos un dado al aire y queremos saber cul es la probabilidad de que salga un 2, o que salga un nmero par, o que salga un nmero menor que 4. El experimento tiene que ser aleatorio, es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto an realizando el experimento en las mismas condiciones. Por lo tanto, a priori no se conoce cul de los resultados se va a presentar: Ejemplos: lanzamos una moneda al aire: el resultado puede ser cara o sello, pero no sabemos de antemano cul de ellos va a salir. Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas de la probabilidad. Ejemplo: en lugar de tirar la moneda al aire, directamente seleccionamos la cara. Aqu no podemos hablar de probabilidades, sino que ha sido un resultado determinado por uno mismo. Antes de calcular las probabilidades de un experimento aleatorio hay que definir una serie de conceptos: Suceso elemental: hace referencia a cada una de las posibles soluciones que se pueden presentar. Ejemplo: al lanzar una moneda al aire, los sucesos elementales son la cara y el sello. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6 Suceso compuesto: es un subconjunto de sucesos elementales. Ejemplo: lanzamos un dado y queremos que salga un nmero par. El suceso "numero par" es un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6 O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un suceso compuesto formado por 18 sucesos elementales (todos los nmeros que van del 1 al 18). Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). Ejemplo: si tiramos una moneda al are una sola vez, el espacio muestral ser cara o sello. Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio muestral estara formado por (cara-cara), (cara-sello), (sello-cara) y (sello-sello). RELACIN ENTRE SUCESOS Entre los sucesos compuestos se pueden establecer distintas relaciones: a) Un suceso puede estar contenido en otro: las posibles soluciones del primer suceso tambin lo son del segundo, pero este segundo suceso tiene adems otras soluciones suyas propias. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un nmero par. Vemos que el suceso a) est contenido en el suceso b). Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el resultado fuera el 2, se cumplira el suceso b), pero no el a). b) Dos sucesos pueden ser iguales: esto ocurre cuando siempre que se cumple uno de ellos se cumple obligatoriamente el otro y viceversa. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que salga mltiplo de 2. Vemos que las soluciones coinciden en ambos casos. c) Unin de dos o ms sucesos: la unin ser otro suceso formado por todos los elementos de los sucesos que se unen.

55

ESTADSTICA

LVARO VALENCIA OROZCO

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6 d) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de dos o ms sucesos que se intersecan. Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a) que salga nmero par, y b) que sea mayor que 4. La interseccin de estos dos sucesos tiene un slo elemento, el nmero 6 (es el nico resultado comn a ambos sucesos: es mayor que 4 y es nmero par). e) Sucesos incompatibles: son aquellos que no se pueden dar al mismo tiempo ya que no tienen elementos comunes (su interseccin es el conjunto vacio). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. Es evidente que ambos no se pueden dar al mismo tiempo. f) Sucesos complementarios: son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero par, y b) que salga un nmero impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa). CLCULO DE PROBABILIDADES Probabilidad Como hemos comentado anteriormente, la probabilidad mide la mayor o menor posibilidad de que se d un determinado resultado (suceso) cuando se realiza un experimento aleatorio. La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible : lanzamos un dado al aire y la probabilidad de que salga el nmero 7 es cero (al menos, si es un dado certificado por la OMD, "Organizacin Mundial de Dados"). El valor uno corresponde al suceso seguro: lanzamos un dado al aire y la probabilidad de que salga cualquier nmero del 1 al 6 es igual a uno (100%). El resto de sucesos tendr probabilidades entre cero y uno : que ser tanto mayor cuanto ms probable sea que dicho suceso tenga lugar. Cmo se mide la probabilidad? Uno de los mtodos ms utilizados es aplicando la Regla de Laplace: define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles.

Veamos algunos ejemplos: a) Probabilidad de que al lanzar un dado salga el nmero 2 : el caso favorable es tan slo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier nmero del uno al seis). Por lo tanto: (o lo que es lo mismo, 16,7% aproximadamente) b) Probabilidad de que al lanzar un dado salga un nmero par : en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto: (o lo que es lo mismo, 50%) c) Probabilidad de que al lanzar un dado salga un nmero menor que 5 : en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los seis casos posibles. Por lo tanto: (o lo que es lo mismo, 66,7% aproximadamente)

56

ESTADSTICA

LVARO VALENCIA OROZCO

Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos: a) El nmero de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sera cero. b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podramos aplicar esta regla. A la regla de Laplace tambin se le denomina "probabilidad a priori", ya que para aplicarla hay que conocer antes de realizar el experimento cuales son los posibles resultados y saber que todos tienen las mismas probabilidades. Y si el experimento aleatorio no cumple los dos requisitos indicados, qu hacemos?, En este caso podemos acudir a otro modelo de clculo de probabilidades que se basa en la experiencia (modelo frecuentista): Cuando se realiza un experimento aleatorio un nmero muy elevado de veces, las probabilidades de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas probabilidades. Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha aparecido el 100% de las veces y el suceso "sello" el 0%. Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el suceso "sello" las 3 restantes. En este caso, la probabilidad del suceso "cara" ya no sera del 100%, sino que se habra reducido al 70%. Si repito este experimento un nmero elevado de veces, lo normal es que las probabilidades de los sucesos "cara" y "sello" se vayan aproximando al 50% cada una. Este 50% ser la probabilidad de estos sucesos segn el modelo frecuentista. En este modelo ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad. Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada), es posible que al repetir dicho experimento un nmero elevado de veces, la "cara" saliera con una frecuencia, por ejemplo, del 65% y el "sello" del 35%. Estos valores seran las probabilidades de estos dos sucesos segn el modelo frecuentista. A esta definicin de la probabilidad se le denomina probabilidad a posteriori, ya que tan slo repitiendo un experimento un nmero elevado de veces podremos saber cul es la probabilidad de cada suceso. PROBABILIDAD DE SUCESOS Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre s, as como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo de probabilidades. a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso ser menor que la del suceso que lo contiene. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6, y b) que salga un nmero par. Dijimos que el suceso a) est contenido en el suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50 Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos sucesos son las mismas. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que salga mltiplo de 2. Las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 c) Interseccin de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o ms sucesos que se intersecan. La probabilidad ser igual a la probabilidad de los elementos comunes. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que sea mayor que 3. La interseccin de estos dos sucesos tiene dos elementos: el 4 y el 6. 57

ESTADSTICA

LVARO VALENCIA OROZCO

Su probabilidad ser por tanto:

d) Unin de dos o ms sucesos: la probabilidad de la unin de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso interseccin Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos incompatibles ser igual a la suma de las probabilidades de cada uno de los sucesos (ya que su interseccin es el conjunto vacio y por lo tanto no hay que restarle nada). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166 Por lo tanto, f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A) Ejemplo: lanzamos un dado al aire. El suceso (A) es que salga un nmero par, luego su complementario, suceso (B), es que salga un nmero impar. La probabilidad del suceso (A) es igual a : P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 g) Unin de sucesos complementarios: la probabilidad de la unin de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que salga un nmero impar. La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, P(A U B) = 0,50 + 0,50 = 1 COMBINACIONES, VARIACIONES Y PERMUTACIONES Para aplicar la Regla de Laplace, el clculo de los sucesos favorables y de los sucesos posibles a veces no plantea ningn problema, ya que son un nmero reducido y se pueden calcular con facilidad: Por ejemplo: Probabilidad de que al lanzar un dado salga el nmero 2. Tan slo hay un caso favorable, mientras que los casos posibles son seis. Probabilidad de acertar al primer intento el horscopo de una persona. Hay un caso favorable y 12 casos posibles. 58

ESTADSTICA

LVARO VALENCIA OROZCO

Sin embargo, a veces calcular el nmero de casos favorables y casos posibles es complejo y hay que aplicar reglas matemticas: Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten juntos. En este caso, determinar el nmero de casos favorables y de casos posibles es complejo. Las reglas matemticas que nos pueden ayudar son el clculo de combinaciones, el clculo de variaciones y el clculo de permutaciones. a) Combinaciones: Se llama combinaciones de m elementos tomados de n en n (m > n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. No importa el orden. No se repiten los elementos. Determinar el nmero de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Por ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar con los nmeros 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el clculo de combinaciones las parejas (1,2) y (2,1) se consideran idnticas, por lo que slo se cuentan una vez. b) Variaciones: Se llama variaciones de m elementos tomados de n en n (m > n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. Si importa el orden. No se repiten los elementos. Calcular el nmero de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con los nmeros 1, 2 y 3. Ahora tendramos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. c) Permutaciones: Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de esos m elementos de forma que: S entran todos los elementos. S importa el orden. No se repiten los elementos Calcular las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Por ejemplo, calcular las posibles formas en que se pueden ordenar los nmeros 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1) Cmo se calculan? a) Combinaciones: Para calcular el nmero de combinaciones se aplica la siguiente frmula:

El trmino " n ! " se denomina "factorial de n" y es la multiplicacin de todos los nmeros que van desde "n" hasta 1. Por ejemplo: 4 ! = 4 * 3 * 2 * 1 = 24 La expresin "Cm,n" representa las combinaciones de "m" elementos, formando subgrupos de "n" elementos.

59

ESTADSTICA

LVARO VALENCIA OROZCO

Ejemplo: elementos:

son las combinaciones de 10 elementos agrupndolos en subgrupos de 4

Es decir, podramos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. b) Variaciones: Para calcular el nmero de variaciones se aplica la siguiente frmula:

La expresin "Vm,n" representa las variaciones de "m" elementos, formando subgrupos de "n" elementos. En este caso, un subgrupo se diferenciar del resto, bien por los elementos que lo forman, o bien por el orden de dichos elementos. Ejemplo: son las variaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:

Es decir, podramos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. c) Permutaciones: Para calcular el nmero de permutaciones se aplica la siguiente frmula:

La expresin "Pm" representa las permutaciones de "m" elementos, tomando todos los elementos. Los subgrupos se diferenciaran nicamente por el orden de los elementos. Ejemplo: P10 son las permutaciones de 10 elementos:

Es decir, tendramos 3.628.800 formas diferentes de agrupar 10 elementos. Vamos a analizar ahora que ocurrira con el clculo de las combinaciones, de las variaciones o de las permutaciones en el supuesto de que al formar los subgrupos los elementos pudieran repetirse. Por ejemplo: tenemos bolas de 6 colores diferentes y queremos formar subgrupos en los que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo tuvieran el mismo color. En este caso no podramos utilizar las frmulas que vimos anteriormente. a) Combinaciones con repeticin: Se llama combinaciones de m elementos tomados de n en n (m > n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. No importa el orden. S se repiten los elementos. Para calcular el nmero de combinaciones con repeticin se aplica la siguiente frmula:

Ejemplo: C'10,4 =10C'4 son las combinaciones de 10 elementos con repeticin, agrupndolos en subgrupos de 4, en los que 2, 3 o los 4 elementos podran estar repetidos:

60

ESTADSTICA

LVARO VALENCIA OROZCO

Es decir, podramos formar 715 subgrupos diferentes de 4 elementos. b) Variaciones con repeticin: Se llama variaciones con repeticin de m elementos tomados de n en n a los distintos grupos formados por n elementos de manera que: No entran todos los elementos si m > n. Pueden entrar todos los elementos si m = n. S importa el orden. S se repiten los elementos. Para calcular el nmero de variaciones con repeticin se aplica la siguiente frmula:

Ejemplo: V'10,4 = 10 V'4 son las variaciones de 10 elementos con repeticin, agrupndolos en subgrupos de 4 elementos: Es decir, podramos formar 10.000 subgrupos diferentes de 4 elementos. c) Permutaciones con repeticin: Permutaciones con repeticin de m elementos donde el primer elemento se repite a veces, el segundo b veces, el tercero c veces, ...(m = a + b + c + ... = n) son los distintos grupos que pueden formarse con esos m elementos de forma que : S entran todos los elementos. S importa el orden. S se repiten los elementos. Para calcular el nmero de permutaciones con repeticin se aplica la siguiente frmula:

Son permutaciones de "m" elementos, en los que uno de ellos se repite " x 1 " veces, otro " x2 " veces y as ... hasta uno que se repite " xk " veces. Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y otro se repite en 3 ocasiones:

Es decir, tendramos 302,400 formas diferentes de agrupar estos 10 elementos. EJERCICIOS RESUELTOS Ejemplo 1: Rutas de viaje Dos caminos unen a las ciudades A y B, cuatro unen a B y C, y cinco unen a las ciudades C y D. Para conducir de A a B, luego a C y por ltimo a D, Cuntas rutas diferentes son posibles? Este es un proceso por etapas. La primera de AB tiene dos posibilidades, la segunda de BC tiene cuatro y la tercera de CD tiene cinco. Por el principio multiplicativo de conteo, el nmero total de rutas es 2 x 4 x 5 = 40. Ejemplo 2: Respuestas de examen De cuntas maneras puede ser respondido un examen bajo cada una de las siguientes condiciones? a. El examen consiste en tres preguntas de opcin mltiple con cuatro opciones para cada una. Responder de manera sucesiva las tres preguntas es un proceso de tres etapas. La primera pregunta puede ser respondida de cualquiera de cuatro formas. Del mismo modo, cada una de las otras preguntas puede ser respondida en cuatro formas. Por el principio multiplicativo de conteo el nmero de maneras para responder el examen es: 4 x 4 x 4 = 4^3 = 64.. b. El examen consiste en tres preguntas de opcin mltiple (con cuatro opciones para cada una) y cinco preguntas de falso-verdadero. Responder el examen puede ser considerado como un proceso de dos etapas. Primero podemos responder las preguntas de opcin mltiple (sta es la primera etapa), y despus responder las preguntas de falso-verdadero (la segunda etapa). 61

ESTADSTICA

LVARO VALENCIA OROZCO

De la parte (a), las preguntas de opcin mltiple pueden ser respondidas de 64 formas. Cada una de las preguntas de falso-verdadero tiene dos opciones (falso o verdadero), de modo que el nmero total de maneras de responder las cinco preguntas es 2 x 2 x 2 x 2 x 2. Por el principio multiplicativo de conteo, el nmero de maneras en que todo el examen puede ser respondido es: (4 x 4 x 4)( 2 x 2 x 2 x 2 x 2) = 4^3 x 2^5 = 2.048. Ejemplo 3: Funcionarios de un club Un club tiene 20 miembros. Los cargos de presidente, vicepresidente, secretario y tesorero deben ser cubiertos y ningn miembro puede servir en ms de un cargo. Cuntas listas diferentes de candidatos son posibles? Consideremos una lista de candidatos en el orden de presidente, vicepresidente, secretario y tesorero. Cada ordenamiento de cuatro candidatos constituye una lista de candidatos, de modo que el nmero de posibles listas 20V4. De la ecuacin de variacin tenemos:

Ejemplo 4: Placas de automvil En Colombia, las placas de los autos tienen 3 letras seguidas de 3 dgitos. Cuntas placas se pueden hacer si: a. Se permite repetir letras. Se pueden hacer elecciones, una por cada letra o por cada dgito. Tracemos un cuadro para cada etapa: 26 26 26 10 10 10 Letras Dgitos En la primera etapa se elige una letra de 26 posibles; en la segunda etapa, otra letra (de nuevo entre 26 opciones); en la tercera etapa, otra letra (26 opciones); en la cuarta un digito de 10 posibles; en la quinta, un dgito (de nuevo de entre 10 opciones) y en la sexta etapa, otro digito (10 opciones). Segn el principio multiplicativo de conteo, la cantidad de placas distintas es: 26 x 26 x 26 x 10 x 10 x 10 = 17.576.000 b. No se permite repetir letras Si no se permite repetir letras, las opciones se pueden representar como sigue: 26 25 24 10 10 10 Letras Dgitos En la primera etapa tenemos 26 letras para elegir, pero una vez seleccionada la primera letra, solo quedan 25 para elegir en la segunda etapa. Una vez elegidas las dos primeras, quedan 24 para elegir en la tercera etapa. Los dgitos se determinan como antes. As, la cantidad de placas distintas en este caso es: 26 x 25 x 24 x 10 x 10 x 10 = 15.600.000 Ejemplo 5: Los seis corredores De cuantas formas distintas puede terminar una competencia entre seis corredores? (Suponga que no hay empates.) Hay seis opciones distintas para el primer lugar, cinco para el segundo, porque despus de haberse decidido el primer lugar solo quedan cinco corredores, hay cuatro opciones para el tercer lugar, y as sucesivamente. De acuerdo con el principio multiplicativo, la cantidad de opciones distintas en la que puede terminar esta carrera es: 6! = 6 x 5 x 4 x 3 x 2 x 1 = 720 Ejemplo 6: Las pelotas Calcule el nmero de formas distintas en que se pueden colocar 15 pelotas en una fila, si cuatro son rojas, tres son amarillas, seis son negras y dos son azules. Se trata de determinar el nmero de

62

ESTADSTICA

LVARO VALENCIA OROZCO

permutaciones distinguibles de esas pelotas. De acuerdo con la frmula de permutacin con repeticin, ese nmero es:

Ejemplo 7: Miembros del club Un club tiene nueve miembros, De cuantas formas se puede elegir un comit de tres miembros entre los nueve del club? Se necesita calcular el nmero de formas de elegir tres miembros de los nueve. En este caso no importa el orden, porque el comit ser igual sin importar como se ordenan sus miembros. As, se desea conocer el nmero de combinaciones de nueve objetos (los miembros del club) tomados de tres en tres. El nmero es:

Ejemplo 8: Carrera de caballos Calcular la probabilidad de, en una carrera de 12 caballos, acertar los 3 que quedan primeros (sin importar cul de ellos queda primero, cual segundo y cual tercero). Se aplica la Regla de Laplace. El caso favorable es tan slo uno: los 3 caballos que entran en primer lugar. Los casos posibles se calculan como combinaciones de 12 elementos tomados de 3 en 3 (es decir, determinamos todos las posibles alternativas de 3 caballos que pueden entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros caballos no importa, utilizamos combinaciones en lugar de variaciones. Por lo tanto, los casos posibles son:

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Ejemplo 9: Carrera de caballos Y si hubiera que acertar, no slo los 3 caballos que ganan, sino el orden de su entrada en meta. El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados en su orden correspondiente. Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 12 elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12 caballos podran ocupar las 3 primeras posiciones.

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Menor que en el ejemplo 8. Ya que no vale acertar que 3 caballos entran en primer lugar, sino que tenemos que acertar el orden de su entrada. 1. EJERCICIOS Determine la probabilidad p, o un estimador de ella, para cada uno de los siguientes sucesos: a. La aparicin de un nmero impar en la tirada de un dado equilibrado. b. La aparicin de al menos una cara en dos lanzamientos de una moneda. c. La obtencin de 7 puntos en una sola tirada de un par de dados. De una caja que contiene 6 bolas rojas, 4 blancas y 5 azules se extrae una al azar. Determine la probabilidad de que sea Roja. Blanca. Azul. 63

2.

ESTADSTICA

LVARO VALENCIA OROZCO

No roja Roja o blanca. 3. Se lanza un dado dos veces. Hallar la probabilidad de obtener 4, 5 6 en el primero y 1, 2, 3 4 en el segundo. 4. Se extraen sucesivamente tres bolas de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. De termine la probabilidad de que sean extradas en el orden roja, blanca y azul si las extracciones son: a) con reemplazamiento y b) sin reemplazamiento. 5. Halle la probabilidad de obtener al menos un 4 en dos lanzamientos de un dado. 6. Una bolsa contiene 4 bolas blancas y 2 bolas negras; otra contiene 3 bolas blancas y 5 bolas negras. Si se extrae una bola de cada bolsa, halle la probabilidad de que a) ambas bolas sean blancas b) ambas bolas sean negras c) una sea blanca y la otra negra d) una sea negra y la otra blanca. 7. Un monedero contiene 2 monedas de plata y 4 monedas de cobre, y un segundo monedero contiene 4 monedas de plata y 3 de cobre. Si se elige al azar una moneda de cada monedero, cul es la probabilidad de que una sea de plata?. 8. De un total de 800 familias con 4 hijos cada una, qu porcentaje cabe esperar que tenga a) 2 nias y 2 nios, b) al menos 1 nio, c) ninguna nia, d) a lo sumo 2 nias. 9. La probabilidad de que un hombre viva dentro de 25 aos es 3/5 y la probabilidad de que una mujer viva dentro de 25 aos es 2/3. Halle la probabilidad de que dentro de 25 aos: a) ambos vivan, b) viva solamente el hombre, c) viva solamente la mujer y d) al menos uno viva. 10. Determine la probabilidad o un estimador de ella para el suceso un cerrojo no defectuoso a extraer de una poblacin, si de 600 ya examinados, 12 fueron defectuosos.

64

Вам также может понравиться