Вы находитесь на странице: 1из 239

ESTADSTICA BSICA

Ing. Coln Govea L., M.Sc.

PREFACIO

El libro Estadstica Bsica ha sido desarrollado con el propsito de coadyuvar al aprendizaje de la estadstica. Se ha estructurado en forma sencilla, con el propsito de inducir en el estudiante y lector un conocimiento prctico de ciertos fundamentos estadsticos que se detallan en forma muy ampliada en otras publicaciones, pero que aqu, se justifica su concrecin por los siguientes motivos. a. Entregar una publicacin en forma comprensible an para los que no poseen una slida formacin estadstica.

b. Presentar procedimientos sistematizados y simplificados en la resolucin de los clculos numricos.


c. Introducir al alumno en la comprensin de la

necesidad y oportunidad de la aplicacin de procedimientos estadsticos no slo en la ciencia sino tambin en la tecnologa y en las distintas ramas del saber. En el desarrollo de los contenidos, de ninguna manera se prescinde del rigor cientfico, que para efectos de una investigacin ms profunda debe considerarse. El propsito
2

es proporcionar al estudiante una obra de consulta prctica y objetiva de los fundamentos y mtodos matemticos, que puedan convencerlo de que se trata de una materia que puede aprender y llegar a dominar para la solucin de sus problemas profesionales.

CONTENIDO Pg.
1.0 INTRODUCCIN A LA ESTADSTICA

1.1 Estadstica Descriptiva 1.2 Estadstica Inferencial 1.3 Poblacin 1.4 Muestra 2.0 TIPOS DE VARIABLES. 2.1 Variables y Atributos 3.0 DATOS ESTADSTICOS 3.1 Ordenacin de datos por agrupacin 3.1.1 Distribucin de frecuencias. 3.2 Tabla de Frecuencia Tipo A 3.3 Ordenacin de los datos por agrupacin 3.4 Tabla de Frecuencia Tipo B 3.5 Distribucin de frecuencias por agrupacin 3.6 Caractersticas de las tablas tipo B 4.0 GRAFICAS DE FRECUENCIAS. 4.1 El histograma 4.2 El polgono de frecuencias 4.3 Las barras 4.4 Los grficos circulares 4.5 Las curvas 5.0 MEDIDAS DE TENDENCIA CENTRAL 5.1 Media aritmtica 5.1.1 Media aritmtica simple sin agrupar. 5.1.2 Media aritmtica de una serie estadstica
4

1 3 6 7 8 11 11 19 20 21 23 26 28 29 33 36 36 38 39 41 41 43 43 45 46

Pg. 5.1.3 Media aritmtica con datos agrupados 5.2 Mediana. 5.3 Moda 5.4 Media Geomtrica 5.5 Media armnica 5.6 Media Cuadrtica 6.0 MEDIDAS DE POSICIN 6.1 Cuartiles 6.2 Deciles 6.3 Percentiles 7.0 MEDIDAS DE DISPERSIN 7.1 Recorrido. 7.2 Desviacin Media 7.3 Varianza 7.4 Desviacin Estndar 7.4.1 Desviacin tpica de una serie estadstica 7.4.2 Desviacin tpica de frecuencias 7.4.3 Desviacin tpica de una serie de intervalo 7.5 Coeficiente de Variacin 8.0 MEDIDAS DE DISTRIBUCIN 8.1 Asimetra 8.2 Coeficiente de Curtosis 9.0 ANLISIS DE ASOCIACIN 9.1 Covariancia 9.2 Correlacin 9.2.1 Diagrama de Puntos o dispersin
5

47 54 58 62 63 64 68 69 72 77 81 82 82 87 88 89 90 91 93 97 97 100 104 105 107 108

Pg. 9.3 Regresin Lineal Simple 9.4 La Regresin como ecuacin predictiva 10.0 Anlisis de varianza de la regresin simple 11.0 PROBABILIDAD 11.1 Espacio Muestral 11.2 Suceso o Evento 11.2.1 Tipos de sucesos o eventos 11.3 Probabilidad de sucesos 11.3.1 Suceso contenido en otro 11.3.2 Igualdad de sucesos 11.3.3 Unin de dos o ms sucesos 11.3.4 Interseccin de sucesos 11.3.5 Sucesos incompatibles 11.3.6 Sucesos complementarios o contrarios 11.3.7 Unin de sucesos complementarios 12.0 CLCULO DE PROBABILIDADES 12.1 Medicin de la probabilidad 13.0 PERMUTACIONES, COMBINACIONES, VARIACIONES 13.1 Permutaciones 13.2 Combinaciones 13.3 Variaciones 13.4 Combinaciones, Variacin , Permutaciones 14.0 PROBABILIDAD CONDICIONADA
6

112 120 121 129 133 137 138 139 139 140 131 142 143 144 145 147 148 154 155 156 162 163 170

Pg. 15.0 PROBABILIDAD COMPUESTA 16.0 TEOREMA LA PROBABILIDAD TOTAL 17.0 TEOREMA DE BAYES 18.0 INDEPENDENCIA DE SUCESOS 19.0 DISTRIBUCIONES DE PROBABILIDAD 19.1 Distribuciones discretas y continuas 19.1.1. Distribuciones discretas: Bernoulli 19.1.2 Distribuciones discretas: Binomial 19.1.3 Distribuciones discretas: Poisson 19.1.4 Distribuciones Hipergeomtrica 19.1.5 Distribuciones discretas: Multinomial 19.1.6 Distribuciones Multihipergeomtrica 19.1.7 Distribuciones continuas: Uniforme 19.1.8 Distribuciones continuas: Normal 179 182 185 188 191 191 192 195 199 204 208 210 213 216

1.0 INTRODUCCIN A LA ESTADSTICA

Es la ciencia que estudia el comportamiento de los fenmenos de masa e investiga las caractersticas generales de un colectivo prescindiendo de las particularidades que tuvieran cada uno de sus elementos. No se detiene a analizar el comportamiento de un caso aislado; estudia siempre grupos, conjuntos o colectivos de casos. Existen casos de datos donde con frecuencia se encuentran fenmenos en que no es posible predecir el resultado de un caso aislado. Por ejemplo, una investigacin usa el trmino de poblacin para definir el grupo de vehculos a motor matriculados. Una investigacin sobre los efectos de las emisiones gaseosas en la generacin de tumores carcingenos, definir su poblacin en relacin a la totalidad de personas que trabajan en las industrias de hidrocarburos. Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica, debido al gran campo de aplicacin que posee. La Estadstica no analiza el comportamiento de un caso aislado; estudia siempre grupos, conjuntos o colectivos de casos. Si estadsticamente se desea analizar un nmero de repuestos defectuosos que recibe un taller de reparaciones, la estadstica inicia su trabajo seleccionando y examinando
8

un grupo numeroso de unidades y obtiene despus, la proporcin de repuestos defectuosos. En muchas ocasiones, cuando no se puede predecir el resultado de casos aislados, se afirma que el resultado depende del azar o que es concretamente aleatorio. La Estadstica tiene como propsito describir los fenmenos, tales como, realizar predicciones o inferencias sobre ellos. En el primer caso se aplica la Estadstica Descriptiva y en el segundo, se usa la Inferencia Estadstica.

Entre otros conceptos la Estadstica cita los siguientes: La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples llamados individuales o particulares. (Gini, 1953). Murria R. Spiegel, (1991) dice: La estadstica estudia los mtodos cientficos para recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones razonables basadas en tal anlisis.

La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los fenmenos. (Yale y Kendal, 1954). Establecer una definicin para la estadstica resulta difcil. El concepto de Estadstica y sus aplicaciones directas o indirectas es muy amplio. En todo caso, a la Estadstica incumbe la recogida, ordenacin, resumen y anlisis de cualquier tipo de conjunto de datos o colectivos, lo que significa que no tiene sentido pensar en un dato aislado o individual como terreno de trabajo de la Estadstica, siempre analiza un grupo de elementos (personas, animales, cosas, experimentos, etc.)

1.1 Estadstica Descriptiva Comprende el anlisis y descripcin de un conjunto de datos, para obtener conclusiones sobre las caractersticas y sus relaciones existentes con otras poblaciones, a fin de compararlas. La estadstica descriptiva tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La observacin de los elementos de una poblacin puede ser exhaustiva o parcial. Es exhaustiva cuando la observacin se refiere a uno o todos los elementos de la
10

poblacin; y, es observacin parcial, cuando se refiere a la descripcin de los elementos de una muestra. La estadstica descriptiva considera en su anlisis las siguientes etapas: a) Recoleccin de datos b) Organizacin de datos Tabulacin Graficacin c) Anlisis y medicin de datos. Recoleccin de datos. En la recoleccin de datos se consideran los siguientes conceptos bsicos: Poblacin: conjunto de observaciones efectuadas Individuo: cada elemento de la poblacin. Atributo: es la caracterstica que se investiga; puede ser cualitativa como la calidad, condicin, sexo, religin, nacionalidad; o cuantitativa, como la resistencia, dureza, estatura, peso, superficie. Por ejemplo: Se aplica un estudio estadstico para investigar la resistencia a la traccin de unos grilletes. Poblacin: conjunto de grilletes. Individuo: cada grillete Atributo: la resistencia a la traccin.
11

Organizacin de los datos Puede hacerse por medio de la Tabulacin a travs de una serie simple, o a travs de la agrupacin de datos, este mtodo se utiliza cuando el nmero de observaciones es muy grande. La organizacin de los datos puede hacerse tambin a travs de los grficos de barras, sectores circulares, mapas, curvas. Los grficos permiten visualizar e interpretar en forma ms clara el fenmeno que se estudia. Anlisis y medicin de datos Bajo este procedimiento se puede describir un conjunto de datos y calcular algunas medidas que resumen la informacin y que permiten establecer comparaciones. El anlisis y medicin de datos se logra con el empleo de las medidas de posicin, entre ellas, la media aritmtica, la moda y la mediana. Tambin pueden utilizarse las medidas de dispersin como la varianza y desviacin estndar, las cuales, nos dan informacin de la forma cmo estn distribuidos los datos.

12

1.2 Estadstica Inferencial Se fundamenta en el anlisis de los resultados de una muestra para inducir o inferir el comportamiento o caracterstica de la poblacin a que pertenece. Infiere propiedades de gran nmero de datos recogidos de una muestra tomada de la poblacin. De acuerdo con Berenson y Levine; Estadstica Inferencial son procedimientos estadsticos que sirven para deducir o inferir algo acerca de un conjunto de datos numricos (poblacin), seleccionando un grupo menor de ellos (muestra). Para establecer una diferencia entre la estadstica descriptiva y la inferencial, tenemos el siguiente ejemplo: Un ingeniero calcula el promedio del consumo de gasolina por recorrido de un grupo automotor. En este caso, la estadstica por no describir el rendimiento del grupo y por no hacer ninguna generalizacin de los diferentes grupos, estara utilizando la estadstica descriptiva. Por el contrario, si el ingeniero decide utilizar el promedio del consumo obtenido por uno de sus grupos para estimar el consumo promedio en relacin a otros grupos, entonces, el proceso de estimacin del promedio

13

sera un problema concerniente a la estadstica inferencial. 1.3 Poblacin Segn Levin & Rubin (1996) Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. El anlisis estadstico siempre se refiere a un conjunto de personas o cosas que denomina poblacin; el trmino poblacin tiene un amplio significado y puede referirse a personas, objetos, actos, reas geogrficas e inclusive al tiempo. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. Las partes componentes de la poblacin se conocen como elementos, los cuales pueden ser algo con existencia real como un restaurante, una fbrica, un sistema de tendido elctrico, un repuesto, o algo ms abstracto, como la gravedad, la temperatura, un voto o el intervalo de tiempo. Los elementos de la poblacin poseen ciertas propiedades, rasgos o cualidades que se denominan caracteres. Por ejemplo, el hombre posee unos caracteres llamados estatura, peso, edad, estado civil, religin, profesin, ingresos, formacin acadmica, condicin de
14

salud, etc. El flujo de un ro tiene unos caracteres llamados volumen o caudal, velocidad de flujo, densidad, etc. El tamao de la poblacin es un factor de gran importancia en la investigacin estadstica. Este tamao viene dado por el nmero de elementos que la integran. As, sta es finita cuando el nmero de elemento es finito e infinito cuando consta de infinitos elementos. Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica. En lugar de examinar el grupo entero llamado poblacin, se examina una pequea parte del grupo llamada muestra.

1.4 Muestra Cuando se desarrollan investigaciones estadsticas, no es posible obtener informacin sobre toda la poblacin, de aqu que solamente se investigue un subconjunto o muestra de la misma. El tamao de la poblacin es un factor de gran importancia en la investigacin estadstica. Este tamao
15

viene dado por el nmero de elementos que la integran. As, sta es finita cuando el nmero de elemento es finito e infinita cuando consta de infinitos elementos. Se conoce como muestra a una parte de la poblacin a estudiar que sirve para representarla. La muestra se define en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra slo podrn referirse a la poblacin en referencia. La muestra se caracteriza por ser representativa, contiene las caractersticas relevantes de la poblacin en las mismas proporciones de la poblacin donde fue tomada. La poblacin es un todo y la muestra es una fraccin o segmento de ese todo. Si se han de aplicar los resultados de la muestra a la poblacin entera, es fundamental que la muestra a estudiar sea cuidadosamente seleccionada. Una cobertura incompleta de la poblacin conducira a un error, error de muestreo, pues de otra forma no puede esperarse que la muestra sea representativa de la poblacin de manera exacta. Al valor de una caracterstica en la muestra se da el nombre de estadgrafo o estadstico y al valor de esa misma caracterstica en la poblacin se le llama parmetro. Un aspecto importante es el tamao de la muestra. Este est relacionado directamente con la precisin de los
16

resultados que se obtendrn. Cuanto mayor sea el tamao de la muestra estar ms cerca del tamao de la poblacin y sus resultados sern ms precisos. La importancia de estudiar muestras en lugar de poblaciones, entre otras, es:

El estudio de pocos individuos permite ahorrar el tiempo. Disminucin de los costos. Estudia de la totalidad de los elementos bajo una caracterstica determinada. Mejora la calidad de las observaciones y mediciones realizadas a un reducido nmero de individuos, antes que realizarlas a toda la poblacin.

Ejercicios. Resuma los siguientes conceptos: Estadstica. Poblacin. Elemento. Estadstica descriptiva. Estadstica inferencial. Muestra. Variables categricas. Parmetro. Estadgrafo. Diferencie estadstica descriptiva de la inferencial. Escriba ejemplos de casos que deben ser analizados bajo la estadstica inferencial. Identifique en cuatro ejemplos lo que constituye la poblacin, individuo y atributo.

17

2.0 TIPOS DE VARIABLES. 2.1 Variables y Atributos En una muestra o poblacin se estudia una serie de variables en cada individuo o elemento. Por lo general, se estudia una a una las variables sin llegar a plantearse ninguna asociacin entre ellas. El nmero de variables o datos de una muestra determinan el tamao de la muestra y suele representarse con la letra n. Es importante diferenciar que el dato individual es un dato de un slo individuo, mientras que el dato estadstico es un dato de una muestra o de una poblacin en su conjunto. Por ejemplo, el consumo elctrico de la vivienda de Pedro es un dato individual, mientras que el promedio del consumo elctrico de las viviendas del cantn o provincia es un dato estadstico. En una investigacin, el primer problema que se presenta en el anlisis estadstico, es el de definir el mtodo ms apropiado para resumir la informacin, a fin de presentar lo ms esencial de ella. Es importante establecer la distincin que existe entre dos tipos de informacin, los atributos y las

18

variables, toda vez, que procedimientos diferentes.

ellas

implican

En una poblacin los caracteres de los elementos son de dos clases, cuantitativos y categricos o cualitativos. Los caracteres cuantitativos o variables son los que describen mediante nmeros la resistencia, la intensidad de flujo de un caudal, el salario, la edad, las ventas, el volumen, la distancia, las medidas ergonmicas. Estas variables o caracteres cuantitativos difieren de elemento a elemento, no se presentan con la misma intensidad en cada uno de ellos, es decir, no todo material tiene la misma resistencia, ni todo vehculo la misma potencia. Por consiguiente, los individuos o elementos de una poblacin presentan distintos nmeros, que son los valores de la variable. Los atributos son las propiedades de los fenmenos que pueden ser medidos cualitativamente, expresan una descripcin cualitativa, no numrica. Los categricos o atributos se expresan mediante palabras como la profesin, el estado civil, la condicin de saludable o no de una persona o el hecho de un producto ser o no defectuoso. Puede notar que los atributos no se presentan en la misma forma en todos los elementos. Estas distintas formas en que se presentan los atributos reciben el nombre de modalidades. Cuando un atributo tiene distintas formas de presentacin se conoce como
19

modalidad: Por ejemplo, la condicin de funcionamiento de los barcos pesqueros de Esmeraldas no presentan una misma modalidad. En las variables cualitativas y cuantitativas se puede mencionar:
Ordinale s Puras Discreta s Continu

Cualititativas.

Cuantitativas o numricas

Las ordinales, son aquellas que teniendo ms de dos modalidades se enuncian siguiendo una cierta ordenacin ascendente o descendente y no de otra manera. Por ejemplo, la variable gravedad de un accidente de trnsito, podra tener como orden natural entre sus modalidades leve, moderado, grave, etc. Variable: Escala: Accidente de trnsito. Leve Moderado Grave Crtico Muerte Diferencia: Existe diferencia entre los diferentes niveles de la escala, entre los accidentes leves con los de nivel crtico o muerte.
20

Variable: Escala:

Grado de militar y/o policial Soldado Sargento Suboficial Oficial General Diferencia: Existe diferencia entre los grados jerrquico no solo en aos de experiencia sino en aos de estudio. Las variables cualitativas puras, carecen de un orden natural preestablecido entre sus modalidades, y pueden tener cualquier tipo de ordenacin, como por ejemplo el grupo sanguneo o la nacionalidad de una persona. En este tipo de variables se carece de un ordenamiento previo, ms bien es arbitrario, por ello se ha establecido tres parmetros para entender mejor este tipo de escala; variable, escala y diferencia, por ejemplo: Variable: Escala: Profesin Ingeniero Mdico Abogado Enfermero Odontlogo Diferencia: No existe diferencia entre los profesionales. Variable: Escala: Sexo Masculino Femenino Diferencia: Ninguna.
21

Variable: Escala:

Estado civil Soltero Casado Divorciado Viudo Unin estable Diferencia: Ninguna. Las dicotmicas, tienen slo dos modalidades posibles y no tiene sentido sealar si son o no ordinales. Ejemplo, el sexo, el pertenecer o no a una asociacin, o en general cualquier situacin que slo admita una respuesta s o no. Las variables cuantitativas son las propiedades de los fenmenos que se pueden medir cuantitativamente. Los caracteres cuantitativos o variables, son susceptibles de medicin. Son aquellos que pueden ser expresados mediante nmeros. Como por ejemplo, la densidad, el peso, la estatura, el salario, la edad, etc. Se llama constante, cuando la variable toma solamente un valor. Cuando las variables toman diferentes valores para representar los diferentes elementos de una poblacin se las conoce como valores de la variable. Las variables cuantitativas se clasifican en discretas y continuas. Las primeras slo pueden asumir
22

determinados valores y no es posible que llegue a tomar algn valor comprendido entre dos nmeros consecutivos; es un nmero entero que no admite fracciones. Ejemplo, el nmero de motores de un taller. El nmero de alumnos de un aula de clases. Variable: Escala: Nmero de visitas De 1 a 3 visitas De 4 a 6 visitas De 7 a 9 visitas De 10 a 12 visitas Entre 1 y 3, existe una amplitud de 2 Nmero de caries dental De 1 a 3 caries De 4 a 6 caries De 7 a 9 caries Entre 1 y 3 caries, existe una amplitud de 2 caries

Amplitud: Variable: Escala: Amplitud:

Las variables continuas pueden tomar cualquier valor en un intervalo de los nmeros reales. La velocidad de recorrido por hora de un vehculo. El peso de una persona, etc. Variable: Escala: PESO EN GRAMOS 6,5 Kg 7,5 Kg 8,5 Kg 9,5 Kg

23

Amplitud: Entre 6,5 y 9,5 kg existe una amplitud de 4,0 kg.

Variables Independientes y Variables Dependientes Si a cada valor de X le corresponde uno o ms valores de la variable Y, entonces, Y es una funcin de X, y se representa por:

X ser la variable independiente Y la dependiente. Por ejemplo, la torsin T de un eje es funcin de su resistencia R.

Ejemplo de identificacin de variables: Descripcin de la variable Tiempo de funcionamiento de un motor Distancia recorrida por un vehculo. Ingreso de visitas al taller. Cantidad de motores Color de una elctricos. dnamo circuitado.
24

Identificacin Cuantitativa, continua. Cuantitativa, continua. Cuantitativa, Cuantitativa, discreta. Categrica. discreta.

Preferencia por la marca de un repuesto. Estatura de los empleados.

Categrica. Cuantitativa continua.

25

3.0 DATOS ESTADSTICOS Los datos estadsticos pueden ser el resultado de un censo o de una muestra. Es de un censo cuando las caractersticas observadas se la han realizado sobre todos los elementos de la poblacin, pero si se ha tomado de una parte de ella, se trata de una muestra. Es importante insistir que slo se podrn hacer estimaciones confiables cuando las caractersticas de los elementos de la muestra sean representativas de las caractersticas de la poblacin de donde se tom. Todo dato estadstico es el resultado de las observaciones realizadas a las personas o cosas que ocasionan el fenmeno que se va ha estudiar. Para lograr una buena descripcin y anlisis con los datos, stos debern ordenarse y clasificarse antes de que se realice su recopilacin. Si se desea conocer el comportamiento de un grupo de barras metlicas debe hacrselo sobre la base de: tipo de material, dimensiones, densidad, etc. En un censo de poblacin a las personas se les toma datos sobre: nombres, apellidos, edad, origen, lugar donde vive, ingresos econmicos, etc. Durante la recoleccin de datos se consideran los conceptos de poblacin, individuo y atributos (que pueden ser
26

cualitativos o cuantitativos). Por ejemplo: se desea realizar un estudio de las densidades de maderas de un bosque. Poblacin: Individuo: Atributo: Conjunto de densidades cada densidad la densidad.

En cuanto a la organizacin de los datos, stos pueden ser tabulados a travs de una serie simple o por medio de su agrupacin. La agrupacin se emplea para los casos cuando las observaciones son muy grandes. 3.1 Ordenacin de los datos por agrupacin o distribucin de frecuencias. Bajo este mtodo se registran las frecuencias de cada valor de la variable y se determina la frecuencia absoluta, frecuencia relativa, frecuencia relativa en porcentaje, frecuencia acumulada y frecuencia acumulada en porcentaje. La Frecuencia absoluta expresa el nmero de veces que la variable u observacin toma un cierto valor; mientras que la frecuencia relativa se establece por el cociente entre la frecuencia absoluta de cada valor de la variable dividida por el total de observaciones.

27

3.1.1 Distribucin de frecuencias. Con el fin de poder identificar el comportamiento caracterstico de un fenmeno y facilitar el anlisis exhaustivo de los datos, se procede a estudiar el comportamiento de las variables y conocer su distribucin, describiendo y entendiendo la forma como varan los valores de la caracterstica estudiada en los individuos de la muestra o poblacin. La distribucin de una variable entrega informacin sobre los valores que una variable puede tomar en los individuos observados y la frecuencia con que estos valores ocurren. Al conjunto de datos o variables, de valor cualitativo o cuantitativo, que tiene cada elemento de la muestra se denomina distribucin. La forma de simplificar los datos que equivale a las veces que se repiten, nos conduce a la definicin de los siguientes conceptos: Frecuencia: es el nmero de veces que se presenta cada valor de la variable Frecuencia absoluta (f) es el nmero de veces que el valor de una variable aparece dentro de un conjunto de datos. Por ejemplo, si una muestra recoge la densidad de algunos minerales y dentro de ella, la del cobre se repite 20 veces, sta ser la f y n corresponder al

28

tamao total de la muestra, o sea, a la totalidad de todos los minerales observados. La totalidad de los datos (n) equivale a la sumatoria de las frecuencias absolutas. Matemticamente se expresa:

Frecuencia relativa (fi) equivale al valor de la frecuencia absoluta de la variable dividida por la totalidad de datos o tamao muestral (n). Del ejemplo anterior, si f es 20 y el tamao total muestral n es 100, es decir, el total de los minerales observados, entonces fi = 20/100 = 0.2

Las frecuencias relativas, por lo general, se expresan como porcentajes, que en nuestro caso es de 20% en relacin al total. Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, y de ah su importancia; adems, pese a su simplicidad, dan lugar a conceptos muy importantes, como el de proporcin, y son la base sobre la que se construye cualquier resumen de los datos.

29

En toda investigacin estadstica se llega a la acumulacin de valores cuantitativos y cualitativos correspondientes a los diversos valores de las variables que se pueden resumir en lo que se conoce como tablas de frecuencia. Luego, las tablas de frecuencia, es el procedimiento de simplificacin de los datos que agrupan diversos valores de una variable. Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una variable y sus correspondientes frecuencias. Para entender como funcionan, analizaremos dos tipos de tablas de frecuencia.

3.2 Tabla de Frecuencia Tipo A Se pide a una comisin tcnica que valore el concurso de merecimientos de los profesionales que participan para el ingreso a una empresa con la siguiente escala de puntuacin: Excelente (6), Muy Bueno (5), Bueno (4), Regular (3), Malo (2) y Muy Malo (1) Los resultados de la calificacin para diez concursantes fueron:

30

Profesional 1 2 3 4 5 6 7 8 9 10 Nivel de calificacin 1 2 3 4 5 6 Total

Nivel 5 2 4 3 5 5 4 3 5 4 Frecuencia (f) 0 1 2 3 4 0 10

El cuadro expone la calificacin para cada concursante. Luego, se simplifican y se interpretan los datos.

Como en la catalogacin de los datos la amplitud presenta una

Los miembros de la comisin tcnica no valoraron a los profesionales ni como Malos ni como Excelentes; mientras que la mayora de los profesionales se valoraron como Muy Bueno y Bueno.

31

Obsrvese en el cuadro anterior que la sumatoria de las frecuencias es igual al nmero de profesionales concursantes. El anlisis de las tablas de frecuencia se complementa con la frecuencia relativa (fi), frecuencia acumulada (fa) y frecuencia relativa en porcentaje (fi%) y acumulada en porcentaje (fa%). Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, a ms de su simplicidad permiten establecer la proporcin de los datos. Nivel de calificacin 1 2 3 4 5 6 Total Frecuencia (f) 0 1 2 3 4 0 10

fa 0 1 3 6 10

fi 0,0 0,1 0,2 0,3 0,4 1,0

fa% 0,0 0,1 0,3 0,6 1,0

32

Ejemplo: De los datos de una encuesta de usuarios de energa elctrica sobre el consumo de Kw se obtuvieron los siguientes datos:

37 20 49 50

20 43 47 42

58 37 34 31

39 40 35 44

41 32 32 37

25 31 21 35

27 18 43 46

32 25 38 30

31 37 47 53

28 29 19 46

Ordenacin de los datos (aparecen como U=usuario, C=consumo) como una serie simple: U 1 2 3 4 5 6 7 8 9 1 0
33

C 1 8 1 9 2 0 2 0 2 1 2 5 2 5 2 7 2 8 2 0

U 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0

C 3 0 3 1 3 1 3 1 3 2 3 2 3 2 3 4 3 5 3 5

U 2 1 2 2 3 2 4 2 5 2 6 2 7 2 8 2 9 3 0

C 3 7 3 7 3 7 3 7 3 8 3 9 4 0 4 1 4 2 4 3

U 3 1 3 2 3 3 4 3 5 3 6 3 7 3 8 3 9 4 0

C 4 3 4 4 6 4 6 4 7 4 7 4 9 5 0 5 3 5 8

3.3 Ordenacin de los datos por agrupacin o distribucin de frecuencias. Bajo este mtodo se registran las frecuencias de cada valor de la variable y se determina la frecuencia absoluta, frecuencia relativa, frecuencia relativa en porcentaje, frecuencia acumulada y frecuencia acumulada en porcentaje. La Frecuencia absoluta expresa el nmero de veces que la variable u observacin toma un cierto valor; mientras que la frecuencia relativa se establece por el cociente entre la frecuencia absoluta de cada valor de la variable dividida por el total de observaciones. La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. Distribucin de frecuencias de datos simples. 18 19
34

f 1 1

fi 0,025 0,025

fi % 2,50 2,50

fa 1 2

fa % 2,50 5,00

20 21 25 27 28 29 30 31 32 34 35 37 38 39 40 41 42 43 44 46 47 49 50 53 58

2 1 2 1 1 1 1 3 3 1 2 4 1 1 1 1 1 2 1 2 2 1 1 1 1 40

0,050 0,025 0,050 0,025 0,025 0,025 0,025 0,075 0,075 0,025 0,050 0,100 0,025 0,025 0,025 0,025 0,025 0,050 0,025 0,050 0,050 0,025 0,025 0,025 0,025 1

5,00 2,50 5,00 2,50 2,50 2,50 2,50 7,50 7,50 2,50 5,00 10,00 2,50 2,50 2,50 2,50 2,50 5,00 2,50 5,00 5,00 2,50 2,50 2,50 2,50 100

4 5 7 8 9 10 11 14 17 18 20 24 25 26 27 28 29 31 32 34 36 37 38 39 40

10,00 12,50 17,50 20,00 22,50 25,00 27,50 35,00 42,50 45,00 50,00 60,00 62,50 65,00 67,50 70,00 72,50 77,50 80,00 85,00 90,00 92,50 95,00 97,50 100,00

3.4 Tabla de Frecuencia Tipo B

35

Se emplean estas tablas cuando los datos observados son numerosos y la amplitud de los valores de las variables es considerable. Se toma a la amplitud como la diferencia entre el menor y el mayor valor de la observacin. Debido a los datos numerosos se hace necesario agruparlos en Intervalos de Clase. La agrupacin de los valores de la variable en intervalos de clase permitira simplificar las fuentes de datos. Por ejemplo, si tuviramos una valoracin de 1 a 75, podramos establecer intervalos de clase entre 0-15, 15-30, 30-45, 45-60 y 60-75.

3.5 Distribucin de frecuencias por agrupacin de datos Para aplicar este procedimiento es importante definir los siguientes conceptos: Amplitud total o recorrido de la variable (A).- Se la define como la diferencia que existe entre el valor mayor y el valor menor de las observaciones. A = Obmayor Obmenor Intervalo de clase.- Comprende los nmeros extremos y los incluidos entre ellos. Por ejemplo: se tiene un intervalo de 60 64
36

60 61 62 63

64

Lmites de clase.- Est formado por los nmeros extremos que forman el intervalo de clase. Los lmites de clase en el anterior intervalo serian 60 y 64. Sin embargo, los lmites reales se obtienen restando 0.5 al lmite inferior (Li) y sumando 0.5 al lmite superior (Ls). Lmite inferior: Lmite superior: 59.5 60.5

Ancho del intervalo (I).- El ancho del intervalo o intervalo de clase se lo obtiene por la diferencia entre el lmite real superior (Lrs) menos el lmite real inferior (Lri). I = lrs - lri I : ancho del intervalo Lrs : limite real superior Lri : limite real inferior O tambin mediante lo siguiente: I = Ls Li + 1

Marca de clase.- Es el valor medio de cada intervalo.


37

Mc = marca de clase Li Ls = limite inferior = limite superior

Nmero de intervalos.- Es un nmero entero que refleja la totalidad de clases. ni = nmero de intervalo I = ancho del intervalo A = amplitud

A n = + i 1 I

Los intervalos deben ser no menor que 5 ni mayor a 15. Con un nmero de 5 intervalos de clase las frecuencias son muy concentradas. Cuando los intervalos son mayores a 15 las frecuencias se presentan muy dispersas, lo cual, dificulta su representacin grfica y clculos matemticos. Ejemplo de ordenacin de los datos por agrupacin o distribucin de frecuencias de la produccin alcanzada por setenta obreros, fue la siguiente: 51 36 45 49 50 51
38

49 65 45 47 51 50

45 55 45 41 49 49

56 50 50 52 48 45

49 50 51 49 55 44

46 45 56 41 67 45

45 47 39 60 36 41

40 43 61 79 48 37

38 37 55 36 40 66

61 65 52 42 41 57

ni =

A +1 I

49

34

45

65

70

54

50

46

37

41

Amplitud:

A = 75 34 = 41

Ancho intervalo: I =6 Para establecer los intervalos de clase se procede: ni descendente, tome a)Nmerova ha ordenar en forma = (41/6)+18 el Si los de intervalos: mayor valor de la observacin asignndolo como el lmite superior del que ser el primer Intervalo de clase, de acuerdo con los datos anteriores, tenemos:

I = Ls Li +1

De donde:

6 = 79 Li + 1

74

Luego, el primer intervalo de clase estara determinado por aquellos que alcanzan una produccin entre 74 79 y artculos.

El resto de intervalos lo deduce restando, sucesivamente, el ancho del intervalo (I) tanto al lmite inferior como al superior.

INTERVALO 39

fa

fi

fi %

74 68 62 56 50 44 38 32 Totales

79 73 67 61 55 49 43 37

1 1 5 6 16 23 11 7 70

70 69 68 63 57 41 18 7

0,01 0,01 0,07 0,09 0,23 0,33 0,16 0,1 1

1,43 1,43 7,14 8,57 22,86 32,86 15,71 10 100

3.6 Caractersticas de las tablas tipo B Utiliza en el clculo las marcas de clase. Los valores asumidos por las variables son elevados. Slo se utilizan variables cuantitativas (discretas y continuas). Su elaboracin tiene mayores procedimientos que las tablas Tipo A. La interpretacin y anlisis se centra en los intervalos de clase. Presenta un componente adicional: las marcas de clase.

EJERCICIOS. 1. Completar los datos que faltan en la siguiente tabla estadstica, donde f, fa y fi representan, respectivamente, la frecuencia absoluta, acumulada y relativa:
x
40

fa

Fi

1 2 3 4 5 6 7 8

4 4 16 7 5 7 28 38 45

0,08 0,16 0,14

2. La frecuencia relativa de 1 es 0,08 = 4/N, de donde N = 50. Complete la frecuencia y frecuencia absoluta de la observacin de 3.
X 1 2 3 4 5 6 7 8 f 4 4 7 5 10 7 5 fa 4 8 23 28 38 45 50 fi 0,08 0,08 0,16 0,14 0,10 0,20 0,14 0,10

3. Construya una tabla de frecuencias con los datos de mxima temperatura que se registr en la ciudad. 29, 30, 32, 28, 29, 31, 34, 28, 31, 33, 29, 30, 30, 31, 31, 30, 29, 29, 34, 33, 33, 29, 29. 30, 32, 31, 31, 30, 30, 29, 30, 31

41

4. La resistencia a dureza de 65 piezas se registran en la siguiente tabla. Construir la tabla de frecuencias.


Dureza f 51-60 61-70 71-80 81-90 91-100 10 7 12 9 14 101-110 11

5. Un tornero observa el nmero de fallas por lotes de produccin de las piezas elaboradas, la cual, se registra en la siguiente tabla.
Lotes 1 2 3 4 5 6
Fallas 8 10 5 4 6 3 f 8 15 p1 9 11 5 fi 0,17 0,31 p2 0,19 0,23 0,10

42

4.0

GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.

Las distribuciones de frecuencias no slo se representan en tablas sino tambin en grficos. Los grficos permiten facilitar la comprensin de los resultados, puestos que, fundamentalmente, representan las frecuencias de cada modalidad o valor, pero no aade ninguna informacin sobre la que contendra una tabla de frecuencias. Hay dos formas de representar las distribuciones de frecuencias, por medio de un histograma o por un polgono de frecuencias. En las grficas las reas (o longitudes) han de ser proporcionales a las frecuencias y los detalles deben ser lo suficientemente visibles. Se recomienda no representar demasiada informacin en una grfica Los datos de las variables u observaciones pueden adecuadamente tambin expresarse mediante grficos, tales como: barras, sectores circulares, mapas, curvas, etc. 4.1 El histograma se utiliza para representar una tabla de frecuencias de intervalos de clase. Es la grfica adecuada para representar variables cuantitativas continuas, en muchas ocasiones estos histogramas son llamados errneamente diagramas de barras.

43

Sobre el eje horizontal (X) se representan los intervalos de clase y sobre el eje vertical (Y), las frecuencias de los intervalos de clase. El histograma consiste en un conjunto de rectngulos adyacentes cuya base (todos ellos con base de igual amplitud) representa un intervalo de clase y cuya altura representa la frecuencia absoluta o relativa de acuerdo con la distribucin de frecuencias del intervalo que estemos representando. En la base del rectngulo, bien puede colocarse el intervalo o su punto medio de clase.
No obreros

Produccin Histograma de la produccin media de setenta obreros

44

4.2 El polgono de frecuencias Es Empleado con variables

cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, segn el tipo de tabla de frecuencia manejada. El polgono se construye uniendo los puntos medios de los lados superiores de cada rectngulo. Si se quiere cerrar el rectngulo, se agregan dos intervalos: uno anterior y otro posterior al ltimo y se prolonga el polgono hasta los puntos medios de estos intervalos. # Obreros

Produccin Polgono de frecuencias de la produccin media de setenta obreros

45

4.3 Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos discretos. La longitud es igual a la frecuencia de cada observacin. Pueden ser barras simples o mltiples, segn se trate de representar uno o ms atributos. Las barras pueden ser horizontales o verticales. Los diagramas de barras asocian a cada modalidad de una variable a un rectngulo y la superficie refleja su frecuencia. Las bases de los rectngulos son todas iguales; pero, las alturas corresponden a las frecuencias. Ejemplo: Produccin de PETROINDUSTRIAL el 16 de diciembre de 2008 LPG Jet A-1 Asfalto C-20 Resido 6.575 3.921 7.239 10.329

En el ejemplo de los grficos de barras vertical y horizontal los rectngulos van separados.

46

Produccin total diaria en barriles (16-dic-2008)

47

4.4 Los grficos circulares o grficos de torta se emplean para comparar datos. Cada sector del grfico representa el porcentaje que corresponde a la frecuencia de un cierto valor de la variable. Ejemplo: Produccin de azcar (Ao 2007) en miles de sacos de 50 Kg de los siguientes ingenios: Ingenio San Carlos Ecudos Valdez Produccin 3.322 3.159 3.180 Porcentaje 34.39 32.70 32.91

4.5 Las curvas se utilizan generalmente para representar la variacin de una variable a travs del tiempo (aos,

48

meses, horas, etc.). Sobre el eje horizontal figuran los perodos de tiempo. Ao 2003 Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Precipitacin (mm) 197,7 186,9 133,1 68,2 133,0 39,7 1,4 20,4 41,9 24,4 43,6 45,2

49

5.0 MEDIDAS DE TENDENCIA CENTRAL. Las medidas o parmetros de centralizacin, conocidos tambin como medidas de tendencia central o posicin central, permiten encontrar un valor lo ms representativo posible de todos los valores de la muestra, es decir, se utilizan para encontrar un valor que represente a todos los datos. El valor que represente a todos los datos no ser el valor ms elevado ni el valor ms pequeo, lo ms adecuado, es entonces buscar un valor central que represente al grupo antes que al individuo. Las medidas de tendencia central permiten resumir la localizacin de los datos, ubicando el punto alrededor del cual se centran los mismos. Las medidas ms utilizadas son: Media aritmtica Mediana Moda Media geomtrica Media armnica

5.1 Media aritmtica

50

La media es la medida de tendencia central ms utilizada y puede definirse como el promedio aritmtico de una distribucin. Se calcula sumando los valores de los datos y dividiendo su resultado para la cantidad de ellos. Si los datos provienen de la poblacin el promedio se representa por la letra griega ; si lo es de una muestra, por La media aritmtica o promedio ( ) se calcula sumando todas las observaciones y luego dividiendo el total entre el nmero de elementos observados. El smbolo indica que debe efectuarse una sumatoria, X es el smbolo de una puntuacin y N es el nmero total de casos o puntuaciones. La sumatoria es un smbolo muy utilizado en matemticas que sirve para simplificar frmulas estadsticas. Una sumatoria nos permite representar sumas muy grandes, de n sumandos o incluso sumas infinitas y se expresa con la letra griega sigma (). Por lo general, despus de una sumatoria aparece una variable con un suscrito representado por la letra i (Xi). Este suscrito indica qu valores de la variable se deben sumar, Para determinar cules valores, es necesario sustituir la i por los valores que se indican arriba y debajo de la sumatoria

51

Los datos provenientes de las poblaciones o muestras pueden ser tratados de dos formas: sin agruparlos o agrupndolos en tablas de frecuencias.

5.1.1

Media aritmtica simple con datos sin agrupar.

Es la suma de todos los elementos de la serie dividida por el nmero de ellos. Se calcula como:

siendo:
x : la media

x
i =1

: suma de elementos

n : nmero de elementos (incluyendo a los de igual valor) k : nmero de elementos con distinto valor. Ejemplo.

52

1. Hallar el promedio de los datos correspondientes a

espacios en km recorridos por vehculos. 120, 50, 200, 80, 174, 180, 130

2. La media de 5 elementos se sabe que es 15. Sabiendo que cuatro de ellos son: 10, 7, 20, 25 hallar el elemento que falta. 3. Ejemplo: determine la media aritmtica de los amperajes de un grupo de motores: 3.5, 3.6, 3.7, 3.8, 3.9, 4.0, 4.2, 4.3, 4.4, 4.9
X = 3.5 + 3.6 + 3.7 + 3.8 + 3.9 + 4.0 + 4.2 + 4.3 + 4.4 + 4.9 40.3 = = 4.03 10 10

5.1.2 Media aritmtica de una serie estadstica de frecuencias o media aritmtica ponderada. Se define como la suma de los productos de cada elemento de la serie por su frecuencia respectiva, dividida por el nmero de elementos de la serie. La frmula matemtica para calcular la media o promedio para casos agrupados es:
53

Donde ni corresponde al nmero de observaciones o frecuencias de cada valor. Ejemplo: determinar la media aritmtica del esfuerzo de torsin para los datos encontrados en los siguientes motores: 280, 220, 278, 250, 260, 220, 250, 278, 280, 260, 250, 250 x 280 278 20 250 220 f 2 2 2 4 2

X=

( 2)( 280) + ( 2)( 278) + ( 2)( 260) + ( 4)( 250) + ( 2)( 220) = 3076 = 256.33
2+ 2+ 2+4+ 2 12

5.1.3 Media aritmtica con datos agrupados en una serie estadstica de intervalos de frecuencia. Para la resolucin de la media aritmtica con datos agrupados en intervalos de frecuencia se tienen tres mtodos.
54

Primer Mtodo El procedimiento establecido para resolver los clculos bajo este mtodo se resume en: a. Se establecen los intervalos de clase. b. Para cada intervalo se sacan las frecuencias absolutas. c. Se deduce los puntos medio de clase. d. Se multiplica b y c. e. Se hace la sumatoria de los productos de los puntos medios de clase por sus frecuencias absolutas respectivas. f. Se divide la sumatoria obtenida para el nmero de observaciones. Frmula que se emplea:

Ejemplo: calcular la media aritmtica, en miles de libras por pulgada cuadrada, de 40 muestras de varios tipos de aluminio, despus de haber sido sometidas a un ensayo de mxima tensin.
16 22 36
55

32 40 18

27 16 34

42 20 25

28 42 38

34 36 27

4 4 4 0 2 0

22 42 25

18 32 36

38 16 34

27

38

36

44

22

32

1 6

40

27

20

A = 44 16 = 28 I = Ls Li +1 I =5 5 = 44 - Li +1 Ni = A/I = 28/5 = 5.6 6 Li = 40 Mc= Punto medio de clase.

X 40 44 35 39 30 34 25 29 20 24 15 19 Total.

f 8 7 6 7 6 6 4

Mc 42 37 32 27 22 17

f*Mc 336 259 192 189 132 102 1210

56

Ejemplo. Una distribuidora de energa elctrica en la venta de los datos que se registran en el cuadro, tuvo en promedio una prdida del 25%. Cunto represent la prdida, si el precio del Kw/h fue de $ 0.75?
Cons Kw/h

120 0 900

230 0 240 0

160 0 650

101 0 740

254 0 120 0

180 0 1540 848 1900

Segundo Mtodo. El procedimiento de resolucin es el siguiente:


a. Reptase los pasos a, b y c del procedimiento

del Primer Mtodo.


b. Escoja el punto medio de clase que tenga la

mayor frecuencia absoluta y lo denominamos punto medio de clase supuesto Mcs. c. Se calcula u con la siguiente frmula:

57

d. Finalmente, multiplica las frecuencias absolutas por u. La frmula es:


e.

Bajo este mtodo resolveremos el mismo ejercicio del caso anterior.

58

X 40 44 35 39 30 34 25 29 20 24 15 19 Total.

f 8 7 6 7 6 6 40

Mc 42 37 32 27 22 17

Mcs 42

u 0 -1 -2 -3 -4 -5

f* u 0 -7 -12 -21 -24 -30 -94

Aplicamos la frmula:

Se obtuvo el mismo resultado con este mtodo.

Tercer Mtodo. Su procedimiento de resolucin es:


a. Reptase los pasos a, b y c del procedimiento

del Primer Mtodo.


b. Seleccione en forma arbitraria cualquier punto

medio de clase y as obtendr su punto medio de clase supuesto Mcs.


59

c. Deduzca la desviacin (d) restando a cada

punto medio de clase (Mc) el punto medio de clase (Mcs). d. Multiplique la frecuencia por la desviacin. e. La frmula que debe emplear es:

Para efectos de comprobacin de la consistencia del mtodo, utilizaremos los mismos datos que hemos empleado, a fin de obtener el mismo valor de la media.
X 40 44 35 39 30 34 25 29 20 24 15 19 Total. f 8 7 6 7 6 6 40 Mc 42 37 32 27 22 17 Mcs d 10 5 0 -5 -10 -15 f*d 80 35 0 -35 -60 -90 -70

32

Aplicando la frmula:

60

Con los tres mtodos hemos logrado el mismo resultado.

EJERCICIOS. 1. Considrense los siguientes datos: 7, 12, 23, 10, 6, 2. Se pide: a. Calcular su media. b. Si los todos los datos anteriores los multiplicamos por 3, cul ser la nueva media. 2. A un conjunto de 5 nmeros cuya media es 6.84 se le aaden los nmeros 12.5 y 6.4. Cul es la media del nuevo conjunto de nmeros? 3. Calcular la media de una distribucin estadstica que viene dada por la siguiente tabla: xi f 59 6 72 15 47 32 60 25 79 12

4. Hallar la media de la distribucin estadstica de los datos de la siguiente tabla.


x fi 8 -12 7 13-17 8 18-22 5 23-27 10 28-32 4

61

62

5.2 Mediana. Es el valor que divide una serie de datos ordenados en dos partes iguales. El nmero de datos que queda por debajo y por arriba de la mediana son iguales; eso hace que la mediana sea el valor que est en el centro de la distribucin. Cuando no existe un valor central se puede definir a la mediana como la media aritmtica de los valores medios. Esto es, si el nmero de partidas es par, la mediana es la media aritmtica de los valores de las dos partidas medias. La mediana se calcula segn los siguientes casos: Caso 1. Mediana para datos no agrupados, con nmero de datos impar. Ejemplo: 2, 4, 6, 8, 10, 12, 14 Mediana = 8 Mediana para datos no agrupados, con nmero de datos par. Ejemplo: 3, 3, 4, 4, 6, 7, 7, 8 Mediana = 5

63

Caso 2. Mediana para datos agrupados. Calcular la mediana a partir de la siguiente tabla de frecuencia: En este caso se calcula la Mediana de una serie con datos agrupados slo por frecuencias, pero sin agrupar en intervalos.
Procedimiento:

Se calcula la frecuencia acumulada. Se calcula nmero total de casos dividiendo suma de frecuencias para 2.

64

X 5 10 15 20 25 30 35

f 3 7 8 5 10 8 5 46

fa 3 10 18 23 33 41 46

f% 6,5 15,2 17,4 10,9 21,7 17,4 10,9 100,

fa% 6,5 21,7 39,1 50,0 71,7 89,1 100,0

En consecuencia, la frecuencia acumulada inmediata superior a 23 es 33; luego, la mediana es la variable 25.

Caso 3. Mediana para una serie de datos agrupados en intervalos. En este caso se calcula la Mediana para una serie de datos agrupados por frecuencias y en intervalos.
65

La mediana se calcula de la siguiente forma:


a. Se ordenan los valores en una tabla con

b.
c.

d. e.
f.

intervalos de clase, frecuencia absoluta y frecuencia acumulada. Se divide la sumatoria de frecuencias absolutas para dos. A este resultado se le busca el valor inmediato superior en las frecuencias acumuladas, el cual, en la lnea de valores, nos indicar el intervalo de clase que contendr la mediana. Al lmite inferior de este intervalo de clases se le obtiene el lmite real inferior. La frecuencia acumulada menor (fam) se encontrar debajo del valor que seala el numeral 3 anterior. Se calcula la frecuencia del intervalo que contiene a la mediana mediante la frmula de la mediana.

f fam 2 . I Mn = la mediana a partir de la siguiente Ejemplo. Calcular Lri + f tabla de frecuencia: Ejemplo: Se registr los amperajes de 30 motores de potencia entre HP hasta 3.0 HP funcionando bajo corriente alternativa trifsica, siendo sus datos:

66

2 4,8 9,2 6,5 8,6 13 8,6 3 3,4 8,2 14,4 3 2 13 4,2 8,2 2,5 4,8 6,2 3,7 4,2 3 11 6,8 2,8 13 14 4,2

2,5 11 8,2 8,6 6,5 4,2 3,4 4,8 2 9,2 8,2 13

X 10, 6,4 4 2,4 -1,6 14, 10, 4 4 6, 4 2, 4

f 1 8 1 2 7 3 4 0 4 a 3 0 2 0 3

f fam . I Mn = Lri + 2 f

5.3 Moda
67

Es el valor de la variable que tiene mayor frecuencia en la muestra y puede definirse para cualquier tipo de variables; es decir, el que se repite un mayor nmero de veces. Es por tanto, el valor comn. En una distribucin puede ocurrir que haya dos o ms modas, entonces se habla de distribucin bimodal, trimodal, incluso puede no existir la moda, como en la serie 2, 3, 4, 5, 7, 10. Ejemplo: Se presenta en forma ordenada de menor a mayor las edades de una muestra de 12 jvenes. 15 15 16 16 17 17 7 17 8 18 19 19

De los datos la edad o valor de 17 es la moda. La moda en los datos sin agrupar la constituye el conjunto de valores que ocurre con mayor frecuencia; mientras que para datos agrupados es el intervalo de clase con la frecuencia ms alta. Si los valores se encuentran en una tabla de frecuencias para datos agrupados, el clculo de la moda se obtiene realizando la siguiente secuencia: a. Determinar el intervalo en donde se encuentra la clase modal, que corresponde al intervalo que posee la mayor frecuencia. b. Obtener el limite inferior de la clase modal (Li)
68

c. Obtener la amplitud del intervalo de la clase modal

(I) d. Calcular la diferencia intervalo modal y la contiguo inferior. (d1) e. Calcular la diferencia intervalo modal y la contiguo superior (d2)

entre la frecuencia del frecuencia del intervalo entre la frecuencia del frecuencia del intervalo

Ejemplo. Ejemplo (del Captulo I Libro I) de ordenacin de los datos por agrupacin o distribucin de frecuencias de la produccin alcanzada por setenta obreros.

INTERVALO 74 79 68 73 62 67 56 61 50 55 44 49 38 43 32 37

f 1 1 5 6 1 6 2 3 1 1 7 7 0

fa 1 2 7 1 3 2 9 5 2 6 3 7 0

Mc 76, 5 70, 5 64, 5 58, 5 52, 5 46, 5 40, 5 34, 5

f *Mc 76,5 70,5 322,5 351 840 1069,5 445,5 241.5

69

Utilizando los datos de la tabla anterior, tenemos que: a. La frecuencia absoluta de mayor valor es 23, que corresponde al intervalo 44 - 49 b. Limite real inferior 43.5 c. La amplitud del intervalo es 6
d. La frecuencia absoluta del intervalo modal es 23

La frecuencia absoluta del intervalo contiguo inferior es: 11, luego d1 = 23-11 = 12
e. La frecuencia absoluta del intervalo modal es: 23

La frecuencia absoluta del intervalo contiguo superior es: 16, luego d2 = 7 Se obtiene que la moda sea: d1 = 23 11 = 12 d2 = 23 16 = 7

70

Ventajas y desventajas de la moda Ventajas a. La Moda (al igual que la Me) se puede usar como una localizacin central tanto para datos cualitativos como cuantitativos. b. La Moda (como la Me) no esta indebidamente afectada por valores extremos, an cuando los valores altos sean muy bajos, se escoge el valor ms frecuente del conjunto de datos como el valor modal. c. Se puede usar la Mo an cuando los intervalos de clases estn abiertos en sus extremos. Desventajas a. No siempre hay un valor modal b. Cuando un conjunto contiene 2, 3 o ms modas, estas son difciles de interpretar y comparar 5.4 Media Geomtrica
71

La media geomtrica de un conjunto de observaciones se trata de la raz ensima de su producto. El clculo de la media geomtrica exige que todas las observaciones sean positivas. Los datos que emplea la media geomtrica deben ser todos nmeros positivos. Si hay un nmero negativo la media geomtrica o bien negativa o bien inexistente en los nmeros reales. Cuando uno de los datos es 0, entonces el resultado es 0.

G = n ( X 1 ) ( X 2 )( X 3 )..................( X n )
Donde: G = media geomtrica n = numero de partidas de la muestra x = valores de las partidas

72

5.5 Media armnica Es la media aritmtica de los recprocos y se toma el recproco de esta media; o tambin, es el recproco de la media aritmtica del recproco de las observaciones. Por lo general se emplea para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.; no se recomienda en distribuciones de variables con valores pequeos. Entre las ventajas e inconvenientes que presenta es que en el clculo intervienen todos los valores de la distribucin; y, el clculo no tiene sentido cuando algn valor de la variable toma valor cero.
H= 1 1 X1 + 1 X2 + ............................... + 1 N XN = 1 1

( X) ( )
N

N 1 X

1 = H

X1

+ 1

X2

+ .............................+ 1 n

Xn

1 n

( x)

Ejemplo:

73

Caso 1 obrero obrero a: b:

2 corbatas 3 corbatas por hora por hora

1.- considera al tiempo una constante y la produccin un variable. (2+3)/ 2


obrero obrero a: b: = 2,5 corbatas por hora

Caso 2 30 minutos por 20 minutos por corbata corbata

2.- cuando __ utiliza el tiempo como una variable debe se emplearse laX H
1 +1 1 5 = 30 20 = = 24 M in / Corbata H 2 120

5.6 Media Cuadrtica Es otra medida de tendencia central. Es muy til cuando las variables toman valores positivos y negativos. Se la utiliza para obtener un promedio que no refleje los efectos del signo, para lo cual, se elevan al cuadrado
74

todas las observaciones desapareciendo los signos negativos. Es ms alta que la media aritmtica, y por tanto que la geomtrica y armnica. La media cuadrtica, es igual a la raz cuadrada de la suma de los cuadrados de los valores dividida entre el nmero de datos. Su frmula es:

EJERCICIOS
1. Calcula la media, mediana y moda de esta distribucin. x 1 2 3 4 5 6 7 8 f 4 4 7 5 7 fa Fi 0,08 0,16 0,14

16 28 38 45

75

2. Observada la produccin en miles de arandelas de un conjunto de talleres, se han obtenido los siguientes datos:

Alquileres en miles de pesetas 1 - 15 16 30 31 45 46 - 60 61 - 75 76 - 90 Calcular la moda y la mediana.

ni 24 86 136 46 12 4

3. Los jugadores de un determinado equipo de baloncesto se clasifican por altura segn la tabla siguiente: Altura 1,70-1,75 1,90-195 Nmero 1 jugadores 5 1,75-1,80 1,80-1,85 1,85-190 1,95-2,00 3 4 8 2

Se pide analizar la variable altura para la media, la moda y la mediana. Ejemplo: En una librera se registran la ventas y se desea:
76

a. Obtener el precio medio por semestre.


b. Para el total de libros vendidos al ao el precio

medio, el ms frecuente y el que divide en dos partes iguales la distribucin de frecuencias.

Precio x f1 10 - 25 17,5 22 26 - 41 33,5 14 42 - 57 49,5 25 58 - 73 65,5 10 71

f2 12 16 22 8 58

x*f1 x*f2 f1+f2 x(f1+f2) 385 210 34 595 469 536 30 1005 1238 655 2747 1089 524 2359 47 18 129 2326,5 1179 5105,5

Precio medio en 1er semestre: 2746.5/71= 38.68 dlares Precio medio en 2do semestre: 2359/58 Media aritmtica: Precio medio en el 1er
77

= 40.67 dlares

2746.5/71= 38.68

semestre: Precio medio en el 2do semestre:

2359/58

= 40.67

Media aritmtica: 5105.5 / 129 = 39.58 dlares.

78

6.0 MEDIDAS DE POSICIN Conocidas tambin como medidas de dispersin se emplean para describir la variacin o dispersin en un conjunto de datos. Lo constituyen indicadores estadsticos que muestran la frecuencia acumulada hasta un valor k cualquiera. Son valores de la muestra o poblacin que puede tomar una variable. Los valores se distinguen por agrupar a cierto porcentaje de observaciones en la muestra o poblacin. Las medidas de posicin, parmetros de posicin o cuantiles se caracterizan por ser medidas de posicin, aun cuando pueden ser considerados como medidas de centralizacin o como medidas de dispersin. Los cuantiles son valores de la distribucin de un conjunto de observaciones que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o de marcas de clase y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes. El cuantil se define como el valor de la variable que puede o no estar incluida en la muestra y que supera al % de los datos de la muestra. Permite conocer la posicin en que se encuentra un valor dado en relacin al conjunto de la muestra o poblacin.
79

Entre las medidas de posicin se encuentran: Los cuartiles dividen a la distribucin en cuatro partes. Los deciles dividen a la distribucin en diez partes. Los percentiles dividen a la distribucin en cien partes.

6.1 Cuartiles Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales por tres medidas cuartiles, en los que cada uno de ellos concentra el 25% de los resultados. El cuartil se representa por Qk
k

= Nmero del cuartil 1, 2 o 3

Qk = q-simo del cuartil


a. Q1= Valor de la variable que es igual o menor al

25% de los valores de una variable.


b. Q2= Valor de la variable que agrupa el 50% de

los datos. Es idntico a la mediana.


c. Q3= Valor de la variable que es igual o menor al

75% de los valores de una variable.


d. Q4 = Valor de la variable que agrupa el 100% de

los datos.
Ejemplo: De los datos registrados de los sueldos de treinta trabajadores localizar los valores que correspondan a los Cuartiles.
80

X 240 235 225 Q3 200 195 Q2 185 180 175 Q1 170 165 Total.

f 1 2 3 5 3 2 3 2 5 4 30

fa 30 29 27 24 19 16 14 11 9 4

N: Es igual a la sumatoria de las frecuencias. PK : Punto del cuartil correspondiente. P1 = N/4 = 30/4 = 7,5 En relacin a este valor ubicamos en la columna de fa el valor inmediato superior; esto es el 9. Luego, el primer cuartil Q1 corresponde al valor de la variable 170. Q1 = 170 P2 = 2N/4 = (2 * 30)/4 = 15 P3 = 3N/2 = (3 * 30)/4 = 22,5 Luego, Q2 = 185 Luego, Q3 = 200

81

El procedimiento responde al clculo de una serie estadstica de frecuencia. Para el clculo de Cuartiles de una serie estadstica de intervalos se lo har con el siguiente ejemplo: Las marcas en segundos (X) realizados por atletas en una competencia de 10 000 m planos se agruparon en la siguiente tabla: X Q 46 - 49 Q 42 - 45 Q 38 - 41 34 - 37 30 - 33 26 - 29 Total. f 18 14 10 6 4 2 54 fa 54 36 22 12 6 2

: Es igual a la sumatoria de las frecuencias. facm: Frecuencia acumulada menor. I: Ancho del intervalo. P1 = /4 = 54/4 = 13,5 El valor inmediato superior en la fa es el 22, luego el cuartil est en el intervalo 38 41 y se lo determina con la siguiente frmula: Q1 = Lri + [ (( N/4 ) f acm )/ f ] * I
82

P1 = 13,5 Q1 = 37,5 + [(13,5 / 12) / 10] * 4 = 37,95 P2 = 2N/4 = (2*54) /4 = 27 Q2 = 41,5 + [(27 / 22) / 14] * 4 = 41,85 P3 = 3N/4 = (3*54)/4 = 40,5 Q3 = 45,5 + [(40,5) / 12) / 18] * 4 = 46,25 Resultados: El 25% de los atletas hicieron 37,95 segundos o menos. El 50% de los atletas hicieron 41,85 segundo o menos. El 75% de los atletas hicieron 46,45 segundos o menos. 6.2 Deciles Son medidas de localizacin que dividen un conjunto de observaciones en diez partes iguales, por consiguiente, habrn 10 deciles representado como dk. Los deciles establecen nueve cortes para definir de diez en diez por ciento los valores de la distribucin; de tal manera que el primer decil deja por debajo una dcima parte de la distribucin, el segundo dos dcimas partes, etc., hasta nueve deciles. k: Numeracin de los deciles.
83

dk: Representa el decil correspondiente. d1 = Valor de la variable que agrupa el 10% de los datos. d2 = Valor de la variable que agrupa el 20% de los datos. d3 = Valor de la variable que agrupa el 30% de los datos. d4= Valor de la variable que agrupa el 40% de los datos. d5= Valor de la variable que agrupa el 50% de los datos. d6= Valor de la variable que agrupa el 60% de los datos. d7= Valor de la variable que agrupa el 70% de los datos. d8= Valor de la variable que agrupa el 80% de los datos. d9= Valor de la variable que agrupa el 90% de los datos. N = 10 deciles. La frmula para calcularlo es:

Donde: Lri : Lmite real inferior en el decil k. f : Sumatoria de frecuencias.


84

fam : Frecuencia acumulada menor. fdk : Frecuencia del decil k. I : Intervalo de clase del decil k. Ejemplo: Hallar los deciles de los datos registrados de produccin lechera en 125 granjas agropecuarias. PRODUCCIN 95 99 90 94 80 84 75 79 70 74 65 69 60 64 55 59 50 54 45 49 40 44 35 39 Total.. f 4 7 12 14 19 13 16 10 15 8 5 2 12 fa 12 12 11 10 88 69 56 40 30 15 7 2 Pk P9 P8 P6 P5 P4 P3 P2 P1

85

Se procede a determinar la posicin de los deciles: P1= P6=

P2=

P7=

P3=

P8=

P4=

P9=

P5= Para cada uno de los valores encontrados de Pk se toma en la columna de las frecuencias acumuladas (fa), el valor inmediato superior. Para P1=16,1 el valor inmediato mayor es 24, luego, en esta posicin se encontrar el decil uno (d1) y corresponder a uno de los valores dentro del intervalo

86

de clase 85 89 que se lo determinar de la siguiente manera:

dk=

d1= 44,5 +

d2 = 49,5 +

d3 = 54,5 +

d4 = 59,5 + d5 = 64,5 + d6 = 69,5 + d7 = d6

d8 = 74,5 +

87

d9 = 79,5 +

6.3 Percentiles Los percentiles son medidas de posicin relativa que dividen el conjunto de datos en cien partes iguales, son como los deciles pero de uno en uno por ciento, y por tanto son noventa y nueve. Los percentiles representan los valores de la variable que estn por debajo de un Porcentaje. Ejemplo, el percentil 48 deja por debajo al 48% de la distribucin.
Relacionando las medidas de posicin, se tiene que la mediana es el segundo cuartil, 5 decil y 50 percentil, as: Mn=Q2= d5=P50. El percentil nos permite des-agregar ms an la distribucin que el decil.

Determinacin de la posicin del punto percentil, se lo hace: Pk = Donde: k: Valor del punto percentil 2, 3, 10, 30, 40, 50, etc.
88

f: Sumatoria de frecuencias. La frmula para calcular el valor percentil es:

Donde: Vk: Valor del percentil que se busca. Lri: Lmite real inferior. Pk: Punto percentil k. f am: Frecuencia acumulada menor. f: Frecuencia en el punto percentil. I: Ancho del intervalo de clase. Ejemplo: De un registro de la altura de reclutas de un cuartel se est interesado en conocer el 25o punto percentil, 40o y 65o ALTURA 17 18 17 17 9 3 16 17 4 8 16 16 9 3 15 16 4 8 9 Total 3 f 22 28 15 32 18 11 5 fa 11 93 5 65 50 18

P65 P25 y

89

V40 = V25 = 165,2

Respuesta: Tanto el 25% como 40% del total de los reclutas tiene una altura menor a los 165,2 cm: mientras que el 60% de ellos tienen una altura menor a los 176,7 cm. EJERCICIOS En el estudio de un cierto fenmeno se obtiene la siguiente tabla: xi ni 7 6 10 7 12 16 16 17 19 22 20 19 21 17

Calcular los quartiles Q1 y Q3 correspondiente.


90

Los jugadores de un determinado equipo de baloncesto se clasifican por altura segn la tabla siguiente:

Altura

1,70-1,75 1,90-195 Nmero 1 jugadores 5

1,75-1,80 1,80-1,85 1,85-190 1,95-2,00 3 4 8 2

Se pide calcular los cuartiles 1 y 3.

91

7.0 MEDIDAS DE DISPERSIN Tratan de medir el grado de dispersin que tiene una variable estadstica respecto a una medida de posicin o tendencia central. La representatividad proviene de su dispersin, a mayor dispersin menor representatividad de la medida de posicin y viceversa. Se entiende por dispersin o variabilidad, a la mayor o menor separacin de los valores de la muestra, respecto de las medidas de centralizacin que hayamos calculado. Podemos concretar diciendo que las medidas de dispersin se basan en la idea de medir las diferencias entre unos datos y otros midiendo las diferencias de cada dato con la media, esto es, usando las desviaciones; pero como stas siempre suman cero, es preciso considerar su valor absoluto o su cuadrado para que ello no ocurra. Para comprender el comportamiento de una serie de datos no es suficiente determinar las medidas de tendencia central, es importante conocer cuan alejados se encuentran los datos respecto a su punto de concentracin. La importancia del estudio de las medidas de variacin es que pueden medir el grado de variacin de una serie de datos y cuan representativo de la distribucin es el promedio. Las medidas de dispersin ms utilizadas son: Recorrido.
92

Desviacin media. Varianza. Desviacin estndar. Coeficiente de variacin.

7.1 Recorrido. En una observacin cuyos datos son numricos, el recorrido o amplitud es la diferencia entre los valores extremos. El valor de la diferencia depende de los valores de los individuos que se encuentran en los extremos. El recorrido o amplitud (A) es la diferencia entre el mayor valor y menor valor que se presente entre los datos. Ejemplo: Si se tienen los valores 22 35 36 37 44 47 48 A = 48 - 22 = 26 25 28 30 31

93

7.2 Desviacin Media La desviacin media (Dm) es la media aritmtica de los valores absolutos de las desviaciones con relacin a un valor medio. Se puede calcular a partir de la media aritmtica o de la mediana. La desviacin media es til para tratar con pequeas muestras que no requieren anlisis muy complejos. Para conocer con un solo indicador que tan disperso se encuentran un conjunto de datos a un punto de concentracin, debemos como primera medida, calcular la distancia de cada dato respecto a la media aritmtica. Por ejemplo: 5 1 3 2 4 4 1 2 1 2 2 3 1 3 1 1 2 3 2 1

Tenemos que la media aritmtica es 2.2 (indicador de tendencia central por excelencia). El primer dato (5), se aleja de la media en 2.8 hacia la derecha.

94

Grficamente tendramos:
2.8 1.8

95

Para el segundo dato (4) la distancia es de 1,8 respecto a la media aritmtica: Para responder a la pregunta de qu tan disperso estn los datos respecto a la media aritmtica?, recurriremos nuevamente al promedio simple. Para llegar a una frmula bsica de dispersin, en que las distancias positivas y negativas no se eliminen, modificaremos la frmula anterior para trabajar solo con distancias positivas mediante el valor absoluto:

Para una serie estadstica la desviacin media se calcula con la siguiente forma:

(X - ): Sumatoria de las diferencias entre el valor de la variable y la media aritmtica. d : Valor absoluto de la sumatoria de las desviaciones.

96

1) Calcular la desviacin media para las densidades de los lquidos. Densidad Desviacin 1,26 0,32 1,06 0,12 1,04 0,10 1,02 0,08 0,90 -0,04 0,79 -0,15 0,73 -0,21 0,72 -0,22 7,52 1,24 0,16 es el valor con que se separan cada una de las densidades con respecto a la media aritmtica. 2) Clculo de la desviacin media para una serie estadstica de frecuencia. Se considera en el ejemplo los datos de las mismas densidades pero repetidos. Densidad X 1,26 1,06 1,04 1,02
97

f 2 1 3 6

X.f 2,52 1,06 3,12 6,12

d 0,31 0,11 0,09 0,07

f.d 0,62 0,11 0,27 0,42

0,90 0,79 0,73 0,72 Total..

1 3 2 2 20

0,90 2,37 1,46 1,44 18,9 9

-0,05 -0,16 -0,22 -0,23

-0,05 -0,48 -0,44 -0,46 2,85

3) Clculo de la desviacin media para una serie estadstica de intervalos. Ejemplo: Se registraron las siguientes velocidades iniciales de las balas que imprimieron 33 fusiles, calcular su desviacin media.
X 851 - 900 801 - 850 751 - 800 701 - 750 651 - 700 600 - 650 98 f 6 4 5 7 6 5 Mc 875, 5 825, 5 775, 5 725, 5 675, 5 625, Mcs u 3,00 2,00 1,00 725, 5 0,00 -1,00 -2,01 f.u 18,00 8,00 5,00 0,00 -6,00 d 118,2 68,2 18,2 -31,8 -81,8 f.d 709,27 272,85 91,06 -222,52 -490,73

-10,05 -132,3 -661,44

0 Totales.. 33 20,98 2002,83

Donde: Mc: Punto medio de clase. Mcs: Punto medio de clase supuesto.

.I

7.3 Varianza La variancia es el promedio de la sumatoria de los cuadrados de las desviaciones. Mide la mayor o menor dispersin de los valores de la variable respecto a la media aritmtica. Es un indicador del alejamiento de los valores respecto de su valor medio. El valor de la variancia depende de las desviaciones, cuanto mayor sean las desviaciones en relacin a la media aritmtica, mayor ser el valor de la variancia.

99

En la varianza el valor de sus unidades no la podemos usar porque se expresan al cuadrado; para hacerlo, es preciso tomar la raz cuadrado de los mismos, este nuevo valor, se lo conoce como desviacin estndar.

Donde: N: Nmero total de casos. La varianza para datos de la poblacin se representa con 2 y para datos muestras con S2. Las frmulas deben definirse segn se trate de datos agrupados o no. 7.4 Desviacin Estndar La desviacin estndar es la raz cuadrada del promedio de la desviacin o diferencias de cada uno de los valores con respecto a la media. Equivale a la raz cuadrada de la varianza. El mayor valor o menor valor de la desviacin estndar, expresa la mayor o menor desviacin de los datos respecto a la media. Si no existe variacin en los datos o variables observadas, todas ellas sern iguales a su media; por lo tanto, las desviaciones respecto a la media
100

sern iguales a cero y el valor de la desviacin estndar es cero.

Para el clculo de la desviacin con datos agrupados o no se precede de la siguiente forma: 7.4.1 Desviacin tpica de una serie estadstica. Ejemplo: Calcular la desviacin estndar en decibelios (dB), con los datos de ruido medidos en 10 sitios diferentes. x 67,9 70,2 68,8 77,1 62,7 71,1 81,9 63,2 82,7 78,1 723,7 n=10
101

x^2 4610,41 4928,04 4733,44 5944,41 3931,29 5055,21 6707,61 3994,24 6839,29 6099,61 52843,55

s = 6,85

7.4.2 Desviacin tpica de una serie estadstica de frecuencia. Ejemplo: Determinar la desviacin tpica de las lecturas de temperatura obtenida por una estacin meteorolgica. x 27,1 27,4 28,9 29,1 29,2 29,5 29,8
102

f 5 2 6 4 3 5 4

f.x 135,5 54,8 173,4 116,4 87,6 147,5 119,2

x^2 734,41 750,76 835,21 846,81 852,64 870,25 888,04

f.x^2 3672,05 1501,52 5011,26 3387,24 2557,92 4351,25 3552,16

30,3 Total..

7 36

212,1 1046,5

918,09 6696,21

6426,63 30460,03

S = 1,97

7.4.3 Desviacin tpica de una serie estadstica de intervalo. Ejemplo: En cuarenta sitios de la ciudad se midieron los niveles de ruido, calcular las variacin de las variables o datos observados en torno al promedio.
x f 5 9 7 8 4 4 Mc 82,6 77,6 72,6 67,6 62,6 57,6 Mc^2 6822,8 6021,8 5270,8 4569,8 3918,8 3317,8 f.Mc 413 698,4 508,2 540,8 250,4 230,4 f.Mc^2 34113,8 54195,84 36895,32 36558,08 15675,04 13271,04

80,6 75,6 70,6 65,6 60,6 55,6

84,6 79,6 74,6 69,6 64,6 59,6

103

50,6

- 54,6

3 40

52,6

2766,8

157,8 2799,0

8300,28 199009,4

Totales

S= 8,87

EJERCICIOS Se ha preguntado a 40 personas el nmero de personas que forman sus hogares, teniendo los siguientes resultados:
No personas en el hogar Frecuencia 2 4 3 11 4 11 5 6 6 6 7 2

Calcula la media, la mediana, la moda y la desviacin tpica. b. Haz el diagrama correspondiente.


a.

104

7.5 Coeficiente de Variacin El Coeficiente de Variacin es una medida de variacin relativa, ms que una medida de variacin absoluta, expresa la desviacin estndar como un porcentaje de la media. Se define al coeficiente de variacin de Pearson como el cociente entre la desviacin estndar y la media aritmtica de una distribucin. La frmula est dada por la expresin:

Como la desviacin estndar y la media se expresan en la misma unidad de medida, sta se anula, obtenindose una unidad de medicin independiente o medida adimensional. El coeficiente de Pearson se usa cuando se trata de comparar la dispersin entre dos poblaciones en las que las unidades de medida (desviacin estndar) son distintas, o que an teniendo la misma unidad de medida difieren en sus magnitudes. Ejemplo: Se desea comparar dos muestras sobre la produccin de dos parcelas de diferentes aos que tienen los siguientes resultados;

105

Datos Periodo Produccin media Desviacin estndar

Parcela 1 3 aos 620 Kg 5 Kg

Parcela 2 2 aos 390 Kg 5 Kg

La comparacin de las desviaciones estndar podra llevar a concluir que las dos muestras poseen igual variabilidad. Sin embargo, si se calculan los coeficientes de variacin para las parcelas se tiene los siguientes resultados: Parcela 1: Parcela 2: Los resultados del coeficiente de variacin expresan que a pesar de que las muestras tienen el mismo valor de desviacin estndar tienen diferentes dispersiones de sus datos respecto a la media. Ejemplo: As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de 69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mm Hg) cuya media es de 166 mm Hg y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms dispersa, el peso o la tensin arterial? Si comparamos las
106

desviaciones tpicas observamos que la desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin: CV de la variable peso =

CV de la variable TAS = A la vista de los resultados, observamos que la variable peso tiene mayor dispersin. A diferencia de la desviacin estndar que se expresa con la misma unidad de los datos observados, el coeficiente de variacin se expresa en porcentaje, lo cual, facilita comparar el nivel de dispersin de dos muestras. Por ejemplo, no se puede comparar el nivel de dispersin de una serie de datos de densidad de metales que se expresa gr/cm3, con otra serie que corresponda a la resistencia a la compresin que se expresa en kg/cm2. En cambio, sus coeficientes de variacin son ambos porcentajes, por lo que s se pueden comparar. Se puede concluir que el coeficiente de variacin, adems, presenta los siguientes aspectos:
107

a. Es un valor estadstico til para comparar la dispersin de conjuntos de datos que tienen distintas desviaciones estndar y distintos promedios. b. El coeficiente de variacin pierde su utilidad cuando la media se aproxima a cero. EJERCICIOS 1. Los jugadores de un determinado equipo de baloncesto se clasifican por altura segn la tabla siguiente:
Altura # jugadores 1.711.75 1 1.761.80 3 1.81185 4 1.861.90 8 1.911.95 5 1.962.00 6

Se pide analizar calcular la desviacin tpica. La media y la desviacin tpica de los puntos conseguidos por Iliana y Roco en una semana de entrenamiento jugando al baloncesto han sido las siguientes: media de Iliana 22 puntos y desviacin tpica 4,106. Media de Roco 22 puntos y desviacin tpica 2. Calcula el coeficiente de variacin de cada una de ellas. a. Cul de las dos ha sido ms regular?
108

8.0 MEDIDAS DE DISTRIBUCIN Las medidas de distribucin permiten identificar la forma en que se encuentran dispersos los valores de las observaciones en una representacin grfica. La importancia de estas medidas se fundamenta en establecer la distribucin prescindiendo del grfico. Las medidas de distribucin ya no trata de determinar la magnitud de la dispersin de las variables con respecto a la media, sino, la de analizar como los datos se distribuyen en torna a ella. Las principales medidas de distribucin son las de Asimetra y la de Curtosis

8.1 Asimetra La asimetra es la medida que permite determinar si los datos se distribuyen de manera uniforme alrededor de su valor medio. Esta medida cuantifica el grado de asimetra de la distribucin en torno a una medida de tendencia central. De acuerdo como se distribuyen los datos respecto al eje de simetra se presentan los siguientes casos: Simetra positiva, cuando los datos estn por arriba de la media aritmtica.
109

Asimetra negativa cuando la agrupacin de valores est por debajo de la media.

Simtrica si aproximadamente los valores de la observacin se distribuyen por igual a ambos lados de la media.

110

La asimetra se puede calcular por medio del Coeficiente de asimetra o de Fisher con la siguiente ecuacin:

Donde: g1: Coeficiente de asimetra de Fisher. Xi: Valores de la variable Media aritmtica f : Frecuencia de cada valor Para los valores del coeficiente se tiene que: g1 = 0 La distribucin es Simtrica. Existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). g1 > 0 La curva es asimetra positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media.

111

g1 < 0 La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media. Desde luego entre mayor sea el nmero, positivo o negativo, mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.

8.2 Coeficiente de Curtosis Es una medida de asimetra que expresa la intensidad de concentracin de los valores en la regin central de la distribucin. Segn Curtosis se presentan tres tipos de distribucin: Distribucin mesocrtica: Se expresa cuando el grado de concentracin se encuentra alrededor de los valores centrales de la variable. Cuando esto ocurre se tiene entonces una distribucin normal.

112

Curva Mesocrtica

Distribucin leptocrtica: Es cuando las observaciones presenta un elevado grado de concentracin alrededor de los valores centrales de la variable.

113

Curva Leptocrtica

Distribucin platicrtica: Es cuando existe un bajo grado de concentracin alrededor de los valores centrales de la variable.

Curva Platicrtica
114

La frmula que define el clculo del Coeficiente de Curtosis es la siguiente:

Para los diferentes valores del coeficiente se tiene: g2 = 0 (distribucin mesocrtica). g2 > 0 (distribucin leptocrtica). g2 < 0 (distribucin platicrtica). Ejemplo: Calcular el coeficiente de Curtosis para los datos de resistencia hmica obtenida de algunos de aparatos elctricos.
Valor 2,7 2,8 2,9 3,4 4 4,5 4,7 4,8
115

f 1 4 4 2 1 2 3 3

(Xi-Xm)^4*ni (Xi-Xm)^2*ni 4,5892 2,1422 13,8310 7,4380 10,1988 6,3871 0,6801 1,1663 0,0007 0,0268 0,0256 0,2263 0,2483 0,8631 0,4920 1,2149

5,2 5,3 5,5 11 Media=

4 3 3 30 4,16

4,6143 5,0025 9,5680 49,2505

4,2962 3,8740 5,3576 32,9924

El resultado de -1,5072 correspondiente al Coeficiente de Curtosis seala que se trata de una distribucin platicrtica, esto es, de una baja concentracin de los valores centrales de la distribucin.

116

9.0 ANLISIS DE ASOCIACIN. Es muy frecuente encontrar variables que se encuentran relacionadas entre s; por ejemplo, la intensidad de la corriente elctrica se asocia con otros factores como el voltaje y la resistencia. En el crecimiento de una planta estn relacionados factores como el tipo del suelo, cantidad de agua, disponibilidad de nutrientes, etc. La asociacin o forma como estn vinculadas las variables nos lleva frecuentemente a formular preguntas como: la densidad de los metales est relacionado con su resistencia?, el dimetro de un cableado tiene que ver con la intensidad de la luz elctrica?, la demanda de un artculo depender de su precio en el mercado? El anlisis de asociacin de variables permite establecer la relacin entre dos o ms variables que expresen un cierto grado de dependencia o asociacin entre ellas; asociacin, que puede medirse por medio de una funcin o modelo matemtico. El problema principal cuando se analizan datos bivariantes (se caracterizan porque tienen dos medidas, ejemplo: peso y altura, dimetro y resistencia) o multivariantes (con tres medidas, ejemplo: longitud, dimetro y resistencia) es llegar a descubrir y medir la asociacin y covariacin ente las variables, as como, determinar como las variables varan juntas. A este procedimiento se conoce como Estimacin por Asociacin.

117

La estimacin por asociacin es una prediccin que busca expresar la naturaleza de las relaciones de las variables, en forma matemticamente precisa, de modo que se pueda predecir el valor de una variable con base en la otra. Dicha estimacin se puede lograr por medio del anlisis de regresin y del anlisis de correlacin.

9.1 Covariancia Es la medida de la asociacin entre las magnitudes de dos caractersticas. Cuando la asociacin de las magnitudes es pequea o nula la covariancia tiende a cero. La covariancia es positiva cuando los valores grandes de una caracterstica tienden a asociarse con los valores grandes de otra. Es negativa, si los valores grandes de una caractersticas se asociacin con los valores pequeos de otra caracterstica. Dos variables estn variando conjuntamente y en el mismo sentido cuando al crecer los valores de cada uno de ellas, aumentan los valores los valores de la otra. Pero tambin pueden variar en sentido contrario, esto es, cuando crecen los valores de la una, disminuyen los de la otra. La variancia de la poblacin X y Y se simboliza con xy; y los de la muestra, por sxy.

118

La frmula de la covariancia es:

Ejemplo: Calcular el grado de asociacin que existe entre el dimetro y la longitud de las probetas.
Var Valores Sumas Y 4 6 8 9 12 8 10 12 8 6 83 X 12 10 19 12 15 20 24 18 25 15 170

Media de Y = 8,3 Media de X = 17,0

119

9.2 Correlacin Permite analizar en una distribucin bidimensional la relacin que guardan entre s dos variables. La intensidad de esta relacin puede ser determinada por un ndice numrico conocido como coeficiente de correlacin lineal. La aplicacin del coeficiente de correlacin es posible cuando la relacin entre las variables es lineal, esto es, si despus de graficar los pares de valores de las variables se observa que la nube de puntos se aproxima a una recta. El coeficiente de correlacin de una poblacin bidimensional se representa por (rho), siendo su estimador r. La correlacin puede ser lineal o lineal. Es lineal cuando la relacin entre las dos variables puede ser representada por una lnea recta, y es no lineal cuando la correlacin est representada por una lnea curva. Adems, de acuerdo a los fenmenos que relaciona a dos variables, la correlacin puede ser perfecta, imperfecta y nula. En la perfecta la variacin de los fenmenos se corresponden en forma igual. En la correlacin imperfecta la variacin de uno de los fenmenos se pude corresponder con la variacin del
120

otro fenmeno, pero no se puede llegar al valor de una determinacin. En la nula, no existe relacin entre los fenmenos. De acuerdo con el signo la correlacin se considera positiva o directa y negativa o inversa. Es positiva cuando las dos variables aumentan o disminuyen en el mismo sentido. Es negativa cuando se comportan en sentido contrario.

9.2.1 Diagrama de Puntos o dispersin Es un grfico que representa un conjunto de datos y de conclusiones deducibles de esos datos. Los datos representan los valores de las variables X y Y que pueden encontrarse distribuidos en el primer cuadrante de un sistema de coordenadas; y, el diagrama de dispersin que se establezca se obtendr por la ubicacin de los valores de X en la abscisa y de la variable Y en la lnea vertical. La primera se toma como la variable independiente y la Y como la variable dependiente. De acuerdo con los diagramas de dispersin se ilustran los tipos de correlacin.

121

122

En el diagrama de la Figura A todos los puntos tienen una tendencia situarse sobre una lnea recta ascendente de izquierda a derecha, con lo que se define una correlacin perfecta. En el diagrama de la Figura B, los puntos tambin caen sobre una lnea recta, pero descendente; siendo tambin, una correlacin perfecta. La correlacin puede asumir valores positivos o negativos. La correlacin es positiva cuando una de las variables incrementa la otra se incrementa tambin y viceversa (cuando ambas decrecen). La correlacin es negativa cuando una de las variables se incrementa, la otra disminuye. En las Figura C, D y F se presenta una relacin evidente, pero sta no es de tipo lineal. No existe correlacin cuando graficado los puntos se muestran como en la Figura G.
123

La frmula del coeficiente de correlacin lineal simple es:

El coeficiente de correlacin siempre debe encontrarse en el rango de -1 a +1, lo que equivale a una correlacin perfecta. Como el coeficiente de correlacin es una expresin numrica que expresa el grado de concomitancia que existe entra las dos variables, es importante definir la significacin de sus valores: 0.70 0.40 0.10 r= r +1 r 0.69 r 0.39 -1 Correlacin alta, perfecta y positiva. Correlacin moderada. Correlacin baja. Correlacin alta, perfecta y negativa.

A partir del coeficiente de correlacin lineal se calcula el coeficiente de determinacin, el cual, permite evaluar qu porcentaje de la variabilidad total de la variable dependiente es atribuible a la variable independiente. El coeficiente de determinacin (rd) equivale al valor del coeficiente de correlacin lineal elevado al cuadrado.

124

9.3 Regresin Lineal Simple Las variables cuantitativas en la mayora de los casos se encuentran relacionadas en algn grado con otras. La dependencia, asociacin o forma de relacionarse, es lo que hace posible que una de las variables pueda matemticamente expresarse en funcin de la otra. Por ejemplo: la resistencia a la flexin est relacionada con la densidad del cuerpo; la resistencia al esfuerzo cortante con el dimetro de una soldadura; la dureza de un cuerpo est relacionada con su densidad; la intensidad del viento se relaciona con su velocidad; el flujo de las emisiones gaseosas con la temperatura; el monto de un salario con el nivel educativo, etc. En este tipo de relacin se considera al valor de la variable dependiente como Y, que depende en cierto grado de la variable independiente X. La variable dependiente es una variable aleatoria, pero los valores de la variable independiente son cantidades fijas que el analista o investigador selecciona y controla. La relacin media entre X y Y se puede describir con una ecuacin lineal, cuya representacin geomtrica es una lnea recta.

125

La altura de la lnea seala un valor medio de Y para un valor fijo de X. Cuando X = 0 el valor medio de Y es igual a A. El valor de A se llama ordenada al origen y es el punto en que la lnea recta cruza el eje Y. La pendiente es el grado de inclinacin de la recta. Si es positiva, la recta es creciente. Si es negativa es decreciente. Es el cociente entre el incremento que se produce en la variable dependiente, Y, cuando se incrementa la variable independiente, X. La pendiente se mide por B que da la cantidad media de cambio de Y por unidad de cambio en el valor de X. B indica el tipo de relacin entre X y Y. La ecuacin de regresin para el modelo de regresin lineal bivariante es:
126

Donde A y B son los coeficientes de regresin poblacional. La tarea principal del anlisis de la regresin es estimar A y B. Se puede representar por a y b las estimaciones de A y B, entonces la ecuacin de regresin muestral se convierte en: y = a + bx de donde:

El coeficiente a se puede determinar tambin como:

: Media aritmtica de valores de x : Media aritmtica de valores de y Ejemplo:

127

Las siguientes muestras de acero con diferentes porcentajes de concentraciones de carbono1 fueron sometidas a ensayo de resistencia a la tensin (lb/plg 2), tenindose los siguientes datos:
% Carbono 6 22 11 0 28 132 36 15 8 41 20 1 48 20 8 59 215 72 71 27 284 5

Tensin (miles) 85

Determine la relacin de dependencia que existe entre las variables de la composicin de los aceros a diferentes porcentajes de concentracin de carbono con la resistencia a la tensin. Clculos: Para simplificar las operaciones de clculo la tensin ha sido dividida para mil. %Carbono Tensin x y 6 22 28 36 41 48 59
1

xy 510 2420 3696 5688 8241 9984 12685

x^2 36 484 784 1296 1681 2304 3481

85 110 132 158 201 208 215

Los aceros al carbono son una mezcla de hierro y carbono, siendo el hierro el solvente y el carbono el soluto. Los tomos de carbono se ubican en los intersticios que existen entre los tomos de hierro.

128

72 71 383

275 284 1668

19800 20164 83188

5184 5041 20291

a = 185,44 3,06*42,55 55,26 = 42,55 = 185,44

Respuesta: En cuanto a la relacin de dependencia se tiene que por cada unidad de incremento porcentual de carbono en el acero, su resistencia se incrementa 3,06 veces. Luego, la ecuacin de la recta que calcula la prediccin de los valores es:

129

El ajuste de la recta de regresin y el clculo de los coeficientes a y b, tambin puede ser deducidos con el siguiente procedimiento.

a. Construccin del diagrama de dispersin.

y Tensin

% Carbono b. Uso de frmulas a desarrollar:

= a + bx

1 2

130

3 c. Elaboracin de la tabla de valores: %Carbono Tensin xy x y 6 85 510 22 110 2420 28 132 3696 36 158 5688 41 201 8241 48 208 9984 59 215 12685 72 275 19800 71 284 20164 383 1668 83188 Teniendo los siguientes valores: x^2 36 484 784 1296 1681 2304 3481 5184 5041 20291

d. Sustitucin de valores en las frmulas 2 y 3

1668 = 9(a) + b(383)

131

83 188 = a(383) + b(20 291)

e. Se resuelve el sistema de ecuaciones resultantes y se tiene que:

b = 3.06 a = 55.26

y = 55.26 + 3.06x

Ejemplo. Se desea conocer el esfuerzo de corte que requiere para cortar un material con una dureza de 760 kg/cm2. Los datos obtenidos de los ensayos fueron los siguientes:
Esf corte 18. 8 331 Dureza . 35. 9 56. 9 7. 6 6. 8 14. 8 27. 7 18. 9 45. 7 24. 5 64. 5 35. 7 72. 8 14. 9 86. 0 22. 26.8 0 48. 47.6 0

Adems, dibuje el grfico de dispersin y la recta de regresin. Ejemplo.


132

Si el punto de interseccin de la recta de regresin coincide con el punto de cruce en origen de las coordenadas, cul sera el esfuerzo de corte sabiendo que el valor de la pendiente es de 1.02 y la dureza de 65.22.

133

9.4 La Regresin como ecuacin predictiva La ecuacin de la regresin muestral se conoce como ecuacin predictiva, porque su funcin es predecir el valor medio de y; o, el valor de una observacin individual de y asociado con un valor determinado de x. La eficiencia predictiva depende de la variabilidad de los valores individuales de y provenientes de los valores calculados (promedios) de y asociados con los valores de x. Ejemplo: Si se desea predecir la resistencia de un acero para una concentracin de carbono de 20%, se tendra lo siguiente: yc = 55,26 + 3,06 * 20 = 116,46 Como los valores de la tensin se dividieron para mil, ahora el resultado debe multiplicarse por mil, entonces, la resistencia que se tiene es de 116.460 lb/plg2

134

10.0 ANLISIS DE VARIANZA DE LA LNEA DE REGRESIN SIMPLE. Es importante conocer el nivel de precisin de la lnea regresin con los datos. La lnea de regresin es una media movible que proporciona un valor medio de Y asociada con un valor particular de X. Los valores observados de Y pueden estar por arriba o por debajo de la lnea de regresin, de la misma forma como se ubican respecto a la media general de Y. El anlisis de variancia se utiliza para comparar las medias de las variables que participan en un experimento, para probar e inferir si entre ellas existen o no verdaderas diferencias. Se consideran tres las etapas correlativas que hay que observar para desarrollar el mtodo del anlisis de variancia, las cuales son: a. A su vez, tiene las siguientes fases: i. Se debe identificar las fuentes o causas de variacin con sus correspondientes grados de libertad. Se determina las sumas de cuadrados para cada una de las fuentes de variacin.

ii.

135

iii. iv.

Se calcula las variancias o cuadrados medios. Se realiza la prueba de significacin, conocida tambin como Prueba de F o razn de las variancias.

b. Se elabora el cuadro del Anlisis de Variancia. c. En esta etapa se procede a la interpretacin de los resultados del anlisis estadstico.

El anlisis de varianza considera bsicamente determinar los siguientes valores:

La suma de cuadrados corregidos para Y. La suma de cuadrados de reduccin o suma de cuadrados de la regresin. SC REDUCCIN. La suma de cuadrados residual. SC Residual. La suma de cuadrados corregidos para Y, estima la cantidad de variacin de los valores individuales de Y respecto al valor medio de Y. La frmula que lo calcula es:

La suma de cuadrados de reduccin determina la cantidad de variacin en Y que est asociada con la regresin sobre X. Su frmula:
136

La suma residual de cuadrados constituye la porcin de la variacin total en Y que no est asociada con la regresin y se deduce con la frmula: SC RESIDUAL = En el ejemplo que se establece a continuacin, mediante el anlisis de varianza, se busca conocer el nivel de precisin que tienen los datos con la lnea de regresin. Se aplican los datos del ejemplo anterior.
% Carbono 6 22 11 0 28 132 36 15 8 41 20 1 48 20 8 59 215 72 71 27 284 5

Tensin (miles) 85

%Carbono Tensin x y 6 22 28 36 41 48 59 72 71
137

xy 510 2420 3696 5688 8241 9984 12685 19800 20164

x^2 36 484 784 1296 1681 2304 3481 5184 5041

85 110 132 158 201 208 215 275 284

383

1668

83188

20291

Suma de cuadrados corregidos:

Suma de cuadrados de Reduccin:

Suma de cuadrados residual: SC RESIDUAL = = 1432.90

Cuadro del Anlisis de Varianza de la Regresin


FUENTE DE VARIACIN SC REGRESIN SC RESIDUAL TOTAL GL SC CM Fc

(t-1)=1 37315,10 37315,10 182,29 (n-2)=7 1432,90 204,70 (n-1)=8 38748,00

138

En el anlisis de varianza de la regresin se usa la variacin inexplicada para probar la cantidad de variacin atribuible a los tratamientos, para lo que se aplica la prueba de F. Para encontrar el valor de la F tabular o Snedecor con el que se va a comparar el valor de Fc, es necesario conocer los grados de libertad del numerador, en este caso, corresponde al de la SC de Regresin, m=1; y los grados de libertad del error, que corresponde a la SC Residual, n=7. Con estos valores se escogen dos niveles: nivel de 0.05 (o nivel al 5%) y nivel 0.01 (o nivel al 1%); luego, con estos datos, el valor tabulado de F tabular tiene:

La regresin se prueba para la F calculada (Fc) y su valor de (en este caso) de 182,29 se compara con la F tabular de Snedecor con 1/7 grados de libertad, se observa que es bastante mayor, lo que permite concluir que la regresin se acepta como significativa al nivel de 0.01, sealndose entonces como altamente significativa. Se determinamos el coeficiente de correlacin (r), tenemos que:

139

El valor obtenido est indicando que existe una alta correlacin entre los niveles o porcentajes de carbono en el hierro con su resistencia a la tensin. Otra forma de calcularlo. Se procede con los datos del mismo ejemplo y se tiene:
%Carb Tensin x 6 22 28 36 41 48 59 72 71 383 y 85 110 132 158 201 208 215 275 284 1668 dx -36,56 -20,56 -14,56 -6,56 -1,56 5,44 16,44 29,44 28,44 dy -100,33 -75,33 -53,33 -27,33 15,67 22,67 29,67 89,67 98,67 dx.dy 3667,74 1548,52 776,30 179,19 -24,37 123,41 487,85 2640,19 2806,52 12205,3 3 dx^2 1336,31 422,53 211,86 42,98 2,42 29,64 270,42 866,98 809,09 3992,22 dy^2 10066,78 5675,11 2844,44 747,11 245,44 513,78 880,11 8040,11 9735,11 38748,00

140

Reemplazando:

Resultado igual que el anterior. Finalmente, si se calcula el coeficiente de determinacin (r2) para evaluar que porcentaje de la variabilidad total de la resistencia a la tensin se atribuye a los niveles o porcentajes de contenido de carbono, se tiene: Coeficiente de Determinacin = r2 = 0.98^2 = 0.96 El valor del coeficiente de determinacin est sealando que un 96% de la variacin de las resistencias a la tensin se atribuye o depende de los niveles o concentracin de carbono. Otro procedimiento para calcular el coeficiente de determinacin (r2) consiste en dividir la suma de cuadrados de reduccin o de regresin para la suma de cuadrados corregidos

141

Ejemplo. Un grupo de mquinas de distintas velocidades produjo los siguientes artculos defectuosos (P), tal como se exponen los datos en el cuadro. Se pregunta: a. Cuntos artculos defectuosos se produciran en una mquina que trabaja a una velocidad de 14800 RPM.
b. Determine cul es el nivel de significacin en la

produccin los artculos defectuosos.

142

11.0 PROBABILIDAD Introduccin La probabilidad se ha definido de distintas formas, en general, cuando hablemos de probabilidad se lo hace en referencia a la probabilidad de un suceso y se la entiende como una medida cuantificada de la verosimilitud de ocurrencia de un suceso frente a los dems sucesos de un experimento.

Se la define tambin como el grado de incertidumbre en la ocurrencia de los resultados de un experimento. En todo caso la probabilidad de un suceso es una medida que se puede cuantificar, que toma valores entre cero y uno a diferencia del concepto de posibilidad que es una medida cualitativa. El estudio de los conceptos y las propiedades del azar ms el desarrollo matemtico de los mismos, es lo que hace de la probabilidad un instrumento fundamental para toda clase de estudio que contenga incertidumbre. El azar permite estudios rigurosos y cientficos que pueden expresarse a travs de frmulas matemticas, condiciones en las que probabilidad se fundamenta para determinar la frecuencia con que puede presentarse un resultado determinado cuando se realiza un experimento.

143

La estadstica tiene por objeto el estudio y comportamiento de fenmenos. Estos fenmenos son a su vez el resultado de una experimentacin, por lo que podemos hablar indistintamente de fenmenos y experimentos aleatorios. El experimento aleatorio es aquel que puede dar varios resultados, anticipadamente no se puede predecir cual es el que se va a producir en una experiencia concreta. Los experimentos se pueden clasificar en deterministas y aleatorios. Los experimentos deterministas son aquellos que realizados de una misma forma y con las mismas condiciones iniciales, ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial de reposo, y dejado caer al vaco desde una torre, llega siempre al suelo con la misma velocidad:

Cuando en un experimento no se puede predecir el resultado final, hablamos de experimento aleatorio. Este es el caso cuando lanzamos un dado y observamos su resultado. Mientras que los aleatorios, aun cuando las condiciones del experimento no cambien el resultado del experimento es impredecible antes de realizarlo. Por ejemplo, ante el hecho de lanzar una moneda al aire no sabremos si saldr cara o cruz. Son tambin experimentos aleatorios la cotizacin de
144

las acciones de una empresa, sus beneficios, sus ventas, su periodo de actividad, etc.). En general diremos que las caractersticas de un experimento aleatorio son las siguientes: a) En circunstancias similares, el experimento se puede repetir u observar de forma indefinida. b) Aunque no se pueda predecir el resultado si se puede conocer el conjunto de todos los posibles resultados. c) Cuando se repite pocas veces un experimento, los resultados parecen mostrar un comportamiento catico, mientras que si se repite un nmero infinito de veces comienza a obtenerse una regularidad en el comportamiento de los resultados. Cuando el experimento es aleatorio puede presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto an realizando el experimento en las mismas condiciones. Nunca se conoce que resultados se va ha obtener. Por ejemplo: Si se lanza una moneda al aire y queremos saber cual es la posibilidad que salga un nmero 1, o que salga un nmero impar, o que salga un nmero menor que 3.

145

Al lanzar una moneda al aire el resultado puede ser cara o cruz, pero anticipadamente no se conoce cual de ellos va a salir.

No se puede aplicar las reglas de la probabilidad a experimentos que no son aleatorios. Por ejemplo, si se selecciona directamente en una moneda la cruz, entonces no se puede hablar de probabilidad, sino de un resultado impuesto por uno mismo. La probabilidad de un evento se representa con P. Luego, P(A) significa la probabilidad de que ocurra el evento A en una sola observacin o experimento. Cero es el menor valor que puede tener un enunciado de probabilidad lo que significa que el evento es imposible. El mayor valor corresponde a 1 y significa que el evento ocurra. De aqu que: 0 P(A) 1 En todo experimento un evento debe o no ocurrir. Por consiguiente, la suma de la probabilidad de la ocurrencia mas la probabilidad de la no ocurrencia siempre ser igual a 1. Si se tiene que A representa la no ocurrencia del evento A, se tiene: P(A) + P(A) = 1

146

11.1 Espacio Muestral Una de las caractersticas del experimento aleatorio es que se puede saber el conjunto de todos sus posibles resultados, aunque los resultados individuales no son predecibles con anterioridad. Toda experiencia lleva a la obtencin de un resultado, pero no siempre ste es previsible con certeza o precisin adecuadas. A pesar de esta imposibilidad de prediccin si podemos plantearnos cules son los resultados esperables de un experimento. A este conjunto de resultados lo llamamos espacio muestral. El espacio muestral puede ser finito o infinito. Es finito si est formado por un conjunto finitos de resultados. En los espacios infinitos se establecen los infinitos numerables e infinitos no numerables. Los espacios finitos y los infinitos numerables se los conoce como espacios discretos, mientras a que los infinitos no numerables se denominan continuos. Se llama espacio muestral al conjunto de los posible resultados de un experimento o situacin aleatoria y se lo representa por la letra E. El resultado de un experimento o prueba se llama resultado, punto muestral, suceso o evento elemental. Cada experimento aleatorio tiene
147

definido su espacio muestral, esto es, un conjunto con todas las soluciones posibles. Se tendr siempre presente que un espacio muestral siempre est asociado con un experimento. El espacio muestral puede ser un nmero, el resultado de una sucesin de caras o sellos, un vector o una funcin. Es importante establecer qu se va a hacer y qu se va a observar o contar a la hora de determinar el espacio muestral en un experimento aleatorio En todo espacio muestral podemos distinguir los siguientes sucesos: Sucesos elementales, los subconjuntos con un solo elemento. Suceso seguro, E, el propio espacio muestral. Suceso imposible, , que no posee ningn suceso elemental (no puede verificarse). Teniendo en cuenta que los sucesos son subconjuntos se suelen usar los diagramas de Venn para representarlos.

148

Si A y B son dos sucesos del espacio muestral E, ste queda dividido en cuatro partes: Los que estn en A y no en B, los que estn en B y no en A, los que estn en ambos y los que no estn ni en a ni en B. Figura 2

En el dibujo se ha indicado el nmero de sucesos elementales que les corresponden. Llamaremos P(E) al conjunto de todos los sucesos, es decir a partes de E.
Diremos que el suceso A implica el B, s siempre que se verifica A se verifica B. Se indica A B, pues todos los su sucesos de A pertenecen a B.

Ejemplo 6. A = sacar un dos ; B = sacar par Dos sucesos son iguales cuando contienen los mismos sucesos elementales; se puede expresar esto diciendo que se implican mutuamente, A B y B A.

149

Definicin: Se llama suceso contrario (o complementario) de A, y se representa por , Ac Ac, al formado por los sucesos elementales de E que no estn en A.

Ac

Es decir se verifica Ejemplo:

o Ac cuando no se verifica A.

a. En un experimento se trata de determinar al azar los primeros 10 motores con problemas de ignicin en una fbrica de automviles. Para este ejemplo, el espacio muestral que adems es finito y discreto, viene dado por: E={1,2,3,4,5,6,7,8,9,10} Adicionalmente, para este experimento se puede determinar otros tipos de eventos como: A ={la totalidad de motores son reparables} B={los motores reparables son al menos 4}
150

Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral. b. Si tiramos una moneda al are una sola vez, el espacio muestral ser cara o cruz. Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio muestral estara formado por (cara-cara), (cara-cruz), (cruz-cara) y (cruz-cruz).

11.2 Suceso o Evento A partir de los resultados elementales de un experimento se presenta un suceso o evento, el cual, se trata de un conjunto de resultados elementales del experimento. Algunos autores usan los trminos evento o acontecimiento para nombrar lo que aqu llamamos suceso. Los resultados de cualquier prueba de un experimento corresponden a un elemento del espacio muestral. Se llama suceso o evento, dentro de un espacio muestral, a cualquier subconjunto del espacio muestral. Un suceso se realiza, cuando el resultado del experimento aleatorio es uno de los sucesos posibles. Por
151

ejemplo, los resultados de la tirada de una moneda darn cruz o cara, pero no ambas; esto es, que los puntos muestrales o eventos elementales son mutuamente excluyentes, estos dos eventos o sucesos no podrn ocurrir simultneamente en una sola prueba. 11.2.1 Tipos de sucesos o eventos Antes de calcular las probabilidades de un experimento aleatorio hay que definir los tipos de sucesos. Suceso elemental: hace referencia a cada una de las posibles soluciones que se pueden presentar. Ejemplo: al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6. Suceso compuesto: es un subconjunto de sucesos elementales. Ejemplo: lanzamos un dado y queremos que salga un nmero par. El suceso "numero par" es un suceso compuesto o evento, integrado por 3 sucesos elementales: el 2, el 4 y el 6 O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es un suceso compuesto formado por 18 sucesos elementales (todos los nmeros que van del 1 al 18).
152

11.3 Probabilidad de sucesos Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre s, as como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo de probabilidades. 11.3.1 Suceso contenido en otro.- Se dice que A est contenido en B y lo indicaremos por A B si todos los elementos de A pertenecen a B. Las posibles soluciones del primer suceso tambin lo son del segundo, pero este segundo suceso tiene adems otras soluciones suyas propias. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6: A={6}

b) que salga un nmero par: B={2,4,6} Vemos que el suceso a) est contenido en el suceso b): A B

Siempre que se da el suceso a) se da el suceso b), pero no al contrario.

153

Cuando un suceso puede estar contenido en otro, entonces, la probabilidad del primer suceso ser menor que la del suceso que lo contiene. Tomando el mismo ejemplo, tenemos: P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50 Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). Por tano el suceso A est contenido en el suceso B. 11.3.2 Igualdad de sucesos.- A = B, en este caso, las probabilidades de ambos sucesos son las mismas. Se presenta cuando siempre que se cumple uno de ellos se cumple obligatoriamente el otro y viceversa. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos, A) que salga nmero par, y B) que salga mltiplo de 2. Las soluciones coinciden en ambos casos. a. que salga nmero par: A = {2,4,6} b. que salga mltiplo de 2: B = {2,4,6} Vemos que las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50
154

P(B) = 3 / 6 = 0,50 11.3.3 Unin de dos o ms sucesos.- A B. Producir otro suceso formado por todos los elementos de los sucesos que se unen; lo que es lo mismo, la probabilidad de la unin de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso interseccin Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga nmero par, y b) que el resultado sea mayor que 3. El suceso unin estara formado por los siguientes resultados: el 2, el 4, el 5 y el 6. a. que salga nmero par: A = {2,4,6} b. que el resultado sea mayor que 3: B = {4,5,6}
c. el suceso unin estara formado por el siguiente

resultado: C = {2,4,5,6} Se expresa: A B = {2,4,6} {4,5,6} = {2,4,5,6} P(A) = 3 / 6 = 0,50


155

P(B) = 3 / 6 = 0,50 P (A B) = 2 / 6 = 0,33 Por lo tanto, Como ejemplo, tenemos que la unin de un suceso cualquiera con su complementario es el suceso seguro: P (A u B) = (0,50 + 0,50) - 0,33 = 0,666 11.3.4 Interseccin de sucesos.- A B. Es suceso compuesto por los elementos comunes de dos o ms sucesos que se intersectan. La probabilidad ser igual a la probabilidad de los elementos comunes. Ejemplo: lanzamos un dado al aire, y analizamos dos sucesos: a. que salga nmero par: A = {2,4,6} b. que sea mayor que 4: B = {5,6} c. la interseccin de estos dos sucesos tiene un slo elemento: C = {6} Puede expresarse: A B = {2,4,6} {5,6} = {6}

156

El nmero 6 es el resultado comn a ambos sucesos: es mayor que 4 y es nmero par. Su probabilidad ser por tanto: P(A B) = 1 / 6 = 0,166

11.3.5 Sucesos incompatibles, disjuntos mutuamente excluyentes.- A B = . Este tipo sucesos no pueden ocurrir al mismo tiempo ya que tienen elementos comunes, por consiguiente, interseccin es el conjunto vacio.

o de no su

Los eventos son no excluyentes cuando es posible que ocurran al mismo tiempo, sin embargo, esta definicin no indica que esos eventos siempre deban ocurrir necesariamente en forma conjunta. La probabilidad de la unin de dos sucesos incompatibles ser igual a la suma de las probabilidades de cada uno de los sucesos y como su interseccin es el conjunto vacio no hay que restarle nada. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero menor que 3, y b) que salga el nmero 6. Es evidente que ambos no se pueden dar al mismo tiempo.
157

A B = {1,2} {6} = La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166 Por lo tanto, P(A B) = 0,33 + 0,166 = 0,50

11.3.6 Sucesos complementarios o contrarios.- En dos sucesos complementarios, el segundo es un subconjunto que contiene todos los sucesos elementales del espacio muestral que no estn en el primero. Son aquellos que si no se da uno, obligatoriamente se tiene que dar el otro. La probabilidad de un suceso complementario a un suceso (A) es igual a 1 - P(A) Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un nmero par, y b) que salga un nmero impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa). La probabilidad del suceso (A) es igual a:

158

P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 O tambin: P(A) = {2,4,6} = 3/6 P(B)={1,3,5} = 3/6 P(E) =P(A) + P(B) = 1 Luego: P( ) = P(E) P(B) = 1 3/6 = 3/6 = 0.5 =50%

11.3.7 Unin de sucesos complementarios.- La probabilidad de la unin de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que salga un nmero impar.

159

La probabilidad del suceso unin de estos dos sucesos ser igual a: P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, P(A U B) = 0,50 + 0,50 = 1

160

12.0 CLCULO DE PROBABILIDADES Los clculos de probabilidades realizados sobre un experimento aleatorio siempre se hacen en referencia a la probabilidad de un suceso y la entenderemos como una medida cuantificada de ocurrencia de un suceso frente a los dems sucesos del experimento. El clculo debe medir mide la mayor o menor posibilidad de que se d un determinado resultado. La probabilidad de un suceso es una medida cuantificable que toma valores entre 0 y 1 o que tambin pueden ser expresados en tanto por ciento, entre 0% y 100%

Suceso imposible.- Su valore corresponde a cero. Es aquel que no contiene ningn elemento del espacio muestral (E) y por tanto no ocurrir nunca y se lo representa por Por ejemplo: Si lanzamos un dado al aire la probabilidad de que salga el nmero 7 es cero. Valor del suceso seguro o universal.- Es cuando el suceso coincide con el espacio muestral. El valor de uno corresponde al suceso seguro.

161

Ejemplo: Al lanzar un dado al aire se tiene la probabilidad de que salga cualquier nmero del 1 al 6; lo cual es igual o 100%. El resto de sucesos tendr probabilidades entre cero y uno: que ser tanto mayor cuanto ms probable sea que dicho suceso tenga lugar.

12.1 Medicin de la probabilidad. La Regla de Laplace permite medir la probabilidad de un suceso A perteneciente a un espacio muestral (E) finito. Se define como el cociente entre los resultados casos respecto al total de resultados posible. Regla de Laplace o Probabilidad clsica o a priori, se atribuye a los primeros estadsticos que emplearon este concepto y se refiere a que la probabilidad de cualquiera de los sucesos de este tipo de experimentos es conocida incluso antes que los mismos tengan lugar. De hecho no es necesario realizar el experimento para conocer las probabilidades de sus resultados. La Regla de Laplace se define como:

162

Con la letra P representaremos el trmino probabilidad para que no surjan dudas de su significado. Siendo que: A; B identifican sucesos P(A) probabilidad del suceso A E el espacio muestral (conjunto de todos los resultados) Ejemplo: Calcular la probabilidad de que al lanzar un dado se obtenga un nmero impar. Solucin: El espacio muestral es E={1,2,3,4,5,6} Lamamos A al suceso consistente en que el resultado es impar A={1,3,5} Como no suponemos que ninguna de las caras ofrece una probabilidad de ocurrencia diferente a las dems, podemos aplicar la regla de Laplace para obtener que

163

Se describen los axiomas: Primer axioma: P(A) 0

La P de un suceso es un nmero mayor o igual a 0. No


puede haber sucesos cuya probabilidad de ocurrir sea del 120% ni del -4%.

Segundo axioma: P(E) = 1 La P del espacio muestral es 1, es decir del 10%; no podr asignarse P a sucesos no considerados en el espacio muestral. Tercer axioma: P(A B) = P(A) + P(B) SI A B=

La P de la unin de dos sucesos es igual a la suma de las P respectivas si, y solo si, su interseccin es el conjunto vaco. Ejemplos con el dado: a) Probabilidad que salga el nmero 2: Aqu el caso es tan slo uno, esto es, que salga el dos, mientras que los
164

casos posibles son seis, puede salir cualquier nmero del uno al seis. Luego: P(A) = 1 / 6 = 0,166 = 16.6% b) Probabilidad que salga un nmero par: Los casos favorables pueden ser el 2, 4, 6; esto es tres resultados favorables; mientras que los casos posibles son seis. Luego: P(A) = 3 / 6 = 0,50 = 50% c) Probabilidad que salga un nmero menor que 5: Aqu se tendran cuatro casos favorables, pudiendo salir el uno, el dos, el tres o el cuatro frente a los seis casos posibles. Luego: P(A) = 4 / 6 = 0,666 = 66,6% d) Cuatro ases contiene un juego de naipes, la probabilidad de obtener un as (A) en una sola extraccin es de: P(A)= 4 P(B)= 52

165

Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos requisitos: 1) El nmero de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sera cero. 2) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podramos aplicar esta regla. Si el experimento aleatorio no cumple se recurre a otro modelo de clculo de probabilidades que se basa en la experiencia llamado modelo frecuentista. Cuando son muchas las veces que se repite un experimento aleatorio, las probabilidades de los diversos posibles sucesos empiezan a converger hacia valores determinados, que son sus respectivas probabilidades. Ejemplo: si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha aparecido el 100% de las veces y el suceso "cruz" el 0%. Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso "cara"
166

ya no sera del 100%, sino que se habra reducido al 70%. Si repito numerosamente este experimento, lo normal es que las probabilidades de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada una. Este 50% ser la probabilidad de estos sucesos segn el modelo frecuentista. En este modelo ya no ser necesario que el nmero de soluciones sea finito, ni que todos los sucesos tengan la misma probabilidad. Ejemplo: si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada), es posible que al repetir dicho experimento un nmero elevado de veces, la "cara" saliera con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores seran las probabilidades de estos dos sucesos segn el modelo frecuentista. A esta definicin de la probabilidad se le denomina probabilidad a posteriori, ya que tan slo repitiendo un experimento un nmero elevado de veces podremos saber cual es la probabilidad de cada suceso.

167

168

13.0 PERMUTACIONES, COMBINACIONES, VARIACIONES. Para aplicar la Regla de Laplace, el clculo de los sucesos favorables y de los sucesos posibles a veces no plantea ningn problema, ya que son un nmero reducido y se pueden calcular con facilidad: Por ejemplo: Probabilidad de que al lanzar un dado salga el nmero 2. Tan slo hay un caso favorable, mientras que los casos posibles son seis. Probabilidad de acertar al primer intento el horscopo de una persona. Hay un caso favorable y 12 casos posibles. Sin embargo, a veces calcular el nmero de casos favorables y casos posibles es complejo y hay que aplicar reglas matemticas: Por ejemplo: 5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de que al menos los miembros de un matrimonio se sienten junto. En este caso, determinar el nmero de casos favorables y de casos posibles es complejo. Las reglas matemticas que nos pueden ayudar son el clculo de combinaciones, el clculo de variaciones y el clculo de permutaciones.

169

13.1 Permutaciones Es todo arreglo de elementos en donde nos interesa el lugar o posicin que ocupa cada uno de los elementos que constituyen dicho arreglo. Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Se llama permutacin a cada una de las posibles ordenaciones de los elementos de un conjunto finito dado con todo sus elementos diferentes. La permutacin es todo de elementos donde interesa el lugar o posicin que ocupa cada uno de los elementos que forman dicho arreglo. Ejemplo: Enumerar todas las permutaciones 2 a 2 de las letras a, b y c. Solucin: ab, ac, ba, bc, ca y cb Dados elementos distintos, cualquier forma de ordenarlos se denomina una permutacin. Las formas de ordenar los elementos se denominan permutacin.
170

En el conjunto {1,2,3}, cada ordenacin posible de sus elementos, sin repetirlos, es una permutacin. Existe un total de 6 permutaciones para estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1". Para calcular el nmero de permutaciones se aplica la siguiente frmula:

La expresin Pm representa las permutaciones de m elementos, tomando todos los elementos. Los subgrupos se diferenciaran nicamente por el orden de los elementos. Ejemplo: P8 son las permutaciones de 8 elementos: P8 = 8! = 8 * 7 * 6 * 5 * 4 * 3 * 2 * 1 = 40 320 Es decir, tendramos 40 320 formas diferentes de agrupar 8 elementos

13.2 Combinaciones Es todo arreglo de elementos en donde no nos interesa el lugar o posicin que ocupa cada uno de los elementos que constituyen dicho arreglo.
171

Una combinacin es un arreglo donde el orden no es importante. Son los grupos que se pueden formar tomando una cantidad n de elementos del total m; considerando como grupo distinto aquel que tiene diferentes elementos. No puede repetirse un elemento dentro de un grupo. Su smbolo es Cm, n y se lee combinaciones de elementos tomados de a n (en grupos de n elementos). En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), de cuntas formas pueden elegirse tres de ella (por ejemplo, para realizar tres trabajos donde es indistinto quin lo realiza)? Las alternativas, donde no interesa el orden de los elementos en cada grupo, son: (a, b, c) (a, b, d) (a, b, e) (a, c, d) (a, c, e) (b, c, d) (b, c, e) (b, d, e) (c, d, e) y la cantidad total se calcula como: (a, d, e)

172

El arreglo o listado se conoce como combinacin. Determina el nmero de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. La notacin para las combinaciones es C(m,n) y se lee como la cantidad de combinaciones de m, de m elementos determinados por n; y, dividido por n!. Las combinaciones con repeticin son los grupos que se pueden formar tomando una cantidad n de elementos del total m; considerando como grupo distinto aquel que tiene diferentes elementos. S puede repetirse un elemento dentro de un grupo y n puede ser hasta mayor que m. Su smbolo es Cm,n y se lee combinaciones con repeticin de m elementos tomados de a n. En este caso puede demostrarse que:

Ejemplo: entre 5 personas (a, b, c, d, e), de cuntas formas pueden elegirse tres de ellos para realizar tres trabajos, pudiendo una misma persona ocuparse de dos o ms?
173

Respuesta:

Por ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar con los nmeros 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el clculo de combinaciones las parejas (1,2) y (2,1) se consideran idnticas, por lo que slo se cuentan una vez. Para calcular el nmero de combinaciones de m cosas tomadas n a la vez, o C(m,n), divide el nmero de permutaciones P(m,n) entre el nmero de maneras que n cosas pueden arreglarse lo cual es n!, para lo cual, se aplica la siguiente frmula:

O tambin, se aplica la siguiente frmula:

El termino n! se denomina factorial de n y es la multiplicacin de todos los nmeros que van desde n hasta 1.
174

Por ejemplo: 4! = 4 * 3 * 2 * 1 = 24 La expresin C(m,n) representa las combinaciones de m elementos, formando subgrupos de "n" elementos. Ejemplo: C(10,4) son las combinaciones de 10 elementos agrupndolos en subgrupos de 4 elementos: = 210 Es decir, podramos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. Ejemplo: Debe seleccionarse 3 mquinas para que trabajen en turnos vespertinos de un total de 12 que se encuentran en la sala de torneado. Cuantos grupos de 3 mquinas pueden elegirse sin reparar en el orden en que cada grupo pudiera tener.

Continuando con el ejercicio, anterior: Si el total de mquinas est compuesta de 7 de marca Toledo y 5 de marca Yiler. Cul es la probabilidad de que en una eleccin aleatoria, de las 3 mquinas que se elijan 2 sean Toledo y 1 Yiler?
175

Nmero de mquinas con 2T y 1Y:

Nmero total de combinaciones posibles de mquinas = C(12,3)

Calcular y determinar si se trata de una permutacin o una combinacin:


1. 2. 3. 4. 5. 6. 7.

8.

C(8,3) C(11,4) C(40,1) C(16,5) Seleccionar 5 cilindros de una produccin de 40 Escoger 6 bujas de 20 daadas. Ocho trabajadores se encuentran en la sala de afilado. Escoger 5 relej variados de una caja de 15 relej de diferentes marcas. Cuatro vehculos estacionados en un garaje de capacidad de 10 vehculos. Un almacn tiene 12 alternadores de diferentes orgenes. El mecnico del lugar compra tres alternadores cada vez que visita el almacn. El mecnico cuantas combinaciones de diferentes orgenes de alternadores puede comprar? El profesor de resistencia de materiales tiene 15 varillas de una misma dimensin y de diferentes

176

aleaciones. Cuntos grupos diferentes de 3 aleaciones puede hacer para ensayo de los estudiantes? 13.3 Variaciones Calcula el nmero de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con los nmero 1, 2 y 3. Ahora tendramos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. Para calcular el nmero de variaciones se aplica la siguiente frmula:

La expresin m,n representa las variaciones de m elementos, formando subgrupos de "n" elementos. En este caso, como vimos en la leccin anterior, un subgrupo se diferenciar del resto, bien por los
177

elementos que lo forman, o bien por el orden de dichos elementos. Ejemplo: V10,4 son las variaciones de 10 elementos agrupndolos en subgrupos de 4 elementos:

Es decir, podramos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10 elementos. 13.4 Combinaciones, Variaciones y Permutaciones con repeticiones. Vamos a analizar ahora que ocurrira con el clculo de las combinaciones, de las variaciones o de las permutaciones en el supuesto de que al formar los subgrupos los elementos pudieran repetirse. Por ejemplo: tenemos bolas de 6 colores diferentes y queremos formar subgrupos en los que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo tuvieran el mismo color. En este caso no podramos utilizar las frmulas que vimos en la leccin anterior. a) Combinaciones con repeticin: Para calcular el nmero de combinaciones con repeticin se aplica la siguiente frmula:

178

Ejemplo: C(10,4) son las combinaciones de 10 elementos con repeticin, agrupndolos en subgrupos de 4, en los que 2, 3 o los 4 elementos podran estar repetidos:

Es decir, podramos formar 120 subgrupos diferentes de 3 elementos. b) Variaciones con repeticin: Para calcular el nmero de variaciones con repeticin se aplica la siguiente frmula:

Ejemplo: Vr(12,3) son las variaciones de 12 elementos con repeticin, agrupndolos en subgrupos de 3 elementos:

179

Es decir, podramos formar 1728 subgrupos diferentes de 3 elementos. c) Permutaciones con repeticin: Para calcular el nmero de permutaciones con repeticin se aplica la siguiente frmula:

Son permutaciones de "m" elementos, en los que uno de ellos se repite " x1 " veces, otro " x2 " veces y as ... hasta uno que se repite " xk " veces. Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y otro se repite en 3 ocasiones:

Es decir, tendramos 33600 formas diferentes de agrupar estos 10 elementos

Ejercicio 1.- Calcular la probabilidad de acertar los 14 signos de la quiniela:


180

Solucin: Se aplica la Regla de Laplace (casos favorables / casos posibles). El caso favorable es tan slo uno (acertar los 14 signos). Los casos posibles se calculan como variaciones con repeticin de 3 elementos (1, X y 2), tomados de 14 en 14 (los signos que hay que rellenar). Son variaciones y no combinaciones ya que el orden influye: no es lo mismo (1,1,X) que (1, X, 1). Y son con repeticin, ya que cualquiera de los signos (1, X y 2) se puede repetir hasta 14 veces. Por lo tanto, los casos posibles son:

Y la probabilidad de acertar los 14 resultados es:

No demasiado elevada....pero el que la sigue la consigue. Ejercicio 2.- Y la probabilidad de acertar 12 signos de la quiniela: Solucin:

181

Aplicamos nuevamente la Regla de Laplace. En este caso los casos favorables se calculan como combinaciones de 14 elementos tomados de 2 en 2, de esta manera obtenemos todas las posibles alternativas de fallar 2 resultados de 14 (lo que equivale a acertar 12 resultados). Utilizamos combinaciones y no variaciones ya que el orden no importa (da lo mismo fallar el 3 y el 6, que el 6 y el 3)

Los casos posibles siguen siendo los mismos:

Por lo que la probabilidad de acertar 12 resultados es:

Por lo tanto, tenemos ms probabilidades de acertar 12 resultados que 14 (ser por eso por lo que pagan menos?). Ejercicio
182

3.- Calcular la probabilidad de, en una carrera de 15 caballos, acertar los 3 que quedan primeros (sin importar cual de ellos queda primero, cual segundo y cual tercero). Solucin: Se aplica la Regla de Laplace. El caso favorable es tan slo uno: los 3 caballos que entran en primer lugar. Los casos posibles se calculan como combinaciones de 15 elementos tomados de 3 en 3 (es decir, determinamos todos las posibles alternativas de 3 caballos que pueden entrar en las 3 primeras posiciones). Como el orden de estos 3 primeros caballos no importa, utilizamos combinaciones en lugar de variaciones. Por lo tanto, los casos posibles son:

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Algo mayor que en las quinielas.... Eso s, se paga menos.

183

Ejercicio 4.- Y si hubiera que acertar, no slo los 3 caballos que ganan, sino el orden de su entrada en meta. Solucin: El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados en su orden correspondiente. Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 15 elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12 caballos podran ocupar las 3 primeras posiciones.

Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Menor que en el ejemplo 3. Ya no vale acertar que 3 caballos entran en primer lugar, sino que tenemos que acertar el orden de su entrada.

184

14.0 PROBABILIDAD CONDICIONADA Es la Probabilidad de que un evento ocurra dado que otro evento ha ocurrido con anterioridad. Es la probabilidad de que ocurra un suceso A, sabiendo que tambin sucede otro evento B. La probabilidad condicional se escribe P(A|B), y se lee la probabilidad de A dado B. Asumamos que se tiene una caja con cuatro bolas numeradas; extraemos de ella una bola e inmediatamente la introducimos para hacer una segunda extraccin. La posibilidad de sacar la bola nmero 2 es la misma que en la primera. Pero si hacemos lo mismo sin reemplazar la bola extrada, la probabilidad de extraer por ejemplo, la bola nmero 2 en la segunda extraccin, depender de la bola extrada en primer lugar. Sean A y B dos sucesos definidos en el espacio muestral E, la probabilidad de A dado B se denota como: P(A | B) = P (A B) / P(B) Siempre que P(B) > 0 Reglas de la Probabilidad: a) Suma: Si A y B son eventos excluyentes, entonces:
185

P (A U B) = P(A) + P(B) y se lee: La probabilidad de que ocurra A B De otra forma (no excluyentes): P(A U B) = P(A) + P(B) P(AB)

b) Eventos independientes: Si A y B son eventos independientes (aqullos en que la ocurrencia de uno no afecta la ocurrencia del otro), entonces: P(AB) = P(A) * P(B) y se lee: La probabilidad de que ocurra A y B al mismo tiempo. De otra forma (eventos dependientes): P(AB) = P(A) * P(B | A) Cuando dos los sucesos entonces: A y B son independientes,

P ( A | B ) = P(AB) / P(B) Dado que A y B son independientes, entonces P(AB) = P(A) * P(B) y por lo tanto:

186

P ( A | B ) = P(A) Las probabilidades condicionadas se calculan una vez que se ha incorporado informacin adicional a la situacin de partida: Ejemplo: se tira un dado y sabemos que la probabilidad de que salga un 2 es 1/6 (probabilidad a priori). Si incorporamos nueva informacin (por ejemplo, alguien nos dice que el resultado ha sido un nmero par) entonces la probabilidad de que el resultado sea el 2 ya no es 1/6. Donde: P (A | B) es la probabilidad de que se de el suceso B condicionada a que se haya dado el suceso A. P(AB) es la probabilidad del suceso simultneo de A y de B P (A) es la probabilidad a priori del suceso A En el ejemplo que hemos visto: P(A | B) es la probabilidad de que salga el nmero 2 (suceso B) condicionada a que haya salido un nmero par (suceso A). P (AB) es la probabilidad de que salga el dos y nmero par.

187

P (A) es la probabilidad a priori de que salga un nmero par. Por lo tanto: P (AB) = 1/6 P (A) = 1/2 P (A | B) = (1/6) / (1/2) = 1/3 Luego, la probabilidad de que salga el nmero 2, si ya sabemos que ha salido un nmero par, es de 1/3 (mayor que su probabilidad a priori de 1/6). La probabilidad condicionada es en este caso cero, frente a una probabilidad a priori de 1/6. EJEMPLO. Se lanza un dado al aire Cul es la probabilidad de que salga el nmero 2? Si sabemos que el resultado ha sido un nmero par, se ha modificado esta probabilidad? Solucin: El espacio muestral que corresponde a este experimento es E={1,2,3,4,5,6} y se debe calcular la probabilidad del suceso A={2}. Si el dado no est trucado, todos los nmeros tienen la misma
188

probabilidad de salir, y siguiendo la definicin de probabilidad de Laplace,

Al calcular la probabilidad de A, segn la definicin de Laplace, previamente se supone que todos los elementos del espacio muestral tienen la misma probabilidad de salir, es decir: P(1)=P(2)=P(3)=P(4)=P(5)=P(6) Por otro lado, si ha salido un nmero par, de nuevo por la definicin de probabilidad de Laplace tendramos

189

Esta misma probabilidad se podra haber calculado siguiendo la definicin de la probabilidad condicionada, ya que si escribimos A ={2}

B={2,4,6}

y entonces

que por supuesto coincide con el mismo valor que calculamos usando la definicin de probabilidad de Laplace. 2 ejemplo:

190

En un estudio mecnico se ha determinado que la probabilidad de que un motor tenga problemas de ignicin (suceso B) sea del 0,10 (probabilidad a priori). Adems, la probabilidad de que el motor tenga problemas de ignicin admisin (suceso A) es el 0,25 y la probabilidad de que el motor tenga a la vez problemas de admisin e ignicin (suceso interseccin de A y B) es del 0,05. Calcular la probabilidad de que el motor tenga problemas de ignicin si tiene problemas de admisin (probabilidad condicionada P (A | B). P (B A) = 0,05 P (A) = 0,25 P(A | B) = 0,05 / 0,25 = 0,20 Por lo tanto, la probabilidad condicionada es superior a la probabilidad a priori. No siempre esto es as, a veces la probabilidad condicionada es igual a la probabilidad a priori o menor. Por ejemplo: probabilidad de que al tirar un dado salga el nmero 2, condicionada a que haya salido un nmero impar. Ejercicio Se lanzan dos dados:

191

a. Cul es la probabilidad de obtener una suma de puntos igual a 7? b. Si la suma de puntos ha sido 7, cul es la probabilidad de que en alguno de los dados haya salido un tres? Solucin: Sean los sucesos A="la suma de los puntos es 7" y B="en alguno de los dados ha salido un tres".
a. Los casos posibles al lanzar dos dados son 36 y los

casos favorables al suceso A son los seis siguientes: (1,6); (2,5); (3,4); (4,3); (5,2) y (6,1). Por tanto, P(A)=6/36=1/6
b. En este caso, el suceso B/A es salir en algn dado 3,

si la suma ha sido 7. Observamos que esta situacin ocurre en las parejas (3,4) y (4,3). Por tanto, P( B|A )=2/6=1/3 De tres talleres se registr la produccin en porcentaje de piezas defectuosas y buenas, los datos se recogen en el cuadro:

TIPO Defectuosa Buena


192

TALLER 20 1 40

TALLER 10 2 30

TALLER 10 3 10

TOTAL 40 80

Total

60

40

20

120

Se desea conocer: a. Qu probabilidad existe que se pueda tomar de toda la produccin de los talleres una pieza defectuosa? b. Calcular la probabilidad de que una pieza tomada sea del Taller 2 y que sea buena. Respuesta:
a. b.

193

15.0 PROBABILIDAD COMPUESTA Es la probabilidad de ocurrencia simultnea de dos o ms eventos independientes es el producto de las probabilidades de cada evento independiente. La probabilidad compuesta o regla de multiplicacin de probabilidades se deriva de la probabilidad condicionada: La probabilidad de que se den simultneamente dos sucesos (suceso interseccin de A y B) es igual a la probabilidad a priori del suceso A multiplicada por la probabilidad del suceso B condicionada al cumplimiento del suceso A. La frmula para calcular esta probabilidad compuesta es:

Ejemplo 1. Estudiamos el suceso A (porcentaje de varones mayores de 40 aos casados) y el suceso B (varones mayores de 40 aos con ms de 2 hijos) y obtenemos la siguiente informacin: Un 35% de los varones mayores de 40 aos estn casados. De los varones mayores de 40 aos y casados, un 30% tienen ms de 2 hijos (suceso B condicionado al suceso A).

194

Calcular la probabilidad de que un varn mayor de 40 aos est casado y tenga ms de 2 hijos (suceso interseccin de A y B). Por lo tanto: P (A) = 0,35 P (B|A) = 0,30 P (A B) = 0,35 * 0,30 = 0,105

Es decir, un 10,5% de los varones mayores de 40 aos estn casados y tienen ms de 2 hijos. 2 ejemplo: Estudiamos el suceso A (alumnos que hablan ingls) y el suceso B (alumnos que hablan alemn) y obtenemos la siguiente informacin: Un 50% de los alumnos hablan ingls. De los alumnos que hablan ingls, un 20% hablan tambin alemn (suceso B condicionado al suceso A). Calcular la probabilidad de que un alumno hable ingls y alemn (suceso interseccin de A y B). Por lo tanto: P (A) = 0,50

195

P (B|A) = 0,20 P (A B) = 0,50 * 0,20 = 0,10

Es decir, un 10% de los alumnos hablan ingls y alemn.

196

16.0 TEOREMA DE LA PROBABILIDAD TOTAL El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso a partir de probabilidades condicionadas: Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cul es la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y la probabilidad de que haga buen tiempo. La frmula para calcular esta probabilidad es:
(Donde i toma valores entre 1 y n)

Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un accidente) es igual a la suma de multiplicar cada una de las probabilidades condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A. Para que este teorema se pueda aplicar hace falta cumplir un requisito: Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas las posibilidades (la suma de sus probabilidades debe ser el 100%).
197

Ejemplo: al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman un sistema completo, no hay ms alternativas: la suma de sus probabilidades es el 100% Ejemplo: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema completo, ya que no contempla todas las opciones (podra salir el 5 o el 6). En este caso no se podra aplicar el teorema de la probabilidad total. Ejercicio 2: Van a cambiar a tu jefe y se barajan diversos candidatos: a) Carlos, con una probabilidad del 60% b) Juan, con una probabilidad del 30% c) Luis, con una probabilidad del 10% En funcin de quien sea tu prximo jefe, la probabilidad de que te suban el sueldo es la siguiente: a) Si sale Carlos: la probabilidad de que te suban el sueldo es del 5%. b) Si sale Juan: la probabilidad de que te suban el sueldo es del 20%. c) Si sale Luis: la probabilidad de que te suban el sueldo es del 60%. En definitiva, cual es la probabilidad de que te suban el sueldo?:
198

1.- Los tres candidatos forman un sistema completo 2.- Aplicamos la frmula: P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15 Por tanto, la probabilidad de que te suban el sueldo es del 15%.

199

17.0 TEOREMA DE BAYES El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto en el Teorema de la probabilidad total. Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?). La frmula del Teorema de Bayes es:

Tratareremos de explicar esta frmula con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que este teorema tambin exige que el suceso A forme un sistema completo. Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de semana: a) Que llueva: probabilidad del 50%.

200

b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%. Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente: a) Si llueve: probabilidad de accidente del 20%. . (inicialmente 10%) b) Si nieva: probabilidad de accidente del 10% (inicialmente 20%) ...

c) Si hay niebla: probabilidad de accidente del 5%. (inicialmente 5%) Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no sabemos que tiempo hizo (nev, llovi o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades. Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan probabilidades a priori (lluvia con el 50%, nieve con el 30% y niebla con el 20%). Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A|B), que se denominan probabilidades a posteriori. Vamos a aplicar la frmula:

201

a) Probabilidad de que estuviera lloviendo:

La probabilidad de que efectivamente estuviera lloviendo el da del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad de que estuviera nevando es del 21,4%.

c) Probabilidad de que hubiera niebla:

La probabilidad de que hubiera niebla es del 7,1%.


202

18.0 INDEPENDENCIA DE SUCESOS Dos sucesos son independientes entre s, si la ocurrencia de uno de ellos no afecta para nada a la ocurrencia del otro: Ejemplo: el suceso estatura de los alumnos de una clase y el color del pelo son independientes: el que un alumno sea ms o menos alto no va a influir en el color de su cabello, ni viceversa. Para que dos sucesos sean independientes tienen que verificar al menos una de las siguientes condiciones: P (B|A) = P (B) es decir, que la probabilidad de que se de el suceso B, condicionada a que previamente se haya dado el suceso A, es exactamente igual a la probabilidad de B. Ejemplo: la probabilidad de que al tirar una moneda salga cara (suceso B), condicionada a que haga buen tiempo (suceso A), es igual a la propia probabilidad del suceso B. P (A|B) = P (A) es decir, que la probabilidad de que se de el suceso A, condicionada a que previamente se haya dado el suceso B, es exactamente igual a la probabilidad de A. Ejemplo: la probabilidad de que haga buen tiempo (suceso A), condicionada a que al tirar una moneda salga cara (suceso B), es igual a la propia probabilidad del suceso A.

203

P (A B) = P (A) * P (B) es decir, que la probabilidad de que se de el suceso conjunto A y B es exactamente igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B. Ejemplo: la probabilidad de que haga buen tiempo (suceso A) y salga cara al tirar una moneda (suceso B), es igual a la probabilidad del suceso A multiplicada por la probabilidad del suceso B Si el suceso A es independiente del suceso B, entonces el suceso B tambin es independiente del suceso A. Ejemplo 1: analicemos dos sucesos: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de tener un accidente es del 0,1 Suceso interseccin: la probabilidad de que haga buen tiempo y tener un accidente es del 0,08 Veamos si se cumple alguna de las condiciones sealadas: P (B|A) = P (A B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P (B)) P (A|B) = P (A B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a P (A))

204

P (A B) = 0,08 (que no es igual a P (A) multiplicado por P (B)) Por lo tanto, no se cumple ninguna de las tres condiciones sealadas por lo que estos dos sucesos no son independientes, sino que existe algn grado de dependencia entre ellos. Ejemplo 2: analicemos dos sucesos: Suceso A: la probabilidad de que haga buen tiempo es del 0,4 Suceso B: la probabilidad de salir cara al lanzar una moneda es del 0,5 Suceso interseccin: la probabilidad de que haga buen tiempo y que salga cara es 0,2 Veamos si se cumple alguna de las condiciones sealadas: P (B|A) = P (A B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B)) P (A|B) = P (A B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A)) P (A B) = 0,2 (igual a P (A) multiplicado por P (B)) Por lo tanto, estos dos sucesos s son independientes.

205

19.0 DISTRIBUCIONES DE PROBABILIDAD Las distribuciones de probabilidad presentan una serie de valores que pueden representarse como un resultado en la ejecucin de los experimentos. Las variables aleatorias son las que generan toda distribucin de probabilidad. Se conoce como aleatoria porque el valor tomado es completamente al azar. Las variables aleatorias pueden ser: Variable aleatoria discreta. Variable aleatoria contnua. Variable aleatoria discreta. Tomar nicamente valores enteros y un nmero finito de ellos. Variable aleatoria continua (x). Porque puede tomar tanto valores enteros como fraccionarios y un nmero infinito de ellos dentro de un mismo intervalo. 19.1 Distribuciones discretas y continuas Las distribuciones discretas son aquellas en las que la variable puede tomar un nmero determinado de valores: Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un nmero de 1 al 6; en una ruleta el nmero puede tomar un valor del 1 al 32.

206

Las distribuciones continuas son aquellas que presentan un nmero infinito de posibles soluciones: Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una poblacin (72,5 aos, 7,513 aos, 72, 51234 aos). A continuacin estudiaremos exclusivamente principales distribuciones discretas. 19.1.1. Distribuciones discretas: Bernoulli Consiste en realizar un experimento aleatorio una sla vez y observar si cierto suceso ocurre o no, siendo p la probabilidad de que sea as, xito; y q=1-p el que no lo sea, fracaso. Como se puede observar se trata ms que de una variable dicotmica, es decir que nicamente puede tomar dos modalidades, es por ello que el hecho de llamar xito o fracaso a los posibles resultados de las pruebas obedece ms una tradicin literaria o histrica, en el estudio de las variables aleatorias que a la situacin real que pueda derivarse del resultado. La distribucin de Bernoulli es una distribucin de probabilidad discreta, que toma valor 1 para la probabilidad de xito p y valor 0 para la probabilidad de fracaso q = 1 p. La funcin probabilstica de una variable de Bernoulli es: las

207

xi 1 0 Luego:

f(xi) P q 1

q = 1 p = P(x =0) X=
1

p = P(x = 1)

Por lo tanto, si X es una variable aleatoria con esta distribucin tenemos: Pr (X=1) = 1 P(X=0) = p Es el modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas)

208

Al haber nicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de xito se le denomina p A la probabilidad de fracaso se le denomina q Verificndose que: p+q=1 Veamos los ejemplos anteriores: Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1

209

Ejemplo. Cul es la probabilidad de los artculos defectuosos de una mquina que produce el 92 por ciento de artculos aceptables? A={artculos aceptables} B={artculos defectuosos} P(A) + P(B) = 1 P(B) = 1 P(A) P(B) = 1 0.92 = 0.8 19.1.2 Distribuciones discretas: Binomial Por sus aplicaciones la distribucin Binomial es quizs la ms importante, y su anlisis es un caso particular de probabilidad de variable aleatoria discreta. Esta distribucin Binomial que corresponde a la realizacin de un experimento aleatorio cumple con las siguientes condiciones: En el experimento slo son posible dos resultados: un suceso llamado xito (A), o su contrario (B), llamado fracaso. Al repetir el experimento, el resultado obtenido es independiente de los resultados obtenidos anteriormente.

210

La probabilidad del suceso (A) es constante, es decir, no vara de una prueba del experimento a otra. Si llamamos p a la probabilidad de A, p(A) = P, entonces p(B) = 1 p = q La distribucin Binomial parte de la distribucin de Bernoulli. La distribucin binomial se aplica cuando se realizan un nmero n de veces el experimento de Bernoulli, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre: 0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido xitos Ejemplo: se tira una moneda 10 veces: cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10 La distribucin de probabilidad de este tipo de distribucin sigue el siguiente modelo:

Alguien entiende esta frmula? Vamos a tratar de explicarla con un ejemplo:

211

Ejemplo 1: Cul es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? k es el nmero de aciertos. En este ejemplo k igual a 6 (en cada acierto decamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6) n es el nmero de ensayos. En nuestro ejemplo son 10 p es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La frmula quedara:

Luego, P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 2: Cul es la probabilidad de obtener cuatro veces el nmero 3 al lanzar un dado ocho veces? k (nmero de aciertos) toma el valor 4 n toma el valor 8

212

p (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La frmula queda:

Luego, P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el nmeros 3 al tirar un dado 8 veces. Ejemplos: En una reunin de muchas personas, el 20% de los presentes no habla espaol. En un grupo de 5 personas tomada al azar: a) Cul es la probabilidad de que ninguno hable espaol? b) Cul es la probabilidad de que 4 hablen espaol. Experimento aleatorio: repetir 5 veces la prueba de sacar al azar una persona. Variable aleatoria de las 5 pruebas: nmero de xitos (o sea de personas que no hablen espaol) en las 5 pruebas.
213

Distribucin binomial: X ~ B(5;0,20) es decir n = 5, p = 0,20 y q = 1- p = 0,80. a) Suceso=ninguno habla espaol ={X=5}

b) Suceso=cuatro no hablan espaol

19.1.3 Distribuciones discretas: Poisson Este tipo de distribucin es un caso particular de probabilidad de variable aleatoria discreta. Esta distribucin debe su nombre al francs Simon Denis Poisson (1781-1840) y se emplea en la descripcin de muchos procesos. Los xitos buscados en este tipo de experimentos son expresados por unidad de rea, tiempo, pieza, etc.

214

El modelo de Poisson abarca una gran clase de eventos y cada evento, por ejemplo, puede ser el nmero de ocurrencias de accidentes, errores, desastres u otros factores que aparecen aleatoria e independientemente en un tiempo continuo. Entre otros se cuentan las siguientes:

Cantidad de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc. Emisin de partculas radioactivas. Volumen de contaminantes en el aire. Nmero de defectos de una tela por m2 Cantidad de bacterias por cm2 de cultivo Llamadas telefnicas a un conmutador por hora, minuto, etc. Nmero de embarcaciones llegadas a un puerto por da, mes, etc.

Cuando en una distribucin binomial se realiza el experimento un nmero n muy elevada de veces y la probabilidad de xito p en cada ensayo es reducida, entonces se aplica el modelo de distribucin de Poisson: Se tiene que cumplir que: p < 0,10 p * n < 10 La distribucin de Poisson sigue el siguiente modelo:
215

Vamos a explicarla: El nmero e es 2,71828


=

n * p (es decir, el nmero de veces n que se realiza el experimento multiplicado por la probabilidad p de xito en cada ensayo) k es el nmero de xito cuya probabilidad se est calculando. Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de tiempo, rea o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, as como cada rea es independiente de otra rea dada y cada producto es independiente de otro producto dado. Veamos un ejemplo: La probabilidad de tener un accidente de trfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, cual es la probabilidad de tener 3 accidentes? Como la probabilidad p es menor que 0,1, y el producto n * p es menor que 10, entonces aplicamos el modelo de distribucin de Poisson.

216

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de trfico en 300 viajes es del 8,9% Otro ejemplo: La probabilidad de que un nio nazca pelirrojo es de 0,012. Cul es la probabilidad de que entre 800 recin nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4,6%. Ejemplo: Si un banco recibe en promedio ( =) 6 cheques sin fondo por da, cules son las probabilidades de que reciba:
217

a) cuatro cheques sin fondo en un da dado (x=k), b) 10 cheques sin fondos en cualquiera de dos das consecutivos. (e= 2.718281828) Resolviendo para a:
a) k = 4; = 6 cheques sin fondo por da y sustituyendo en la frmula

P(4 cheques sin fondo) = 0.01265 = 1.26%

Resolviendo para b:
b) k=10; = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos.

218

P(10 cheques sin fondo)= 0.10483=10.48% 19.1.4 Distribuciones discretas: Hipergeomtrica La distribucin hipergeomtrica es el modelo que se aplica en experimentos que correspondan a una poblacin finita sin remplazo. En una urna hay bolas de dos colores (blancas y negras), cul es la probabilidad de que al sacar 2 bolas las dos sean blancas? Son experimentos donde, al igual que en la distribucin binomial, en cada ensayo hay tan slo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribucin binomial en que los distintos ensayos son dependientes entre s. Se puede concluir que los experimentos que tienen este tipo de distribucin tienen las siguientes caractersticas: a. Al realizar un experimento con este tipo de distribucin, se esperan dos tipos de resultados. b. Las probabilidades asociadas a cada uno de los resultados no son constantes.
219

c. Cada ensayo o repeticin del experimento no es

independiente de los dems.


d. El nmero de repeticiones del experimento (n)

es constante. Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca, en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes (hay dependencia entre los distintos ensayos). La distribucin hipergeomtrica sigue el siguiente modelo:

Donde:

220

Vamos a tratar de explicarlo: N: es el nmero total de bolas en la urna N1: es el nmero total de bolas blancas N2: es el nmero total de bolas negras k: es el nmero de bolas blancas cuya probabilidad se est calculando n: es el nmero de ensayos que se realiza Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas Cul es la probabilidad de que 3 sean blancas? Entonces: N = 12; N1 = 7; N2 = 5; k = 3; n = 4 Si aplicamos el modelo:

Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35,3%.
221

Pero este modelo no slo se utiliza con experimentos con bolas, sino que tambin se aplica con experimentos similares: Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar Cul es la probabilidad de que las 3 sean solteras?

Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean solteras es tan slo del 1,75%.

222

19.1.5 Distribuciones discretas: Multinomial La distribucin multinomial es similar a la distribucin binomial, con la diferencia de que en lugar de dos posibles resultados en cada ensayo, puede haber mltiples resultados: Ejemplo: a unas elecciones se presentaron 2 partidos polticos: el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hayan votado al JEJE? Ejemplo: a esas elecciones se presentaron 4 partidos polticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. Cul es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al MUMU y 1 al LALA? La distribucin multinomial sigue el siguiente modelo:

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que el partido POPO lo hayan votado 3 personas)

223

n: indica el nmero de veces que se ha repetido el suceso (en el ejemplo, 5 veces) n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1) p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%) Veamos el ejemplo:

Luego: P = 0,0256 Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera es tan slo del 2,56% Nota: 0! es igual a 1, y cualquier nmero elevado a 0 es tambin igual a 1 Veamos otro ejemplo: En una fiesta, el 20% de los asistentes son espaoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeo grupo se han reunido 4 invitados: cual es la probabilidad de que 2 sean espaoles y 2 italianos?

224

Aplicamos el modelo:

Luego P = 0,0384 Por lo tanto, la probabilidad de que el grupo est formado por personas de estos pases es tan slo del 3,84%. 19.1.6 Distribuciones discretas: Multihipergeomtrica La distribucin multihipergeomtrica es similar a la distribucin hipergeomtrica, con la diferencia de que en la urna, en lugar de haber nicamente bolas de dos colores, hay bolas de diferentes colores. Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4 amarillas: cul es la probabilidad de que al extraer 3 bolas sea cada una de un color distinto? La distribucin multihipergeomtrica sigue el siguiente modelo:

225

Donde: X1 = x1: indica que el suceso X1 aparezca x1 veces (en el ejemplo, que una de las bolas sea blanca) N1: indica el nmero de bolas blancas que hay en la urna (en el ejemplo, 7 bolas) N: es el nmero total de bolas en la urna (en el ejemplo, 14 bolas) n: es el nmero total de bolas que se extraen (en el ejemplo, 3 bolas) Veamos el ejemplo:

Luego: P = 0,2307
226

Es decir, que la probabilidad de sacar una bola de cada color es del 23,07%. Veamos otro ejemplo: En una caja de lpices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se extraen 7 lpices, cual es la probabilidad de que 5 sean amarillos y 2 rojos? Aplicamos el modelo:

Luego P = 0,0777 Por lo tanto, la probabilidad de que los 5 lpices sean de los colores indicados es del 7,77%.

227

19.1.7

Distribuciones continuas: Uniforme

En estadstica la distribucin uniforme es una distribucin de probabilidad cuyos valores tienen la misma probabilidad. La distribucin uniforme es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad. Es una distribucin continua porque puede tomar cualquier valor y no nicamente un nmero determinado (como ocurre en las distribuciones discretas). Se dice que una variable aleatoria X continua tiene una distribucin uniforme en el intervalo [a,b] si la funcin de densidad de probabilidad (FDP) es f(x) = 0 para el resto

Ejemplo: el precio medio del litro de gasolina super durante el prximo ao se estima que puede oscilar entre 196 ctvs. y 205 ctvs. americanos. Podra ser, por tanto, de 197, 198, 200 ctvs., etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

228

Su funcin de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

Donde: b: es el extremo superior (en el ejemplo, 205 ctvs..) a: es el extremo inferior (en el ejemplo, 196 ctvs.) Por lo tanto, la funcin de distribucin del ejemplo sera:

Es decir, que el valor final est entre 196 ctvs. y 197 ctvs. tiene un 11% de probabilidad, que est entre 200 ctvs. Y 2001 ctvs., otro 5%, etc. El valor medio de esta distribucin se calcula:

En el ejemplo:

229

Por lo tanto, el precio medio esperado de la gasolina para el prximo ao es de 200.5 ctvs. Veamos otro ejemplo: El volumen de precipitaciones estimado para el prximo ao en la ciudad de Sevilla va a oscilar entre 400 y 500 litros por metro cuadrado. Calcular la funcin de distribucin y la precipitacin media esperada:

Es decir, que el volumen de precipitaciones est entre 400 y 401 litros tiene un 1% de probabilidades; que est entre 401 y 402 litros, otro 1%, etc. El valor medio esperado es:

Es decir, la precipitacin media estimada en Sevilla para el prximo ao es de 450 litros.

230

19.1.8

Distribuciones continuas: Normal

La distribucin normal se presenta como un caso particular de probabilidad de variable aleatoria continua. Fue el francs Abraham de Moivre (16671754) quin la estableci y posteriormente, Carl Friedrich Gauss (1777-1855) elabor estudios ms profundos y formul la ecuacin de la curva; de ah que tambin se le conozca, ms comnmente, como la campana de Gauss. La distribucin de una variable normal est completamente determinada por dos parmetros, su media () y su desviacin estndar (). Con esta notacin, la densidad de la normal viene dada por la ecuacin:

Esta frmula determina la curva en forma de campana,

En general, la funcin de densidad de cualquier v.a. normal tiene una grfica similar, siempre simtrica respecto de la media.
conocida como campana de Gaus.

231

Es el modelo de distribucin ms utilizado en la prctica, ya que multitud de fenmenos se comportan segn una distribucin normal. Esta distribucin de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribucin. Un 50% de los valores estn a la derecha de este valor central y otro 50% a la izquierda Propiedad No importa cules sean los valores de y para una distribucin de probabilidad normal, el rea total bajo la curva siempre es 1, de manera que podemos pensar en reas bajo la curva como si fueran probabilidades. Matemticamente es verdad que:

232

Aproximadamente el 68% de todos los valores de una poblacin normalmente distribuida se encuentra dentro de 1 desviacin estndar de la media.

Aproximadamente el 95.5% de todos los valores de una poblacin normalmente distribuida se encuentra dentro de 2 desviaciones estndar de la media.

233

Aproximadamente el 99.7% de todos los valores de una poblacin normalmente distribuida se encuentra dentro de 3 desviaciones estndar de la media.

La distribucin Normal viene definida por dos parmetros: X: N (, 2) : es el valor medio de la distribucin y es precisamente donde se sita el centro de la curva (de la campana de Gauss). 2: es la varianza. Indica si los valores estn ms o menos alejados del valor central: si la varianza es baja los valores estn prximos a la media; si es alta, entonces los valores estn muy dispersos.

234

Cuando la media de la distribucin es 0 y la varianza es 1se denomina normal tipificada, y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribucin. Adems, toda distribucin normal se puede transformar en una normal tipificada: Ejemplo: una variable aleatoria sigue el modelo de una distribucin normal con media 10 y varianza 4. Transformarla en una normal tipificada. X: N (10, 4) Para transformarla en una normal tipificada se crea una nueva variable (Y) que ser igual a la anterior (X) menos su media y dividida por su desviacin tpica (que es la raz cuadrada de la varianza)

En el ejemplo, la nueva variable sera:

Esta nueva variable se distribuye como una normal tipificada, permitindonos, por tanto, conocer la probabilidad acumulada en cada valor. Y: N (0, 1)

235

BIBLIOGRAFA
1. Bello, Len Daro. 2005. Estadstica como apoyo a la

Investigacin. Editorial L. Vieco e Hijas Ltda.


2. Cabrera, C. and Jaramillo, J.

1997. Estadstica Inferencial. Universidad Tcnica de Loja. Ecuador. Pp 510 Estadstica General con nfasis en Muestreo. Editorial Jurdica, S.A. Primera Edicin. Lima Per. Pp 518. Casco F., Ignacio. 2006 Introduccin a la probabilidad. Departamento de Estadstica. Universidad Calos III de Madrid. Madrid Espaa.

3. Calzada B, Jos. 1966.

4.

5. Daniel, Wayne W. 1988. Bioestadstica: Base para el

anlisis de las ciencias de la salud. Noriega editores. Editorial Limusa. Tercera edicin. Mxico.
6. Daz, Ramn et all. 1999.

El Anlisis de Varianza y sus aplicaciones. Centro de Estudios Forestales de Postgrado. Universidad de los Andes. Mrida Venezuela. Pp 540

236

7. Fantoni

C, Hctor. 1975. Distribuciones Bidimensionales de Frecuencias. Regresin y Correlacin. Segunda Edicin. Guayaquil Ecuador. Pp 167. 1980. Generalidades y Distribuciones Unidimensionales de Frecuencias. Segunda Edicin. Guayaquil Ecuador. Pp 221. Curso de Estadstica General. Anlisis Metodolgico. Guayaquil Ecuador. Pp 217

8. _________________

9. _________________ 1976.

10. Freese, Frank. Linear Regresin Methods for Forest

Research. Forest Products Laboratory. Forest Service U.S. Department of Agriculture. Pp 134
11. ____________

1974. Freese, Frank. Elementary Statistical Methods for Foresthers Products Laboratory. Forest Service U.S. Department of Agriculture in cooperation with the University of Wisconsin. Agriculture Handbook 317. Washington. United State. Pp 134

12. Grisales Romero Hugo. 2002. Estadstica Aplicada en

Salud Pblica: Estadstica Descriptiva y Probabilidad. Editorial L-Vieco e Hijas.

237

13. Hoel, Paul. Estadstica Elemental. Nueva Edicin. Los

Angeles California, 1966. Pp 396. 14. Kalton, G. 1974. Introduccin a los conceptos estadsticos. Instituto de Estadstica Aplicada y Computacin. Universidad de los Andes. Mrida Venezuela. Pp 80.
15. Kazmier, Leonardo. 1998.

Estadstica aplicada a la administracin y a la economa. McGraw Hill Interamericana de Editores, S.A. Mexico.

16. Laplace, Pierre Simon de. 1988. Ensayo Filosfico sobre las Probabilidades. Alianza Editorial. El libro de bolsillo-SEP. 17. Marques de Cant, Mara Jos. Probabilidades y Estadstica. Para Ciencias Qumico-Biolgicas. Editorial McGraw-Hill 1991
18. Meyer, Paul. 1973.

Probabilidad y Aplicaciones Estadsticas. Versin en Espaol. Departamento de Estadsticas. Universidad Catlica de Chile. Fondo Educativo Interamericano, S.A. Pp 231.

19. Milton, J. Susan, 2001. Estadstica para la Biologa y

Ciencias de la Salud. Editorial McGraw-Hill. Tercera Edicin. Espaa

238

20. Ogaya, Noel. 1980. Algunos aspectos de regresin y

correlacin. Universidad de los Andes. Facultad de Ciencias Forestales. Mrida venezuela. Pp 97


21. Vidal, Juan. 1984. Estadstica. Ejercicios de Inferencia

Estadstica. Faculta de Economa. Universidad de los Andes. Mrida Venezuela. Pp 70


22. Ya-Lun Chou.

Anlisis Estadstico. Nueva Editorial Interamericana, S.A. Primera Edicin. Impreso en Mexico, 1972. Pp 85

239

Вам также может понравиться