Вы находитесь на странице: 1из 15

PROBABILIDAD Y ESTADISTICA UNIDAD I ESTADISTICA DESCRIPTIVA

1.1 CONCEPTOS BASICOS DE ESTADISTICA

El tema de la estadstica moderna abarca la recoleccin, presentacin y caracterizacin de informacin para ayudar tanto en el anlisis de datos como en el proceso de la toma de decisiones. La estadstica se divide normalmente en dos: Estadstica Descriptiva.- Puede definirse como aquellos mtodos que incluyen la recoleccin, presentacin y caracterizacin de un conjunto de datos con el fin de describir apropiadamente las diversas caractersticas de ese conjunto de datos. Ejemplos: promedio de bateo, ndice de accidentes, tasa de mortalidad, calcular desviacin estndar, etc. Inferencia Estadstica o Estadstica inferencial . Puede definirse como aquellos mtodos que hacen posible la estimacin de una caracterstica de una poblacin o la toma de una decisin referente a una poblacin, basndose slo en los resultados de la muestra. Por ejemplo un profesor de historia decide servirse de la calificacin promedio lograda por un grupo para estimar el promedio de los diez grupos que asisten al mismo curso de historia. El proceso de estimacin de la calificacin promedio sera un problema de inferencia estadstica. Cualquier conclusin a la que llegue el profesor respecto al os diez grupos del curso se basar en una generalizacin que va mucho ms all de loas datos relativos al grupo que asiste al curso de historia; y la generalizacin no ser totalmente vlida, de modo que el profesor debe indicar las probabilidades de que sea verdadera. Teora de decisin. Algunos de los problemas ms importantes de la inferencia estadstica se refieren a la evaluacin de los riesgos y las consecuencias que pueden ocurrir al hacer generalizaciones a partir de una muestra de datos. Esto incluye una estimacin de la probabilidad de tomar decisiones errneas, las posibilidades de hacer predicciones incorrectas. En los ltimos aos, se han hecho intentos de abordar todos estos problemas dentro del marco de referencia de una teora unificada llamada teora de decisin. Si bien esta teora tiene muchas ventajas conceptuales y tericas, plantea algunos problemas de aplicacin que son difciles de resolver. Para entenderlos debe comprenderse que, por muy objetivamente que se planee un experimento o investigacin, es imposible eliminar todos los elementos subjetivos. Un elemento de subjetividad interviene aun cuando definimos elementos como bueno o mejor con respecto a la razn de criterios de decisin (por ejemplo buscaremos una lnea recta que mejor se ajuste a un conjunto dado de pares ordenados de datos). La gran mayora de los mtodos que sern usados para plantear y resolver estos problemas pertenecen al enfoque clsico, ya que no toman en cuenta los varios factores subjetivos mencionados antes. Algunas otras aplicaciones pertenecen al enfoque Bayesiano, que consideran, informalmente al menos, algunos de estos factores subjetivos. La subjetividad

influye mucho en la eleccin de los mtodos estadsticos o frmulas empleadas en una situacin especfica. Poblacin (o universo): Es la totalidad de elementos o cosas bajo consideracin. Una Muestra: Es la porcin de la poblacin que se selecciona para su anlisis. Un Parmetro: Es una medida de resumen que se calcula para describir una caracterstica de toda una poblacin. Una Estadstica: Es una medida de resumen que se calcula para describir una caracterstica de una sola muestra de la poblacin. Muestra aleatoria: Es una muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad. 1.2 DESCRIPCION DE DATOS Los datos ayudan a los encargados de la toma de decisiones a hacer conjeturas bien fundamentadas acerca de las causas y, por lo tanto, sobre los efectos probables de ciertas caractersticas de algunas situaciones. Por lo dems, el conocimiento de las tendencias adquirido con la experiencia permite conocer los posibles resultados y planear con anticipacin. Los datos estadsticos se obtienen mediante un proceso que comprende la observacin o medicin de conceptos, como ingresos anuales de una comunidad, calificaciones de exmenes, resistencia a la rotura de las fibras de plstico, etc., a menudo son tan numerosos que carecen de utilidad a menos que sean condensados o reducidos a una forma ms adecuada. Algunas veces puede ser satisfactorio presentar los datos tal como se encuentran y obtener informacin directamente de ellos; otras veces solo habr que agruparlos y presentarlos en forma grfica o tabulada, aqu el uso de las tecnologas computacionales es mucha utilidad y rapidez. DATOS AGRUPADOS Cuando la muestra consta de ms de 30 datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las caractersticas de la muestra y por consiguiente las de la poblacin de donde fue tomada. Los datos agrupados se pueden resumir grficamente, o en tablas, y mediante el uso de medidas numricas, como la media, la amplitud, la desviacin estndar, y otras ms. El nombre que reciben los datos ordenados en grupos o categoras es el de distribucin de frecuencia.

Distribucin de frecuencia Una forma de sintetizar los datos consiste en valerse de una tabla o distribucin de frecuencia. Tomemos como ejemplo el inventario promedio en das de 20 tiendas de conveniencia. En las siguientes tablas se han incluido datos idnticos referentes al inventario promedio y se han dispuesto primero como un arreglo en orden ascendente y luego como una distribucin de frecuencia. Para obtener la tabla 2 se tuvo que dividir los datos en grupos de valores semejantes. Despus se registraron el nmero de puntos graficados (observaciones) de datos que caan dentro de cada grupo.
TABLA 1: Arreglo de datos del inventario promedio (en das) de 20 tiendas de artculos de conveniencia 2.0 3.4 3.4 3.8 3.8 4.0 4.1 4.1 4.1 4.2 4.3 4.7 4.7 4.8 4.9 4.9 5.5 5.5 5.5 5.5

TABLA 2: Distribucin de frecuencia del inventario promedio (en das) de 20 tiendas de artculos de conveniencia (6 clases) Clase (grupo de observaciones de datos con valores semejantes) 2.0 a 2.5 2.6 a 3.1 3.2 a 3.7 3.8 a 4.3 4.4 a 4.9 5.0 a 5.5 Frecuencia (nmero de observaciones en cada clase) 1 0 2 8 5 4

Ntese que perdimos un poco de informacin al construir la distribucin de frecuencia, por ejemplo ya no sabemos que el valor 5.5 aparece cuatro veces o que el valor 5.1 no parece en absoluto. Pero por otra parte, adquirimos informacin concerniente al patrn de los inventarios promedio. La distribucin de frecuencia es una tabla que organiza los datos en clases; es decir, en grupos de valores que describen una caracterstica de los datos. El inventario promedio es una caracterstica de las 20 tiendas de conveniencia Una distribucin de frecuencia muestra el nmero de observaciones provenientes del conjunto de datos que caen dentro de cada una de las clases. Si podemos determinar la frecuencia con que ocurren los valores en cada clase de un conjunto de datos, estaremos en condiciones de construir una distribucin de frecuencia. Caractersticas de las distribuciones de Frecuencia relativa Hasta ahora se ha expresado la frecuencia con que ocurren los valores en cada clase como el nmero total de observaciones que caen en dicha clase. Tambin se puede expresar la frecuencia de cada valor como una fraccin o porcentaje del nmero total de observaciones. La frecuencia de un inventario promedio, digamos de 4.4 a 4.9, es 5 en la tabla 2 y de 0.25

en la tabla 3. Para obtener este ltimo valor, dividimos la frecuencia de esta clase (5) entre el nmero total de observaciones en el conjunto de datos (20). La respuesta puede expresarse como una fraccin ( 5 20 ), un decimal (0.25) o un porcentaje (25 %). Una distribucin de frecuencia relativa presenta las frecuencias en fracciones o porcentajes.
TABLA 3: Distribucin de frecuencia relativa del inventario promedio (en das) de 20 tiendas de artculos de conveniencia CLASE 2.0 a 2.5 2.6 a 3.1 3.2 a 3.7 3.8 a 4.3 4.4 a 4.9 5.0 a 5.5 FRECUENCIA 1 0 2 8 5 4 20 Frecuencia relativa: Fracciones de observaciones en cada clase 0.05 0.00 0.10 0.40 0.25 0.20 1.00 suma de las frecuencias relativas de todas las clases

La suma de todas las frecuencias relativas es de 1.00 o 100 %. Esto sucede porque una distribucin de frecuencia relativa parea cada clase con su fraccin o porcentaje correspondiente de los datos totales. Por lo anterior, las clases en cualquier distribucin de frecuencia simple o relativa son exhaustivas. Todos los datos encajan en una u otra categora. Observe tambin que las clases son mutuamente excluyentes; es decir, ninguna observacin cae dentro de ms de una categora. Clases discretas. Los esquemas de clasificacin pueden ser cualitativos o cuantitativos y discretos o continuos. Las clases discretas son entidades individuales que no pasan de una clase a la siguiente sin una ruptura. Son discretas las siguientes clases: el nmero de hijos de las familias, el nmero de camiones que poseen las compaas transportistas, las ocupaciones de los graduados universitarios. Los datos continuos pueden pasar de una clase a la siguiente sin ruptura alguna. Contienen una medida numrica como el peso de unas latas de tomates, los kilogramos de presin sobre el concreto, o el promedio de calificaciones de los universitarios el ltimo semestre. Construccin de una distribucin de Frecuencia Ahora que hemos aprendido a dividir una muestra en clases, ya se esta en condiciones de tomar datos brutos y construir una distribucin de frecuencia. A continuacin tomaremos el siguiente ejemplo para el desarrollo de la distribucin de frecuencia: EJEMPLO 1: Un ingeniero de control de calidad del agua en Charlotte (North Carolina) es responsable del nivel de clorinacin del agua. Dicho nivel ha de acercarse bastante al que exige el departamento de salubridad. Para vigilar el cloro sin necesidad de verificar cada galn de agua que sale de la planta, el ingeniero muestrea diariamente algunos galones, mide el contenido de cloro y extrae una conclusin sobre el nivel promedio de clorinacin que tiene el agua tratada de ese da. La tabla anexa muestra las concentraciones de cloro de 30 galones seleccionados como muestra de un da. Estos niveles son los datos brutos de

donde el ingeniero saca sus conclusiones respecto a la poblacin total a la que se aplic la clorinacin ese da.
TABLA 4: Concentraciones de cloro en partes por milln (ppm) en 30 galones de agua tratada. 16.2 15.7 16.4 15.4 16.4 15.8 16.0 15.2 15.7 16.6 15.8 16.2 15.9 15.9 15.6 15.8 16.1 15.9 16.0 15.6 16.3 16.8 15.9 16.3 16.9 15.6 16.0 16.8 16.0 16.3

Para analizar los datos de esta tabla seguiremos los siguientes pasos: 1.- Escoger el tipo y nmero de clases para dividir los datos . En este caso, ya se ha optado por clasificar los datos segn la medida cuantitativa del nmero de ppm del cloro en el agua tratada, en vez de hacerlo a partir de un atributo cualitativo como color o el olor del agua. Despus necesitamos decidir cuntas clases utilizar y el intervalo (la distancia que debe comprender cada clase). El nmero de clases por utilizar depende principalmente del nmero de observaciones en los datos. Esto es, un nmero mayor de observaciones requiere un mayor nmero de grupos de clase. En general la distribucin de frecuencia debe tener al menos cinco clases pero no ms de 15. Si no hay suficientes agrupamientos de clase o si hay demasiados, se obtendr poca informacin. A continuacin se muestra una tabla que nos puede ser til para seleccionar el nmero de clases, aclarando que esta designacin no es obligatoria y puede ser a decisin del analista..
TAMAO DE MUESTRA O N DE DATOS NUMERO DE CLASES (K)

Menos de 50 50 a 99 100 a 250 250 en adelante

5a7 6 a 10 7 a 12 12 a 15

Para designar el nmero de clases usaremos la letra K, para este ejemplo se usar K= 6 clases. Es deseable que el ancho da cada agrupamiento de clase (intervalo del inicio de una clase al inicio de la siguiente) sea igual. Para determinar el ancho de cada clase, el alcance de los datos de divide entre el nmero de agrupamientos de clase deseado: Ancho de Intervalo : Rango = nmero total de intervalos de clase A= R K R = Val. mayor Val. menor

La amplitud o ancho del intervalo se calcula: 16.9 15.2 = 0.283 0.30 ppm 6 Ya se ha terminado el paso 1. Se han clasificado los datos segn la media cuantitativa de cuantas ppm se encuentran en el agua tratada. Se escogieron seis clases para cubrir el intervalo de 15.2 a 16.9 y en consecuencia se utilizar 0.3 ppm como el ancho de los intervalos de clase. A= 2.- Clasificar los puntos de datos en clases y contar el nmero de puntos en cada clase: Esta informacin aparece en la tabla 5. Toda observacin de datos encaja por lo menos en una clase y ninguna observacin lo hace en ms de una clase. Por lo que nuestras clases son exhaustivas y mutuamente excluyentes. Observe que el lmite inferior de la primera clase corresponde a la menor observacin de datos de la muestra, y que el lmite superior de la ltima clase corresponde a la observacin mayor de los datos.
TABLA 5: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3 ppm CLASE 15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9 FRECUENCIA 2 5 11 6 3 3 30

3.- Mostrar las observaciones en una grfica. Vase la figura siguiente.

12 10
Frecuencia

11

8 6 4 2 0
15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9

6 5 3 2 3

Fig. 1 Histograma de Frec. Absoluta Graficacin de las distribuciones de Frecuencia. Las grficas de distribucin de frecuencia y de distribucin de frecuencia relativa son tiles porque ponen de manifiesto y aclaran las tendencias que no se captan fcilmente en las tablas. Atraen la atencin del lector sobre las tendencias de los datos.

Histogramas La figura 1 es un ejemplo de un histograma. El histograma es una serie de rectngulos, todos ellos de anchura proporcional a la gama de valores dentro de una clase y tambin de altura proporcional a los elementos que caen dentro de la clase. Si las clases que empleamos en la distribucin de frecuencia tienen el mismo ancho, las barras verticales del histograma lo tendrn tambin. La altura de la barra de cada clase corresponde al nmero de elementos de est ltima. Un histograma que se sirve de la frecuencia relativa (tabla 6) de las observaciones de datos en cada una de las clases y no del nmero real de observaciones recibe el nombre de Histograma de frecuencia relativa (fig. 2). Este tiene la misma forma que un histograma de frecuencia absoluta hecho con el mismo conjunto de datos. La nica diferencia entre el histograma de frecuencia absoluta y el de frecuencia relativa, es la escala vertical de la izquierda, en el primero es el nmero absoluto de observaciones en cada clase y en el segundo es el nmero de observaciones en cada clase como una fraccin del nmero total de ellas.
TABLA 6: Concentraciones de cloro en muestras de agua tratada con intervalos de clase de 0.3 ppm usando la frecuencia relativa. CLASE FRECUENCIA FREC. REL. 15.2 - 15.4 2 0.067 15.5 - 15.7 5 0.167 15.8 - 16.0 11 0.367 16.1 - 16.3 6 0.200 16.4 - 16.6 3 0.100 16.7 - 16.9 3 0.100 Total 30 1.000

Fig. 2 Histograma de Frec. Relativa


HISTOGRAMA DE FRECUENCIA RELATIVA

0.400 0.350 0.300 0.250 0.200 0.150 0.100 0.050 0.000

0.367

PORCENTAJE

0.200 0.167 0.100 0.067 0.100

15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9

Polgono de frecuencias Aunque de menor uso, los polgonos de frecuencias son otro medio de representar grficamente tanto las distribuciones de frecuencia simples como las de frecuencia relativa. Para construir un polgono de frecuencias, marcamos las frecuencias sobre el eje vertical y los valores de la variable que vamos a medir las marcamos sobre el eje horizontal, tal como lo hicimos con los histogramas. El siguiente paso consiste en graficar cada frecuencia de clase dibujando un punto sobre su marca de clase, o punto medio, y conectar los puntos consecutivos con una recta para formar un polgono (figura de muchos lados). A continuacin en la tabla 7 se muestran los datos de una distribucin de frecuencias para elaborar un polgono.
TABLA 7: Datos de la concentracin de cloro en ppm (distribucin de frecuencia) para graficar polgono de frecuencias.
CLASE FRECUENCIA 0 2 5 11 6 3 3 0 30 CENTRO CLASE 15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1

15.2 - 15.4 15.5 - 15.7 15.8 - 16.0 16.1 - 16.3 16.4 - 16.6 16.7 - 16.9

En la figura 3 se muestra un polgono de frecuencias construido con los datos de la tabla 7. Si comparamos esta figura con las figuras anteriores vemos que se han agregado clases en cada extremo de la escala de valores observados. Estas dos nuevas clases contienen cero observaciones, pero permiten al polgono alcanzar el eje horizontal en ambos extremos de la distribucin.
FIG. 3 Polgono de frecuencias
POLIGONO DE FRECUENCIAS

12 FRECUENCIA 10 8 6 4 2 0
15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1

Concentracin de cloro en ppm

El polgono es simplemente una grfica lineal que une los puntos medios de todas barras en un histograma. Se llama polgono de frecuencias relativas a aquel que usa la frecuencia relativa de de los puntos de datos en cada clase y no el nmero real de puntos. Ojivas Una distribucin de frecuencia acumulativa nos permite ver cuantas observaciones se hallan por arriba o por debajo de ciertos valores, en lugar de limitarnos a anotar los nmeros de elementos dentro de los intervalos. Por ejemplo, si queremos saber cuantos galones contienen menos de 17.0 ppm, podemos servirnos de una tabla que incluya frecuencias acumulativas menores que en nuestra muestra como se observa en la tabla 8.
TABLA 8: Distribucin de frecuencia acumulativa menor que de las concentraciones de cloro en ppm CLASE Menor que 15.2 Menor que 15.5 Menor que 15.8 Menor que 16.1 Menor que 16.4 Menor que 16.7 Menor que 17.0 FRECUENCIA ACUMULATIVA 0 2 7 18 24 27 30

Se llama ojiva a la grfica de una distribucin de frecuencia acumulativa. La ojiva de una distribucin de este tipo se muestra en la figura 4. Los puntos graficados representan la cantidad de galones que tienen menos cloro que las partes por milln indicadas sobre el eje horizontal.
FIG. 4 Ojiva menor que de la distribucin de las concentraciones de cloro en ppm para 30 galones de agua tratada.
33 30 27 24 21 18 15 12 9 6 3 0 15.2 15.5 15.8 16.1 16.4 16.7 17.0 Concentracin de cloro en ppm

No. Acumulativo de gal. muestreados

En ocasiones la informacin que se utiliza se presenta a partir de frecuencias mayores que. La ojiva apropiada para tal informacin tendr una pendiente hacia abajo y hacia la derecha. Tambin es posible construir una ojiva de una distribucin de frecuencia relativa, de la misma manera que una absoluta. DATOS NO AGRUPADOS Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es menor de 30 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto se le llama tratamiento de datos no agrupados. Con frecuencia un conjunto de nmeros se pueden reducir a una o unas cuantas medidas numricas sencillas que resumen el conjunto total. Tales medidas son fciles de comprender que los datos originales, no procesados. Dos importantes caractersticas de los datos que las medidas numricas pueden poner de manifiesto son: 1) el valor central o tpico del conjunto y 2) la dispersin de los nmeros. 1.3 MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS Estas medidas se utilizan para indicar un valor que tiende a ser el ms representativo de un conjunto de nmeros. Las tres medidas que ms comnmente se emplean son la media, la mediana y la moda. En la fig. 5 podemos apreciar el significado grafico de las medidas de tendencia central.

Curva B Curva A

Curva C

Fig. 5. Comparacin de la localizacin central de las tres curvas

Media Aritmtica Es lo que viene a la mente de la mayora de las personas cuando se menciona la palabra promedio Como este trmino tiene ciertas propiedades matemticas deseables, es la ms importante de las tres. La media aritmtica se calcula al sumar los valores de un conjunto de datos y dividir el resultado de la suma entre el nmero de valores del mismo.

La media poblacional se calcula:

X
i =1

donde = Media Poblacional y N = N datos de la poblacin

La media muestral se calcula: X=

X
i =1

en donde: X = media muestral y n= n datos en la muestra

Ejemplo: Se han tomado como muestra las medidas de seis cables (cm.) usados en un arns para lavadora, las cuales son: 15.2, 15.0, 15.1, 15.2, 15.1y 15.0, determine su media aritmtica. Media Geomtrica Algunas veces estamos manejando cantidades que cambian a lo largo de un periodo; entonces necesitamos conocer una tasa promedio de cambio, como el crecimiento promedio a travs de un periodo de varios aos. En tales casos la simple media aritmtica no es apropiada, porque no proporciona las respuestas correctas. Lo que necesitamos encontrar es la media geomtrica. Se calcula con la siguiente formula:

G;

x1 * x2 ...* xn

Ejemplo: Consideremos el crecimiento de una cuenta de ahorros. Supngase que depositamos $ 100 inicialmente y dejamos que el inters se acumule a diferentes tasas por cinco aos. El crecimiento se resume en la siguiente tabla:
AO TASA DE INTERES FACTOR DE CRECIMIENTO AHORROS AL FIN DE AO

1 2 3 4 5

7% 8 10 12 18

1.07 1.08 1.10 1.12 1.18

$ 107.00 115.56 127.12 142.37 168.00

El rtulo factor de crecimiento es igual a: 1 +

tasa de inters 100

El factor de crecimiento de la media aritmtica ser (1.07 +1.08 +1.10 +1.12 +1.18) / 5 = 1.11. Pero para encontrar el factor correcto utilizaremos la media geomtrica:

M .G. = 5 1.07 *1.08*1.10*1.12*1.18 = 1.1093

Factor de crecimiento promedio.

Ntese que la tasa correcta del inters promedio de 10.93 % al ao, obtenida mediante la media geomtrica, se acerca mucho a la tasa promedio incorrecta de 11 % calculada en la media aritmtica. Esto se debe a que las tasas de inters son relativamente pequeas. Pero no sucumbamos ala tentacin de recurrir a la media aritmtica en vez de la media geomtrica, la cual es ms complicada La media Ponderada Nos permite obtener un promedio que tiene en cuenta la importancia de cada valor para el total global. Xw =

X w
i =1 n i

w
i =1

donde wi = Peso asignada a cada observacin

Tomemos, por ejemplo, la situacin en la que un profesor informa a su clase que les har dos exmenes de una hora, cada uno de los cuales equivaldr al 30 % de la calificacin de todo el curso, y un examen final que corresponder al 40 %. El clculo de la media deber considerar las diferentes ponderaciones de los exmenes. As el alumno que tenga: Examen 1 2 3 La Mediana Es una medida de tendencia central diferente a las medias. La mediana es un solo valor del conjunto de datos que mide el elemento central en los datos una vez que estos han sido ordenados segn su valor o magnitud. Para calcular la mediana se presentan dos casos: a).- Cuando el nmero de datos en la muestra es impar . En este caso despus de ordenar los datos de la muestra en cuanto a su magnitud, es decir de mayor a menor o de menor a mayor valor, se procede a localizar aquel dato que se encuentra justo en el centro de los datos o en la parte central de los mismos. Ejemplo: Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arns de lavadora; se toman como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, y 11.5 cm. Solucin: Ordenando los datos de menor a mayor valor: 11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5 Xmed = 11.3 cm Calificacin 80 90 96 Ponderacin 0.30 0.30 0.40

Media ponderada =

0.30(80) + 0.30(90) + 0.40(96 0.30 + 0.30 + 0.40 = 89.4

b).- Cuando el nmero de datos en la muestra es par. En este caso despus de ordenar los datos en cuanto a su magnitud, observamos que en la parte central de los datos no se encuentra dato alguno, en este caso la mediana, tomar el valor promedio de dos datos; el que se encuentra antes de la parte central y el que se encuentra despus de la parte central. Ejemplo: Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arns de lavadora; se toman como muestra ocho circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5, y 11.4 cm. Solucin: Ordenando los datos de mayor a menor valor, 11.5, 11.4, 11.4, 11.3, 11.2, 11.2, 11.2, 11.1 cm. 11.3 + 11.2 xmed = = 11.25cm 2 La Moda Se define como aquel valor o valores que ms se repiten entre los datos que se han obtenido en una muestra. Una vez que los datos se han ordenado es posible observar la moda o modas de la misma, la distribucin de los datos puede ser amodal (carece de moda, Unimodal (tiene una sola moda), bimodal (tiene dos modas), polimodal (tiene ms de dos modas). Ejemplo: Determine la moda de los datos que se muestran a continuacin: Se refieren a la estatura de un grupo de jvenes; 1.60, 1.65, 1.70, 1.71, 1.70, 1.70, 1.70, 1.93, 1.87, 1.85 Xmod = 1.70m 1.4 MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS Cuando se tiene una muestra de datos obtenida de una poblacin cualquiera, es importante determinar sus medidas de tendencia central as como tambin el determinar que tan dispersos estn los datos en la muestra. Por ejemplo las medidas de dispersin indican si los valores estn relativamente cercanos uno del otro o si se encuentran dispersos. En la Fig. 6 se aprecia la dispersin que hay entre las dos curvas. 11.3 + 11.2 xmed = = 11.25cm 2

Curva B Curva A

Fig. 6 Dispersin entre dos curvas

La dispersin mide cuan prximos estn los valores de un grupo entre si Es conveniente considerar cuatro variables de dispersin: La amplitud de variacin (o rango), la desviacin media, la varianza y la desviacin estndar. Todas estas medidas, excepto la amplitud de variacin, toman a la media como punto de referencia. Un valor cero indica que no hay dispersin, la dispersin aumenta a medida que se incrementa el valor de la medida (amplitud, varianza, etc.). Amplitud de variacin o rango Es la medida ms sencilla de calcular y comprender. Es la diferencia entre el valor mayor y el valor menor. Se determina de la siguiente manera: R = VM Vm Ejemplo: Se han tomado como muestra las siguientes mediciones de la resistencia a la tensin de la soldadura usada para unir dos cables, estas son: 78.5, 82.4, 87.3, 78.0,90.0, 86.5, 77.9, 92.4, 75.9 kg. Solucin: VM= 92.4 Kg Vm= 75.9 kg R= VM Vm = 92.4 75.9 = 16.5 Kg La principal limitacin de la Amplitud de variacin o rango es que considera solamente los valores extremos de un conjunto, y no proporciona mayor informacin respecto a los dems valores del mismo. Se ha encontrado determinado nmero de medidas de dispersin que utilizan la media como punto de referencia. Todas incluyen la obtencin de la desviacin, o diferencia entre cada valor y la media (xi - X ). Se consideran tres de estas medidas. La primera trata sobre la desviacin absoluta respecto de la media, mientras que las otras dos se concentran en las desviaciones cuadradas a partir de la media. Desviacin absoluta media (DAM). Mide la desviacin promedio de valores con respecto a la media del grupo, sin tomar en cuenta el signo de la desviacin. Se obtiene al restar la media a cada valor del grupo, eliminando el signo de la desviacin, hallando despus el promedio.

DAM =

x x
i =1 i

Ejemplo determine la desviacin media para el siguiente conjunto de datos: 2, 4, 6, 8, 10. Solucin: obtenga la media: Halle la desviacin media: x= 2 + 4 + 6 + 8 + 10 5

DAM =

2 6 + 4 6 + 6 6 + 8 6 + 10 6 2 6 + 4 6 + 6 6 + 8 6 + 10 6 = 2.4 DAM = 5 5

Varianza o Variancia. La varianza de una muestra se calcula casi en la misma forma que la desviacin media, con dos pequeas diferencias: 1) las desviaciones de elevan al cuadrado antes de ser sumadas y, 2) se obtiene el promedio, utilizando n - 1 en lugar de n.

sx

( x x) =
i

Ejemplo: Calcular la varianza de la muestra: 2, 4, 6, 8 y 10 Primero se calcula la media x =

n 1

2 + 4 + 6 + 8 + 10 =6 5

s2 =

(2 6) 2 + (4 6) 2 + (6 6) 2 + (8 6) 2 + (10 6) 2 = 10.0 5 1

Desviacin estndar La desviacin estndar es simplemente la raz cuadrada positiva de la varianza. De este modo si la varianza es 81 la desviacin estndar es 9. Para obtener la desviacin estndar se debe calcular la varianza y hallar su raz cuadrada. Las formulas para la desviacin estndar son: s=

( x x)
i

n 1

2 ( xi ) / n

n 1

La desviacin estndar es una de las medidas de resumen que ms se suele utilizar para distribuciones, y desempea un papel importante en la estadstica. Es importante notar que las unidades de la desviacin estndar son las mismas que las de la media.

Вам также может понравиться