Вы находитесь на странице: 1из 4

Medidas de posicin Las medidas de posicin son funciones de los datos de una muestra que miden, segn diferentes

criterios, el centro de la distribucin de frecuencias en la muestra; tambin son llamadas medidas de tendencia central. Las ms usadas para este fin son: la media muestral ( x ), los cuantiles (xp), la mediana muestral (me) y el modo muestral (mo). Medidas de dispersin Para describir la dispersin de los elementos de una muestra, las medidas que se encuentran con mayor frecuencia en la literatura tcnica (Steel y Torrie, 1985; Berenson et al., 1983) son el rango muestral, el rango intercuartlico, la varianza, el desvo estndar o desviacin estndar muestral y el coeficiente de variacin muestral. Se ver en captulos posteriores cmo se utilizan estas medidas para inferir acerca de los parmetros correspondientes de la distribucin Histogramas y Polgonos Otra forma alternativa de presentar los resultados de la Tabla 1.3 es mediante el clsico histograma. La Figura 1.14 presenta el histograma de frecuencias relativas y el polgono correspondiente al peso de las larvas del estadio 1. Lo ms destacable que puede observarse es la marcada asimetra de la distribucin; en comparacin con la representacin en box-plot es ms difcil identificar los percentiles, los valores extremos y muy extremos. 0.32 0.97 1.61 2.26 2.91 3.55 4.20 Peso (mg) 0.00 Esta distribucin tiene origen cuando ocurren las siguientes tres condiciones en forma simultnea: a) Se realizan o repiten n ensayos Bernoulli. b) El parmetro se mantiene constante entre ensayos. c) Los ensayos son todos independientes entre s. Estas condiciones experimentales son muy frecuentes, y en general el problema de inters radica en el nmero de xitos en n casos estudiados, o el nmero de respuestas no en n consultas, o el nmero de veces que ocurre un cierto fenmeno atmosfrico en n observaciones realizadas. Cuando se registra la ocurrencia de un fenmeno atmosfrico en n observaciones suele utilizarse la distribucin binomial para modelar el nmero total de ocurrencias. Sin embargo, en este caso es importante destacar que se debe verificar que las observaciones sean independientes y que la probabilidad de ocurrencia del fenmeno atmosfrico () se mantenga constante entre observaciones. En caso contrario el modelo binomial no ser apropiado. Distribucin Hipergeomtrica Esta distribucin est ligada a situaciones de muestreo sin reposicin, es decir situaciones en que al azar se elige un elemento de una poblacin y as sucesivamente hasta completar la muestra, sin restituir los elementos extrados. Para inducir la frmula de esta distribucin, anloga a la binomial, considrese como poblacin a un conjunto de N elementos de los cuales k poseen uno de dos estados posibles (xito) y N-k que presentan el otro (fracaso). Al igual que en la binomial, el problema de inters es hallar la probabilidad de obtener X xitos, pero en este caso, cuando se seleccionan sin reposicin n elementos

de un conjunto de N . Como se recordar, el concepto frecuencial de probabilidad est asociado al cociente: nmero de casos favorables nmero de casos posibles En este problema el nmero de casos totales viene dado por el nmero de combinaciones posibles que se puede obtener a partir de N elementos tomados de a grupos de n. Esto es: Nmero de casos totales = ( N ) Distribucin Poisson La distribucin de Poisson da un modelo para variables de tipo conteo, donde los conteos se refieren al registro del nmero de un evento de inters en una unidad de tiempo o espacio dados (horas, minutos, m2, m3, etc.). Ejemplos de variables que se pueden modelar como Poisson son: a) Nmero de huevos de un insecto en una oviposicin. b) Nmero de bacterias en una muestra de agua. c) Nmero de semillas defectuosas observadas en una cinta transportadora por minuto. d) Nmero de nemtodos por unidad de volumen del suelo. e) Nmero de pulgones por planta. f) Nmero de pulgones por m2. Se da ahora la siguiente definicin formal para esta distribucin. Distribucin Exponencial Esta densidad es un caso especial de la funcin de densidad G(,), tomando =1 y =, quedando as definida: La tabla de contingencia es un medio particular de representar simultneamente dos carcteres observados en una misma poblacin, si son discretos o continuos reagrupados en clases. Los dos carcteres son $ x$ e $ y$, el tamao de la muestra es $ n$. Las modalidades o clases de $ x$ se escribirn $ c_1,\ldots,c_r$, las de $ y$, $ d_1,\ldots,d_s$. Se denota: $ \bullet$ $ n_{hk}$ el efectivo conjunto de $ c_h$ y $ d_k$ : es el nmero de individuos para los cuales $ x$ toma el valor $ c_h$ e $ y$ el valor $ d_k$, $ \bullet$ $ n_{h\bullet}=\sum_{k=1}^s n_{hk}$ el efectivo marginal de $ c_h$ : es el nmero de individuos para los cuales $ x$ toma el valor $ c_h$, $ \bullet$ $ n_{\bullet k}=\sum_{h=1}^r n_{hk}$ el efectivo marginal de $ d_k$ : es el nmero de individuos para los cuales $ y$ toma el valor $ d_k$. Se representan estos valores en una tabla de doble entrada, llamada tabla de contingencia: \begin{displaymath} \begin{array}{\vert c\vert\vert c\vert c\vert c\vert c\vert... ...n_{\bullet k}&\ldots&n_{\bullet s}&n\\ \hline \end{array} \end{displaymath}

Distribucin de frecuencia para datos agrupados Cuando la muestra es grande es frecuente encontrar muchos valores de la variable y resulta poco prctico numerarlas todos, en estos casos resulta conveniente agrupar los valores en intervalos consecutivos llamados clases. Estos intervalos son de la forma [Li, Ls], cuyo extremo Li es el limite inferior de la clase y el extremo Ls es el limite superior de la clase.
No existe alguna ley que defina cmo obtener el nmero de clases; pero la experiencia recomienda que sean entre 5 y 20 clases. Para construir una distribucin de frecuencias en clases seguimos el siguiente procedimiento

aplicado al ejemplo: los puntajes de un examen de ingreso a la universidad realizado por 40 alumnos son los siguientes:110, 102, 108, 115, 120, 130, 93, 124, 112, 102, 110, 108, 108, 109, 110, 90, 95, 98, 104, 124, 130, 97, 125, 136, 140, 104, 108, 96, 106, 107, 103, 92, 122, 93, 99, 107, 105, 103, 115, 110. Paso 1. Determinamos el rango (R) de variacin de los datos que se define como R = Xmax Xmin, donde Xmax es el dato mximo y Xmin es el dato mnimo. Para el ejemplo Xmax = 140 y Xmin = 90 entonces R = 140 90 = 50 Paso 2. Determinamos el nmero de intervalos o clases k. Una forma de hacerlo es con la Regla de Sturges, donde: k = 1 + 3.3 log (n) ; donde n es el numero de datos (se recomienda que sean ms de 10). Para el ejemplo se tiene n = 40 datos, sustituyendo k = 1 + 3.3 log (40) = 1 + 3.3 (1.602) = 1 + 5.28 = 6.28 , la cual se redondea al entero siguiente, en este caso k = 7. Otra alternativa es usando la raiz cuadrada del total de datos n para este ejemplo nos queda asi: k = raiz (n) = raiz (40) = 6.32 que tambien se redondea al entero siguiente quedando k= 7. Paso 3. Calculamos la amplitud de clase (A), que corresponde a la cantidad de datos que van en casa clase, dividiendo el rango R entre el numero de clases k: sustituyendo se redondea a 8.

Paso 4. Construimos los intervalos o clases, como la variable es cuantitativa discreta los intervalos o clases son cerrados, es decir de la forma [Li, Ls]. Para formar las clases comenzaremos con los limites inferiores: En la primer clase tomamos Li1 = Xmin ( el dato mas pequeo) Para las dems clases el limite inferior se obtiene sumando la Xmin con la amplitud, es decir Li n = Li n 1 + A. Para nuestro ejemplo Xmin = 90 y A = 8, entonces las 7 clases quedan:

DIAGRAMAS DE BARRAS Es un tipo de grfico estadstico que se utiliza para variables cualitativas y Discretas. En el eje X se sitan: Las modalidades de la variable cualitativa. Los valores de la variable cualitativa discreta. y sobre ellos se levantan barras cuya altura sea proporcional a sus frecuencias. Si se unen los extremos superiores de las barras con una lnea poligonal se Obtiene el polgono de frecuencias. HISTOGRAMAS Se utiliza con variables continuas, o agrupadas en intervalos, representando en

El eje X los intervalos de clase y levantando rectngulos de base la longitud de Los distintos intervalos y de altura tal que el rea sea proporcional a las Frecuencias representadas. El polgono de frecuencias se obtiene uniendo los puntos medios de las bases Superiores de los rectngulos. DIAGRAMA DE SECTORES Es un grfico empleado fundamentalmente para variables cualitativas. Las modalidades se representan en un crculo dividido en sectores. La amplitud de cada sector, en grados, se obtiene multiplicando la frecuencia Relativa de cada modalidad o valor por 360.

Вам также может понравиться