Вы находитесь на странице: 1из 12

Medidas de dispersin

La informacin que arrojan las medidas de tendencia central no siempre proporcionan conclusiones contundentes frente al conjunto de datos. El conjunto de datos, adems de tener una tendencia de agruparse hacia el centro, en ocasiones suelen estar bastante alejados de esa tendencia central. Medir esa variacin respecto a los promedios es un clculo importante en el tratamiento estadstico de datos, medidas a las que se les denomina de dispersin o de variacin. Entre las medidas de dispersin ms comunes estn:

ango o recorrido !arian"a #esviacin tpica o estndar $oeficiente de variacin #esviacin media %untaje tpico o estandari"ado

Varianza
Es una de las medidas ms usadas en estadstica, ella a su ve" da origen a otra mucho ms significativa: la desviacin tpica o estndar. &e define como la media aritm'tica de los cuadrados de las desviaciones respecto a la media aritm'tica. &e simboli"a s2para la varian"a muestral ( para la varian"a poblacional. %ara datos no agrupados:

%ara datos agrupados:

La varian"a indica la desviacin de los datos respecto a la media. %ara comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utili"ar sus varian"as de manera que el resultado indique cul de ellas es ms homog'nea o cul es ms heterog'nea.

Desviacin tpica o estndar


Esta medida se obtiene e)tra(endo la ra" cuadrada de la varian"a, tomando siempre el valor positivo. &e simboli"a por s en la muestra . Esta es la medida de dispersin ms conocida ( ms utili"ada en el anlisis de datos estadsticos. %ara datos no agrupados:

%ara datos agrupados:

Propiedades de la desviacin estndar


Es importante tener en cuenta las siguientes propiedades de la desviacin estndar:

La desviacin estndar es una medida de variacin de todos los valores con respecto a la media. El valor de la desviacin estndar siempre es positivo ( slo es igual a cero cuando los valores de los datos son iguales. &i el valor de la desviacin estndar es mu( grande, este

indica ma(or variacin en el grupo de datos.

El valor de la desviacin estndar puede incrementarse drsticamente cuando se inclu(e uno o ms datos distantes. Las unidades de la desviacin estndar son las mismas de los datos originales *pulgadas, centmetros, etc.+

&e define como la media aritm'tica de los cuadrados de las desviaciones respecto al pomedio.

Su respuesta : !arian"a Mu( bien,, $ontinuar Coeficiente de variacin


Las medidas de dispersin como rango, varian"a ( desviacin estndar medidas absolutas ( se e)presan en las mismas unidades con las que se mide la variable. $uando se comparan dos o ms conjuntos de datos con unidades de medida de observacin diferentes, no es posible compararlas con estas medidas absolutas. %ara efectuar comparaciones entre series de observaciones distintas, en estadstica se usa el coeficiente de variacin ( as se puede determinar cul serie tiene ma(or o menor variabilidad relativa.

$uando el coeficiente de variacin es mu( alto se dice que la media aritm'tica no es lo suficientemente representativa en la distribucin. -na de las siguientes medidas ./ es medida de dispersin absoluta:

Su respuesta : $oeficiente de variacin 0s es. %ara efectuar comparaciones entre series de observaciones

distintas, en estadstica se usa el coeficiente de variacin ( as se puede determinar cul serie tiene ma(or o menor variabilidad relativa. Medidas de asimetra
En cualquier distribucin el valor de la mediana se locali"a entre la media ( la moda. En una distribucin simtrica se tiene que:

En las distribuciones asimtricas la media se corre en el sentido del alargamiento o sesgo por efecto de las frecuencias ( de los valores e)tremos de la variable1 la mediana tambi'n se corre pero menos que la media (a que en ella slo influ(en las frecuencias1 en tanto que la moda no es influenciada ni por las frecuencias ni por los valores e)tremos. Los datos sesgados a la derecha *sesgo positivo+ poseen una cola derecha ms larga ( su mediana ( media estn a la derecha de la moda. La distribucin es asimtrica positiva (:

Los datos sesgados a la i"quierda *sesgo negativo+ presentan una cola i"quierda ms larga ( su media ( mediana se encuentran a la i"quierda de la moda. &er asimtrica negativa (:

Figura #istribuciones sesgadas *a+ &esgada a la derecha1 *b+ &esgada a la i"quierda1 *c+ &im'trica

Las asimetras positivas son las ms frecuentes que las sesgadas hacia la i"quierda, porque con frecuencia es ms fcil obtener valores e)cepcionalmente grandes que valores e)cepcionalmente peque2os. Ejemplo de ello es la distribucin de valores en los consumos de servicios p3blicos, las calificaciones en pruebas, los sueldos, etc.

Medidas de apuntamiento o curtosis


Las curvas de distribucin, comparadas con la curva de distribucin normal, pueden presentar diferentes grados de apuntamiento o altura de la cima de la curva. Esta agude"a en la cima se observa en la moda. &i la curva es ms plana que la normal se dice que la curva es platicrtica1 si es ms aguda que la normal, recibe el nombre de apuntada o leptocrtica. &i la distribucin es normal, la curva se conoce tambi'n como mesocrtica. La curtosis es la medida de la altura de la curva ( esta dada por:

&i Ap = 3 la distribucin es normal o mesocrtica. &i Ap > 3 la distribucin es apuntada o leptocrtica. &i Ap < 3 la distribucin es achatada o platicrtica.
Cuando en una distribucin, la moda es mayor que la mediana y esta mayor que la media, se puede decir que la distribucin es:

Su respuesta :

0simetrica .egativa correcto,,, Regresin y correlacin


En muchos casos se requiere conocer ms que el comportamiento de una sola variable, la relacin entre dos o ms variables. Muchos de estos comportamientos tienen una tendencia lineal, aunque ha( muchos otros que lo hacen de forma curva, en este curso slo se trabajar sobre variables con correlacin lineal. -na distribucin bidimensional o bivariante puede representarse grficamente en un plano cartesiano, ubicando en el eje hori"ontal o abscisa los valores de la primera variable denominada X ( en el eje vertical u ordenada, los valores de la segunda variable, Y. #e manera pues que se grafican tantas parejas ordenadas como observaciones ha(an de las variables. 0 este conjunto de puntos o nube de puntos se le denomina diagrama de dispersin, dado que los puntos se ubican de forma dispersa en el plano cartesiano. En muchos casos el slo diagrama de dispersin indica una tendencia de agrupacin de los puntos, que puede ser lineal *hacia arriba o hacia abajo+, e)ponencial, curvilnea o poligonal. %arte del anlisis estadstico que hace el investigador es determinar cul es la mejor lnea o curva que representa a ese conjunto de datos. El mejor ajuste se hace cuando se elabora bien la grfica, se conoce la distribucin ( se va adquiriendo e)periencia en su clculo ( determinacin.

Regresin lineal simple


La regresin lineal simple e)amina la relacin entre dos variables restringiendo una de ellas respecto a la otra, con el objeto de estudiar las variaciones de la primera cuando la otra permanece constante. La regresin es un m'todo que se emplea para pronosticar o predecir el valor de una variable en funcin de los valores dados de la otra *o de las otras, cuando se trabaja ms de dos variables+. &e trata pues de una dependencia funcional entre las variables. $uando se trata de dos variables, una *la X + ser la variable

independiente mientras que la otra *la Y + ser la variable dependiente. &e habla as de una regresin de Y sobre *o en funcin de+ X . La mejor lnea es aquella que hace mnima la suma de los cuadrados de las diferencias entre los puntos dados ( los obtenidos mediante la lnea ajustada o estimada. Es por eso que a este m'todo tambi'n se le conoce como el mtodo de los mnimos cuadrados. La ecuacin de la recta estimada est dada por:

#onde: !ariable dependiente *la que se va a predecir+ a:4ntercepto de la variable Y X: !ariable independiente b: %endiente de la recta En esta ecuacin ha( dos valores desconocidas: a( b, que deben determinarse aplicando el criterio de los mnimos cuadrados, buscando as la mejor recta que se ajuste a los datos. &e tiene entonces:

#onde: b: %endiente de la recta a: 4ntercepto de la variable Y X: !alores de la variable independiente Y: !alores de la variable dependiente n: 5ama2o de la muestra

Correlacin
La correlacin entre dos variables busca determinar el grado de relacin que e)iste entre ellas dos. Ella se calcula con los coeficientes de correlacin.

Los coeficientes de correlacin son n3meros que varan entre 67 ( 87. &u magnitud indica el grado de asociacin entre las variables, si es 9 indica que no e)iste relacin alguna ( los valores e)tremos 67 ( 87 indican una correlacin perfecta positiva o negativa respectivamente. &e dice que e)iste una correlacin lineal positiva entre dos variables, si al aumentar o disminuir los valores de la variable independiente aumentan o disminu(en los de la variable dependiente. En un grfico de dispersin, la nube de puntos tiene forma ascendente ( por tanto la recta que se ajusta tendr una pendiente positiva. En cambio, cuando al aumentar los valores de la variable independiente disminu(en los valores de la variable dependiente, o viceversa, se dice que la correlacin lineal es negativa. En este caso la nube de puntos descender de i"quierda a derecha ( la pendiente de la recta ajustada ser negativa. Figura :rficas de dispersin lineal *a+ positiva1 *b+ negativa

(a (!

Coeficiente de correlacin
%ara determinar el coeficiente de correlacin, es necesario conocer primero el error estndar del estimado de la recta ajustada. &e trata pues de medir el grado de confiabilidad de la ecuacin de la recta estimada. El error estndar indicar la dispersin o la variabilidad de los valores observados alrededor de la lnea de regresin ( se calcula a partir de la siguiente ecuacin:

#onde: Se: Error estndar del estimado Y: !alores de la variable dependiente X: !alores de la variable independiente n: 5ama2o de la muestra -na ve" obtenido el error estndar del estimado, es necesario medir qu' porcentaje de la informacin es recogida o e)plicada por el modelo de regresin escogido. &e trata pues, de determinar las variaciones de la variable dependiente mediante el coeficiente de determinacin (R 2 .

#onde: R2: $oeficiente de determinacin, 9 ;


<

;7

<V:SHAPETYPE id="_x0000_t75" coordsize="21600,21600" o:s t="75" o: re!erre"#ti$e="t" #t%="&'('5"'('11')'11')'5xe" !i""ed="!" stro*ed="!"+ o:tit"e="",+<-../i! -$&"0..+ <-../e1di!0..+

Se2: !arian"a del error estimado !2": !arian"a de la variable dependiente Y . $uando el R2es cercano a 7, se dice que el modelo de regresin lineal ajustado tiene un alto grado de confiabilidad, si al contrario este se acerca a 9 su grado de confiabilidad es mu( bajo ( se recomienda no utili"ar el modelo de regresin estimado. En la prctica es ms frecuente usar r, denominado el coeficiente de correlacin lineal. &iendo .

El coeficiente de correlacin lineal r, es tambi'n conocido como coeficiente de #earson. -na distribucin bidimensional o bivariante puede representarse grficamente en un plano cartesiano, ubicando en el eje hori"ontal o abscisa los valores de la primera variable denominada X ( en el eje vertical u ordenada, los valores de la segunda variable, Y . #e manera pues que se grafican tantas parejas ordenadas como observaciones ha(an de las variables.

0 este conjunto de puntos o nube de puntos se le denomina:

Su respuesta : #iagrama de dispersin Mu( bien,,


"l o!#eto del anlisis de regresin lineal simple es investigar$

Su respuesta : La relacin entre una variable dependiente cuantitativa ( una variable independiente cuantitativa. $orrecto,,,
El coeficiente de determinacin *R2+:

Su respuesta : Es el porcentaje de la informacin que es recogida o e)plicada por el modelo de regresin escogido. $orrecto,,
5eniendo en cuenta el intervalo en el que se mueve la correlacin entre dos variables, =cul de los siguientes valores para ese coeficiente %& puede ser posible;

Su respuesta : r > <.9 0si es,,, El intervalo en el que se mueve la correlacin entre dos variables es entre 87.9 ( 7.9 $ontinuar
0l estimar la relacin entre dos variables se encontr que el coeficiente de determinacin es igual a 9.?@, esto se interpreta como:

Su respuesta : El modelo e)plica en un ?@A la variacin de los datos. $orrecto

%'M"R&( )%D)C"
Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que sirven para indicar las variaciones que sufre una serie de valores respecto a una de ellas, tomada como punto de referencia y a la cual se le denomina base. Los nmeros ndices no son una medida cuantificable, se trata de un indicador de variacin en la variable observada. Son indicadores muy utilizados en el sector econmico por ejemplo, la variacin en los precios de un producto respecto al a o anterior, la cantidad de unidades vendidas de un producto respecto al mes anterior, el costo de produccin por unidad de este trimestre comparado con el inmediatamente anterior, etc. Si se trata de una serie corta, el perodo base seleccionado ser! el primer valor de la serie" pero si la serie es extensa se debe seleccionar cono perodo base aquel que #aya sido m!s estable, es decir, que no presente cambios muy bruscos debido a factores internos y$o externos. Sin embar%o, la seleccin de la serie base depender! de los an!lisis que el investi%ador requiera #acer para sus variables. Los nmeros ndice se pueden construir para una sola observacin o para un conjunto de ellas" en el primer caso, se #ablar! de ndices simples y para un conjunto de datos dados, se #ablar! de ndices compuestos. &stos ltimos se clasifican a su vez en agregativos y de promedios. Los promedios se clasifican en aritmticos, %eomtricos, medianos, etc., pero en la pr!ctica los m!s utilizados son los aritmticos.

)%D)C"( C&MP'"(*&(
Se construyen a partir de un %rupo de series de tiempo, concernientes a varios artculos. Se trata de examinar el valor no de un artculo, sino de un %rupo de ellos respecto a otro considerado de m!s importancia. Los ndices compuestos determinan una condicin particular, por ejemplo el costo de vida relativo a transporte, vivienda, alimentacin, etc. Se #abla entonces de calcular un ndice agregado ponderado. Son muc#as las frmulas para calcular ndices ponderados, los m!s conocidos son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth, Walsh, Drobisch y Sidgwick. 'eneralmente en ellos las ponderaciones son las cantidades o precios. (uando se van a calcular los ndices de precios en un %rupo de artculos, las ponderaciones son las cantidades, y en el c!lculo de los ndices de cantidad las ponderaciones son los precios.
-na de las siguientes respuestas ./ interviene en la construccin de un n3mero ndice simple de precios para un solo producto o variable:

Su respuesta :

%orcentaje de desvalori"acin. $orrecto,,,


El ndice de precios que se calcula como la relacin entre los precios actuales de una canasta de bienes o servicios del perodo, ( los precios de esos mismos artculos o servicios en el periodo base, manteni'ndose constante como ponderacin las cantidades del perodo base se le denomina:

Su respuesta : 4ndice de Laspe(res. $orrecto,,,

Вам также может понравиться