Академический Документы
Профессиональный Документы
Культура Документы
La informacin que arrojan las medidas de tendencia central no siempre proporcionan conclusiones contundentes frente al conjunto de datos. El conjunto de datos, adems de tener una tendencia de agruparse hacia el centro, en ocasiones suelen estar bastante alejados de esa tendencia central. Medir esa variacin respecto a los promedios es un clculo importante en el tratamiento estadstico de datos, medidas a las que se les denomina de dispersin o de variacin. Entre las medidas de dispersin ms comunes estn:
ango o recorrido !arian"a #esviacin tpica o estndar $oeficiente de variacin #esviacin media %untaje tpico o estandari"ado
Varianza
Es una de las medidas ms usadas en estadstica, ella a su ve" da origen a otra mucho ms significativa: la desviacin tpica o estndar. &e define como la media aritm'tica de los cuadrados de las desviaciones respecto a la media aritm'tica. &e simboli"a s2para la varian"a muestral ( para la varian"a poblacional. %ara datos no agrupados:
La varian"a indica la desviacin de los datos respecto a la media. %ara comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utili"ar sus varian"as de manera que el resultado indique cul de ellas es ms homog'nea o cul es ms heterog'nea.
La desviacin estndar es una medida de variacin de todos los valores con respecto a la media. El valor de la desviacin estndar siempre es positivo ( slo es igual a cero cuando los valores de los datos son iguales. &i el valor de la desviacin estndar es mu( grande, este
El valor de la desviacin estndar puede incrementarse drsticamente cuando se inclu(e uno o ms datos distantes. Las unidades de la desviacin estndar son las mismas de los datos originales *pulgadas, centmetros, etc.+
&e define como la media aritm'tica de los cuadrados de las desviaciones respecto al pomedio.
$uando el coeficiente de variacin es mu( alto se dice que la media aritm'tica no es lo suficientemente representativa en la distribucin. -na de las siguientes medidas ./ es medida de dispersin absoluta:
Su respuesta : $oeficiente de variacin 0s es. %ara efectuar comparaciones entre series de observaciones
distintas, en estadstica se usa el coeficiente de variacin ( as se puede determinar cul serie tiene ma(or o menor variabilidad relativa. Medidas de asimetra
En cualquier distribucin el valor de la mediana se locali"a entre la media ( la moda. En una distribucin simtrica se tiene que:
En las distribuciones asimtricas la media se corre en el sentido del alargamiento o sesgo por efecto de las frecuencias ( de los valores e)tremos de la variable1 la mediana tambi'n se corre pero menos que la media (a que en ella slo influ(en las frecuencias1 en tanto que la moda no es influenciada ni por las frecuencias ni por los valores e)tremos. Los datos sesgados a la derecha *sesgo positivo+ poseen una cola derecha ms larga ( su mediana ( media estn a la derecha de la moda. La distribucin es asimtrica positiva (:
Los datos sesgados a la i"quierda *sesgo negativo+ presentan una cola i"quierda ms larga ( su media ( mediana se encuentran a la i"quierda de la moda. &er asimtrica negativa (:
Figura #istribuciones sesgadas *a+ &esgada a la derecha1 *b+ &esgada a la i"quierda1 *c+ &im'trica
Las asimetras positivas son las ms frecuentes que las sesgadas hacia la i"quierda, porque con frecuencia es ms fcil obtener valores e)cepcionalmente grandes que valores e)cepcionalmente peque2os. Ejemplo de ello es la distribucin de valores en los consumos de servicios p3blicos, las calificaciones en pruebas, los sueldos, etc.
&i Ap = 3 la distribucin es normal o mesocrtica. &i Ap > 3 la distribucin es apuntada o leptocrtica. &i Ap < 3 la distribucin es achatada o platicrtica.
Cuando en una distribucin, la moda es mayor que la mediana y esta mayor que la media, se puede decir que la distribucin es:
Su respuesta :
independiente mientras que la otra *la Y + ser la variable dependiente. &e habla as de una regresin de Y sobre *o en funcin de+ X . La mejor lnea es aquella que hace mnima la suma de los cuadrados de las diferencias entre los puntos dados ( los obtenidos mediante la lnea ajustada o estimada. Es por eso que a este m'todo tambi'n se le conoce como el mtodo de los mnimos cuadrados. La ecuacin de la recta estimada est dada por:
#onde: !ariable dependiente *la que se va a predecir+ a:4ntercepto de la variable Y X: !ariable independiente b: %endiente de la recta En esta ecuacin ha( dos valores desconocidas: a( b, que deben determinarse aplicando el criterio de los mnimos cuadrados, buscando as la mejor recta que se ajuste a los datos. &e tiene entonces:
#onde: b: %endiente de la recta a: 4ntercepto de la variable Y X: !alores de la variable independiente Y: !alores de la variable dependiente n: 5ama2o de la muestra
Correlacin
La correlacin entre dos variables busca determinar el grado de relacin que e)iste entre ellas dos. Ella se calcula con los coeficientes de correlacin.
Los coeficientes de correlacin son n3meros que varan entre 67 ( 87. &u magnitud indica el grado de asociacin entre las variables, si es 9 indica que no e)iste relacin alguna ( los valores e)tremos 67 ( 87 indican una correlacin perfecta positiva o negativa respectivamente. &e dice que e)iste una correlacin lineal positiva entre dos variables, si al aumentar o disminuir los valores de la variable independiente aumentan o disminu(en los de la variable dependiente. En un grfico de dispersin, la nube de puntos tiene forma ascendente ( por tanto la recta que se ajusta tendr una pendiente positiva. En cambio, cuando al aumentar los valores de la variable independiente disminu(en los valores de la variable dependiente, o viceversa, se dice que la correlacin lineal es negativa. En este caso la nube de puntos descender de i"quierda a derecha ( la pendiente de la recta ajustada ser negativa. Figura :rficas de dispersin lineal *a+ positiva1 *b+ negativa
(a (!
Coeficiente de correlacin
%ara determinar el coeficiente de correlacin, es necesario conocer primero el error estndar del estimado de la recta ajustada. &e trata pues de medir el grado de confiabilidad de la ecuacin de la recta estimada. El error estndar indicar la dispersin o la variabilidad de los valores observados alrededor de la lnea de regresin ( se calcula a partir de la siguiente ecuacin:
#onde: Se: Error estndar del estimado Y: !alores de la variable dependiente X: !alores de la variable independiente n: 5ama2o de la muestra -na ve" obtenido el error estndar del estimado, es necesario medir qu' porcentaje de la informacin es recogida o e)plicada por el modelo de regresin escogido. &e trata pues, de determinar las variaciones de la variable dependiente mediante el coeficiente de determinacin (R 2 .
;7
<V:SHAPETYPE id="_x0000_t75" coordsize="21600,21600" o:s t="75" o: re!erre"#ti$e="t" #t%="&'('5"'('11')'11')'5xe" !i""ed="!" stro*ed="!"+ o:tit"e="",+<-../i! -$&"0..+ <-../e1di!0..+
Se2: !arian"a del error estimado !2": !arian"a de la variable dependiente Y . $uando el R2es cercano a 7, se dice que el modelo de regresin lineal ajustado tiene un alto grado de confiabilidad, si al contrario este se acerca a 9 su grado de confiabilidad es mu( bajo ( se recomienda no utili"ar el modelo de regresin estimado. En la prctica es ms frecuente usar r, denominado el coeficiente de correlacin lineal. &iendo .
El coeficiente de correlacin lineal r, es tambi'n conocido como coeficiente de #earson. -na distribucin bidimensional o bivariante puede representarse grficamente en un plano cartesiano, ubicando en el eje hori"ontal o abscisa los valores de la primera variable denominada X ( en el eje vertical u ordenada, los valores de la segunda variable, Y . #e manera pues que se grafican tantas parejas ordenadas como observaciones ha(an de las variables.
Su respuesta : La relacin entre una variable dependiente cuantitativa ( una variable independiente cuantitativa. $orrecto,,,
El coeficiente de determinacin *R2+:
Su respuesta : Es el porcentaje de la informacin que es recogida o e)plicada por el modelo de regresin escogido. $orrecto,,
5eniendo en cuenta el intervalo en el que se mueve la correlacin entre dos variables, =cul de los siguientes valores para ese coeficiente %& puede ser posible;
Su respuesta : r > <.9 0si es,,, El intervalo en el que se mueve la correlacin entre dos variables es entre 87.9 ( 7.9 $ontinuar
0l estimar la relacin entre dos variables se encontr que el coeficiente de determinacin es igual a 9.?@, esto se interpreta como:
%'M"R&( )%D)C"
Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que sirven para indicar las variaciones que sufre una serie de valores respecto a una de ellas, tomada como punto de referencia y a la cual se le denomina base. Los nmeros ndices no son una medida cuantificable, se trata de un indicador de variacin en la variable observada. Son indicadores muy utilizados en el sector econmico por ejemplo, la variacin en los precios de un producto respecto al a o anterior, la cantidad de unidades vendidas de un producto respecto al mes anterior, el costo de produccin por unidad de este trimestre comparado con el inmediatamente anterior, etc. Si se trata de una serie corta, el perodo base seleccionado ser! el primer valor de la serie" pero si la serie es extensa se debe seleccionar cono perodo base aquel que #aya sido m!s estable, es decir, que no presente cambios muy bruscos debido a factores internos y$o externos. Sin embar%o, la seleccin de la serie base depender! de los an!lisis que el investi%ador requiera #acer para sus variables. Los nmeros ndice se pueden construir para una sola observacin o para un conjunto de ellas" en el primer caso, se #ablar! de ndices simples y para un conjunto de datos dados, se #ablar! de ndices compuestos. &stos ltimos se clasifican a su vez en agregativos y de promedios. Los promedios se clasifican en aritmticos, %eomtricos, medianos, etc., pero en la pr!ctica los m!s utilizados son los aritmticos.
)%D)C"( C&MP'"(*&(
Se construyen a partir de un %rupo de series de tiempo, concernientes a varios artculos. Se trata de examinar el valor no de un artculo, sino de un %rupo de ellos respecto a otro considerado de m!s importancia. Los ndices compuestos determinan una condicin particular, por ejemplo el costo de vida relativo a transporte, vivienda, alimentacin, etc. Se #abla entonces de calcular un ndice agregado ponderado. Son muc#as las frmulas para calcular ndices ponderados, los m!s conocidos son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth, Walsh, Drobisch y Sidgwick. 'eneralmente en ellos las ponderaciones son las cantidades o precios. (uando se van a calcular los ndices de precios en un %rupo de artculos, las ponderaciones son las cantidades, y en el c!lculo de los ndices de cantidad las ponderaciones son los precios.
-na de las siguientes respuestas ./ interviene en la construccin de un n3mero ndice simple de precios para un solo producto o variable:
Su respuesta :