Вы находитесь на странице: 1из 32

Variables estadsticas bidimensionales

Se trata de variables que surgen cuando se estudian dos caractersticas asociadas a la observacin de un fenmeno.

Variables estadsticas bidimensionales

Ejemplo 1.- Estudiamos la talla, medida en cm. y el peso, medido en kg. de un grupo de 10 personas, podemos obtener los siguientes valores

Talla 160 165 168 170 171 175 175 180 180 182 (cms)
Peso (kgs)

55

58

58

61

67

62

66

74

79

83

Talla (cms) 160 165 168 170 171 175 175 180 180 182 Peso (kgs)

55

58

58

61

67

62

66

74

79

83

Podemos llamar X a la talla e Y al peso con lo que se obtendra la variable bidimensional (X, Y) que toma 10 valores, que son las 10 parejas de valores de la tabla anterior: (160,55), (165,58), etc.

Variables estadsticas bidimensionales

En algunos casos el nmero de "parejas" de valores (x,y) es grande y adems muchos de ellos aparecen repetidos; en este caso se utiliza una "Tabla de doble entrada" como la que se muestra a continuacin en el ejemplo 2

En la primera fila se colocan los valores de una de las caractersticas o variable que componen la variable

bidimensional y en la primera columna los de la otra.

Variables estadsticas bidimensionales

Ejemplo 2.- Se representa por X el nmero de hijos de 100 familias y por Y el nmero de hijas
# de hijas (Y)

# de hijos (x)

0 1 2 3 4

-------------------------------------------------------------

0 1 2 ---- ---- ---10 15 15 10 12 7 8 4 3 3 2 1 2 1 1

3 --3 2 1 0 0

Variables estadsticas bidimensionales


# de hijas (Y)

# de hijos (x)

0 1 2 3 4

-------------------------------------------------------------

0 ---10 10 8 3 2

1 ---15 12 4 2 1

2 ---15 7 3 1 1

3 --3 2 1 0 0

La lectura de esta tabla es sencilla. Por ejemplo: habra 7 familias que tendran 1 hijo y 2 hijas y ninguna familia tendra 3 hijos y 3 hijas.

Representacin grfica
Diagramas de dispersin o nubes de puntos

Variables Estadisticas Bidimencionales


Covarianza Correlacion

Diagramas de dispersin o nubes de puntos

La representacin grfica de este tipo de variables es en realidad semejante a la respresentacin de puntos en el plano, usando unos ejes de coordenadas. Cada pareja de valores da lugar a un punto en el plano y el conjunto de puntos que se obtiene se denomina "diagrama de dispersin o nube de puntos".

Diagramas de dispersin o nubes de puntos

En el ejemplo 1 anterior en el que se estudiaba la talla y el peso de 10 personas se obtendra el siguiente diagrama de dispersin: (En el eje X se representa la talla en cm. y en el eje Y el peso en kg.)

Se puede ver en el primera figura que corresponda al diagrama de talla - peso que la serie de puntos presenta una tendencia "ascendente" . Se dice en este caso que existen entre las dos variables una "dependencia directa" .
En caso en que la tendencia sea "descendente" se dira que estaramos ante una " dependencia inversa "

Diagramas de dispersin o nubes de puntos

Naturalmente en caso en que no se pueda observar una tendencia clara estaramos ante una dependencia muy dbil que no se puede observar mediante la nube de puntos

Diagramas de dispersin o nubes de puntos

Covarianza y su interpretacin

Covarianza

Sean (xi, yi ) pares de observaciones de dos caracteristicas X y Y, y sean sus respectivas medias. La covarianza entre entre las dos variables se define por :

Covarianza

Donde xi e yi representan los pares de valores de la variable y el producto corresponde al producto de las medias aritmticas de las variables x e y respectivamente.

Pasos para calcular la covarianza de una serie de eventos

Paso 1: Se calcula xiyi , esto es la sumatoria de los productos de las variablares x y y; o sea: (x1 * y1) + (x2 * y2) + ... +(xn * yn )

Paso 2: se define n, que el numero de eventos o el numero de pares de


cariables Paso 3: Se calcula , que es el producto de las medias de ambas variables

Paso 4: Obtenidos todos los datos se sustituyen en la formula y se obtiene el resultado

Calculemos la covarianza para el ejemplo primero correspondiente a la variable talla - peso


Talla (cms) 160 165 168 170 171 175 175 180 180 182 Peso (kgs)

55

58

58

61

67

62

66

74

79

83

Paso 1: La suma de todos los productos de los valores de x (talla) por los de y (peso) sera:

160 55 + 165 58 + 168 58 + 170 61 + 171 67 + 175 62 + 175 66 + 180 74 + 180 79 + 182 83 = 114987 Paso 2:

Definimos n como el numero de eventos en este caso es 10

Paso 3: A este valor debemos restarle el producto de las medias de ambas variables que naturalmente sabes calcular: Media de x (talla): 172.6 = 172.6 * 66.3 = 11443.38

Media de y (peso): 66.3


De acuerdo ala formula tenemos que:

Sxy = (114987 / 10 ) 11443.38 Sxy = 55.32 Hemos obtenido un valor positivo para la covarianza que corresponde a una dependencia directa como ya habamos intuido con la nube de puntos

Regresion y Correlacion

Recta de regresion

Relacion entre dos variables Variable independiente x Variable dependiente y funcin lineal del tipo y = ax + b, su grfica correspondera a una recta recta de regresin.

se deduce que la recta de regresin debe pasar por el punto correspondiente a las medias de ambas variables y que debe tener por pendiente la covarianza dividida por la varianza de la variable x. Con ello la expresin de la recta de regresin ser:

Esta es la llamada "Recta de regresin de y sobre x". Si se deseara estudiar la dependencia de x respecto a y slo habra que cambiar en la expresin de la recta x por y, obtenindose la recta regresin de x sobre y

En la imagen siguiente se muestra la recta de regresin de y (peso) sobre x (talla) del ejemplo 1 de este tema. En este caso se supone que represente cmo depende el peso de una persona de su talla

Si recordamos que entre la talla y el peso decamos que exista una dependencia directa, la recta de regresin lo confirma ya que su pendiente es positiva: a medida que aumenta la talla aumenta el peso. Por tanto:

Dependencia directa - Pendiente de la recta positiva - Funcin creciente

Utilidad tiene la recta de regresin

Mediante la recta de regresin podramos obtener de manera aproximada el valor de la variable dependiente (y) de la que conociramos la variable independiente (x), en una poblacin semejante a aquella de la que se ha obtenido la muestra De manera ms precisa, si conocemos la expresin de la recta de regresin, se pueden calcular valores para la variable y, conocidos los de x, como si se tratara de una funcin

Ejemplo : Si observamos la grfica, podramos suponer por ejemplo que una persona de 185 cm pesara algo ms de 80 kg De acuerdo ala formula

La recta de regresin de la variable y (talla) sobre x (peso) ser la recta:

-que pasa por el punto (172,6 ; 66,3) (medias repectivas de (x,y))


-tiene de pendiente: 55.32 / 50.71 = 1.0909 Recta: y 66.3 = 1.0909 ( x 172.6) que operando y simplificando queda: y = 1.0909x 121.9

El valor del peso que suponamos aproximado para una talla de 185 cm sera: Peso= 1.0909 185 121.9 = 79.9

Este valor obtenido es algo menor al esperado. Eso quiere decir que las predicciones hechas con la recta de regresin no son exactas. Mas adelante precisaremos la "fiabilidad" de las mismas.

Por tanto la recta de regresin se puede utilizar para realizar predicciones para la variable y a partir de valores conocidos de la variable x.

Coeficiente de correlacion

Una vez observado que en una variable bidimensional existe una cierta dependencia entre las dos caractersticas o variables que la forman (nube de puntos y covarianza), podemos precisar el grado de dicha dependencia. - Si los puntos de la nube estuvieran todos sobre la recta de regresin se dira que existe una dependencia funcional. De su estudio se encargan las funciones. - Si los puntos no estn todos sobre la recta de regresin se dice que entre las variables hay una cierta correlacin lineal. Este es el caso que nos ocupa. Para cuantificar el grado de dicha correlacin se usa el

Coeficiente de correlacin de Pearson. Si le llamamos r, su valor es:

Puede observarse que el signo del coeficiente de correlacin es el mismo que el de la covarianza y puede deducirse que el valor del mismo esta comprendico entre -1 y 1. Se pueden deducir las siguientes conclusiones relativas al coeficiente de correlacin (r): - Su signo es el mismo de la covarianza, luego si r es positivo la dependencia es directa y si es negativo inversa. - Si r se acerca a -1 o a +1, la dependencia es fuerte y por tanto las predicciones que se realicen a partir de la recta de regresin sern bastante fiables.

- Si r se acerca a 0 la dependencia es dbil y por tanto las predicciones que se realicen a partir de la recta de regresin sern poco fiables

Ejemplo: Calcularemos la correlacion para el ejemplo de las tallas y los pesos

Sxy = 55.32
Sx = 50.71 Sy = 752.81 r = 55.32 / (50.71 * 752.81)

r =0.0014

r se acerca a 0 la dependencia es dbil y por tanto las predicciones que se realicen a partir de la recta de regresin sern poco fiables

Ejercicios
Covarianza Correlacion

Ejercicio 1:En el ejemplo 2 (hijos - hijas) se puede comprobar que tambin la covarianza es positiva. (Se deja como ejercicio la comprobacin). Tngase en cuenta que en este caso la variable bidimensional toma "100 valores"
# de hijas (Y)

# de hijos (x)

0 1 2 3 4

-------------------------------------------------------------

0 ---10 10 8 3 2

1 ---15 12 4 2 1

2 ---15 7 3 1 1

3 --3 2 1 0 0

Ejercicio 2:De la siguiente tabla de las perdidas consumida (x) Esperadas. En rendimiento de soya por riego 0.00 Inoportuno Obtenga: 0.10 a) La covarianza b) Tipo de dependencia 0.20 c) correlacion

Porcion de humedad

Perdida de pesos (y)

0.30 0.40 0.50 0.58

4593.00 3141.60 1965.20 1064.20 438.60 85.00 0.00

Partimos de la escena siguiente, en la que se pueden ver inicialmente la nube de puntos de la variables bidimensional que toma los siguientes 6 pares de valores:
X y 2 8 4 7 6 7 8 6 10 12 6 4

Ejercicio 3 - A la vista de la nube de puntos qu tipo de dependencia se puede suponer? -Calcular la covarianza y confirmar la afirmacin anterior - Calcular el valor de y si se sabe que x = 15 - calcular la correlacion

Вам также может понравиться