Вы находитесь на странице: 1из 12

Distribuciones bidimensionales

Índice general

CAPITULO 1 ............................................................................................................................................ 2

DISTRIBUCIONES BIDIMENSIONALES ............................................................................................ 2

TABULACIÓN DE VARIABLES ESTADÍSTICAS BIDIMENSIONALES................................................................. 2

TABLAS DE CORRELACIÓN ....................................................................................................................... 2

 DISTRIBUCIÓN CONJUNTA ................................................................................................................ 3

 DISTRIBUCIÓN MARGINALES ............................................................................................................ 4

 DISTRIBUCIONES CONDICIONADAS ................................................................................................... 5

TABLAS DE CONTINGENCIA ...................................................................................................................... 7

CONCLUSION ......................................................................................................................................... 9

BIBLIOGRAFÍA .................................................................................................................................... 10

ANEXOS ................................................................................................................................................. 11
CAPITULO 1

DISTRIBUCIONES BIDIMENSIONALES

Tabulación de variables estadísticas bidimensionales

Vamos a considerar 2 tipos de tabulaciones:

1. Para variables cuantitativas, que reciben el nombre de tabla de correlación.

2. Para variables cualitativas, que reciben el nombre de tabla de contingencia.

Tablas de correlación

Sea una población estudiada simultáneamente según dos caracteres X e Y; que

representaremos genéricamente como (xi; yj ; nij), donde xi; yj, son dos valores cualesquiera

y nij es la frecuencia absoluta conjunta del valor i-ésimo de X con el j-ésimo de Y.

Una forma de disponer estos resultados es la conocida como tabla de doble entrada o

tabla de correlación, la cual podemos representar como sigue: Tipos de distribuciones Cuando

se estudian conjuntamente dos variables, surgen tres tipo de distribuciones: Distribuciones

conjuntas, distribuciones marginales y distribuciones condicionadas.


 Distribución conjunta

o La frecuencia absoluta conjunta, viene determinada por el número de veces que

aparece el par ordenado ( xi , yj ), y se representa por " nij ".

o La frecuencia relativa conjunta, del par ( xi , yj ) es el cociente entre la

frecuencia absoluta conjunta y el número total de observaciones. Se trata de " fij

".

Se cumplen las siguientes relaciones entre las frecuencias de distribución

conjunta:

3. La suma de las frecuencias absolutas conjuntas, extendida a todos los pares es

igual.

4. La suma de todas las frecuencias relativas conjuntas extendida a todos los pares es

igual a la unidad.

Frecuencia absoluta
Frecuencia relativa

 Distribución marginales

Cuando trabajamos con más de una variable y queremos calcular las distribuciones de

frecuencias de cada una de manera independiente, nos encontramos con las distribuciones

marginales.

o Frecuencia absoluta marginal: el valor ni. Representa el número de veces que

aparece el valor xi de X, sin tener en cuenta cual es el valor de la variable Y. A ni. se le

denomina frecuencia absoluta marginal del valor xi de X, de forma que:

o Frecuencia relativa marginal. La frecuencia relativa marginal de xi de X, viene

dada por:

Se cumplen las siguientes relaciones entre las frecuencias de distribución marginales:


3. La suma de frecuencias absolutas marginales de la variable X, es igual al número

de observaciones que componen la muestra

4. La suma de las frecuencias relativas marginales de la variable X, es igual a 1

5. Las dos propiedades anteriores se cumplen también para la variable Y

 Distribuciones condicionadas

Consideremos a los n.j individuos de la población que representan la modalidad yj de

la variable Y, y obsérvese la columna j-esima de la tabla. Sus n.j elementos constituyen una

población, que es un subconjunto de la población total.

El razonamiento es análogo cuando condicionamos la variable Y a un determinado

valor de X, es decir Y /xi


¿Cuál es la distribución de la retribución, pero únicamente de los empleados con una

antigüedad de 5 años?, es decir ¿ cuál es la distribución condicionada de la variable X

condicionada a que Y sea igual a 5? Covarianza La covarianza mide la forma en que varía

conjuntamente dos variables X e Y En el estudio conjunto de dos variables, lo que nos

interesa principalmente es saber si existe algún tipo de relación entre ellas. Veremos ahora

una medida descriptiva que sirve para medir o cuantificar esta relación:

o Si Sxy >0 hay dependencia directa (positiva), es decir las variaciones de las

variables tienen el mismo sentido Si Sxy = 0 las variables están incorreladas, es

decir no hay relación lineal, pero podría existir otro tipo de relación.

o Si Sxy < 0 hay dependencia inversa o negativa, es decir las variaciones de las

variables tienen sentido opuesto.

Gráficamente, indicaría la Covarianza, que los datos, se ajustan a una recta, en,los

siguientes casos:
o La covarianza no es un parámetro acotado, y puede tomar cualquier valor real, por

lo que su magnitud no es importante; lo significativo es el signo que adopte la

misma.

Al tener la covarianza entre ambas variables signo positivo, podemos deducir que

existe una relación directa o positiva entre ambas variables, es decir, cuando aumenta la "

edad " del insecto también aumenta su tamaño

Tablas de contingencia

Cuando tenemos la información de 2 variables de tipo cualitativo o de una variable

cualitativa y otra cuantitativa, se dispone de una tabla de contingencia. Nos limitaremos al

caso de 2 variables. Es una tabla de doble entrada en la que en las filas se ubican las

modalidades de una de las variables (atributos ) y en las columnas las del otro; en las celdas

resultantes del cruce de las filas y las columnas se incluye el número de elementos de la

distribución que presentan ambas modalidades

a) Las tablas estadísticas bidimensionales simples adoptan la siguiente forma:

Vari Vari Frecuencia


able X able Y absoluta
x1 y1 f1
x2 y2 f2
M M M
xi yi fi
M M M
xn ym fn

 fN i

i
b) Las tablas estadísticas bidimensionales de doble entrada adoptan la siguiente forma:

X F. absoluta de
x1 x2 ··· xi ··· xn
Y la variable Y
y1 f1 1 f2 1 ··· f i1 ··· fn 1 f 1
y2 f1 2 f2 2 ··· f i2 ··· fn 2 f 2
M M M M M M M M
yj f1 j f2 j ··· fij ··· fn j f j
M M M M M M M M
ym f1 m f2 m ··· fi m ··· fn m f m
F. absoluta de
f1  f2  ··· fi  ··· fn  N
la variable X

Denotamos por f ij a la frecuencia absoluta correspondiente al par (xi, yj) y por N al

número total de individuos.

Si se tiene información de N elementos acerca de las variables A y B de tal forma que

presentan " r " y " s " modalidades respectivamente, la tabla de contingencia sería de la forma:

tabla de contingencia r x s nij= número de elementos de la distribución que presentan la

modalidad i –ésima del atributo A y la modalidad j – esima del atributo B

ni.= ni1+ ni2+ … + nis --.. número de elementos de la distribución con la i – ésima modalidad

del atributo A

Como a las variables cualitativas no se les puede someter a operaciones de sumas, restas y

divisiones, al venir expresadas en escalas nominales u ordinales no tiene sentido hablar de

medias marginales, condicionadas, varianzas, etc; si podríamos calcular la moda en el caso de

que se empleara una escala nominal y de la mediana si utilizamos escalas ordinales.


CONCLUSION

 Uno de los objetivos del análisis de distribuciones bidimensionales es estudiar si existe

asociación o relación entre las variables X e Y.

 A partir de una distribución bidimensional se obtendrán distribuciones unidimensionales

de dos tipos: marginales y condicionadas.

 Dos distribuciones marginales:

–Marginal de X

–Marginal de Y

 Condicionadas:

–q distribuciones condicionadas de los valores de X a los q valores de Y

–p distribuciones condicionadas de los valores de Y a los p valores de X

 Las variables X e Y se dicen que son independientes si los valores de una de ellas no

afecta a la distribución de la otra. Esto equivale a decir que todas las distribuciones

condicionadas sean iguales.

 De modo equivalente se dice que las variables X e Y son independientes si se cumple que

la frecuencia relativa conjunta es igual al producto de las frecuencias relativas

marginales.

 Si las variables no son independientes se dice que están relacionadas o asociadas. Las

distribuciones condicionadas NO son iguales.

 Cuando las variables X o Y son cualitativas se denomina tabla de contingencia.

 Un análisis típico de una tabla de contingencia es el estudio de la posible asociación o

relación entre las variables X e Y.


BIBLIOGRAFÍA

http://www.iespugaramon.com/ies-puga-

ramon/resources/bidimensional_correlacion_regresion1461859284124.pdf

http://www.ugr.es/~mvargas/tema2sd.pdf

http://www.eumed.net/cursecon/libreria/drm/1f.htm
ANEXOS

EJERCICIOS

1. Construye la tabla de doble entrada correspondiente a la

siguiente distribución: (4, 1), (3, 2), (6, 0), (5, 1),

(1, 5), (5, 0), (1, 6), (3, 3), (5, 1), (2, 4),

(4, 2), (3, 4), (2, 4), (5, 1), (1, 7), (5, 2), (1, 6), (1, 5), (3, 3)

Construye la tabla de doble entrada de la distribución.

Solución:

X
1 2 3 4 5 6
Y
0 0 0 0 0 1 1
1 0 0 0 1 3 0
2 0 0 1 1 1 0
3 0 0 2 0 0 0
4 0 2 1 0 0 0
5 2 0 0 0 0 0
6 2 0 0 0 0 0
7 1 0 0 0 0 0

2. Dada la siguiente tabla de doble entrada, calcula la media y la varianza

marginales de ambas variables:

X
1 2 3
Y
10 0 2 1
20 3 0 4

2 2
Solución: x = 2,2; x = 0,76 ; y = 17; y =21

3. Sea una variable bidimensional dada por la siguiente tabla de doble entrada:
X
1 2 3 4
Y
10 0 0 2 4
15 0 1 5 1
20 4 3 0 0

Calcula la media y la varianza de las variables marginales X e Y, así como la covarianza.

Solución: x = 2,65; x
2
= 1,275 ; y = 15,25; y
2
=16,1875; xy = –3,66

4. En un depósito cilíndrico, la altura del agua que contiene varía conforme pasa el

tiempo según la siguiente tabla:

Tiempo (h) 8 22 27 33 50 70
Altura (m) 17 14 12 11 6 1

Halla:

a) Las medias y las varianzas de X y de Y.

b) La covarianza.

Solución: x = 35; x
2
= 402,67 ; y = 10,17; y
2
=27,74; xy = –105,78

5. Representa la nube de puntos de la distribución del ejercicio 1.

Solución:

Вам также может понравиться