Академический Документы
Профессиональный Документы
Культура Документы
Ingeniería de sistemas
Bogotá DC
Junio de 2019
1
INTRODUCCION
Es importante conocer las medidas bivariantes con el objetivo de poder identificarlas, calcularlas e interpretarlas en función
de la descripción de un problema. A partir del siguiente documento se ve el desarrollo de estas habilidades en relación a la
estadística descriptiva.
2
JUSTIFICACION
Teniendo en cuenta las temáticas del curso, es necesario que los estudiantes que ven estadística descriptiva puedan
entender y aplicar este tipo de conocimiento en problemas simulados que recrean un hecho de la vida real. En el siguiente
documento se ve el desarrollo de este tipo de ejercicios.
3
OBJETIVOS
Identificar, calcular e interpretar las medidas bivariantes, en función de la descripción de la problemática a partir
del trabajo realizado con variables cuantitativas.
Desarrollar el ejercicio propuesto por el docente en pro de aplicar el conocimiento adquirido durante la fase del
curso de estadística descriptiva.
4
Actividad 1 – Mapa mental
5
Actividad 2 – Definición de conceptos:
Diagrama de dispersión:
Es un tipo de diagrama matemático que utiliza el plano cartesiano para mostrar los valores de dos variables para un
conjunto de datos. El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos pares como una nube
de puntos. Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes. Una
relación positiva entre x y y significa que los valores crecientes de x están asociados con los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados con los valores decrecientes de y.
El término “correlación” literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica
el grado en el que los valores de una variable se relacionan con los valores de otra. Más exactamente, el análisis que
se ocupa de medir la relación entre una sola variable independiente y la variable dependiente se llama análisis de
correlación simple.
Coeficiente de determinación R2
El R2 es el porcentaje de variación de la variable de respuesta que explica su relación con una o más variables
predictores. Por lo general, mientras mayor sea el R2, mejor será el ajuste del modelo a sus datos. El R2 siempre se
encuentra entre 0 y 100%. El R-cuadrado también se conoce como el coeficiente de determinación o determinación
múltiple (en la regresión lineal múltiple).
Correlación positiva:
Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que
un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva
perfecta, es decir, ambas variables varían al mismo tiempo. Este tipo de correlación es directamente proporcional.
Hay correlación positiva cuando las dos variables se correlacionan en sentido directo. Por lo que, a valores altos de
una le corresponden valores altos de la otra e igualmente con los valores bajos.
6
Correlación negativa:
Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir,
cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos,
la otra posee valores bajos y mientras este valor esté más cerca de -1, más evidente será esta covariación.
Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de correlación es inversamente proporcional.
Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso.
La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de regresión
que pretende cuantificar el grado de variación conjunta entre dos variables. Por tanto, es una medida estadística que
cuantifica la dependencia lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de
puntos representados se aproxima a una recta.
Se realizó una encuesta a los estudiantes de undécimo grado en un colegio de la ciudad de Cali, con el fin de determinar
cuáles serían las profesiones que están pensando estudiar cuando Terminen el periodo académico. Para lo anterior se
realizó una encuesta a 120. Estudiantes, arrojando los siguientes resultados
7
35
30
30
25
25
20 20
20
15
15
10
10
0
Licenciatura Música Ingeniería Medicina Derecho Periodismo
Número
15 20
20 10
30
25
Variable cuantitiva
Conclusiones:
8
Ejercicio 2 – (2.2. Salarios I):
En EEUU los salarios por día en dólares, de los operarios de una industria metalúrgica son:
120
100
80
60
40
20
9
96.1 62.5
94.7
93.4
54.3
90.3
90.1
71.6
89.1
51.8
Variable cuantitativa
Conclusiones:
Se realizó un estudio sobre la altura de un grupo de estudiantes de una universidad, el cual Se registró en la siguiente tabla
de frecuencias:
10
No. de estudiantes
45 42
40
35
30 27
25
20 18
15
10 8
5
5
0
60 a 62 63 a 65 66 a 68 69 a 71 72 74
No. de estudiantes
8 5
18
27
42
60 a 62 63 a 65 66 a 68 69 a 71 72 74
Variable cuantitativa
Conclusiones:
11
Actividad 3 – Laboratorio de regresión y correlación lineal PASO 4
X
(% de Y
Hidro (Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
12
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
Y (Pureza)
102
100
98
96
94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
b) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?
13
d) ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?
Y= a+bx
Y=74.08+15.12(91.3)
Y= 1180.636
Tem-Vapor. El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual.
Temperatura Consumo de
Mes
(F) vapor (Lb)
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
14
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.
700
600
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?
La ecuación es Y= 92.2087x -6.3184
Es confiable ya que según coeficiente de determinación R2= 0.9999 se aproxima a
1.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
R2 x 100% = 0.9999 x 100% = 99.99%
El grado de relación de las dos variables esta dado de la siguiente forma:
La representación porcentual seria: 99,99% lo cual indica que tienen una relación
muy estable.
15
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?
Y= 9.2087x – 6.3184
Y= 9.2087 x -6.3184
Y= 9.2087 (70)-6.3184
Y= 644.609 -6.3184
Y= 638.2906
El resultado es Y= 638.2906
y (umbral de reflejo
% Sobrepeso. de flexión
nociceptiva)
89 2,00
90 3,00
75 4,00
30 4,50
51 5,50
75 7,00
62 9,00
45 13,00
90 15,00
20 14,00
16
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.
14
12
10
0
0 20 40 60 80 100
b) Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?
Formula y= a+bx
Y=-0.063 +11.65x
c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
Y=-0.063 +11.65x
Y= 9.13
17
Actividad 4: Regresión y correlación Lineal
Diagrama:
Estatura (M)
1.60
1.40
1.20
1.00
0.80
0.60
0.40
0.20
0.00
0 2 4 6 8 10 12
Se identifica que la estatura es dependiente de la edad pero no de forma positiva, siempre hay un grado de variabilidad.
18
CONCLUSIONES
Un análisis estadístico por dos variables nos permite obtener de manera sencilla un contexto de cómo se relacionan estas
variables y que tan estrecha puede llegar a ser una relación, esto por medio de elementos como los diagramas de dispersión
y modelos matemáticos.
19
BIBLIOGRAFIA
http://aplicacionesweb/FacturaMail/Facturas/ConsultaFactura.aspx
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&
asid=99feba20c3312cbea60961107ffc27a0
Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158). Recuperado de
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&
asid=b82c81e98fcc1361e1929abe203c8219
Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&
asid=e558184ed89e57d11ede116134cfce41
20