Вы находитесь на странице: 1из 20

Estadística descriptiva – UNAD

Paso 4. Descripción de la Información

Creado por Luis Felipe Baquero Lombana

Ingeniería de sistemas

ESTADISTICA DESCRIPTIVA - (100105A_612)

UNAD – Universidad Nacional Abierta y a Distancia

Bogotá DC

Junio de 2019

1
INTRODUCCION

Es importante conocer las medidas bivariantes con el objetivo de poder identificarlas, calcularlas e interpretarlas en función
de la descripción de un problema. A partir del siguiente documento se ve el desarrollo de estas habilidades en relación a la
estadística descriptiva.

2
JUSTIFICACION

Teniendo en cuenta las temáticas del curso, es necesario que los estudiantes que ven estadística descriptiva puedan
entender y aplicar este tipo de conocimiento en problemas simulados que recrean un hecho de la vida real. En el siguiente
documento se ve el desarrollo de este tipo de ejercicios.

3
OBJETIVOS

 Identificar, calcular e interpretar las medidas bivariantes, en función de la descripción de la problemática a partir
del trabajo realizado con variables cuantitativas.
 Desarrollar el ejercicio propuesto por el docente en pro de aplicar el conocimiento adquirido durante la fase del
curso de estadística descriptiva.

4
Actividad 1 – Mapa mental

5
Actividad 2 – Definición de conceptos:

Definición de conceptos básicos asociados a regresión y correlación lineal:

 Diagrama de dispersión:

Es un tipo de diagrama matemático que utiliza el plano cartesiano para mostrar los valores de dos variables para un
conjunto de datos. El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos pares como una nube
de puntos. Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes. Una
relación positiva entre x y y significa que los valores crecientes de x están asociados con los valores crecientes de y.
Una relación negativa significa que los valores crecientes de x están asociados con los valores decrecientes de y.

 Correlación lineal simple.

El término “correlación” literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica
el grado en el que los valores de una variable se relacionan con los valores de otra. Más exactamente, el análisis que
se ocupa de medir la relación entre una sola variable independiente y la variable dependiente se llama análisis de
correlación simple.

 Coeficiente de determinación R2

El R2 es el porcentaje de variación de la variable de respuesta que explica su relación con una o más variables
predictores. Por lo general, mientras mayor sea el R2, mejor será el ajuste del modelo a sus datos. El R2 siempre se
encuentra entre 0 y 100%. El R-cuadrado también se conoce como el coeficiente de determinación o determinación
múltiple (en la regresión lineal múltiple).

 Correlación positiva y correlación negativa

Correlación positiva:
Se habla de una correlación positiva cuando una relación entre una variable y otra es lineal y directa, de manera que
un cambio en una variable predice el cambio en la otra variable. En ese caso, se dice que la correlación es positiva
perfecta, es decir, ambas variables varían al mismo tiempo. Este tipo de correlación es directamente proporcional.
Hay correlación positiva cuando las dos variables se correlacionan en sentido directo. Por lo que, a valores altos de
una le corresponden valores altos de la otra e igualmente con los valores bajos.

6
Correlación negativa:

Se habla de una correlación negativa cuando la relación entre una variable y otra es opuesta o inversa, es decir,
cuando una variable cambia, la otra se modifica hacia lo contrario. Entonces, cuando una posee variable valores altos,
la otra posee valores bajos y mientras este valor esté más cerca de -1, más evidente será esta covariación.

Se dice que hay correlación negativa perfecta cuando r = -1. Este tipo de correlación es inversamente proporcional.
Entonces, hay correlación negativa cuando las dos variables se correlacionan en sentido inverso.

 ¿Qué es el coeficiente de correlación lineal y qué nos ayuda a medir?

La correlación, también conocida como coeficiente de correlación lineal (de Pearson), es una medida de regresión
que pretende cuantificar el grado de variación conjunta entre dos variables. Por tanto, es una medida estadística que
cuantifica la dependencia lineal entre dos variables, es decir, si se representan en un diagrama de dispersión los
valores que toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el conjunto de
puntos representados se aproxima a una recta.

Actividad 3 – Laboratorio de regresión y correlación lineal PASO 2 Pendiente entregar

Opción Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante


5 1.2. Estudiantes U 2.2. Salario I 3.2. Altura E Felipe Baquero

Ejercicio 1 – (1.2. Estudiantes U):

Se realizó una encuesta a los estudiantes de undécimo grado en un colegio de la ciudad de Cali, con el fin de determinar
cuáles serían las profesiones que están pensando estudiar cuando Terminen el periodo académico. Para lo anterior se
realizó una encuesta a 120. Estudiantes, arrojando los siguientes resultados

Profesiones laborales Número


Licenciatura 20
Música 10
Ingeniería 30
Medicina 25
Derecho 20
Periodismo 15

7
35
30
30
25
25
20 20
20
15
15
10
10

0
Licenciatura Música Ingeniería Medicina Derecho Periodismo

Número

15 20

20 10

30
25

Licenciatura Música Ingeniería Medicina Derecho Periodismo

Variable cuantitiva

Conclusiones:

1. La carrera con más candidatos de estudiantes es ingeniera.

2. Música es la carrera con menos candidatos del grado 11.

8
Ejercicio 2 – (2.2. Salarios I):

En EEUU los salarios por día en dólares, de los operarios de una industria metalúrgica son:

62,5 73,4 51,1 73,2 71,1 61,6 91,1 50,8


94,7 96,1 70,5 68,6 66,7 90,7 62,2 80,1
54,3 89,6 80,3 58,7 85,7 88,6 83,4 61,8
90,1 60,4 87,6 90,7 93,3 58,3 59,1 88,4
89,1 91,6 62,7 89,3 87,4 59,8 82,6 69,9
51,8 80,7 77,9 61,0 52,2 72,7 71,0 51,8
71,6 58,6 53,0 57,5 66,5 63,3 87,7 42,2
90,3 88,3 94,4 77,8 44,3 86,7 58,5 68,2
93,4 64,2 60,4 58,3 62,3 79,6 90,1 86,7
96,1 85,3 91,2 89,2 88,9 90,4 79,3 74,2

120

100

80

60

40

20

Día 1 Día 2 Día 3 Día 4 Día 5 Día 6 Día 7 Día 8

9
96.1 62.5
94.7
93.4
54.3
90.3
90.1
71.6
89.1

51.8

Operario 1 Operario 2 Operario 3 Operario 4 Operario 5


Operario 6 Operario 7 Operario 8 Operario 9 Operario 10

Variable cuantitativa

Conclusiones:

1. El operario 7 es el que menos salario gana en el día 1.


2. A simple vista el salario de los obreros siempre es promedio de acuerdo a los días de trabajo.

Ejercicio 3 – (3.2. Altura E):

Se realizó un estudio sobre la altura de un grupo de estudiantes de una universidad, el cual Se registró en la siguiente tabla
de frecuencias:

Altura (pulgadas) No. de estudiantes


60 a 62 5
63 a 65 18
66 a 68 42
69 a 71 27
72 74 8

10
No. de estudiantes
45 42
40
35
30 27
25
20 18
15
10 8
5
5
0
60 a 62 63 a 65 66 a 68 69 a 71 72 74

No. de estudiantes

8 5
18
27

42

60 a 62 63 a 65 66 a 68 69 a 71 72 74

Variable cuantitativa

Conclusiones:

1. La Mayor parte de los estudiantes encuestados mide entre 66 a 68 pulgadas.


2. 5 estudiantes de los encuestados están entre las 60 a 62 pulgadas de estatura.

11
Actividad 3 – Laboratorio de regresión y correlación lineal PASO 4

Opción Ejercicio 1 Ejercicio 2 Ejercicio 3 Estudiante


5 1.2. CH-Pureza. 1.5. Tem-Vapor 1.8. %-Umbral Felipe Baquero

CH-Pureza. El rendimiento del producto de un proceso químico está relacionado con la


temperatura de operación del proceso. Se desea establecer la relación que existe entre la
pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que está presente en
el condensador principal en un proceso de destilación, de acuerdo con los siguientes datos:

X
(% de Y
Hidro (Pureza)
carburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33

12
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

Y (Pureza)
102

100

98

96

94

92

90

88

86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8

El tipo de relación entre las variables es alta correlación positiva

b) Encuentre el modelo matemático que permite predecir el efecto de una variable sobre la
otra. ¿Es confiable?

La función de ajuste: Y = a+bx

Despejando la función obtenemos: Y=74.08+15.12X

Es confiable porque permite determinar y conocer el comportamiento de las variables


siempre y cuando se hallen de la manera correcta.

c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

Es altamente de correlación positiva. El valor de Y se incrementa nítidamente al medida


que el valor de X aumenta. Indica alto nivel de confiabilidad.

13
d) ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a 91,3?

Y= a+bx
Y=74.08+15.12(91.3)
Y= 1180.636

Tem-Vapor. El número de libras de vapor (y) consumidas mensualmente por una planta
química, se relaciona con la temperatura ambiental promedio (en o F). Para el año 2014, se
registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

Temperatura Consumo de
Mes
(F) vapor (Lb)

Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

14
a. Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

Consumo de vapor (Lb)


800

700

600

500

400

300

200

100

0
0 10 20 30 40 50 60 70 80

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?
La ecuación es Y= 92.2087x -6.3184
Es confiable ya que según coeficiente de determinación R2= 0.9999 se aproxima a
1.
c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.
R2 x 100% = 0.9999 x 100% = 99.99%
El grado de relación de las dos variables esta dado de la siguiente forma:

√𝑅2 = √0.9999 = 0.9999499987

La representación porcentual seria: 99,99% lo cual indica que tienen una relación
muy estable.

15
d. ¿Cuál es el de consumo de vapor cuando la temperatura es de 70 oF?
Y= 9.2087x – 6.3184

La fórmula queda así:

Y= 9.2087 x -6.3184
Y= 9.2087 (70)-6.3184
Y= 644.609 -6.3184
Y= 638.2906

El resultado es Y= 638.2906

%-Umbral. Los investigadores están estudiando la correlación entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x).
La respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y) que
es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son variables
aleatorias

y (umbral de reflejo
% Sobrepeso. de flexión
nociceptiva)

89 2,00
90 3,00
75 4,00
30 4,50
51 5,50
75 7,00
62 9,00
45 13,00
90 15,00
20 14,00

16
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las variables.

y (umbral de reflejo de flexión nociceptiva)


16

14

12

10

0
0 20 40 60 80 100

b) Ajuste un modelo matemático que permita predecir el efecto de una variable sobre la
otra. ¿Es confiable?

Formula y= a+bx
Y=-0.063 +11.65x
c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

Las variables son independientes, no son proporcionales.

d) ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 40?

Y=-0.063 +11.65x

Y=-0.063 +11.65 (40)

Y= 9.13

17
Actividad 4: Regresión y correlación Lineal

Las variables tomadas son: Edad y Estatura

Diagrama:

Estatura (M)
1.60

1.40

1.20

1.00

0.80

0.60

0.40

0.20

0.00
0 2 4 6 8 10 12

Se identifica que la estatura es dependiente de la edad pero no de forma positiva, siempre hay un grado de variabilidad.

18
CONCLUSIONES

Un análisis estadístico por dos variables nos permite obtener de manera sencilla un contexto de cómo se relacionan estas
variables y que tan estrecha puede llegar a ser una relación, esto por medio de elementos como los diagramas de dispersión
y modelos matemáticos.

19
BIBLIOGRAFIA

 Universoformulas. (s.f.). Estadistica descriptiva. Recuperado de:

http://aplicacionesweb/FacturaMail/Facturas/ConsultaFactura.aspx

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical Descriptive.

Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&

asid=99feba20c3312cbea60961107ffc27a0

 Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. (pp 151 – 158). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&

asid=b82c81e98fcc1361e1929abe203c8219

 Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. México City: Cengage Learning.

(pp 675–686). Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&p=GVRL&sw=w&

asid=e558184ed89e57d11ede116134cfce41

20

Вам также может понравиться