Вы находитесь на странице: 1из 24

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

Escuela de Ciencias Básicas, Tecnología e Ingeniería

CURSO: ESTADÍSTICA DESCRIPTIVA

FASE INTERMEDIA: TRABAJO COLABORATIVO III

GRISMALDO MERIÑO MEZA


Cod. 85126938.

TUTOR:
DANIEL FRANCISCO CHICA.

GRUPO: 100175_274

BARRANQUILLA, NOVIEMBRE DE 2016.


INTRODUCCIÓN

La estadística es una ciencia empleada en los campos científicos, investigativos y

analíticos. Por ello es importante su estudio puesto que permite llegar al conocimiento de

un hecho específico, además de minimizar el riesgo ayuda a la toma de decisiones. La

estadística descriptiva es la técnica que se encarga de la recopilación, presentación,

tratamiento y análisis de los datos, con el objetivo de resumir, describir las características

de un conjunto de datos y por lo general toman forma de tablas y gráficas, se utiliza en casi

todos los campos científicos, por esto consideramos que su estudio es de vital importancia

para nuestra formación profesional.

Mediante el desarrollo del presente trabajo se pretenderá identificar los

conocimientos y conceptos de la estadística descriptiva, así como su aplicación en el

contexto real; trabajando sobre problemáticas del entorno diario, mediante la realización de

ejercicios plateados en la guía de actividades. Se trabaja sobre las diferentes maneras de

agrupar la información obtenida mediante encuestas e investigaciones, aplicando la

estadística descriptiva y de esta forma poder hacer algunas conclusiones.

El presente trabajo da un panorama brinda la oportunidad de identificar y trabajar

con los compañeros cono un equipo de trabajo colaborativo. Igualmente brinda un amplio

contexto de la unidad 3 del curso de estadística descriptiva, es por ello que durante el

mismo se encuentra el desarrollo de la guía de actividades correspondiente al trabajo

colaborativo 3, en el cual se pondrán en práctica los conocimientos adquiridos hasta la

fecha del curso, empleando el trabajo en equipo como un reto para su desarrollo.
JUSTIFICACIÓN

A diferencia de otras ramas de la matemática que poseen una parte importante de


abstracción, la estadística tiene aplicaciones directas y concretas en la vida real ya que toma
los números y cifras de diferentes fenómenos sociales como por ejemplo la desocupación,
la tasa de mortalidad, la de natalidad y muchos otros datos incluso más complejos.

Podemos decir que la función principal de la estadística es justamente la recolección


y agrupamiento de datos de diverso tipo para construir con ellos informes estadísticos que
nos den idea sobre diferentes y muy variados temas, siempre desde un punto de vista
cuantitativo y no cualitativo. Es por ello que su estudio se hace necesario para el
fortalecimiento de quehacer profesional en la obtención, análisis y conclusiones de una
investigación sin importar cuál sea la profesión el conocimiento claro de datos estadísticos
ayudará a tomar mejores decisiones en una investigación.
Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la
aplicación de la Estadística.
OBJETIVOS

Objetivos generales:

Potencializar las habilidades y destrezas para caracterizar una situación mediante el análisis de
las medidas estadísticas.

Determinar la relación entre dos o más variables inscritas en una situación específica a partir
del análisis de regresión lineal simple y múltiple.

Objetivos específicos:

Realizar diagramas de dispersión en los ejercicios y actividades colaborativas que


permitan determinar el tipo de asociación entre las variables escogidas en cada
ejercicio.

En los ejercicios propuestos de laboratorio y de regresión y correlación lineal simple


crear modelos matemáticos que permita predecir el efecto de una variable sobre la otra
para determinar su fiabilidad.

Determinar porcentajes que permitan una explicación de modelo y grado de relación de


dos variables de los ejercicios de laboratorio y de regresión y correlación lineal simple.

Identificar una variable cuantitativa dependiente y varias variables independientes del


estudio de investigación, diagramarlas y calcular la recta de regresión y el coeficiente
de correlación para probar estadísticamente su relación.

Relacionar o analizar la información obtenida en cada problema planteado en los


ejercicios de laboratorio y colaborativo.
1. Regresión y Correlación lineal Simple.

a) Identificar dos variables cuantitativas de la situación estudiada que puedan estar


relacionadas.

Número
de Velocidad X Y XY X2 Y2
Muertos
1 33 -3,83 -40,21 153,891157 14,64801653 1616,77099
1 38 -3,83 -35,21 134,754793 14,64801653 1239,68008
1 40 -3,83 -33,21 127,100248 14,64801653 1102,84372
1 40 -3,83 -33,21 127,100248 14,64801653 1102,84372
1 45 -3,83 -28,21 107,963884 14,64801653 795,75281
1 45 -3,83 -28,21 107,963884 14,64801653 795,75281
1 48 -3,83 -25,21 96,4820661 14,64801653 635,498264
2 50 -2,83 -23,21 65,6184298 7,993471074 538,661901
2 50 -2,83 -23,21 65,6184298 7,993471074 538,661901
2 50 -2,83 -23,21 65,6184298 7,993471074 538,661901
2 50 -2,83 -23,21 65,6184298 7,993471074 538,661901
2 51 -2,83 -22,21 62,791157 7,993471074 493,243719
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 55 -2,83 -18,21 51,4820661 7,993471074 331,570992
2 60 -2,83 -13,21 37,3457025 7,993471074 174,480083
2 60 -2,83 -13,21 37,3457025 7,993471074 174,480083
2 60 -2,83 -13,21 37,3457025 7,993471074 174,480083
2 62 -2,83 -11,21 31,691157 7,993471074 125,643719
2 63 -2,83 -10,21 28,8638843 7,993471074 104,225537
2 65 -2,83 -8,21 23,2093388 7,993471074 67,3891736
2 65 -2,83 -8,21 23,2093388 7,993471074 67,3891736
2 66 -2,83 -7,21 20,3820661 7,993471074 51,9709917
2 66 -2,83 -7,21 20,3820661 7,993471074 51,9709917
2 66 -2,83 -7,21 20,3820661 7,993471074 51,9709917
2 66 -2,83 -7,21 20,3820661 7,993471074 51,9709917
2 66 -2,83 -7,21 20,3820661 7,993471074 51,9709917
2 67 -2,83 -6,21 17,5547934 7,993471074 38,5528099
3 67 -1,83 -6,21 11,3457025 3,33892562 38,5528099
3 67 -1,83 -6,21 11,3457025 3,33892562 38,5528099
3 68 -1,83 -5,21 9,51842975 3,33892562 27,1346281
3 68 -1,83 -5,21 9,51842975 3,33892562 27,1346281
3 68 -1,83 -5,21 9,51842975 3,33892562 27,1346281
3 68 -1,83 -5,21 9,51842975 3,33892562 27,1346281
3 68 -1,83 -5,21 9,51842975 3,33892562 27,1346281
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 69 -1,83 -4,21 7,69115702 3,33892562 17,7164463
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
3 70 -1,83 -3,21 5,8638843 3,33892562 10,2982645
4 71 -0,83 -2,21 1,82752066 0,684380165 4,88008264
4 71 -0,83 -2,21 1,82752066 0,684380165 4,88008264
4 72 -0,83 -1,21 1,00024793 0,684380165 1,46190083
4 72 -0,83 -1,21 1,00024793 0,684380165 1,46190083
4 73 -0,83 -0,21 0,17297521 0,684380165 0,04371901
4 73 -0,83 -0,21 0,17297521 0,684380165 0,04371901
4 73 -0,83 -0,21 0,17297521 0,684380165 0,04371901
4 74 -0,83 0,79 -0,65429752 0,684380165 0,62553719
4 74 -0,83 0,79 -0,65429752 0,684380165 0,62553719
4 74 -0,83 0,79 -0,65429752 0,684380165 0,62553719
5 75 0,17 1,79 0,30933884 0,029834711 3,20735537
5 75 0,17 1,79 0,30933884 0,029834711 3,20735537
5 75 0,17 1,79 0,30933884 0,029834711 3,20735537
5 75 0,17 1,79 0,30933884 0,029834711 3,20735537
5 76 0,17 2,79 0,48206612 0,029834711 7,78917355
5 77 0,17 3,79 0,65479339 0,029834711 14,3709917
5 77 0,17 3,79 0,65479339 0,029834711 14,3709917
5 77 0,17 3,79 0,65479339 0,029834711 14,3709917
5 77 0,17 3,79 0,65479339 0,029834711 14,3709917
6 78 1,17 4,79 5,61842975 1,375289256 22,9528099
6 78 1,17 4,79 5,61842975 1,375289256 22,9528099
6 78 1,17 4,79 5,61842975 1,375289256 22,9528099
6 79 1,17 5,79 6,79115702 1,375289256 33,5346281
7 79 2,17 5,79 12,5820661 4,720743802 33,5346281
7 79 2,17 5,79 12,5820661 4,720743802 33,5346281
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 80 2,17 6,79 14,7547934 4,720743802 46,1164463
7 81 2,17 7,79 16,9275207 4,720743802 60,6982645
8 81 3,17 7,79 24,7184298 10,06619835 60,6982645
8 81 3,17 7,79 24,7184298 10,06619835 60,6982645
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
8 83 3,17 9,79 31,0638843 10,06619835 95,8619008
9 85 4,17 11,79 49,2002479 17,41165289 139,025537
9 86 4,17 12,79 53,3729752 17,41165289 163,607355
9 88 4,17 14,79 61,7184298 17,41165289 218,770992
9 88 4,17 14,79 61,7184298 17,41165289 218,770992
9 88 4,17 14,79 61,7184298 17,41165289 218,770992
9 88 4,17 14,79 61,7184298 17,41165289 218,770992
10 88 5,17 14,79 76,5093388 26,75710744 218,770992
10 95 5,17 21,79 112,71843 26,75710744 474,843719
11 95 6,17 21,79 134,509339 38,10256198 474,843719
11 100 6,17 26,79 165,372975 38,10256198 717,75281
11 105 6,17 31,79 196,236612 38,10256198 1010,6619
12 108 7,17 34,79 249,545702 51,44801653 1210,40736
12 111 7,17 37,79 271,063884 51,44801653 1428,15281
12 138 7,17 64,79 464,727521 51,44801653 4197,8619
12 138 7,17 64,79 464,727521 51,44801653 4197,8619
12 150 7,17 76,79 550,800248 51,44801653 5896,84372
5447,97273 1037,718182 35880,1909

R 0,89282808 Media X Media Y

R2 0,79714198 4,8273 73,2091


b) Realizar el diagrama de dispersión de dichas variables y determinar el tipo de
asociación entre las variables.

Numero de Muertos
vs Velocidad y = 5,25x + 47,866
R² = 0,7971
160
140
Numero de Muertos

120
100
80
60
40
20
0
0 2 4 6 8 10 12 14
Velocidad

El tipo de asociación entre las variables es de dispersión lineal ascendente con una
correlación positiva alta

c) Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Y= a + b

y = 5,25x + 47,866

R² = 0,7971

La ecuación de la recta es confiable porque el coeficiente de la determinación (R2) está


cercano a 1 y tiene una correlación positiva alta.
d) Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

𝑅 2 = 0,7971 ∗ 100 = 79,71% → Porcentaje de Explicación


𝑟 = √0,7971 = 0,8928

𝑟 = 0,8928 → 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒

Esta ecuación hace una buena estimación entre las variables debido a que el
coeficiente de determinación R2 explica el 79,71% de la información y el valor del
coeficiente de correlación R confirma el grado de relación de las variables que es el
89,28%.

e) Relacionar la información obtenida con el problema.


Con los resultados obtenidos podemos concluir que hay una relación directa entre la
Velocidad y el número de muertos en los accidentes producidos, lo que nos indica
que a mayor velocidad mayor es el número de muertos.
2. Regresión y Correlación Lineal Múltiple.

a) Identificar una variable cuantitativa dependiente y varias variables independientes


del estudio de investigación.

# de Heridos Edad Grados de 3 31 0,8


(Y) (x) Alcohol (x) 4 50 1,2
1 29 0,0 3 30 1,4
2 38 0,3 4 48 0,8
3 52 0,0 3 53 0,9
0 46 0,2 4 35 1,2
2 21 0,6 2 46 1,1
2 18 0,4 2 45 1,0
1 54 0,2 4 32 1,2
0 33 0,6 3 45 1,0
2 52 0,7 2 31 1,4
3 38 0,5 3 33 1,6
3 46 1,4 2 23 1,5
4 29 0,8 1 56 1,4
1 17 0,6 4 18 1,9
2 22 1,0 3 54 1,8
1 55 0,7 2 33 1,6
3 60 0,4 4 52 1,8
3 33 0,6 4 38 1,5
2 32 0,0 3 46 1,6
3 46 0,2 5 29 2,0
2 55 0,7 6 17 1,8
3 19 0,8 5 22 1,7
4 21 0,9 3 54 1,6
3 42 0,7 4 17 1,2
3 46 0,6 5 21 1,8
3 36 0,8 5 46 1,7
4 35 0,9 3 55 1,6
2 43 1,0 6 19 1,4
3 32 0,9 5 21 1,8
4 24 1,2 3 42 1,7
3 44 1,1 3 46 1,4
4 36 1,5 3 46 2,5
4 35 1,9 6 36 2,4
3 56 2,0 5 35 2,3
4 22 1,9 4 55 2,6
2 23 1,8 4 22 3,0
2 45 2,1 5 18 2,8
3 43 2,2 6 54 3,4
3 34 2,0 6 33 3,1
4 38 2,1 5 52 3,3
2 18 2,3 7 38 3,3
5 54 2,4 5 46 2,9
3 33 2,2 6 29 3,0
4 52 2,4 7 17 3,2
5 38 2,1 5 22 3,0
4 46 1,9 6 38 3,2
3 29 2,3 6 52 3,2
5 17 2,2 5 46 3,5
4 22 2,0 4 21 3,2
3 34 2,3 7 18 3,0
4 46 2,4 7 54 3,2
5 55 2,2 4 60 3,3
4 19 2,3 7 33 3,4
3 21 2,4 5 32 3,4
3 42 2,5 7 46 3,5
b) Realizar el diagrama de dispersión de dichas variables.
Calcular la recta de regresión y el coeficiente de correlación para probar
estadísticamente su relación.

y = -1,0055x + 40,657
# Heridos Vs Grados de alcohol, Edad R² = 0,0152
70

60
Número de Heridos

50

40

30

20

10

0
0 1 2 3 4 5 6 7 8

Grados de Linear (Edad


Alcohol (x) (x))

𝑅 2 = 0,0152 ∗ 100 = 1,52% → Porcentaje de Explicación


𝑟 = √0,0152 = 0,1232

𝑟 = 0,1232 → 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒

Esta ecuación no hace una buena estimación entre las variables debido a que el coeficiente
de determinación R2 explica solo 1,52% de la información y el valor del coeficiente de
correlación R confirma el grado de relación de la variable, que es el 12,32%

c) Relacionar la información obtenida con el problema.


La asociación de las variables no existe, esto se puede observar con el coeficiente de
determinación R2 que es 1,52% . por lo que podemos concluir que el número de heridos en
nada tiene que ver con los grados de alcohol del y las edades de los conductores.
CONCLUSIONES.

Es evidente que los gráficos de dispersión son de gran ayuda para el buen análisis
del comportamiento de dos variables de las cuales se estima algún tipo de relación, y por
ende demostrar que tanto puede afectar una a otra.
Las medidas de dispersión contribuyen a la realización de una comparación entre las
posibles variaciones que pueden tener algunos datos que se están estudiando.
Tanto las medidas de dispersión como los gráficos de dispersión sirven para observar el
comportamiento que tienen algunos datos que son objeto de estudio y que pretenden
mostrar la relación que existe entre los mismos o por el contrario una total desconexión que
impide brindar soluciones.
Las temáticas tratadas durante el curso muestran la importancia de la estadística
para el análisis de datos de acuerdo a estudios previos en circunstancias que necesitan de un
proceso para llegar a conclusiones determinantes en cada una de ellas.
Además de lo anterior se puede evidenciar la ayuda que brindan las gráficas para el estudio
de los datos, con el fin de dar soluciones precisas que contribuyan a mejores resultados de
las situaciones objeto de estudio
REFERENCIAS BIBLIOGRÁFICAS.

Montero, J.M. (2007). Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.


130 – 172. Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219

Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple. Mexico


City: Cengage Learning. Páginas 675 – 686 Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900232&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=e558184ed89e57d11ede116134cfce41

Churchill, G.A. (2009). "Análisis de Regresión Múltiple." Investigación de


mercados.México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4058900234&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=49575112db86a0eb46dae86bbaf74cb9

Montero, J.M. (2007). Regresión y Correlación Múltiple. Madrid: Paraninfo.


Páginas 191 – 225.Tomado de:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100012&v=2.1&u=unad&it=r&
p=GVRL&sw=w&asid=47eaa8f46c19ad13af26a0a74e510de2

Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto


Politécnico Nacional. Retrieved from http://www.ebrary.com Recuperado de:
http://site.ebrary.com/lib/unadsp/reader.action?ppg=1&docID=10436604&tm=1471981
857855
ANEXO

Laboratorio Regresión y Correlación Lineal

Aspectos Teóricos:

Regresión y correlación

En muchos casos se requiere conocer más que el comportamiento de una sola


variable, se requiere conocer la relación entre dos o más variables como la relación entre
producción y consumo; salarios y horas de trabajo; oferta y demanda; salarios y
productividad; la altura de un árbol y el diámetro de su tronco.
Muchos de estos comportamientos tienen una tendencia lineal, aunque hay muchos otros
que lo hacen de forma curva. Para determinar el grado de correlación entre las variables, no
basta con calcular la varianza explicada, pues existe el coeficiente de determinación
coeficiente de correlación; sin embargo, frecuentemente se utiliza un coeficiente de
correlación rectilíneo, siendo este un valor entre -1y1.
Para estas confrontaciones se utiliza el diagrama de dispersión que es plano cartesiano en el
que se marcan los puntos correspondientes a los pares (x, y) de los valores de las variables.
El análisis de Regresión tiene los siguientes usos: el primero es obtener los estimadores de
los parámetros, estimar la varianza del error, obtener los errores estándares de los
parámetros estimados, probar la hipótesis sobre los parámetros, cálculo de valores
estimados basados en la ecuación estimada, estimar el ajuste o la falta de ajuste del modelo.
El modelo a utilizar es Y= a+ bx, a es el intercepto, b es la pendiente de la función, la que
nos indica el cambio marginal de Y respecto a X.
EJERCICIOS:
1. El rendimiento del producto de un proceso químico está relacionado con la
temperatura de operación del proceso. Se desea establecer la relación que existe
entre la pureza (y) del oxígeno producido y el porcentaje de hidrocarburo (x) que
está presente en el condensador principal en un proceso de destilación, de acuerdo
con los siguientes datos:

X
Y
(% de XY X² Y²
(Pureza
Hidrocarburos)
0,99 90,01 89,11 0,98 8101,8
1,02 89,05 90,83 1,04 7929,9
1,15 91,43 105,14 1,32 8359,4
1,29 93,74 120,92 1,66 8787,2
1,46 96,73 141,23 2,13 9356,7
1,36 94,45 128,45 1,85 8920,8
0,87 87,59 76,20 0,76 7672,0
1,23 91,77 112,88 1,51 8421,7
1,55 99,42 154,10 2,40 9884,3
1,4 93,65 131,11 1,96 8770,3
1,19 93,54 111,31 1,42 8749,7
1,15 92,52 106,40 1,32 8560,0
0,98 90,56 88,75 0,96 8201,1
1,01 89,54 90,44 1,02 8017,4
1,11 89,85 99,73 1,23 8073,0
1,2 90,39 108,47 1,44 8170,4
1,26 93,25 117,50 1,59 8695,6
1,32 93,41 123,30 1,74 8725,4
1,43 94,98 135,82 2,04 9021,2
0,95 87,33 82,96 0,90 7626,5
23,92 1843,21 2214,657 29,2892 170044,5
a) Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

Pureza vs % hidrocarburos
102
100
98
y = 14,947x + 74,283
96
R² = 0,8774
Pureza

94
92
90
88
86
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8
% de Hidrocarburos

El tipo de asociación entre las variables es de dispersión lineal ascendente con una
correlación positiva alta.

b) Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. ¿Es confiable?

Y= a + b

X Y= 14,947X + 74,283

R² = 0,8774

La ecuación de la recta es confiable porque el coeficiente de la determinación (R2) está


cercano a 1 y tiene una correlación excelente.
c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos
variables.

Primero hallamos las variables a y b

20∗2214,657−(23,92)(1843,21) 203,56
b= = = 15,15
20∗29,28−(23,92)2 13,44

1843,21 −(15,15∗23,92) 1480,8


a= = = 74,04
20 20

Media de X

X = 23,92/20 = 1,19

Media de Y

Y = 1843,21/20 = 92,16

La ecuación de la recta está dada por:

Y = 15,15X + 74,04

Error estándar de la recta:

170044,5−(74,04)(1843,21)−(15,15)(2214,65) 21,29
Se = √ =√ = √1,18 = 1.09
20−2 18

Se halla el coeficiente de determinación y el coeficiente de correlación

170044,5
S²y= − (92,16)2 = 8.76
20

1,09
R²= 1 - = 0,87 r = √𝑅² = 0,93
8,76

El grado de relación de las variables es de 0,93


d) ¿Cuál es el porcentaje de hidrocarburo cuando la pureza del oxígeno es igual a
51,4?

𝑦 = 14,947𝑥 + 74,283

𝑦 − 74,287
𝑋=
14,947

Reemplazando:
51,4−74,287
𝑋= = −1,53
14,947

Cuando la pureza del oxígeno es igual a 51,4, el porcentaje de hidrocarburo es de -1,53%

2. El número de libras de vapor (y) consumidas mensualmente por una planta química,
se relaciona con la temperatura ambiental promedio (en o F). Para el año 2015, se
registraron los siguientes valores de temperatura y consumo anual.

X Y
Mes XY X² Y²
Temperatura (°F) Consumo de vapor (Lb)

Ene. 21 185,79 3901,59 441 34517,92

Feb. 24 214,47 5147,28 576 45997,38

Mar. 32 288,03 9216,96 1024 82961,28

Abr. 47 424,84 19967,48 2209 180489

May. 50 455 22750 2500 207025

Jun. 59 539 31801 3481 290521

Jul. 68 621,55 42265,4 4624 386324,4

Ago. 74 675,06 49954,44 5476 455706

Sep. 62 562,03 34845,86 3844 315877,7

Oct. 50 452,93 22646,5 2500 205145,6

Nov. 41 369,95 15167,95 1681 136863

Dic. 30 273,98 8219,4 900 75065,04

558 5062,63 265883,86 29256 2416493,37


a) Realice el diagrama de dispersión y determine el tipo de asociación entre las
variables.

2015 Registros de temperatura y consumos de vapor.


800
700
y = 9,2087x - 6,3184
Consumo de vapor (lb)

600
R² = 0,9999
500
400
300
200
100
0
0 10 20 30 40 50 60 70 80
Temperatura (°F)

El tipo de asociación entre las variables es de dispersión lineal ascendente con una
correlación positiva alta.

b) Encuentre un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?

y=9,2087x-6,3184
R² = 0,9999

La ecuación de la recta es confiable porque el coeficiente de la determinación (R2) está


cercano a 1 y tiene una correlación excelente.

c) Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

Se halla a y b

12∗265883,86−(558)(5062,63) 365658,78
𝑏= 2 = 39708
= 9,21
12∗29256−(558)

5062,63 −(9,21∗558) −76,55


𝑎= 12
= 12
= −6,4
Media de X
X = 558/12 = 46,5

Media de y
Y = 5062,63/12 = 421,88

La ecuación de la recta está dada por:

Y = 9,21X – 6,4

Error estándar de la recta:

2416493,37−(−6,4)(5062,63)−(9,21)(265883,86) 103,8514
Se = √ =√ = 3,22
12−2 10

R²= 0,99 r = √𝑅² = 0,99

El grado de relación entre las dos variables es de 0,99

La correlación entre las dos variables, temperatura °F vs consumo de vapor en LB,


es excelente.
3. Los investigadores están estudiando la correlación entre la obesidad y la respuesta
individual al dolor. La obesidad se mide como porcentaje sobre el peso ideal (x). La
respuesta al dolor se mide utilizando el umbral de reflejo de reflexión nociceptiva (y)
que es una medida de sensación de punzada. Obsérvese que ambas, X e Y, son
variables aleatorias.

X Y
(% de (Umbral de reflejo de XY X² Y²
Sobrepeso) flexión Nociceptiva)
89 2 178 7921 4
90 3 270 8100 9
75 4 300 5625 16
30 4,5 135 900 20,25
51 5,5 280,5 2601 30,25
75 7 525 5625 49
62 9 558 3844 81
45 13 585 2025 169
90 15 1350 8100 225
20 14 280 400 196
627 77 4461,5 45141 799,5

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

% de sobrepeso VS umbral de reflejo de


flexión nociceptiva
16
y = -0,0629x + 11,642
UMBRAL DE REFLEJO DE FLEXIÓN

14
R² = 0,1115
12
NOCICEPTIVA)

10
8
6
4
2
0
0 20 40 60 80 100
% DE SOBREPESO
𝑅 2 = 0,1115 ∗ 100 = 11,15% → Porcentaje de Explicación
𝑟 = √0,1115 = 0,3339

𝑟 = 0,3339 → 𝐺𝑟𝑎𝑑𝑜 𝑑𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑑𝑜𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒

Esta ecuación no hace una buena estimación entre las variables debido a que el coeficiente
de determinación R2 explica solo 11,15% de la información y el valor del coeficiente de
correlación R confirma el grado de relación de la variable, que es el 33,39%

b. Ajuste un modelo matemático que permita predecir el efecto de una variable sobre
la otra. ¿Es confiable?

Y= -0,0629x + 11,642
R² = 0,1115

La ecuación de la recta no es muy confiable porque el coeficiente de la


determinación (R2) está cercano a 0 y tiene una correlación débil.

c. Determine el porcentaje de explicación del modelo y el grado de relación de las dos


variables.

77 −(0,007∗627) 72,611
𝑎= = = 6,601
11 11

11∗4461,5−(627)(77) 797,5
𝑏= = = 0,007
11∗45141−(627)2 103422

Media de X
X = 627/11 = 57

Media de y
Y = 77/11 = 7

La ecuación de la recta está dada por:

Y = 0,007X + 6,6

Error estándar de la recta:


799,5−(6,6)(77)−(0,007)(4461,5) 260,6
Se = √ =√ = 5,37
11−2 9

799,5
S²y= − (7)2 = 23,7
11

5,37
R²= 1 - 23,7 = 0,78 r = √𝑅² = 0,88

El grado de relación de las variables es de 0,88.

d. ¿Cuál es el umbral de reflejo de flexión nociceptiva, cuando hay un porcentaje de


sobrepeso, de 50?

Y= -0,0629x + 11,642

X = 50
Y= ¿?

Y= -0,0629 (50) + 11,642

Y= 8,497

Cuando el porcentaje de sobrepeso es de 40% el umbral de flexión nociceptiva es de


8,497.

Вам также может понравиться