Академический Документы
Профессиональный Документы
Культура Документы
INTEGRANTES:
GRUPO:
511004_3
TUTORA:
UNAD
Introducción
Las medidas de tendencia central son medidas estadísticas que resumen en un solo valor a un
conjunto de valores; las más utilizadas son: la media, la mediana y la moda. Las medidas de
dispersión por su parte miden el grado de dispersión de los valores de la variable, es decir pretenden
evaluar en qué medida los datos difieren entre sí; entre estas se cuentan el recorrido, la desviación
media, la varianza y la desviación típica. Ambos tipos de medidas usadas en conjunto permiten
En este trabajo se profundizan los conceptos de regresión lineal, medidas de dispersión, correlación
Objetivo Especifico
Regresión lineal: El análisis de regresión lineal es una técnica estadística utilizada para
estudiar la relación entre variables. Se adapta a una amplia variedad de situaciones. ... En
física se utiliza para caracterizar la relación entre variables o para calibrar medidas.
*Un rectángulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de la caja
una línea indica dónde se encuentra la mediana (segundo cuartil Q2).
*Dos brazos, uno que empieza en el primer cuartil y acaba en el mínimo, y otro que empieza
en el tercer cuartil y acaba en el máximo.
*Los datos atípicos (o valores extremos) que son los valores distintos que no cumplen
ciertos requisitos de heterogeneidad de los datos.
La varianza se define como el cociente entre la suma de los cuadrados de las desviaciones
de los valores de la variable y el número de datos del estudio. Matemáticamente, se expresa
como:
La regresión lineal es una técnica estadística que permite estudiar la relación entre una
variable dependiente y una o más variables independientes, con el fin de averiguar en que
medida la primera puede estar explicada por la segunda y obtener predicciones en la
variable dependiente a partir de las independientes. El procedimiento implica, básicamente,
obtener la ecuación mínimo cuadrática que mejor expresa la relación entre las variables y
estimar mediante el coeficiente de determinación la calidad de la ecuación de regresión
obtenida.
Medidas de dispersión:
Las medidas de dispersión son las que se encargan de mostrar la variable de una distribución
teniendo como herramienta principal o como base un número, teniendo en cuenta que esto se da si
las puntuaciones de la variable están alejadas de la media.
Hay que tener en cuenta que entre más alejado estén las puntuaciones de la media mayor será la
variabilidad y viceversa.
Regresión lineal:
También conocido como ajuste lineal, este modelo matemático se basa en aproximar la relación
que existe entre las variables independientes y las variables dependientes. Teniendo en cuanta que
las variables dependientes son la y y las variables independientes son Xi y un término aleatorio ε.
Correlación lineal:
La correlación lineal tiene que ves con el estudio que se hace a la relación que existe entre una
variable dependiente y una o más variables independientes para así saber en qué medida la variable
dependiente está declarada o expresada por la segunda.
Diagrama de cajas:
Los diagramas de Caja-Bigotes son una presentación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
X ̅
𝑿 ̅
𝑿−𝑿 ̅ )𝟐
(𝑿𝟏 − 𝑿
𝑿𝟏 26 5,55 30,80
𝑿𝟏 0 -20,45 418,20
245,4
𝑥̅ =
12
𝑥̅ = 20,45
Varianza:
∑(𝑋1 − 𝑋̅)2
S2 =
𝑛−1
1036,33
S2 =
12 − 1
1036,33
S2 =
11
𝐒 𝟐 = 𝟗𝟒, 𝟐𝟏
La desviación típica:
∑(𝑋1 − 𝑋̅)2
𝜎=√
𝑛
1036,33
𝜎=√
12
𝜎 = √86,36
𝝈 = 𝟗, 𝟐𝟗
Desviación media:
∑(𝑋1 − 𝑋̅)
𝐷. 𝑀 =
𝑛
97,7
𝐷. 𝑀 =
12
𝑫. 𝑴 = 𝟕, 𝟖𝟎
Tarea 2:
En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de una gran
Años de Número de
experiencia empleados
0-1 8
1-2 34
2-3 56
3-4 76
4-5 82
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3
Para esta muestra halle:
a. Dibuje el histograma
b. Media
c. Mediana
d. Moda
e. Varianza
f. Desviación típica
experiencia.
Tabla De Frecuencia
N 12
Clase limite inf limite sup mi ni Ni fi Fi
X min 3
1 3 20 23 6 6 1 1
X max 82
2 20 37 58 3 9 0 1
Rango 79
3 37 55 92 0 9 0 1
K 5
4 55 72 126 1 10 0 1
W 17
5 72 89 161 2 12 0 1
Histograma
Histograma
1
0
0
0
23 58 92 126 161
Media 30
Mediana 22
Moda 8
Varianza
Desviación típica
√(30 − 8)2 + (30 − 34)2 + (30 − 56)2 + (30 − 76)2 + (30 − 82)2 + (30 − 25)2 + (30 − 10)2 + (30 − 27
12
√(22)2 + (−4)2 + (−26)2 + (−46)2 + (−52)2 + (5)2 + (20)2 + (3)2 + (18)2 + (22)2 + (11)2 + (27)2
12
√−2936
12
√−244,6
−𝟒𝟗, 𝟒𝟓𝟕
experiencia.
Tarea 3:
La siguiente tabla refiere a los usos más comunes citados en una encuesta realizada a usuarios de
ordenadores de pequeñas y medianas empresas.
Área Respuesta
Contabilidad 26%
Procesadores de texto 15%
Hojas de calculo 24%
Bases de datos 13%
Puntos de venta 10%
Información 4%
Otros 8%
Hallar:
a) Media
b) Mediana
c) Moda
d) Varianza
e) Desviación típica
f) Realizar el histograma correspondiente a los datos.
Solución:
a) Hallar la media
b) Hallar la mediana
Organizamos los valores de menor a mayor
4%,8%,10%,13%,15%,24%,26%
Entonces tachamos los extremos de cada lado hasta obtener los dos números del centro para
hallar la mediana
13% es la mediana
c) Hallar la moda
d) Hallar la varianza
x
𝒙𝟏 26%
𝒙𝟐 15%
}𝒙𝟑 24%
𝒙𝟒 13%
𝒙𝟓 10%
𝒙𝟔 4%
𝒙𝟕 8%
∑ 100%
x x x- x (𝒙 − 𝒙𝟐 )
𝒙𝟏 26% 11,72 484
𝒙𝟐 15% 0.72 0.5184
𝒙𝟑 24% 9.72 94.4784
𝒙𝟒 13% -1.28 1.6384
𝒙𝟓 10% -4.28 18.3184
𝒙𝟔 4% -10.28 105.6784
𝒙𝟕 8% -6.28 39.4384
Tarea 4:
Una compañía asigna diferentes precios a un equipo de sonido particular en ocho regiones
diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los precios
correspondientes (en miles de pesos).
Ventas 402 381 350 430 441 380 405 420 421
Precio 45 66 70 90 75 45 65 70 65
a) Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se
ajuste.
b) Determinar las ventas si el precio es de 55, 58, 68, y 70 miles de pesos.
c) Determinar R y dar una interpretación
Solución
X(precio) Y(ventas) 𝒙𝟐 x.y
45 402 2025 18090
66 381 4356 25146
70 350 4900 24500
90 430 8100 38700
75 441 5625 33075
45 380 2025 17100
65 405 4225 26325
70 420 4900 29400
65 421 4225 27365
Total 591 3630 40381 239701
Para encontrar y= mx + b
9(239701)−(591)(3630)
M= 9(40381)−(591)2
M= (2157309) − (2145330)
(363429)-(349281)
M= 11979
14148
M= 0,84669
Media de x = 591 / 9
X= 65,666
Media de y = 3630 / 9
y= 403,333
1331
R= 2 2
√1572 √6612
1331
R= (39,648)(81,314)
1331
R= 3224,056
R= 0,412
Tarea 5:
El dato de la siguiente tabla representa las alturas (X) cm. y los pesos (Y) kg. de varios hombres.
a) Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.
b) Determinar el peso si la altura es de 150, 153 y 175 cm.
c) Determinar R y dar una interpretación
Solución
x (m) y (Kg) x2 y2 x.y
13,58 457,5
𝑥̅ = 𝑦̅ =
8 8
𝑥̅ = 1,70 𝑦̅ = 57,19
23,44
𝜎𝑥 2 = − (1,70)2 = 2,93 − 2,89 = 0,04
8
27163,25
𝜎𝑦 2 = − (57,19)2 = 3395,41 − 3270,70 = 124,71
8
Se calcula la covarianza:
780,75
𝜎𝑥𝑦 = − (1,70)(57,19) = 97,59 − 97,22 = 0,37
8
0,37
𝑦 − 57,19 = (𝑥 − 1,70)
0,04
𝑦 − 57,19 = 9,25𝑥 − 15,72
𝒚 = 𝟗, 𝟐𝟓𝒙 + 𝟒𝟏, 𝟒𝟕
𝑦 = 9,25𝑥 + 41,47
𝑦 = 9,25(1,50) + 41,47
𝒚 = 𝟓𝟓, 𝟑𝟒 𝑲𝒈
𝑦 = 9,25𝑥 + 41,47
𝑦 = 9,25(1,53) + 41,47
𝒚 = 𝟓𝟓, 𝟔𝟐 𝑲𝒈
𝑦 = 9,25𝑥 + 41,47
𝑦 = 9,25(1,75) + 41,47
𝒚 = 𝟓𝟕, 𝟔𝟔 𝑲𝒈
23,44
𝜎𝑥 = √ − (1,70)2 = √2,93 − 2,89 = 0,2
8
27163,25
𝜎𝑦 = √ − (57,19)2 = √3395,41 − 3270,70 = 11,17
8
cuando una variable aumenta la otra también; la recta correspondiente a la nube de puntos
de la distribución es creciente; dado que el valor es cercano a cero, indica que la correlación
es débil.
Conclusión
También fue de gran ayuda cada actividad porque con ellas pudimos aplicar los conocimientos
adquiridos a lo largo de este tiempo académico.
Como grupo nos ayudamos muchísimos, todos aportamos al aprendizaje de nuestros compañeros
Referencias
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/GuiaSPSS/18reglin.pdf
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html
- Romero, E. (2016). Estadística para todos: análisis de datos; estadística descriptiva; teoría
Disponible en:
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?docID=11231145&p00
=Estadistica+descriptiva