Вы находитесь на странице: 1из 18

ACTIVIDAD 10

TRABAJO COLABORATIVO 2

PRESENTADO POR:

EDUARD YAMID GARZÓN MUÑOZ – C.C: 14.897.495

WILKINSON EXNEIDER GUISAO – C.C.

EDUARDO JAVIER LOPEZ VANEGAS – C.C.

DIEGO CARDONA – C.C: 15.439.615

GRUPO: 100105_22

TUTOR:

FRANCISCO CABRERA DIAZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)

ESTADISTICA DESCRIPTIVA

NOVIEMBRE DE 2014
INTRODUCCION

Los datos son la materia prima con que trabaja la estadística, puesto que la estadística se
ocupa de una gran cantidad de datos, debe primeramente definir de cuáles datos se va a
ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadístico se
llama población.
Los datos de la totalidad de una población pueden obtenerse a través de un censo. Sin
embargo, en la mayoría de los casos no es posible obtenerlos por razones de tiempo y
dinero, razón por la cual se extrae, de la población, una muestra, mediante un
procedimiento llamado muestreo. Se llama muestra a un subconjunto de la población,
preferiblemente representativo de la misma.
JUSTIFICACIÓN

Dentro de un proceso de investigación existen varias etapas, entre las cuales tenemos los
antecedentes históricos, y la recolección previa de la información de los conceptos a
estudiar; este material no será bien entendido si no se organiza y se presenta de una manera
clara y sencilla, por esto en el primer trabajo nos centramos en la herramienta más conocida
de la estadística, las gráficas y tablas.

Hay situaciones en las que no bastan las tablas y gráficas, por esto en la estadística existen
otras herramientas precisas, como son las medidas estadísticas univariantes y Bivariantes;
las cuales permiten el estudio de una serie de variables que se involucran en los cálculos
matemáticos. Además la estadística necesita de una serie de conceptos y propiedades
aritméticas y matemáticas.
Con el siguiente trabajo queremos mostrar cómo se aplican estas herramientas en la
interpretación de una investigación acerca de un estudio de la población, a partir de una
información previa.
OBJETIVOS

Realizar un muestreo, diseñar un experimento sencillo y recolectar datos de manera


apropiada.

Analizar los datos obtenidos de manera descriptiva y formular una interpretación de los
resultados.

Interpretarlas medidas de tendencia central y comprender sus aplicaciones.

Reconocer que las medidas de dispersión complementan la descripción que proporcionan


las medidas de tendencia central.

Interpretar y utilizar las medidas de dispersión.

Estimular y promover el trabajo en equipo.

Poner en práctica la estadística descriptiva mediante la resolución de los problemas


propuestos.
DESARROLLO

1. Realizar un mentefacto conceptual sobre las medidas de dispersión.

2. Una empresa despulpadora de fruta busca optimizar su producción de jugo de


mango. Para esto, inició un estudio en el cual midió los pesos en gramos de una
muestra.

76 85 92 70 65 90 98 99 78 97
84 102 77 94 109 102 104 105 100 102
90 83 74 91 87 88 90 96 94 92
68 69 79 82 96 100 102 107 98 93
104 76 83 108 67 100 102 98 99 130

Realizar la tabla de distribución de frecuencias para datos agrupados dado que la


variable es peso (cuantitativa continua), calcular varianza, desviación estándar y
coeficiente de variación. Interprete los resultados.
Primero organizamos los datos en orden ascendente

65 94
67 94
68 96
69 96
70 97
74 98
76 98
76 98
77 99
78 99
79 100
82 100
83 100
83 102
84 102
85 102
87 102
88 102
90 104
90 104
90 105
91 107
92 108
92 109
93 130

 Rango : 130-65 = 65
 Número de clases: Aplicando la regla de Sturges:
𝑘 = 1 + 3.322 𝑙𝑜𝑔50 = 6.64 ≈ 7

 Amplitud de los intervalos de clase

65
𝑨= = 9.28 ≈ 10
7

 Nuevo rango:

𝑅∗ = (10) ∗ (7) = 70
Existe un exceso de 5: (70-65). Procedemos a distribuir el exceso entre los
límites del rango. Como la mayoría de los datos se agrupan hacia el límite
inferior entonces el exceso mayor queda hacia éste.

𝑋𝑚𝑖𝑛 = 65 − 3 = 62
𝑋𝑚á𝑥 = 130 + 2 = 132

 Intervalos de clase:

62 + 9 = 71
72 + 9 = 81
82 + 9 = 91
92 + 9 = 101
102 + 9 = 111
112 + 9 = 121
122 + 9 = 131

 Límites reales:

61.5
71.5
81.5
91.5
101.5
111.5
121.5
131.5
Ahora ya podemos construir la tabla.

Intervalos de Frecuencia Frecuencia Frecuencia Frecuencia


clase peso en Relativa absoluta relativa
(gramos) acumulada acumulada
61.5 – 71.5 5 10% 5 10%
71.5 – 81.5 6 12% 11 22%
81.5 – 91.5 11 22% 22 44%
91.5 – 101.5 16 32% 38 76%
101.5– 111.5 11 22% 49 98%
111.5–121.5 0 0%
121.5 –131.5 1 2% 50 100%
Total 50 100%
Calcular varianza: Para datos agrupados

∑ 𝑓∙𝑋 2
− 𝑥̅ 2
𝑆 2= 𝑛

Peso (gramos) frecuencia 𝑓∙𝑋 𝑋2 𝑓 ∙ 𝑋2


65 1 65 4225 4225
67 1 67 4489 4489
68 1 68 4624 4624
69 1 69 4761 4761
70 1 70 4900 4900
74 1 74 5476 5476
76 2 152 5776 11552
77 1 77 5929 5929
78 1 78 6084 6084
79 1 79 6241 6241
82 1 82 6724 6724
83 2 166 6889 13778
84 1 84 7056 7056
85 1 85 7225 7225
87 1 87 7569 7569
88 1 88 7744 7744
90 3 270 8100 24300
91 1 91 8281 8281
92 2 184 8464 16928
93 1 93 8649 8649
94 2 188 8836 17672
96 2 192 9216 18432
97 1 97 9409 9409
98 3 294 9604 28812
99 2 198 9801 19602
100 3 300 10000 30000
102 5 510 10404 52020
104 2 208 10816 21632
105 1 105 11025 11025
107 1 107 11449 11449
108 1 108 11664 11664
109 1 109 11881 11881
130 1 130 16900 16900
Total 50 4575 270211 427033
Media aritmética

4575
𝑥̅ = = 91.5
50

𝑥̅ 2 = (91.5)2 = 8372.25

Varianza

427033
𝑆 2= 50
− 8372.25 = 168.41

Desviación estándar

∑ 𝑓 ∙ 𝑋2
𝑠=√ − 𝑥̅ 2
𝑛

𝑠 = √168.41 = 12.97

Coeficiente de Variación

𝑠
CV = ∗ 100
𝑥̅

12.97
CV = ∗ 100 = 14.17%
91.5
3. Un empleado de la empresa de acueducto de la ciudad de Cartagena, realiza un
estudio sobre los reclamos realizados en los 2 últimos años, para ello elige una
muestra de 60 personas, con los siguientes resultados:

Nº Reclamaciones 0 1 2 3 4 5 6 7

Nº De usuarios 26 10 8 6 4 3 2 1

Calcular:

a. El promedio de reclamos.

28
X= = 0,46
60

b. La varianza y su deviación típica.

∑ x2
S2 = − x2
n
115,8
𝑆2 = = 1,93
60
Deviación típica

∑(X − x 2 )
S=√ − x2
n
115,8
S=√ = 1,389
60

c. El coeficiente de variación
S
CV = ∗ 100%
X
1,389
CV = ∗ 100 = 301,9
0,46
4. Ingresar al blog de Estadística Descriptiva que se encuentra en la página principal
del curso en el TOPICO DE CONTENIDOS, posteriormente buscar el
LABORATORIO (REGRESIÓN Y CORRELACIÓN LINEAL –EXCELL) y
realizar los ejercicios 2 y 3 que se encuentra al final del laboratorio.

Ejercicio 4.2.
En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado,
se ha considerado que era importante ir anotando periódicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza y el número de días desde
que empezó dicho proceso de fabricación. Con ello, se pretende analizar cómo los
operarios van adaptándose al nuevo proceso mejorando paulatinamente su proceso
de producción.
Los siguientes datos representan dicha situación:
X 10 20 30 40 50 60 70
Y 35 28 23 20 18 15 13

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.
b. Encuentre el modelo matemático que permite predecir el efecto de una variable
sobre la otra. Es confiable ?.
c. Determine el porcentaje de explicación del modelo y el grado de relación entre
las dos variables.
d. Que tiempo debería tardase un empleado cuando llevan 100 días?

Diagrama de dispersión

Diagrama de Dispersion
40
Tiempo de fabricación (minutos)

35 10; 35
30
20; 28
25
30; 23
20 40; 20
50; 18
15 60; 15 Series1
70; 13
10
5
0
0 20 40 60 80
Dias de fabricación
Ecuación del modelo matemático:

Diagrama de Dispersion
40

Tiempo de fabricación (minutos)


35 10; 35 y = -0,3464x + 35,571
30 R² = 0,9454
20; 28
25
30; 23
20 40; 20
50; 18 Series1
15 60; 15
70; 13 Lineal (Series1)
10
5
0
0 20 40 60 80
Dias de fabricación

De acuerdo a los resultados, podemos observar que la ecuación de la recta es


una muy buena apreciación de la relación entre las dos variables siendo muy
confiable.
El 𝑅2 afirma que el modelo matemático explica el 94.54% de la información, lo
que es un valor alto.
El valor de coeficiente de correlación lineal confirma el grado de relación entre
las dos variables con un porcentaje del 97% . (√𝑅2 ).

Para saber cuánto tiempo tardaría un empleado en fabricar una pieza cuando
hayan transcurrido 100 días empleamos la ecuación del modelo matemático:

𝑦 = −0.3464𝑥 + 35.571

𝑦 = −0.3464(100) + 35.571

𝑦 = 0.93 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

De acuerdo al resultado tardaría 0.93 minutos


Ejercicio 4.3:

Un nutricionista de un hogar infantil desea encontrar un modelo matemático que


permita determinar la relación entre el peso y la estatura de sus estudiantes.
Para ello selecciona 10 niños y realiza la medición respectiva.
A continuación se presentan los resultados:

Estatura 121 123 108 118 111 109 114 103 110 115
Cm
Peso 25 22 19 24 19 18 20 15 20 21
Kg

a. Realice el diagrama de dispersión y determine el tipo de asociación entre las


variables.

Diagrama de dispersión
30

25

20
PESO ( Kg)

15

10 Series1

0
100 105 110 115 120 125
ESTATURA ( cm)

b. Encuentre el modelo matemático que permite predecir el efecto de una


variable sobre la otra. Es confiable?
Diagrama de dispersión
30
y = 0,4212x - 27,377
25
R² = 0,8102
20

PESO ( Kg) 15
Series1
10
Lineal (Series1)
5

0
100 105 110 115 120 125
ESTATURA ( cm)

c. Determine el grado de relación de las dos variables.

El 𝑅2 afirma que el modelo matemático explica el 81.02% de la


información, lo que no es muy confiable.
El valor de coeficiente de correlación lineal confirma el grado de relación
entre las dos variables con un porcentaje del 90% . (√𝑅 2 ).

d. Cuál es el peso que debería tener un estudiante ce 130 cm?

El peso sería de acuerdo al modelo matemático de:

𝑦 = 0.4212 ∗ (130) − 27.377 = 27.379 Kg


5. A continuación Se presentan las ventas nacionales de móviles nuevos de
1992 a 2004 en la siguiente tabla. Obtenga un índice simple para las ventas
nacionales utilizando una base variable:

Año Ventas (millones $)

1992 8.8

1993 9.7

1994 7.3

1995 6.7

1996 8.5

1997 9.2

1998 9.2

1999 8.4

2000 6.4

2001 6.2

2002 5.0

2003 6.7

2004 7.6

Tomamos como base el primer año 1992 con el valor 8.8 y calculamos cada índice
anual como

Índice = Valor anual / 8.8 * 100

Obtenemos al aplicarlo:

1992 --> 8.8/8.8*100 = 100

1993 --> 9.7/8.8*100 = 110.23

1994 --> 7.3/8.8*100 = 82.95

1995 --> 6.7/8.8*100 = 76.14

1996 --> 8.5/8.8*100 = 96.59

1997 --> 9.2/8.8*100 = 104.55


1998 --> 9.2/8.8*100 = 104.55

1999 --> 8.4/8.8*100 = 95.45

2000 --> 6.4/8.8*100 = 72.73

2001 --> 6.2/8.8*100 = 70.45

2002 --> 5.0/8.8*100 = 56.82

2003 --> 6.7/8.8*100 = 76.14

2004 --> 7.6/8.8*100 = 86.36


CONCLUSIONES

Sin duda las medidas de dispersión en estadística descriptiva son una herramienta de gran
importancia, ya que nos dan más precisión cuando los datos no están uniformemente
distribuidos.

Las aplicaciones como Excel, son herramientas de software muy útiles para el manejo de
este tipo de datos estadísticos, además que nos permiten generar las gráficas y modelos
matemáticos que rigen las tendencias de los datos, proporcionándonos una idea más
avanzado de su comportamiento.

Los números índices nos proporcionan un concepto inmediato de la eficiencia de nuestros


negocios o nuestros productos, comparados con otros, ayudándonos a establecer metas para
mejorar o mantener esa eficiencia.
BIBLIOGRAFIA

Módulo de estadística descriptiva de la Unad

ORTEGON PAVA, Milton Fernando. Módulo Estadística Descriptiva. Ibagué.


UNAD. 2010

Вам также может понравиться