Вы находитесь на странице: 1из 17

ESTADISTICA DESCRIPTIVA

TRABAJO COLABORATIVO MOMENTO 2

GRUPO 100105_11

EDWIN DIDIER AGUDELO


JORGE ANDRES GOMEZ
JOHANNA LISSETH MORALES

TUTOR
ASTRID SEGURA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


MAYO DE 2016
BOGOTA D.C
INTRODUCCIN

En el presente trabajo tienen como finalidad el estudio y anlisis de la unidad 2 que


contiene los temas de; Medidas Estadsticas Univariantes, se continua con el
ejercicio anterior por lo que se realizara una primera actividad que consiste en
identificar las variables Discretas y continuas tomadas de la base de datos de la
Secretaria de Transito de Medelln, de las cuales escoge una variable
discreta(nmero de heridos) , se realiza la tabla de distribucin de frecuencias para
datos no agrupados y se calculan las medidas de tendencia central como Media,
Mediana, moda, Deciles 5 y 7, Cuartiles y Percentiles 30 y 50, y una variable
continua ( velocidad), se realiza la respectiva tabla de frecuencias para datos
agrupados, se calculan las medidas de tendencia central Media, Mediana, moda,
Deciles 5 y 7, Cuartiles y Percentiles 50 y 75 igualmente la respectiva interpretacin
de los resultados.

JUSTIFICACION

Con el presente trabajo colaborativo se busca un aprendizaje significativo en el


clculo e interpretacin de las medidas univariantes de tendencia central y de
dispersin para variable discreta con ejercicio prctico al analizar los datos
suministrados por la secretaria de transito de Medelln. Con el objetivo se identificar
las relacin entre los datos suministrados y como presentar dicha informacin
recogiendo varias caractersticas influyentes en el caso de estudio.
OBJETIVOS

Objetivo General: Adquirir habilidades para identificar las medidas de tendencia


central y dispersin y precisar sus conceptos y anlisis, aplicando sus diferentes
maneras de agrupar la informacin, en relacin a los datos obtenido.

Objetivos Especficos:

Conocer cada uno de las medidas de tendencia central- medidas de


dispersin.

Analizar la base de datos proporcionada para realizar la propuesta de


solucin.

Dar solucin y desarrollo a la gua del momento 2


Generar nuevos conocimientos sobre los datos obtenidos en una
investigacin.
Comprender cmo puede la estadstica descriptiva ayudarnos a analizar
datos e informacin arrojndonos resultados significativos y entendibles

TRABAJO COLABORATIVO MOMENTO 2

1. De acuerdo a la informacin dada sobre la Secretaria de Trnsito de


Medelln, se puede decir que las variables discretas que aparecen en el
estudio, son:
Edad, nmero de heridos, nmero de muertos, costo estimado del siniestro
y velocidad.

Ahora se van a calcular la media, la mediana y la moda para datos no


agrupados. A continuacin se tiene algunos de los datos dados por la
Secretara de Trnsito de Medelln, pero se tuvieron en cuenta todos para
realizar los clculos.
Edad (aos)
17 Media = 37,01
17 Mediana= 36
17 Moda= 46
17
17
18
18
18
18

numero de heridos
0
0 Media= 2,75
0 Mediana= 2
0 Moda= 2
0
0
0
0
0

Numero de muertos
0
0 Media= 0,86
0 Mediana= 1
0 Moda= 1
0
0
0
0
0

Para m, creo que el nmero de muertos es la variable ms relevante, ya que


el nmero de muertos es lo que determina la gravedad del accidente, porque
entre ms muertos existan, se genera mayor gasto para el Estado y hay
mayor impacto social en las familias afectadas.
Primero se hace la tabla de frecuencias para datos no agrupados.

Numero de muertos fi Fi % Xi.fi


0 47 47 39,17 0
1 48 95 40,00 48
2 21 116 17,50 42
3 3 119 2,50 9
4 1 120 0,83 4
Total 103

Veamos algunos grficos, el de barras y el circular.

N de Accidentes segun el numero de


muertos
47 48

21

3 1

0 1 2 3 4
Porcentaje de accidente de acuerdo
al numero de muertos
2,5% 0,83%

17,5%

39,17%

40%
0 1 2 3 4

Ahora se calcula la media, mediana y moda, adems los cuartiles, el decil 5


y 7, as los percentiles 30 y 50.

103
La media = =1 = 120 = 0,86 luego = 0,86

1+1
La mediana = =1 luego = 1
2

La moda = 1

El primer cuartil es el dato que se encuentra en la posicin n=120/4=30, luego


Q1= 0, el segundo cuartil se encuentra en la mitad, es decir Q2 = 1 y el tercer
cuartil se encuentra en la posicin 90, o sea que Q3 = 1.

Ahora se hallan los deciles 5 y 7, o sea los que se encuentran en la posicin


n= 5x120/10=60, luego D5 = 1 y el decil 7 se encuentra en la posicin 84, o
sea D7 = 1.

Siguiendo con los percentiles, el percentil 50, se encuentra en la posicin 60,


luego P50 = 1 y el percentil 30 se encuentra en la posicin 36, es decir D 30 =
0.
Con base en los resultados obtenidos, se puede decir que el 70% de los
accidentes de trnsito, dejan como saldo entre 0 y 1 muerto, el 30% de los
accidentes de trnsito, no dejan muertos que lamentar. Tambin se puede
concluir que entre el 39,17% y el 79,16% de los accidentes de trnsito dejan
como saldo un muerto y que tan solo el 3,33% de los accidentes de trnsito
dejan ms de dos muertos.

Una variable continua es el grado de alcoholemia del conductor.

Se va a elaborar la tabla de frecuencia para datos agrupados, teniendo en


cuenta los pasos dados en el video.

Nmero de clases Linf Lsup Marca de clase(X) Frecuencia abs(f) Frecuencia acum X.f
1 0 0,43 0,215 24 24 5,16
2 0,43 0,86 0,645 21 45 13,545
3 0,86 1,29 1,075 13 58 13,975
4 1,29 1,72 1,505 15 73 22,575
5 1,72 2,15 1,935 13 86 25,155
6 2,15 2,58 2,365 10 96 23,65
7 2,58 3,01 2,795 24 120 67,08
120 171,14

Ahora se hace el histograma de frecuencias y el polgono de frecuencias

HISTOGRAMA DE FRECUENCIAS
30

25
NMERO DE ACCIDENTES

20

15

10

0
0-0,43 0,43-0,86 0,86-1,29 1,29-1,72 1,72-215 2,15-2,50 2,58-3,01
GRADO DE ALCOHOL DEL CONDUCTOR
30.00

25.00

20.00

15.00

10.00

5.00

0.00
0.215 0.645 1.075 1.5 1.935 2.365 2.795

Series2

Polgono de frecuencia

Las medidas de tendencia central, se obtuvieron mediante las formulas


dadas en el video y se utiliz Excel y los resultados son los siguientes:

Media 1,43
Mediana 1,35
moda 0,89
Segn los datos obtenidos, se tiene que la distribucin es sesgada a la
derecha o tiene una asimetra positiva.

Los cuartiles son los siguientes:

Qk=Lk +(kn/4-Fk-1)xA/fk

Q1= 0,43 + (30-24) x0, 43/21=0,43+0,12= 0,55 luego Q1=0,55

Q2=1,35 es la misma mediana

Q3= 2,15 + (90-86) x0, 43/10= 2,15+0,17=2,32 luego Q3=2,32

Siguiendo con los deciles, se tiene

Dk=Lk +(kn/10-Fk-1)xA/fk

El decil quinto es la misma mediana, o sea D5= 1,35


El decil 7 es:

D7 = 1,72 + (84-73)x0,43/ 13 = 1,72 + 0,47=2,19 luego D7 = 2,19

Por ltimo el percentil est dado por:

Pk=Lk +(kn/100-Fk-1)xA/fk

P25= Q1= 0, 55 y P50= Q2= 1.35

Se puede decir que el 25% de los conductores que generan accidentes de


trnsito, tienen un grado de alcohol entre 0 y 0,55 entre 2,32 y 3.

En promedio el grado de alcohol de los conductores accidentados es de 1,43.


Tambin el 70% de los conductores accidentados tiene un nivel o grado de
alcohol entre 0 y 2,19.

2. LAS MEDIDAS DE DISPERSION

A. Las variables discretas son: Edad, nmero de heridos, nmero de


muertos, el costo del siniestro y la velocidad. En nuestro caso solo vamos
a calcular el rango y la desviacin estndar para cada variable. En las
tablas aparecen solo unos cuantos datos, pero para los clculos
utilizamos toda la informacin enviada, de la Secretaria de Trnsito.
edad
17
17 Rango 43
17 Desviacion estndar 12,67
17
17
18
18
18
18
18
19
19
19
19
21
21
21
21
21
21
Numero de heridos
3
2 Rango 18
1 Desviacion estandar 2,74
2
8
0
0
4
2
6
4
1
2
0
2
2
3
4
2
5
2
4

Numero de muertos
0
1
1 Rango 4
0 Desviacion estandar 0,85
0
2
1
2
0
1
0
3
1
2
1
0
0
1
1
1
0
2
Costo
$ 10.452.553,00
$ 77.151.050,00
$ 52.738.121,00 Rango $ 95.900.208,00
$ 95.079.286,00 Desviacion estandar 29111380,50
$ 94.261.384,00
$ 5.895.287,00
$ 6.016.187,00
$ 7.605.984,00
$ 8.340.294,00
$ 28.118.123,00
$ 23.061.916,00
$ 87.052.027,00
$ 61.724.694,00
$ 9.761.496,00
$ 7.139.147,00
$ 3.757.786,00
$ 2.990.175,00
$ 74.482.579,00
$ 34.431.668,00
$ 6.540.997,00
$ 33.178.748,00
$ 6.166.393,00

Velocidad
66
111
66 Rango 117
80 Desviacion estandar 17,65
75
66
45
88
55
70
105
88
69
48
70
83
138
68
Ahora vamos a escoger como variable de estudio, el nmero de heridos le
vamos a hallar el rango, varianza, desviacin tpica y coeficiente de
variacin. Adems se van a interpretar los resultados obtenidos y asociarlos
con el problema objeto de estudio.

Numero de heridos
3
2 Rango 18
1 Desviacion estandar 2,74
2 Varianza 7,48
8 Coeficiente de variacin 99,5%
0
0
4
2
6
4
1
2
0
2

La diferencia entre el mayor numeros de heridos y el menor numeros de


heridos en accidentes de trnsito es 18.

Como las medidas de dispersin son muy altas se puede afirmar que los
datos estn muy dispersos respecto a la media, o sea que la informacin
proviene de una distribucin no homognea y por tanto el promedio de
numeros de heridos de 2,75 no es representativo, en el estudio realizado.

Se toma una variable continua, que viene siendo el grado de alcohol de los
conductores accidentados, tambin vamos a hallar el rango, varianza,
desviacin tpica y coeficiente de variacin. Adems se van a interpretar los
resultados obtenidos y asociarlos con el problema objeto de estudio.
Nmero de clases Linf Lsup Marca de clase(X) Frecuencia abs(f) Frecuencia acum X.f (x-(X ) )2 f.(x-(X ) ) 2
1 0 0,43 0,215 24 24 5,16 1,48 35,43
2 0,43 0,86 0,645 21 45 13,545 0,62 12,94
3 0,86 1,29 1,075 13 58 13,975 0,13 1,64
4 1,29 1,72 1,505 15 73 22,575 0,01 0,08
5 1,72 2,15 1,935 13 86 25,155 0,26 3,32
6 2,15 2,58 2,365 10 96 23,65 0,87 8,74
7 2,58 3,01 2,795 24 120 67,08 1,86 44,72
120 171,14 106,87

Rango 3
Varianza 0,89
Desv estan 0,943697515096866
Coef de var 66,17

La diferencia entre el conductor con mayor grado de alcohol y el menor grado


de alcohol es 3.

Como las medidas tienen un valor pequeo, con relacion a los datos
podemos decir que no existe diferencia significativa entre los niveles o grado
de alcohol de los conductores accidentados en la ciudad de Medelln,
adems se puede que la informacin viene de una distribucin homognea y
que el promedio del nivel de alcohol de 1,43 es significativo.
CONCLUSIONES

Con el presente trabajo realizado se evidencia los diferentes clculos delas medidas
de univariantes de dispersin de acuerdo a la informacin de la secretaria de
transito de Medelln.

Conocer las formas de calcular: rango, varianza, desviacin tpica y coeficiente de


variacin. Interpretar los resultados obtenidos y asociarlos con el problema objeto
de estudio.

Identificar las variables discretas dentro del problema de estudio y calcular las
medidas univariantes de tendencia central ms adecuadas, a aquellas que
consideren sean relevantes para el problema de estudio
BIBLIOGRAFIA

Leccin 2. Anlisis Univariado UNAD.(2016) Recuperado de


http://datateca.unad.edu.co/contenidos/401533/2014-
1/modulo2014/leccin_2_anlisis_univariado.htmlJ

Anlisis de Datos Unidimensionales (2005) Estadstica descriptiva y


nociones de probabilidad, Recuperado de
http://campus03.unad.edu.co/ecbti04/mod/lesson/view.php?id=16804&p
ageid=4709

Jse Maria Montero Lorenzo. Madrid: Paraninfo, 2007. Caractersticas de


Una Distribucin de Frecuencias,

Marta Garca Secades. 3rd ed. Madrid: Paraninfo, 2004, Dispersin


Introduccin a la estadstica econmica y empresarial: Teora y prctica

Tareas plus (2013 enero 03) Medidas de dispersin: rango, desviacin


media, varianza y desviacin estndar, recuperado de
https://www.youtube.com/watch?v=wm6maUOPmfY

Вам также может понравиться