You are on page 1of 19

CURSO ESTADISTICA DESCRIPTIVA

FASE INTERMEDIA MOMENTO DOS


TRABAJO COLABORATIVO

TUTOR:
ROBERTO MARIO DE LEN
GRUPO: 204040-53

ESTUDIANTES
IBETH IBEZ TORRES
ERLEIDYS ISABEL FLORES
MILEXANDRA LOPEZ
SILVANA MARGARITA ACEVEDO

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD


ESCUELA DE CIENCIAS SOCIALES ARTES Y HUMANIDADES PROGRAMA
PROGRAMA PSICOLOGA
CCVA-COROZAL

SINCELEJO, 17 DE ABRIL DE 2016

INTRODUCCIN

En el presente trabajo, podremos encontrar las actividades correspondientes a la unidad


dos, Medidas Estadsticas Univariantes, momento del curso Estadstica Descriptiva.
Se podr encontrar el primer punto de la actividad, una primera actividad (a) en la que el
grupo, identifica las variables Discretas y continuas de la base de datos de la Secretaria de
Transito de Medelln, de las cuales escogen las variables discretas (nmero de Muertos) y
variable continua (velocidad), con las cuales realiza las respectivas tabla de frecuencias para
datos no agrupados y datos agrupados respectivamente para cada caso, calculando las medidas
de tendencia central como Media, Mediana, moda, medidas de tendencia no central como
Deciles 5 y 7, Cuartiles y Percentiles 30 y 50, igualmente la respectiva interpretacin de los
resultados y asociacin con el problema en estudio.
Tambin se podr encontrar la actividad (b) del primer punto en la que con las variables

Continuas elegidas se disea una tabla de frecuencia para datos agrupados y calculan las
medidas de tendencia central, los cuartiles, deciles 5, 7 y percentiles 50 y 75
Se podr encontrar adems, un segundo punto en el cual el grupo colaborativo realiza
clculos con las variables elegidas Discretas y Continuas, calcula las medidas univariantes
absolutas y relativas de dispersin para variables cuantitativas Discretas y Continuas como son
rango, varianza, desviacin tpica y coeficiente de variacin, igualmente la respectiva
Interpretacin de los resultados obtenidos y asociados con el problema objeto de estudio;
realizando las operaciones, tablas, diagramas, necesarios para llegar a un resultado.

JUSTIFICACIN
La estadstica descriptiva es una herramienta de gran importancia en cualquier proceso
de investigacin, ya sea de tipo cualitativo o cuantitativo, por lo que, la Estadstica Descriptiva
puede definirse como una ciencia que facilita los mtodos precisos para la obtencin de la
informacin numrica de base sino que, adems, proporciona mtodos objetivables de anlisis de
esa informacin recogida y, en general, mtodos de investigacin aplicables al resto de las
Ciencias Garca S. Martha (2005).
Por lo anterior es necesario entender, el concepto Medidas Estadsticas Univariantes, los
diferentes conceptos estudiados en el presente trabajo como son medidas de tendencia central,
medidas de posicin y medidas univariantes, para datos no agrupados y datos agrupados, las
cuales son indispensables para poder calcular datos relacionados con variables cualitativas
Discretas y Continuas, con el fin de poder aplicarlas al problema en estudio de este trabajo.
Igualmente, la aplicacin de estos conceptos en un problema real nos proporciona los
datos necesarios para poder entender determinada situacin en sus causas, efectos, y
probabilidades o alternativas de solucin, pues las medidas de posicin nos ayudan a fijar el
comportamiento de una variable a partir de los valores individuales de una tabla, las medidas de
tendencia central (media, mediana y moda), otras medidas son las de posicin no central
(cuartiles, deciles, percentiles), y las medidas de dispersin (Rango, Varianza, desviacin tpica
o estndar y coeficiente de variacin) determinan la variabilidad existente en los valores de la
variable, de all la importancia de entender y adquirir las destrezas tanto en lo relacionado con
los conceptos anteriores como en saber distinguir entre los datos cualitativos y cuantitativas,
variables discretas y continuas, y los diferentes tipo de medidas, para poder aplicarlos tanto en
nuestra formacin como futuros profesionales.

OBJETIVOS
Adquirir conocimientos relacionados con las Medidas Univariantes como son medidas
de tendencia central, medidas de posicin y de dispersin para variables discretas y continuas,
y aplicar esos conocimientos al problema en estudio.
Apropiarse de las variables discretas y continuas, tablas de frecuencias, mediante grficos
estadsticos descriptivos.
Identificar las medidas de tendencia central, media, mediana, moda, deciles, cuartiles y
percentiles, en las variables discretas y continuas, interpretar los resultados.
Adquirir destrezas y habilidades en lo relacionado con tablas de frecuencia para variables
discretas y continuas, clculo de medidas de tendencia central como media, mediana y moda,
medidas de posicin como cuartiles deciles y percentiles, y medidas univariantes absolutas y
relativas, como rango, varianza, desviacin tpica y coeficiente de variacin; de acuerdo a los
datos estipulados y las variables seleccionadas por cada uno de los integrantes del grupo, lo cual
nos servir en futuro, para aplicarlo en los diversos campos de aplicacin de nuestra profesin.

PRIMER PUNTO
A) A partir de la base de datos, identificamos las siguientes Variables Discretas
dentro del problema en estudio.

a) Se identifican las variables Discretas:

VARIABLES

DISCRETA

Nmero de accidentes

Nmero de heridos

Nmero de muertos

* Se escoge la variable para realizar los clculos solicitados:

VARIABLES
Nmero de muertos

DISCRETA
x

Se realiza la siguiente tabla de distribucin de frecuencias


datos no agrupados

Tabla de distribucin de frecuencias datos no agrupados de la variable


nmero de muertos

Xi
0
1

fi
47
48

Fr
47/120=0,39
48/120=0,4

F acumulada
47
95

2
3
4
total

21
3
1
120

21/120=0,175
3/120= 0,025
1/120=8,3 x 103

116
119
120

Recopilacin de datos
Poblacin: principales causas que incrementan e (inciden) en el nmero de
accidentes de trnsito ocurridos entre los meses de Enero a Diciembre de 2015, en la
ciudad de Medelln ocasionados por carros, motos, busetas y tracto camiones, cuyos
conductores estn en edades entre 17 y 60 aos, gnero femenino y masculino.
Tamao de la muestra: 120 accidentes de trnsito ocurridos entre Enero y Diciembre
de 2015 en la ciudad de Medelln.
c) Calcular las medidas de tendencia central: media, mediana, moda
SE CALCULAN LAS MEDIDAD DE TENDENCIA CENTRAL ASI:
1. MEDIA
Es un tipo de promedio que se halla al dividir la suma de todos los datos de nmeros
dividido por la cantidad total de nmeros de ese conjunto

MEDIA:

x =

( 47 ) + ( 48 )+ ( 21 )+ ( 3 ) + ( 1 )
120

x=

100
120

La media es:

0,838333333

0,838333333

Interpretacin de los resultados: En promedio los 120 accidentes de trnsitos


ocurridos en Medelln durante el ao 2015; Podemos decir que aproximadamente se
presentan 0,83 muertos durante los accidentes de trnsito.
2. MEDIANA: La mediana es el valor que ocupa el lugar central entre todos los
valores del conjunto de datos
Mediana (es el dato central)
Mediana = 1
Interpretacin de los resultados: Despus de organizar los datos de menor a mayor
el nmero que queda en la posicin 60 es 1; dndonos a conocer que de los 120
accidentes ocurridos en la ciudad de Medelln durante los meses de Enero a Diciembre
del 2015;

3. Moda: La moda de un conjunto de datos es el dato que ms veces se repite, es decir,


aquel que tiene mayor frecuencia absoluta
Moda= 1 porque es el valor que ms se repite
Media

0,9

Mediana
Moda

1
1

Interpretacin de los resultados: Despus de observar los datos podemos concluir


que en los 120 accidentes que se presentan en la ciudad de Medelln la cantidad de
muertos que ms se presentan es 1 muerto.
d) Calcular las medidas de tendencia central los cuartiles, deciles 5, 7 y percentiles 30,
50 e interpretar sus resultados.
Cuartiles: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados
en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Q2 coincide con la mediana.

N: 120
Cuartiles: Q1,Q2, Q3
Formula:

KN
,K
4

=1,2,3.

Cuartil 1
N= 120
Q1 =?
kN
=
4

L=

1120
=30
4

Q1: 30
Q1:0

CUARTIL 2
Q2= ?
L=

KN
4

2120
4

= 60

Q2:60
Q2: 1
CUARTIL 3
Q3 = ?
L=

KN
4

3120
4

=90

Q3: 90
Q2: 1
Interpretacin de los resultados: Podemos concluir que en los 120 accidentes de
trnsito ocurridos en la ciudad de Medelln durante el ao 2015; el 25% de los
datos no se presentaron muertos y entre el 75% se presentaron entre 0 y 4
muertos.

Cuartil
Q1
Q2
Q3

POSICIN
30
60
90

VALOR
0
1
1

DECILES: Son los nueve valores que dividen la serie de datos en diez partes iguales.
DECILES 5 y 7
Formula:

KN
,K
10

=1,2,...9

D5= ?
N= 120
L=

KN
10

5120
10

= 60

7120
10

= 84

D5 = 1
D7 =?
L=

KN
10

D7 = 1

DECILES
POSICIN
D5
60
D7
84
Interpretaci del anlisis: El quinto decil, es aquel valor de la

VALOR
1
1
variable que supera al 50%

de las observaciones, es decir que la posicin 60 representa el D5, el cual representa tambin
a la mediana de los datos, por lo cual D5= 1.

El sptimo decil, es aquel valor de la variable que supera al 70% de las observaciones y es
superado por el 30% de las observaciones, es decir que la posicin 84 representa el D7, por
lo cual D7 = 1.

Formula:

KN
,K
10

=1,2,...99

PERCENTILES: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes

iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
PERCENTILES 30 y 50
P30 = ?
L=

KN
100

P30 = 0

30120
100

= 36

(Percentil 30)

P50 =?
L=

KN
100

P50 = 1

50120
100

= 60

(Percentil 50)

Percentiles
POSICIN
VALOR
P30
36
0
P50
60
1
Interpretacin de resultados: Podemos concluir que el 30% de los accidentes causados en la
ciudad de Medelln no presenta ningn muerto y el 50% presenta 1 muerto, coincidiendo con los
deciles D5.
El Percentil treinta, es aquel valor de la variable que supera al 30% de las
observaciones, es decir que la posicin 36 representa el P30, por lo cual P30

= 0. Este resultado indica que el 30% de los Accidentes de trnsito ocurridos


en el ao 2015 en la ciudad de Medelln no se registraron muertos.
El percentil 50, es aquel valor de la variable que supera al 50% de las
observaciones, es decir que la posicin 60 representa el P50, por lo cual
P50= 1. Este resultado indica que el 50% de los Accidentes de trnsito
ocurridos en el ao 2015 en la ciudad de Medelln es inferior a 1, el nmero
de muertos.

b) Elegir una variable Continua que sea representativa y siguiendo los lineamientos,
disear una tabla de frecuencia para datos agrupados, calcular las medidas de tendencia
central, los cuartiles, deciles 5, 7 y percentiles 50 y 75
(Interpretar sus resultados).
a) Se eligen las siguientes variables cuantitativas continuas para realizar los clculos solicitados:
VARIABLES

CONTINUA

Velocidad

Costo estimado del siniestro

Edad

Grados de alcohol del conductor

b) Se realiza la siguiente tabla de frecuencia a la variable cuantitativa continua velocidad


Variable Continua Velocidad
Variable
Clase
VELOCIDAD
1
VELOCIDAD
2
VELOCIDAD
3
VELOCIDAD
4
VELOCIDAD
5
VELOCIDAD
6
VELOCIDAD
7
VELOCIDAD
8
VELOCIDAD
9

LI
LS
[ 33,00 46,00 )
[ 46,00 59,00 )
[ 59,00 72,00 )
[ 72,00 85,00 )
[ 85,00 98,00 )
[ 98,00 111,00 )
[ 111,00124,00 )
[ 124,00137,00 )
[ 137,00 150,00 ]

MC
39,50
52,50
65,50
78,50
91,50
104,50
117,50
130,50
143,50

FA
6
15
39
44
9
3
1
0
3

FAA
6
21
60
104
113
116
117
117
120

c) Se calculan la medida de tendencia central: media, mediana, moda y los cuartiles, deciles
5 y 7, y percentiles 50 y 75, a partir de los siguientes datos
Variable
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD

Clase
1
2
3
4
5
6
7
8
9

LI
[ 33,00
[ 46,00
[ 59,00
[ 72,00
[ 85,00
[ 98,00
[ 111,00
[ 124,00
[ 137,00

LS
46,00 )
59,00 )
72,00 )
85,00 )
98,00 )
111,00 )
124,00 )
137,00 )
150,00 ]

MC
39,5
52,5
65,5
78,5
91,5
104,5
117,5
130,5
143,5

FA
6
15
39
44
9
3
1
0
3

FAA
6
21
60
104
113
116
117
117
120

FA * MC
237
787,5
2554,5
3454
823,5
313,5
117,5
0
430,5
8718

8718

fAMC
MEDIA = X=
n

8718

120

=72.65

La media es 72.65

MEDIANA= Linf + a * (

n
FAAi1
2
FAi

) = 59 + 13 (60-21)39= 59+13(3939) = 59+13*

1= 72
MODA= Linf + a (

72+13

[ FAiFAi1]
[ FAiFAI 1 ] +[ FAiFAi+1]

[5]
[ 5 ] +[35 ]

=72+13 ( 5 40 ) = 72 +13 (0.875) =72+11.375=83.375


CUARTILES:
L= k*n/4 = 1*120/4=30

[4439]
) = 72+13 [ 4439 ] +[449 ]

Q1 = Linf +a

Ln
FAAi1]
4
[ FAi]

= 59 + 13

[3021]
[39]

= 59+11/3=62.66

= 59 + 13

[6021]
[39 ]

= 59+13(39/39) =72

= 72 + 13

[9060 ]
[44]

= 72+13(30/44)

= 59 + 13

[6021]
[39 ]

= 59+13(39/39)=59+13=72

= 72 + 13

[8460]
[39]

= 72+13(24/39) =72+8=80

= 59 + 13

[ 6021]
[39 ]

= 59+13(39/39) =59+13=72

L= k*n/4 = 2*120/4=60

Q2 = Linf +a

Ln
FAAi1]
4
[ FAi]

L= k*n/4 = 3*120/4=90

Q3 = Linf +a

Ln
FAAi1]
4
[ FAi]

=72+13(0.68181)=72+8,863 = 80,86
DECILES:
L= k*n/10 = 5*120/10=60

D5 = Linf +a

Ln
FAAi1]
10
[ FAi]

DECILES:
L= k*n/10 = 7*120/10=84

D7 = Linf +a

Ln
FAAi1]
10
[ FAi]

PERCENTILES:
L= k*n/100 = 50*120/100=60

P50 = Linf +a

Ln
FAAi1]
10
[ FAi]

L= k*n/100 = 75*120/100=90

P75 = Linf +a

Ln
FAAi1]
10
[ FAi]

= 72 + 13

[ 9060 ]
[44]

= 72+13(30/44)

=72+13(0.681)=80.8636
c) Interpretacin de los resultados para la variable contina velocidad asociados con el
problema objeto de estudio:
La media es =

72.65 , lo cual quiere decir que este es el promedio del nmero de

heridos por accidentes de trnsito registrados en una muestra de 120 accidentes.


La mediana es 72, lo cual quiere decir que all es donde se concentra el mayor nmero
de accidentalidad.
La Moda es el dato que ms se repite en este caso es 83.75.
Los cuartiles son 3 y dividen el conjunto de datos sea 120 en cuatro partes iguales con lo
cual podemos demostrar que el primer cuartil que es = 30, corresponde al 25% de los datos
(accidentes), 60 Corresponde al 50% y 90 corresponde al 75% de los accidentes.
Los Deciles son 9 y dividen el conjunto de datos en 10 partes iguales. En este caso el
cuartil 2, el Decil 5 y percentil 50 coinciden en su valor porque son iguales a la mediana que es
=60, y corresponde a la mitad de 120 que es el total del nmero de accidentes.
Los percentiles, son 90 y dividen el conjunto de datos en 100 partes iguales, buscan
establecer cuales valores estn por encima o por debajo., en este caso el percentil 50 corresponde
al 50% de la muestra y el percentil 75, corresponde a 80.8636.

SEGUNDO PUNTO
Calcular las medidas univariantes absolutas y relativas de dispersin para variables
cuantitativas (Discretas y Continuas).
Con la variable Discreta elegida calcular: rango, varianza, desviacin tpica y
coeficiente de variacin. Interpretar los resultados obtenidos y asociarlos con el problema
objeto de estudio
a) Con la Variable Discreta Nmero De Muertos Hallamos:

Numero
de
muertos
(Xi)
0
1
2
3
4
total

f.A(fi
)

F.R(hi) F.A.A(FI) Xi.Fi

47
48
21
3
1
120

39%
40%
17%
3%
1%
100%

47
95
116
119
120

0
48
42
9
4
103

Porcentaje de frecuencia
17%

3%1%
39%

40%

Numero de datos (n)


min
max

120
0,0
4,0

Rango: Representa la diferencia entre el valor mximo y el valor mnimo de un conjunto de datos.
Rango: (max min)
Rango: 4,0 0,0 = 4

Varianza: 0,727661064
Desviacin estndar: 0,85303052
b) Con las variables Continuas elegidas calculamos: rango, varianza, desviacin tpica y
coeficiente de variacin
a) Con La Variable Continua VELOCIDAD hallamos: rango, varianza, desviacin tpica y
coeficiente de variacin a partir de los siguientes datos:

Variable Continua Velocidad

Variable
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD
VELOCIDAD

Clase
1
2
3
4
5
6
7
8
9

LI
[ 33,00
[ 46,00
[ 59,00
[ 72,00
[ 85,00
[ 98,00
[ 111,00
[ 124,00
[ 137,00

LS
46,00 )
59,00 )
72,00 )
85,00 )
98,00 )
111,00 )
124,00 )
137,00 )
150,00 ]

MC
39,5
52,5
65,5
78,5
91,5
104,5
117,5
130,5
143,5

FA
6
15
39
44
9
3
1
0
3

FAA
6
21
60
104
113
116
117
117
120

FA * MC
237
787,5
2554,5
3454
823,5
313,5
117,5
0
430,5
8718
8718

Rango = 150-33 = 117


Media
X=

faimc
n

8718
120

=72.6

Varianza

S2 =

X
MC

* FAi =
2

65.572.6

78.572.6

91.572.6

104.572.6

117.572,6

143,572.6

2
2
2
6(39.572.6) +15 (52.572.6) +39

(65,73+6060,15+1965.99+139.24+ 3214,89+ 3052.83+2016.01+ 15080,43)


120
= 263.3105833
Varianza == 263.3105833

Desviacin Tpica
= 263.3105833 =16.22684761
Coeficiente de Variacin
CV= / X

= 16.22684761/72.6 =0.2235102977

Coeficiente de Variacin =0.2235102977

31597.77
120

REFERENCIAS BIBLIOGRAFICAS

Garca, J. E. , Bachero, J.M, Blasco, O.M. Coll. S. V., Diez G. R.., Ivars. A.E., Madrid
(2005) Anlisis de datos Unidimensionales Estadstica descriptiva y nociones de probabilidad,
pag.25-69.
Llinas S. H., Rojas. . C., Barranquilla Colombia (2005; Estadstica
Descriptiva y nocin de probabilidad.

Montero. J. M., Madrid, Paraninfo (2007);, medidas de tendencia central, estadstica


descriptiva, caracterstica de una distribucin de frecuencias, pg. 17-6

Martha Garca. S. M., Madrid: Paraninfo (2004), Medidas de Dispersin, introduccin a


la estadstica econmica y empresarial Dispersin