Вы находитесь на странице: 1из 27

Informe Final

ESCUELA DE CIENCIAS DE LA EDUCACIÓN


ESTADISTA DESCRIPTIVA

Presentado a
Tutor:
FRANCISCO CABRERA DÍAZ

Presentado por
Jhon Wilfer VIRGUEZ SIERRA – 1053332035
WIRIS RAFAEL CONTRERAS QUINTERO - 1051816706
JUAN DIEGO BERNAL OROZCO - 1053818828

Grupo No.
100105_112

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA (UNAD)


ESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA
INGENIERÍA DE SISTEMAS
BOGOTÁ D.C.
2016

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
1
Informe Final

Contenido Actividad Individual 1


Introducción............................................................................................................................3
Justificación............................................................................................................................4
Objetivos.................................................................................................................................5
General................................................................................................................................5
Específicos...........................................................................................................................5
Conceptos Básicos..................................................................................................................6
Medidas de Ubicación o dispersión........................................................................................7
Medidas Univariantes de Tendencia Central.......................................................................8
Medidas Estadísticas Bivariantes..........................................................................................13
Regresión y Correlación Lineal Múltiple..........................................................................17
Propuesta Individual.............................................................................................................21

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
2
Informe Final

Introducción.

El desarrollo de esta actividad se hizo con el fin de aplicar los conceptos


estudiados en el curso Estadística Descriptiva de la Unad, siendo este un
conocimiento indispensable para el continuo aprendizaje en nuestro programa. Así
mismo tiene como fin llevar a la práctica los conceptos y ejercicios trabajando con
escenario real. Adicional a la obtención del reconocimiento de los recursos para
realizar una planeación del desarrollo de las actividades, se llevó a cabo porque
hace parte de nuestra formación académica. Haciendo buen uso de las
herramientas y el material variado y competente para indagar acerca del tema
propuesto, hemos desarrollado la actividad de manera didáctica con el fin de
compartir con todos los participantes y contribuir al aprendizaje colaborativo,
generando así unos resultados satisfactorios y significativos.

Teniendo en cuenta que el interés por aprender es constante, fue de buen agrado
y mayor provecho dedicar tiempo para plasmar las ideas según lo solicitado, y de
esta forma continuar con el proceso de aprendizaje, y demostrar de manera
consecuente el entendimiento y enriquecimiento del saber. Así mismo la
intencionalidad de contribuir a la formación y cumplimiento de acuerdo al
desarrollo de las actividades.
.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
3
Informe Final

Justificación.

La estadística proporciona los elementos básicos para fundamentar, en una


investigación:
 Cómo planear la obtención de los datos para que de ellos se puedan
extraer conclusiones confiables
 Cómo analizar estos datos
 Qué tipo de conclusiones pueden obtenerse con los datos disponibles
 Cuál es la confianza que nos merecen los datos.
La estadística, como se puede observar, por medio de sus dos ramas, nos permite
realizar estudios de tipo descriptivo y explicativo prácticamente en todas las áreas
del conocimiento humano.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
4
Informe Final

Objetivos
General

Desarrollar la capacidad de comprensión, análisis y síntesis, mediante la


identificación y aplicación de la estadística descriptiva para solucionar situaciones
del entorno.

Específicos

 Identificar la población, el tamaño de la muestra, la ubicación espacio


temporal del estudio, la unidad estadística y las variables (cualitativas,
cuantitativas: Discretas y continuas) que intervienen en el caso de estudio.
 Organizar la información mediante la implementación de las diferentes
herramientas estadísticas (tablas de frecuencias, diagramas de tallo, etc.)
 Desarrollar en cada uno de los estudiantes la capacidad de análisis e
identificación de problemáticas de la vida cotidiana.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
5
Informe Final

Conceptos Básicos
 La Población, se habla del total de eventos que representan un estudio,
para el caso concreto, la población son los accidentes de tránsito ocurridos
a en el territorio Nacional, durante el 2015
 El tamaño de la muestra, y ubicación espacio temporal de la muestra, es la
definición y delimitación de la proporción que se va a estudiar y la que
permitirá extrapolar los resultados a una conclusión más general, de
acuerdo a la representatividad de los datos, para el caso particular la
muestra que se va a estudiar son los 110 accidentes de tránsitos
presentados en la ciudad de Medellín durante el 2015.
 La unidad estadística, se dice que es la unidad básica de cualquier análisis
estadístico, es la parte indivisible del proceso de análisis y representa cada
una de las observaciones, para el caso de nuestro análisis esta unidad es
Cada uno de los registros de accidente
 Las variables; estas pueden ser de dos tipos, discretas o continuas, siendo
las primeras: variables de tipo cuantitativo que puede tomar un solo valor,
entre cierta cantidad de valores dados dentro del problema de estudio, su
valor siempre será finito y solo acepta valores enteros. Mientras que las
variables continuas son las que pueden tomar cualquier valor que exista
entre dos magnitudes, es decir puede tomar infinitos valores, además estos
valores admiten fracciones y son el resultado de algún método de
medición
o Cualitativas; Tipo de Vehículo, Genero, Mes, Día de la semana,
Otros Factores, Tipo de Vía, involucra peatones
o Cuantitativas.
 Las Variables discretas son : número de heridos,
número de muertos
 Variables continuas son: grado de alcohol del
conductor, hora, costo estimado del siniestro, edad,
velocidad velocidad

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
6
Informe Final

Medidas de Ubicación o dispersión

Las medidas invariantes de tendencia central son aquellas medidas ubicadas


en el centro de los datos o de la distribución del mismo, y que simplifica la
información dada. Se debe tener en cuenta, y referenciar la diferencia cuando se
habla de muestras (estadígrafos) o de poblaciones (parámetros). Entre las
medidas de tendencia central más importantes se encuentran; la media aritmética,
la media ponderada, la media geométrica, la media armónica, la mediana y la
moda.

Así mismo, para el análisis de una variable o de una distribución unidimensional se


Consideran las siguientes clases de medidas; las Medidas de posición y las
Medidas de dispersión. Dentro de las primeras encontramos Los cuartiles, decirles
y percentiles son medidas que se utilizan para determinar los intervalos dentro de
los cuales quedan proporcionalmente repartidos los términos de la distribución

Las medidas de dispersión hacen referencia al análisis de los datos que se alejan
del centro, y que por tanto no dan información útil en los cálculos de promedio o
de tendencia central, pero que son necesarios para conocer cuál es la realidad de
los datos con los que se pretende analizar una situación dada. Las principales
medidas de dispersión son; el rango o recorrido, la varianza, el coeficiente de
variación, el puntaje típico o estandarizado y las medidas de asimetría o
apuntalamiento.

Una vez revisado, a modo general, algunos conceptos sobre las variables y sus
medidas procederemos a hacer el respectivo análisis teniendo en cuenta los datos
aportados por la investigación y orientados a resolver la problemática planteada
“Principales Causas que incrementan e (inciden) en el número de accidentes de
tránsito, ocurridos en el territorio Nacional”

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
7
Informe Final

Para el caso de la variable discreta tomare la edad y para el análisis de variable


continua el grado de alcohol del conductor, con lo cual espero poder reconocer
más adelante alguna relación entre las variables y determinar si existe o no una
correlación o causalidad entre el grado de alcohol y la edad.

Medidas Univariantes de Tendencia Central


Variable Discreta: Edad:
29 48 21 29 22 29 42 18 23 35 32 45 46 19 54 54 24 29 54 52
17 53 46 17 38 38 46 54 45 55 46 31 36 21 60 33 44 17 33 38
22 35 55 22 52 52 36 33 43 22 55 33 35 42 33 52 31 22 52 46
55 46 19 34 46 46 35 52 34 18 19 23 56 46 32 38 50 54 38 29
60 45 21 46 21 21 43 38 38 54 21 56 22 36 46 46 30 17 46 17
33 32 42 55 18 18 32 46 18 33

Tabla de Frecuencia datos no Agrupados


Frecuencia
Frecuencia Frecuencia
Edad Frecuencia Relativa
Acumulada Relativa
Acumulada
17 5 5 4,55% 4,55%
18 5 10 4,55% 9,09%
19 3 13 2,73% 11,82%
21 6 19 5,45% 17,27%
22 6 25 5,45% 22,73%
23 2 27 1,82% 24,55%
24 1 28 0,91% 25,45%
29 5 33 4,55% 30,00%
30 1 34 0,91% 30,91%
31 2 36 1,82% 32,73%
32 4 40 3,64% 36,36%
33 7 47 6,36% 42,73%
34 2 49 1,82% 44,55%
35 4 53 3,64% 48,18%
36 3 56 2,73% 50,91%
38 7 63 6,36% 57,27%
42 3 66 2,73% 60,00%
43 2 68 1,82% 61,82%
44 1 69 0,91% 62,73%
45 3 72 2,73% 65,45%
46 14 86 12,73% 78,18%
48 1 87 0,91% 79,09%
50 1 88 0,91% 80,00%
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
8
Informe Final

Frecuencia
Frecuencia Frecuencia
Edad Frecuencia Relativa
Acumulada Relativa
Acumulada
52 6 94 5,45% 85,45%
53 1 95 0,91% 86,36%
54 6 101 5,45% 91,82%
55 5 106 4,55% 96,36%
56 2 108 1,82% 98,18%
60 2 110 1,82% 100,00%
Total 110 100%
Medidas de Tendencia Central
Moda 46
Mediana 36
Media 36,97

Medidas de Posición
Percentile
Cuartiles Edad Deciles Edad Edad
s
Q1 25.25 D5 36 P30 29,7
Q2 36 D7 46 P50 36
Q3 46

Como se evidencia las personas de 46 años fueron las que en mayor número se
vieron involucradas en accidentes de tránsito, así mismo, vemos que los datos
tienden a agruparse alrededor de los 36 años; el promedio de edad de las
personas involucradas en accidentes es de los 36, casi 37 años, además el 50%
de los accidentes fueron ocasionados por personas menores a 36 años. De
acuerdo a los resultado podemos ver que los datos presentan una distribución
sesgada hacia la izquierda, donde x́< Me< Mo

Variable Continua: Grados de Alcohol


0, 0, 0, 0, 1, 1, 1, 2, 2, 3,
0 8 7 8 9 8 8 3 3 0
0, 0, 0, 0, 1, 1, 2, 2, 2, 3,
3 6 6 9 8 7 1 2 6 2
0, 1, 0, 1, 1, 1, 2, 2, 3, 3,
0 0 8 2 6 6 2 0 0 2

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
9
Informe Final

0, 0, 0, 1, 1, 1, 2, 2, 2, 3,
2 7 9 1 8 4 0 3 8 5
0, 0, 1, 1. 1, 1, 2, 2, 3, 3,
6 4 0 0 5 8 1 4 4 2
0, 0, 0, 1, 1, 1, 2, 2, 3, 3,
4 6 9 2 6 7 3 2 1 0
0, 0, 1, 1, 2, 1, 2, 2, 3, 3,
2 0 2 0 0 4 4 3 3 2
0, 0, 1, 1, 1, 1, 2, 2, 3, 3,
6 2 1 4 8 5 2 4 3 3
0, 0, 0, 1, 1, 1, 2, 2, 2, 3,
7 7 8 6 7 9 4 5 9 4
0, 0, 1, 1, 1, 2, 2, 2, 3, 3,
5 8 2 5 6 0 1 5 0 4
1, 0, 1, 1, 1, 1, 1, 2, 3, 3,
4 9 4 4 2 9 9 4 2 5
Tabla de Frecuencia datos no Agrupados
Puntos Medios
Frecuencia
Intervalos de Frecuencia Frecuencia Intervalos de
Frecuencia Relativa
clase (Grados de Acumulada Relativa Clase o Marca de
Acumulada
Alcohol) clase
1 (0,00 – 0,438] 9 9 8,18% 8,18% 0.22
2 (0,438 – 0,875] 15 24 13,64% 21,82% 0.66
3 (0,875 – 1,31] 15 39 13,64% 35,45% 1.09
4 (1,31 – 1,75] 17 56 15,45% 50,91% 1.53
5 (1,75 – 2,19] 17 73 15,45% 66,36% 1.97
6 (2,19 – 2,62] 17 90 15,45% 81,82% 2.41
7 (2,62 – 3,06] 6 96 5,45% 87,27% 2.84
8 (3,06 – 3,5] 14 110 12,73% 100,00% 3.28
Total 110 100%
Histograma de Frecuencias

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
10
Informe Final

Histograma de frecuencias absolutas Grados de Alcohol


Frecuencia (Numero de personas)
18 17 17 17
16 15 15 14
14
12 9
10
8 6
6
4
2
0
8] 5] 1 ] 5 ] 9 ] 2 ] 6 ]
,5
]
43 87 ,3 ,7 ,1 ,6 ,0 3
– 0, – 0, – 1 – 1 – 2 – 2 – 3
6

0 5 1 5 9 2 ,0
,0 38 ,8
7
(1
,3
(1
,7
(2
,1
(2
,6 (3
(0 ,4 (0
(0

Grados de Alcohol

Polígono de Frecuencias

Poligono de frecuencias absolutas Grados de Alcohol


(0 (Numero de personas)

20 17 17 17
15 15 15 14
10 9
5 6
0
]

1]

2]
5]

9]

6]

]
38

75

,5
,3

,7

,1

,6

,0

–3
,4

,8

–1

–1

–2

–2

–3
–0

–0

6
75

,0
0

38

,3

,7

,1

,6

(3
,0

,8

(1

(1

(2

(2
Frecuencia

,4

(0
(0

Grados de Alcohol

Medidas de Tendencia Central


Moda 1,4
Mediana 1,7
Media 1,74
Medidas de Posición
Grados de Grados de Percentile Grados de
Cuartiles Deciles
Alcohol Alcohol s Alcohol
Q1 0,925 D5 1,70 P25 0,925
Q2 1,7 D7 2,23 P50 1,7
Q3 2,375

Como se aprecia en los cálculos anteriores, las personas con 1,4 grados de
alcohol fueron las que mayoritariamente se vieron involucradas en accidentes de
tránsito, así mismo el promedio de 1,74 grados de alcohol en los accidentes
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
11
Informe Final

ocurridos indican una concentración de los datos entorno a los valores que se
encuentran por encima de 0,5 y por debajo de los 2,5 grados. De acuerdo a los
resultado podemos ver que los datos presentan una distribución sesgada hacia la
derecha, donde Mo< Me < x́
2. Medidas Univariantes de Dispersión

Variable Discreta: Edad:


Rango 43
158,844710
Varianza 7
12,6033610
Desviación Típica 9
Coeficiente de
Variación 34%
Como se puede apreciar el rango de edad del estudio presenta un alto nivel de
variación, dado entre otras cosas por las edades posibles, las cuales están entre
los 17 y 6º años, dando como resultado 43 años de rango, lo cual se explica por la
misma normatividad que limita la edad de conducción. Este dato por sí solo no nos
da muchas luces sobre las causas de la accidentalidad. Sin embargo, podemos
ver No se ve un patrón claro.

Variable Continua: Grados de Alcohol


Rango 3,5
Varianza 0,8841
Desviación Típica 0,9402659
Coeficiente de
59%
Variación

Como se puede apreciar el rango de medición es bastante limitado, yendo de 0 a


3,5 grados, y encontrándose un patrón importante en el centro de los datos,
aunque el nivel de variación de los datos es alto, se puede apreciar, por medio del
histograma, una fuerte concentración entre los grados0,5 y 2,5; esto se explicaría
por la levedad de embriaguez que le da al conductor una mayor confianza a usar
el carro, que además se podría aventurar a decir, que al ser somero el nivel de

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
12
Informe Final

trago ingerido por el conductor, no hay presión social por no usar el carro, es decir
si no es evidente el estado de embriaguez raramente existirá presión de amigos o
familiares por dejar de conducir, cosa contraria a cuando esta es evidente. Esto
supone que es más peligrosa una persona con niveles medios de alcohol que una
totalmente ebria, dado que si lo está el grupo presionara por hacerlo desistir de
manejar y eso explica porque en niveles más altos no se encuentran involucrados.

Medidas Estadísticas Bivariantes

Regresión y Correlación lineal Simple.


La regresión hace alusión al cálculo del comportamiento de dos variables, cuando
se puede entender que existe un comportamiento dependiente o de relación entre
ellas, y se desea conocer cuál es el valor, peso o determinación de afectación de
una variable frente a otra. Esto se puede determinar también para más de una
variable, lo que se conoce como análisis de regresión múltiple. Para el caso de
regresión simple se busca determinar la relación entre solo dos variables, una (y)
independiente y una dependiente(x), lo cual da una solución lineal; que no implica
determinación per se, ya que en la realidad una variable no determina
directamente otra, por lo que se trata de un fenómeno probabilístico.
Uno de los métodos para realizar esta estimación es empleando el método de los
mínimos cuadrados, el cual permite encontrar la relación, o mejor línea que
simplifica el grupo de datos. Así mismo, es necesario el cálculo del grado de
correlación entre las variables, el cual se calcula con coeficiente de correlación
rectilíneo, r siendo este un valor entre -1 y 1. Este análisis se hace a partir de la
construcción del diagrama de dispersión, que representa la ubicación del par de
datos, x para los valores independientes y, y para los dependientes, conformando una
nube de puntos
 Identificar dos variables cuantitativas del problema que puedan estar
relacionadas.

Para el desarrollo del presente laboratorio las variables cuantitativas que se


analizaran son Grados de Alcohol del Conductor, como variable independiente

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
13
Informe Final

(x), y Número de muertos, como variable dependiente (y). Esto con el fin de
revisar lo que intuitivamente se sospecha, que si entre más borracho (mas alto el
nivel o grado de alcohol del conductor), se es más propenso a verse involucrado
en un accidente de tránsito con víctimas fatales, y determinar de esta manera
como es la relación.
 Realizar el diagrama de dispersión de dichas variables, determinar el
tipo de asociación.

Diagrama de dispersión de Grados de Alcohol de Conductores y Numero de Muertos


14

12

10

8
erodeMertos

6
Num

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Grados de Alcohol del Conductor

 Calcular la recta de regresión o encuentre el modelo matemático que


permite predecir el efecto de una variable sobre la otra, ¿es
confiable?

X Y XY X2 Y2
Total
190,3 531,0 1213,8 426,5 3601,0
∑❑

Y^ =a+bX

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
14
Informe Final

n ∑ XY −∑ X ∑ Y 110∗1213,8−(190,3∗531) 32468,70
b= 2
= = =3,0351
n ∑ x2−( ∑ X) ( 110∗426,47 )−(190,3)2 10697,61

a=
∑ Y −b ∑ X = 531− (3,0351∗190,3 ) = −46,5863 =−0,4235
n 110 110
Y^ =a+bX → Y^ =3,0351 X −0,4235
Dónde:
Y^ : Variable dependiente (la que se va a predecir):
a : Intercepto de la variable Y
X : Variable independiente
b : Pendiente de la recta
Para determinar la confiabilidad del modelo matemático o la recta de regresión se
hará uso del cálculo del Error estándar del estimado: el cual mide el grado de
confiabilidad de la ecuación de la recta estimada, indicando el grado de dispersión o
variabilidad de los datos observados alrededor de la línea de regresión:


2
∑ y −a ∑ y −b ∑ xy =
Se=
n−2 √ 3601+0,4235 ( 531 )−3,0351(1213,8)
110−2 √=
3825,8850−3684,
109

Del modelo matemático, que permite predecir el efecto de la variable grados de


alcohol, sobre el número de muertos, se puede concluir que es una estimación muy
buena, pues el Coeficiente de determinación es alto, cerca del 87%, lo que permite
concluir que la variación de los datos no es muy alta y se encuentra recogida dentro
del modelo, la información está determinada por la variabilidad de las estadísticas
revisadas.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
15
Informe Final

Grados de Alcohol del Conductor -Curva de regresión ajustada-


14

12

10
f(x) = 3.04x - 0.42 GRADOS DE ALCOHOL DEL
NUMERO DE MUERTOS

8 R² = 1 CONDUCTOR
Pronóstico para Numero de
6 Muertos
Linear (Pronóstico para Numero
4 de Muertos)
2

0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
-2
GRADOS DE ALCOHOL DEL CONDUCTOR

 Determine el porcentaje de explicación del modelo y el grado de


relación de las dos variables.

Con el valor del error estándar del estimado, se procede a calcular el coeficiente
de determinación, que es la medida que permite estimar el porcentaje de la
información que es recogida o explicada por el modelo de regresión escogido; a
2
partir de medir la variación de la variable dependiente. Cuando el R es cercano
a 1, se dice que el modelo de regresión lineal ajustado tiene un alto grado de
confiabilidad, si al contrario este se acerca a 0 su grado de confiabilidad es muy
bajo y se recomienda no utilizar el modelo de regresión estimado
Se 2
2
R =1− 2 =R =1−
Sy
2 1,14072
9,4338
=0,8790
( )
2
Primero toca calcular S y la varianza de la variable dependiente Y.

S 2y = (∑ ) n
y
− ý 2 =S 2y = ( 3601
110 )
−( 4,8272) =9,4338 2

Generalmente, por cuestiones de interpretación, se usa con mayor frecuencia el


coeficiente de correlación lineal o coeficiente de Pearson, que es la raíz
cuadrada del coeficiente de determinación; esta toma valores que van desde +1
100105-112 – ESTADÍSTICA DESCRIPTIVA
Fase: Evaluación Final
16
Informe Final

hasta el -1. e indica el grado de asociación entre las variables, si es 0 indica que no
existe relación alguna y los valores extremos +1 y -1 indican una correlación perfecta
positiva o negativa respectivamente.
r= √ R2 =r=√ 0,8790=r=0,9375
Como se puede apreciar la relación que existe entre las dos variables fuerte, de
cerca del 80% y existe una correlación lineal positiva entre las variables; por lo que
se puede decir que la relación entre el número de muertes por accidentes de
tránsito si se encuentra explicada por el grado de alcohol que tenga el conductor,
pues es cerca del 93%.

 Relacionar la información obtenida con el problema.

Como se pudo apreciar la relación entre las variables es alta, es además positiva
lo que quiere decir que la ocurrencia de una implica una afectación de la otra, y la
fuerza de explicación entre una y otra es alta, lo que indica que, si existe, con un
93% de probabilidad la ocurrencia de la otra. Saberlo implica mayor conciencia
sobre la responsabilidad que se tiene al conducir, pues si es evidente que se tiene
mayor probabilidad de verse involucrado en un accidente donde se presenten
muertos.
Regresión y Correlación Lineal Múltiple.

 Identificar una variable dependiente y dos o varias variables independientes


del estudio de investigación.

Para el desarrollo de este ejercicio tomare como variable dependiente Número de


Heridos y analizare como esta está determinada por el comportamiento de dos
variables independientes como lo son la velocidad y el grado de alcohol del
conductor.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
17
Informe Final

160
140
120
100
f(x) = 16.49x + 44.68
80 R² = 0.74
60
40
20
0 f(x) = 1.17x + 1.63
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
R² = 0.51
Vel oci da d Li near (Vel oci dad)
Número de Heri dos Li near (Número de Heri dos )

 Realizar el diagrama de dispersión de dichas variables.

Como se puede apreciar cuando se calculan y grafican por separado, no en


regresion, da un coeficiente de correlacion mas bajo comparado cuando se ajusta
a la regresion y se hacen en un mismo plano.

Velocidad Curva de regresión ajustada


8
f(x) = 0.06x - 0.63
7 R² = 0.89
6
Número de Heridos

Número de Heridos
5
Pronóstico Número de
4 Heridos
3 Linear (Pronóstico Número
2 de Heridos)
1
0
20 40 60 80 100 120 140 160
Velocidad

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
18
Informe Final

Grados de Alcohol del Conductor Curva de regresión ajustada


8
7
6
5 f(x) = 1.17x + 1.63 Número de Heridos
R² = 0.96
Número de Heridos

Pronóstico Número de
4 Heridos
3 Linear (Pronóstico Número
de Heridos)
2
1
0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
Grados de Alcohol del Conductor

2 2
X1 X2 Y X1 Y X2 Y X1 X2 X1 X2 Y
2

Total 15535, 62543


190,3 8053 403 811,4 31606 426,5 1739
∑❑ 2 3

 Calcular la recta de regresión y el coeficiente de correlación para probar


estadísticamente su relación.

Y^ =a+b1 X 1 +b2 X 2
X 1 +¿ b2 ∑ X 2 → 403=110 a+190,3 b1 +8053 b2
∑ Y =na+b 1 ∑ ¿
2
X 1 +¿ b2 ∑ X 1 X 2 → 811,4=190,3 a+ 426,5 b1 +15535,2 b2
X 1 +¿ b 1 ∑ ¿
∑ X 1 Y =a ∑ ¿
2
X 2 +b1 ∑ X 1 X 2 +¿ b2 ∑ X 2 →31606=8053 a+15535,2 b1 +625433 b2
∑ X 2 Y =a ∑ ¿
Desarrollamos como un sistema de ecuaciones lineales y por el medio del método
de Gauss, es decir transformar en una matriz escalonada

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
19
Informe Final

(
110 190,3 8053 403
| ) 110
190,3 426,5 15535,2 811,4 f 2−1,73 ( f 1 ) → f 2 0
8053 15535,2 625433 31606
190,3 8053

(
403
97,281 1603,51 114,21 f 3−
8053 15535,2 625433 31606
8053
110 | )
f 1→f

{
110 a 190,3 b 1 8053 b2 ¿ 403
0 97,281b 1 1603,51b 2 ¿ 114,21
(1)
10111381849 2908810
0 0 b2 ¿
1070091 13211
a=0,59
b1=0,79
b2=0,023
Y^ =a+bX → Y^ =0,79 X 1+ 0,023 X 2 +0.59
Dónde:
Y^ : Variable dependiente (la que se va a predecir):
a : Intercepto de la variable Y
X 1 , X 2 : Valores de las Variables independientes
b1 , b2 : Pendientes asociadas con cada variable independiente en la recta


2
∑Y −a ∑ Y −b1 ∑ X 1 Y −b 2 ∑ X 2 Y
Se=
n−3
→ Se=

1739−( 0,59∗403 )−( 0,79∗811,4 )−(0,023∗31606)
110−3
=

2 a ∑ Y +b 1 ∑ X 1 Y +b 2 ∑ X 2 Y −n ý 2 ( 0,59∗403 ) + ( 0,59∗403 ) + ( 0,79∗811,4 )−(110∗13,422) 237,77


R= 2
→ =
1739−(110∗13,422)
∑Y −n ý 2

r= √ R2 =r=√ 0,49235=r=0,7016
 Relacionar la información obtenida con el problema.

Como se puede apreciar el modelo matemático hallado; explica, en combinación


de las dos variables, muy bien el comportamiento del número de heridos frente al
registro de velocidad y grados de alcohol del conductor, como se puede apreciar el
proceso de predicción es más asertivo al usar los dos datos. Esto es debido a que
los datos no varían mucho y se concentran permitiendo mejorar las predicciones
de los mismos. Se tiene que el modelo explica de manera muy baja la información

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
20
Informe Final

obtenida ( R2=¿ 50%), sin embargo el coeficiente de correlación es alto,


permitiendo concluir que las variables si tienen alta relación, es decir el número de
heridos si se explica por las altas velocidades y el grado de alcohol de los
conductores.
Propuesta Individual

Del diagrama estadístico de dispersión se desprende que existe una correlación


lineal directa entre el número de heridos y el grado de alcohol; esta información
está confirmada por el valor del coeficiente de determinación que nos indica que el
modelo de regresión nos explica cerca del 87% de los casos de accidentes
observados en el estudio, es decir el modelo es altamente confiable. Así mismo si
revisamos el polígono de frecuencias, la media de alcohol dentro de la muestra es
de 1,74 grados, donde hay que resaltar que cerca del 70 por ciento de las
muestras se concentran en un rango de alcohol de entre 0,5 y 2,7, razón por la
cual hasta el más leve nivel de alcohol representa un riesgo importante para el
bienestar de los peatones.
Otro dato que también es importante analizar es la edad de los conductores
involucrados en los accidentes, aunque la media y la moda estén muy cercanas,
vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los
picos o segmentos de edad de los conductores donde es mayor la probabilidad de
verse involucrado en un accidente de tránsito y estas edades son los 46 (con 14
casos), los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17,
18 29 y 59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor
control a los conductores con este tipo de edades, pues su sola edad implica un
aumento en la probabilidad de verse involucrado en un accidente, quizá porque en
estas edades aumentan los consumos de alcohol.

A este análisis se debe sumar el que se hizo con respecto a la velocidad donde se
encontró un alto nivel de confiabilidad en el modelo de regresión que analiza la

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
21
Informe Final

relación entre heridos y velocidad, cerca del 88 de los accidentes se explican por
este concepto, donde según el modelo se encuentra que después de 28km/h se
corre el riesgo de cometer un accidente y que esto aumenta en la medida que
aumente de ahí en adelante la velocidad. Sin embargo al analizar en un mismo
sistema la velocidad y los grados de alcohol (análisis de regresión múltiple),
vemos que el nivel de confiabilidad del modelo, explicada por el coeficiente de
determinación, cae a solo el 49%, sin embargo el nivel de correlación es alto, pues
cerca es del 70%, lo que nos indica que existe una correlación lineal positiva entre
el número de heridos explicada por el grado de alcohol y la velocidad del carro.
Según la ecuación de la recta cada herido se explica en un 56% por el efecto
alcohol, un 42% por otro tipo de situaciones, esto es el error, y un 2% por el efecto
velocidad. Esto nos pone de relieve que el problema central es el grado de
alcohol, que se debe controlar en un segmento específico de la población y se
debe hacer énfasis en la medida de lo posible en la disminución de la velocidad.

Propuesta Individual: la propuesta individual deriva de mi perfil profesional; soy


estudiante de Ingeniería de Sistemas, y teniendo en cuenta la tecnología con la
que posiblemente contaremos en la próxima década, podría implementarse un tipo
de chip biológico, que estableciera un patrón general que regulase algunos
componentes fisicoquímicos del conductor, entre los cuales estaría la capacidad
sensorial y emocional, ya que pese a que el alcohol es uno de los altos indices de
riesgos de accidentalidad, la capacidad fisicoquímica hace la gran diferencia entre
el poder y el querer. De igual forma se pretendería entrar a un nivel futurista pero
posible, dando lugar a la llamada inteligencia artificial, que ha logrado posicionar al
ser humano como perfecto. Por otro lado se podrían implementar reductores de
velocidad instalados en los frenos de los automóviles, monitoreados satelitalmente
mediante ondas electromagnéticas, reduciendo el índice de altas velocidades, lo
que generaría una reducción de aproximadamente el 38,63%.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
22
Informe Final

La propuesta individual y el perfil profesional, de acuerdo a la carrera que me


encuentro estudiando ingeniería de sistema, propongo de acuerdo a los dato que
se obtuvieron, para reducir la accidentalidad ya que los accidente fueron
ocasionado por los conductores quienes se encontraban en acto de alcohol, que
los nuevos vehículos traigan instalado un dispositivo que cuando el conductor, se
suba al vehículo tenga que soplar y si le sale grado de alcohol positivo el vehículo
no le encienda, para así reducir el acto riesgo de accidente, también las personas
puedan conducir de acuerdo a sus edades, de acuerdo a cada edad, tengan una
velocidad permitida, y que la velocidad no superen los 80 kHz. También una
alternativa es que en el promedio de la hora en que ocurrieron los accidente fuero
aproximadamente a las 11:10hrs, y cada vehículo tenga una distancia al otro de
por lo menos 5 metros, para así prevenir los herido y muerto ocasionado por lo
accidente de tránsito, esto se desprende de un análisis de regresión de los
resultado de la tabla de velocidad, grado de alcohol, numero de muerto y herido.
Cuando analizamos estos encontramos una correlación lineal positiva, ya que la
mayor parte de los accidente de tránsito fueron ocasionado por los conductores en
acto grado de alcohol y por velocidad, y una posible solución, es tener más
controles sobre estos conductores, que la pena sea pagada con cárcel, y sobre las
vía, tener mucho más reductores de velocidad, puesto control y velocímetro en las
carretera, para así prevenir los accidentes, tener cámara de seguridad en las
carretera cada tres kilómetro de distancia para poder observar cuando ocurra un
accidente de tránsito.

Propuesta consolidada
Del diagrama estadístico de dispersión se desprende que existe una correlación
lineal directa entre el número de heridos y el grado de alcohol; esta información
está confirmada por el valor del coeficiente de determinación que nos indica que el
modelo de regresión nos explica cerca del 87% de los casos de accidentes
observados en el estudio, es decir el modelo es altamente confiable. Así mismo si
revisamos el polígono de frecuencias, la media de alcohol dentro de la muestra es
de 1,74 grados, donde hay que resaltar que cerca del 70 por ciento de las

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
23
Informe Final

muestras se concentran en un rango de alcohol de entre 0,5 y 2,7, razón por la


cual hasta el más leve nivel de alcohol representa un riesgo importante para el
bienestar de los peatones.
También una alternativa es que en el promedio de la hora en que ocurrieron los
accidente fuero aproximadamente a las 11:10hrs, y cada vehículo tenga una
distancia al otro de por lo menos 5 metros, para así prevenir los herido y muerto
ocasionado por lo accidente de tránsito, esto se desprende de un análisis de
regresión de los resultado de la tabla de velocidad, grado de alcohol, numero de
muerto y herido.
Otro dato que también es importante analizar es la edad de los conductores
involucrados en los accidentes, aunque la media y la moda estén muy cercanas,
vemos que son las personas de 46 años las que mayor número de accidentes
causan, a esto también se suma que el 80% de los conductores de la muestra de
accidentes se encuentran en el rango de 18 a 50 años , siendo importante los
picos o segmentos de edad de los conductores donde es mayor la probabilidad de
verse involucrado en un accidente de tránsito y estas edades son los 46 (con 14
casos), los 33 y 38 (con 7 casos), los 21, 22, 52 y 54 (con 6 accidentes) y, los 17,
18 29 y 59.(con 5 casos cada uno)., es por esto que se debería hacer un mayor
control a los conductores con este tipo de edades, pues su sola edad implica un
aumento en la probabilidad de verse involucrado en un accidente, quizá porque en
estas edades aumentan los consumos de alcohol. A este análisis se debe sumar el
que se hizo con respecto a la velocidad donde se encontró un alto nivel de
confiabilidad en el modelo de regresión que analiza la relación entre heridos y
velocidad, cerca del 88 de los accidentes se explican por este concepto, donde
según el modelo se encuentra que después de 28km/h se corre el riesgo de
cometer un accidente y que esto aumenta en la medida que aumente de ahí en
adelante la velocidad. Sin embargo al analizar en un mismo sistema la velocidad y
los grados de alcohol (análisis de regresión múltiple), vemos que el nivel de
confiabilidad del modelo, explicada por el coeficiente de determinación, cae a solo
el 49%, sin embargo el nivel de correlación es alto, pues cerca es del 70%, lo que
nos indica que existe una correlación lineal positiva entre el número de heridos

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
24
Informe Final

explicada por el grado de alcohol y la velocidad del carro. Según la ecuación de la


recta cada herido se explica en un 56% por el efecto alcohol, un 42% por otro tipo
de situaciones, esto es el error, y un 2% por el efecto velocidad. Esto nos pone de
relieve que el problema central es el grado de alcohol, que se debe controlar en un
segmento específico de la población y se debe hacer énfasis en la medida de lo
posible en la disminución de la velocidad. Siendo un poco más atrevidos, podría
pretenderse establecer un patrón general que regulase algunos componentes
fisicoquímicos del conductor, entre los cuales estaría la capacidad sensorial y
emocional, ya que pese a que el alcohol es uno de los altos índices de riesgos de
accidentalidad, la capacidad fisicoquímica hace la gran diferencia entre el poder y
el querer.
Recomendaciones
Algunas recomendaciones para prevenir estos accidentes son:

 Reducir la velocidad en las esquinas, así sea que no se encuentre un pare.


 No seguir de cerca un vehículo que este en frente.
 Respetar las señales de tránsito.
 Usar en todo momento el cinturón de seguridad.
 No distraerse durante la conducción de un vehículo.
 Evitar conducir en la noche.
 No hablar por celular mientras se conduce un vehículo.
 No conducir un vehículo con cansancio o fatiga.
 Mantener el vehículo en buen estado y revisarlo ante de conducirlo.
 No manejar en acto grado de alcohol.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
25
Informe Final

Bibliografía

Holguín Quiñones, F. (1981). Estadística descriptiva aplicada a las ciencias sociales.


México: UNAM.
Gorostizaga, J. C. (n.d.). ESCUELA TÉCNICA SUPERIOR DE NÁUTICA Y MÁQUINAS
NAVALES. From ESTADÍSTICA DESCRIPTIVA:
http://www.ehu.eus/juancarlos.gorostizaga/apoyo/estadistica.htm
www.ditutor.com. (n.d.). www.ditutor.com. From Tipos de Variables:
http://www.ditutor.com/estadistica/variables_tipos.html
Velazco, C. (01 de 05 de 2013). Youtube.com. From Deciles para datos no agrupados:
https://www.youtube.com/watch?v=w8uSEV7M9L0
Velazco, C. (2014 de 04 de 2014). Youtube.com. From Cuartiles con su interpretación
para datos no agrupados: https://www.youtube.com/watch?v=LUSpXiyZ90c
Hernández, E. (11 de 10 de 2012). Youtube.com. From Tabla de Distribución de
Frecuencias: https://www.youtube.com/watch?v=3JRoegqw9v0

Montero, J.M. (2007).Regresión y Correlación Simple. Madrid: Paraninfo. Paginas.


130 – 172. Recuperado de: http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc13
61e1929abe203c8219.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
26
Informe Final

Churchill, G.A.(2009). "Análisis de Regresión Múltiple." Investigación de mercados.


México City: Cengage Learning. Páginas 686 – 695.Recuperado de:
http://go.galegroup.com/ps/i.do?id=GALE
%7CCX4058900234&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=49575112db86a
0eb46dae86bbaf74cb9.
Holguín Quiñones, F. (1981). Estadística descriptiva aplicada a las ciencias
sociales. México: UNAM.
Ortegón Pava, Milton Fernando, (2010) Estadística Descriptiva, segunda versión
Universidad Nacional Abierta y a Distancia UNAD
Regresión lineal. (s.f.). En Wikipedia. Recuperado el 18 de noviembre de 2016 de
https://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal.

100105-112 – ESTADÍSTICA DESCRIPTIVA


Fase: Evaluación Final
27

Вам также может понравиться