Вы находитесь на странице: 1из 4

Relatório do Projeto Final– “Titanic”

Link da visualização da análise:


https://public.tableau.com/profile/carlos.mendes.tavares#!/vizhome/ProjetoF
inal_titanic_modificado/Histria1

 Introdução:
Coletou-se dois feedback’s, uma em versão 1ª versão do esboço e uma outra
em 2ª versão, supra apontados. Os feedback’s recebidos foram apreciados e
feitos os acertes nos gráficos do presente projeto, em anexo a este relatório
(ProjetoFinal_titanic_28_06_2018_UV), que nos parece inclui evidências de
que a visualização foi melhorada deste a 1ª versão.

 Resumo:
Este projeto propõe-se analisar um dos conjuntos de dados mais populares para
quem inicia estudos de ciências de dados e machine learning, Titanic. Este
conjunto de dados tem diversas informações sobre passageiros que embarcaram
no famoso transatlântico, partindo de em sua viagem inaugural de Southampton,
Inglaterra, em direção a Nova Iorque, em 10 de Abril de 1912 e que não
esperavam pelo fim trágico. Durante a viagem fez duas paradas, uma em
Cherbourg e outra em Queenstown para embarque de mais passageiros antes de
partir em direção ao oceano Atlântico. Dentre as perguntas de partidas, se
pretende responder aa seguintes perguntas:
Quais fatores que parecem se relacionar às chances de sobreviventes ao
acidente?
As taxas de tarifa aumentaram de acordo com a faixa etária de
viajantes que sobreviveram ao acidente?

 Design:
A concepção deste projeto, antes e após a coleta de feedback, visa criar
visualização que facilita aos leitores a entenderem fatores que parecem se
relacionar às chances de sobreviventes (“variável resposta” é: sobrevive -sim,
variáveis explanatórias são: sexo, faixa etária, local de embarque e tipologia de
classe classe em embarque), e se houve incremento em taxas de tarifa de
acordo com a faixa etária de viajantes que sobreviveram ao acidente
(“variável resposta” é: taxa de embarque, variáveis explanatórias é: idade).

 Comentários analisando a histórico:


Na primeira parte, perfil dos viajantes:
Pretende-se apresentar as principais características dos passageiros, destacando-
se ao leitor que houve mais homens, pessoas em idade adultas, que embarcaram
em Southampton e em classe baixa (gráficos 1 – 4), em analise univariada.
Passageiros que embarcaram em Southampton ocuparam parecem ter ocupado
uma maior parte dos assentos da embarcação, independentemente da classe que
ocupou (gráfico 5), em análise bivariada.
Na mesma direção se pode constatar, em análise múltipla (gráfico 6), que a
maior parte dos passageiros eram homens, que embarcaram em Southampton,
entretanto, a maioria deles ocupou a classe média. Todas as mulheres idosas que
ocuparam a classe baixa embarcaram em Queenstown ou Cherbourg (gráfico 7),
o que pode sugerir ao leitor o perfil socioeconômico das mulheres idosas dessas
cidades à época.

Na segunda parte, fatores que parecem se associar às chances de sobrevivência,


são passageiros: mulheres, idosos, os que embarcaram em Cherbourg e em alta
classe, de acordo com modelo de análise univariada (Gráficos 11-14). Isso pode
ser explicado por ter havia política de se evacur primeiro a mulheres, idosos e
crianças.
Destaca-se, ainda, ao leitor que houve um pouco mais de 38% dos passageiros
sobreviveram (gráfico 10).
Na terceira parte, pretende levar aos leitores identificarem os nomes e outas
características mais importantes dos sobreviventes mais velho e mais novo desse
acidente (Gráficos 15 e 16).

Na quarta parte, deseja levar aos leitores apontarem se houve incremento em


taxas de tarifa de acordo com a faixa etária de viajantes (Gráficos 17).
O gráfico 18, tem a intuição de apresentar um exemplo pratico da técnica de
animação de visualização de dados.

Na quinta parte, conclusão:


Fatores que parecem se associar às chances de sobrevivência, são passageiros:
mulheres, idosos, os que embarcaram em Cherbourg e em alta classe.
Possivelmente, as taxas de tarifa aumentaram de acordo com a faixa etária dos
viajantes que sobreviveram ao acidente. Ressalve–se, no entanto que, esses
achados, são descritivos/de visualização e exploratória e como tal, ainda são
inconclusivos, necessitando de testes de inferências estatísticas para se refutar ou
não a esses achados.

Comentário Final:
Optou-se por utilizar gráficos de colunas compostas para realizar as visualizações
de: i) caracterização dos passageiros ou análise univariada de variáveis
qualitativas; ii) a relação entre duas variáveis qualitativas (consideramos como
modelo simples) ou , análise bivariada entre duas variáveis qualitativas (fatores
que parecem se associar às chances de sobrevivência). Por outro lado, em
análise entre duas variáveis quantitativas (taxa de embarque X idade) utilizou-se
um gráfico de dispersão.
Para este projeto, considerou-se: i) crianças, os passageiros que tinham entre 0 e
20 anos de idade, adultos, os que entre 21 e 59 anos e idosos, aqueles que tinha
entre 60 e 80 anos de idade; ii) modelo simples qualquer relação entre duas
variáveis, seja entre duas variáveis qualitativas ou quantitativas.
Nesta versão do projeto foram implementadas todas as correções indicadas em
feedbacks e revisores.

 Recursos: liste todas as fontes consultadas para criar a visualização


 https://github.com/IamGianluca/titanic/tree/master/code
 https://paulovasconcellos.com.br/competicao-kaggle-titanic-tutorial-
5b11993774f7
 https://paulovasconcellos.com.br/o-que-o-naufr%C3%A1gio-do-titanic-
nos-ensina-at%C3%A9-hoje-data-science-project-2fea8ff1c9b5
 https://paulovasconcellos.com.br/como-criar-seu-primeiro-projeto-de-
data-science-parte-1-de-2-d846c4c8d314
 https://www.kaggle.com/tukichen/titanic-r-random-forest

Arquivos de dados
https://s3.amazonaws.com/video.udacity-
data.com/topher/2017/October/59d54e6d_titanic-data/titanic-data.csv

Вам также может понравиться