Академический Документы
Профессиональный Документы
Культура Документы
DADOS
Outubro,
2016 Aprenda, Aplique, Destaque-se
Neste breve e-book nós compilamos 10 de nossos melhores posts sobre análise de
dados. Vale a pena dar uma lida. São diversas técnicas e exemplos que podem
ajudar você a aprender e aplicar conhecimentos, assim como se destacar em seu
trabalho.
Análise de Dados
Análise de Dados
A P R E N DA , A P L I Q U E , D E S TA Q U E - S E
Sumário
LEITURA 1 – COMO ANALISAR DADOS PARA ENTENDER CORRELAÇÕES ........................ 2
LEITURA 2 – ANÁLISE DE DADOS DA ECONOMIA.............................................................. 4
LEITURA 3 – O PDSA E A ANÁLISE DE DADOS ................................................................... 7
LEITURA 4 – PDSA: SEGURANÇA PÚBLICA EM ANÁLISE .................................................. 13
LEITURA 5 – IPCA, IGP-M E OUTRAS ANÁLISES DA CRISE................................................ 19
LEITURA 6 – ANÁISE DO PREÇO DOS IMÓVEIS ................................................................ 23
LEITURA 7 – CONSTRUÇÃO CIVIL EM 2015 ...................................................................... 26
LEITURA 8 – COMO FAZER UMA ANALISE DE CORRELAÇÃO USANDO O EXCEL? ......... 32
LEITURA 9 – ANÁLISE DE 20 ANOS DE POUPANÇA ......................................................... 38
LEITURA 10 – O ENDIVIDAMENTO DAS FAMÍLIAS ........................................................... 40
Página 1
Análise de Dados
Análise de dados: olá, caro leitor. Tudo bom? Como estão as coisas no trabalho? Pressão por resultados?
Ou as coisas estão se acalmando um pouco? E os projetos? Como andam? Muita análise de dados ou a
coisa está mais para análise de opiniões? Como estão as reuniões de projeto? As equipes levam
diagnósticos teóricos, baseados em horas de lorotas compiladas ou lançam mão da análise de dados mais
fundamentada?
Brainstroming infinitos ou gráficos de tendências (ou linhas)? E a análise dos problemas? Rola uma
investigação prévia, utilizando um Ishikawa para fundamentar as hipóteses ou a coisa é mais Paretar
Paretar Paretar? Por que pergunto isto? Porque analisar dados não é algo fácil. Depois de fazer
seu Green Belt e sair cheio de vontade fazer a análise de dados aprendida nele, você foi surpreendido
em reuniões com coisas como estas? Quantas vezes um gestor, mal informado sobre o tema, pediu para
você fazer um gráfico mais bonito, mesmo que não fosse o correto para aquela situação? Quantas vezes,
ao mostrar sua análise, alguém falou que os dados estavam errados? Dados esses, que a equipe dele lhe
passou por meio da extração de uma base de dados do sistema oficial?
Calma. A coisa é assim mesmo. O Brasil não é conhecido por ser um país de expoentes na esfera da
análise de dados na empresa. Não é todo mundo que como você, quer se esforçar para alcançar
resultados com consistência, que estudou bastante e procura fatos e dados concretos para tomar decisão.
Há muito mais em jogo, que exigirá de você habilidade para dominar as circunstâncias, ter paciência e
resiliência. Mudar cultura não é fácil, mas é possível.
Análise de Dados
Agora, chega de papo e vamos brincar um pouco. Desabafo feito, vamos para a análise de dados.
Vamos começar analisando o índice “salário real médio” publicado pela FIESP que mede os salários na
indústria e tem a base 100, fixada no ano de 2006.
Página 2
Análise de Dados
colaboradores. E por que será que isto aconteceu? Numa análise básica, poderíamos intuir que uma das
possíveis causas seja o desemprego, concordam? Como realizar uma análise de dados para comprovar
isto?
Previsão
Página 3
Análise de Dados
Neste exemplo, é possível analisar como aplicamos os conceitos que aprendemos no Green Belt e Black
Belt na prática. Com uma simples regressão, realizada por meio do assistente do Minitab, é possível
entender a relação forte que há entre vários indicadores. Agora, fé no método e aproveite para afinar
suas análises de dados.
No artigo de hoje vamos voltar a falar sobre análise de dados. O leitor que quiser conhecer melhor sobre
essa técnica, pode ver nosso curso de Green Belt, que explica melhor as ferramentas aqui usadas. E com
esta Economia pujante que temos em 2015, nada melhor do que comparar alguns índices do
mercado financeiro. Para isto, vamos começar comparando o dólar (temido dólar) com a bolsa de valores.
Página 4
Análise de Dados
Qual será que foi o comportamento do Ibovespa divido pelo dólar? Quem cresceu mais ao longo destes
anos?
Página 5
Análise de Dados
Página 6
Análise de Dados
Dívida externa bombando também. Olha só que maravilha. Depois de 2009 a dívida dobrou, parece que
a saída da crise adotada pelo governo levou a esta crise que vivemos hoje.
Página 7
Análise de Dados
Neste artigo, gostaríamos de mostrar como aproveitar dois grandes ativos gratuitos disponíveis (PDSA
e Google Trends) para você aumentar seus ganhos em tempos de crise. Imagine que a situação está difícil
e para melhorar um pouco suas perspectivas você decida empreender em algum novo negócio. Porém, você
têm dúvidas: qual negócio abrir? Qual mercado é interessante para eu entrar? Para lhe ajudar em decisões
estratégicas como esta nós vamos utilizar o PDSA (disponível e gratuito) e o Google Trends (disponível
e ainda gratuito também).
PDSA: Plan
Objetivo: descobrir um bom negócio para se comercializar por meio de uma loja virtual.
Questões Predições (O que achamos antes do estudo)
2) Quais as regiões que mais pesquisam estes 2) A regiões com maior volume de busca são as
termos? cidades e Estados com populações mais numerosas
PDSA: Do
Pesquisas realizadas e problemas não foram encontrados.
PDSA: Study
Página 8
Análise de Dados
Página 9
Análise de Dados
Página 10
Análise de Dados
PDSA: Ação
Como ação pós-estudo, sugiro a continuidade da pesquisa para os termos que vocês mais se interessam. Se
quiser abrir uma loja relacionada ao esporte tênis. Podemos procurar “raquete de tênis”, como na figura 6.
Página 11
Análise de Dados
Página 12
Análise de Dados
Segurança pública: no artigo de hoje nós vamos analisar os dados de segurança pública do Estado de São
Paulo. E para analisar dados, nada melhor do que um ótimo PDSA para nos ajudar. Vamos para o
terceiro PDSA que a FM2S disponibiliza. É no Green Belt e no Black Belt que você construirá todas suas
ferramentas para melhoria.
Objetivo: entender como está a evolução da segurança pública no Estado de São Paulo de janeiro de 2013
até maio de 2015.
Questões Predições
Para analisar a evolução dos crimes iremos utilizar gráficos de tendência e gráficos de controle.
Do
Dados coletados sem encontrarmos problemas.
Estudo
Página 13
Análise de Dados
Página 14
Análise de Dados
Página 15
Análise de Dados
Página 16
Análise de Dados
Conclusão
Pode-se concluir que houve redução em:
Homicídios dolosos;
Roubo de veículos;
Tentativa de homicídio;
E houve aumento em:
Página 17
Análise de Dados
Roubo – outros;
E permaneceram estáveis:
Homicídios dolosos e culposos por acidentes de trânsito.
Act
Após aprendermos como estão os índices de segurança pública no Estado de São Paulo, podemos
acompanhar os índices em algumas cidades específicas. A análise por cidade irá nos fornecer informações
mais estratificadas sobre os problemas. Por meio desta análise é possível auxiliar os prefeitos, comandantes
e secretários de segurança pública dos municípios o que eles devem atacar.
Uma análise interessante seria procurar as cidades que mais melhoraram os indicadores nos últimos anos e
torna-las benchmark de segurança. Depois, poderíamos avaliar quais as piores cidades e promovermos um
intercâmbio de melhores práticas e disseminação de mudanças. Com isto conseguiríamos revolucionar o
modelo da segurança no Estado e no Brasil. E aí? Vamos fazer estes exercícios? Ano que vem tem eleições
e eu gostaria muito que meu candidato pensasse desta maneira. Não importa o partido, se um município for
benchmark, deveríamos copiá-lo. Gestão na prática galera.
Página 18
Análise de Dados
IPCA: neste post vamos continuar aplicando a Estatística que ensinamos em nossos cursos
de greenbelt e blackbelt para entendermos um pouco mais do nosso cenário macroeconômico. Vamos
começar pelo PIB mensal, calculado pelo Banco Central. Para primeira análise, vamos utilizar o gráfico
de tendência, figura 1.
IPCA
Pela figura 1, vemos que o PIB cresceu bastante nos últimos anos, mas agora parece estar iniciando um
período de estabilidade.
Na segunda etapa, vamos ver o comportamento dos índices de inflação IPCA e IGP-M mensais ao longo
dos anos, de 1995 até 2015. Isto pode ser conferido na figura 2 e 3. Para o IPCA e IGP-M iremos utilizar
a variação mensal .
Página 19
Análise de Dados
IGP-M
Página 20
Análise de Dados
Página 21
Análise de Dados
Outra análise interessante é o famoso “tempering” que o governo Dilma utiliza para controlar a
inflação. Está claro que o quando a inflação cai muito o governo atua e quando sobe também, mas que a
capacidade de controlar a inflação com as medidas heterodoxas estão a se esgotar. Prova disto são os
três meses consecutivos fora do controle no ano de 2015. E aí pessoal? Será que a equipe da Dilma
conseguirá se reinventar? Pelo visto, a tentativa de controle está mais para replicação do modelo FHC,
já que a taxa de juros voltou a subir, conforme figura 6.
Se você gostou da análise e deseja aprender a elaborá-las, participe de nossos cursos. Há on-
line e presencial. Para levar um presencial para sua cidade é fácil, basta entrar em contato
conosco.Nossos cursos de green belt e blac kbelt são ótimos para isto.
Página 22
Análise de Dados
No artigo de hoje nós vamos analisar alguns dados provenientes da construção civil. Fazer um curso
de Greenbelt o ajuda na hora comprar imóveis, pois permite que você analise os dados e veja se está na
hora certa, ou se é melhor esperar um pouco. Para isto, fizemos uma excursão no banco de dados do IBGE
(http://seriesestatisticas.ibge.gov.br/) que está disponível on-line.
E por onde começar? Na minha percepção é melhor começarmos seguindo a dica de Robert Shiller, Nobel
de Economia em 2013. Shiller fala que o segredo para entender se os preços dos imóveis estão caros ou
baratos é compará-los aos índices de inflação. Para isto, compara-se o índice de custos da construção com
o IPCA.
Página 23
Análise de Dados
Página 24
Análise de Dados
Pela figura 3 é possível afirmar que a variabilidade dos custos da construção civil afeta a variabilidade
do índice FIPE/ZAP para preço de venda. Mas como será que estes dois indicadores se comportaram ao
longo de tempo? Para isto, utiliza-se o gráfico de tendência, outra ferramenta muito utilizada e discutida
nos cursos de Greenbelt.
Figura 4: gráfico de tendência do FIPE/ZAP e do Custo, ambos na base 100 em agosto de 2010.
Olha que interessante o gráfico da figura 4. Mostra que os dois índices cresciam juntos, porém, em 2013 os
custos deram uma “soluçada”. Porém, já no final de 2014, os dois encontraram-se novamente e diminuíram
a tendência de alta. Parece que 2015 foi o ano que chegamos a um ponto de inflexão da curva. Com a
tendência de inflação para o ano de 2015 acima da meta, penso compensar os investimentos que paguem
próximo a 100% do CDI e comprar o imóvel, se for a vista, só em 2016. Parece que a correção que Shiller
comenta no preço dos imóveis, feita pela própria inflação, está começando no Brasil.
Dúvidas sugestões, fiquem a vontade. Ideias para postagens? Podem enviar também. Este é um espaço
para compartilhar conhecimentos, análises e experiências.
Página 25
Análise de Dados
Fim do ano, 2016 batendo a porta, e por isto, vamos aproveitar para analisar alguns indicadores sobre
quantas anda nosso país. Serei breve nas reflexões comentários e darei mais ênfase nos dados e gráficos.
Assim, ficará um relatório mais breve de ser lido e mais rico de ser interpretado.
Vamos começar com o setor que há anos atrás, era a grande oportunidade e queridinho do Brasil:
construção. Como será que está nosso INCC (Índice Nacional de Custos da Construção)?
Figura 1: análise de tendência exponencial para o INCC de 1993 a 2015 – Fonte: FGV.
Pela figura 1, pode-se perceber que aproximar o INCC por uma curva exponencial, é uma boa
aproximação. Deste modo, é pode-se notar os anos em que o crescimento esteve acima e abaixo da curva.
Por meio desta observação é possível verificar os anos pré-aceleração (maio de 2003 até 2008) e o ano
pré-crise (2013). Parece, a primeira vista e sem muita análise, ser o INCC um bom indicador para
predizermos o comportamento do mercado imobiliário.
Outra análise interessante, é comparar o custo médio do m² (fonte:IBGE) com o INCC. Como será que estes
dois indicadores se comportam ao longo do tempo? Será que a indústria da construção está conseguindo
repassar seus custos ao valor do m²?
Página 26
Análise de Dados
Figura 2: comparação entre o custo médio do m² e INCC. Comparação feita por meio de um gráfico de
tendência e por meio de um gráfico de dispersão.
Pela figura 2, não é possível observar muitas alterações, com um R² de 98,4% e baixa dispersão do modelo.
Há dois degraus, um em 1999 e outro em 2013, que merecem destaque na curva do preço médio do m².
Mas mesmo assim, a relação dos dois é bastante forte.
Outro indicador, que interessa a todos, é o saldo dos empregos na construção civil. Como está o saldo
de empregos formais calculados pelo CAGED para o setor. Figura 3.
Página 27
Análise de Dados
Página 28
Análise de Dados
A indústria de transformação
E a indústria de transformação? Como será que está?
Página 29
Análise de Dados
Página 30
Análise de Dados
Quando olhamos para as horas trabalhadas na produção, o indicador de outubro de 2015 bate o recorde
negativo da série, chegando abaixo de agosto de 2003. Dispensas, férias coletivas e renegociação da
mão de obra, são alguns dos itens que a fábrica terá de negociar, se tudo continuar como está.
Página 31
Análise de Dados
Correlações: o post de hoje tem por objetivo ajudá-lo a entender uma das ferramentas mais utilizadas em
estatística para se verificar a existência de correlação entre variáveis. Já explicamos como interpretar
uma regressão linear e hoje iremos ensinar a como fazê-la no Excel. Ensinamos isto em nossa
certificação Green Belt e revisamos na Black Belt.
A primeira etapa da regressão é a coleta de dados. Para uma boa análise, uma boa coleta é
fundamental. Um extrato dos dados do nosso exemplo pode ser conferido na tabela 1 e correspondem a
um call center . A análise de interesse neste caso é saber se a variabilidade no número de atendimentos
do call center está correlacionada ao tamanho da equipe disponível para atendê-los. Esta análise é
importante, pois dirá à empresa se é necessário fazer contratações para que a meta de atendimentos
seja cumprida.
Tabela 1: Extrato da tabela oriunda do formulário de coleta de dados.
Dia Dia da Semana Time slot Intervalo de Tempo Chamadas atendidas Equipe
1 Mon 1 6-6:30 6 3
2 Tue 1 6-6:30 7 6
3 Wed 1 6-6:30 7 4
4 Thu 1 6-6:30 10 5
5 Fri 1 6-6:30 9 6
6 Mon 1 6-6:30 11 4
7 Tue 1 6-6:30 12 4
Após coletar e organizar os dados, partimos para elaboração da análise. Existem duas maneiras de se
fazer isto no Excel, uma via gráfico de dispersão e outra mais completa, utilizando o módulo de análise
de dados do Excel. É este que utilizaremos neste exemplo. Para acompanhar a análise, basta acompanhar
o passo a passo a seguir.
Página 32
Análise de Dados
Figura 1: Montar tabela de dados no Excel, ir ao menu dados e clicar em análise de dados.
Página 33
Análise de Dados
Figura 4: Selecionar o nível de confiança de 95% e Plotar resíduos e Plotar de probabilidade normal.
Página 34
Análise de Dados
Após realizar a sequência (fig. 1 a 6), você deve analisar o resultado obtido. Se você pedir ao Excel
uma análise de regressãopadrão ele não irá traçar os gráficos de resíduos, que são importantes para
Página 35
Análise de Dados
verificar a qualidade da sua análise. Muita gente incorre neste erro, até porque o Excel favorece esta
análise errônea.
Correlações: Análise
No exemplo deste artigo pedimos ao Excel que além da análise padrão (Estatística da Regressão) ele nos
mostrasse os resíduos da regressão. Com os resíduos expostos, pedimos ao Excel que ele nos mostrasse a
plotagem dos resíduos, a plotagem de probabilidade normal e a plotagem de ajuste de linha.
Estes gráficos servem para entendermos o comportamento dos resíduos, para analisarmos se há causas
especiais ou se os resíduos estão sob controle. Caso haja, não é recomendável utilizar a análise de
regressão elaborada. O outro gráfico, plotagem de probabilidade, serve para avaliarmos se a
distribuição dos resíduos é uma curva normal ou se é necessário transformar as variáveis. Caso este
gráfico seja uma reta, podemos concluir que a distribuição dos resíduos é normal.
O último gráfico, plotagem de ajuste de linha, nos informa o valor previsto e o compara com os dados
reais, permitindo a análise visual do comportamento dos resíduos ao longo do X. Se observarmos o
resíduo aumentar ao longo do eixo X, temos um forte indício de que algo está errado ou que a previsão
se deteriora a medida que X aumenta.
Somente após estas muitas análises é que podemos verificar se a nossa regressão é adequada ou não.
Caso não seja, uma das saídas possíveis é realizar a transformação das variáveis, como por exemplo,
para log. É muito comum em análises de regressão de dados econômicos, como o PIB, termos de
aplicar a transformação log nas variáveis, tanto na dependente (Y) como na independente (X). Ao
fazermos isto, repetimos a análise e verificamos se o comportamento dos resíduos está adequado. Caso
esteja, verificamos o novo R² e o novo coeficiente de correlação.
Correlações
Nesta vida de consultor de empresas, já observei várias barbaridades quando o assunto é regressão
linear. O primeiro erro é o fato de muitas pessoas pensarem que regressão é previsão. Não é. Regressão
é uma maneira de correlacionarmos variabilidade entre as variáveis. Outro erro é verificar a qualidade
da regressão pelo R². Também está errado. Precisamos avaliar o gráfico dos resíduos antes.
Ao ver tantos conceitos entendidos e aplicados de maneira errada, pergunto-me: qual será a razão para
isto? Acho que a principal é a falha do sistema educacional que forma pessoas sem os mínimos
conhecimentos técnicos em estatística, mas outra razão pode estar no Excel. O programa é muito bom, não
há dúvida, mas por ser muito fácil, permite que as pessoas façam coisas sem saber bem o porquê. Permite
que, qualquer pessoa, sem o conhecimento básico de estatística vá lá e extraia o R² de um conjunto de
dados.
Conceitos
Sem a devida revisão e aproveitando-se do pouco conhecimento estatístico disponível nas empresas, este
R² foge ao controle e vai parar numa reunião de planejamento estratégico. Lá, ele encontra a paixão
grega que nos persegue até hoje pela retórica, argumentação e elaboração de teorias sem
fundamentação nos experimentos e, após um ano, o estrago costuma ser grande. Portanto, ao usarmos o
Excel, devemos ir com calma. O software pressupõe que você domina o conceito por trás dele, portanto,
aprenda estatística básica, antes de utilizar o Excel.
Página 36
Análise de Dados
Uma das coisas boas do Minitab é que ele é mais complicado de mexer, a primeira vista, pois exige que
o operador esteja mais por dentro dos conceitos antes de utilizar a ferramenta para sair cuspindo dados
e análises rebuscadas.
Como dica: invistam no estudo e na capacitação da sua equipe nas ferramentas e conceitos de
estatística. Cada centavo investido retorna na proporção de 1:10 em menos de 1 ano. Só a quantidade
de deslizes que sua equipe deixará de fazer, vai economizar muito dor de cabeça e prejuízos.
Página 37
Análise de Dados
Dando continuidade aos nossos posts de análise de dados e da situação da construção de civil, vamos olhar
mais alguns indicadores. Como primeiro, vamos analisar o comportamento do cofre que paga tudo isto, a
poupança. Para isto, coletamos os dados de janeiro de 1995 até janeiro de 2015. São 10 anos de análise
do patrimônio liquido deste tipo de investimento.
Página 38
Análise de Dados
Pela figura 2, é possível verificar que há uma grande variação mensal na captação da poupança e, que
janeiro de 2015 a coisa foi realmente feia. Mas para parar de achar, vamos lançar mão de nosso famoso
gráfico x. Este irá nos informar se a variação está fora de controle e qual é a tendência da captação ao
longo dos anos.
Página 39
Análise de Dados
Endividamento da famílias: para terminar a semana vai um post rápido, mostrando a evolução do
endividamento das famílias brasileiras. Coletei os dados no Banco Central de duas séries histórias:
19882 – Endividamento das famílias com o Sistema Financeiro Nacional em relação à renda acumulada
dos últimos doze meses – %
20400 – Endividamento das famílias com o Sistema Financeiro Nacional exceto crédito habitacional em
relação à renda acumulada dos últimos doze meses – %
Este indicador é interessante, pois mede o grau de endividamento das famílias em relação a sua renda
acumulada. Este percentual só poderia subir em duas ocasiões: ou a renda das famílias está caindo ou o
endividamento aumentando. Como é de praxe em nossas análises, fiz 3 gráficos. Vamos aos gráficos:
Figura 1: evolução do endividamento das famílias com o Sistema Financeiro Nacional em relação à renda
acumulada dos últimos doze meses e endividamento das famílias com o Sistema Financeiro Nacional
exceto crédito habitacional em relação à renda acumulada dos últimos doze meses, ambos em %.
Figura 2: evolução da variação mensal do endividamento das famílias com o Sistema Financeiro Nacional
em relação à renda acumulada dos últimos doze meses.
Página 40
Análise de Dados
Figura 3: evolução da variação mensal do endividamento das famílias com o Sistema Financeiro Nacional
exceto crédito habitacional em relação à renda acumulada dos últimos doze meses.
Por este gráfico é possível verificarmos que as famílias só estão aumentando seu endividamento para
adquirem um imóvel. Parece-me que as famílias não estão querendo contrair mais dívidas ou os bancos
estão sendo mais criteriosos na concessão de mais crédito, não deixando as famílias se endividarem mais
que os 30%.
Isto por um lado é bom, pois mostra que uma possível crise de calote dificilmente irá acontecer, mas por
outro lado, o crescimento da economia puxado por este aumento no endividamento das famílias está
chegando ao fim. Assim, as perspectivas para o crescimento econômico nos próximos anos não são as
melhores.
Vamos ficar de olho no que vai acontecer, mas por estes dados para crescer mais o Brasil precisará de
mudanças que não sejam mais do mesmo. Se a produtividade do país não aumentar, as únicas mudanças
possíveis serão o perigoso aumento do endividamento a ser realizado por meio dos bancos públicos. Se
isto acontecer, melhor abrirmos o olho.
Sendo um Green Belt ou Black Belt da FM2S, você não é enrolado pelos jornais.
Página 41