Вы находитесь на странице: 1из 6

Nota de

pesquisa Utilização do Google Maps para o georreferenciamento


de dados do Sistema de Informações sobre Mortalidade
no município do Rio de Janeiro, 2010-2012*
doi: 10.5123/S1679-49742017000400018

Use of Google Maps for geocoding data from the Mortality Information
System in Rio de Janeiro municipality, Brazil, 2010-2012

Uso de Google Maps para georreferenciación de datos del Sistema de Informaciones


sobre Mortalidad en el municipio de Río de Janeiro, Brasil, 2010-2012

Ismael Henrique da Silveira1


Beatriz Fátima Alves de Oliveira2
Washington Leite Junger1

Universidade do Estado do Rio de Janeiro, Instituto de Medicina Social, Rio de Janeiro-RJ, Brasil
1

Fundação Instituto Oswaldo Cruz, Escola Nacional de Saúde Pública Sergio Arouca, Rio de Janeiro-RJ, Brasil
2

Resumo
Objetivo: descrever os resultados da aplicação de um procedimento de baixo custo, baseado em software livre, para o
georreferenciamento de dados do Sistema de Informações sobre Mortalidade (SIM) no município do Rio de Janeiro, Brasil.
Métodos: estudo descritivo, com uso da base de endereços do Google Maps para georreferenciamento de dados de óbitos
registrados no SIM, ocorridos no município entre 2010 e 2012; o trabalho foi realizado em três etapas, (i) padronização dos
endereços, (ii) georreferenciamento pelo Google e (iii) intervenção manual. Resultados: do total de 26.081 endereços submetidos
ao procedimento, 18.646 (71,5%) foram automaticamente georreferenciados; os 7.435 remanescentes foram submetidos a
intervenção manual, encontrando-se 5.250; 70,6% dos endereços não foram localizados inicialmente; afinal, 91,6% dos endereços
foram georreferenciados. Conclusão: o procedimento apresentou alta proporção de acertos automáticos e, apesar de demandar
maior tempo, a intervenção manual reduziu consideravelmente as perdas.
Palavras-chave: Mapeamento Geográfico; Sistemas de Informação Geográfica; Análise Espacial; Epidemiologia Descritiva.

*Manuscrito originado da dissertação de Mestrado de Ismael Henrique da Silveira, intitulada ‘Espaços verdes e mortalidade por
doenças cardiovasculares no município do Rio de Janeiro’, defendida junto ao programa de Pós-Graduação do Departamento de
Epidemiologia do Instituto de Medicina Social da Universidade do Estado do Rio de Janeiro em 2015.

Endereço para correspondência:


Ismael Henrique da Silveira – Rua São Francisco Xavier, no 524, sala 7013D, Maracanã, Rio de Janeiro-RJ. CEP: 20550-013
E-mail: ismaelhsilveira@gmail.com

Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017 881


Georreferenciamento de dados do SIM

Introdução seado em software livre, para o georreferenciamento


de dados do Sistema de Informações sobre Mortalidade
No Brasil, existem Sistemas de Informações em – SIM – no município do Rio de Janeiro, Brasil
Saúde (SIS) consolidados, a exemplo do Sistema de
Informações sobre Mortalidade (SIM) e do Sistema Métodos
de Informação de Agravos de Notificação (Sinan),1
que disponibilizam dados para análises de situação de Estudo descritivo de um método de georreferenciamento
saúde. Contudo, o georreferenciamento desses dados de dados sobre óbitos registrados no SIM, ocorridos no
em cidades brasileiras ainda é um desafio. Entre os município do Rio de Janeiro entre 2010 e 2012.
problemas mais comuns destacam-se a qualidade dos Em 2010, a população do município era de 6.320.446
dados, a falta de sistemas de informações geográficas habitantes, dos quais 2,62% vivendo em extrema po-
(SIG) municipais estruturados, a falta de bases cartográ- breza. No mesmo ano, o índice de desenvolvimento
ficas digitais e cadastros oficiais de endereços, além da humano municipal era de 0,799. O produto interno
complexidade da infraestrutura urbana, principalmente bruto per capita era de 46.461,82 reais em 2014.7 A
em áreas carentes como ocupações irregulares e favelas, cobertura da Atenção Básica no município era de 52%
onde é comum a não padronização dos endereços.2 em fevereiro de 2017.8
Os SIG são usados para descrever, analisar e prever Os dados de óbitos ocorridos no período, por doen-
padrões espaciais, dispondo de diversas aplicações em ças isquêmicas do coração (DIC) e cerebrovasculares
epidemiologia, como o mapeamento de doenças, a inves- (DCBV), correspondentes aos códigos I20 a I25 e I60 a
tigação de surtos e análises espaciais.3 Seu uso depende, I69 da Décima Revisão da Classificação Internacional de
sobretudo, da disponibilidade de dados georreferenciados. Doenças (CID-10), foram obtidos do SIM da Secretaria
O georreferenciamento, por sua vez, é o processo pelo Municipal de Saúde do Rio de Janeiro.
qual informações textuais descritivas de uma localidade, O trabalho foi realizado em três etapas: (I) padroni-
como o endereço relacionado a um evento de saúde, são zação dos endereços, (II) georreferenciamento por meio
convertidas em representações geográficas válidas. Ele do Google Maps e (III) intervenção manual (Figura 1).
pode ser realizado por meio da associação a um par de A padronização dos endereços, programada em R,9
coordenadas geográficas ou a unidades espaciais, como buscou corrigir erros frequentes, remover caracteres
setores censitários, bairros, municípios, entre outras.4,5 estranhos e padronizar componentes relacionados aos
tipos (avenida, praça, rua) e aos títulos (Presidente,
Os SIG são usados para descrever, Professora, Princesa) dos logradouros. As substituições
analisar e prever padrões espaciais, realizadas constam em material suplementar. Embora
essa etapa não tenha eliminado todos os erros, ela foi
dispondo de diversas aplicações em útil para aumentar a quantidade de endereços geor-
epidemiologia, como o mapeamento referenciados automaticamente.
de doenças, a investigação de surtos O georreferenciamento foi realizado por meio da
e análises espaciais. Seu uso depende, Interface de Programação de Aplicativos (API) do Google,
acessada com um script programado em R. A API de
sobretudo, da disponibilidade de georreferenciamento compara os endereços informa-
dados georreferenciados. dos com a base do Google Maps, para a captura das
coordenadas geográficas. A utilização gratuita permite a
As ferramentas de georreferenciamento, concomi- requisição diária de até 2.500 pares de coordenadas.10 A
tantemente aos avanços da informática, têm apresentado API também retorna o endereço localizado e sua precisão,
melhorias em termos de qualidade, acessibilidade e redução como residência, edificação específica (condomínio,
de custos. A escolha do método depende da disponibilidade parque, aeroporto), logradouro, bairro, cidade etc.
de informações e bases cartográficas, da precisão desejada, Para verificar a qualidade do georreferenciamento, os
do volume de dados e dos recursos disponíveis.5,6 endereços encontrados pelo Google receberam o mesmo
O objetivo deste trabalho foi descrever os resultados tratamento dos informados, sendo comparados entre
da aplicação de um procedimento de baixo custo, ba- si. Quando não correspondentes, foram transferidos

882 Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017


Ismael Henrique da Silveira e colaboradores

Fase I
Padronização dos endereços

Endereços encontrados no Comparação dos endereços


nível da residência informados e encontrados
Fase II
Georreferenciamento pela
APIa do Google
Endereços não encontrados

Fase III Endereços georreferenciados


Intervenção manual

Perdas

a) API: Application Programming Interface (Interface de Programação de Aplicativos).


Figura 1 – Diagrama representando as três fases do procedimento de georreferenciamento de dados do Sistema
de Informações sobre Mortalidade no município do Rio de Janeiro, 2010-2012

para intervenção manual, juntamente com os demais Resultados


endereços não localizados. Ademais, uma amostra de
100 endereços georreferenciados automaticamente foi Dos 26.081 endereços submetidos ao procedimento,
analisada manualmente, para verificar se a coordenada 18.646 (71,5%) foram georreferenciados automa-
correspondia ao endereço informado. ticamente. A correspondência entre os endereços
Na etapa manual, erros ortográficos remanes- informados e os encontrados, na amostra analisada
centes foram corrigidos e novamente submetidos manualmente, foi de 100%. Os restantes, 7.435,
ao georreferenciamento automático. Casos mais foram encaminhados para intervenção manual, pela
complexos exigiram pesquisas manuais, por meio qual foram recuperados 5.250, 70,6% dos endereços
do Google Street View, que permite a visualização do não localizados inicialmente. Ao final, 91,6% foram
logradouro, e da base de logradouros do município, georreferenciados. A etapa manual dispendeu o maior
obtida do Instituto Pereira Passos. Endereços sem tempo, devido à análise individual de cada endereço. A
número foram georreferenciados nos pontos médios Tabela 1 apresenta os principais resultados.
dos logradouros, quando contidos em um setor cen- A Figura 2 mostra a distribuição espacial do per-
sitário, devido ao uso desses dados em um estudo centual de perdas por bairro. A maior proporção
epidemiológico. Quando não contido, o endereço correspondeu à Rocinha, maior favela do país. Os
foi considerado perda. A verificação baseou-se na bairros que tiveram perdas acima de 15% foram: Barra
sobreposição das bases de logradouros e de setores de Guaratiba; Paquetá; Jacarezinho; Vidigal; Alto da Boa
censitários, obtida da Fundação Instituto Brasileiro Vista; Pitangueiras; Itanhangá; Complexo do Alemão;
de Geografia e Estatística (IBGE). Galeão; Parada de Lucas; Gamboa; Manguinhos; Man-
As perdas foram analisadas pelo mapa de distribuição gueira; Maré; Jacaré; Tauá; Caju; Jacarepaguá; Acari;
do percentual por bairro, dado pelo quociente entre Inhaúma; Vargem Pequena; Saúde; Santa Cruz; Barros
o número de perdas e de óbitos (Figura 2). Foram Filho; Curicica; Sepetiba; e Costa Barros.
utilizados os softwares R 3.3.2 e QGIS 2.14.
O estudo foi aprovado pelos Comitês de Ética em Discussão
Pesquisa do Instituto de Medicina Social da Universidade
do Estado do Rio de Janeiro (UERJ) e da Secretaria O georreferenciamento de dados do SIM no Rio de
Municipal de Saúde do Rio de Janeiro (Parecer no Janeiro, utilizando a API do Google, teve alta proporção
531.635, em maio de 2014). de acertos, apesar das dificuldades relacionadas à

Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017 883


Georreferenciamento de dados do SIM

Tabela 1 – Número de endereços georreferenciados e tempo gasto em cada etapa do georreferenciamento de


dados do Sistema de Informações sobre Mortalidade no município do Rio de Janeiro, 2010-2012

Endereços
Etapas do georreferenciamento Endereços submetidos Tempo gasto
georreferenciados
Etapa 1 – Padronização dos endereços 26.081 – <1 dia
Etapa II – Georreferenciamento pela APIa do Google 26.081 18.646 1-2 semanas
Etapa III – Intervenção manual 7.435 5.250 Aproximadamente 4 meses
a) API: Application Programming Interface (Interface de Programação de Aplicativos).

 
Figura 2 – Distribuição do percentual de perdas segundo bairros, no georreferenciamento de dados do Sistema
de Informações sobre Mortalidade no município do Rio de Janeiro, 2010-2012

qualidade dos dados e às condições da infraestrutura Rua Projetada etc.), frequentemente, eram perdidos por
urbana, marcada por inúmeras ocupações irregulares. haver mais de um logradouro com o mesmo nome no
A etapa manual foi importante por aproveitar 70% dos bairro. Em alguns desses casos, o CEP, quando presente,
dados não georreferenciados automaticamente, reduzindo facilitava a localização.
as perdas a 8,4%. As perdas foram maiores em bairros Programas de SIG e serviços comerciais, geralmente, são
menos urbanizados, com assentamentos recentes e/ou capazes de georreferenciar de 70 a 80% de endereços.11
ocupações irregulares, e de menor nível socioeconômico. Em 2003, experiências em munícipios brasileiros como
Foram identificados erros de inúmeras naturezas, Belo Horizonte e Goiânia, onde há SIG estruturados para
possivelmente devidos ao informante, ao responsável georreferenciar endereços dos SIS, apresentaram desem-
pelo registro ou digitação do banco, e à base do Google. penho acima de 90%; em Porto Alegre e no Rio de Janeiro,
Houve erros ortográficos, no tipo e/ou título do logra- utilizando-se de técnicas de interpolação em logradouros,
douro, grafias diferentes, nomes diferentes com alguma esse desempenho variou entre 60 e 90%.2 Em um trabalho
semelhança fonética, ou mesmo o fato de e logradouro ser de georreferenciamento por interpolação em logradouros,
reconhecido por um nome diferente do cadastro oficial. sobre agravos notificados pelo Sinan em Campinas, Macapá
A confusão entre bairros foi frequente, especialmente e Rio de Janeiro, datado de 2004, os acertos automáticos
quando vizinhos. Outro problema recorrente foi a falta de foram, respectivamente, de 49, 72 e 48%, e a busca manual
preenchimento dos campos de endereço, principalmente acrescentou 34, 20 e 17% dos totais de endereços.12 Outro
do número. Endereços pouco informativos (Rua Um, trabalho, realizado no Rio de Janeiro em 2014, envolvendo

884 Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017


Ismael Henrique da Silveira e colaboradores

dados de tuberculose do Sinan, comparou técnicas baseadas A ferramenta é útil em atividades de vigilância epide-
na API do Google e na interpolação com programa comer- miológica e gestão de serviços com base no território e na
cial: a primeira apresentou melhor desempenho, atingindo pesquisa epidemiológica sobre determinantes ambientais,
69% – contra 64% de acertos do programa comercial.13 entre outras aplicações. Seu desempenho depende da
Conforme ressaltado por Magalhães et al.,13 diante qualidade dos dados e do endereçamento municipal:
da realidade cartográfica do país, em algumas locali- quanto maior o detalhamento do endereço, menores
dades a utilização da API do Google pode ser a única serão as perdas. Apesar de o georreferenciamento de
opção para o georreferenciamento. Além disso, a base dados ser acessível e de baixo custo, sua incorporação
do Google Maps pode estar mais atualizada que muitas em serviços de saúde demanda pessoal com habilidades
bases cartográficas oficiais de municípios, embora não em informática e disponibilidade para a busca manual.
atenda a todos com igual precisão.
O georreferenciamento pode conter erros, em função Contribuição dos autores
do mapeamento ou da acurácia do Google. Erros no
mapeamento tendem a ser pouco frequentes entre os Silveira IH foi responsável pela concepção do estudo,
dados georreferenciados automaticamente, visto que são análise e interpretação dos resultados e redação do
locais com melhor endereçamento. A acurácia, por sua manuscrito. Oliveira BFA colaborou na análise dos resul-
vez, diz respeito à proximidade da coordenada obtida tados e revisão do manuscrito. Junger WL colaborou nas
– por meio do Google – do valor real. Esses erros têm etapas de programação e revisão do manuscrito. Todos
sido cada vez menores, devido aos esforços do Google os autores aprovaram a versão final do manuscrito,
no mapeamento de cidades e à crescente utilização das sendo responsáveis por todos os aspectos do trabalho
API para inúmeras finalidades de geolocalização. e garantindo sua precisão e integridade.

Referências
1. Ministério da Saúde (BR). Biblioteca Virtual em of geocoding. J Urban Reg Inf Syst Assoc. 2007
Saúde. Vigilância em Saúde. Sistemas de Informação: Jan;19(1):33-46.
informações estratégicas [Internet]. 2008 [citado
6. Rushton G, Armstrong MP, Gittler J, Greene BR,
2016 jun 15]. Disponível em: http://bvsms.saude.gov.
Pavlik CE, West MM, et al. Geocoding in cancer
br/bvs/svs/inf_sist_informacao.php.
research: a review. Am J Prev Med. 2006 Fev;30(2
2. Barcellos C, Ramalho WM, Gracie R, Magalhães Suppl):16-24.
MAFM, Fontes MP, Skaba DA. Georreferenciamento
7. Instituto Brasileiro de Geografia e Estatística.
de dados de saúde na escala submunicipal: algumas
Cidades@ [Internet]. 2014 [citado 2017 mar 20].
experiências no Brasil. Epidemiol Serv Saúde. 2008
Disponível em: http://cidades.ibge.gov.br/xtras/home.
mar;17(1):59-70.
php?lang=
3. Kirby RS, Delmelle E, Eberth JM. Advances in
8. Ministério da Saúde (BR). Departamento de Atenção
spatial epidemiology and geographic information
Básica. Nota técnica: sistema de nota técnica do DAB
systems. Ann Epidemiol [Internet]. 2017 Jan[cited
[Internet]. 2017 [citado 2017 mar 20]. Disponível
2017 Jan 10];27(1):1-9. Available from: http://
em: http://dab2.saude.gov.br/sistemas/notatecnica/
www.annalsofepidemiology.org/article/S1047-
frmListaMunic.php.
2797(16)30495-1/fulltext
9. R Core Team. R: a language and environment for
4. Goldberg DW. A geocoding best practices guide
statistical computing [Internet]. Viena: R Foundation
[Internet]. Springfield: North American Association of
for Statistical Computing; 2017 [cited 2017 Mar 20].
Central Cancer Registries; 2008 [cited 2017 Ago 28]. 287
Available from: https://www.r-project.org/
p. Available from: https://20tqtx36s1la18rvn82wcmpn-
wpengine.netdna-ssl.com/wp-content/uploads/2016/11/ 10. Google. Google maps geocoding API [Internet].
Geocoding_Best_Practices.pdf 2016 [citado 2017 mar 24]. Disponível em: https://
developers.google.com/maps/documentation/
5. Goldberg DW, Wilson JP, Knoblock CA. From
geocoding/
text to geographic coordinates: the current state

Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017 885


Georreferenciamento de dados do SIM

11. Sonderman JS, Mumma MT, Cohen SS, Cope EL, 13. Magalhães MAFM, Matos VP, Medronho RA.
Blot WJ, Signorello LB. A multi-stage approach to Avaliação do dado sobre endereço no Sistema de
maximizing geocoding success in a large population- Informação de Agravos de Notificação utilizando
based cohort study through automated and interactive georreferenciamento em nível local de casos de
processes. Geospat Health. 2012 May;6(2):273-84. tuberculose por dois métodos no município do
Rio de Janeiro. Cad Saúde Coletiva. 2014 abr-
12. Skaba DA, Carvalho MS, Barcellos C, Martins PC,
jun;22(2):192-9.
Terron SL. Geoprocessamento dos dados da saúde: o
tratamento dos endereços. Cad Saúde Pública. 2004
nov-dez; 20(6):1753-6.

Abstract Resumen
Objective: to describe the results of the application of Objetivo: describir los resultados de la aplicación
a low cost procedure, using free software, for geocoding de un procedimiento de bajo costo basado en software
data from the Mortality Information System (SIM), in libre para la georreferenciación de datos del Sistema de
the municipality of Rio de Janeiro. Methods: descriptive Informaciones sobre Mortalidad (SIM), en el municipio
study using Google Maps database for geocoding deaths de Río de Janeiro. Métodos: estudio descriptivo
data recorded at SIM, occurred from 2010 to 2012, in Rio utilizando la base de direcciones de Google Maps para
de Janeiro; the study was carried out in three stages, (i) la georreferenciación de datos de óbitos registrados
standardization of addresses, (ii) geocoding by Google en el SIM, ocurridos del 2010 al 2012, en el municipio
Maps, and (iii) manual intervention. Results: from the de Río de Janeiro; el trabajo se llevó a cabo en tres
total of 26,081 addresses submitted to the procedure, etapas, (i) estandarización de las direcciones, (ii)
18,646 (71.5%) had exact matches; the remaining georreferenciación por Google e (iii) intervención
7,435 were submitted to manual intervention, which manual. Resultados: de 26.081 direcciones sometidas al
found 5,250; 70.6% of the addresses were not initially procedimiento, 18.646 (71,5%) fueron automáticamente
found; a total of 91.6% of the addresses were geocoded. georreferenciadas; el restante, 7.435, se enviaron
Conclusion: the procedure presented high proportion a intervención manual, donde fueron encontrados
of automatic matches and, although it demanded much 5.250; al final, se georreferencio 91,6%. Conclusión: el
time, manual intervention allowed a considerable procedimiento presentó una alta proporción de aciertos
reduction of losses. automáticos y, a pesar de demandar más tiempo,
Keywords: Geographic Mapping; Geographic la intervención manual permitió una considerable
Information Systems; Spatial Analysis; Epidemiology, reducción de las pérdidas.
Descriptive. Palabras-clave: Mapeo Geográfico; Sistemas
de Información Geográfica; Análisis Espacial;
Epidemiología Descriptiva.

Recebido em 14/03/2017
Aprovado em 25/07/2017

886 Epidemiol. Serv. Saude, Brasília, 26(4):881-886, out-dez 2017

Вам также может понравиться