Академический Документы
Профессиональный Документы
Культура Документы
Projeto de Doutorado
Aluno: Rafael Alceste Berri
São Carlos – SP
Julho/2014
Resumo
A distração ao volante é uma ação que leva o motorista a desviar a atenção
da pista por alguns segundos e representa aproximadamente metade dos casos de
acidentes no trânsito. Em rodovias federais brasileiras, cerca de 63.000 acidentes, em
2010, tiveram relação com a desatenção do motorista. As distrações do motorista
possuem três origens principais: visual (quando os olhos estão fora da estrada), mãos
(mãos fora do volante) e cognitiva (mente dispersa ou focada em outra tarefa). Este
projeto de pesquisa visa o desenvolvimento de um sistema avançado de assistência
ao condutor (ADAS) não intrusivo capaz de detectar comportamentos de condutores
de veículos em situações perigosas: de uso de celular, de sonolência e de embriaguez.
Serão pesquisados, pelo menos, dois tipos distintos de percepção e aquisição
de dados: imagens 2D e dados provenientes de sensores 3D. A pesquisa inicia-se uti-
lizando imagens 2D junto com um levantamento bibliográfico sobre atenção visual e
detecção de movimento para este tipo de entrada. No projeto, a atenção visual fun-
cionará como um filtro que simplificará a entrada de dados do sistema; já a detecção
de movimento dará apoio temporal à solução verificando e rastreando movimentos
ditos perigosos. Posteriormente objetiva-se estudar e desenvolver novas técnicas e
algoritmos de atenção visual e detecção de movimentos, aplicando-os em dados 3D,
sendo esta a principal contribuição esperada pela pesquisa.
Como resultado desta pesquisa, espera-se propor, desenvolver e aperfeiçoar
algoritmos de percepção e análise de dados espaciais (3D) descrevendo comporta-
mentos dinâmicos. Por meio do uso de técnicas de aprendizado de máquina, serão
desenvolvidos métodos para o reconhecimento de comportamentos do motorista,
que possam vir a representar um perigo na condução do veículo. Por fim, também
será estudada a possibilidade de aplicar técnicas de integração dos dados referentes
ao comportamento do motorista, juntamente com os dados referentes ao compor-
tamento do veículo, a fim de realizar uma análise mais completa da condução do
veículo.
1 Identificação do Projeto
1.1 Dados Gerais do Projeto
Proponente e Coordenador: Prof. Dr. Fernando Santos Osório
Instituição: USP – ICMC – PPG CCMC (São Carlos, SP)
Departamento de Sistemas de Computação – SSC
Laboratório de Robótica Móvel – Web: http://www.lrm.icmc.usp.br/
2
sador / concursado estatutário – tempo integral e dedicação exclusiva)
2 Introdução
2.1 Contextualização e Motivação
A distração ao volante (1, 2), ou seja, uma ação que leve o motorista a desviar
a atenção da pista por alguns segundos, representa aproximadamente metade dos
casos de acidentes no trânsito. Em rodovias federais brasileiras, cerca de 63.000
acidentes, em 2010, tiveram relação com a desatenção do motorista (3).
As distrações do motorista possuem três origens principais: visual (quando os
olhos estão fora da estrada), mãos (mãos fora do volante) e cognitiva (mente dispersa
ou focada em outra tarefa) (4).
O objetivo desta pesquisa é propor um sistema avançado de assistência ao
condutor (ADAS) não intrusivo capaz de detectar comportamentos de condutores
de veículos em situações perigosas: de uso de celular, de sonolência e de embriaguez.
Nos últimos anos, o uso do celular, vem se mantendo frequente entre os con-
dutores. A cada instante entre 4% e 6% dos automóveis em rodovias americanas
estão sendo conduzidos por pessoas falando ao celular (5). Falar ao celular enquanto
3
dirige aumenta o risco de colisão de 4 a 6 vezes (6, 7). Em alguns países permite-se
efetuar ligações telefônicas usando hands-free (fones de ouvido ou viva-voz), porém
seu uso distrai o motorista de modo similar à utilização do celular ao ouvido (8).
Nota-se uma redução no processamento de informações visuais quando pessoas estão
em conversas telefônicas (9) e um aumento significativo da distração cognitiva (10).
A sonolência causa cerca de 100.000 acidentes nas estradas dos Estados Unidos,
segundo a National Highway Traffic Safety Administration (NHTSA), o que resulta
em mais de 1.500 mortos e 71.000 feridos ao ano. Isso equivale a 1, 6% de todos os
acidentes e de 3, 6% dos acidentes fatais (11).
Motorista embriagados causaram 1.800 mortes nas estradas americanas em
2008, número que representa 30% do total de mortes causada por distrações neste
período (12). Um estudo realizado em 143 cidades brasileiras em 2009 indicou que
beber e dirigir é aceitável para 35% da população (13). Pesquisa realizada em bares
de Porto Alegre constatou que 51% dos motoristas frequentadores desses lugares
iriam dirigir seus veículos após a ingestão de álcool e que apenas 9% deles já haviam
sido abordados, alguma vez na vida, pela polícia para realizar o bafômetro (14).
Leis vêm sendo criadas nos últimos anos em muitos países com o intuito de
minimizar estes números. Porém, as leis e a fiscalização não são capazes de impe-
dir que motoristas falem ao celular, ou dirijam por longos períodos, ou mesmo, se
julguem aptos a desempenhar a direção do veículo.
O problema a ser tratado será o desenvolvimento de processos e ferramentas
para se adquirir e processar dados, que por sua vez, permitam analisar o compor-
tamento e o modo de condução do veículo pelo motorista. Esta pesquisa irá buscar,
por meio computacional e não intrusivo, detectar situações de risco de uso de celular,
de sonolência e de embriaguez, contribuindo assim para avançar o estado da arte de
sistemas de apoio à direção e para minimizar o número de acidentes dessas origens.
2.2 Objetivos
2.2.1 Geral
O objetivo geral deste trabalho é pesquisar e desenvolver técnicas avançadas
para análise do comportamento de condutores de veículos e identificar situações
de uso de celular, sonolência e embriaguez, permitindo assim, a construção de um
sistema avançado de assistência ao condutor (ADAS) para inibir estas situações de
risco.
2.2.2 Específicos
∙ Buscar e desenvolver algoritmos de atenção visual que permitam focar em ele-
mentos da cena que se diferenciam e destacam de uma situação convencional;
∙ Adaptar algoritmos de detecção de movimentos que tradicionalmente são ba-
seados em imagens (2D) para o uso de sensores 3D;
∙ Pesquisar, desenvolver e aperfeiçoar algoritmos de percepção e análise de dados
3D descrevendo comportamentos dinâmicos;
∙ Desenvolver e aperfeiçoar algoritmos de atenção espacial e de análise da dinâ-
mica da cena (por exemplo, algoritmos baseados em fluxo ótico e na análise
de densidade e da variação da ocupação espacial em grades de ocupação 3D);
∙ Pesquisar técnicas de integração dos dados referentes ao comportamento do
motorista, juntamente com os dados referentes ao comportamento do veículo
4
(por exemplo, usando uma unidade inercial - IMU);
∙ Buscar trabalhar com sensores inteligentes 3D do estado da arte;
∙ Escolher características que, extraídas de dados 3D (point clouds) adquiridos
no interior do veículo, permitam a identificação das situações de riscos por meio
de algoritmos de aprendizado de máquina (classificação e reconhecimento de
padrões);
∙ Buscar novas técnicas de segmentação e tracking em 3D.
2.4 Apresentação
A apresentação deste projeto de pesquisa se dá da seguinte forma: ferramentas
de suporte à solução são definidas na Seção 3; na Seção 4 trabalhos relacionados são
mostrados; trabalhos anteriores da equipe relacionados ao tema são apresentados na
Seção 5; a Seção 6 contém alguns métodos e equipamentos que serão testados quanto
a sua viabilidade para aplicação no sistema final; as principais contribuições ao final
da pesquisa são apresentadas na Seção 7; na Seção 8 as condições de execução do
projeto e infraestrutura são mostradas; e por fim o cronograma das atividades é
apresentado na Seção 9.
3 Referencial Teórico
Nesta seção apresentam-se conceitos necessários para a compreensão do foco
da pesquisa pretendida.
5
cialmente importantes, como por exemplo: o movimento de um predador ou
regiões de cores distintas.
∙ Endógeno (Top-down): o cérebro induz a procura por uma ou várias caracte-
rísticas desejáveis no momento. Foca em estratégias cognitivas de longo prazo.
Caso o animal está com fome tende a buscar pontos coloridos em busca de
alimento. Caso suspeite de algum predador na área buscará por animais qua-
drúpedes.
Margem
Vetores de
Suporte
Hiperplano de
Separação
6
Com a SVM é possível utilizar algumas funções de kernels para tratar da-
dos não lineares (não possuem margem de separação linear entre classes). A função
de kernel transforma os dados originais em um espaço de características de alta
dimensionalidade, onde as separações não lineares podem se apresentar sob forma
linear (26). Dentre os kernels existentes pode-se citar: Linear (Equação 1), Poli-
nomial (Equação 2), Radial basis function (Equação 3) e Sigmoide (Equação 4).
A escolha de uma função adequada (mais acurada) e de parâmetros (𝛾, 𝑑𝑒𝑔𝑟𝑒𝑒 e
𝑐𝑜𝑒𝑓 0) corretos são importantes passos para atingir a alta acurácia do sistema de
classificação.
7
f(x) = sgn( + b) classificação
1 2 3 4 pesos
K K K K comparação (kernel)
vetores de suporte
7 1 4 1
x1 ... x4
1 entrada do vetor x
A rede MLP pode resolver problemas não lineares e é uma ferramenta de classificação
multi-classes.
Existem três tipos de camadas presentes em uma rede MLP (30). A primeira
camada é responsável por receber os dados, não realizando nenhum tipo de processa-
mento e seu número de neurônios é igual a quantidade de variáveis (características).
A última camada é denominada camada de saída, pois é a camada responsável por
retornar a resposta calculada pela rede. A quantidade de neurônios desta camada
depende da quantidade de bits de saída da rede. Entre estas pode haver uma ou mais
camadas intermediárias (ocultas), o número depende da complexidade do problema.
Na Figura 3, é mostrado um exemplo de uma rede MLP com 4 neurônios na camada
de entrada, 3 neurônios na camada intermediária e 2 neurônios na camada de saída.
Camada de
entrada
x1 Camada
Intermediária
Camada de
Saída
x2 y1
x3 y2
x4
8
para a camada seguinte. A escolha da função ativação correta e dos parâmetros (𝛼
e 𝛽) ajustados ao problema, nas demais camadas, levam a alta acurácia do classifi-
cador.
𝑓 (𝑥) = 𝑥 (8)
𝛽(1 − 𝑒−𝛼𝑥 )
𝑓 (𝑥) = (9)
(1 + 𝑒−𝛼𝑥 )
2
𝑓 (𝑥) = 𝛽𝑒−𝛼𝑥 (10)
Uma rede MLP precisa ser treinada para estar apta a classificar. Um dos
treinamentos possíveis é o denominado backpropagation (31). Este processo visa
descobrir os pesos que melhoram a acurácia da rede e se dá pela redução gradual
do erro da rede. Os erros são estimados utilizando-se os valores de treinamentos já
previamente rotulados.
3.3 Considerações
A atenção visual visa identificar regiões da cena relevantes (segmentação)
com relação ao comportamento do motorista. Por meio destas regiões destacadas
objetiva-se extrair características que permitam o monitoramento do motorista.
Espera-se que a importante tarefa de rotular a atividade em uso do celular, so-
nolência, embriaguez e atividade normal seja executada por classificadores SVM ou
MLP após treinamento.
4 Trabalhos Relacionados
Nesta seção, trabalhos que se relacionam com a pesquisa são apresentados.
Controle Lateral: Estes sistemas procuram prever saídas de pista não intencionais
ou mudanças de faixa perigosas. Pode-se citar como exemplos:
∙ Aviso de Saída de Faixa (Lane Departure Warning): é utilizado na
ajuda aos motoristas em manter-se dentro da faixa de rodagem. Sua fun-
ção, portanto, é avisar quando o veículo está saindo da pista atual de
9
maneira inadequada ou perigosa, verificando-se para tanto objetos pró-
ximos e o acionamento das luzes de sinalização (indicando a intenção de
troca de faixa) (37). Estes sistemas são projetados para minimizar coli-
sões causadas principalmente por: erro do motorista, distrações ou mesmo
sonolência.
∙ Ponto Cego (Blind Spot): monitora a área lateral ao veículo, local onde
os condutores não conseguem ver pelos retrovisores exteriores (38). Se
o sistema detectar um veículo nesta região, sinais acústicos e/ou visuais
alertam o motorista do risco de colisão.
Controle Longitudinal: Abrange controle de velocidade, de distâncias e tempos
de reação. Exemplos desses tipos de aplicação são:
∙ Controle de velocidade de Cruzeiro Adaptativo (Adaptive Cruise
Control): ajusta automaticamente a distância para o veículo à frente e a
velocidade, utilizando-se de sensores para medir a distância longitudinal
entre os veículos (39). Seu objetivo é melhorar o conforto na condução,
reduzir acidentes de trânsito e aumentar o fluxo de tráfego (velocidade
média).
∙ Assistente de Luz Alta (High-beam Assist): o sistema detecta a luz
dos veículos que circulam em sentido contrário ou os que estão à frente,
alternando entre luz alta e média (40).
∙ Reconhecimento de Sinais de Trânsito (Traffic Sign Recognition):
tem por objetivo ajudar o motorista a detectar e classificar os sinais de
trânsito que definem perigos e limitações das estradas (41). Com este
sistema pode-se reconhecer, por exemplo, o limite de velocidade ou curvas
acentuadas à frente.
Auxílio ao Estacionamento e Marcha Ré: São sistemas de detecção de obstá-
culos em situações de baixa velocidade. O Assistente de Estacionamento (Park
Assist) é um exemplo de abordagem dessa categoria, sendo um recurso que per-
mite ao veículo estacionar sozinho, envolvendo direção automática e controle
de velocidade (42).
Melhoramento da Visão: Dá suporte ao motorista em situações de visibilidade
reduzida. Como exemplo, pode-se citar a Visão Noturna (Night Vision) cujo
objetivo é ampliar a capacidade do motorista em visualizar obstáculos du-
rante as horas escuras do dia, utilizando-se de câmeras sensíveis a radiação
infravermelha (39). Enquanto a maioria dos faróis dos automóveis pode ilumi-
nar a estrada cerca de 60 metros à frente do veículo, este sistema permite aos
condutores obter informações sobre o tráfego de até 150 metros de distância.
Anti-colisão: São sistemas que visam evitar ou minimizar os possíveis problemas de
um acidente em curso, atuam quando o motorista pode não ter mais condição
de reação. Como exemplos dessa categoria de ADAS, pode-se citar:
∙ Airbags: São sacos inflados, muito rapidamente, com ar no momento que
ocorre a colisão do veículo (43). Os airbags mais comuns são os frontais
e laterais que protegem os ocupantes do veículo.
∙ Aviso de Colisão Frontal (Forward Collision Warning): o sistema for-
nece avisos (visuais, auditivos ou vibrações) ao condutor quando detec-
tado um provável acidente iminente com o veículo à frente (44).
∙ Detecção de Objeto (Object Detection): visa detectar objetos, os mais
diversos a se colocar na trajetória do veículo. Um exemplo desse tipo de
10
abordagem é a detecção de pedestres a fim de alertar o condutor. Em
alguns casos pode ainda executar frenagem automática ou mesmo abrir
airbags externos (no caso de uma colisão inevitável) (45).
Monitoramento da Superfície da Estrada: Tem como principal objetivo aler-
tar o condutor em caso de más condições da pista. O sistema pode emitir
avisos ou estar diretamente relacionado ao sistema de controle de velocidade,
por exemplo, ajudando o motorista a manter-se na velocidade apropriada para
as condições atuais da pista.
Monitoramento do Motorista: Concentra-se no estado fisiológico e comporta-
mental do motorista, informando quando a tarefa de dirigir não pode ser ade-
quadamente executada pelo condutor. O monitoramento do estado condutor
pode ser dividido em duas ramificações principais: a detecção de distrações e
a identificação de sonolência (46, p. 23). Este projeto de pesquisa direciona-se
para geração de soluções para esta categoria de ADAS.
Controle de Velocidade
de Cruzeiro Adaptativo
Monitoramento
Visão Noturna Ponto Cego do motorista
11
para a captura e processamento dos sinais. O objetivo dos avisos sonoros é estimar
a posição em que se encontra o celular. Em outras palavras, se é o motorista quem
está utilizando o mesmo ou algum outro passageiro do veículo. A proposta obteve
precisão de classificação de mais de 90% (49). No entanto, o sistema depende, para
operação, de um software habilitado continuamente no celular pelo motorista. A
grande vantagem da técnica é o seu funcionamento mesmo utilizando o celular com
fones de ouvido (Hands-free).
Enriquez et al. estudam formas de segmentar a pele. O algoritmo, apresentado
pelos autores, analisa dois espaço de cores, YCbCr e o LUX, utilizando as coordena-
das CR e U, especificamente (50). A grande vantagem do algoritmo é a possibilidade
de utilização em uma câmera simples (webcam) para aquisição da imagem.
Outra proposta apresentada por Watkins et al. é a de identificar autonoma-
mente comportamentos distraídos do motorista associados a mensagens de texto em
celular. A abordagem utiliza um telefone celular programado para registrar toda e
qualquer digitação efetuada e, por meio de análise do histórico de atividades, cons-
tatar a ocorrência de distrações (51).
Além destes trabalhos foi feito um estudo, do autor deste projeto de pesquisa,
sobre a detecção de celular (52). Os detalhes do estudo encontram-se na Seção 5.1.
12
O sistema proposto por Carroll et. al. (60) verifica o teor de álcool no san-
gue do motorista por meio de sensores transdérmicos incorporados ao volante do
veículo. Estando acima de um limiar o sistema impede o funcionamento do veículo.
A medição do teor de álcool é feita por algoritmos neurais previamente treinados
a receber as informações dos sensores. Já a proposta de Edmonds III e Hopta (61)
funciona de forma similar, porém, o teor de álcool é medido pela intensidade dos
comprimentos de ondas que emergem do dedo do condutor. Um microprocessador
correlaciona a intensidade coletada com o teor de álcool. Para garantir que o dedo
do principal condutor do veículo está sendo analisado, o sistema ainda identifica a
impressão digital.
O sistema de detecção de motorista embriagado desenvolvido por Haile em
1987 (62) e aprimorado em 1992 (63) utiliza-se de um caminho entre sensores por
onde o motorista precisa conduzir o veículo. Os sensores são portáteis, ocos e devem
ser posicionado sobre o solo. Quando o pneu do veículo fica sobre um sensor seu
volume interno é reduzido e lâmpadas de sinalização são acionadas, ou mesmo, outros
aparelhos, indicando assim, a inaptidão do condutor.
5 Experiência prévia
Como experiências prévias, do autor deste projeto, no desenvolvimento de
ADAS constam dois trabalhos que utilizam uma câmera passiva frontal ao motorista
e outro trabalho utilizando o sensor 3D Microsoft Kinect para interação robô/pessoa.
Nas subseções seguintes os trabalhos são apresentados.
13
Utilizando-se o classificador e as características para detecção do celular foi
possível o desenvolvimento de um sistema em tempo real. O sistema utiliza pro-
cessamento paralelo (multi-thread), sendo: uma thread para aquisição da imagem,
quatro threads para processamento dos quadros e uma thread para exibir o resul-
tado do processamento em tela. O sistema opera processando ao menos 6 quadros
por segundo em um computador Intel i5 2.3GHz CPU, 6.0GB RAM e sistema ope-
racional Lubuntu 12.04. Na saída do sistema, a imagem adquirida é alterada para
ilustrar o resultado do processamento. No centro esquerdo é acrescentada uma barra
de progresso vertical do percentual histórico dos quadros com celular no período (3
segundos) anterior. Quando o percentual de quadros com celular estiver acima ou
igual a 65% a cor vermelha é empregada na barra vertical. A cor vermelha indica
uma situação risco e, em uma situação real, deve-se acionar um aviso sonoro. Na
Figura 5, mostra-se uma amostragem sequencial de quadros de saída do sistema.
14
imagem como sendo a face do motorista, por ser a pessoa mais próxima da câmera.
A detecção dos olhos ocorre em duas partes: primeiramente, localiza-se a região dos
olhos; feito isto, localizam-se os olhos individualmente.
Por fim, para detectar o estado dos olhos (aberto ou fechado) utiliza-se a ideia
de que, após uma normalização da imagem, a parte mais escura da pupila é envolvida
em uma região mais clara (67), representando o olho aberto, e uma grande região
mais clara ou escura quando o olho estiver fechado. Em termos computacionais,
a identificação do olho aberto baseia-se em uma pequena região escura envolvida
por uma grande região de níveis maiores do que zero. A Figura 6 ilustra essas
características. O algoritmo resume-se em quatro partes principais: preparação da
imagem, segmentação da região do olho, avaliação da condição de olho aberto ou
fechado e, por fim, análise da sequência de quadros.
(a)
(b)
15
Figura 7 – Exemplo da localização da face e mãos de uma pessoa utilizando sensor
3D Microsoft Kinect. O círculo azul e vermelho mostram a respectiva
posição da mão direita e esquerda.
5.4 Considerações
A continuidade do estudo de detecção de celular é importante pelo fato do
sistema desenvolvido necessitar de aquisição em cores da imagem, o que o deixa
dependente de iluminação. Em períodos noturnos, por exemplo, necessitaria de uma
iluminação incidindo no rosto do motorista, podendo prejudicar a condução do veí-
culo. Outro ponto relevante é o sol que satura regiões onde incide dificultando a
segmentação da pele por cor.
O estudo prévio de detecção de sonolência necessita de aprimoramentos. Pode-
se adaptá-lo para período noturno já que, sua entrada é em níveis de cinza, mas sua
principal dificuldade é em verificar o estado dos olhos quando o motorista vira sua
cabeça para os lados, o que é comum ao dirigir.
É importante, portanto, buscar novos métodos para ampliação e melhoramento
do sistema. Sensores 3D, como Kinect, podem suprir a dependência de iluminação
já que possui iluminação própria, e evita a dependência da cor. Trabalhando com
dados 3D ganha-se mais informações, o que leva a incorporações de mais caracterís-
tica destinada a detecção das distrações, como por exemplo, a queda da cabeça do
motorista como indicação de sonolência.
Além disto, também consideramos a possibilidade de adquirir dados referentes
ao comportamento do carro, obtidos através de sensores inerciais, e que podem
complementar as informações sobre como o motorista está dirigindo o veículo.
6 Materiais e métodos
A pesquisa possui duas abordagens principais. Na primeira, faz-se uso de aqui-
sição por meio de câmera infravermelha (near IR - "night shot") e infravermelha
termal FLIR (Tau e PathFindIR), todas disponíveis nos laboratórios do ICMC. Na
Figura 8, mostram-se a câmera FLIR e um exemplo de imagem de retorno. Estas
câmeras dotam o sistema de independência quanto a iluminação por serem câmeras
que não necessitam de uma fonte adicional de luz. Utilizando-se este tipo de equi-
pamento é possível o uso do sistema em períodos noturnos. Esta primeira etapa é
acompanhada de uma pesquisa bibliográfica sobre algoritmos tradicionais de aten-
ção visual baseados em imagens 2D. A pesquisa abrangerá modelos baseados em
Mapas de Saliência (71, 72), com Enviesamento top-down (73, 74), na Correlação
Temporal (75, 76) e, principalmente, os apresentados na tese de Benicasa (19). Os
algoritmos serão testados quanto a detecção de informações relevantes na detecção
16
das distrações objetivadas.
Figura 9 – Exemplo de utilização do sensor Kinect. (a) sensor Kinect. (b) Point
cloud 3D obtida. (c) Mapa de profundidade em tons de cinza (quanto
mais claro mais distante).
17
Outra contribuição é a utilização de algoritmos de aprendizado de máquina
(item 3.2) também aplicados em dados 3D, levando a extração de atributos e pro-
cessamento diferenciado em relação ao que se faz usualmente em imagens 2D.
O projeto contempla aspectos de pesquisa e desenvolvimento científico, onde
se buscará a publicação de artigos (conferências e periódicos) na divulgação de re-
sultados e avanços alcançados no projeto. Além disto, o sistema de detecção de
distrações do motorista poderá vir a ser aplicado em outras distrações e ambientes,
fora do escopo desta pesquisa, gerando assim novas soluções e produtos tecnológicos
com inúmeras aplicações práticas junto à sociedade.
18
com um veículo Fiat Palio Adventure. Este laboratório foi criado recentemente, en-
tretanto já conta com uma sala para uso específico dos alunos e pesquisadores dotada
de diversos PCs, além dos equipamentos acima citados.
O LRM é um dos grupos que atua de forma importante junto ao desenvolvi-
mento das atividades do INCT-SEC (Instituto de Sistemas Embarcados Críticos).
O INCT-SEC possui em sua previsão orçamentária, a aquisição de diversos equi-
pamentos que estarão também à disposição dos alunos e pesquisadores do LRM a
fim de desenvolver pesquisas relacionadas com veículos terrestres. Entre os equipa-
mentos está prevista sensores lasers, câmeras de aquisição de imagens e placas de
desenvolvimento de hardware reconfigurável (FPGA).
Os pesquisadores do LRM-ICMC já possuem experiência no estudo e desen-
volvimento de sistemas automotivos, com publicações já efetuadas (77, 78, 79, 80,
81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91). Esta experiência é de grande valia para o
desenvolvimento deste projeto uma vez que se espera contar com os conhecimentos
adquiridos pelo grupo no desenvolvimento dos trabalhos desta proposta.
Em relação ao apoio geral de infraestrutura e técnico, a USP-ICMC possui uma
excelente infraestrutura com laboratórios de ensino, pessoal de apoio, infraestrutura
de acesso a rede, e de softwares de apoio que são utilizados pelos pesquisadores e
alunos.
19
10. Buscar propor técnicas e algoritmos para atenção visual e detecção de movi-
mento em dados 3D;
11. Preparação e submissão de artigos científicos para eventos nacionais e inter-
nacionais, e para periódicos;
12. Preparação do texto da monografia da qualificação do doutorado;
13. Defesa da qualificação: apresentação da proposta de dissertação e de seu an-
damento;
14. Redação do texto final da dissertação de doutorado;
15. Defesa da dissertação de doutorado.
1o. sem.
2o. sem.
1o. sem.
2o. sem.
1o. sem.
2o. sem.
1o. sem.
Atividades
1 - Disciplinas PG-CCMC X X
2 - Estudo Sensores X X
3 - Estado da arte da Atenção Visual em imagens X X
4 - Adaptação de algoritmo de atenção visual para X X X
dados 3D
5 - Estudo de segmentação e detecção de movimento X
em 3D
6 - Estudo sobre comportamento dos condutores X
7 - Escolha de características candidatas X X
8 - Projeto de aplicações de detecção de distrações X X X X X
9 - Experimentos X X X
10 - Buscar propor técnicas de atenção visual em 3D X
11 - Preparação de Artigos X X X
12 - Redação da Qualificação X
13 - Defesa da Qualificação X
14 - Redação da dissertação X
15 - Defesa da dissertação X
10 Considerações Finais
Este projeto de pesquisa de sistema sobre monitoramento de motorista está
alinhado as pesquisas de sistemas de apoio a direção que vem sendo desenvolvido
pelo LRM-USP nos últimos anos. Sendo todas as atividades apresentadas específicas
do aluno de doutorado Rafael Alceste Berri.
20
Referências
21
15 ITTI, L.; KOCH, C. Computational modelling of visual attention. Nature
reviews neuroscience, Nature Publishing Group, v. 2, n. 3, p. 194–203, 2001.
22
30 JAIN, A. K.; MAO, J.; MOHIUDDIN, K. M. Artificial neural networks: A
tutorial. IEEE computer, v. 29, n. 3, p. 31–44, 1996.
37 HSIAO, P.; YEH, C.; HUANG, S.; FU, L. A portable vision-based real-time
lane departure warning system: day and night. Vehicular Technology, IEEE
Transactions on, IEEE, v. 58, n. 4, p. 2089–2094, 2009.
39 MANIKOTH, N.; LOCE, R.; BERNAL, E.; WU, W. Survey of computer vision
in roadway transportation systems. Proc. of SPIE-IS&T Electronic Imaging Vol,
v. 8305, p. 83050W, 2012.
23
43 TANGO, F.; CARREA, P.; GOBETTO, E. The development of a smart
pre-crash system–the chameleon project. In: Proceedings of ITS 2000, 7th World
Congress on Intelligent Transport Systems. [S.l.: s.n.], 2000.
49 YANG, J.; SIDHOM, S.; CHANDRASEKARAN, G.; VU, T.; LIU, H.;
CECAN, N.; CHEN, Y.; GRUTESER, M.; MARTIN, R. P. Detecting driver phone
use leveraging car speakers. In: ACM. Proceedings of the 17th annual international
conference on Mobile computing and networking. [S.l.], 2011. p. 97–108.
54 LENSKIY, A.; LEE, J. Driver’s eye blinking detection using novel color and
texture segmentation algorithms. International Journal of Control, Automation
and Systems, Springer, v. 10, n. 2, p. 317–327, 2012.
24
NY, USA, v. 110, n. 3, p. 346–359, jun. 2008. ISSN 1077-3142. Disponível em:
http://dx.doi.org/10.1016/j.cviu.2007.09.014.
56 KUMAR, K.; ALKOFFASH, M.; DANGE, S.; IDARROU, A.; SRIDEVI, N.;
SHEEBA, J.; SHAH, N.; SHARMA, S.; ELYASI, G.; SAREMI, H. Morphology
based facial feature extraction and facial expression recognition for driver vigilance.
International Journal of Computer Applications, Foundation of Computer Science
(FCS), v. 51, n. 2, p. 17–24, 2012.
59 DAI, J.; TENG, J.; BAI, X.; SHEN, Z.; XUAN, D. Mobile phone based drunk
driving detection. In: IEEE. Pervasive Computing Technologies for Healthcare
(PervasiveHealth), 2010 4th International Conference on-NO PERMISSIONS.
[S.l.], 2010. p. 1–8.
25
68 HEITMANN, A.; GUTTKUHN, R.; AGUIRRE, A.; TRUTSCHEL, U.;
MOORE-EDE, M. Technologies for the monitoring and prevention of driver fatigue.
In: Proceedings of the First International Driving Symposium on Human Factors
in Driver Assessment, Training and Vehicle Design. [S.l.: s.n.], 2001. p. 81–86.
26
80 SOUZA, J. R.; PESSIN, G.; OSÓRIO, F. S.; WOLF, D. F. Vision-based
autonomous navigation using supervised learning techniques. In: Engineering
Applications of Neural Networks. [S.l.]: Springer, 2011. p. 11–20.
27