Вы находитесь на странице: 1из 106

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

INSTITUTO DE INFORMTICA
PROGRAMA DE PS-GRADUAO EM COMPUTAO

RAQUEL MAINARDI PILLAT

Coordenao Dinmica de Visualizaes de


Dados Multidimensionais

Dissertao apresentada como requisito parcial


para a obteno do grau de Mestre em Cincia
da Computao

Prof. Dr. Carla Maria Dal Sasso Freitas


Orientadora

Porto Alegre, julho de 2006.

CIP CATALOGAO NA PUBLICAO

Pillat, Raquel Mainardi


Coordenao Dinmica de Visualizaes de Dados
Multidimensionais / Raquel Mainardi Pillat Porto Alegre:
Programa de Ps-Graduao em Computao, 2006.
106 f.:il.
Dissertao (mestrado) Universidade Federal do Rio Grande
do Sul. Programa de Ps-Graduao em Computao. Porto
Alegre, BR RS, 2006. Orientadora: Carla Maria Dal Sasso
Freitas.
1. Visualizao de informaes. 2. Visualizaes coordenadas.
3. Interface de usurio. I. Freitas, Carla Maria Dal Sasso. II. Ttulo.

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL


Reitor: Prof. Jos Carlos Ferraz Hennemann
Vice-Reitor: Prof. Pedro Cezar Dutra Fonseca
Pr-Reitora de Ps-Graduao: Profa. Valquria Linck Bassani
Diretor do Instituto de Informtica: Prof. Philippe Olivier Alexandre Navaux
Coordenador do PPGC: Prof. Flvio Rech Wagner
Bibliotecria-Chefe do Instituto de Informtica: Beatriz Regina Bastos Haro

AGRADECIMENTOS

Agradeo minha orientadora, Carla Dal Sasso Freitas, pelo auxlio e estmulo
recebido durante a realizao desse trabalho e a todos os integrantes do grupo de
computao grfica da UFRGS (um GRUPO de verdade, do qual eu tenho muito
orgulho em fazer parte). No posso deixar de agradecer tambm a pacincia e boa
vontade daqueles que participaram uma ou vrias vezes dos meus experimentos de
avaliao.
Por fim, agradecimentos muito especiais minha famlia: minha me Lcia, meu pai
Luiz Clvis, minha irm Micheli e meu namorado Fbio.

SUMRIO

LISTA DE FIGURAS.......................................................................................... 7
LISTA DE TABELAS ....................................................................................... 10
RESUMO.......................................................................................................... 11
ABSTRACT...................................................................................................... 12
1 INTRODUO ........................................................................................... 13
1.1
1.2
1.3

Motivao ............................................................................................................. 14
Objetivos e Contribuies ................................................................................... 15
Organizao do Trabalho ................................................................................... 15

2 INTERAO COM VISUALIZAES MULTIDIMENSIONAIS ................. 16


2.1 Visualizaes Multidimensionais ....................................................................... 16
2.1.1 Tcnicas de projeo geomtrica........................................................................ 17
2.1.2 Tcnicas Iconogrficas ....................................................................................... 23
2.1.3 Tcnicas Orientadas a Pixel................................................................................ 24
2.2 Tcnicas de Interao.......................................................................................... 26
2.2.1 Mapeamento de Dados para Propriedades Visuais............................................. 26
2.2.2 Projees............................................................................................................. 27
2.2.3 Filtragem............................................................................................................. 28
2.2.4 Zoom................................................................................................................... 29
2.2.5 Detalhes por Demanda........................................................................................ 30
3 VISUALIZAES COORDENADAS: CONCEITOS E REVISO
BIBLIOGRFICA............................................................................................. 31
3.1 Tipos de Coordenaes........................................................................................ 31
3.1.1 Brushing-and-Linking......................................................................................... 32
3.1.2 Reordenao de Dimenses Sincronizada.......................................................... 33
3.1.3 Filtragem Sincronizada....................................................................................... 33
3.1.4 Mapeamento de Dados para Propriedades Visuais............................................. 34
3.1.5 Scrolling Sincronizado ....................................................................................... 34
3.1.6 Zoom Sincronizado ............................................................................................ 35
3.1.7 Rotao Sincronizada ......................................................................................... 36
3.1.8 Overview e Detalhe............................................................................................. 36
3.1.9 Drill Down.......................................................................................................... 37
3.2 Sistemas de Mltiplas Visualizaes Coordenadas .......................................... 38

3.2.1
3.2.2
3.2.3

XmdvTool........................................................................................................... 39
Snap-Together .................................................................................................... 40
GeoVista Studio.................................................................................................. 43

4 O TOOLKIT INFOVIS ................................................................................. 45


4.1 Framework Geral ................................................................................................. 46
4.1.1 Entrada e Sada ................................................................................................... 46
4.1.2 Tabelas e Colunas............................................................................................... 46
4.1.3 Visualizaes ...................................................................................................... 47
4.1.4 Componentes ...................................................................................................... 48
4.2 Exibindo Visualizaes........................................................................................ 48
4.3 Extenso do Toolkit: Criando Novas Visualizaes ......................................... 49
4.4 Mecanismos de Interao.................................................................................... 52
4.4.1 Mecanismos Adicionados................................................................................... 55
5 COORDENAO DINMICA DE VISUALIZAES
MULTIDIMENSIONAIS .................................................................................... 57
5.1 Coordenaes para Sistemas de Visualizao de Dados Multidimensionais . 57
5.1.1 Mapeamento de Dados para Propriedades Visuais............................................. 57
5.1.2 Reordenao de Dimenses................................................................................ 58
5.1.3 Filtragem............................................................................................................. 58
5.1.4 Brushing-and-Linking......................................................................................... 59
5.2 Aplicao de Visualizaes Coordenadas para Dados Multidimensionais .... 59
5.2.1 Visualizaes ...................................................................................................... 60
5.2.2 Coordenaes ..................................................................................................... 68
5.2.3 Arquitetura.......................................................................................................... 71
5.2.4 Grafo de Coordenao ........................................................................................ 73
5.2.5 Especificando Coordenaes Dinamicamente.................................................... 74
5.2.6 Gerenciamento de Coordenaes ....................................................................... 76
5.2.7 Tornando uma Visualizao Coordenvel: A Interface Visualization ............... 80
5.3 Comentrios Finais.............................................................................................. 81
6 AVALIAO PRELIMINAR ....................................................................... 82
6.1 Primeira Avaliao .............................................................................................. 82
6.1.1 Conjunto de Dados ............................................................................................. 82
6.1.2 Tarefas Experimentais ........................................................................................ 83
6.1.3 Procedimento ...................................................................................................... 83
6.1.4 Resultados........................................................................................................... 84
6.2 Segunda Avaliao............................................................................................... 87
7 ESTUDO DE CASO ................................................................................... 88
7.1 Descrio e Objetivos do Domnio: Morfometria Craniana............................ 88
7.2 Conjunto de Dados .............................................................................................. 89
7.3 Procedimento ....................................................................................................... 89
7.4 Resultados ............................................................................................................ 90
7.4.1 Identificao de Crnios com Medidas Fora do Padro ..................................... 90
7.4.2 Identificao de Variaes nos Padres de Medidas de Diferentes Localidades91
7.4.3 Identificao de Variaes nas Medidas de Animais com Nmero de
Cromossomos Diferente ..................................................................................... 92
7.4.4 Verificao de Variaes nas Medidas de Animais de Sexo Diferente ............. 93

7.5
7.6

Comparao: Aplicao Desenvolvida x Aplicao do Domnio .................... 95


Concluses ............................................................................................................ 96

8 CONCLUSES .......................................................................................... 98
8.1
8.2

Avaliao Final .................................................................................................... 98


Trabalhos Futuros ............................................................................................. 101

REFERNCIAS.............................................................................................. 102

LISTA DE FIGURAS

Figura 2.1: Representao visual da tcnica Coordenadas Paralelas ............................. 18


Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itens
de dados representados)............................................................................... 18
Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots............................. 19
Figura 2.4: Representao visual da tcnica Radviz ...................................................... 20
Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares............ 21
Figura 2.6: Representao visual da tcnica Polyviz ..................................................... 22
Figura 2.7: Representao visual da tcnica Survey Plots.............................................. 22
Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela ......... 23
Figura 2.9: Mapeamento de Stick Figures (esquerda) e grfico iconogrfico de dados
do censo da Inglaterra (direita) .................................................................... 24
Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com nove
dimenses, utilizando duas formas de distribuio espacial: espiral
(esquerda) e por eixos (direita).................................................................. 25
Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert,
b) curvas de Morton e c) padres recursivos............................................. 25
Figura 2.12: Tcnica Segmentos de Crculo................................................................... 26
Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial de
itens de dados em uma regio de interesse ............................................... 28
Figura 2.14: Magic lenses: Lente de viso aramada 3D e lente de aumento 2D............ 29
Figura 2.15: Usando a tcnica detalhes por demanda para obter informaes
adicionais sobre um item de dado. ............................................................ 30
Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking ................... 33
Figura 3.2: Visualizaes coordenadas com valores do atributo Origin mapeados
para cor ........................................................................................................ 35
Figura 3.3: Mltiplas visualizaes 3D em grid............................................................. 36
Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser ........... 37
Figura 3.5: Usando a coordenao drill down para visualizar o contedo de
agregaes no Snap-Together...................................................................... 38

Figura 3.6: Brushing-and-linking n-dimensional no sistema XmdvTool. Os dados


selecionados so exibidos nas imagens (a) e (b) em vermelho e a regio
de brushing, que indica os dados de interesse, mostrada nas imagens
(c) e (d) no espao de um glifo em estrela e no espao de coordenadas
paralelas, respectivamente. .......................................................................... 41
Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelas
relacionadas de dados multidimensionais.................................................... 42
Figura 3.8: Cenrio construdo em GeoVista Studio com todas as suas tcnicas de
visualizao multidimensionais ................................................................... 44
Figura 4.1: Estrutura interna do toolkit InfoVis. Retngulos representam estruturas de
dados e elipses representam funes. .......................................................... 46
Figura 4.2: Programa para a visualizao de Coordenadas Paralelas. O cdigo do
retngulo azul gera uma visualizao no-interativa, mas quando
substitudo pelo cdigo do retngulo vermelho a visualizao recebe um
painel de controle padro............................................................................. 49
Figura 4.3: Hierarquia das classes de visualizao do toolkit InfoVis........................... 50
Figura 4.4: Cdigo padro executado para o desenho de itens de dados ....................... 51
Figura 4.5: Cdigo padro executado para o desenho de um item de dado ................... 51
Figura 4.6: As quatro abas do painel de controle: (a) Filters; (b) Visual; (c) Excentric;
e (d) Fisheyes............................................................................................... 52
Figura 4.7: Visualizaes geradas pela aplicao dos mecanismos de interao Color
by ( esquerda) e Size by ( direita) sobre as tcnicas Radviz (acima) e
Coordenadas Paralelas (abaixo)................................................................... 53
Figura 4.8: Labels dinmicos na tcnica Coordenadas Paralelas ................................... 54
Figura 4.9: Lente Fisheye aplicada na tcnica Radviz ................................................... 54
Figura 4.10: Visualizao dos valores que o 142 item de dado do conjunto sobre
carros possui para cada atributo ................................................................ 55
Figura 4.11: Componentes grficos que compem o mecanismo de interao
Attributes Manipulation ............................................................................ 56
Figura 5.1: Tcnica Coordenadas Paralelas implementada no toolkit InfoVis .............. 61
Figura 5.2: Criao e desenho das linhas que representam atributos na tcnica
Coordenadas Paralelas ................................................................................. 61
Figura 5.3: Criao dos objetos que representam itens de dados na tcnica
Coordenadas Paralelas ................................................................................. 62
Figura 5.4: Tcnica Radviz implementada no toolkit InfoVis ....................................... 63
Figura 5.5: Criao e desenho das linhas que representam atributos na tcnica Radviz 64
Figura 5.6: Criao dos objetos que representam itens de dados na tcnica Radviz...... 65
Figura 5.7: Tcnica Matriz de Scatter Plots implementada no toolkit InfoVis.............. 66
Figura 5.8: Procedimento para a criao da matriz de visualizaes Scatter Plots 2D.. 67

Figura 5.9: Procedimento utilizado para garantir que aes realizadas em uma
visualizao 2D da matriz de Scatter Plot sejam executadas tambm nas
suas demais visualizaes............................................................................ 68
Figura 5.10: Cenrio de explorao construdo na aplicao prottipo ......................... 71
Figura 5.11: Arquitetura do prottipo desenvolvido ...................................................... 72
Figura 5.12: Estrutura do grafo de coordenao e seus relacionamentos com outros
mdulos da aplicao ................................................................................ 73
Figura 5.13: Processo de criao e viabilizao de uma nova coordenao .................. 74
Figura 5.14: Representao grfica de um grafo de coordenao.................................. 75
Figura 5.15: Conectando os nodos da nova coordenao............................................... 75
Figura 5.16: Seleo de interaes a serem coordenadas............................................... 76
Figura 5.17: Nodos conectados pela ao de seleo..................................................... 76
Figura 5.18: Removendo uma coordenao ................................................................... 76
Figura 5.19: Processo de gerenciamento de coordenaes ............................................ 77
Figura 5.20: Atividades realizadas pelo usurio e aplicao no processo de
propagao de uma interao .................................................................... 78
Figura 5.21: Seqncia de operaes realizadas pelos objetos envolvidos na
propagao de interaes .......................................................................... 79
Figura 5.22: Mtodos da interface Visualization relacionados ao processo de
coordenao............................................................................................... 81
Figura 7.1: Indicao das dezesseis medidas extradas do crnio de um tuco-tuco para
a anlise morfomtrica tradicional. (a) Vista dorsal, (b) vista ventral e (c)
vista lateral................................................................................................... 89
Figura 7.2: Identificao de um animal com medidas fora do padro (item destacado) 91
Figura 7.3: Representao do conjunto inteiro de dados morfomtricos com locais
de coleta mapeados para cor ........................................................................ 92
Figura 7.4: Representao em Coordenadas Paralelas das amostras morfomtricas
coletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 93
Figura 7.5: Representao em Matriz de Scatter Plot das amostras morfomtricas
coletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha).. 94
Figura 7.6: Representao do conjunto inteiro de dados morfomtricos com machos
mapeados para a cor rosa e fmeas mapeadas para a cor preta ................... 94
Figura 7.7: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot
(direita), utilizados na anlise do dimorfismo sexual. ................................. 96
Figura 7.8: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot
(direita), utilizados na anlise de variaes por local de coleta................... 96

LISTA DE TABELAS

Tabela 2.1: Representao de uma tabela de dados.........................................................16


Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos de
dados e exemplos de mapeamentos tpicos..................................................27
Tabela 5.1: Interaes coordenadas e as propriedades que notificam sua ocorrncia.....80
Tabela 8.1: Comparao das tcnicas Coordenadas Paralelas, Radviz e Matriz de
Scatter Plots segundo critrios encontrados na literatura.............................99

RESUMO

Tcnicas de visualizao de informaes representam graficamente dados de um


determinado domnio de aplicao e disponibilizam mecanismos para a interao com a
representao gerada, a fim de que o usurio consiga interpretar e compreender as
informaes apresentadas. As tcnicas de visualizao multidimensionais, em
particular, referem-se visualizao de informaes onde cada elemento no conjunto de
dados descrito, ou caracterizado, por mltiplas variveis (atributos), as quais devem
ser codificadas em uma nica estrutura visual.
Embora existam diversas tcnicas de visualizao para representar dados
multidimensionais, nenhuma delas apresenta o melhor desempenho para todos os tipos
de tarefas. Uma estratgia interessante analisar vrias representaes simultaneamente
mantendo uma ligao semntica entre elas, de forma que aes realizadas sobre uma
tcnica se reflitam automaticamente nas demais. No existe, atualmente, um sistema de
mltiplas visualizaes coordenadas especfico para a representao de dados
multidimensionais, que disponha de um amplo e variado conjunto de coordenaes. Os
sistemas que suportam a representao coordenada deste tipo de dados so de propsito
geral e, devido a isto, oferecem poucas possibilidades de coordenao.
O presente trabalho apresenta um estudo de tcnicas de coordenao para sistemas
de mltiplas visualizaes, focando coordenao de representaes visuais de dados
multidimensionais. A partir do estudo dos diversos sistemas de visualizao existentes,
foi identificado um conjunto de coordenaes que podem ser aplicadas entre
visualizaes multidimensionais. Esse trabalho apresenta estas coordenaes e uma
nova aplicao de mltiplas visualizaes coordenadas (construda a partir do toolkit
InfoVis), especfica para a representao de dados multidimensionais, que implementa o
conjunto de coordenaes. A aplicao desenvolvida conta com um variado conjunto de
coordenaes e altamente flexvel, permitindo tanto a escolha das visualizaes que
representaro o conjunto de dados, bem como das coordenaes ativas entre elas.
Foram realizados alguns estudos de avaliao como ensaios de interao com
usurios. Primeiramente, as implementaes das tcnicas de visualizao suportadas
pela aplicao desenvolvida foram avaliadas, com o objetivo de encontrar possveis
problemas de usabilidade. Grande parte dos problemas identificados nesta avaliao,
principalmente os mais graves, foram solucionados logo aps sua realizao. Na
seqncia, outro experimento, conduzido de maneira mais informal, avaliou algumas
questes a respeito do uso das coordenaes implementadas. Por fim, com um estudo de
caso, verificou-se a aplicabilidade das visualizaes multidimensionais suportadas pela
aplicao para a explorao de dados de um domnio especfico.
Palavras-Chave: Visualizao de informaes, mltiplas visualizaes coordenadas,
interface de usurio.

Dynamic Coordination of Multidimensional Data Visualizations

ABSTRACT

Information visualization techniques represent data of a specific domain graphically


and provide mechanisms for interacting with this representation, allowing users to
explore and understand their data. Multidimensional visualization techniques are
employed to represent information where each data element is described by multiple
variables (attributes) that must be mapped to a single visual structure.
Although there are several techniques to display multidimensional data, none of
them performs best for all kinds of tasks. An interesting strategy is to analyze multiple
visualization techniques simultaneously with a semantic connection between them, so
that actions performed on a representation are broadcasted to the others.
This work investigates coordination techniques for multiple views systems, focusing
the coordination of multidimensional data visualization. At the moment, there is not a
specific coordinated-view system for multidimensional data representation that provides
various forms of coordination. Systems allowing coordinated views are usually for
general purpose. Due to this reason, they provide few coordination possibilities.
Starting from the study of several visualization systems, we identified coordination
forms that can be used between multidimensional visualizations. This work presents
these coordinations and a new specific coordinated-view application (built with the
InfoVis toolkit) for multidimensional data representation that implements the identified
coordinations. Our application provides various coordination forms and is very flexible:
it allows the user to choose the views that will display the dataset as well as the active
coordinations.
This work also presents some evaluation studies conducted as interaction tests with
users. Firstly, the visualization techniques implemented in our application were
evaluated in order to identify possible usability problems. Most of the problems
identified in that study, mainly the more serious ones, were solved. Soon after, other
experiment, conducted in a more informal way, evaluated some questions regarding the
use of the implemented coordinations. Finally, we verified the suitability of the
multidimensional visualizations supported by our application for a specific domain
through a case study.
Keywords: Information visualization, coordinated multiple views, user interface.

1 INTRODUO

O desenvolvimento tecnolgico, incorporando avanos em produtos e servios,


gerou condies para medies mais precisas, simulaes mais velozes e registro de
uma gama variada de tipos de dados, produzindo conjuntos de dados cada vez mais
volumosos e complexos. A explorao e a anlise desses volumes de dados tornou-se
uma tarefa difcil que s pode ser realizada com a utilizao de ferramentas
computacionais apropriadas, muitas vezes dependentes do domnio dos dados. Isto
especialmente complexo quando os dados tm alta dimensionalidade, ou seja,
correspondem a conjuntos de vrios atributos.
A rea de visualizao de informaes tem por objetivo facilitar a compreenso e a
manipulao desta vasta quantidade de dados diversificados (CARD, 1999; SPENCE,
2001), atravs do emprego de tcnicas que buscam tanto representar visualmente os
dados quanto permitir ao usurio a interao com estas representaes. As tcnicas de
visualizao multidimensionais so especialmente projetadas para a representao de
dados que tm alta dimensionalidade (descritos por mltiplos atributos). Conjuntos de
dados multidimensionais geralmente so representados como tabelas, onde cada linha
corresponde a um elemento de dado, com as colunas representando atributos.
As representaes visuais de tcnicas de visualizao de informaes, quando
manipuladas dinamicamente, facilitam a interpretao dos dados pelo usurio,
possibilitando a percepo de padres, tendncias, relacionamentos e excees
embutidos nos mesmos. Uma das grandes questes em relao a essas tcnicas o quo
efetiva uma determinada tcnica, em um determinado domnio, ou para um
determinado objetivo.
Embora existam diversas tcnicas para mostrar tabelas e conjuntos de dados
multidimensionais, dependendo da categoria dos dados e das tarefas especficas que
deveriam ser suportadas, uma nica tcnica pode no ser suficiente: usurios podem
precisar visualizar os dados mostrados com diferentes tcnicas para encontrar
relacionamentos e modelos.
Assim, dadas as necessidades mencionadas acima, alguns autores (BALDONADO
et al., 2000; NORTH, 2000) passaram a trabalhar com uma estratgia denominada
Mltiplas Visualizaes Coordenadas (CMV - Coordinated Multiple Views). Nesta
estratgia, diferentes visualizaes podem ser integradas em um ambiente e usadas de
forma coordenada, isto , estabelecendo-se uma ligao semntica entre as
visualizaes, de maneira que aes sobre uma se reflitam nas demais. Desta forma,
aproveita-se os pontos fortes de cada uma, e conjuntos de dados complexos e de alta
dimensionalidade podem ser visualizados atravs de tcnicas apropriadamente
selecionadas (SHIMABUKURO, 2004).

14

North e Shneiderman (1997) observaram que a coordenao de mltiplas


visualizaes oferece as seguintes vantagens:

Melhora na performance do usurio: O tempo de acesso informao


reduzido, principalmente com a manipulao de informaes hierrquicas, como
mostrado por Chimera et al. (1994), bem como o nmero de aes requeridas do
usurio para manter um estado sincronizado, como mostrado por Kandogan e
Shneiderman (1997);

Descoberta de relacionamentos inesperados: Seria difcil encontrar tais


relacionamentos sem coordenao;

Unificao do desktop: mais sensato apresentar informaes complexas no


em uma nica visualizao complexa e integrada, mas em mltiplas
visualizaes mais simples, usando coordenao para navegar, manter
relacionamentos, etc.

1.1 Motivao
Mltiplas visualizaes de um mesmo conjunto de dados permitem observ-lo sob
vrias perspectivas, bem como explorar os pontos fortes e minimizar os efeitos dos
pontos fracos das tcnicas envolvidas (KEIM, 1996; EICK; KARR, 2000). Diversas
ferramentas genricas de visualizao de informaes oferecem vrias tcnicas e
permitem o seu uso coordenado para visualizar um mesmo conjunto de dados. No
entanto, em geral, o conjunto de tcnicas e as formas de coordenao disponveis so
fixos, pr-estabelecidos durante o projeto da ferramenta, o que limita a potencialidade
do uso das tcnicas em contextos de aplicaes diversos e a liberdade do usurio no
processo de explorao das mesmas. Ambientes que permitem flexibilidade na
configurao da coordenao entre mltiplas visualizaes, possibilitando a criao de
cenrios personalizados para as necessidades do usurio, tm sido tema de estudos e j
existem algumas iniciativas, como Snap-Together (NORTH, 2000) e GeoVISTA Studio
(GAHEGAN et al., 2000), que sero abordadas com maior detalhamento no Captulo 3.
A primeira destas ferramentas genrica, podendo ser aplicada para a anlise de
variados tipos de dados e domnios de aplicao; a ltima, entretanto, enfatiza o
tratamento de dados espaciais (geo-referenciados).
Assim como a ferramenta GeoVISTA Studio, a maioria das aplicaes existentes
que suportam mltiplas visualizaes coordenadas so projetadas para atender, com
maior nfase, dados relativos a um domnio especfico. Assim, a tarefa de determinao
das aes de interao coordenadas em uma ferramenta facilitada e a mesma adquire
condies para atender melhor as necessidades dos usurios no processo de
compreenso e anlise dos dados.
Um problema encontrado atualmente em ferramentas de mltiplas visualizaes
coordenadas genricas a baixa variedade de interaes coordenadas que as mesmas
suportam. Os usurios de Snap-Together, por exemplo, tm suas aes de interao
limitadas seleo e navegao, mas ...muito mais interaes deveriam ser suportadas,
tendo em vista que o objetivo da ferramenta a visualizao exploratria
(BOUKHELIFA et al., 2003).
A delimitao das coordenaes suportadas por uma ferramenta de visualizao
genrica uma tarefa difcil. Devido natureza multiforma das diversas visualizaes,

15

aes executadas sobre uma delas nem sempre podem ser diretamente aplicadas para
outras. Alm disso, algumas coordenaes possveis de serem alcanadas, podem no
possuir utilidade; e ainda, outras podem ser impossveis de realizar (BOUKHELIFA et
al., 2003). Na rea de visualizao de informaes multidimensionais, ainda no existe
uma ferramenta genrica, capaz de atender os diversos domnios de aplicao em que
dados multidimensionais podem ser gerados, flexvel na escolha das visualizaes e das
aes coordenadas e com um conjunto rico e variado destas ltimas. Esta observao foi
a principal motivadora para a realizao desse trabalho.

1.2 Objetivos e Contribuies


O objetivo principal desse trabalho investigar tcnicas de coordenao que podem
ser aplicadas entre visualizaes multidimensionais em geral. Como objetivo secundrio
est a implementao de tais tcnicas em uma aplicao prottipo altamente flexvel,
com a finalidade de validar as coordenaes definidas.
Assim, as contribuies desse trabalho so:
A definio de um conjunto variado de coordenaes que podem ser aplicadas
entre visualizaes multidimensionais em geral, reunindo coordenaes
utilizadas por diferentes ferramentas;
A construo de uma aplicao prottipo de mltiplas visualizaes
coordenadas que:

especfica para visualizao de informaes multidimensionais, no


sendo, no entanto, voltada para um domnio de aplicao especfico;

altamente flexvel, pois permite que usurios possam definir quais,


dentre as visualizaes suportadas, iro compor um cenrio de mltiplas
visualizaes e quais aes interativas sero coordenadas entre as mesmas.

1.3 Organizao do Trabalho


Os demais captulos dessa dissertao esto organizados como segue. O Captulo 2
descreve as principais tcnicas de visualizao e de interao utilizadas para conjuntos
de dados multidimensionais, organizadas em categorias. O Captulo 3 aborda os
principais tipos de coordenaes utilizadas por sistemas de mltiplas visualizaes
coordenadas, alm de descrever alguns destes sistemas relacionados com o presente
trabalho. O Captulo 4 apresenta caractersticas e a estrutura bsica do toolkit de
visualizao InfoVis, sobre o qual foi construda a aplicao prottipo para validao de
coordenaes. O Captulo 5 tem como objetivo apresentar e descrever apenas um
conjunto especfico de coordenaes: aquelas que podem ser aplicadas em sistemas de
mltiplas visualizaes coordenadas, especficos para a visualizao de dados
multidimensionais. Alm disso, este ltimo captulo aborda tambm a descrio de uma
aplicao de visualizaes multidimensionais coordenadas, que implementa o conjunto
de coordenaes apresentado no mesmo. O Captulo 6 descreve dois estudos de
avaliao preliminar da aplicao prottipo apresentada nesse trabalho e o Captulo 7
descreve um estudo de caso em que a aplicao desenvolvida foi utilizada por
especialistas de um domnio especfico para a explorao de seus dados
multidimensionais. Finalmente, o Captulo 8 apresenta concluses e trabalhos futuros.

2 INTERAO COM VISUALIZAES


MULTIDIMENSIONAIS

O termo dimensionalidade usado para referir tanto o nmero de dimenses do


espao-domnio onde determinado objeto est definido - podendo ser um espao
unidimensional (1D), bidimensional (2D) ou tridimensional (3D) -, quanto o nmero de
atributos de um registro de dado - geralmente, referenciado como n-dimensional (nD),
multidimensional ou multivariado. Assim, dados multidimensionais so aqueles que
podem ser representados como uma tabela de dados multivariados, ou seja, que possui
muitas variveis (ou atributos) que devem ser codificadas em uma nica estrutura visual
1D, 2D ou 3D (CARD, 1999). A representao de uma tabela de dados multivariados
mostrada na tabela 2.1.
Tabela 2.1: Representao de uma tabela de dados
Variveli

Varivelj

Varivelk

Casox

Valorix

Valorjx

Valorkx

...

Casoy

Valoriy

Valorjy

Valorky

...

...

...

...

...

...

As colunas da tabela em questo representam variveis (ou atributos), conjuntos que


representam a gama de valores nas colunas. As linhas representam casos (ou itens de
dados, tuplas), que so conjuntos de valores para cada varivel. Nesse trabalho, adotouse o termo item de dado para denotar uma tupla descrevendo um relacionamento entre
mltiplas variveis (por exemplo, um caso ou registro de dado) e o termo atributo
para denotar as variveis (dimenses) do conjunto de dados.

2.1 Visualizaes Multidimensionais


As visualizaes que so especificamente projetadas para codificar dados que
podem ser representados como tabelas multivarivel so denominadas visualizaes
multidimensionais.
As tcnicas de visualizao multidimensionais podem ser categorizadas de acordo
com diferentes critrios. Keim (1996) sugere uma categorizao baseada em trs
critrios: a natureza do dado a ser visualizado, a abordagem de mapeamento adotado
pela tcnica e os mtodos de interao e distoro disponibilizados para permitir a
manipulao da representao visual.

17

Existem vrias tcnicas para a visualizao de dados multidimensionais. Nessa seo


sero apresentadas algumas tcnicas clssicas, direcionadas visualizao de tabelas de
dados, dando-se nfase s tcnicas mais representativas e citadas na literatura. As
mesmas sero descritas seguindo o critrio de classificao proposto por Keim (1996),
que difere tcnicas de acordo com a forma de mapeamento adotada para transformar
dados em formas visuais. Este critrio divide as tcnicas de visualizao
multidimensionais em tcnicas de projeo geomtrica, iconogrficas e orientadas a
pixel.
2.1.1 Tcnicas de projeo geomtrica
Nessa classe esto includas todas as tcnicas de visualizao que empregam algum
tipo de projeo geomtrica para mapear dados para formas visuais. Entre as tcnicas
desta categoria esto: Coordenadas Paralelas, Matriz de Scatter Plots, grficos de linhas,
grfico de barras e histogramas, Survey Plots, Curvas de Andrews, Radviz e
Coordenadas Paralelas Circulares.
As principais tcnicas representantes dessa categoria so descritas com maior
detalhamento a seguir. Para demonstrar a representao visual gerada por cada uma
destas tcnicas, foi utilizado o conjunto de dados sobre carros (descrito na seo 6.1.1
desse trabalho).
2.1.1.1 Coordenadas Paralelas
A tcnica Coordenadas Paralelas foi introduzida por Inselberg (1985) (1990) para
representar mltiplas dimenses sem utilizar eixos cartesianos ortogonais. Nessa
tcnica, dados multidimensionais so representados utilizando linhas verticais e
horizontais. Cada linha vertical indica um atributo (ou varivel) e os valores dos
atributos so mapeados para pontos nessas linhas verticais, de forma que cada item de
dado seja representado como uma linha poligonal que intercepta cada linha vertical em
seu ponto correspondente ao valor de cada atributo, formando um aglomerado de linhas
horizontais. Os valores mximo e mnimo de um atributo so usualmente mapeados
para as extremidades superior e inferior de uma linha vertical, respectivamente. A figura
2.1 mostra um exemplo da representao visual gerada pela tcnica Coordenadas
Paralelas (para representar os dados de carros). As diferentes intensidades de cor, das
linhas horizontais da figura, foram usadas para diferenciar itens de dados com valores
diferentes para o atributo Origin.
A representao visual gerada pela tcnica Coordenadas Paralelas facilita
principalmente a identificao de algumas caractersticas, como diferenas na
distribuio dos dados e correlaes entre atributos. Porm, visto que as linhas
poligonais podem se sobrepor, o nmero de itens de dados que podem ser visualizados
ao mesmo tempo limitado a aproximadamente 1.000 itens (KEIM, 1996). Assim, a
visualizao de grandes volumes de dados requer que a tcnica seja utilizada
disponibilizando-se operaes adequadas de interao. A figura 2.2 exibe um exemplo
da visualizao Coordenadas Paralelas, onde h uma acentuada sobreposio de linhas.
2.1.1.2 Matriz de Scatter Plots
Scatter Plot uma tcnica classificada como geomtrica, onde pontos ou
marcadores visuais (representando itens de dados) so plotados em coordenadas (x, y)

18

de forma semelhante a outros grficos bidimensionais. Matriz de Scatter Plots uma


extenso desta tcnica, utilizada para a representao de dados multidimensionais. Na
mesma, so exibidas simultaneamente mltiplas projees bidimensionais (scatter
plots) dos diferentes pares de atributos do conjunto de dados. Por exemplo, para um
conjunto de dados com 6 dimenses, uma matriz 6 x 6 (6 linhas e 6 colunas) usada
para prover a visualizao de cada dimenso versus todas as outras. A figura 2.3 mostra
um exemplo de visualizao gerada com a tcnica Matriz de Scatter Plots.

Figura 2.1: Representao visual da tcnica Coordenadas Paralelas

Figura 2.2: Tcnica Coordenadas Paralelas com sobreposio de linhas (15.000 itens de
dados representados) (KEIM, 1997)

19

Figura 2.3: Representao visual da tcnica Matriz de Scatter Plots


A Matriz de Scatter Plots considerada de fcil interpretao, por permitir a
visualizao de todas as possveis correlaes entre os pares de dimenses. Contudo, a
quantidade de dimenses que podem ser apresentadas simultaneamente uma limitao,
devido ao pouco espao disponvel para a projeo de cada grfico. medida que o
nmero de dimenses aumenta, torna-se necessrio o uso de operaes de interao
(como zooming ou panning) para uma efetiva interpretao dos resultados. Hyperslice
(VAN, 1993) e HyperBox (ALPERN; CARTER, 1991) so exemplos de variaes da
Matriz de Scatter Plots, que fazem uso de uma matriz de painis.
2.1.1.3 Radviz
Radviz (HOFFMAN et al., 1997) visualizao de coordenadas radiais uma
tcnica que segue um princpio semelhante a Coordenadas Paralelas. Nessa tcnica, n
linhas, correspondentes n dimenses, emanam radialmente do centro de um crculo e
terminam no seu permetro, em pontos igualmente espaados, denominados dimensional
anchors (DAs). Cada item de dado projetado est ligado por meio de molas imaginrias
s DAs e a posio onde so projetados aquela onde existe equilbrio das foras das
molas associadas a cada dimenso (HOFFMAN, 1999). Cada ponto de dado , ento,
exibido onde a soma das foras das molas igual a zero. Todos os valores dos itens de
dados so, geralmente, normalizados para valores entre 0 e 1 (FAYYAD; GRINSTEIN;
WIERSE, 2002). A figura 2.4 mostra um exemplo da representao visual da tcnica
Radviz.
A tcnica Radviz pode mapear vrios itens de dados na mesma posio, dependendo
da ordem em que os atributos esto distribudos no crculo. Alm disso, outras
caractersticas desta tcnica de visualizao so (HOFFMAN, 1999) (FAYYAD;
GRINSTEIN; WIERSE, 2002):

20

Itens de dados com valores de atributos aproximadamente iguais (depois de


normalizados) so posicionados prximos ao centro do crculo;

Itens de dados com valores similares associados a dimenses em eixos


opostos ficam, tambm, prximos ao centro;

Valores maiores dos atributos (ou dimenses) atraem o ponto projetado para
regies prximas aos eixos associados a estes atributos.

A posio de um item de dado depende da representao das dimenses ao redor do


crculo, sendo que, se a ordem das dimenses for alterada, a representao grfica
tambm o ser.

Figura 2.4: Representao visual da tcnica Radviz


(imagem extrada de VALIATI, 2004)
2.1.1.4 Coordenadas Paralelas Circulares
Coordenadas Paralelas Circulares (denominada, tambm, como Grfico de Estrelas
Sobrepostas) correspondem a uma outra verso circular da tcnica Coordenadas
Paralelas, consideravelmente, mais prxima idia original desta ltima (FAYYAD;
GRINSTEIN; WIERSE, 2002). Basicamente, a forma de mapear e projetar os dados
permanece a mesma, apenas as dimenses so dispostas de outra forma (em um formato
circular), formando um grfico em estrela (conforme mostra a figura 2.5).
Seguindo esta forma de projeo geomtrica, os segmentos de linha so mais longos
na parte externa do crculo, onde os valores maiores so tipicamente mapeados,
enquanto os valores menores so projetados para o centro do crculo. Devido
assimetria formada na representao dos valores maiores e menores, certos padres
podem ser facilmente detectados com esta tcnica (FAYYAD; GRINSTEIN; WIERSE,
2002).

21

Figura 2.5: Representao visual da tcnica Coordenadas Paralelas Circulares (imagem


extrada de VALIATI, 2004)
2.1.1.5 Polyviz
Polyviz uma tcnica que busca combinar caractersticas de Coordenadas Paralelas
e de Radviz. Um dos problemas apresentados pela tcnica Radviz que pontos ndimensionais com valores bastante diferentes podem ser mapeados para a mesma
posio na tela. Esta sobreposio pode ser contornada se os pontos fixados para as
molas, em cada dimenso, forem expandidos ao longo dos eixos (FAYYAD;
GRINSTEIN; WIERSE, 2002).
Na tcnica Polyviz, alm de ser empregada esta nova forma de mapeamento dos
pontos, a distribuio para cada dimenso mostrada por linhas emanando dos eixos e
dispostas em uma configurao poligonal (ver figura 2.6). Deste modo, procura-se
aproveitar a capacidade de exibio de agrupamentos, demonstrada pela tcnica Radviz,
e a habilidade de visualizar a distribuio de dados em cada dimenso, caracterstica de
Coordenadas Paralelas.
2.1.1.6 Survey Plots
Survey Plots (LOHNINGER; INSPECT, 1994) outra tcnica na qual os dados de
cada dimenso so mapeados para linhas estendidas a partir de um ponto central. O
comprimento de cada linha corresponde ao valor do item de dado sendo representado.
Como em grfico de barras, esta tcnica utiliza a idia de representar os dados
estendendo cada ponto sendo mapeado para um determinado eixo. Um princpio
semelhante a este empregado tambm pelas tcnicas Table Lens (RAO; CARD, 1994)
e Matriz de Permutao (BERTIN, 1983).

22

A visualizao de Survey Plots permite que correlaes entre quaisquer duas


dimenses possam ser percebidas, especialmente, quando os dados so classificados de
acordo com uma dimenso particular (FAYYAD; GRINSTEIN; WIERSE, 2002). A
figura 2.7 mostra um exemplo de visualizao Survey Plots (representando os dados
sobre carros), na qual os dados esto classificados por nmero de cilindros (valores do
atributo Cylinders).

Figura 2.6: Representao visual da tcnica Polyviz (HOFFMAN et al., 2000)

Figura 2.7: Representao visual da tcnica Survey Plots (imagem extrada de


VALIATI, 2004)

23

2.1.2 Tcnicas Iconogrficas


H dois tipos de visualizaes do tipo iconogrficas: glifos e cones. Em cada uma
destas, as dimenses de um conjunto de dados so mapeadas para certas caractersticas
dos glifos ou cones. Assim, cada glifo ou cone representa um item de dado com suas
n-dimenses.
2.1.2.1 Faces de Chernoff
Uma das mais conhecidas visualizaes iconogrficas Faces de Chernoff
(CHERNOFF, 1973). Nesta ltima, as dimenses dos dados so mapeadas para
caractersticas de uma face, como formato do nariz, boca, olhos e da face como um todo
(ver figura 2.8(a)), resultando em diferentes formatos de faces (definidas segundo os
valores sendo mapeados). Contudo, a efetividade desta tcnica amplamente discutida,
devido dificuldade de percepo de diferenas muito pequenas nas imagens e pela
mesma ser inadequada para a identificao de agrupamentos.

Figura 2.8: Tcnicas iconogrficas: a) Faces de Chernoff e b) Glifos em Estrela


(KEIM, 1997)
2.1.2.2 Glifo em Estrela
Na tcnica Glifo em Estrela (ver figura 2.8 (b)), cada item de dado representado
por um glifo em forma de estrela. Em cada um destes, as dimenses dos dados so
representadas como raios de ngulos iguais, partindo do centro de um crculo. O
comprimento de um raio indica o valor de um atributo. Raios mais extensos representam
valores altos e o centro do crculo indica o valor mnimo da dimenso.
2.1.2.3 Stick Figure
A tcnica Stick Figure caracteriza-se pelo uso de cones bsicos. As vrias
dimenses dos dados so mapeadas para parmetros dos cones, tais como o
comprimento e o ngulo de rotao de uma aresta (ou galho). Variaes de
comprimento, espessura e cor das arestas fornecem outras possibilidades de
representao, explorando a capacidade humana de percepo de texturas e
interpretao de padres (FAYYAD; GRINSTEIN; WIERSE, 2002). A imagem da
esquerda da figura 2.9 apresenta uma tabela de cones, que representam diversos

24

parmetros do censo da Inglaterra, e a imagem da direita da mesma figura mostra estes


cones plotados em coordenadas x e y, indicando renda e idade.

Figura 2.9: Mapeamento de Stick Figures (esquerda) e grfico iconogrfico de dados do


censo da Inglaterra (direita) (FAYYAD et al., 2002)
2.1.3 Tcnicas Orientadas a Pixel
Tcnicas dessa categoria caracterizam-se por mapear o conjunto de valores de cada
atributo (ou dimenso) dos dados em pixels na tela. O conjunto de valores de cada
atributo exibido em janelas individuais, ou seja, para um conjunto de dados que possui
n atributos, a tela dividida em n janelas. Em cada uma das janelas, cada valor do
atributo representado por um pixel, colorido conforme o valor sendo representado. A
distribuio espacial dos pixels na janela pode ser determinada de diferentes maneiras
(ver figura 2.10), de modo que relaes ou significados nos dados possam ser
percebidos pela anlise das regies correspondentes nas janelas (KEIM, 1996).
As formas utilizadas para a distribuio dos pixels nas janelas podem ser divididas
em tcnicas dependentes e independentes do resultado de uma consulta. Nas tcnicas
independentes de consulta, os valores dos atributos so mapeados diretamente para os
pixels e exibidos nas janelas, utilizando-se curvas de preenchimento de espao (curvas
de Peano-Hilbert ou Morton) ou padres recursivos (ver figura 2.11), que proporcionam
um melhor agrupamento de itens de dados relacionados e uma distribuio
semanticamente significativa.
Por outro lado, nas tcnicas dependentes de consulta, ao invs dos valores dos
atributos serem mapeados diretamente para pixels, as distncias destes valores a uma
determinada consulta que so mapeadas. Desta forma, alm dos itens de dados que
satisfazem a consulta, tambm podem ser exibidos aqueles valores que se aproximam da
resposta, atravs da exibio da distncia de cada valor a um respectivo valor
estabelecido na consulta. O clculo da distncia depende da aplicao e do tipo de dado.
Os atributos referentes a um item de dado ocupam a mesma posio relativa nas suas
respectivas janelas, sendo que a ordem de exibio dos itens na janela determinada por
uma distncia global. Essa distncia calculada pela combinao das distncias de cada
atributo, ponderadas por um peso correspondente, que determina a relevncia dada ao
atributo.

25

Visto que o foco est na relevncia dos dados com respeito a uma consulta,
diferentes formas de distribuio dos pixels podem ser apropriadas: em espiral, onde as
respostas corretas so apresentadas no centro da janela e os valores prximos ao redor
desta regio, ou por eixos, indicando distncias positivas e negativas (ver figura 2.10).

Figura 2.10: Visualizaes orientadas a pixel de um conjunto de dados com nove


dimenses, utilizando duas formas de distribuio espacial: espiral (esquerda) e por
eixos (direita) (KEIM, 1997).

Figura 2.11: Tcnicas independentes de consulta: a) curvas de Peano-Hilbert , b) curvas


de Morton e c) padres recursivos (KEIM, 1996) (KEIM, 1997)
Embora o formato retangular para as janelas permita um uso racional do espao na
tela, a percepo de relacionamentos entre os atributos pode ser dificultada quanto
maior for o nmero de dimenses a serem visualizadas. Uma alternativa de soluo a
este problema a utilizao de um formato circular, adotado, por exemplo, na tcnica
Segmentos de Crculo (ver figura 2.12).

26

Figura 2.12: Tcnica Segmentos de Crculo (KEIM, 1997).

2.2 Tcnicas de Interao


Alm das tcnicas de visualizao, para uma explorao de dados efetiva,
necessrio tambm o uso de algumas tcnicas de interao. Estas ltimas permitem que
um usurio possa interagir diretamente com visualizaes e alter-las dinamicamente de
acordo com seus objetivos de explorao. A possibilidade de interagir com
representaes visuais pode reduzir consideravelmente as desvantagens e pontos fracos
de algumas tcnicas de visualizao (principalmente, daquelas que apresentam
desordem visual e sobreposio de objetos), fornecendo ao usurio mecanismos para
manipular a complexidade de conjuntos de dados (OLIVEIRA; LEVKOWITZ, 2003).
Keim (1997) identificou as tcnicas de interao que so utilizadas para a
explorao de conjuntos de dados multidimensionais e organizou-as em seis classes:
mapeamento de dados para propriedades visuais, projees, filtragem (seleo e
consulta), brushing and linking, zoom e detalhes por demanda. A seguir, as tcnicas de
interao aplicadas para a visualizao de dados multidimensionais sero descritas,
utilizando a categorizao proposta por Keim.
2.2.1 Mapeamento de Dados para Propriedades Visuais
Esta categoria inclui as tcnicas de interao que realizam mapeamentos de atributos
(dimenses) dos dados para parmetros de uma visualizao. Estes parmetros so
atributos visuais de objetos representando itens de dados (como cor, tamanho,
transparncia, orientao, etc.). A tabela 2.2 mostra exemplos tpicos de mapeamentos
para algumas propriedades visuais.
A codificao de atributos de dados para propriedades visuais de uma visualizao
aumenta a densidade dos dados e a variedade de representaes que podem ser geradas
(STOLTE; HANRAHAN, 2001). Alm disso, este tipo de mapeamento aumenta o
nmero de dimenses que podem ser visualizadas simultaneamente. Por exemplo, um
scatter plot 2D representa apenas dois atributos (dispostos nos eixos x e y), mas outros

27

atributos podem ser representados simultaneamente se estes forem mapeados para


atributos visuais de objetos.
A fim de manter uma especificao breve, no deve ser requerida do usurio a
construo de mapeamentos. O usurio deve apenas especificar qual atributo de dados
deve ser mapeado para uma determinada propriedade visual. O sistema que deve ser
responsvel por gerar um mapeamento efetivo dos valores do atributo para variaes da
propriedade visual.
Diferentes smbolos (ver tabela 2.2) podem ser utilizados para o mapeamento de
atributos nominais, desde que o nmero de valores do atributo seja pequeno. O tamanho
de objetos pode ser usado para mapear tanto atributos nominais como quantitativos.
Quando mapeando atributos quantitativos, um mapa linear a partir dos valores de
atributo para o tamanho dos objetos criado. Por outro lado, se um atributo nominal
mapeado, o nmero de valores precisa ser pequeno (no mximo quatro ou cinco), de
forma que o usurio consiga distinguir entre diferentes categorias (BERTIN, 1983).
Quando a cor utilizada para mapear atributos nominais, os valores de atributo
devem ser associados a cores bem distintas entre si (ver tabela 2.2). Quando os atributos
mapeados so quantitativos, geralmente, apenas a nuance de cor variada.
Um princpio chave na gerao de mapeamentos de atributos nominais para a
propriedade orientao que a orientao precisa variar pelo menos 30 graus entre as
categorias (KOSSLYN, 1994), o que restringe o nmero de categorias para no mximo
seis. Para atributos quantitativos, a orientao varia linearmente com os valores de
atributo.
Tabela 2.2: Propriedades visuais que podem ser usadas para mapear atributos de dados e
exemplos de mapeamentos tpicos
propriedade objetos
visual

mapeamento nominal

figura

glifo

tamanho

retngulo,
crculo, linha,
glifo, texto

cor

retngulo,
crculo, linha,
glifo, texto

orientao

retngulo,
linha, texto

mapeamento quantitativo

Fonte: STOLDE; HANRAHAN, 2001


2.2.2 Projees
A idia das tcnicas interativas de projeo mudar, dinamicamente, os atributos de
dados (dimenses) que so projetados em eixos de uma visualizao. O objetivo
explorar um conjunto de dados multidimensional, permitindo correlaes entre
diferentes atributos de dados. Um exemplo clssico de sistema que emprega projees
o Grand-Tour (ASIMOV, 1985). Ele tenta mostrar todas as projees bi-dimensionais
interessantes de um conjunto de dados multidimensional como uma srie de scatter
plots. O nmero de projees possveis exponencial no nmero de dimenses e,

28

devido a isto, esta organizao invivel para conjuntos de dados de alta


dimensionalidade. A seqncia de projees mostrada pode ser randmica, manual ou
pr-computada (KEIM, 2002).
2.2.3 Filtragem
Ao explorar grandes conjuntos de dados, importante particionar, interativamente,
estes dados em diferentes segmentos e, ento, focar no subconjunto de interesse (KEIM,
2002). Isto pode ser feito atravs da seleo direta do subconjunto desejado (browsing)
ou pela especificao de propriedades do subconjunto alvo (consulta). Ambas as
possibilidades so formas de filtragem.
A seleo realizada diretamente sobre uma representao visual, com o auxlio de
um dispositivo de apontamento. Sua nfase na filtragem rpida, destacando um
subconjunto dos dados. No entanto, o uso desta tcnica muito difcil para a filtragem
de grandes conjuntos de dados, quando ocorre desordem visual e sobreposio de
objetos.
As tcnicas de consulta dinmica permitem ao usurio manipular widgets grficos
(sliders, botes, etc.) para controlar a quantidade de dados visualizados (AHLBERG;
WILLIAMSON; SHNEIDERMAN, 1992). Cada widget corresponde a um atributo do
conjunto de dados. Esta tcnica funciona melhor para dados quantitativos, mas pode
tambm ser usada na manipulao de dados nominais (GOLDSTEIN; ROTH, 1994).
Neste ltimo caso, o usurio deve selecionar elementos a partir de uma lista de valores.
A figura 2.13 mostra uma interface de consultas dinmicas, usada para selecionar
dinamicamente itens de dados, com base nos seus valores para os atributos Latitude,
Longitude e Interval (intervalo de anos). O mapa maior mostra todos os itens de dados
da regio de interesse (delimitada pelos valores de Latitude e Longitude) e o mapa
menor (acima direita) mostra apenas os itens dentro do intervalo de 30 a 50 anos.

Figura 2.13: Usando consultas dinmicas para verificar a concentrao espacial de itens
de dados em uma regio de interesse (SHIMABUKURO, 2004)

29

As vantagens da consulta dinmica so que widgets grficos so fceis de manipular


e os efeitos da interao so vistos imediatamente na visualizao. Ao utilizar sliders,
por exemplo, o usurio pode acompanhar a mudana progressiva na quantidade de
dados visualizados, medida que a barra do slider vai sendo movida. Alm disso,
consultas dinmicas permitem que o usurio possa descobrir rapidamente quais
segmentos do espao de pesquisa multidimensional esto muito ou pouco populados,
onde h agrupamentos, lacunas ou outliers, e quais tendncias existem em dados
nominais (SHNEIDERMAN, 1994). Por outro lado, a principal desvantagem dessa
tcnica interativa a dificuldade de representar consultas mais elaboradas, como por
exemplo, disjunes. Um exemplo de disjuno seria a combinao de dois intervalos
distintos de valores em um nico slider.
Como as tcnicas de filtragem mencionadas acima (seleo e consultas dinmicas)
apresentam limitaes claras, vrias outras tcnicas tm sido desenvolvidas para
melhorar a filtragem interativa na explorao de dados. Um exemplo de ferramenta
interativa que pode ser usada para filtragem magic lenses (BIER et al., 1993)
(FISHKIN; STONE, 1995). A idia bsica desta ltima usar uma ferramenta como
uma lente, para filtrar dados diretamente na visualizao. Os dados debaixo da lente so
processados por um filtro e exibidos diferentemente do restante dos dados (vrias lentes
com diferentes filtros podem ser usadas). A tcnica mostra uma visualizao modificada
da regio selecionada, enquanto o resto da visualizao permanece igual. Como a
lente pode ser movimentada por toda a rea de uma visualizao (utilizando o mouse),
as magic lenses so tambm chamadas de filtros mveis. A figura 2.14 mostra o uso de
dois filtros de magic lenses, um deles mostra uma viso aramada de blocos 3D e o outro
uma viso aumentada 2D.
As principais vantagens do uso dessa tcnica so a possiblidade de visualizar
detalhes e contexto simultaneamente e modificar a apresentao de objetos para revelar
informaes escondidas, aumentar os dados de interesse ou eliminar informaes
desnecessrias do foco (BIER et al., 1993).

Figura 2.14: Magic lenses: Uma lente de viso aramada 3D e uma lente de aumento 2D
(BIER et al., 1993).
2.2.4 Zoom
Zoom uma tcnica interativa muito conhecida e amplamente utilizada por diversas
aplicaes. Ao representar graficamente conjuntos de dados com um grande nmero de
itens de dados, importante que estes ltimos sejam exibidos de forma comprimida,
com o objetivo de fornecer uma viso de overview do conjunto inteiro. Mas, ao mesmo

30

tempo, interessante fornecer tambm uma visualizao diferenciada dos dados, em


diferentes resolues.
A tcnica de zoom no significa apenas mostrar objetos de dados maiores, mas
significa tambm que a representao dos dados muda automaticamente para apresentar
mais detalhes, em nveis de zoom mais altos (KEIM, 2002). Os objetos podem, por
exemplo, ser representados em um nico pixel, em nveis de zoom baixos; como cones,
em um nvel de zoom intermedirio; e como objetos nomeados, em resolues altas.
Uma viso overview permite ao usurio detectar modelos, correlaes e outliers no
conjunto de dados, j uma viso com nvel de zoom mais alto permite melhor
explorao de uma rea de interesse, pois os itens de dados so exibidos com maior
detalhe.
2.2.5 Detalhes por Demanda
Essa tcnica representa a possibilidade de obter, interativamente, mais detalhes
sobre os dados visualizados. Estes detalhes podem ser, por exemplo, valores de atributo
de um item de dado ou cone (ou glifo) ou informaes adicionais destes.
Detalhes por demanda uma tcnica oferecida como alternativa mais rpida a
consultas dinmicas. Em vez de compor consultas e interpretar seus resultados, o
usurio pode, em qualquer momento que sentir necessidade, solicitar rapidamente a
exibio de detalhes acerca de um item de dado. Esta solicitao, geralmente,
realizada por meio da seleo direta do item na visualizao, e os dados de detalhe
solicitados, usualmente, so exibidos em um frame pop-up (como na figura 2.15, que
mostra informaes adicionais sobre um filme selecionado) ou no painel de controle da
visualizao.

Figura 2.15: Usando a tcnica detalhes por demanda para obter informaes adicionais
sobre um item de dado (extrado de AHLBERG; SHNEIDERMAN, 1994).

3 VISUALIZAES COORDENADAS: CONCEITOS E


REVISO BIBLIOGRFICA

Conectar e relacionar informaes em uma visualizao com informaes em outra


auxilia o usurio no processo de explorao de um conjunto de dados e pode fornecer
compreenses adicionais acerca do mesmo (ROBERTS, 2004). North e Shneiderman
(1997), em seus experimentos com usurios, descobriram que a coordenao de
mltiplas visualizaes oferece como vantagens a melhora na performance do usurio, a
descoberta de relacionamentos inesperados e a unificao do desktop.
Muitas formas diferentes de interaes podem ser coordenadas, como operaes de
manipulao, consultas, selees e mapeamentos visuais. Alm disso, uma ao em
determinada visualizao pode ser conectada mesma ao em outra visualizao ou a
uma ao diferente (a possibilidade de cada combinao deve ser verificada, pois nem
todas so possveis). Ainda, tambm h formas diferentes para especificar um
relacionamento de coordenao, que pode ser unidirecional ou bidirecional.
Considerando um par de visualizaes interligadas, apenas uma delas pode afetar a
outra, com uma ligao unidirecional (nico sentido). J se a ligao estabelecida for
bidirecional (duplo sentido), ambas as visualizaes so mutuamente afetadas.
Duas visualizaes interligadas, geralmente, representam dados de um mesmo
conjunto, cada uma utilizando uma tcnica de representao visual diferente. Outra
possibilidade, no entanto, permitir que visualizaes interligadas representem
conjuntos de dados diferentes. Neste caso, os conjuntos de dados considerados devem
possuir uma relao entre si, de forma que seja possvel para uma aplicao estabeler
um mapeamento de informaes em uma visualizao para informaes em outra.
A seo abaixo apresenta as principais formas de coordenaes utilizadas por
sistemas de mltiplas visualizaes coordenadas e as vantagens que o uso das mesmas
oferece, e a seo seguinte a esta descreve alguns dos principais sistemas de
visualizaes coordenadas relacionados a esse trabalho.

3.1 Tipos de Coordenaes


North e Shneiderman (1997) determinaram que as aes realizadas por usurios no
processo de explorao de dados so limitadas seleo de itens e navegao em
janelas (zoom, scroll, pan, rotao, etc.). Com base nisto, eles desenvolveram uma
taxonomia de coordenaes que abrange trs possibilidades de combinao destas aes
(uma ao em uma visualizao ligada outra ao numa segunda visualizao):
seleo seleo, navegao navegao e seleo navegao. O smbolo
indica bidirecionalidade, o que significa que estas ligaes so vlidas nos dois

32

sentidos. Os mesmos autores tambm determinaram que as trs possibilidades de


coordenao podem ser aplicadas para visualizaes que representam o mesmo conjunto
de dados, bem como para visualizaes que representam conjuntos relacionados.
No entanto, Pattison e Phillips (2001) discordaram das determinaes acima,
indicando outras formas de coordenao alm da seleo e navegao, como por
exemplo, a ordenao de itens e agrupamentos. Da mesma forma, Boukhelifa et al.
(2003) acredita em um uso mais amplo de coordenaes, exemplificado por um modelo
em camadas, onde o usurio pode ligar qualquer aspecto do dataflow e processo de
explorao.
Muitas so as coordenaes citadas na literatura (muitas vezes a mesma tcnica
tratada por diferentes nomenclaturas), mas no h uma nica categorizao amplamente
aceita que organize as mesmas. Por esta razo, a seguir sero descritas algumas
coordenaes, que foram identificadas como as mais utilizadas em sistemas de mltiplas
visualizaes coordenadas para explorao de dados. As sete primeiras coordenaes
descritas (brushing-and-linking, reordenao de dimenses sincronizada, filtragem
sincronizada, mapeamento de dados para propriedades visuais, scrolling sincronizado,
zoom sincronizado e rotao sincronizada) conectam a mesma ao em todas as
visualizaes, ao contrrio das duas ltimas coordenaes (overview e detalhe e drill
down), que conectam aes diferentes em cada visualizao. Entre todas as tcnicas
descritas abaixo, apenas drill down no costuma ser implementada de forma
bidirecional.
3.1.1 Brushing-and-Linking
Brushing um processo no qual um usurio pode destacar, selecionar ou apagar um
subconjunto de elementos representados graficamente, apontando-os com o mouse
(MARTIN; WARD, 1995). Quando mltiplas visualizaes dos dados esto sendo
exibidas simultaneamente, o brushing associado com outro processo, conhecido como
linking. Neste caso, elementos selecionados em uma visualizao so automaticamente
destacados em todas as demais, tornando possvel a deteco de dependncias e
correlaes. Por exemplo, na figura 3.1, a seleo dos estados com mais alto nvel de
educao nos EUA, na visualizao scatter plot, revela que estes estados esto
localizados na regio nordeste do pas. Atravs da coordenao brushing-and-linking,
os itens selecionados na scatter plot (em amarelo) so automaticamente selecionados
tambm na representao de mapa.
Brushing-and-linking o tipo de coordenao mais utilizada pelos sistemas de
visualizaes coordenadas e empregada para a anlise de dados h muitos anos.
Recentemente, esta tcnica tem sido usada tambm para ajudar usurios a obterem
informaes adicionais sobre pontos de dados selecionados. Alguns sistemas que
implementam esse tipo de coordenao so Spotfire (AHLBERG; WISTRAND, 1995),
Visage (ROTH et al., 1996) e Snap-Together (NORTH, 2000), sistema no qual foi
gerado o cenrio da figura 3.1.
A coordenao brushing-and-linking utilizada com maior freqncia para
visualizar equivalncias entre diferentes representaes do mesmo conjunto de dados,
mas a mesma tambm utilizada, por alguns sistemas, para visualizar relaes
arbitrrias entre diferentes conjuntos de dados. Por exemplo, registros de dados
relacionados, mas em diferentes tabelas, podem ser destacados consultando uma base de
dados relacional durante o processo de brushing-and-linking.

33

Figura 3.1: Visualizaes coordenadas pela tcnica brushing-and-linking


(NORTH, 2000)
3.1.2 Reordenao de Dimenses Sincronizada
Esse tipo de coordenao permite que um usurio possa mudar a disposio em que
atributos de dados (dimenses) aparecem em diferentes visualizaes
multidimensionais, simultaneamente. Na maioria das tcnicas de visualizao
multidimensionais, os atributos do conjunto de dados so posicionados na tela em um
arranjo uni ou bi-dimensional (YANG et al., 2003). Devido a isto, deve ser escolhida
alguma ordem para as dimenses. Esta ordem geralmente interfere na expressividade da
visualizao, pois diferentes arranjos de dimenses podem revelar aspectos diferentes
dos dados e afetar a clareza e estrutura da representao visual (PENG; WARD;
RUNDENSTEINER, 2004). Assim, caractersticas bem diferentes podem ser percebidas
do conjunto de dados, dependendo do arranjo das dimenses na visualizao.
Apenas alguns sistemas de visualizaes multidimensionais permitem a reordenao
de dimenses e esta realizada manualmente pelo usurio. XmdvTool (WARD, 1994)
um exemplo de sistema que permite coordenar a reordenao de dimenses. Quando o
usurio solicita manualmente uma alterao na ordem das mesmas, essa alterao
realizada em todas as visualizaes multidimensionais disponveis, simultaneamente.
3.1.3 Filtragem Sincronizada
O processo de filtragem consiste em particionar um conjunto de dados,
dinamicamente, com o objetivo de focar em um determinado subconjunto de interesse
(KEIM, 2002). No contexto de visualizaes coordenadas, a filtragem , geralmente,
utilizada como consultas dinmicas (AHLBERG; SHNEIDERMAN, 1994). O usurio
habilita a eliminao de pontos de dados das visualizaes, especificando intervalos de
valores para atributos em consultas. Cada widget grfico (geralmente, um slider) de
consulta dinmica representa um atributo de dados. Conforme o usurio muda o
intervalo de um filtro de consulta dinmica, todas as visualizaes coordenadas so
progressivamente alteradas, para exibir o novo montante de pontos de dados.
CityOScope (BRODBECK; GIRARDIN, 2003) um exemplo de sistema que
coordena o processo de filtragem da forma descrita acima. Outra forma de coordenar
filtragem implementada por sistemas de filter-flow, como Linkwinds (JACOBSON;
BERKIN; ORTON, 1994). Neste tipo de sistema, o usurio conecta controles de filtro

34

de consulta dinmica e visualizaes em uma rede pipeline. Selecionando intervalos


para dimenses em um controle ou filtros da visualizao, os dados mostrados seguem
no pipeline. Em todos os sistemas pesquisados na literatura, a filtragem sincronizada
utilizada apenas em visualizaes que representam o mesmo conjunto de dados.
A filtragem uma tcnica muito til para analisar a distribuio dos dados
(agrupamentos e lacunas) e tendncias, assim como reduzir a desordem visual das
representaes. Quando empregada de forma coordenada, esta tcnica evita que o
usurio tenha que, repetidas vezes, focar uma visualizao em um determinado
subconjunto de dados, para visualiz-lo em todas as representaes visuais.
3.1.4 Mapeamento de Dados para Propriedades Visuais
Esse tipo de coordenao mapeia valores de atributos (dimenses) para parmetros
visuais de objetos de dados de visualizaes, como cor, tamanho, transparncia,
orientao, entre outros (ver tabela 2.2 para exemplos de mapeamentos tpicos). O
usurio deve indicar qual atributo de dados deve ser mapeado para uma determinada
propriedade visual, selecionando o nome do atributo no componente de interface grfica
que representa a propriedade em questo. Logo aps a seleo, todas as visualizaes
coordenadas exibiro seus objetos de dados com os valores do atributo selecionado pelo
usurio, mapeados para a propriedade visual por ele tambm escolhida. O mesmo tipo
de mapeamento visual aplicado em todas as visualizaes.
A coordenao de mapeamentos de dados para propriedades visuais auxilia o
usurio a identificar o posicionamento de determinados objetos de dados nas diferentes
visualizaes e perceber tendncias gerais do conjunto de dados. O sistema XmdvTool
(WARD, 1994) permite a coordenao de mapeamentos de dados para diferentes mapas
de cores. A figura 3.2 mostra as tcnicas Coordenadas Paralelas e Glifos em Estrela
utilizando o mesmo mapa de cores, que representa os valores do atributo Origin. Preto
representa o valor mais baixo do atributo e verde claro o valor mais alto.
3.1.5 Scrolling Sincronizado
Esse tipo de coordenao conecta as scroll bars de duas ou mais janelas, mantendoas sincronizadas. Uma scroll bar um mecanismo tpico de navegao em janela
(panning), sendo assim, as tcnicas scrolling e panning sincronizado so anlogas.
Quando o usurio movimenta a scroll bar de uma janela, as demais so deslocadas
automaticamente para a posio correspondente primeira. Esta navegao
sincronizada evita a perda do relacionamento entre as visualizaes e a repetio tediosa
da ao de navegao em cada uma das janelas, pelo usurio (NORTH;
SHNEIDERMAN, 1997). Com isto, as tarefas do usurio, como fazer comparaes e
examinar diferentes pontos de vista, so agilizadas.

35

Figura 3.2: Visualizaes coordenadas com valores do atributo Origin mapeados


para cor
O scrolling sincronizado pode ser usado para navegar atravs do mesmo conjunto de
dados em todas as janelas ou atravs de mltiplos conjuntos correspondentes (NORTH;
SHNEIDERMAN, 1997). No primeiro caso, por exemplo, quando editando um
documento HTML (representao de texto) em uma janela, til simultaneamente
visualizar a sada desse documento (representao do layout) como uma pgina web, em
outra janela. No caso de conjuntos de dados diferentes, o Microsoft Word fornece
scrolling sincronizado entre as janelas de documento, notas de rodap e anotaes. O
deslocamento atravs do documento provoca o deslocamento das listas de notas de
rodap e anotaes, para mostrar os itens que so referenciados dentro da atual parte
visvel do documento.
Os exemplos de scrolling sincronizado citados acima so uni-dimensionais. No
entanto, este tipo de coordenao pode tambm ser aplicado para representaes visuais
de dimensionalidade maior. O sistema DEVise (LIVNY et al., 1997), por exemplo,
implementa panning sincronizado em 2D, permitindo que o usurio conecte o eixo x ou
y de mltiplos grficos, para que estes mostrem sempre os mesmos domnios e
intervalos.
3.1.6 Zoom Sincronizado
O zoom sincronizado permite que duas ou mais visualizaes apresentem o mesmo
nvel de detalhamento. Se o usurio executa uma operao de zoom em uma
visualizao, as visualizaes coordenadas a esta sero automaticamente atualizadas
para refletir a mesma operao.
O sistema DEVise (LIVNY et al., 1997), por exemplo, permite ao usurio
sincronizadamente realizar zoom em mltiplos grficos 2D, que possuam eixos x ou y
em comum. Da mesma forma, Chi et al. (1997) arranjou vrias visualizaes 3D
pequenas em um grid e sincronizou suas operaes de zoom (ver figura 3.3). O zoom
sincronizado pode ser aplicado com visualizaes que representam o mesmo conjunto
de dados ou conjuntos diferentes (como DEVise).

36

Figura 3.3: Mltiplas visualizaes 3D em grid (CHI et al., 1997)


3.1.7 Rotao Sincronizada
Esse tipo de coordenao consiste apenas em sincronizar rotaes executadas no
espao visual de diferentes visualizaes, de forma que a orientao rotacional seja a
mesma em todas elas. Esta tcnica utilizada apenas em representaes 3D.
O sistema de visualizaes em grid proposto por Chi et al. (1997) utiliza rotaes
sincronizadas para permitir a visualizao de pontos oclusos dos objetos em cada clula
do grid. Na figura 3.3, possvel observar que todas as visualizaes 3D do grid
representado possuem a mesma orientao rotacional.
3.1.8 Overview e Detalhe
Ao contrrio de todas as coordenaes descritas acima, o overview e detalhe no
corresponde ao mesmo tipo de interao nas visualizaes interligadas. Este tipo de
coordenao envolve, geralmente, apenas duas visualizaes e estas so conectadas por
interaes diferentes.
A idia fornecer uma visualizao de overview para orientao e uma visualizao
de detalhe para tarefas adicionais. Selecionando um item na viso overview faz com que
a viso de detalhe seja automaticamente atualizada para exibir este item (e vice-versa).
Note que a ao de seleo na vista overview corresponde a uma ao de navegao
(panning ou zoom) na vista de detalhe, pois o conjunto inteiro de dados no pode ser
exibido simultaneamente nesta ltima vista. O overview fornece uma viso do conjunto
de dados inteiro e, por isto, os itens so exibidos de forma bastante reduzida. O detalhe,
ao contrrio, fornece informaes detalhadas de uma pequena parte do conjunto,
exibindo-a em propores bem maiores que o overview.
A figura 3.4 mostra a coordenao overview e detalhe na representao de rvores.
A visualizao da esquerda mostra a representao reduzida da rvore (overview) e a

37

visualizao da direita mostra em detalhe apenas a sub-rvore selecionada no overview.


Nessa figura, a visualizao de detalhe apenas uma verso ampliada do overview.
No entanto, a aparncia, ou at mesmo o contedo, pode mudar entre as visualizaes
de overview e de detalhe (CARD, 1999). Por exemplo, no sistema SeeSoft (BALL;
EICK, 1996), o texto do cdigo de um programa mostrado com a largura de um nico
pixel na viso de overview, j na viso de detalhe, ele mostrado com letras. A grande
maioria dos sistemas que implementam a coordenao overview e detalhe representam o
mesmo conjunto de dados em ambas as visualizaes.
Ter uma visualizao de overview dos dados apresenta muitas vantagens. O
overview reduz o tempo de busca, permite a deteco de modelos gerais e ajuda o
usurio a escolher o prximo movimento (NORTH; SHNEIDERMAN, 1997). Sua
coordenao com a visualizao de detalhe permite ainda um acesso muito mais rpido
a informaes detalhadas.

Figura 3.4: Coordenao de overview e detalhe no sistema PDQ Tree-browser


(KUMAR; PLAISANT; SHNEIDERMAN, 1997)
3.1.9 Drill Down
A coordenao drill down permite ao usurio navegar atravs de sucessivas camadas
de uma base de dados hierrquica, com visualizaes separadas para cada camada.
Selecionando um item pai em uma visualizao, os itens filhos deste so carregados em
uma outra visualizao, como ocorre no Windows Explorer. Este tipo de coordenao
no costuma ser implementado de forma bidirecional, ou seja, a coordenao ocorre
somente em um sentido (da visualizao que exibe itens pais para aquela que exibe itens
filhos).
Esta coordenao torna possvel a explorao de dados hierrquicos com um grande
nmero de camadas e ainda de conjuntos de dados com um grande nmero de itens, que
suportam agregaes. Agregaes so mostradas em uma visualizao e o contedo de

38

uma agregao selecionada exibido em outra visualizao (FREDRIKSON et al.,


1999). Por exemplo, a figura 3.5 mostra agregaes de itens pelo nmero de automveis
envolvidos em incidentes, no grfico superior da figura, e os incidentes com 2 carros
envolvidos (agregao selecionada) so exibidos no grfico inferior da figura. Uma
forma diferente de implementao da tcnica drill down utilizada no sistema Visage
(ROTH et al., 1996). Neste ltimo, o usurio precisa arrastar uma agregao de itens de
uma visualizao e solt-la em outra para ver seu contedo detalhado.

Figura 3.5: Usando a coordenao drill down para visualizar o contedo de agregaes
no Snap-Together (FREDRIKSON et al., 1999)

3.2 Sistemas de Mltiplas Visualizaes Coordenadas


Sistemas de visualizaes coordenadas podem ser classificados por seus nveis de
flexibilidade em manipulaes de dados, visualizaes e coordenaes (NORTH;
SHNEIDERMAN, 2000). Sistemas flexveis em dados (nvel 1) permitem que os
usurios carreguem conjuntos de dados diferentes nas visualizaes. Sistemas flexveis
em visualizaes (nvel 2) permitem a escolha de diferentes conjuntos de visualizaes,
conforme mais apropriado para os dados. J os sistemas flexveis em coordenaes
permitem que usurios escolham diferentes tipos de coordenaes entre pares de
visualizaes.
A maioria dos sistemas de visualizaes coordenadas de nvel 1, ou seja, flexveis
para dados, mas no para visualizaes ou coordenaes. Usurios podem carregar seus
prprios dados, mas estes so sempre apresentados com a mesma interface.
Sistemas de nvel 2 incluem flexibilidade na escolha de visualizaes. Ferramentas
como EDV (EICK; WILLS, 1995), Spotfire (AHLBERG; WISTRAND, 1995) e Visage
(ROTH et al., 1996) podem representar conjuntos de dados atravs de muitas tcnicas

39

de visualizao diferentes, escolhidas pelo usurio. Todas as visualizaes so


coordenadas atravs da tcnica brushing-and-linking, o que permite o estabelecimento
de relaes entre itens de dados em diferentes visualizaes.
Finalmente, sistemas de nvel 3 incluem flexibilidade nas coordenaes entre
visualizaes. Alguns deles fornecem apenas um tipo de coordenao, mas deixam o
usurio escolher quais visualizaes coordenar. Como em sistemas desse nvel as
coordenaes so dinmicas, importante que os mesmos disponham de algum mtodo
para representar visualmente as coordenaes ativas entre pares de visualizaes. O
objetivo disto evitar a desorientao do usurio, que pode esquecer facilmente quais
conexes estabeleceu. Ferramentas como Snap-Together (NORTH, 2000), GeoVISTA
Studio (GAHEGAN et al., 2000), DEVise (LIVNY et al., 1997) e Improvise
(WEAVER, 2004) apresentam flexibilidade nas coordenaes.
Os sistemas DEVise e Improvise podem ser utilizados para a representao de dados
multidimensionais, porm ambos no disponibilizam visualizaes que mostram todas
as dimenses destes dados em uma nica representao visual. DEVise tem como nica
visualizao um plot 2D e Improvise oferece tambm plots 3D e algumas tabelas.
Assim, a forma utilizada para representar simultaneamente n-dimenses de dados nestas
ferramentas a criao de mltiplos plots 2D. Embora este tipo de representao no
faa parte do foco desse trabalho, importante mencionar que o mesmo permite a
utilizao de coordenaes interessantes (como panning e zoom sincronizado de plots
com eixos comuns), que so disponibilizadas por DEVise e Improvise. Um ponto
negativo destas ferramentas que elas no oferecem um recurso visual de rpido acesso
para o usurio verificar as coordenaes ativas.
A aplicao apresentada nesse trabalho classificada como um sistema flexvel em
dados, visualizaes e coordenaes, pois suporta a escolha dos dados a serem
representados, das visualizaes que formaro um cenrio, bem como tambm das
coordenaes que conectaro estas ltimas.
A seguir, sero abordadas com maior detalhamento as ferramentas de visualizaes
coordenadas que possuem uma relao mais forte com o presente trabalho. So elas:
XmdvTool, Snap-Together e GeoVista Studio.
Snap-Together e GeoVista Studio so flexveis em dados, visualizaes e
coordenaes, enquanto XmdvTool flexvel somente em dados e visualizaes. Esta
ltima ser abordada aqui por ser especfica para a visualizao de dados
multidimensionais e apresentar tcnicas de coordenao relevantes para o trabalho.
3.2.1 XmdvTool
A aplicao XmdvTool (WARD, 1994) (RUNDENSTEINER et al., 2002) tem como
foco a visualizao exploratria de conjuntos de dados multidimensionais. Para
representar estes dados, ela disponibiliza quatro tcnicas tradicionais: Coordenadas
Paralelas, Matriz de Scatter Plots, Glifos em Estrela e Pilha Dimensional. No entanto,
como estas tcnicas geram grande confuso visual e sobreposio de objetos quando
representando conjuntos com grande nmero de itens de dados, XmdvTool fornece
ainda uma verso hierrquica para cada uma das tcnicas mencionadas. O usurio pode,
ento, escolher qual verso de uma tcnica utilizar. A nica diferena entre uma tcnica
hierrquica e sua verso tradicional est no fato de que a primeira possibilita ao usurio
filtrar hierarquicamente objetos de dados separados em clusters, por meio da interao

40

com uma rvore de mnimos e mximos, onde intervalos de consultas so especificados


(RUNDENSTEINER et al., 2002).
As visualizaes geradas por essa ferramenta so todas interligadas por um conjunto
fixo e pr-determinado de coordenaes e apenas duas visualizaes podem ser exibidas
simultaneamente (uma visualizao principal e outra auxiliar). Alm disso, todas as
visualizaes representam o mesmo conjunto de dados. As caractersticas mais
interessantes dessa ferramenta, no entanto, so suas possibilidades de coordenao, que
abrangem brushing-and-linking n-dimensional, reordenao e filtragem sincronizada de
dimenses, filtragem hierrquica de objetos de dados e mapeamento de dados para cor
(ver figura 3.2 para um exemplo).
Brushing-and-linking n-dimensional permite ao usurio selecionar, atravs de
manipulao direta, regies diferentes para cada dimenso do conjunto de dados, as
quais sero consideradas tambm em outras visualizaes devido coordenao. Logo,
apenas os objetos de dados contidos inteiramente dentro da regio de brushing ndimensional sero destacados em todas as visualizaes. Na figura 3.6, as imagens (c) e
(d) mostram em roxo as regies de brushing n-dimensional definidas por um usurio
interagindo diretamente nestas representaes e as imagens (a) e (b) mostram
destacados (em vermelho) os dados contidos inteiramente dentro da regio de brushing
definida. As tcnicas de visualizao da figura esto interligadas, devido a isto as
regies de brushing de ambas so anlogas.
A reordenao e filtragem sincronizada de dimenses so realizadas pelo usurio
modificando componentes grficos em uma janela independente das visualizaes. A
filtragem faz com que um eixo vertical seja retirado da visualizao Coordenadas
Paralelas, uma aresta (ou raio) da visualizao Glifos em Estrela e uma linha e uma
coluna da Matriz de Scatter Plots. A reordenao sincronizada, diferentemente, apenas
muda a posio destes elementos nas visualizaes citadas, conforme determinado pelo
usurio.
Embora o sistema XmdvTool apresente tcnicas de coordenao interessantes e
variadas para visualizaes multidimensionais, ele no flexvel em coordenaes e no
permite a criao de mltiplas visualizaes (apenas duas), restringindo a liberdade de
usurios no processo de explorao de dados. Alm disso, ele emprega apenas uma
possibilidade de mapeamento de dados para propriedades visuais, quando muitas outras
poderiam ser utilizadas.
3.2.2 Snap-Together
Snap-Together (NORTH, 2000) uma ferramenta de propsito geral, que suporta a
visualizao exploratria de conjuntos de dados de diversos tipos. Usurios podem criar
cenrios com mltiplas visualizaes e coorden-las da forma que desejarem. Uma
coordenao pode corresponder a aes diferentes em cada visualizao (por exemplo,
uma seleo de itens correspondendo a uma operao de zoom), mas o conjunto de
aes suportadas por cada representao visual limitado seleo de itens e
navegao em janela (scroll, pan, zoom, load, etc.). Alm disso, muitas combinaes de
aes no so possveis. As principais coordenaes suportadas por Snap-Together so:
brushing-and-linking, overview e detalhe, drill down e scrolling sincronizado (NORTH,
SHNEIDERMAN, 2000).

41

Figura 3.6: Brushing-and-linking n-dimensional no sistema XmdvTool. Os dados


selecionados so exibidos nas imagens (a) e (b) em vermelho, e a regio de brushing
que indica os dados de interesse mostrada nas imagens (c) e (d), no espao de um glifo
em estrela e no espao de coordenadas paralelas, respectivamente.
Essa ferramenta permite tambm que cada visualizao de um cenrio represente
graficamente dados de tabelas diferentes, mas relacionadas. Para isto, Snap-Together
utiliza um modelo conceitual baseado no modelo relacional. Usurios podem,
interativamente, estabelecer relacionamentos entre tabelas de dados relacionadas,
conectando um atributo de uma tabela com um atributo de outra. Este relacionamento
utilizado pela aplicao para mapear dados de uma visualizao para a outra.
Apesar de Snap-Together prover um conjunto amplo de tcnicas de visualizao,
apenas Coordenadas Paralelas e a visualizao Tabela representam tcnicas
multidimensionais. Para estas tcnicas, as aes possveis so ainda mais limitadas:
selection, highlight e load, para Coordenadas Paralelas, e selection, load e scrool, para a
visualizao Tabela. A ao highlight (destaque) provoca o mesmo efeito visual que a
ao selection, mas difere desta ltima porque executada quando o usurio
simplesmente passa o mouse sobre um objeto de dado, destacando-o. A ao load, que
permite apenas o recebimento de dados, utilizada para isolar itens de interesse,
exibindo apenas estes ltimos na visualizao. Finalmente, a ao scroll faz com que a
barra de scroll da visualizao Tabela seja deslocada para exibir um determinado item
de dado. Esta ltima ao tambm apenas recebe dados. A figura 3.7 mostra um cenrio
construdo em Snap-Together, para a explorao de duas tabelas relacionadas de dados
multidimensionais. A primeira tabela (com dados sobre o censo em estados dos EUA)
foi relacionada segunda (com dados sobre o censo em cidades dos EUA) atravs do
atributo nome do estado, contido em ambas. Este relacionamento que determina o
mapeamento de informaes da visualizao Coordenadas Paralelas, que representa a
primeira tabela, para informaes nas visualizaes Scatter Plot e Tabela, que

42

representam a segunda tabela de dados. Isto pode ser comprovado observando a figura
3.7: a ao selection da visualizao Coordenadas Paralelas est coordenada com a ao
load da visualizao Tabela, ento a seleo de um item na primeira representao, no
caso o estado California, causa a exibio de informaes acerca de todas as cidades
deste estado, apenas, na segunda visualizao.

Figura 3.7: Cenrio construdo em Snap-Together para a explorao de duas tabelas


relacionadas de dados multidimensionais
Como pode ser observado tambm na figura 3.7 (frame da esquerda), o sistema
Snap-Together mantm visvel em sua interface a representao visual de um diagrama
de coordenaes. Neste, cada visualizao de um cenrio e suas possveis aes
(pequenos retngulos coloridos) so representadas. As coordenaes estabelecidas pelo
usurio em cada momento tambm podem ser identificadas, pois so representadas
pelas linhas que conectam os smbolos de aes. Alm de orientar o usurio quanto s
coordenaes atuais, o diagrama de coordenaes em questo tambm manipulado
interativamente pelo usurio para criar e remover coordenaes.
Enfim, as caractersticas mais interessantes de Snap-Together so a possibilidade de
representar mais de uma tabela de dados em um mesmo cenrio de explorao e sua
aplicao em diversos domnios de dados. No entanto, estas duas caractersticas
acarretam limitaes quanto s possibilidades de coordenao. A ferramente oferece um
conjunto pouco variado de aes interativas (apenas seleo e navegao em janelas),
sendo suas combinaes ainda mais limitadas. No caso especfico da explorao de
dados multidimensionais, alm da disponibilidade de poucas visualizaes adequadas, o
usurio fica limitado, basicamente, seleo coordenada de objetos de dados.
Coordenaes como filtragem sincronizada e mapeamento de dados para propriedades
visuais no so suportadas.

43

3.2.3 GeoVista Studio


GeoVista Studio (GAHEGAN et al., 2000) consiste em uma ferramenta de
programao visual orientada a componentes, que tem como foco principal a
visualizao e anlise de dados geo-cientficos. Ela baseada em um modelo de fluxo
de dados, em que cenrios de explorao personalizados podem ser dinamicamente
construdos conectando entradas e sadas de componentes independentes JavaBeans.
Cada componente possui uma lista pr-definida de mtodos que permitem a entrada ou
sada de determinadas informaes, e cabe ao usurio definir quais destes mtodos sero
ativados para habilitar a troca de informaes entre beans.
O conjunto de componentes que acompanham a ferramenta bastante variado e
permite a execuo das mais diversas funcionalidades, desde a leitura de arquivos e
entradas fornecidas pelo usurio at a representao visual dos dados e anlises. Em
especial, para a visualizao de dados multidimensionais, GeoVista Studio oferece
quatro tcnicas tradicionais: Coordenadas Paralelas, Matriz de Scatter Plots, Space Fill
(orientada a pixel e independente de consulta) e Tabela de Dados. A figura 3.8 mostra
um cenrio de explorao de dados multidimensionais formado por estas quatro tcnicas
de visualizao. A janela acima direita, na figura, mostra a representao dos
componenentes utilizados neste cenrio e do fluxo de dados entre eles. interagindo
diretamente com esta representao que o usurio cria um cenrio.
As mltiplas visualizaes criadas para um cenrio de explorao podem ser
coordenadas dinamicamente. Para isto, os componentes que as representam devem ser
conectados a um componente especial, denominado Coordinator, que responsvel por
gerenciar coordenaes entre componentes de visualizao (ver figura 3.8 acima
direita). O componente Coordinator cria uma janela (como a mostrada na figura 3.8,
abaixo, esquerda) que mostra todas as possibilidades de coordenao para cada
visualizao. Por default, todas as coordenaes possveis entre pares de visualizaes
iniciam ativadas, mas o usurio pode desabilitar/habilitar as mesmas atravs dos botes
check box da janela do coordenador.
Cada coordenao, em GeoVista Studio, corresponde a aes iguais em diferentes
visualizaes. No entanto, essa ferramenta disponibiliza poucas aes para coordenao.
No caso das visualizaes multidimensionais mencionadas, possvel coordenar apenas
a seleo ou destaque (highlight) de itens e o mapeamento de dados para cor.
Enfim, embora disponha de diferentes tcnicas para a visualizao de dados
multidimensionais, GeoVista Studio, assim como os demais sistemas descritos nessa
seo, tambm deixa a desejar quanto s possibilidades de coordenao, que so
bastante limitadas.
A limitao constatada nas tcnicas de coordenao para representaes de dados
multidimensionais nos sistemas atuais inspirou o desenvolvimento do presente trabalho,
onde foram identificados os tipos de coordenaes para visualizaes
multidimensionais, e seu uso demonstrado em uma aplicao prottipo.

44

Figura 3.8: Cenrio construdo em GeoVista Studio com todas as suas tcnicas de
visualizao multidimensionais

4 O TOOLKIT INFOVIS

Esse captulo descreve as principais caractersticas e a estrutura bsica do toolkit de


visualizao de informaes InfoVis (FEKETE, 2003; FEKETE, 2004), sobre o qual foi
construda a aplicao de visualizaes coordenadas descrita nesse trabalho. InfoVis foi
escolhido por ser especfico para visualizao de informaes, por apresentar uma
arquitetura simples de usar e extensvel e, principalmente, porque implementa vrias
tcnicas de visualizao e fornece vrios componentes para suportar manipulaes
interativas nestas ltimas. O mesmo pode tanto ser usado na sua forma original, como
modificado e estendido livremente, j que seu cdigo fonte encontra-se disponvel.
O toolkit InfoVis foi projetado para suportar a criao, extenso e integrao de
componentes avanados de visualizao de informaes 2D dentro de aplicaes Java
interativas. Segundo Fekete, suas principais caractersticas so:

Estruturas de dados genricas;

Algoritmos especficos para visualizar estas estruturas de dados;

Mecanismos e componentes para executar manipulao direta sobre


visualizaes;

Mecanismos e componentes para selecionar, filtrar e executar tarefas de


visualizao de informaes genricas;

Componentes para nomeao dinmica (dynamic labeling) e deformao


espacial.

Algumas das possibilidades de interao oferecidas pelo InfoVis so padres na


ferramenta, ou seja, so suportadas pela maioria das tcnicas de visualizao
implementadas. Estas interaes so:

Filtragem;

Mapeamento de valores de atributos de dados para atributos visuais (cor,


tamanho e transparncia);

Mapeamento de valores de atributos de dados para a ordenao em


profundidade das figuras;

Nomeao dinmica (dynamic labeling);

Deformao espacial.

Atualmente, o toolkit InfoVis suporta trs diferentes estruturas de dados tabelas,


rvores e grafos e oito tipos de visualizaes: (1) sries de tempo, (2) coordenadas
paralelas e (3) scatter plots 2D, para tabelas; (4) diagramas de nodos e arestas, (5)

46

rvores Icicle e (6) treemaps, para rvores; (7) diagramas de nodos e arestas e (8)
matrizes de adjacncia, para grafos.

4.1 Framework Geral


O toolkit InfoVis uma biblioteca Java e uma arquitetura de software organizada em
cinco mdulos principais (FEKETE, 2004): tabelas, colunas, visualizaes,
componentes e entrada/sada. A figura 4.1 detalha estes mdulos, descritos abaixo.

Figura 4.1: Estrutura interna do toolkit InfoVis. Retngulos representam estruturas de


dados e elipses representam funes (FEKETE, 2003).
4.1.1 Entrada e Sada
O toolkit InfoVis suporta um conjunto limitado, mas extensvel de formatos de
arquivos. Atualmente, existem readers e writers para os seguintes formatos: CSV,
XML, TQD, Newick, TM3, DOT, XML TreeML DTD e XML GraphML DTD.
Os readers podem ser criados instanciando diretamente, a partir do programa, a
classe que trata de um determinado formato de arquivo ou podem ser criados atravs de
objetos factory. Estes ltimos so usados para criar objetos indiretamente, de acordo
com alguns parmetros especificados. Eles analisam o nome do arquivo a ser carregado
e seu contedo para criar o reader mais satisfatrio para ele (FEKETE, 2003).
4.1.2 Tabelas e Colunas
InfoVis fornece uma estrutura de dados unificada que baseada em tabelas.
Segundo Fekete (2003), as razes disto recaem sobre os ganhos com eficincia que a
estrutura permite e a facilidade com que qualquer estrutura de dados pode ser
implementada sobre tabelas.
Uma tabela uma lista de colunas nomeadas, metadados e dados do usurio. Uma
coluna gerencia linhas com elementos de tipos homogneos (inteiro, ponto flutuante,
string, etc.). Os elementos so indexados, de forma que as colunas so implementadas

47

com arrays. Algumas linhas podem ter seus valores no definidos. Este mecanismo
importante, porque conjuntos de dados do mundo real freqentemente possuem valores
faltando, e, alm disso, facilita a representao de estruturas de dados gerais.
Um conjunto de dados armazenado como uma tabela, onde cada linha representa
um registro (item de dado) e cada coluna representa um atributo. Isto natural para
conjuntos de dados tabulares, mas rvores e grafos tambm so representados com essa
estrutura de dados. rvores e grafos so implementados como wrappers no topo de
tabelas com informao topolgica representada por colunas internas (FEKETE, 2003).
Estas ltimas contm informaes internas e no so salvas para arquivos e nem
disponveis para consultas dinmicas.
4.1.3 Visualizaes
Visualizaes transformam um conjunto de atributos armazenados em colunas de
tabela para representaes visuais. Alm disso, elas executam filtragem, zoom,
navegao e picking. Cada visualizao dispe de uma lista de atributos visuais que
podem ser associados com colunas de dados. Esses atributos so utilizados para mudar a
cor ou propriedades geomtricas dos itens exibidos (FEKETE, 2002). Para seu controle,
a visualizao mantm uma coluna interna de objetos grficos (FEKETE, 2003). Alguns
atributos visuais so genricos e padres para todas as visualizaes, como cor (color),
tamanho (size), transparncia (alpha) e label. Outros, so especficos de uma
visualizao, como eixo x e eixo y no scatter plot 2D, ou de algumas, como os atributos
visuais de aresta e vrtice nas visualizaes de grafos.
As visualizaes so redesenhadas quando pelo menos uma coluna a que elas se
referem modificada. Alm disso, quando um atributo visual usado para computar as
figuras modificado, estas ltimas so invalidadas e recomputadas para o prximo
rendering ou picking. A seleo, filtragem e ordenao, que no so atributos visuais,
comportam-se exatamente do mesmo modo. Por default, elas so associadas com
colunas internas. As permutaes so usadas para ordenao e filtragem. Elas
especificam uma ordem para as linhas da tabela e so capazes de esconder (filtrar) uma
linha da visualizao apenas no a especificando na ordenao. Permutaes tambm
mantm o mapeamento de um nmero de linha para seu ndice e a contagem das linhas
visveis.
Visualizaes usam vrios subcomponentes para gerenciar cores, permutaes,
redesenho, labeling e deformaes espaciais. O mapeamento de atributos de dados para
cores feito atravs de uma interface, chamada color visualization, que retorna uma cor
a partir de uma linha da tabela.
O redesenho est dividido entre o layout e o rendering. Na maioria dos casos, o
layout pode ser reusado. Selees apenas causam redesenho sem refazer layout, picking
tambm reusa o layout j computado e a filtragem, em geral, apenas muda o conjunto de
itens redesenhados, no seu layout. Este ltimo poderia ser recomputado cada vez que
um item filtrado, no entanto, o tempo necessrio para o redesenho dos itens mudaria
drasticamente, sendo talvez impossvel atualizar as mudanas de um frame para o
prximo (FEKETE, 2003).
O rendering de itens de dados est relacionado com figuras, computao de cores e,
opcionalmente, com lentes fisheye. Por default, o rendering itera sobre cada linha nofiltrada da tabela, na ordem de permutao, computando a cor com o componente color

48

visualization. A figura representando um item de dado pintada, bem como sua borda
geralmente preta para itens no-selecionados e vermelha para os selecionados.
As visualizaes opcionalmente suportam labels dinmicos e deformaes espaciais.
O primeiro componente usa o mecanismo picking para computar os labels sob o
ponteiro do mouse. Dois mtodos so fornecidos pelo toolkit para picking: o primeiro
retorna o item desenhado mais frente em uma posio espacial e o segundo retorna
uma lista de itens que intersecionam um retngulo. O segundo componente opcional,
deformao espacial, aplicado pelo rendering depois que as figuras dos itens de dados
foram computadas pelo layout. O toolkit suporta, atualmente, um subconjunto das
deformaes de Carpendale (CARPENDALE; MONTAGNESE, 2001). Um objeto
Fisheye usado para transformar uma figura Java na sua deformao atravs de lentes.
A implementao verifica se uma figura especfica intersecciona a lente e, se isto no
ocorre, ela retorna sem alteraes. Mas, se a interseo acontece, itera-se sobre a borda
da figura, aplicando-se a deformao de lentes para cada vrtice de controle (FEKETE,
2003).
4.1.4 Componentes
O toolkit InfoVis fornece vrios componentes para suportar manipulaes
interativas. Por default, a cada visualizao est associado um painel de controle padro
organizado em um grupo de abas. Programadores podem usar seus prprios painis de
controle, substituindo ou acrescentando componentes e mecanismos de interao.
O painel de controle padro apresenta os seguintes componentes: consultas
dinmicas e filtros, seleo, ordenao, labels dinmicos, lente fisheye e manipulao de
atributos visuais. Todos esses componentes so descritos e ilustrados na seo 4.4.

4.2 Exibindo Visualizaes


O procedimento seguido para exibir a representao visual de uma tcnica j
suportada pelo toolkit InfoVis bastante simples. A figura 4.2 demonstra, de forma
simplificada, como uma visualizao da tcnica Coordenadas Paralelas pode ser gerada
para um arquivo de dados, cujo nome especificado no primeiro argumento do
programa principal.
No programa da figura 4.2, primeiramente, uma tabela criada e identificada com o
nome do arquivo de dados especificado (linhas 4-5). O carregamento do arquivo feito
em dois passos: encontrando um reader e carregando o arquivo a partir deste ltimo. O
reader criado atravs de um objeto factory (linhas 6-7). Este ltimo analisa o nome do
arquivo e seu contedo para criar o reader mais satisfatrio para ele. Se nenhum reader
retornado ou ele no pde carregar o arquivo, o programa encerrado com uma
mensagem de erro (linhas 8-11). Caso contrrio, um objeto visualizao criado (linhas
12-13) e inserido em um JFrame Java/Swing padro, dentro de um painel de
visualizao (linhas 14-15).
Como descrito acima, a visualizao gerada no interativa, porque nenhum painel
de controle foi associado a ela. A visualizao ter um painel de controle se o cdigo
para a criao do painel de visualizao (retngulo azul na figura) for substitudo pelo
cdigo contido no retngulo vermelho.

49

Figura 4.2: Programa para a visualizao de Coordenadas Paralelas. O cdigo do


retngulo azul gera uma visualizao no-interativa, mas quando substitudo pelo
cdigo do retngulo vermelho a visualizao recebe um painel de controle padro.
Como pode ser observado na mesma figura, a criao do painel de controle
associado visualizao tambm realizada atravs de um objeto factory. A classe
painel de controle a ser instanciada depender do tipo de visualizao recebida como
parmetro pelo objeto. Como foi mencionado na seo anterior, visualizaes diferentes
podem ter painis de controle com componentes ou mecanismos de interao distintos.

4.3 Extenso do Toolkit: Criando Novas Visualizaes


Antes de iniciar a implementao de novas tcnicas com o toolkit InfoVis,
necessrio conhecer a organizao e hierarquia das classes de visualizao e dos seus
mtodos mais relevantes para essa tarefa.
Todas as visualizaes do toolkit implementam a interface Visualization. Uma
visualizao est sempre relacionada a uma nica tabela e deveria ser instalada em um
JComponent Java para ser exibida em uma janela (FEKETE, 2002). O toolkit InfoVis
fornece a classe VisualizationPanel para este propsito.
A principal implementao da interface Visualization a classe
DefaultVisualization. Todas as visualizaes especficas derivam dela. A figura 4.3
exibe a hierarquia das classes de visualizao do toolkit.
A implementao de uma nova tcnica no toolkit InfoVis envolve, antes de tudo, a
criao de uma nova classe de visualizao especfica, com o nome da tcnica, e esta
deve tambm ser derivada de DefaultVisualization. A classe especfica contm apenas
mtodos que so utilizados exclusivamente pela nova tcnica.

50

Figura 4.3: Hierarquia das classes de visualizao do toolkit InfoVis


Quando uma nova visualizao criada, ela deve tambm ser configurada para
mapear colunas da tabela para colunas visuais. Visualizaes usam vrios tipos de
propriedades visuais, algumas so padres para todas elas e outras so especficas para
uma tcnica. A configurao de um atributo visual realizada com a seguinte linha de
cdigo:
visualization.setVisualColumn(string_constante,
table.getColumn("nome_coluna"));

string_constante uma string que contm o nome da coluna visual para a


propriedade a ser mapeada e nome_coluna o nome de uma coluna numrica da tabela.
Os atributos visuais padres so os seguintes:

Color A coluna usada para especificar a cor dos itens. Sua constante string
Visualization.VISUAL_COLOR.

Size A coluna usada para especificar o tamanho dos itens. Sua constante
string Visualization.VISUAL_SIZE.

Alpha A coluna usada para especificar a transparncia ou canal alpha de


itens. Sua constante string Visualization.VISUAL_ALPHA.

Label A coluna usada para especificar o nome ou label de itens. Sua


constante string Visualization.VISUAL_LABEL.

Outros atributos podem ser especificados utilizando o mesmo mecanismo, embora


no sejam atributos visuais:

Selection A coluna usada para especificar quais itens esto selecionados.


Ela deve ser uma coluna booleana e sua constante string
Visualization.VISUAL_SELECTION.

Filter A coluna usada para especificar quais itens esto filtrados. Ela deve
ser
uma
FilterColumn
e
sua
constante
string

Visualization.VISUAL_FILTER.

Sort A coluna usada para especificar a ordem (de sobreposio) dos itens
na visualizao. Sua constante string Visualization.VISUAL_SORT.

A computao e desenho dos itens de dados de uma visualizao so implementados


atravs da derivao de classes. H um elemento grfico para cada item de dado

51

visualizado: Shape uma interface Java que descreve uma geometria geral. As
visualizaes especficas podem decidir que tipo de figura elas criam e em qual posio.
Geralmente, um Rectangle2D Java que implementa a interface Shape.
As figuras computadas so armazenadas em uma coluna visual chamada
Visualization.VISUAL_SHAPE.
O mtodo usado para computar o layout das figuras, geralmente implementado nas
classes especficas de visualizao, denominado computeShapes. Este mtodo
chamado apenas antes do desenho, quando um dos seguintes eventos ocorre (FEKETE,
2002):

A visualizao deve ser mostrada na tela e nenhum layout foi computado antes;

Uma coluna visual envolvida na computao do layout foi associada com uma
nova coluna da tabela;

Uma coluna visual envolvida na computao do layout foi modificada.

Depois que todas as figuras foram computadas, os itens podem ser mostrados de
uma nica vez, na ordem definida pelo atributo sorting. A implementao padro usa o
mtodo paintItems para essa tarefa, geralmente definido na classe DefaultVisualization,
e cujo cdigo exibido na figura 4.4.

Figura 4.4: Cdigo padro executado para o desenho de itens de dados


Esse mtodo usa um RowIterator para iterar sobre todos os itens na ordem
determinada pelo sorting, pula os itens filtrados atravs do mtodo isFiltered e desenha
os demais usando o mtodo paintItem. O mesmo pode ser sobrescrito em uma classe
derivada se, por exemplo, a visualizao deve mostrar em cinza os itens filtrados.
O desenho de um item precisa de vrios passos: configurar todos os atributos
grficos, transformar a figura com uma lente fisheye, desenhar a figura, desenhar sua
linha de contorno e seus labels. Cada um desses passos realizado dentro do mtodo
paintItem, cujo cdigo mostrado na figura 4.5.

Figura 4.5: Cdigo padro executado para o desenho de um item de dado

52

Todos os mtodos mencionados podem ser sobrescritos em subclasses, se requerido.


Na maioria dos casos, as novas tcnicas acrescentadas ao toolkit InfoVis precisam
implementar apenas o mtodo computeShapes para a exibio dos itens de dados.
Geralmente, a implementao padro dos mtodos de desenho (paintItems e paintItem)
pode ser reusada.

4.4 Mecanismos de Interao


O painel de controle padro do toolkit InfoVis oferece vrios componentes, por meio
dos quais um usurio pode interagir com visualizaes. As opes de interao
disponibilizadas encontram-se distribudas dentro de quatro abas, denominadas Filters,
Visual, Excentric e Fisheyes, que compem o painel de controle.

Figura 4.6: As quatro abas do painel de controle: (a) Filters; (b) Visual; (c) Excentric; e
(d) Fisheyes.
A aba Filters contm, basicamente, barras de filtragem correspondentes aos
atributos do conjunto de dados, conforme pode ser observado na figura 4.6(a). As barras
de filtragem permitem que o usurio possa ocultar da representao visual itens de
dados dentro de uma faixa de valores (para atributos numricos). Quando uma barra
movida da esquerda para a direita, os itens so ocultados, progressivamente, daqueles
que possuem o menor valor para o atributo relativo barra at aqueles que apresentam o
maior valor para o mesmo. J quando o sentido de movimentao da barra invertido, o
desaparecimento de itens se d em ordem reversa. Para atributos de dados categricos, o
processo de filtragem realizado atravs da seleo de strings em uma lista. Apenas os
itens de dados que possuem as strings selecionadas como valores para um atributo
categrico so desenhados na representao visual.
A aba Visual, cujos componentes podem ser observados na figura 4.6(b),
disponibiliza mecanismos de interao que alteram atributos visuais dos objetos
representando itens de dados. Os mecanismos denominados Color by, Alpha by e Size
by utilizam variaes progressivas na intensidade da cor, nvel de transparncia e
tamanho dos objetos itens de dados, respectivamente, para representar quo alto o
valor que cada objeto apresenta para um determinado atributo (escolhido pelo usurio).
No recurso Color by, a menor intensidade de cor atribuda ao item de dado que possui

53

o menor valor para o atributo sendo mapeado e a maior intensidade aplicada ao item
que apresenta o maior valor para o mesmo. Os recursos Alpha by e Size by aplicam suas
variaes segundo este mesmo critrio. As visualizaes geradas pela aplicao dos
mecanismos de interao Color by e Size by, com a tcnica Coordenadas Paralelas e
Radviz, podem ser observadas na figura 4.7.

Figura 4.7: Visualizaes geradas pela aplicao dos mecanismos de interao Color by
( esquerda) e Size by ( direita) sobre as tcnicas Radviz (acima) e Coordenadas
Paralelas (abaixo)
O mecanismo denominado Sort by trabalha de forma semelhante aos mencionados
acima. No entanto, ele utiliza o valor que cada objeto item de dado possui para um
determinado atributo (especificado pelo usurio) como critrio para a ordenao dos
objetos em profundidade. Ou seja, a ordem em que objetos se sobrepem na
representao visual pode ser determinada pela escala de valores de um atributo do
conjunto de dados. O primeiro item a ser desenhado aquele que possui o menor valor
para o atributo determinante e o ltimo item desenhado aquele que apresenta o maior
valor para o mesmo.
O usurio pode tambm especificar um atributo de dados, que determina os labels
exibidos para cada item de dado, atravs do mecanismo de interao Label by. Quando
o componente Label all items da aba Visual encontra-se habilitado, cada item aparece na
visualizao com um label associado e o contedo deste ltimo o valor que o objeto
possui para o atributo determinante.
Alm de todos os mecanismos de interao j citados, a aba Visual tambm permite
ao usurio modificar algumas configuraes padro dos itens de dados, como o tamanho
(componente Default size), o nvel de transparncia (componente Default alpha) e a cor

54

(componente Default color). O nmero de itens desenhados na visualizao a cada


momento pode tambm ser acompanhado habilitando o componente Display stats.
Em muitos casos, os labels fixos gerados pelo componente Label all items no
podem ser visualizados adequadamente, principalmente quando o nmero de itens de
dados muito elevado. Diante disso, um meio alternativo para visualizar esses labels
oferecido pela aba Excentric (figura 4.6(c)), habilitando o componente Enable excentric
labels. Este ltimo exibe labels em posies dinmicas (sempre indicando o objeto ao
qual cada um se refere) e apenas para os itens que ficam sob uma regio quadrada
(limitada por linhas vermelhas) que acompanha o cursor do mouse, conforme ilustrado
na figura 4.8. O tamanho do quadrado, que representa a rea de abrangncia desse
mecanismo de interao e o nmero mximo de labels exibidos podem ser configurados
atravs dos componentes Radius e Max Labels, respectivamente.

Figura 4.8: Labels dinmicos na tcnica Coordenadas Paralelas

Figura 4.9: Lente Fisheye aplicada na tcnica Radviz

55

Finalmente, a ltima aba do painel de controle, denominada Fisheyes (figura 4.6(d)),


refere-se a um mecanismo de filtro mvel, que amplia a representao dos objetos de
dados localizados sob uma lente que acompanha o cursor do mouse. O efeito dessa
ampliao pode ser comparado com o de uma lupa, conforme pode ser observado na
figura 4.9, e facilita a identificao de objetos pequenos, prximos ou levemente
sobrepostos.
Acima das quatro abas do painel de controle, pertencendo tambm a este ltimo,
existe ainda um espao reservado apenas para a visualizao dos valores que um ou
mais itens de dados, selecionado(s) na representao visual, possui (possuem) para cada
um dos atributos do conjunto de dados. A exibio desses valores feita em forma de
tabela, como pode ser observado na figura 4.10, com a primeira coluna mostrando os
nomes dos atributos e a segunda mostrando os valores que o item selecionado apresenta
para estas dimenses. Com a finalidade de facilitar a identificao do objeto de dado
selecionado na visualizao, este ltimo tem sua cor de contorno modificada para
vermelho.

Figura 4.10: Visualizao dos valores que o 142 item de dado do conjunto sobre carros
possui para cada atributo
4.4.1 Mecanismos Adicionados
Com o objetivo de ampliar os recursos de interao oferecidos pelo toolkit InfoVis,
foram adicionados novos mecanismos no painel de controle das tcnicas de visualizao
multidimensionais. Os mesmos foram acrescentados aps um estudo de avaliao
preliminar (relatado no captulo 6), que revelou a necessidade destes mecanismos para a
realizao de algumas tarefas de usurio, envolvidas no processo de explorao de
conjuntos de dados.
Assim, no final da aba Visual do painel de controle, foram adicionados os
componentes grficos exibidos na figura 4.11, que compem o novo mecanismo de
interao, denominado Attributes Manipulation. Por meio deste mecanismo, o usurio
pode remover (filtrar) atributos de dados da visualizao associada ao painel de
controle, bem como tambm alterar a ordem em que estes atributos aparecem na
mesma. Para remover um atributo, o usurio deve selecionar o nome deste na lista de
atributos que aparece direita na figura 4.11 e pressionar o boto Remove. Ao contrrio,
para adicionar este atributo novamente visualizao, o procedimento selecinar o
nome deste na lista de atributos esquerda na figura 4.11 e pressionar o boto Add. No
entanto, se o usurio deseja apenas trocar a localizao de um atributo por outro, na
representao visual, ele deve selecionar seu nome na lista de atributos da direita e
pressionar o boto Up, para troc-lo de posio com o atributo acima na lista, ou o boto
Down, para troc-lo de posio com o atributo abaixo na lista.
Outro componente de interao adicionado ao painel de controle do toolkit, agora na
aba Filters, um boto para filtragem (um para cada atributo de dados). Ao pressionar o

56

mesmo, apresentada uma janela onde um intervalo numrico (valor inicial e final) de
filtragem pode ser rapidamente fornecido. A finalidade deste a mesma das barras de
filtragem (scroll bars), no entanto ele oferece maior agilidade para filtrar um intervalo
previamente conhecido de valores.

Figura 4.11: Componentes grficos que compem o mecanismo de interao


Attributes Manipulation

5 COORDENAO DINMICA DE VISUALIZAES


MULTIDIMENSIONAIS

No captulo 2 desse trabalho, foram descritas as tcnicas de interao que costumam


ser associadas a representaes visuais isoladas de dados multidimensionais e no
captulo seguinte, foram apresentados os principais tipos de coordenaes
implementadas pelos sistemas com mltiplas visualizaes coordenadas em geral.
Nesse captulo, o objetivo apresentar e descrever um conjunto especfico de
coordenaes (interaes): aquelas que podem ser aplicadas em sistemas de mltiplas
visualizaes coordenadas, especficos para a visualizao de dados muldimensionais.
Alm disso, a fim de validar o conjunto de coordenaes apresentado aqui, ser
abordada tambm a descrio de uma aplicao de visualizaes multidimensionais
coordenadas, que implementa o conjunto de coordenaes apresentado.

5.1 Coordenaes para Sistemas de Visualizao de Dados


Multidimensionais
Analisando-se os tipos de coordenaes disponibilizadas por sistemas de
visualizaes coordenadas em geral, procurou-se identificar quais coordenaes
poderiam ser usadas para conectar diferentes visualizaes multidimensionais e
auxiliariam no processo de explorao de um conjunto de dados com mltiplas
dimenses. Como resultado deste estudo, definiu-se um conjunto com quatro categorias
gerais de coordenaes: mapeamento de dados para propriedades visuais, reordenao
de dimenses, filtragem e brushing-and-linking. Todas estas coordenaes podem ser
implementadas de forma bidirecional, o que garante que, para um par de visualizaes
interligadas, uma interao do usurio com a primeira visualizao ser propagada para
a segunda, e vice-versa.
A seguir, so discutidas quais categorias de visualizaes multidimensionais
suportam as coordenaes acima e como estas coordenaes podem ser implementadas
em cada categoria.
5.1.1 Mapeamento de Dados para Propriedades Visuais
Todas as tcnicas multidimensionais de projeo geomtrica suportam vrias
possibilidades de mapeamentos de dados para propriedades visuais, pois os itens de
dados, nestas tcnicas, so representados por figuras geomtricas (crculos, retngulos,
linhas, etc.). Assim, em qualquer tcnica de projeo geomtrica, valores de atributos
podem ser mapeados para cor, tamanho ou transparncia de objetos de dados. Algumas
tcnicas dessa categoria, como Radviz, Matriz de Scatter Plots e Polyviz, podem

58

suportar ainda mapeamentos de dados para o tipo de figura utilizada como objeto de
dado e sua orientao. Alm disso, outro tipo de mapeamento visual pode ainda ser
utilizado em tcnicas de projeo geomtrica: a ordenao em profundidade. Este tipo
de mapeamento utiliza valores de atributo para determinar a ordem em que objetos de
dados so desenhados na representao visual. Como o problema da sobreposio de
objetos costuma ser muito acentuado em tcnicas de projeo geomtrica, a
possibilidade de alterar a ordem de desenho destes objetos muito ltil para uma
explorao mais efetiva do conjunto de dados.
Em tcnicas multidimensionais iconogrficas, possvel o emprego de
mapeamentos de dados para cor, espessura e transparncia. Um glifo ou cone que
representa um item de dado nestas tcnicas pode refletir seu valor para um determinado
atributo atravs da cor ou nvel de transparncia que desenhado ou ainda atravs da
espessura de suas linhas (ver a figura 3.2 para um exemplo). Geralmente, os glifos ou
cones dessa categoria de tcnicas no possuem uma localizao determinada onde
devem ser exibidos na tela e, por esta razo, no costumam haver sobreposies dos
mesmos. Se no h sobreposio de objetos, no faz sentido o emprego do mapeamento
de dados para ordenao em profundidade.
As tcnicas orientadas a pixel, finalmente, no permitem nenhum tipo de
mapeamento de dados para propriedades visuais definido pelo usurio. Estas tcnicas j
possuem uma forma de mapeamento fixa, que no pode ser alterada pelo usurio. Ou
seja, todas as tcnicas dessa categoria utilizam um mapa de cores fixo, que utilizado
para mapear os valores de itens de dados para todas as dimenses. No possvel
utilizar um mapa de cores para representar apenas valores de uma dimenso, como
feito em tcnicas de projeo geomtrica e iconogrficas. Outros tipos de mapeamentos
tambm no so possveis: diferentes nveis de transparncia tornariam a visualizao
confusa; diferentes tamanhos no podem ser aplicados para pixels; e ordenao em
profundidade no faz sentido, pois no h sobreposies.
5.1.2 Reordenao de Dimenses
Todas as tcnicas de visualizao multidimensionais suportam alguma forma de
reordenao de dimenses. Em tcnicas de projeo geomtrica que representam
dimenses como eixos, esse tipo de interao bastante intuitivo: consiste apenas em
mudar a disposio dos eixos na visualizao. Na tcnica Matriz de Scatter Plots, a
reordenao de dimenses pode ser executada alterando a numerao da linha e coluna
da matriz, representativas de uma dimenso.
Na tcnica iconogrfica Faces de Chernoff, a reordenao de dimenses pode ser
realizada alterando a caracterstica da face (olhos, nariz, boca, etc.) que representa cada
dimenso. Na tcnica Glifos em Estrela, a reordenao realizada alterando a posio,
em graus, dos raios que representam as dimenses.
Finalmente, nas tcnicas orientadas a pixel, a reordenao de dimenses pode ser
aplicada simplesmente trocando a ordem em que as janelas de dimenses aparecem na
tela.
5.1.3 Filtragem
Em visualizaes multidimensionais, dois tipos de filtragem podem ser realizadas:
de objetos de dados e de dimenses.

59

A filtragem de objetos de dados causa o mesmo efeito em todas as tcnicas de


visualizao multidimensionais. Os itens de dados com valores dentro de um intervalo
filtrado deixam de ser representados nas visualizaes. Em tcnicas de projeo
geomtrica, so figuras geomtricas que deixaro de ser desenhadas; em tcnicas
iconogrficas, so glifos ou cones que no sero representados; e em tcnicas
orientadas a pixel, para cada item de dado filtrado, um pixel em cada janela de
dimenso ser cedido para a representao de um outro item de dado.
A filtragem de dimenses faz com que uma ou mais dimenses do conjunto de
dados deixem de ser representadas nas visualizaes multidimensionais. Em tcnicas de
projeo geomtrica, so eixos que deixaro de ser desenhados (ou linhas e colunas,
para a Matriz de Scatter Plots); em tcnicas iconogrficas, so caractersticas de faces
ou raios que no sero representados; e em tcnicas orientadas a pixel, janelas de
dimenses sero excludas da representao visual.
5.1.4 Brushing-and-Linking
Quaisquer visualizaes multidimensionais podem ser coordenadas pela tcnica
brushing-and-linking. Em tcnicas de projeo geomtrica, objetos de dados
selecionados so geralmente exibidos com preenchimento vermelho ou com esta cor de
borda; em tcnicas iconogrficas, as arestas de cones ou glifos so exibidas com a cor
de destaque escolhida; e em tcnicas orientadas a pixel, os pixels selecionados so
exibidos com uma borda de destaque. A coordenao brushing-and-linking possui
vrias formas de implementao e no necessariamente requer que o usurio selecione
objetos de dados clicando com o mouse sobre eles. Algumas implementaes destacam
os objetos de dados correspondentes em outras visualizaes quando o usurio
simplesmente passa o mouse sobre eles.
Todas as coordenaes mencionadas nessa seo foram implementadas em uma
aplicao de mltiplas visualizaes coordenadas, flexvel em coordenaes, com o
objetivo de valid-las e de criar uma ferramenta para visualizao de dados
multidimensionais que oferece variadas possibilidades de conexes e liberdade na
construo de cenrios.

5.2 Aplicao de Visualizaes Coordenadas para Dados


Multidimensionais
A aplicao de mltiplas visualizaes coordenadas desenvolvida para validar o
conjunto de coordenaes definido nesse trabalho foi projetada para trabalhar apenas
com a representao grfica de dados multidimensionais. Assim, tanto as visualizaes,
como as coordenaes por ela suportadas, so direcionadas para a representao desse
tipo de dados.
Desenvolvida a partir das classes que compem o toolkit de visualizao InfoVis
(FEKETE, 2003), a aplicao integra as tcnicas de visualizao e interaes do toolkit
que podem ser utilizadas para dados multidimensionais. Foi acrescentada a
possibilidade de coordenar dinamicamente visualizaes atravs destas interaes.
A aplicao permite que usurios construam dinamicamente cenrios com mltiplas
visualizaes coordenadas, sem a necessidade de programao. Com isto, pretende-se
oferecer flexibilidade na representao de informaes. Tal flexibilidade suportada em

60

relao aos dados representados, tcnicas de visualizao e coordenaes. Ou seja, a


aplicao permite que usurios possam escolher o conjunto de dados a ser carregado,
definir quais dentre as visualizaes suportadas iro compor um cenrio de mltiplas
visualizaes e quais aes interativas sero coordenadas entre as mesmas. Usurios
tm liberdade para criar e remover coordenaes a qualquer momento, sendo capazes de
sincronizar as aes que so importantes para suas tarefas.
5.2.1 Visualizaes
No captulo 2 desse trabalho, foi apresentada uma categorizao, freqentemente
utilizada na literatura, para tcnicas de visualizao multidimensionais, bem como
tambm se descreveu as caractersticas gerais das principais tcnicas representantes de
cada categoria.
Essa seo apresenta uma breve descrio das tcnicas de visualizao suportadas
pela aplicao desenvolvida, bem como tambm mostra como estas tcnicas foram
incorporadas ao toolkit InfoVis. Atualmente, trs tcnicas de visualizao de
informaes multidimensionais esto disponveis: Coordenadas Paralelas, Radviz e
Matriz de Scatter Plots. A primeira tcnica j se encontrava implementada no toolkit
InfoVis e as outras duas foram incorporadas especialmente para comporem a aplicao
relatada nesse trabalho.
5.2.1.1 Coordenadas Paralelas
A tcnica Coordenadas Paralelas faz parte do conjunto de visualizaes
disponibilizadas pelo InfoVis. Sua implementao no toolkit foi levemente modificada
com a finalidade de acrescentar caractersticas importantes.
A implementao dessa tcnica, utilizada na aplicao desenvolvida, representa os
atributos (dimenses) do conjunto de dados por meio de linhas verticais dispostas de
forma regular (espaamentos iguais). A ordenao inicial dos atributos (da esquerda
para a direita) segue a mesma ordem em que estes aparecem no arquivo de dados. Cada
linha vertical possui acima dela a indicao do nome do atributo que a mesma
representa.
Os valores mnimo e mximo que cada atributo assume em determinado conjunto de
dados so mapeados para as extremidades inferior e superior das linhas verticais,
respectivamente, e valores intermedirios a estes tm suas posies, ao longo das
mesmas, calculadas com base no intervalo mnimo-mximo.
Os itens de dados, representados por linhas horizontais, aparecem, inicialmente,
todos com a mesma cor. A figura 5.1 mostra a tcnica Coordenadas Paralelas no toolkit
InfoVis, exibindo o conjunto de dados sobre carros (descrito na seo 6.1.1).
Os procedimentos seguidos para a criao das linhas verticais, que representam os
atributos, e das linhas horizontais, que representam os itens de dados, sero
detalhadamente descritos a seguir, pois os mesmos representam as operaes
fundamentais para a criao da representao visual dessa tcnica.
Na implementao de Coordenadas Paralelas no toolkit InfoVis, as linhas verticais
foram incorporadas ao plano de fundo (background) do grfico 2D. Por este motivo,
elas so computadas e desenhadas dentro do mtodo paintBackground. A figura 5.2
mostra o cdigo Java executado por este ltimo.

61

Figura 5.1: Tcnica Coordenadas Paralelas implementada no toolkit InfoVis


Na figura 5.2, para o desenho da linha vertical de cada atributo, necessrio
fornecer ao mtodo drawLine (linha 9) as coordenadas (x,y) de dois pontos, que
representam as extremidades da linha. Como se trata de uma linha vertical, a
coordenada x de ambos os pontos a mesma e seu valor obtido pela frmula da linha
6. A coordenada y do primeiro ponto igual ao valor do limite superior do grfico 2D
(linha 7) e a coordenada y do segundo ponto igual ao valor do limite inferior do
mesmo grfico (linha 13).

Figura 5.2: Criao e desenho das linhas que representam atributos na tcnica
Coordenadas Paralelas (implementado por Fekete)
A figura 5.3 apresenta o cdigo Java executado pelo mtodo computeShapes,
responsvel pela criao dos objetos que representam os itens de dados na tcnica
Coordenadas Paralelas. O cdigo das linhas 6 35 executado para cada item de dado,
conforme determina o lao for da linha 5. As linhas 8 12 verificam se j existe um
objeto GeneralPath caminho geomtrico formado por segmentos de linha reta para
o item de dado atual. Se tal objeto existe, ele tem seus atributos inicializados, caso
contrrio, um novo objeto GeneralPath criado.
O lao for da linha 15 indica que cada item de dado ser considerado em relao a
cada atributo do conjunto de dados a partir desse ponto. Com isto, as linhas de cdigo
contidas no lao tm como objetivo calcular a posio em que as linhas horizontais

62

(itens de dados) atravessam as linhas verticais (atributos). Se o item de dado possui um


valor numrico vlido para o atributo em questo, a posio onde a linha horizontal
corta a linha vertical desse atributo, no eixo x, dada pela frmula da linha 26 e a
posio no eixo y dada pela frmula da linha 28. Finalmente, o mtodo setShapeAt
armazena o caminho de segmentos de linha para o item de dado.

Figura 5.3: Criao dos objetos que representam itens de dados na tcnica Coordenadas
Paralelas (implementado por Fekete)
5.2.1.2 Radviz
A tcnica Radviz no faz parte do conjunto de tcnicas de visualizao que
acompanham o toolkit InfoVis. Ela foi incorporada ao mesmo para a construo da
aplicao relatada nesse trabalho.
A implementao dessa tcnica no toolkit representa os atributos (dimenses) do
conjunto de dados por meio de linhas que emanam radialmente do centro de um crculo
e terminam em seu permetro. A ordenao inicial dos atributos no crculo (em sentido
horrio) segue a mesma ordem em que estes aparecem no arquivo de dados. No final de
cada linha, no permetro do crculo, o nome do atributo que a mesma representa
permanece visvel. Alm disso, para facilitar a compreenso do mapeamento dos pontos

63

de dados realizado pela tcnica, todos os seus valores so normalizados para o intervalo
de 0 1.
Os itens de dados, representados nessa implementao por pequenas elipses,
aparecem, inicialmente, todos com a mesma cor. A figura 5.4 mostra a representao
visual da tcnica Radviz implementada no toolkit InfoVis, exibindo o conjunto de dados
sobre carros.
Os procedimentos seguidos para a criao das linhas e das pequenas elipses, que
representam os atributos e os itens de dados, respectivamente, sero detalhadamente
descritos a seguir, por representarem as operaes fundamentais da tcnica Radviz.
Na implementao dessa tcnica no toolkit InfoVis, as linhas representando atributos
tambm foram computadas e desenhadas dentro do mtodo paintBackground, como
ocorreu com as linhas de atributos na tcnica Coordenadas Paralelas. No entanto, nesse
caso, as mesmas no foram incorporadas ao plano de fundo (background) do grfico
2D, mas sim desenhadas como objetos separados do mesmo. A razo para isto a
preciso necessria (double) para o desenho das linhas de atributos do Radviz, preciso
esta no alcanada com o mtodo drawLine (figura 5.2 linha 9) empregado em
Coordenadas Paralelas, que trabalha apenas com valores inteiros. A figura 5.5 mostra o
cdigo Java executado pelo mtodo paintBackground da tcnica Radviz.

Figura 5.4: Tcnica Radviz implementada no toolkit InfoVis


Todas as linhas de atributos so computadas por esse mtodo, no interior do lao
while (linha 15), que executa seu bloco de operaes somente para colunas numricas
do conjunto de dados. Cada nova linha criada tem seu ponto inicial no centro do crculo
Radviz e seu ponto final sobre a borda do mesmo (linha 20-21). O primeiro ponto
igual para todas as linhas e previamente conhecido, mas o segundo ponto precisa ser
calculado. As frmulas das linhas 17 e 18 calculam a posio do ponto final de cada
linha, considerando um crculo que abrange o intervalo [-1, 1] tanto em x como em y.
As coordenadas resultantes so ento multiplicadas pelo raio do crculo Radviz e
somadas aos valores do centro do mesmo (linha 21) para a obteno da posio correta
de trmino da linha de atributo. Nos comandos seguintes da figura 5.5, a linha
computada e o nome do atributo que ela representa so desenhados no grfico 2D. As
operaes necessrias para o clculo e desenho da borda do crculo Radviz tambm so

64

executadas pelo mtodo paintBackground, mas foram ocultadas da figura 5.5 porque
no possuem importncia significativa para esse trabalho.

Figura 5.5: Criao e desenho das linhas que representam atributos na tcnica Radviz
A figura 5.6 apresenta o cdigo Java executado pelo mtodo computeShapes,
responsvel pela criao dos objetos que representam itens de dados na tcnica Radviz.
As operaes que determinam a posio onde estes objetos devem aparecer so
executadas para cada item de dado, conforme determina o lao for da linha 12, e
considerando-os em relao a cada atributo, como determina o lao while da linha 18.
Todos os valores de um item de dado so, primeiramente, normalizados para o
intervalo [0, 1], com base nos valores mnimo e mximo do atributo ao qual ele se refere
(linhas 20-21). Nas linhas 22 26, a posio do item de dado para cada atributo isolado
e seu valor normalizado so acumulados e registrados. A localizao final de um item
(onde a soma das foras das molas dos atributos zero) encontrada dividindo a soma
das posies do item para cada atributo isolado pela soma dos valores normalizados,
multiplicando o resultado pelo raio do crculo Radviz e, finalmente, somando as
coordenadas do seu centro (linhas 31 e 32). Um novo objeto elipse criado nessa
posio (linha 36) e armazenado (linha 37).

65

Figura 5.6: Criao dos objetos que representam itens de dados na tcnica Radviz
5.2.1.3 Matriz de Scatter Plots
A tcnica multidimensional Matriz de Scatter Plots tambm no faz parte do
conjunto de tcnicas de visualizao do toolkit InfoVis. No entanto, a tcnica Scatter
Plot 2D, que exibida em cada clula dessa matriz, j se encontrava implementada no
mesmo. Assim, construiu-se a implementao da Matriz de Scatter Plots no toolkit
como um agrupamento de n Scatter Plots 2D. O valor de n corresponde ao quadrado do
nmero de dimenses dos dados (dimensoes2).
Cada Scatter Plot 2D criado para compor a matriz uma visualizao independente,
que implementa os mtodos paintBackground e computeShapes da interface de
visualizao, assim como as tcnicas descritas acima. Logo, no necessrio fornecer,
para a classe de visualizao que representa a Matriz, uma implementao para estes
mtodos, pois a representao visual dessa matriz formada pelo conjunto das
representaes de seus Scatter Plots 2D.

66

A representao visual de um Scatter Plot 2D bastante simples: as figuras de itens


de dados so mapeadas como em grficos cartesianos, considerando seus valores para
um eixo x e um eixo y. Nesse caso, os eixos x e y so representados por dois atributos do
conjunto de dados. Assim, dada a simplicidade do mapeamento utilizado por essa
tcnica, no ser apresentada aqui a implementao para os mtodos computeShapes e
paintBackground da mesma.
A figura 5.7 mostra a representao visual da Matriz de Scatter Plots implementada
no toolkit InfoVis, exibindo o conjunto de dados sobre carros. Os itens de dados so
representados em cada Scatter Plot 2D por pequenas elipses e o nome dos atributos que
correspondem aos eixos x e y destas so exibidos nas laterais da matriz. Por outro lado,
a figura 5.8 mostra o cdigo Java executado pelo mtodo createVisualizationMatrix da
classe Matriz, que gera o agrupamento de Scatter Plots 2D (matriz).

Figura 5.7: Tcnica Matriz de Scatter Plots implementada no toolkit InfoVis


importante salientar que devido classe de visualizao Matriz de Scatter Plots
no fornecer implementao para o mtodo computeShapes, ela no gera um conjunto
de objetos grficos para representar itens de dados. Apenas as visualizaes Scatter
Plots 2D geram estes objetos. Assim, para que um usurio possa interagir com a
visualizao Matriz atrves de um painel de controles para interao, que modificam a
representao de objetos de dados, uma de suas visualizaes Scatter Plot 2D deve ser
associada diretamente a este painel de controle. Quando esta visualizao sofrer
alteraes na representao de seus objetos de dados (causada por uma interao com o
painel de controle), as demais visualizaes da matriz devero ser igualmente alteradas.
Para isto, um Scatter Plot 2D identificado como a principal (associada ao painel de
controle) e as demais so registradas como ouvintes (listeners) de mudanas em
determinadas propriedades desta visualizao.

67

1. public void createVisualizationMatrix() {


2.
//IntVector numericColumnIndices = ndices das colunas numricas da tabela;
3.
int n = numericColumnIndices.size();
4.
JPanel panel = new JPanel( new GridLayout(n, n) );
5.
6.
mainVisualization = null; // visualizao associada com um painel de controle
7.
8.
for (int i = 0; i < n; i++) {
9.
// obtm uma coluna da tabela
10.
Column c = table.getColumnAt( numericColumnIndices.get(i) );
11.
12.
for (int j = 0; j < n; j++) {
13.
// cria uma visualizao scatter plot 2D
14.
ScatterPlotVisualization visualization = new ScatterPlotVisualization(
15.
table, selectionColumn, filterColumn );
16.
VisualizationPanel visualizationPanel =
17.
new VisualizationPanel(visualization);
18.
19.
// adiciona a scatter plot na matriz (grid)
20.
panel.add( visualizationPanel );
21.
22.
// seta duas colunas da tabela para os eixos x e y da scatter plot 2D
23.
visualization.setVisualColumn( ScatterPlotVisualization.VISUAL_X_AXIS,
24.
table.getColumnAt(numericColumnIndices.get(i)) );
25.
visualization.setVisualColumn( ScatterPlotVisualization.VISUAL_Y_AXIS,
26.
table.getColumnAt(numericColumnIndices.get(j)) );
27.
28.
if ( i== 0 && j == 0 ) {
29.
// a primeira scatter plot criada ser associada com o painel de controle
30.
mainVisualization = visualization;
31.
}
32.
else {
33.
addListenerForMainVisualization( mainVisualization, visualization );
34.
}
35.
}
36.
}
37. }

Figura 5.8: Procedimento para a criao da matriz de visualizaes Scatter Plots 2D


No cdigo da figura 5.8, inicialmente criado um grid de n linhas e n colunas (linha
4), onde sero adicionadas as representaes dos Scatter Plots 2D. Cada visualizao
criada desta tcnica (linhas 14-15) tem seus eixos x e y associados com um par diferente
de atributos do conjunto de dados (linhas 23-26). Estes eixos so representados na
classe de visualizao ScatterPlotVisualization como propriedades visuais. A primeira
visualizao Scatter Plot 2D criada identificada como a principal da matriz (linha 30),
ou seja, aquela que ser associada com um painel de controle. Todas as visualizaes
criadas aps esta so registradas como suas ouvintes pelo mtodo
addListenerForMainVisualization. Este ltimo, cujo cdigo mostrado na figura 5.9,
executado para cada Scatter Plot 2D que forma a matriz (exceto a principal).
No cdigo da figura 5.9, um objeto ouvinte de mudanas de propriedades criado
(linha 5) e registrado para a visualizao principal da matriz (linha 4). Uma propriedade
identificada por uma constante string e representa a ocorrncia de uma interao em
uma visualizao. Assim, quando uma determinada propriedade da visualizao
principal alterada, o mtodo propertyChange (linha 6-49) invocado. Este identifica
qual foi exatamente a propriedade modificada e a altera da mesma forma nas demais
visualizaes Scatter Plot 2D. Assim, o mtodo addListenerForMainVisualization
garante que todas as visualizaes que compem a matriz estejam sempre iguais,
utilizando, para isto, coordenaes fixas e pr-determinadas entre elas. A figura 5.7, por
exemplo, mostra um mesmo item selecionado em todas as clulas da Matriz.

68

1. void addListenerForMainVisualization( ScatterPlotVisualization mainVisualization,


2.
final ScatterPlotVisualization visualization )
3. {
4.
mainVisualization.addPropertyChangeListener(
5.
new PropertyChangeListener() {
6.
public void propertyChange( final PropertyChangeEvent evt ) {
7.
new Thread( new Runnable() {
8.
public void run() {
9.
10.
if ( evt.getPropertyName().equals(VISUAL_SIZE) ||
11.
evt.getPropertyName().equals(VISUAL_SORT) ||
12.
evt.getPropertyName().equals(VISUAL_ALPHA) ||
13.
evt.getPropertyName().equals(VISUAL_LABEL) ||
14.
evt.getPropertyName().equals(VISUAL_COLOR) ) {
15.
16.
visualization.setVisualColumn( evt.getPropertyName(),
17.
(Column) evt.getNewValue() );
18.
}
19.
else {
20.
21.
if ( evt.getPropertyName().equals(PROPERTY_SMOOTH) ) {
22.
visualization.setSmooth( !visualization.isSmooth() );
23.
return; }
24.
25.
if ( evt.getPropertyName().equals(PROPERTY_DEFAULT_SIZE) ) {
26.
visualization.setDefaultSize( (Double) evt.getNewValue() );
27.
return; }
28.
29.
if ( evt.getPropertyName().equals(PROPERTY_DEFAULT_ALPHA) ) {
30.
visualization.setDefaultAlpha( (Double) evt.getNewValue() );
31.
return; }
32.
33.
if ( evt.getPropertyName().equals(PROPERTY_SHOWING_LABEL) ) {
34.
visualization.setShowingLabel(
35.
!visualization.isShowingLabel() );
36.
return; }
37.
38.
if ( evt.getPropertyName().equals(PROPERTY_FISHEYES) ) {
39.
visualization.setFisheyes( (Fisheyes) evt.getNewValue() );
40.
return; }
41.
42.
if ( evt.getPropertyName().equals(PROPERTY_EXCENTRIC_LABEL) ) {
43.
visualization.setExcentric( (evt.getNewValue() != null) ?
44.
new DefaultExcentricLabels() : null );
45.
return; }
46.
}
47.
}
48.
} ).run();
49.
}
50.
}
51.
);
52. }

Figura 5.9: Procedimento utilizado para garantir que aes realizadas em uma
visualizao 2D da matriz de Scatter Plots sejam executadas tambm nas suas
demais visualizaes
5.2.2 Coordenaes
O toolkit InfoVis, utilizado para a construo da aplicao em questo, implementa
e disponibiliza para todas as suas visualizaes (sem coordenao) grande parte das
tcnicas interativas que podem ser coordenadas na visualizao de dados
multidimensionais (apenas as manipulaes de atributos de dados no so suportadas).
Assim, na aplicao desenvolvida foi necessrio apenas habilitar a coordenao
dinmica destas tcnicas e acrescentar aquelas ainda no suportadas pelo toolkit.

69

Na aplicao desenvolvida, o tipo de coordenao mapeamento de dados para


propriedades visuais possui cinco formas especficas: mapeamento para cor
(denominado Color by), mapeamento para tamanho (denominado Size by), mapeamento
para transparncia (denominado Alpha by), mapeamento para ordenao em
profundidade (denominado Sort by) e, finalmente, mapeamento para texto de labels
(denominado Label by). A filtragem de dimenses e reordenao destas foram
agrupadas em uma nica coordenao, denominada Attributes manipulation. A
denominao Filtering foi limitada para designar apenas a filtragem coordenada de
objetos de dados e a denominao Selection foi adotada para representar a coordenao
brushing-and-linking.
Analisando os efeitos de cada ao interativa disponibilizada pela aplicao,
decidiu-se coordenar apenas aes iguais. Muitas combinaes no so possveis e
aquelas que o so, no auxiliam significativamente na compreenso do conjunto de
dados. Alm disso, desta forma, todas as coordenaes realizadas na aplicao sero
bidirecionais.
Como interagir com uma visualizao e os efeitos gerados por cada interao j
foram detalhadamente descritos na seo 4.4 do Captulo 4, que abordou os mecanismos
de interao oferecidos pelo toolkit InfoVis. Cada visualizao suportada pela aplicao
desenvolvida possui um painel de controle prprio, que o usurio deve utilizar para
interagir com sua representao. Este painel de controle igual quele apresentado na
seo 4.4 (incluindo os mecanismos adicionados). Na aplicao de visualizaes
coordenadas, o usurio dever apenas estabelecer e remover dinamicamente
coordenaes, o que ser tratado mais adiante nesse captulo.
Atualmente, oito aes interativas podem ser coordenadas dinamicamente entre as
trs visualizaes suportadas pela aplicao. Como a execuo e efeitos destas aes j
foram discutidos no captulo anterior, descreve-se, agora, resumidamente, o conjunto
completo de aes coordenadas suportadas pela aplicao desenvolvida:

Selection: Objetos de dados selecionados com o mouse em uma visualizao


so destacados (exibidos com uma borda vermelha) em todas as visualizaes
coordenadas. Alm disso, os valores que estes itens possuem para cada atributo
de dados so exibidos nos pains de controle das visualizaes (figura 5.10, em
baixo esquerda).

Filtering: Intervalos numricos de filtragem podem ser especificados para cada


atributo numrico do conjunto de dados, separadamente. Itens de dados com
valores contidos em um intervalo filtrado deixam de ser desenhados nas
visualizaes coordenadas. Para atributos categricos, a filtragem de valores
realizada selecionando o nome destes em uma lista. Objetos de dados com
valores no selecionados nesta lista tambm deixam de ser desenhados na
visualizao.

Size by: Aplica variaes progressivas no tamanho dos objetos de dados para
representar quo alto o valor que cada objeto apresenta para um determinado
atributo (escolhido pelo usurio). O menor tamanho atribudo ao objeto de
dado que possui o menor valor para o atributo sendo mapeado e o maior
tamanho aplicado ao objeto de dado que apresenta o maior valor para o
mesmo (figura 5.10, centro).

70

Color by: Aplica variaes progressivas na intensidade da cor dos objetos de


dados para representar quo alto o valor que cada objeto apresenta para um
determinado atributo (escolhido pelo usurio). A menor intensidade de cor
atribuda ao objeto de dado que possui o menor valor para o atributo sendo
mapeado e a maior intensidade de cor aplicada ao objeto de dado que
apresenta o maior valor para o mesmo (figura 5.10, centro).

Sort by: Utiliza o valor que cada item de dado possui para um determinado
atributo (especificado pelo usurio) como critrio para a ordenao dos objetos
de dados em profundidade. Ou seja, a ordem em que figuras de itens se
sobrepem na representao visual pode ser determinada pela escala de valores
de um atributo do conjunto de dados. O primeiro item a ser desenhado aquele
que possui o menor valor para o atributo determinante e o ltimo item
desenhado aquele que apresenta o maior valor para o mesmo.

Label by: Determina que o contedo de labels exibidos para cada objeto de
dado ser o valor que este possui para um determinado atributo (escolhido
pelo usurio).

Alpha by: Aplica variaes progressivas no nvel de transparncia dos objetos


de dados para representar quo alto o valor que cada objeto apresenta para
um determinado atributo (escolhido pelo usurio). O menor nvel de
transparncia atribudo ao objeto de dado que possui o maior valor para o
atributo sendo mapeado e o maior nvel de transparncia aplicado ao objeto
de dado que apresenta o menor valor para o mesmo.

Attributes manipulation: Permite que atributos (dimenses) do conjunto de


dados sejam retirados/acrescentados de representaes visuais pelo usurio.
Alm disso, o usurio pode tambm alterar a ordem em que tais atributos so
exibidos.

Dentre as aes mencionadas acima, apenas a seleo (selection) realizada


interagindo diretamente sobre as representaes visuais. As demais aes so realizadas
atravs da interao do usurio com componentes grficos dos painis de controle.
A figura 5.10 mostra um cenrio de explorao construdo na aplicao relatada
aqui, para anlise do conhecido conjunto de dados sobre carros. Nas trs visualizaes
do cenrio, o mecanismo de interao Color by foi utilizado para mapear os valores do
atributo de dados Cylinders para intensidades de cor. Nos grficos das tcnicas Radviz e
Coordenadas Paralelas foi utilizado ainda o recurso Size by, para mapear valores do
atributo de dados Year para o tamanho (ou espessura) das figuras de itens de dados. As
figuras que aparecem com o tom mais escuro de verde e com o maior tamanho so
aquelas que possuem os valores mais altos para os atributos Cylinders e Year,
respectivamente.
Ainda em relao figura 5.10, h um item de dado selecionado em todas as
visualizaes. Este item pode ser identificado porque aparece como uma linha vermelha
na tcnica Coordenadas Paralelas e como um crculo de borda vermelha nas outras
tcnicas. Os valores que o item selecionado possui para cada atributo do conjunto de
dados so mostrados em uma tabela na parte superior do painel de controle das
visualizaes. Na figura, esta tabela aparece no painel de controle da tcnica Radviz.
Em nenhuma das visualizaes da mesma figura, o conjunto de dados inteiro est
representado. Uma pequena parcela dos itens de dados foi filtrada: aqueles que

71

possuam os mais baixos valores para o atributo de dados Acceleration. A aplicao


deste filtro pode ser notada observando o painel de controle da tcnica Radviz.
As coordenaes entre visualizaes so estabelecidas e removidas dinamicamente
pelo usurio, interagindo com o grafo de coordenaes. Este ltimo representado, na
figura 5.10, no interior da janela Main Window. A descrio do grafo de coordenao e
de como interagir com ele sero abordadas nas prximas sees desse captulo.
importante mencionar que alm das interaes que podem ser coordenadas entre
visualizaes, as quais foram abordadas nessa seo, a aplicao desenvolvida tambm
disponibiliza para as trs visualizaes suportadas outras possibilidades de interao
(no-coordenadas), como as lentes Fisheyes, labels dinmicos e configuraes padro
de objetos de dados. Estas tcnicas interativas foram descritas na seo 4.4 do captulo
4.

Figura 5.10: Cenrio de explorao construdo na aplicao prottipo


5.2.3 Arquitetura
A arquitetura da aplicao de visualizaes coordenadas desenvolvida uma
combinao de dois estilos arquiteturais. A comunicao entre componentes internos da
aplicao segue o mesmo padro utilizado pelo toolkit InfoVis, ou seja, uma
organizao orientada a objetos. Estes ltimos encapsulam dados e operaes a eles
associadas (SHAW; GARLAN, 1996). Cada objeto no sistema precisa conhecer a
identidade de outros objetos para que possam ocorrer trocas de mensagens. Por
outro
lado, a propagao de interaes (coordenao) foi construda com arquitetura baseada
em eventos. A ocorrncia destes ltimos causa chamadas implcitas de mtodos.

72

A aplicao pode ser dividida em cinco estruturas principais: tabela, visualizaes,


painis de controle, controlador de coordenao e grafo de coordenao. As classes que
compem as trs primeiras estruturas pertencem ao toolkit InfoVis. No entanto, algumas
extenses foram feitas nas classes de visualizao e de controles de interao, com o
objetivo de viabilizar coordenaes e ampliar suas possibilidades. A figura 5.11
demonstra as relaes existentes entre os mdulos da aplicao.

Figura 5.11: Arquitetura do prottipo desenvolvido


Os dados multidimensionais obtidos a partir de um arquivo so armazenados na
estrutura Tabela. As visualizaes transformam estes dados armazenados em
representaes visuais. Todas as visualizaes suportadas pela aplicao representam
graficamente a mesma tabela de dados, porm utilizando tcnicas diferentes para o
mapeamento de itens. Mais de uma visualizao da mesma tcnica pode ser gerada, se o
usurio desejar.
Cada visualizao possui sempre um painel de controle associado a ela. Utilizando
os componentes de interface contidos neste ltimo, o usurio pode interagir com a
visualizao. Apenas a seleo de itens realizada com manipulao direta.
O grafo de coordenao a estrutura por meio da qual o usurio pode definir e
remover dinamicamente coordenaes entre visualizaes. Alm de armazenar as
propriedades relevantes de cada coordenao, essa estrutura tambm mantm atualizada
uma representao grfica interativa das conexes atuais. Logo aps o estabelecimento
de uma nova coordenao, o grafo atualiza a lista de conexes das duas visualizaes
envolvidas.
Finalmente, o controlador de coordenao a estrutura encarregada de receber
eventos de interao ocorridos em qualquer das visualizaes e propagar a interao
para aquelas conectadas primeira. Como todas as visualizaes possuem um painel de
controle associado e todas as ligaes so bidirecionais, o controlador de coordenao
propaga interaes modificando os componentes do painel de controle. Este, por sua
vez, atualiza a visualizao correspondente.

73

5.2.4 Grafo de Coordenao


Como a aplicao desenvolvida permite que conexes entre visualizaes sejam
definidas e removidas dinamicamente, necessrio manter uma estrutura atualizada,
que armazene as coordenaes atuais. Alm disso, deve ser oferecida ao usurio uma
forma visual de construir cenrios com mltiplas visualizaes coordenadas assim como
visualizar, a qualquer momento, esta estrutura, j que ele pode esquecer com facilidade
quais ligaes estabeleceu. O grafo de coordenao a estrutura que oferece todos estes
servios mencionados, sendo representado graficamente por um diagrama de nodos e
linhas de conexo (figura 5.12).

Figura 5.12: Estrutura do grafo de coordenao e seus relacionamentos com outros


mdulos da aplicao
Cada nodo do grafo de coordenao encapsula uma visualizao e seu painel de
controle. Alm disso, ele tambm mantm armazenadas as conexes associadas com o
mesmo.
As informaes contidas nos nodos so utilizadas para manter o grafo de
coordenao em estado coerente e para atualizar a lista de conexes das visualizaes
envolvidas em novas ligaes.
Cada linha de conexo mantm referncias para os dois nodos envolvidos na ligao
que ela representa. Alm disso, toda linha de conexo possui tambm uma informao
que identifica o tipo de interao associado a ela. Como pode ser observado na figura
5.12, dois nodos podem ter mais de uma linha de conexo ligando-os. No entanto, cada
linha destas deve representar um tipo de interao diferente. A flexibilidade em
coordenaes, oferecida pela aplicao, permite que o usurio possa coordenar apenas
as aes interativas que lhe parecerem convenientes.
No momento em que uma nova linha de conexo criada pelo usurio, trs aes
importantes so executadas pela aplicao para viabilizar esta coordenao.
Primeiramente, todas as visualizaes envolvidas na coordenao, direta ou
indiretamente, so inicializadas para a ao coordenada. Ou seja, se a nova linha de
conexo representa a interao filtering, todos os itens que estavam filtrados
anteriormente em visualizaes envolvidas na coordenao, deixaro de estar. O
componente grfico do painel de controle que invoca esta ao ser forado a voltar a
seu estado de inicializao. Com isto, conseqentemente, a visualizao ser tambm

74

atualizada. O que se pretende com estas inicializaes evitar que visualizaes


coordenadas apresentem estados diferentes logo aps a conexo.
Em seguida, a aplicao adiciona o controlador de coordenao como ouvinte da
ao coordenada em ambas as visualizaes envolvidas na ligao. Sempre que a ao
em questo for realizada pelo usurio em uma destas visualizaes, o controlador de
coordenao tomar conhecimento disto e propagar a ao para as visualizaes
coordenadas.
Finalmente, a ltima providncia necessria para viabilizar a coordenao atualizar
a lista de conexes das duas visualizaes envolvidas na ligao. A primeira
visualizao adicionada lista de conexes da segunda, e a segunda adicionada
lista de conexes da primeira.
A seqncia completa de operaes realizadas desde que o usurio solicita a criao
uma nova conexo at sua inteira viabilizao pela aplicao representada no
diagrama de seqncia UML da figura 5.13.

Figura 5.13: Processo de criao e viabilizao de uma nova coordenao


5.2.5 Especificando Coordenaes Dinamicamente
Com o intuito de permitir que o usurio construa dinamicamente relacionamentos
entre visualizaes, a aplicao mantm visvel na janela principal uma representao
grfica atualizada do grafo de coordenao. O usurio pode interagir a qualquer
momento com esta representao para criar ou remover conexes e tambm para alterar
a disposio dos elementos que compem o grafo.
Os nodos do grafo so representados por retngulos amarelos. Os mesmos so
identificados pelo nome da visualizao que representam. As linhas de conexo so
representadas graficamente por linhas coloridas. Cada interao possui uma cor que a
identifica.
Para permitir a identificao da ao representada por cada linha de conexo, alm
da cor, foram adicionados pequenos conectores na representao do grafo de

75

coordenao. Cada um destes representa uma interao diferente e, devido a isto, so


exibidos como retngulos com a cor de sua interao e a primeira letra do nome da
mesma. Cada conector est associado a um nodo. Posicionando o ponteiro do mouse
sobre ele, o nome completo da interao exibido.
As linhas de conexo no aparecem conectando diretamente nodos, mas sim,
conectores. Dessa forma, possvel identificar com facilidade a interao representada
por cada uma delas. A figura 5.14 mostra a representao grfica de um grafo de
coordenao com trs nodos e todas as suas coordenaes possveis ligadas.

Figura 5.14: Representao grfica de um grafo de coordenao


No cenrio representado pelo grafo da figura 5.14, todas as visualizaes esto
coordenadas. Embora no existam linhas de conexo ligando diretamente as
visualizaes Radviz e Matriz de Scatter Plots, elas esto conectadas indiretamente por
meio das aes coordenadas em comum com a visualizao Coordenadas Paralelas.
Dessa forma, no necessrio ligar explicitamente essas duas visualizaes.
5.2.5.1 Criando Coordenaes
Uma ao interativa pode ser coordenada entre duas visualizaes interagindo no
grafo de coordenao:
1. Os nodos envolvidos na coordenao devem ser conectados por uma linha
pontilhada vermelha, conforme mostra a figura 5.15. O usurio cria esta
linha clicando uma vez sobre o primeiro nodo e depois sobre o segundo.

Figura 5.15: Conectando os nodos da nova coordenao


2. Com a criao da linha, aparece uma janela de dilogo (como a da figura
5.16). Nesta, o usurio deve selecionar quais das aes exibidas sero
coordenadas.

76

Figura 5.16: Seleo de aes a serem coordenadas


3. Aps a escolha, as linhas de conexo so criadas e desenhadas no grafo
(figura 5.17).

Figura 5.17: Nodos conectados pela ao de seleo


5.2.5.2 Removendo Coordenaes
Uma coordenao entre duas visualizaes pode ser removida interagindo no grafo
de coordenao:
1. O usurio deve pressionar o boto direito do mouse sobre a linha que
representa a coordenao a ser removida.
2. No menu que aparece, selecionar a opo Remove coordination (mostrada na
figura 5.18).

Figura 5.18: Removendo uma coordenao


5.2.6 Gerenciamento de Coordenaes
Quando o usurio interage com uma visualizao, a aplicao propagar os efeitos
desta ao para as visualizaes coordenadas atravs das conexes estabelecidas. Sero
afetadas pela interao as visualizaes conectadas direta ou indiretamente primeira.
O controlador de coordenao recebe eventos que indicam que uma ao foi
executada em uma visualizao e seu estado mudou. A partir deste evento, ele identifica
a ao e provoca sua execuo em cada uma das visualizaes coordenadas primeira.
O controlador recebe eventos a partir de uma visualizao, mas propaga os efeitos da
interao representada por este evento atravs dos painis de controle. Assim, ele no
intermedia a comunicao entre objetos de visualizao, mas sim, entre estes ltimos e
seus painis de controle.
A figura 5.19 mostra as classes da aplicao envolvidas no processo de
gerenciamento de coordenao e as mensagens trocadas entre seus objetos. importante
mencionar que a seqncia de operaes do diagrama no termina com a execuo de

77

repaint() no objeto de visualizao. Aps esta operao, um novo evento de notificao


de mudana ser gerado pela visualizao atualizada e enviado ao controlador de
coordenao. Deve-se ressaltar que os componentes do diagrama no possuem
indicao de nomes de objetos, o que significa que eles so utilizados para representar n
objetos da classe.
A comunicao entre objetos de visualizao e o controlador de coordenao se d
conforme especifica o padro de projeto Observer (GAMMA et al., 1995). O
controlador de coordenao um observador dos objetos de visualizao. Quando um
destes ltimos tem seu estado alterado, ele envia uma notificao de mudana para o
controlador, e este, por sua vez, obter o novo estado do objeto de visualizao, a fim de
propagar este estado para outros objetos.

Figura 5.19: Processo de gerenciamento de coordenaes


Para cada interao que pode ser coordenada, a aplicao possui uma constante
string que armazena um nome atribudo a ela. Esta mesma constante utilizada como
uma propriedade para a notificao de mudanas em uma visualizao, provocadas pela
interao em questo. Dessa forma, quando o usurio interage com uma determinada
visualizao, o mtodo da mesma que processa a ao invocado. Este ltimo atualiza a
visualizao (fornecendo feedback ao usurio) e provoca a gerao de um evento de
mudana de propriedade, cujo nome a string mencionada acima, que representa a
interao executada.
O evento gerado pela visualizao enviado ao controlador de coordenao
(registrado como ouvinte de todas as visualizaes), provocando uma chamada
implcita ao mtodo deste que propaga interaes. O controlador de coordenao obtm
a lista de visualizaes conectadas diretamente (pela interao em questo) quela que
gerou o evento e fora a atualizao do painel de controle associado a elas. Assim como
o usurio faz uso de componentes grficos do painel de controle para interagir com as
visualizaes, o controlador de coordenao tambm modifica o estado destes
componentes para provocar interaes nas visualizaes coordenadas.

78

O diagrama da figura 5.20 representa graficamente as atividades de alto nvel


descritas acima, que so executadas pelo usurio e pelo sistema. Por outro lado, o
diagrama da figura 5.21 fornece uma viso mais detalhada do processo de propagao
de interaes. Ele mostra a seqncia de operaes de objeto executadas desde a
interao do usurio com uma visualizao at o trmino da propagao dessa interao
para as visualizaes coordenadas primeira.
Logo que as visualizaes coordenadas diretamente quela com a qual o usurio
interagiu forem atualizadas, estas tambm provocaro a gerao de um novo evento de
mudana de propriedade. Este ltimo, por sua vez, tambm ser tratado pelo controlador
de coordenao e a interao por ele representada ser propagada para outras
visualizaes coordenadas a elas.

Figura 5.20: Atividades realizadas pelo usurio e aplicao no processo de propagao


de uma interao
Conforme j mencionado em seo anterior, no momento em que uma nova
coordenao estabelecida entre duas visualizaes, a primeira delas adicionada
lista de conexes da segunda e a segunda adicionada lista de conexes da primeira.
Embora o controlador de coordenao atualize o componente grfico que causa uma
interao sendo propagada nos painis de controle de todas as visualizaes
coordenadas com a que o usurio interagiu, no ocorrem ciclos de propagao infinitos.
Isto porque um painel de controle somente ir atualizar sua visualizao correspondente
se foi gerado um evento de mudana em um de seus componentes grficos. Assim, se o
componente grfico atualizado pelo controlador j se encontrava exatamente no estado
desejado antes da ao do controlador, nenhum evento de mudana ser gerado para
este componente. Conseqentemente, a visualizao ligada ao painel de controle no
ser novamente atualizada e a propagao termina.
A propagao de interaes realizada utilizando mltiplas threads. A atualizao
de cada painel de controle de uma visualizao coordenada executada por uma thread
diferente. Isto permite ao controlador de coordenao continuar propagando interaes,
enquanto cada painel de controle e sua visualizao so atualizados.

Figura 5.21: Seqncia de operaes realizadas pelos objetos envolvidos na propagao de interaes

79

80

5.2.7 Tornando uma Visualizao Coordenvel: A Interface Visualization


No topo da estrutura de classes de visualizao do toolkit InfoVis est uma interface
denominada Visualization. Nesta ltima, esto contidas as assinaturas de todos os
mtodos que uma visualizao precisa implementar para ser incorporada ao toolkit e
disponibilizar ao usurio todos os mecanismos de interao padro oferecidos pelo
mesmo. Como a implementao de muitos destes mtodos igual em diferentes
visualizaes, o InfoVis conta com uma classe abstrata denominada DefaultVisulization,
que contm justamente implementaes padro para os mtodos da interface
Visualization. Assim, a maioria das classes de visualizaes especficas (Radviz,
Coordenadas Paralelas, Matriz de Scatter Plots, etc.) derivam da classe
DefaultVisualization e implementam apenas os mtodos que possuem um
comportamento especfico.
Para adicionar uma nova visualizao aplicao prottipo tema desse trabalho, ela
deve apenas ser incorporada ao toolkit InfoVis. Para isto, a classe que representa a nova
visualizao deve implementar a interface Visualization ou estender a classe abstrata
DefaultVisualization.
A interface Visualization contm a assinatura de muitos mtodos e a declarao de
algumas constantes. Dentre estas ltimas, esto as strings que armazenam um nome para
cada uma das interaes que podem ser coordenadas em nossa aplicao. Estas strings
tambm so utilizadas como propriedades para a notificao de mudanas em uma
visualizao, provocadas pela interao que elas representam. A tabela 5.1 mostra as
interaes suportadas pela aplicao e suas respectivas constantes.
Tabela 5.1: Interaes coordenadas e as propriedades que notificam sua ocorrncia
Interao

Nome da Propriedade que Notifica a Ocorrncia da Interao

Selection

public static final String VISUAL_SELECTION = "Selection";

Filtering

public static final String VISUAL_FILTER = "Filtering";

Sort by

public static final String VISUAL_SORT = "Sort by";

Label by

public static final String VISUAL_LABEL = "Label by";

Color by

public static final String VISUAL_COLOR = "Color by";

Size by

public static final String VISUAL_SIZE = "Size by";

Alpha by
Attributes
Manipulation

public static final String VISUAL_ALPHA = "Alpha by";


public static final String PROPERTY_DATA_ATTRIBUTES =
"Attributes manipulation";

Em relao aos mtodos definidos pela interface Visualization, a maioria deles so


voltados para a manuteno da representao visual. No entanto, nesta interface que
esto definidos tambm os mtodos que tornam possvel uma visualizao ser
coordenada. Os mtodos de Visualization diretamente relacionados ao processo de
coordenao so mostrados na figura 5.22.

81

Figura 5.22: Mtodos da interface Visualization relacionados ao processo de


coordenao
Os mtodos addPropertyChangeListener e removePropertyChangeListener
acrescentam o controlador de coordenao como ouvinte de eventos de mudana de
propriedade ocorridos em uma visualizao. Estes mtodos possuem uma
implementao padro, presente na classe DefaultVisualization. O mtodo
firePropertyChange invocado por uma visualizao logo que uma interao acabou de
ser processada na mesma. Ele envia um evento de mudana de propriedade, que ser
recebido pelo controlador de coordenao. Este mtodo tambm possui uma
implementao padro em DefaultVisualization.
Os mtodos addConnection e removeConnection so invocados pelo grafo de
coordenao para atualizar a lista de conexes de uma visualizao. Esta ltima
armazena referncias no para outras visualizaes, mas para painis de controle. Uma
visualizao pode facilmente ser obtida atravs de seu painel de controle, j o contrrio
no possvel. O mtodo getConnections apenas retorna as conexes atuais que uma
visualizao possui. Finalmente, o mtodo getInteractions fornece a lista de interaes
que so implementadas por uma visualizao.

5.3 Comentrios Finais


A aplicao desenvolvida e relatada nesse captulo flexvel em relao aos dados,
visualizaes e coordenaes. Isto significa que, dado um determinado conjunto de
dados multidimensionais, os usurios podem escolher as visualizaes mais apropriadas
para represent-lo e tambm determinar, dinamicamente, quais interaes sero
coordenadas entre essas visualizaes.
Apenas trs tcnicas de visualizao (Coordenadas Paralelas, Radviz e Matriz de
Scatter Plots) so suportadas, mas esse conjunto pode ser facilmente ampliado. Para
isto, basta apenas incorporar uma nova tcnica ao toolkit. As tcnicas escolhidas para
comporem o grupo de visualizaes da aplicao (todas elas geomtricas) so bastante
conhecidas e apresentam muitas caractersticas teis para a compreenso efetiva dos
dados. As possibilidades de interao disponibilizadas pelo toolkit InfoVis foram
estendidas para uso coordenado e outras foram adicionadas a esse conjunto inicial.
A descrio da aplicao prottipo foi publicada recentemente, na ltima
International Working Conference on Advanced Visual Interfaces (PILLAT; FREITAS,
2006).

6 AVALIAO PRELIMINAR

Nesse captulo sero relatados dois estudos de avaliao preliminares, realizados


com a aplicao prottipo apresentada nesse trabalho. O primeiro estudo de avaliao
foi realizado logo aps o trmino da implementao das tcnicas de visualizao
multidimensionais sobre o toolkit InfoVis. Estas j possuam os mecanismos de
interao disponveis, no entanto, coordenaes ainda no eram possveis.
O segundo estudo de avaliao foi realizado logo aps o trmino da implementao
da estrutura de coordenaes. J era possvel, nesse momento, estabelecer conexes
dinamicamente entre visualizaes (atravs do diagrama de coordenaes).
Ambos os estudos foram realizados como ensaios de interao com usurios.

6.1 Primeira Avaliao


Este primeiro estudo experimental teve como objetivos avaliar e comparar duas
tcnicas de visualizao de informaes, Coordenadas Paralelas e Radviz, bem como
seus recursos de interao. A avaliao foi realizada para identificar possveis
problemas de usabilidade nas implementaes das duas tcnicas e na interface de
usurio de ambas, com o intuito de preparar a implementao para as facilidades de
coordenao. Um segundo objetivo foi enquadrar os problemas dentro dos critrios
ergonmicos de Bastien e Scapin (1993), como colaborao com outro projeto em
andamento. importante mencionar tambm que as implementaes avaliadas nesse
estudo eram verses preliminares das visualizaes e algumas caractersticas e recursos
de interao (como a manipulao de atributos) foram adicionados aps essa avaliao,
com base em seus resultados. A tcnica de visualizao Matriz de Scatter Plots no foi
includa nesse experimento a fim de no torn-lo muito extenso e cansativo para os
usurios.
O estudo de avaliao relatado nessa seo foi descrito em artigo publicado na
Conferncia Latino Americana de Interao Humano Computador (PILLAT; VALIATI;
FREITAS, 2005).
6.1.1 Conjunto de Dados
Para esse experimento de avaliao, apenas um conjunto de dados foi utilizado, o
conjunto de dados de automveis, que freqentemente acompanha pacotes para
visualizao e minerao de dados (GRINSTEIN et al., 2000). Este conjunto bastante
conhecido entre pesquisadores de visualizao de informaes e muito utilizado em
experimentos desse tipo, como por exemplo, Grinstein et al. (2000) e Kobsa (2001).

83

O conjunto demonstra as diferentes caractersticas dos carros americanos, europeus e


japoneses comercializados de 1970 a 1982. Consta de 392 registros (cinco registros
foram excludos da verso original da CMU Statlib Library porque havia valores
faltando) com 7 atributos (seis numricos e um categrico). As dimenses so
denominadas de MPG (milhas por galo), Cylinders, Horsepower, Weight,
Acceleration, Year e Origin.
As caractersticas que esse conjunto de dados pode ilustrar so (GRINSTEIN et al.,
2000):

Itens situados fora da concentrao principal;

Clusters;

Clusters de classe (origem do carro, por exemplo).

6.1.2 Tarefas Experimentais


Todos os usurios que realizaram esse teste de avaliao de usabilidade foram
instrudos a explorar as visualizaes das tcnicas avaliadas enquanto buscavam
respostas para quatro tarefas/questes experimentais.
Essas tarefas/questes, definidas por Valiati (2004), so as seguintes:
1. A maior produo de carros japoneses foi fabricada entre que anos?
2. Analise os dados e descreva as principais caractersticas dos carros
americanos.
3. Os carros japoneses com 4 cilindros geralmente so mais pesados do que os
americanos com 6 cilindros?
4. Que tendncia os carros europeus apresentaram com o passar dos anos em
relao s suas caractersticas?
6.1.3 Procedimento
O experimento de avaliao de usabilidade em questo foi realizado na forma de
ensaios de interao com usurios. Devido a limitaes de voluntrios com experincia
na rea, cinco estudantes de visualizao de informaes participaram do experimento.
Algumas semanas antes do mesmo, os estudantes receberam, em grupo, treinamento
de uma hora com relao ao uso das duas tcnicas avaliadas. Nesse perodo, eles
receberam explicaes gerais sobre a forma como cada tcnica organiza o layout dos
itens de dados em sua representao visual e exploraram livremente todos os
componentes e mecanismos de interao disponibilizados para cada tcnica. Durante
essa seo de treinamento, foi utilizado, para a explorao das tcnicas, um conjunto de
dados chamado Salivary, que acompanha o toolkit InfoVis. O mesmo contm
informaes temporais a respeito de glndulas salivares de larvas.
No momento do experimento propriamente dito, cada estudante recebeu um retreinamento de 15 minutos. Aps este tempo, cada sujeito recebeu uma lista contendo as
quatro tarefas/questes a serem resolvidas utilizando as visualizaes e foi instrudo a
verbalizar todas as aes que iam sendo realizadas e problemas encontrados, assim
como, a sua gravidade.

84

Os experimentos foram conduzidos individualmente, em laboratrio, na presena de


dois observadores, sendo que um deles anotou os problemas de usabilidade observados
e/ou relatados pelo usurio (em cada tcnica de visualizao avaliada) e o outro
observou o procedimento de interao do usurio.
Os estudantes foram randomicamente selecionados para utilizar as duas tcnicas em
ordem inversa de forma alternada, ou seja, dois usurios utilizaram Coordenadas
Paralelas e depois Radviz e os outros trs utilizaram Radviz e depois Coordenadas
Paralelas, totalizando dez observaes. No foi estipulado limite de tempo para a
completude das tarefas/questes.
6.1.4 Resultados
Os problemas relatados pelos usurios e/ou identificados pelo observador do
experimento foram classificados dentro de nove critrios de usabilidade, definidos por
Bastien e Scapin (1993). Ao todo, eles so dezoito critrios, mas apenas em nove deles
foram identificados problemas com as implementaes avaliadas, segundo o resultado
do experimento.
Os dezoito critrios elementares definidos por Bastien e Scapin so: Incitao ou
presteza, agrupamento/distino por localizao, agrupamento/distino por formato,
feedback imediato, legibilidade, conciso, aes mnimas, densidade informacional,
aes explcitas do usurio, controle do usurio, flexibilidade, considerao da
experincia do usurio, proteo contra erros, qualidade das mensagens de erro,
correo dos erros, consistncia, significncia de cdigos e compatibilidade.
A fim de classificar o grau de severidade dos problemas de usabilidade
identificados, foram usados os seguintes cdigos:

Severidade 0 (sem importncia): No afeta o funcionamento da ferramenta;

Severidade 1 (cosmtico): No h necessidade de reparar o problema


imediatamente;

Severidade 2 (simples): Problema de baixa prioridade (no precisa ser


reparado);

Severidade 3 (grave): Problema de alta prioridade (precisa ser reparado);

Severidade 4 (catastrfico): Muito grave (precisa ser reparado).


A seguir, ser descrito cada um dos problemas de usabilidade identificados,
organizados de acordo com os critrios em que foram enquadrados.
6.1.4.1

Incitao/Presteza

Trs usurios que participaram do experimento sentiram falta da indicao dos


valores mnimo e mximo de cada atributo prximo s barras de filtragem. Alm desses
valores, eles tambm mencionaram que o intervalo correspondente aos itens no
filtrados, em cada momento, deveria permanecer visvel ao lado das barras de filtragem.
Os componentes e mecanismos de interao de ambas as tcnicas avaliadas possuem o
mesmo funcionamento. O recurso utilizado pela interface para exibir os valores
mencionados acima um label, que aparece apenas quando o usurio posiciona o cursor
do mouse sobre a barra de filtragem, o que no agradou os usurios devido ao tempo e
esforo requerido para a obteno da informao.

85

Na tcnica Coordenadas Paralelas, os mesmos usurios mencionaram ainda que os


valores mnimo e mximo de cada atributo deveriam permanecer exibidos tambm nas
extremidades inferior e superior, respectivamente, da linha vertical da visualizao
correspondente a ele.
Classificou-se os problemas identificados para esse critrio como graves (severidade
3), que devem ser reparados.
6.1.4.2 Agrupamento/Distino por Localizao
Todos os usurios (5 sujeitos) manifestaram alguma dificuldade quanto
interpretao do layout da tcnica Radviz. Isto foi sentido, principalmente, nos
momentos em que era necessrio conhecer a ordenao dos itens de dados com respeito
a um determinado atributo. Para essa tarefa, todos os usurios recorreram ao uso de
atributos visuais, j que o layout da tcnica, em muitos casos, no fornecia essa
informao com clareza. Um dos usurios sugeriu que a interface poderia fornecer um
mecanismo que mapeasse todos os itens sobre um determinado eixo do Radviz, definido
pelo usurio, nas posies correspondentes a seus valores para o atributo.
O problema identificado para esse critrio foi considerado de tipo cosmtico
(severidade 1), pois se trata de uma deficincia inerente tcnica Radviz.
6.1.4.3 Feedback Imediato
Nesse critrio, o observador do experimento identificou problemas relativos ao
tempo de resposta do sistema para os mecanismos de alterao do tamanho default dos
itens, alterao do nvel de transparncia default dos mesmos e de exibio dos labels
dinmicos (excentric labels).
Classificou-se estes problemas como simples (severidade 2), que podem ser
reparados.
6.1.4.4 Legibilidade
O primeiro problema de legibilidade apontado pelos usurios foi a respeito do label
que exibe os valores mnimo e mximo de cada atributo, bem como o intervalo dos itens
mostrados pelas barras de filtragem. Esse label aparece quando o cursor posicionado
sobre uma destas ltimas. O formato em que estes valores so exibidos foi considerado
de difcil compreenso por todos os usurios (5 sujeitos).
Na tcnica Radviz, a ocluso de objetos (itens de dado) foi apontada por trs
usurios como um fator que dificulta a interpretao dos dados, em alguns casos. Esse
problema mais evidente, quando o atributo visual de tamanho dos itens (Size by)
usado.
A disposio dos atributos no layout da visualizao tambm afeta a interpretao
dos dados em ambas as tcnicas avaliadas. No entanto, em Radviz o problema mais
acentuado. Trs usurios sugeriram que a interface permitisse a alterao da ordenao
dos atributos (posies) nas visualizaes e a retirada de um ou mais atributos das
mesmas, como mecanismos para amenizar o problema da ocluso de itens.
Classificou-se todos os problemas de legibilidade mencionados como graves
(severidade 3).

86

6.1.4.5 Conciso
O nico problema relatado, por dois usurios, quanto a esse critrio foi que a
interface de ambas as tcnicas avaliadas no permite a eliminao (filtragem) de itens
desnecessrios para uma anlise, quando seus valores para um determinado atributo
esto entre os valores de itens relevantes para a mesma. Ou seja, no permitido
especificar dois intervalos diferentes para a filtragem. Esse problema foi considerado
simples (severidade 2).
6.1.4.6 Aes Mnimas
O problema identificado por um dos usurios para esse critrio est relacionado com
a volta da aplicao para o estado inicial. Para que a visualizao de uma tcnica volte a
ser exibida exatamente como apareceu inicialmente, o usurio precisa desfazer, uma por
uma, todas as alteraes realizadas na representao visual por meio de mecanismos de
interao, o que pode envolver um grande nmero de aes. O mesmo usurio sugeriu a
criao de um boto reset (de inicializao) para a resoluo desse problema. Este
ltimo foi considerado do tipo cosmtico (severidade 1), pois no h necessidade
imediata de soluo.
6.1.4.7 Densidade Informacional
O observador do experimento notou que um nmero elevado de itens na
visualizao influencia a interpretao da tcnica Coordenadas Paralelas. Quando havia
muitas linhas horizontais, os usurios sentiam dificuldade para acompanhar o caminho
que elas seguiam aps atravessar uma linha vertical de um atributo. Esse problema foi
considerado do tipo cosmtico (severidade 1), pois inerente tcnica, embora existam
formas de ameniz-lo (trocando a ordenao dos atributos ou retirando alguns, por
exemplo).
6.1.4.8 Flexibilidade
A interface de ambas as tcnicas avaliadas possui poucos recursos alternativos que
do flexibilidade execuo de tarefas. Os recursos no oferecidos e que os usurios
sentiram falta foram:

Componente para entrada de texto do intervalo a ser filtrado (severidade 1);

Permitir a seleo de mltiplos itens e exibir no painel de controle


informaes relevantes sobre o conjunto selecionado, como nmero de itens,
percentagem dessa quantia em relao ao todo e informaes estatsticas
(severidade 0);

Permitir que os itens filtrados apaream em cinza, ao invs de serem


eliminados da visualizao (severidade 1);

Permitir mudana na ordenao dos atributos (severidade 3);

Permitir eliminao de um ou mais atributos da visualizao (severidade 3).

6.1.4.9 Compatibilidade
Um dos usurios notou que a seleo de um item com o mouse considera sempre o
item mais ao fundo como o selecionado. Quando h ocluso de objetos, o normal seria a
seleo considerar o objeto mais frente, como acontece em outras aplicaes.

87

Classificou-se esse problema como grave (severidade 3), pois o resultado da ao


no corresponde ao esperado pelo usurio.

6.2 Segunda Avaliao


Esse segundo estudo de avaliao foi conduzido com o objetivo de avaliar o uso e
contribuies das coordenaes dinmicas implementadas na aplicao desenvolvida.
O estudo foi realizado na forma de avaliao subjetiva e observao, com dez
estudantes de mestrado, que possuem conhecimento bsico sobre visualizao de
informaes. Os estudantes j conheciam as tcnicas de visualizao suportadas pela
aplicao, mas receberam explicaes gerais sobre os mecanismos de interao
possveis, assim como sobre a especificao de coordenaes.
O procedimento de avaliao correspondeu ao uso livre da aplicao para responder
quatro questes experimentais sobre o mesmo conjunto de dados de carros, utilizado na
avaliao anterior. Alm do conjunto de dados, tambm as questes experimentais
foram as mesmas utilizadas no estudo de avaliao anterior.
Observando o procedimento de anlise adotado por cada estudante para responder as
questes, verificou-se que:

O uso de coordenaes mais til para a anlise de conjuntos de dados complexos,


j que nesse estudo de avaliao algumas das questes do experimento foram
respondidas pelos sujeitos analisando a representao visual de apenas uma tcnica
de visualizao.

Para anlises mais complexas do conjunto de dados, em que era necessrio observar
mais de uma visualizao, todos os estudantes usaram algum mecanismo de
interao coordenado.

Coordenaes foram teis, principalmente, para evitar interaes repetidas em


mltiplas visualizaes (economizando tempo), localizar um mesmo item de dado
nas diferentes representaes e identificar padres no evidentes.

Cada sujeito utilizou apenas trs interaes coordenadas: filtragem, mapeamento de


valores para cor e seleo.

7 ESTUDO DE CASO

Esse captulo descreve um estudo de caso em que a aplicao de visualizao


desenvolvida foi utilizada por especialistas de um domnio especfico para a explorao
de seus dados multidimensionais. O objetivo principal desse estudo foi verificar se as
tcnicas de visualizao implementadas na aplicao, em conjunto com os mecanismos
de interao associados a elas, permitem a extrao de informaes relevantes e
significativas quando utilizadas para a representao de dados multidimensionais de um
domnio especfico. Como se sabe, as tcnicas Coordenadas Paralelas, Radviz e Matriz
de Scatter Plots so voltadas para a visualizao de dados multidimensionais em geral e,
por esta razo, torna-se tambm importante verificar sua utilizao por usurios reais,
em um domnio determinado.
A fim de reduzir a complexidade no processo de explorao de dados e simplificar o
aprendizado do usurio especialista na manipulao da aplicao desenvolvida, no foi
habilitado, nesse estudo, nenhum tipo de coordenao entre as trs tcnicas de
visualizao.

7.1 Descrio e Objetivos do Domnio: Morfometria Craniana


A morfometria consiste na obteno de informaes a respeito da forma de
determinadas estruturas atravs de suas medidas. Os bilogos freqentemente utilizam
medidas morfomtricas para distinguir espcies animais ou vegetais. Para esse estudo de
caso, a aplicao desenvolvida foi utilizada para a visualizao de dados morfomtricos
cranianos do roedor conhecido popularmente como Tuco-tuco, a partir de exemplares
coletados por bilogos do departamento de Gentica da Universidade Federal do Rio
Grande do Sul. O projeto de pesquisa destes bilogos tem como objetivos:

Estabelecer a distribuio geogrfica de roedores desse gnero (Ctenomys) no


Estado do Rio Grande do Sul;

Avaliar dimorfismo sexual e variaes cromossmicas e geogrficas e sua


relao com a morfometria craniana do animal;

Propor uma filogenia (histria genealgica das espcies) baseada tambm na


morfometria craniana;

Analisar a influncia de barreiras geogrficas na evoluo do gnero no Rio


Grande do Sul.

Nesse contexto, os bilogos que participaram do presente estudo de caso, utilizando


as visualizaes da aplicao desenvolvida para a explorao dos dados morfomtricos,

89

separados por local da coleta e sexo, esperavam obter as seguintes informaes a partir
da representao destes dados:

A identificao de crnios com medidas fora do padro (possveis erros);

A identificao de variaes entre os padres de medidas cranianas de diferentes


localidades (variaes geogrficas);

A distino entre medidas de animais de sexo diferente (dimorfismo sexual);

A identificao de variaes nas medidas de animais com nmero de


cromossomos diferente.

A ferramenta de software utilizada atualmente pelos especialistas desse domnio


para a verificao das informaes acima denominada NCSS (Number Cruncher
Statistical System), e o mtodo aplicado a Anlise de Componentes Principais (PCA).

7.2 Conjunto de Dados


Para esse estudo de caso, apenas um conjunto de dados do domnio morfometria
animal foi utilizado. Este conjunto contm dados de 157 animais de uma espcie desse
gnero e apresenta como atributos 17 variveis numricas, 16 destas correspondentes a
medidas do crnio destes animais (realizadas como mostra a figura 7.1) e uma
correspondente ao nmero de cromossomos dos mesmos, e trs variveis categricas:
cdigo (valor diferente para cada animal), local (local da coleta da amostra) e sexo. Isto
totaliza 20 atributos de dados.
As amostras presentes nesse conjunto de dados foram obtidas a partir de 10 locais de
coleta diferentes e todas elas deveriam representar animais adultos. No entanto, h
grandes possiblidades de que dados de animais jovens estejam includos na
amostragem acidentalmente pelos bilogos e, caso isto ocorra, estas amostras devem ser
identificadas e retiradas do conjunto de dados, pois podem levar a concluses errneas
na caracterizao do exemplar tpico da espcie.

Figura 7.1: Indicao das dezesseis medidas extradas do crnio de um tuco-tuco para a
anlise morfomtrica tradicional. (a) Vista dorsal, (b) vista ventral e (c) vista lateral.

7.3 Procedimento
Esse estudo de caso foi realizado de maneira informal e contou com a participao
de dois especialistas em morfometria craniana. Ambos os sujeitos so alunos de
doutorado da rea de Gentica, nesta universidade.

90

Os dois sujeitos no conheciam as tcnicas de visualizao a serem avaliadas


(Coordenadas Paralelas, Radviz e Matriz de Scatter Plots), mas possuam algum
conhecimento bsico de visualizao de informaes, adquirido atravs do uso da
ferramenta de software utilizada para a anlise de seus dados. Assim, eles receberam um
treinamento de aproximadamente uma hora com relao ao uso das trs tcnicas
avaliadas. Nesse perodo, eles receberam explicaes gerais sobre a forma como cada
tcnica organiza o layout dos itens de dados em sua representao visual e sobre o efeito
das possibilidades de interao disponibilizadas. No foi comentada a possibilidade de
coordenar visualizaes.
Aps o treinamento, os sujeitos puderam utilizar a aplicao desenvolvida
livremente por trs dias. No foram estabelecidas questes experimentais para essa
avaliao. Ao invs disto, os sujeitos foram orientados a explorarem o mximo possvel
as representaes visuais do conjunto de dados descrito na seo anterior, a fim de
encontrarem informaes relevantes e de interesse para a anlise morfomtrica (como as
informaes mencionadas na seo 7.1). Durante esse perodo, os sujeitos anotaram
todas as informaes relevantes obtidas com o uso da aplicao desenvolvida, as
visualizaes que foram teis para a obteno dessas informaes e o procedimento de
interao seguido. Alm disso, eles anotaram tambm sugestes e observaes sobre a
interface grfica da aplicaco.
Ao final do terceiro dia, conversou-se novamente com os sujeitos para a verificao
das informaes anotadas, incluso de informaes que estivessem faltando e para ouvir
pessoalmente as concluses subjetivas sobre a aplicao desenvolvida e sua
aplicabilidade para a explorao de dados morfomtricos.

7.4 Resultados
No final da seo 7.1 foram citadas as informaes que os especialistas desse estudo
esperavam obter com a explorao de seus dados morfomtricos na aplicao
desenvolvida. Nessa seo, sero apresentadas as informaes que eles conseguiram
realmente obter ao final do estudo e as tcnicas de visualizao e interao que
possibilitaram isto.
7.4.1 Identificao de Crnios com Medidas Fora do Padro
Os usurios especialistas destacaram em suas avaliaes que a visualizao
Coordenadas Paralelas foi muito til para a rpida identificao de crnios com medidas
fora do padro e/ou medidas que apresentam diferenas significativas entre os
indivduos. Estas ocorrncias, segundo eles, podem indicar erros na coleta das medidas
e, por esta razo, a identificao das mesmas muito importante.
A visualizao do conjunto total de indivduos contidos nos dados analisados nesse
estudo j permite a identificao de crnios fora do padro, conforme mostra a figura
7.2, e medidas que apresentam diferenas significativas entre indivduos. A
possibilidade de destacar na representao visual um determinado item e, paralelamente,
observar seus valores de atributo na tabela do painel de controle facilita ainda mais a
observao de um determinado item em relao ao todo, segundo os usurios
especialistas. Por exemplo, o item destacado na visualizao da figura 7.2 foi
identificado pelos mesmos como sendo um indivduo jovem, devido s medidas

91

pequenas apresentadas. Este, ento, deveria ser retirado do conjunto de dados, j que
apenas indivduos adultos devem compor a amostragem.
As visualizaes Radviz e Matriz de Scatter Plots no chegaram a ser exploradas
pelos usurios nessa tarefa.

Figura 7.2: Identificao de um animal com medidas fora do padro (item destacado)
7.4.2 Identificao de Variaes nos Padres de Medidas de Diferentes
Localidades
Um dos objetivos da anlise morfomtrica de crnios verificar se existem
variaes nas medidas de crnios em funo da localizao geogrfica das amostras.
Para tentar identificar estas variaes entre diferentes localidades (o conjunto de dados
analisado contm 10 localidades), os especialistas do estudo de caso inicialmente
retiraram o atributo cromossomos da representao visual e mapearam o contedo do
atributo local (categrico) para cor, na visualizao Coordenadas Paralelas. Com isto, os
itens de dados representados foram divididos em 10 cores diferentes, cada cor
representando um local de coleta. No entanto, isto no foi suficiente para obter as
informaes de variaes desejadas, devido grande sobreposio e cruzamento de
linhas, que pode ser observada na figura 7.3.
Para melhorar a visualizao, os especialistas aplicaram diversas combinaes de
filtros por local, ou seja, variaram o nmero de locais de coleta visualizados
simultaneamente, bem como tambm os locais propriamente ditos. Com isto, eles
conseguiram obter informaes de variaes interessantes: as amostras coletadas em
Pelotas (cor verde claro), por exemplo, apresentam um padro de medidas um pouco
mais alto, em geral, que as amostras coletadas em outros locais; as amostras coletadas
na Estao Ecolgica do Taim (em cor vermelha) apresentam o padro de medidas mais
baixo entre todos os locais analisados; e as amostras coletadas nos demais locais
apresentam um padro semelhante de medidas, intermedirio entre Taim e Pelotas. A
visualizao Matriz de Scatter Plots, com o atributo local mapeado para cor tambm,
foi observada em paralelo com Coordenadas Paralelas e ajudou a validar as informaes
de variao mencionadas acima.

92

As figuras 7.4 e 7.5 mostram apenas os itens de dados que representam amostras
coletadas em Pelotas (cor verde), Bag (cor azul) e Taim (com vermelha), utilizando as
tcnicas Coordenadas Paralelas e Matriz de Scatter Plots, respectivamente. Claramente,
possvel perceber trs padres distintos de medidas: o padro mais alto representa
Pelotas, o intermedirio representa Bag e o mais baixo representa Taim. Os demais
locais de coleta, no representados nessas figuras, seguem aproximadamente o mesmo
padro de medidas de Bag.
7.4.3 Identificao de Variaes nas Medidas de Animais com Nmero de
Cromossomos Diferente
A anlise morfomtrica tem como objetivo tambm verificar se ocorrem variaes
nas medidas de animais que possuem um nmero diferente de cromossomos. No caso
do conjunto de dados analisado nesse estudo, h apenas 3 numeraes diferentes de
cromossomos e estas possuem relao direta com os locais de coleta, ou seja, os
indivduos de Taim e Rio Grande tm 46 cromossomos, os de Alegrete tm 40 e os
indivduos dos demais locais de coleta tm 44 cromossomos. Assim, para a anlise de
variaes nas medidas de crnios em funo do nmero de cromossomos, o
procedimento seguido o mesmo utilizado para a anlise de variaes em decorrncia
do local de coleta (descrito acima) e os resultados tambm so semelhantes. Portanto, os
bilogos puderam confirmar variaes nas medidas de crnios relacionadas com o
nmero de cromossomos das amostras.

Figura 7.3: Representao do conjunto inteiro de dados morfomtricos com


locais de coleta mapeados para cor

93

Figura 7.4: Representao em Coordenadas Paralelas das amostras morfomtricas


coletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha)
7.4.4 Verificao de Variaes nas Medidas de Animais de Sexo Diferente
Um outro objetivo ainda da anlise morfomtrica avaliar o dimorfismo sexual de
uma espcie, ou seja, comparar diferenas nas formas de machos e fmeas. Os
especialistas desse estudo de caso consideraram a visualizao Coordenadas Paralelas
muito til e rpida para a avaliao do dimorfismo sexual, permitindo, inclusive,
acompanhar quais medidas apresentam maiores variaes.
Para esta avaliao, os usurios especialistas basearam-se, principalmente, na
representao da tcnica Coordenadas Paralelas com o atributo sexo mapeado para cor,
conforme mostra a figura 7.6. O mecanismo de interao Sort by foi utilizado tambm
para mudar a ordem de sobreposio das linhas na visualizao mostrada na figura.
Nesta ltima, as linhas que representam machos (cor rosa) sobrepem as linhas que
representam fmeas (cor preta), mas til inverter essa ordem a fim de visualizar
melhor a relao entre os dois grupos.
Alm da representao da figura 7.6, os especialistas observaram tambm,
separadamente, as representaes de machos e fmeas, utilizando para isto o filtro para
o atributo sexo. Eles observaram tambm as medidas de machos e fmeas de cada local
de coleta, isoladamente. Apenas a tcnica Coordenadas Paralelas foi observada para
essa tarefa.
Como resultado da anlise de dimorfismo sexual, os especialistas concluram que os
machos apresentam, em geral, medidas um pouco maiores que as fmeas da espcie. No
entanto, para algumas medidas (como D e LB), os dois grupos apresentam padres
praticamente iguais e, para outras medidas (como CC, CN, LN, LBM e LZ), h variaes
bem evidentes.

94

Figura 7.5: Representao em Matriz de Scatter Plots das amostras morfomtricas


coletadas em Pelotas (cor verde), Bag (cor azul) e Taim (cor vermelha)

Figura 7.6: Representao do conjunto inteiro de dados morfomtricos com machos


mapeados para a cor rosa e fmeas mapeadas para a cor preta

95

7.5 Comparao: Aplicao Desenvolvida x Aplicao do Domnio


A ferramenta de software utilizada atualmente pelos especialistas desse estudo de
caso para a anlise morfomtrica a NCSS (Number Cruncher Statistical System), um
sistema comercial. Com esta ferramenta, eles realizam anlises estatsticas dos dados
gerados, utilizando Funo de Anlise Cannica Discriminante (representao de
escores calculados pelo sistema) e Anlise dos Componentes Principais (representao
apenas dos componentes mais significativos do conjunto de dados, tambm
determinados pelo sistema).
As nicas representaes visuais geradas pelos especialistas com NCSS so scatter
plots e box plots, ambas representaes 2D. Como no possvel, com estas
visualizaes, observar simultaneamente todas as medidas das amostras coletadas, eles
utilizam os dois eixos disponveis do grfico 2D para representar apenas os
componentes principais dos dados ou atributos que resumem o conjunto inteiro de
medidas de uma amostra. No caso de visualizaes scatter plots, a cor e a forma das
figuras grficas so utilizadas ainda para representar outros atributos dos dados.
Para uma anlise mais segura dos dados com NCSS, necessrio criar vrios
grficos 2D, variando os atributos que so mapeados para seus eixos. A anlise do
dimorfismo sexual, por exemplo, feita atravs de scatter plots e box plots que
representam em seus eixos os componentes principais dos dados. As figuras 7.7 e 7.8
mostram alguns dos grficos gerados com NCSS, para a anlise do dimorfismo sexual e
de variaes entre localidades, respectivamente. Para a primeira anlise, so
representados e analisados apenas os componentes principais dos dados. J para a
segunda anlise, alm dos componentes principais, feita tambm a representao e
observao de discriminantes (escores).
O que importante notar a respeito destes grficos que eles fornecem apenas uma
viso geral dos dados, ou seja, representam informaes estatsticas que resumem mais
de uma medida em um nico valor. Com isto, no possvel obter informaes
detalhadas acerca dos dados, como por exemplo, os valores precisos das medidas de um
determinado crnio ou a identificao das amostras com medidas fora do padro. Alm
da desvantagem de ser necessria a criao e observao de mais de um grfico, estes
no oferecem ainda possibilidades de interao ao usurio.
A aplicao proposta nesse trabalho, por outro lado, fornece principalmente vises
detalhadas dos dados representados, permitindo a obteno das informaes que no
podem ser obtidas com a ferramenta NCSS. Tanto amostras como medidas individuais
podem ser detalhadamente acompanhadas. Informaes gerais acerca dos dados tambm
podem ser obtidas, de maneira diferenciada, porm com menor preciso quando
comparado ao sistema NCSS. Alm disso, a aplicao desenvolvida apresenta tambm
como vantagem a disponibilidade de grficos capazes de representar todos os atributos
(medidas) e amostras do conjunto de dados simultaneamente, permitindo ainda que o
usurio interaja de diversas formas com estes grficos.
Em suma, os especialistas desse estudo de caso afirmaram que a aplicao avaliada
complementar ao sistema NCSS e muito til para anlises prvias dos dados
morfomtricos. As informaes detalhadas que eles no conseguiam obter com o
sistema NCSS foram fornecidas pela aplicao descrita nesse trabalho, graas s
tcnicas de visualizao multidimensionais e seus recursos de interao.

96

Figura 7.7: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot
(direita), utilizados na anlise do dimorfismo sexual.

Figura 7.8: Grficos gerados com o sistema NCSS, scatter plot (esquerda) e box plot
(direita), utilizados na anlise de variaes por local de coleta.

7.6 Concluses
A tcnica de visualizao multidimensional que melhor auxiliou os especialistas
desse estudo na obteno das informaes desejadas foi Coordenadas Paralelas. Os
especialistas consideraram o mapeamento desta tcnica bastante claro e o nico capaz
de permitir dedues precisas e detalhadas a respeito dos dados, que era o seu principal
objetivo.
Em relao tcnica Radviz, os especialistas consideraram seu mapeamento
complicado e de difcil compreenso. Alm disso, os dados analisados nesse estudo de
caso no apresentam caractersticas adequadas para a representao com essa tcnica,
pois todos os itens de dados possuem valores com pesos semelhantes, o que faz com que
estes sejam desenhados todos muito prximos, no centro do crculo. Por estas razes, a
tcnica Radviz no contribuiu para a anlise realizada.
A tcnica Matriz de Scatter Plots, por outro lado, foi observada paralelamente
tcnica Coordenadas Paralelas e ajudou a validar informaes extradas a partir desta
ltima, como as variaes nas medidas coletadas em diferentes localidades. Alm disso,
a correlao entre atributos, representada na Matriz, demonstra claramente que todas as

97

medidas de um crnio so alomtricas, ou seja, quando uma delas aumenta, todas as


demais tambm aumentam (ver figura 7.5).
Alm das visualizaes, os recursos de interao tambm foram imprescindveis
para a anlise realizada. A obteno de muitas das informaes mencionadas nos
resultados desse estudo s foi possvel devido disponibilidade de variados recursos
interativos. Considerando todas as anlises realizadas durante esse estudo de caso, os
mecanismos de interao utilizados pelos especialistas foram: Selection (seleo
individual de itens), Filtering (filtragem principalmente por local e sexo), Color by
(mapeamento de local e sexo para cor), Sort by (alterao na ordem de desenho dos
objetos de dados) e Attributes Manipulation (remoo do atributo cromossomos das
visualizaes).
Assim, por meio das visualizaes multidimensionais e seus recursos de interao,
todas as informaes que os especialistas esperavam obter com o uso da aplicao
avaliada foram realmente encontradas.
Finalmente, em relao aplicao de visualizao como um todo, os especialistas
do estudo de caso consideraram-na muito til e gil para a anlise morfomtrica de
crnios, principalmente para anlises prvias, e descreveram sua interface como simples
e de fcil manipulao.

8 CONCLUSES

8.1 Avaliao Final


Esse trabalho apresentou um conjunto de coordenaes que podem ser aplicadas
entre visualizaes multidimensionais, e demonstrou a aplicabilidade destas em uma
nova aplicao de mltiplas visualizaes coordenadas, especfica para a representao
de dados multidimensionais. Esta aplicao foi construda a partir do toolkit de
visualizao InfoVis. Incorporou-se ao conjunto de visualizaes multidimensionais da
mesma aquelas j implementadas pelo toolkit (Coordenadas Paralelas) e acrescentou-se
outras (Radviz e Matriz de Scatter Plots). Os recursos de interao oferecidos pelo
toolkit foram estendidos para uso coordenado e alguns outros recursos adicionados.
A possibilidade de coordenar interaes atravs de mltiplas visualizaes uma
caracterstica muito til para a explorao de conjuntos de dados, pois como se sabe, as
tcnicas de visualizao existentes possuem pontos fortes e fracos diferentes entre si.
Coordenaes so especialmente teis quando se dispe de tcnicas de visualizao
complementares, ou seja, que auxiliam na percepo de informaes diferentes.
Alguns pesquisadores, como Keim (1996, 1997), Hoffman (1999) e Grinstein et al.
(2000), j compararam as representaes visuais das tcnicas Coordenadas Paralelas,
Radviz e Matriz de Scatter Plots em seus estudos de avaliao. Os mesmos
consideraram diferentes critrios (relacionados aos dados, tarefas e visualizao) e, os
resultados obtidos mostram o grau de adequao das tcnicas avaliadas para cada
critrio.
A tabela 8.1 mostra uma comparao das tcnicas Coordenadas Paralelas, Radviz e
Matriz de Scatter Plots, segundo os principais critrios considerados nos estudos de
avaliao mencionados acima. A classificao mostrada na tabela foi obtida a partir da
anlise dos resultados destes estudos, encontrados na literatura, e dos experimentos com
usurios realizados nesse trabalho. Observando essa classificao, pode-se verificar que
as visualizaes avaliadas possuem algumas caractersticas complementares, que
tornam a coordenao entre elas um recurso muito interessante.
A tcnica Coordenadas Paralelas muito til para a percepo de diversas
informaes acerca dos dados representados e h poucos critrios para os quais outras
tcnicas so mais adequadas. Coordenadas Paralelas destaca-se das demais por permitir
a melhor percepo dos valores aproximados de itens de dados e da distribuio destes
entre mltiplas dimenses. Entre as poucas fraquezas dessa tcnica esto o nmero de

99

itens de dados que podem ser mostrados efetivamente e o alto ndice de sobreposio
visual destes. Quando exibindo conjuntos de dados com muitos itens, a ocupao do
espao de tela torna-se muito densa e o grande nmero de cruzamentos e sobreposies
de linhas horizontais causam confuso visual, que impede a compreenso dos dados
representados. Devido a isto, o nmero mximo de itens de dados que podem ser
exibidos por Coordenadas Paralelas fica limitado em torno de mil itens (Keim, 1996).
No entanto, mesmo para conjuntos de dados pequenos, pode haver sobreposio de itens
e confuso visual, o que prejudica a percepo de clusters de dados.
A tcnica Radviz pode representar um grande nmero de dimenses e itens de dados
simultaneamente, sem provocar confuso visual. A mesma muito boa para a
identificao de outliers e clusters de dados, mas, por outro lado, sua representao dos
dados tambm pode ser prejudicada pela sobreposio de itens de dados. Este problema
pode ser contornado, contudo, atravs de mecanismos de interao que permitam alterar
a disposio dos atributos no layout da tcnica. A maior deficincia dessa tcnica , sem
dvida, o fato de no ser possvel estimar os valores dos itens de dados. Alm disso, os
estudos de avaliao relatados nesse trabalho mostram claramente que a tcnica Radviz
tem um aprendizado mais difcil.
A Matriz de Scatter Plots , entre as trs tcnicas avaliadas, a de mais fcil
aprendizagem. No entanto, ela possui limitaes quanto ao nmero de dimenses e itens
de dados que podem ser representados. Para visualizar adequadamente caractersticas de
um conjunto de dados com mais de 10 dimenses, necessria a utilizao de recursos
interativos. Mas, mesmo assim, no ser possvel, nestes casos, observar todas as
clulas da matriz simultaneamente. A visualizao dessa tcnica muito til para a
percepo de outliers, clusters e correlaes entre dimenses dos dados.
Tabela 8.1: Comparao das tcnicas Coordenadas Paralelas, Radviz e Matriz de Scatter
Plots segundo critrios encontrados na literatura. Os smbolos ++, +, 0, - , -correspondem excelente, bom, mdio, pobre e muito pobre (simbologia
proposta por KEIM, 1996).
Coordenadas
Paralelas

Radviz

Matriz de
Scatter Plots

++

++

Nmero de itens de dados

++

Curva de aprendizagem

++

Percepo de valores de dados

++

--

Percepo de regras, modelos

Representao de Outliers

++

++

++

Representao de Clusters

++

++

Sobreposio visual

--

Nmero de dimenses

As tcnicas Radviz e Coodenadas Paralelas mostram vises bem diferentes para um


mesmo conjunto de dados. Enquanto a primeira enfatiza a representao de
caractersticas gerais, como a distribuio dos dados em relao ao todo e a formao de
clusters, a segunda tcnica enfatiza a representao de informaes mais detalhadas,

100

como os valores de dimenses e seus intervalos. Essas tcnicas possuem pontos fortes
diferentes, sendo que uma complementa as fraquezas da outra. De um lado, Radviz
oferece pouca confuso visual e representao clara de clusters de dados, mas ela no
permite a visualizao de informaes quantitativas; por outro lado, Coordenadas
Paralelas mostra claramente valores de itens de dados e intervalos de atributos, mas
apresenta grande confuso visual (at mesmo para conjuntos de dados pequenos).
Um outro enfoque de representao dos dados fornecido ainda pela tcnica Matriz
de Scatter Plots, que possibilita que determinadas anlises dos dados sejam mais
efetivas utilizando essa tcnica do que as anteriores. Por exemplo, a Matriz de Scatter
Plots oferece a representao mais clara e fcil para a identificao de correlaes entre
quaisquer dimenses dos dados.
Com o uso de coordenaes, as possibilidades de colaborao entre essas tcnicas
aumentam consideravelmente. Por exemplo, um cluster de dados pode ser facilmente
identificado na tcnica Radviz. Com a coordenao brushing-and-linking habilitada,
selecionando, nessa tcnica, os itens que compem o cluster ir destacar os mesmos nas
outras duas visualizaes. Com isto, pode-se ento observar a representao de
Coordenadas Paralelas e verificar os valores destes itens para cada atributo. Bertini et al.
(2005) realizaram estudos de avaliao que demonstram outros ganhos com o uso
coordenado das tcnicas Radviz e Coordenadas Paralelas.
Enfim, alm de ser especfica para dados multidimensionais, a aplicao relatada
nesse trabalho apresenta ainda vrias vantagens para a explorao deste tipo de dados
em relao a outros sistemas:

Conta com um conjunto variado de coordenaes e recursos de interao: rene


coordenaes e interaes utilizadas por diversos sistemas de visualizao;

Oferece visualizaes complementares para a construo de cenrios: conforme


foi discutido nessa seo, as visualizaes multidimensionais suportadas pela
aplicao so complementares, pois cada uma delas auxilia na percepo de
informaes diferentes;

altamente flexvel: permite ao usurio escolher os dados a serem


representados, as visualizaes que formaro um cenrio de explorao e, ainda,
quais coordenaes estaro ativas e entre quais visualizaes;

construda sobre um framework de visualizao consistente e extensvel: estas


caractersticas so herdadas pela aplicao, que pode facilmente ser estendida
para incorporar novas visualizaes ou recursos.

A utilidade e eficcia da aplicao desenvolvida foram demonstradas


experimentalmente na explorao de dados multidimensionais de um domnio
especfico.

101

8.2 Trabalhos Futuros


H vrios aspectos da aplicao relatada nesse trabalho que precisam ou poderiam
ser melhorados. Entre estes, pode-se destacar:

Interface grfica:
O resultado do experimento de avaliao de usabilidade realizado com a
aplicao em questo (relatado no captulo 6) apontou diversas falhas e
problemas com a interface grfica inicial que se tinha naquele momento. Por
questes de tempo, apenas os problemas mais graves foram resolvidos aps o
experimento, restando ainda muitos melhoramentos para serem realizados. Por
exemplo, devem ser disponibilizadas opes para abrir/salvar cenrios de
explorao e recursos alternativos para a interao do usurio.

Visualizaes:
A implementao da tcnica Matriz de Scatter Plots , dentre as tcnicas de
visualizao j suportadas, aquela que mais necessita de melhoramentos. Para
aumentar a efetividade dessa tcnica na representao de conjuntos de dados
com grande nmero de dimenses ou itens de dados, interaes como o zoom
devem ser habilitadas para uso nas clulas da matriz.

Coordenaes:
No contexto das tcnicas de coordenao, poderiam ser disponibilizadas
diferentes formas de implementao para uma mesma tcnica. Por exemplo, a
filtragem de itens de dados poderia ser realizada atravs de um outro widget
grfico que no uma slider bar. Da mesma forma, o brushing-and-linking
poderia ser ativado tambm apenas pela passagem do mouse sobre um item de
dado, sem necessitar da seleo.

Alm disso, para aumentar a efetividade da aplicao na explorao dos mais


diversos conjuntos de dados multidimensionais, pretende-se, futuramente, ampliar o
conjunto de visualizaes suportadas (acrescentando tcnicas iconogrficas e orientadas
a pixel) e de interaes.
Finalmente, vale ressaltar que a aplicao aqui desenvolvida vem sendo (e continuar
a ser) usada em trabalho de definio de uma taxonomia de tarefas de visualizao
(VALIATI; PIMENTA; FREITAS, 2006) para permitir a definio de cenrios de
avaliao de usabilidade de tcnicas de visualizao. Espera-se que a aplicao venha a
ser um dos componentes de um sistema de avaliao de usabilidade de tcnicas de
visualizao.

REFERNCIAS

AHLBERG, C.; WILLIAMSON, C.; SHNEIDERMAN, B. Dynamic Queries for


Information Exploration: An Implementation and Evaluation. In: HUMAN FACTORS
IN COMPUTING SYSTEMS, CHI, 1992. Proceedings... Monterey, CA:
ACM/SIGCHI, 1992.
AHLBERG, C.; SHNEIDERMAN, B. Visual Information Seeking: Tight Coupling of
Dynamic Query Filters with Starfield Displays. In: HUMAN FACTORS IN
COMPUTING SYSTEMS, CHI, 1994. Proceedings... [S.l.:s.n.], 1994.
AHLBERG, C.; WISTRAND, E. IVEE: An Information Visualization and Exploration
Environment. In: IEEE INFORMATION VISUALIZATION, 1995. Proceedings...
[S.l.:s.n.], 1995.
ALPERN, B.; CARTER, L. Hyperbox. In: IEEE VISUALIZATION, 1991.
Proceedings... San Diego, California: [s.n.], 1991.
ASIMOV, D. The Grand Tour: A Tool for Viewing Multidimensional Data. SIAM
Journal of Science & Stat. Comp., [S.l.], v. 6, p. 128-143, 1985.
BALDONADO, M. Q.; WOODRUFF, W. A.; KUCHINSKY, A. Guidelines for Using
Multiple Views in Information Visualization. In: ADVANCED VISUAL
INTERFACES, AVI, 2000. Proceedings... [S.l.:s.n.], 2000.
BALL, T.; EICK, S. Software Visualization in the Large. IEEE Computer, [S.l.], v.
29, n. 4, p. 33-43, Apr. 1996.
BASTIEN, C.; SCAPIN, D. Ergonomic Criteria for the Evaluation of HumanComputer Interfaces. [S.l.]: INRIA, 1993. (RT n. 156).
BERTIN, J. Semiology of Graphics. Madison, WI: The University of Wisconsin Press,
1983.
BERTINI, E.; AQUILA, L. D.; SANTUCCI, G. SpringView: Cooperation of Radviz
and Parallel Coordinates for View Optimization and Clutter Reduction. In:
INTERNATIONAL CONFERENCE ON COORDINATED & MULTIPLE VIEWS IN
EXPLORATORY VISUALIZATION, CMV, 2005. Proceedings... [S.l.:s.n.], 2005.
BIER, E. A. et al. Toolglass and Magic Lenses: The See-Through Interface. In:
SIGGRAPH, 1993. Proceedings... Anaheim, CA: [s.n], 1993.

103

BOUKHELIFA, N.; ROBERTS, J. C.; RODGERS, P. J. A Coordination Model for


Exploratory Multi-View Visualization. In: INTERNATIONAL CONFERENCE ON
COORDINATED & MULTIPLE VIEWS IN EXPLORATORY VISUALIZATION,
CMV, 2003. Proceedings... London, England: [s.n.], 2003.
BRODBECK, D.; GIRARDIN, L. Design Study: Using Multiple Coordinated Views to
Analyse Geo-referenced High-dimensional Datasets. In: COORDINATED &
MULTIPLE VIEWS IN EXPLORATORY VISUALIZATION, CMV, 2003.
Proceedings... [S.l.:s.n.], 2003.
CARD, S. K.; MACKINLAY, J. D.; SHNEIDERMAN B. Readings in Information
Visualization: Using Vision to Think. San Francisco, California: Morgan Kaufmann
Publishers, 1999.
CARPENDALE, M. S. T.; MONTAGNESE, C. A. Framework for Unifying
Presentation Space. In: ACM SYMPOSIUM ON USER INTERFACE SOFTWARE
AND TECHNOLOGY, 2001. Proceedings... Orlando, Florida: [s.n.], 2001.
CHERNOFF, H. The Use of Faces to Represent Points in k-Dimensional Space
Graphically. Journal Amer. Statistical Association, [S.l.], v. 68, p. 361-368, 1973.
CHI, E. H. et al. A Spreadsheet Approach to Information Visualization. In: IEEE
INFORMATION VISUALIZATION, 1997. Proceedings... [S.l.:s.n.], 1997.
CHIMERA, R. et al. An Exploratory Evaluation of Three Interfaces for Browsing Large
Hierarchical Tables of Contents. ACM Transactions on Information Systems, New
York, v. 12, n. 4, p. 383-406, 1994.
EICK, S; WILLS, G. High Interaction Graphics. European Journal of Operations
Research, [S.l.], p. 445-459, 1995.
EICK, S. G.; KARR, A. F. Visual Scalability. USA: National Institute of Statistical
Sciences (NISS), 2000. (TR - 106).
FAYYAD, U.; GRINSTEIN, G. G.; WIERSE, A. Information Visualization in Data
Mininig and Knowledge Discovery. San Francisco: Academic Press, 2002.
FEKETE, J. D. The InfoVis Toolkit Manual. 2002. Disponvel
<http://www.lri.fr/~fekete/InfovisToolkit/manual.html>. Acesso em: abr. 2006.

em:

FEKETE, J. D. The InfoVis Toolkit. [S.l.]: INRIA Futurs, 2003. (RR - 4818).
FEKETE, J. D. The InfoVis Toolkit. In: IEEE SYMPOSIUM ON INFORMATION
VISUALIZATION, InfoVis, 2004. Proceedings... [S.l.]: IEEE Press, 2004.
FISHKIN, K.; STONE, M. C. Enhanced Dynamic Queries Via Movable Filters. In:
HUMAN FACTORS IN COMPUTING SYSTEMS, CHI, 1995. Proceedings... Denver,
CO: [s.n.], 1995.
FREDRIKSON, A. et al. Temporal, Geographical and Categorical Aggregations
Viewed through Coordinated Displays: A Case Study with Highway Incident Data. In:
WORKSHOP ON NEW PARADIGMS IN INFORMATION VISUALIZATION AND
MANIPULATION, ACM CIKM, 1999. Proceedings... [S.l.:s.n.], 1999.

104

GAHEGAN, M. et al. GeoVISTA Studio: A Geocomputational Workbench. In:


INTERNATIONAL CONFERENCE ON GEOCOMPUTATION, 2000. Proceedings...
[S.l.:s.n.], 2000.
GAMMA, E. et al. Design Patterns: Elements of Reusable Object-Oriented Software.
[S.l.]: Addison-Wesley, 1995.
GOLDSTEIN, J.; ROTH, S. F. Using Aggregation and Dynamic Queries for Exploring
Large Data Sets. In: HUMAN FACTORS IN COMPUTING SYSTEMS, CHI, 1994.
Proceedings... [S.l.:s.n.], 1994.
GRINSTEIN, G. et al. Benchmark Development for the Evaluation of Visualization for
Data Mining. In: FAYYAD, U. M.; GRINSTEIN, G. G.; WIERSE, A. (Ed.).
Information Visualization in Data Mining and Knowledge Discovery. San
Francisco: Morgan-Kaufmann Publishers, 2000.
HOFFMAN, P. E. et al. DNA Visual and Analytic Data Mining. In: IEEE
VISUALIZATION, 1997. Proceedings... Phoenix, AZ: [s.n.], 1997.
HOFFMAN, P. E. Table Visualization: A Formal Model and Its Applications. 1999.
Tese (Doutorado) - Computer Science Dept., University of Massachusetts at Lowell.
HOFFMAN, P.; GRINSTEIN, G.; PINKNEY, D. Dimensional Anchors: A Graphic
Primitive for Multidimensional Multivariate Information Visualizations. New York:
ACM Press, 2000.
INSELBERG, A. The Plane with Parallel Coordinates. The Visual Computer, New
York, v. 1, p. 69-91, 1985. Special Issue on Computational Geometry.
INSELBERG, A.; DIMSDALE, B. Parallel Coordinates: A Tool for Visualizing
Multidimensional Geometry. In: IEEE VISUALIZATION, 1990. Proceedings...
[S.l.:s.n.], 1990.
JACOBSON, A.; BERKIN, A.; ORTON, M. LinkWinds: Interactive Scientific Data
Analysis and Visualization. Communications of the ACM, New York, v. 37, n. 4, p.
43-52, Apr. 1994.
KANDOGAN, E.; SHNEIDERMAN, B. Elastic Windows: Evaluation of MultiWindow Operations. In: ACM CHI, 1997. Proceedings... [S.l.:s.n.], 1997.
KEIM, D. A. Visualization Techniques for Mining Large Database: A Comparation.
Transactions on Knowledge and Data Engineering, New York, v. 8, n. 6, 1996.
KEIM, D. A. Visual Database Exploration Techniques. In: INTERNATIONAL
CONFERENCE IN KNOWLEDGE DISCOVERY AND DATA MINING, KDD, 1997.
Tutorial. [S.l.:s.n.], 1997.
KEIM, D. A. Information Visualization and Visual Data Mining. IEEE Transactions
on Visualization and Computer Graphics, [S.l.], v. 7, n. 1, Jan./Mar. 2002.
KOBSA, A. An Empirical Comparison of Three Commercial Information Visualization
Systems. In: IEEE SYMPOSIUM ON INFORMATION VISUALIZATION, InfoVis,
2001. Proceedings... San Diego, CA: [s.n.], 2001.

105

KOSSLYN, S. M. Elements of Graph Design. New York: Freeman and Company,


1994.
KUMAR, H.; PLAISANT, C.; SHNEIDERMAN, B. Browsing Hierarchical Data with
Multi-Level Dynamic Queries and Pruning. International Journal of Human
Computer Studies, [S.l.], v. 46, n. 1, p. 103-124, 1997.
LIVNY, M. et al. DEVise: Integrated Querying and Visual Exploration of Large
Datasets. In: ACM SIGMOD, 1997. Proceedings... [S.l.:s.n.], 1997.
LOHNINGER, H.; INSPECT. A Program System to Visualize and Interpret
Chemical Data. 1994. Disponvel em: <http://qspr03.tuwien.ac.at/lo/>. Acesso em:
mar. 2006.
MARTIN, A.; WARD, M. High Dimensional Brushing for Interactive Exploration of
Multivariate Data. In: VISUALIZATION, 1995. Proceedings... [S.l.:s.n.], 1995.
NORTH, C.; SHNEIDERMAN, B. A Taxonomy of Multiple-Window Coordination.
[S.l.]: University of Maryland Computer Science Dept., 1997. (Technical Report #CSTR-3854).
NORTH, C. A User Interface for Coordinating Visualizations Based on Relational
Schemata: Snap-Together Visualization. 2000. Tese (Doutorado) - Computer Science
Department, University of Maryland.
NORTH, C.; SHNEIDERMAN, B. Snap-Together Visualization: Can Users
Construct and Operate Coordinated Views?. 2000. Computer Science Dept,
University of Maryland.
OLIVEIRA, M. C. F.; LEVKOWITZ, H. From Visual Data Exploration to Visual Data
Mininig: A survey. IEEE Transactions on Visualization and Computer Graphics,
[S.l.], v. 9, n. 3, July-Sept. 2003.
PATTISON, T.; PHILLIPS, M. View Coordination Architecture for Information
Visualisation.
In:
AUSTRALIAN
SYMPOSIUM
ON
INFORMATION
VISUALISATION, 2001. Proceedings... Sydney: [s.n.], 2001.
PENG, W.; WARD, M. O.; RUNDENSTEINER, E. A. Clutter Reduction in MultiDimensional Data Visualization Using Dimension. In: IEEE SYMPOSIUM ON
INFORMATION VISUALIZATION, InfoVis, 2004. Proceedings... [S.l.]: IEEE Press,
2004.
PILLAT, R. M.; VALIATI, E.; FREITAS, C. M. D. S. Experimental Study on
Evaluation of Multidimensional Information Visualization Techniques. In: LATIN
AMERICAN CONFERENCE ON HUMAN-COMPUTER INTERACTION, CLIHC,
2005. Proceedings... Cuernavaca, Mxico: [s.n.], 2005.
PILLAT, R. M.; FREITAS, C. M. D. S. Coordinating Views in the InfoVis Toolkit. In:
ADVANCED VISUAL INTERFACES, AVI, 2006. Proceedings... Veneza, Itlia:
[s.n.], 2006.
RAO, R.; CARD, S. K. The Table Lens: Merging Graphical and Symbolic
Representations in an Interactive Focus + Context Visualization for Tabular

106

Information. In: HUMAN FACTORS IN COMPUTING SYSTEMS, CHI, 1994.


Proceedings... Boston: ACM Press, 1994.
ROBERTS, J. C. Exploratory Visualization with Multiple Linked Views. In:
EXPLORING GEOVISUALIZATION, 2004. Proceedings... Oxford: Elsevier, 2004.
ROTH, S. et al. Visage: A User Interface Enrironment for Exploring Information. In:
IEEE INFORMATION VISUALIZATION, 1996. Proceedings... [S.l.:s.n.], 1996.
RUNDENSTEINER, E. A. et al. XmdvTool: Visual Interactive Data Exploration and
Trend Discovery of High-dimensional Data Sets. In: ACM SIGMOD CONFERENCE,
2002. Proceedings... Wisconsin: [s.n.], 2002.
SHAW, M.; GARLAN, D. Software Architecture: Perspectives on an Emerging
Discipline. Upper Sadle River: Prentice Hall, 1996.
SHIMABUKURO, M. H. Visualizaes Temporais em uma Plataforma de Software
Extensvel e Adaptvel. 2004. Tese (doutorado) - Instituto de Cincias Matemticas e
de Computao, Universidade de So Paulo (USP), So Paulo.
SHNEIDERMAN, B. Dynamic Queries for Visual Information Seeking. IEEE
Software, Los Alamitos, v. 11, n. 6, Nov. 1994.
SPENCE, R. Information Visualization. Harlow: Addison-Wesley, 2001.
STOLTE, C.; HANRAHAN, P. Polaris: A System for Query, Analysis and
Visualization of Multi-dimensional Relational Databases. In: IEEE SYMPOSIUM ON
INFORMATION VISUALIZATION, 2001. Proceedings... [S.l.:s.n.], 2001.
VALIATI, E. Avaliao de Tcnicas de Visualizao de Informaes
Multidimensionais. 2004. Trabalho Individual (Mestrado em Cincia da Computao)
Instituto de Informtica, UFRGS, Porto Alegre.
VALIATI, E.; PIMENTA, M.; FREITAS, C. D. S. A Taxonomy of Tasks for Guiding
the Evaluation of Multidimensional Visualizations. In: BEYOND TIME AND
ERRORS:
NOVEL
EVALUATION
METHODS
FOR
INFORMATION
VISUALIZATION, BELIV; AVI, 2006. Proceedings... Veneza: [s.n.], 2006.
VAN WIJK, J.J.; VAN LIERE, R. HyperSlice. In: IEEE VISUALIZATION, 1993.
Proceedings... Los Alamitos: IEEE Computer Society Press, 1993.
WARD, M. Xmdvtool: Integrating Multiple Methods for Visualizing Multivariate Data.
In: VISUALIZATION, 1994. Proceedings... [S.l.:s.n.], 1994.
WEAVER, C. Building Highly-coordinated Visualizations in Improvise. In: IEEE
SYMPOSIUM ON INFORMATION VISUALIZATION, 2004. Proceedings... Austin,
TX: [s.n.], 2004.
YANG, J. et al. Interactive Hierarchical Dimension Ordering, Spacing and Filtering for
Exploration of High Dimensional Datasets. In: IEEE SYMPOSIUM ON
INFORMATION VISUALIZATION, 2003. Proceedings... [S.l.:s.n.], 2003.

Вам также может понравиться