Aula 16 PDF

Informática para PF (Teoria e Exercícios Comentados)
Turma: 30 – Foco: Banca CESPE/UnB

Aula 16 – Tópicos Diversos - Profa. Patrícia Quintão
AULA 16
INFORMÁTICA P/POLÍCIA
FEDERAL
Mineração de Dados, Sistemas de Informação e
Tópicos Relacionados
Professora Patrícia Quintão
www.pontodosconcursos.com.br
www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 1

Aula 16 – Noções de Mineração de Dados, Sistemas de

Informação e Tópicos Relacionados
Saudações querido(a)s amigo(a)s!
É sempre um prazer fazer parte dessa trajetória de muito sucesso com todos
vocês!
Pense POSITIVO E FORÇA nos estudos! Rumo então à aula 16. Espero que
estejam aproveitando todo o curso! Grande abraço,

Sumário
Data Mining (Mineração de Dados) e Tópicos Relacionados... 4
Sistema ............................................................................... 33
Sistema de Informação? ...................................................... 33
Atividades Básicas de um Sistema de Informação ............... 36
Integração da Dimensão Tecnológica com a Dimensão
Cultural, Política e Organizacional ....................................... 38
Componentes de um Sistema de Informação ....................... 40
Tipos de Sistemas de Informação em Ambiente Empresarial
............................................................................................ 41
Processo de Software .......................................................... 55
Fases e etapas de sistema de informação ............................ 52
Noções Sobre o Processo de Desenvolvimento de Software:
Análise, Projeto, Implementação, Teste, Implantação........ 66
Memorex ............................................................................. 84
Questões de Provas Comentadas ......................................... 89
Considerações Finais ......................................................... 117
Referências Bibliográficas ................................................. 117
Lista de Questões Apresentadas na Aula ........................... 119
Gabarito ............................................................................ 129
Acompanhe a Evolução do seu Aproveitamento ................. 130

Data Mining (Mineração de Dados) e Tópicos Relacionados
1. O Contexto Atual
De 1990 em diante o volume de informações armazenadas em meio

eletrônico cresceu aceleradamente. Estudos mostram que a quantidade de
informação no mundo dobra a cada 20 meses, e, como consequência, o
tamanho e a quantidade de banco de dados espalhados pelo mundo cresce
ainda mais aceleradamente.
Figura. O Tsunami de Dados, O Que é e Como nos Afeta?
“Estamos nos afogando em informação mas com sede de

conhecimento” – John Naisbitt, Megatrends (1984).

E que valor tem esses dados armazenados? Por que tanta informação
precisa ser mantida de modo cumulativo e não é simplesmente descartada
pouco tempo depois do seu uso?
O fato é que nesse meio há um amontoado de dados que estão gravados

nos bancos de dados e, também, há muita informação não explorada, que
poderia ser de grande valia para o suporte às decisões nas grandes
corporações, governos, universidades e outros.
Há nesse “enxame” de dados, tidos como desnecessários por alguns,

padrões e tendências que se descobertos podem ser úteis para entender
e otimizar os processos de negócio em empresas, ajudar a entender melhor os
resultados de experiências científicas, colaborar com a medicina no
entendimento e tratamento de casos de epidemias, e muitos outros.
É justamente nesse cenário que entra em cena o Data Mining

(Mineração de Dados). Pode ser entendido como um campo de estudo que
procura encontrar informações que estão implícitas, ou seja, procura
padrões e tendências ocultas em base de dados.
Um exemplo de Data Mining muito comum são as previsões

meteorológicas, em que é utilizado como forma de prever as alterações
climáticas. Para tanto, são analisados os registros climáticos dos últimos 10 a
20 anos e procura-se identificar os padrões de alterações climáticas nesses
períodos, a fim de se conseguir prever as próximas alterações. Assim, o
Data Mining exerce a função de identificar padrões e tendências
meteorológicas.
Esse novo campo de estudos que é o Data Mining é tido como crítico
para os negócios das grandes empresas e continua a crescer, uma vez que o
uso das informações obtidas através de mineração de dados tornou-se
imprescindível para a sustentação da competitividade no ambiente comercial
dos dias de hoje.
E também, alia-se a isso, o fato de que com o armazenamento de grandes

quantidades de dados num local comum e, também, o contínuo avanço da
capacidade de processamento dos computadores, os empresários passaram a
procurar por tecnologias para extração de informação útil em meio aos
infindáveis amontoados de dados.
2. Motivos que Potencializam o Uso do Data Mining
• O volume de dados disponível atualmente é enorme.
• Os dados estão sendo organizados.
• Os recursos computacionais estão cada vez mais potentes.

• A competição empresarial exige técnicas mais modernas de decisão.
• Programas comerciais de mineração de dados já podem ser adquiridos.
3. Quando a Mineração de Dados é mais indicada?
Hoje praticamente não existe nenhuma área de conhecimento em que

técnicas de data mining não possam ser usadas. Entretanto existem áreas nas
quais o uso tem sido mais frequente, como por exemplo:
• Marketing: redução dos custos com o envio de correspondências através

de sistemas de mala direta a partir da identificação de grupos de clientes
potenciais;
• Detecção de fraude: reclamações indevidas de seguro, chamadas

clonadas de telefones celulares, compras fraudulentas com cartão de
crédito.
o Atualmente, em telecomunicações, existe uma explosão de crimes
contra a telefonia celular, dentre os quais, a clonagem. Técnicas
de data mining podem ser utilizadas para detectar hábitos dos
usuários de celulares. Quando um telefonema for feito e
considerado pelo sistema como uma exceção, o programa faz uma
chamada para confirmar se foi ou não uma tentativa de fraude.
• Produção: empresas desenvolvem sistemas para detectar e diagnosticar

erros na fabricação de produtos. Estas falhas são normalmente agrupadas
por técnicas de Análise de Agrupamentos.
• Previsões meteorológicas: utilizado como forma de prever as
alterações climáticas. Para tanto, são analisados os registros climáticos
dos últimos 10 a 20 anos e procura-se identificar os padrões de
alterações climáticas nesses períodos, a fim de se conseguir prever as
próximas alterações. Assim, o Data Mining exerce a função de
identificar padrões e tendências meteorológicas.
As áreas em que as aplicações de mineração de dados são mais bem

sucedidas possuem estas características:
• exigem decisões baseadas em conhecimento;
• possuem um ambiente em mudança constante;
• possuem dados acessíveis, suficientes e relevantes;
• fornece um retorno significativo para decisões corretas.

4. O Processo de Descoberta de Conhecimento em Base de Dados (KDD

- Knowledge Discovery in Databases)
Descoberta de Conhecimento em Base de Dados (KDD):
• “é o processo não trivial de identificação de padrões/modelos em dados

que sejam válidos, novos, potencialmente úteis e compreensíveis
[FPS96]” ;
• “é uma tarefa cujo uso de conhecimento é intensivo, consistindo de
complexas interações, prolongadas no tempo, entre uma pessoa e um banco
de dados, possivelmente suportada por um conjunto heterogêneo de
ferramentas” [Brachman 96].
KDD é pluridisciplinar pois envolve banco de dados, técnicas de

estatísticas, redes neurais, de aprendizado de máquinas, de reconhecimento de
padrões e de visualização de dados.
A figura seguinte ilustra o processo de KDD proposto por Usama Fayyad,

Gregory Piatetsky-Shapiro e Padhraic Smyth (1996).
Figura. Processo de KDD. Adaptação da proposta realizada por Usama

Fayyad, Gregory Piatetsky-Shapiro e Padhraic Smyth (1996)

O processo de KDD é interativo (pois o usuário pode intervir e

controlar o curso das atividades) e iterativo (por ser uma sequência
finita de operações em que o resultado de cada uma é dependente dos
resultados das que a precedem), com os passos listados a seguir:
1. entendimento do domínio da aplicação e identificação do objetivo do

processo de KDD;
2. seleção: criação de um conjunto-alvo de dados;
5. pré-processamento: limpeza de dados e operações básicas como remoção

de ruído, tratamento para a falta de dados, etc. É o passo mais trabalhoso e
demorado do processo de KDD.
Algumas técnicas de pré-processamento conhecidas são:

• análise de outliers (registros que apresentam grande discrepância em
relação à maioria dos registros). A figura seguinte identifica visualmente a
presença de outliers, em que os pontos externos aos polígonos são valores
fora dos padrões da população observada.
Figura. Detecção de Outliers utilizando uma abordagem visual.

Fonte: ftp://obaluae.inf.puc-rio.br/pub/docs/techreports/02_10_cortes.pdf
• remoção de ruídos ou dados espúrios (dados medidos errados);

• estimativa de dados faltantes por modelagem;
• formatação dos dados para a ferramenta específica;
• criação de atributos derivados e de novos registros;
• integração de tabelas;
• discretização de dados numéricos;

4. transformação: encontrar características úteis para representar os dados,

conforme o objetivo definido e realizar a redução ou transformação da
dimensionalidade;
5. mineração de dados (Data Mining): casar os objetivos do processo de

KDD com um método particular de mineração de dados e realizar a análise
exploratória e seleção de modelo e hipótese, buscando padrões de interesse;
6. interpretação: interpretar e avaliar os padrões minerados, podendo

retornar a passos anteriores caso seja necessário;
7. agir a partir do conhecimento descoberto.
Fayyad et al. (1996) destaca o processo de descoberta de conhecimento

de forma mais simplificada, baseada em três etapas: Preparação, Data
Mining e Análise de Dados.
Figura. Etapas do Processo de Descoberta de Conhecimento
Vejamos cada uma delas:
• Preparação: é a etapa que trata de preparar os dados antes de serem

submetidos às técnicas de Data Mining. Nessa etapa, os dados são
selecionados (Quais dados são importantes?), purificados (retirar as

inconsistências e incompletude de dados) e pré-processados

(reapresentá-los de uma forma adequada para o processo de Data Mining).
Esse passo é executado sob a supervisão de um especialista, pois é

necessária a colaboração de uma pessoa apta para definir quais dados são
relevantes e também para definir o que fazer com os dados antes de
utilizá-los no Data Mining.
• Data Mining: é a etapa em que os dados preparados são processados, em

que se faz a mineração dos dados propriamente dita.
O principal objetivo desse passo é transformar os dados de uma maneira

que permita a identificação mais fácil de informações importantes.
O que se tenta fazer nessa etapa é identificar padrões de

comportamento, por exemplo, pode ser verificado que 75% dos clientes de
um supermercado que compram um produto X também compram um
produto Y. Essa informação pode levar as empresas a criarem novos planos
de marketing em cima dos produtos X e Y.
Portanto, esses padrões e associações, vão compor o conhecimento da

empresa sobre o negócio em que atua, ajudando-a a obter maiores lucros e
aumentar a satisfação de seus clientes.
O Data Mining é uma etapa do KDD em que são aplicadas técnicas

para identificação de padrões sobre os dados disponíveis. Tais dados
estão disponíveis em meios digitais, e comumente são trabalhados os dados
que estão em bases de dados.
Esse processo como um todo tem o intuito de trabalhar os dados

registrados ao longo do tempo de vida de um negócio a fim de se
identificar padrões que representam alguma informação sobre o
comportamento do negócio. E em função dessas informações busca-se
identificar conhecimento que possa conduzir a melhores decisões sobre o
negócio. Esse processo de Descoberta de Conhecimento sendo
repetido continuamente resultará em sabedoria sobre o domínio de
negócio para os tomadores de decisões.
• Análise de Dados: aqui o resultado do Data Mining é avaliado, com o

objetivo de determinar se algum conhecimento adicional foi descoberto,
assim como definir a importância dos fatos gerados.
Nessa etapa, várias formas de análise podem ser utilizadas, por exemplo: o
resultado do Data Mining pode ser expresso em um gráfico, em que análise
dos dados passa a ser uma análise do comportamento do gráfico.

O processo de KDD segundo outros autores, como Terra (2000) pode ser
visto a seguir:
Figura. Proposta de processo de KDD (TERRA, 2000)
Em outra visão (Cavalcanti, 2012), tem-se a figura seguinte.
Figura. Fonte: Cavalcanti (2012)
6. Abordagens do Pré-processamento de Dados
• Agregação: combinar dois ou mais objetos em um único.
• Amostragem: selecionar um subconjunto dos objetos de dados a serem

analisados.

• Redução de dimensionalidade: diminuir o número de atributos para

facilitar a análise (uso de técnicas de álgebra linear).
• Seleção de subconjuntos de recursos: eliminar características

irrelevantes ou redundantes (senso comum).
• Criação de recursos (características): criar, a partir dos originais, um

novo conjunto de atributos que capture as informações importantes em
um conjunto de dados muito mais eficazmente (extrair faces de uma
foto).
• Discretização e binarização: categorizar atributos para facilitar o uso

de algoritmos de classificação.
• Transformação de variáveis: transformar atributos ou variáveis, por

exemplo, uso do valor absoluto.
7. Fases da Mineração de Dados com Foco no CRISP-DM
Em 1996, um conjunto de três empresas especializadas no mercado de

Data Mining, desenvolveram um modelo de processos genéricos, com o intuito
de padronizar as etapas do processo de mineração de dados, dando início
ao projeto CRISP-DM (CRoss Industry Standard Process for Data Mining
- Processo Padrão Inter-Indústrias para Mineração de Dados) (The
CRISP-DM Consortium, 2000).
Esse modelo de processo de mineração de dados industrial e livre

de ferramenta propõe uma visão geral do ciclo de vida de um projeto de
mineração de dados. Ele contém as fases correspondentes de um projeto,
suas respectivas tarefas e relacionamentos entre essas tarefas.
Na figura seguinte é mostrado o ciclo de vida de um projeto de

mineração de dados, que consiste de 6 (seis) fases.
A sequência dessas fases NÃO é obrigatória, ocorrendo a transição para

diferentes fases, dependendo do resultado de cada fase, e que etapa particular

de cada fase precisa ser executada em seguida. As setas indicam as mais

importantes e mais frequentes dependências entre as fases.
O ciclo externo na figura simboliza o ciclo natural da mineração de

dados. Um processo de mineração de dados continua após a solução ter sido
desenvolvida. Processos subsequentes se beneficiarão das experiências de
processos anteriores.
Figura - Fases do CRISP-DM Process Model (Baseado em [The

CRISP-DM Consortium, 2000])
A seguir, destacamos uma síntese das etapas pertencentes ao modelo

CRISP (The CRISPDM Consortium, 2000):
1 Entendimento do Negócio (Business Understanding)
Essa fase inicial tem o foco no entendimento do negócio que visa

obter conhecimento sobre os objetivos do negócio e seus requisitos, e então

converter esse conhecimento em uma definição de um problema de mineração

de dados, e um plano preliminar designado para alcançar esses objetivos.
2 Seleção dos Dados (Data Understanding)
Consiste no entendimento dos dados, que visa à familiarização com o

banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados
"modelo".
Uma vez definido o domínio sobre o qual se pretende executar o

processo de descoberta, o próximo passo é selecionar e coletar o conjunto de
dados ou variáveis necessárias. Essa fase se inicia com uma coleta inicial de
dados, e com procedimentos e atividades visando a familiarização com os
dados, para identificar possíveis problemas de qualidade, ou detectar
subconjuntos interessantes para formar hipóteses.
3 Limpeza dos Dados (Data Preparation)
A fase de limpeza dos dados consiste na preparação dos dados que

visa a limpeza, transformação, integração e formatação dos dados da
etapa anterior. É a atividade pela qual os ruídos, dados estranhos ou
inconsistentes são tratados.
Esta fase abrange todas as atividades para construir o conjunto de dados

final (dados que serão alimentados nas ferramentas de mineração), a partir do
conjunto de dados inicial.
A utilização de Data Warehouses facilita muito esta etapa do processo de

mineração de dados, que costuma ser a fase que exige mais esforço,
correspondendo geralmente a mais de 50% do trabalho. Por isso, é muito
importante que a organização possua em seus processos habituais boas
práticas da administração de dados, como o Data Cleansing, que é uma parte
fundamental da cadeia da administração da informação, responsável pelas
etapas de detecção, validação e correção de erros em bases de dados
(Chapman, 2005).
4 Modelagem dos Dados (Modeling)
Fase que consiste na modelagem dos dados, a qual visa a aplicação

de técnicas de modelagem sobre o conjunto de dados preparado na etapa
anterior. Nessa fase, várias técnicas de modelagem são selecionadas e
aplicadas, e seus parâmetros são calibrados para se obter valores otimizados.

Geralmente, existem várias técnicas para o mesmo tipo de problema de

mineração.
Algumas técnicas possuem requerimentos específicos na forma dos dados.

Consequentemente, voltar para a etapa de preparação de dados é
frequentemente necessário. A maioria das técnicas de mineração de dados são
baseadas em conceitos de aprendizagem de máquina, reconhecimento de
padrões, estatística, classificação e clusterização.
5 Avaliação do processo (Evaluation)
A avaliação do processo visa garantir que o modelo gerado atenda às

expectativas da organização. Os resultados do processo de descoberta do
conhecimento podem ser mostrados de diversas formas. Porém, estas formas
devem possibilitar uma análise criteriosa para identificar a necessidade de
retornar a qualquer um dos estágios anteriores do processo de mineração.
Nesta etapa se construiu um modelo que parece de alta qualidade, de

uma perspectiva da análise de dados. Antes de prosseguir, é importante avaliar
mais detalhadamente o modelo, e rever as etapas executadas para construir o
modelo, para se certificar de que ele conseguirá alcançar os objetivos de
negócio. Deve se determinar se houve algum importante objetivo do negócio
que não foi suficientemente alcançado. No fim desta fase, uma decisão sobre o
uso dos resultados da mineração deve ser tomada.
6 Execução (Deployment)
Esta fase consiste na definição das fases de implantação do projeto

de Mineração de Dados. A criação do modelo não é o fim do projeto. Mesmo
se a finalidade do modelo for apenas aumentar o conhecimento dos dados, o
conhecimento ganho necessitará ser organizado e apresentado em uma
maneira que o cliente possa usar.
Dependendo das exigências, a fase de execução pode ser tão simples

quanto a geração de um relatório, ou tão complexo quanto executar processos
de mineração de dados repetidamente. Em muitos casos será o cliente, não o
analista dos dados, que realizará as etapas da execução. Entretanto, mesmo se
o analista não se encarregar da execução é importante que ele faça o cliente
compreender que medidas deverão ser tomadas a fim de empregar
efetivamente os modelos criados.
Destacamos na tabela seguinte uma visão geral das fases do

CRISP-DM (Elaboração própria), para melhor fixação desse assunto! Vamos lá!

(1) Entendimento Foco no entendimento do negócio que visa obter

do Negócio conhecimento sobre os objetivos do negócio e seus
requisitos.
(Business
Understanding)
(2) Seleção dos Consiste no entendimento dos dados, que visa à

Dados familiarização com o banco de dados pelo grupo de
projeto, utilizando-se de conjuntos de dados
(Data Understanding) "modelo".
(3) Limpeza dos Fase de preparação de dados, que consiste na

Dados preparação dos dados buscando a limpeza, a
transformação, a integração e a formatação dos
(Data Preparation) dados da etapa anterior.
(4) Modelagem dos Fase que consiste na modelagem dos dados, a

Dados qual visa à aplicação de técnicas de modelagem
sobre o conjunto de dados preparado na etapa
(Modeling) anterior.
Técnicas são baseadas em conceitos de:

aprendizagem de máquina; reconhecimento de
padrões; estatística; clusterização, ...
(5) Avaliação Visa garantir que o modelo gerado atenda às

do expectativas da organização. Os resultados do
processo processo de descoberta do conhecimento podem ser
mostrados de diversas formas.
(Evaluation)
(6) Execução Esta fase consiste na definição das fases de

implantação do projeto de Mineração de Dados.
(Deployment)
Figura – Visão Geral das Fases do CRISP-DM Process Model
(Elaboração Própria)
CRISP-DM: modelo de processo de Mineração de Dados, não

proprietário, com o objetivo de guiar os esforços de Data Mining nas
organizações.

Como uma metodologia, inclui descrições de fases típicas de um projeto, as

tarefas envolvidas em cada fase, e uma explicação dos relacionamentos entre
essas tarefas; como um modelo de processos, provê uma visão do ciclo de
vida do Data Mining. O ciclo de vida consiste em 6 (seis) fases com setas
indicando as dependências mais importantes e frequentes entre fases. A
sequência entre as fases não é restrita.
O CRISP-DM, essencialmente, é um modelo de quatro níveis,

movendo-se do mais genérico (as fases),
passando por tarefas genéricas,
realizando o mapeamento em tarefas especializadas e
instâncias de processo.

8. Data Mining (ou Mineração de Dados): Conceituação e Características
Nos seus primeiros anos o Data Mining foi popularmente tratado como
sinônimo de Descoberta de Conhecimento em Base de Dados (da sigla em
inglês KDD - Knowledge Discovery in Databases).
Mas na visão de muitos pesquisadores Data Mining deve ser entendido

como um passo da descoberta de conhecimento, independentemente se
será sobre uma base de dados ou sobre quaisquer outros repositórios
de conhecimento.
O Data Mining (Mineração de Dados) é entendido como o processo

de identificar informações relevantes, tais como padrões, associações,
mudanças, anomalias e estruturas, em grandes conglomerados de
dados que estejam em banco de dados ou outros repositórios de
informações.
“A mineração de dados é um campo interdisciplinar que reúne

técnicas de aprendizado de máquina, reconhecimento de padrões,
estatísticas, banco de dados e visualização para abordar a questão da
extração de informações a partir de grandes bases de dados” (Evangelos
Simoudis, citado em Daniel T. Larose, Discovering Knowledge in Data –
An Introduction to Data Mining).
Fayyad (Fayyad et al., 1996) sintetiza Data Mining como “o processo

não-trivial de identificar, em dados, padrões válidos, novos,
potencialmente úteis e ultimamente compreensíveis”.
-Mineração de Dados (ou Data Mining)-
Etapa do processo de KDD. Corresponde à execução de um algoritmo

particular que, sob algumas limitações aceitáveis de eficiência computacional,
encontra padrões ou modelos nos dados.
É o processo de análise de conjuntos de dados que tem por

objetivo a descoberta de padrões interessantes e que possam
representar informações úteis.
Um conceito já cobrado em prova foi proposto na edição antiga do livro

“Data Mining Techniques: For Marketing, Sales, and Customer Support” , listada
a seguir:
A mineração de dados é a exploração e análise, por meios

automáticos ou semiautomáticos, de grandes quantidades de dados a fim
de descobrir padrões e regras significativas (1997).

Na edição mais atual do livro o conceito é o seguinte:
A mineração de dados é um processo de negócio para explorar

grandes quantidades de dados para descobrir padrões e regras
significativas (2011).
Atualmente, em telecomunicações, existe uma explosão de crimes contra

a telefonia celular, dentre os quais, a clonagem. Técnicas de data mining podem
ser utilizadas para detectar hábitos dos usuários de celulares. Quando um
telefonema for feito e considerado pelo sistema como uma exceção, o programa
faz uma chamada para confirmar se foi ou não uma tentativa de fraude.
O conhecimento é classificado em indutivo e dedutivo. O conhecimento

dedutivo deduz novas informações baseadas na aplicação de regras lógicas
predefinidas de dedução sobre dados existentes. O Data Mining apoia o
conhecimento indutivo, que descobre novas regras e padrões nos dados
fornecidos. (ELMASRI, NAVATHE, 2005).
A figura seguinte, ilustra, em camadas, as interações entre

funcionalidades, técnicas da mineração de dados e algoritmos, com o
objetivo de esclarecer a interatividade do objetivo da mineração de dados com
as técnicas a serem empregadas.
Figura. Interatividade entre as funcionalidades e técnicas da

mineração de dados.

Uma das vantagens de se focar nas funcionalidades da mineração de

dados diz respeito às facilidades que podem ser obtidas quando surge uma
nova necessidade de análise de dados. Neste caso, basta identificar a que
resultado se deseja chegar e imediatamente partir para identificação de
qual técnica aplicar.
Diversos autores tratam as funcionalidades da mineração de dados

de forma diferenciada (não se tem um consenso ainda quanto à
nomenclatura a ser utilizada). Vejamos algumas opções:
o Descoberta de conhecimento e predição;
o Classificação, Estimação, Predição, Afinidade em grupos, Agrupamentos
(clustering) e Descrição.
o Classificação, Detecção de sequência, Análise de dependência de dados e
Análise de desvio.
o Previsão, Identificação, Classificação e Otimização.
o Descrição e Predição.
Veja uma diferenciação apontada na literatura para análise descritiva x

prognóstico:
Figura. Funcionalidades (resultados) da mineração de dados.

Fonte: ftp://obaluae.inf.puc-
rio.br/pub/docs/techreports/02_10_cortes.pdf

De acordo com essa referência:
o Análise descritiva: representa a área de investigação nos dados que

busca tanto descrever fatos relevantes, não-triviais e
desconhecidos dos usuários, como analisar a base de dados,
principalmente pelo seu aspecto de qualidade, para validar todo o
processo da mineração e seus resultados, ou seja, o conhecimento
encontrado.
Figura. Sub-funcionalidades da análise prévia e do

descobrimento
o Análise de prognóstico: representa a área de investigação nos dados

que busca inferir resultados a partir dos padrões encontrados na
análise descritiva, ou seja, prognosticar o comportamento de um novo
conjunto de dados.
Cespe (2016) destaca que “para a realização de prognósticos

por meio de técnicas de mineração de dados, parte-se de uma
série de valores existentes obtidos de dados históricos bem como de
suposições controladas a respeito das condições futuras, para prever
outros valores e situações que ocorrerão e, assim, planejar e
preparar as ações organizacionais”.

Uma vez definidas as funcionalidades (resultados) a que se deseja

chegar com o processo de mineração de dados, cabe agora escolher que
técnicas devemos utilizar, que sejam mais aderentes para a obtenção dos
resultados, com uma melhor precisão.
As tarefas básicas de mineração de dados podem ser classificadas,

de uma forma geral, em:
Tarefas de Caracterizam as propriedades gerais dos dados em
DESCRIÇÃO (ou um banco de dados).
DESCRITIVAS)
O objetivo dessas tarefas é derivar padrões
(correlações, tendências, grupos, trajetórias e
anomalias) que resumem os relacionamentos
subjacentes nos dados.
As tarefas descritivas da mineração são muitas vezes

exploratórias em sua natureza e frequentemente
requerem técnicas de pós-processamento para
validar e explicar resultados.
Tarefas de Realizam inferências sobre os dados atuais

PREDIÇÃO (ou para fazer previsões sobre os mesmos).
PREDITIVAS ou O objetivo dessas tarefas é prever o valor de um
DE PREVISÃO) determinado atributo baseado nos valores de outros
atributos.
O atributo a ser previsto é comumente conhecido
como a variável dependente ou alvo, enquanto que
os atributos usados para fazer a previsão são
conhecidos como as variáveis independentes ou
explicativas.
Veja alguns exemplos, estudados a seguir:

A divisão apresentada para as tarefas básicas de mineração de dados

facilita o entendimento do principal objetivo de cada tarefa. Entretanto, nem
sempre é fácil classificar uma tarefa como preditiva ou descritiva, pois
alguns modelos preditivos podem ser descritivos, por serem
compreensíveis, e vice-versa.
A seguir, são apresentados os conceitos a serem aprendidos referentes às

principais tarefas de mineração de dados. Já vi alguns autores as chamarem
de técnicas de mineração de dados (Inclusive temos questões da banca que
tratam dessa forma).
Classificação
• Muito utilizada na mineração de dados.
• O ser humano está sempre classificando o que percebe a sua volta,

criando classes de relações humanas diferentes (colegas de trabalho,
amigos, familiares, etc.) e dando a cada classe uma forma diferente de
tratamento.
Classificar um novo objeto é determinar com que grupo (ou

classe) de objetos, já classificados anteriormente, esse novo
objeto apresenta mais semelhança.
• A classificação pode ser sintetizada por um processo de discriminação

de unidades em classes ou categorias. Assim, classificam-se sabores,
amigos, clientes, eventos, entre outros, em categorias, tais como doce /
salgado / neutro, bom/mau e legal / ilegal.
• Em um processo de mineração de dados, a classificação está

especificamente voltada à atribuição de uma das classes
predefinidas pelo analista a novos fatos ou objetos submetidos à
classificação.
• Cespe (2014) destacou que com o uso da classificação como técnica

de Data Mining, busca-se a identificação de uma classe por meio
de múltiplos atributos.
• Essa técnica pode ser utilizada tanto para entender dados

existentes quanto para prever como novos dados irão se
comportar (Euriditionhome, 2004) e também pode ser usada em
conjunto com outras técnicas de mineração de dados.
• Na mineração de dados são comuns as tarefas de classificação de clientes

em baixo, médio ou alto risco de empréstimo bancário; de clientes
potencialmente consumidores de um determinado produto a julgar pelo

seu perfil; de transações financeiras como legais, ilegais ou suspeitas em

sistemas de fiscalização do 24 mercado financeiro; de ações da bolsa de
valores com lucros potenciais baixos, médios e altos, entre outras.
• A tarefa de classificação é supervisionada (supervised learning), pois os

dados de treinamento (conjunto de treinamento) são fornecidos
com suas classes reais, previamente definidas. O conjunto de
treinamento corresponde à base de dados submetida ao algoritmo de
classificação, a partir da qual serão obtidos os padrões de classificação.
• A qualidade de uma descrição estrutural de classificação pode ser avaliada

com a utilização de novos dados, com classes já conhecidas: os chamados
dados de teste (ou conjunto de teste). Tem-se, então, o conjunto de
treinamento para obter os padrões de classificação e o conjunto de teste
para validar os padrões obtidos. É comum, a partir de uma base de dados
a ser minerada, que seja separado um conjunto de instâncias para o
treinamento e o restante é utilizado como conjunto de teste.
• A taxa de sucesso nos dados de teste pode fornecer uma medida objetiva
da qualidade do conceito aprendido. Entretanto, em muitas situações
práticas o sucesso é medido subjetivamente.
• Exemplo de aplicações para a tarefa de classificação: prever se deve

haver jogo ou não, com base em dados sobre o tempo.
Análise de Agrupamentos (Clusterização - Clustering)

• Também chamada de segmentação de dados, diz respeito a agrupar ou
segmentar uma coleção de objetos em subconjuntos, chamados de
clusters. Os objetos dentro de um mesmo cluster são mais próximos
entre si do que com qualquer outro objeto alocado em outro cluster. Um
cluster é um subconjunto de todos os possíveis subconjuntos distintos da
população (DINIZ e LOUZADA NETO, 2000).
Agrupar é, baseado em medidas de semelhança, definir

quantas e quais classes existem em um conjunto de entidades.
• O problema da tarefa de Clusterização é encontrar grupos de

instâncias (como por exemplo registros em uma base de dados)
de acordo com as similaridades entre estas instâncias.
• A clusterização é considerada como um aprendizado não

supervisionado (unsupervised learning) pois nenhuma classe (ou
grupo) é conhecida previamente.
• O sucesso da clusterização é medido de forma subjetiva.

• Um exemplo de clusterização é agrupamento de clientes que corresponde

à descoberta de grupos de clientes de acordo com seus atributos. Assim,
pode-se obter o perfil de cada grupo de clientes identificado.
• A figura a seguir apresenta um exemplo de clusterização de instâncias

que possuem os atributos X e Y, do tipo numérico.
• O método de clustering k-means objetiva particionar “n” observações

entre “k” grupos; cada observação pertence ao grupo mais próximo da
média.
Regras de Associação
• A tarefa de “obtenção de regras de associação” corresponde a
descobrir qualquer estrutura de associação entre os dados.
• A associação pode ser aplicada caso nenhuma classe tenha sido

especificada.
• Diferenças da tarefa de Associação em relação à Classificação:
• associação pode predizer qualquer atributo (não só a classe);
• associação pode predizer os valores de mais de um atributo.
• Exemplos de regras de associação obtidas a partir da base de dados sobre

o tempo (com atributos nominais).
(temperatura=fria) ⇒ (umidade=normal)
(umidade=normal) e (vento=falso) ⇒ (jogar=sim)
(tempo=claro) e (jogar=não) ⇒ (umidade=alta)
(vento=falso) e (jogar=não) ⇒ (tempo=claro) e (umidade=alta)

• Utilizando-se uma base de dados de compras em um supermercado,

pode-se obter quais itens são comprados juntos com uma certa
frequência, conforme visto a seguir.
fralda ⇒ cerveja
cereal ⇒ leite
• Devido às diferenças apontadas entre as tarefas de Associação e

Classificação, normalmente obtém-se muito mais regras de
associação do que regras de classificação. Assim, é necessário impor
restrições às regras obtidas, como por exemplo, indicar a cobertura
mínima.
Detecção de Anomalias (Detecção de Desvios ou Mineração de

Exceções)
• É a tarefa de identificar observações cujas características sejam
significativamente diferentes do resto dos dados.
• Tan et al. (2009, p.777) destaca que na detecção de anomalias o

objetivo é encontrar objetos que sejam diferentes da maioria dos
outros objetos. Segundo os autores, muitas vezes, objetos anômalos
são conhecidos como fatores elementos estranhos, já que, em um
desenho disperso dos dados, eles ficam longe dos outros pontos de
dados. Veja a figura seguinte como exemplo.
• A detecção de anomalias também é conhecida como detecção de

desvios (Tan et al., 2009), porque objetos anômalos têm atributos que
se desviam significativamente dos valores de atributos esperados ou
típicos ou, como mineração de exceções, porque as anomalias são
excepcionais em algum sentido.
• Cabe destacar que, embora objetos ou eventos diferentes sejam, por

definição, relativamente raros, isto não significa que eles não ocorram

com frequência em termos absolutos. Por exemplo, um evento que seja

“um em um milhão” pode ocorrer milhões de vezes quando bilhões de
eventos são considerados (Tan et al., 2009).
• Os exemplos a seguir, retirados de Tan et al. (2009), ilustram aplicações

para a quais as anomalias são de considerável interesse:
• detecção de fraudes; detecção de Intrusão; distúrbios no Ecossistema;
• saúde pública. Ex.: se todas as crianças de uma cidade forem vacinadas

contra uma determinada doença, como sarampo, então a ocorrência de
alguns casos espalhados por diversos hospitais da cidade é um evento
anômalo, que poderá indicar um problema com os programas de
vacinação da cidade.
Análise de Regressão
• Busca explicar uma ou várias variáveis de interesse (sempre contínuas ou
binárias) em função de outras. Uma vez construído o modelo (que é uma
equação matemática), ele pode ser usado para realizar predições ou
calcular probabilidades.
• A tarefa de regressão é predizer um valor numérico a partir de um

conjunto de atributos fornecidos. A regressão pode ser considerada
uma variação da classificação, pois prevê um valor numérico contínuo
ao invés de um valor categórico (ou nominal).
• A regressão é considerada como um aprendizado supervisionado

(supervised learning) pois a base de dados de treinamento já
possui valores numéricos previamente definidos para o atributo a
ser previsto nas novas instâncias.
• O sucesso da regressão pode ser medido através de dados de teste, ou

subjetivamente.
• A figura a seguir apresenta um exemplo de base de dados de treinamento

com um atributo numérico a ser utilizado para previsão através da
Regressão. Assim, a partir da obtenção da equação de regressão com
base nestes dados fornecidos, será possível prever a duração de um novo
jogo a partir dos demais atributos fornecidos.

Árvores de Decisão
• É um modelo preditivo que pode ser visualizado na forma de uma
árvore, daí seu nome. Cada ramo da árvore é uma questão de
classificação e cada folha é uma partição do conjunto de dados com
sua classificação.
• A forma de execução é simples: dado um conjunto de dados cabe ao

usuário escolher uma das variáveis como objeto de saída. A partir daí,
o algoritmo encontra o fator mais importante correlacionado com a
variável de saída e seta-o como o primeiro ramo (chamado de raiz),
os demais fatores são subsequentemente classificados como nós até
que se chegue ao último nível, a folha.
• Desta forma, a árvore de decisão utiliza a estratégia de dividir para

conquistar, um problema complexo é decomposto em subproblemas
mais simples e recursivamente a mesma estratégia é aplicada a cada
subproblema.
A abordagem “divisão e conquista” produz uma árvore em que cada nó

refere-se ao teste de um atributo particular.
Métodos Bayesianos
• O filtro bayesiano utiliza uma abordagem probabilística, tendo como
base o Teorema de Bayes. Nesse caso, um item que precisa ser
classificado tem uma série de atributos.
• Então, ele calcula a probabilidade de o item pertencer a cada

classe, dados aqueles atributos que ele tem. Dessa forma, a classe
que alcançar a maior probabilidade é aquela na qual o item vai ser
classificado.
Regras de Indução
• A técnica de Regras de Indução é altamente automatizada e,
possivelmente, é a melhor técnica de data mining para expor
todas as possibilidades de padrões existentes em um banco de
dados (BERSON et al., 1999).
• Consiste em uma expressão condicional do tipo:
se <condição> então <consequência>, ou, em outras palavras:

se <isto> então <aquilo>. Por exemplo:
- se comprou cereal então comprou também leite
- se comprou queijo e presunto então comprou também pão

• Após a formação das regras, constrói-se uma tabela com o percentual

de precisão (com que frequência a regra está correta?) e de
cobertura (com que frequência a regra pode ser usada?). Quando
maior o percentual, melhor a regra.
Redes Neurais Artificiais

• São técnicas que procuram reproduzir de maneira simplificada as
conexões do sistema biológico neural. Estruturalmente, consistem
em um número de elementos interconectados, chamados neurônios,
organizados em camadas que aprendem pela modificação de suas
conexões. Tipicamente, tem-se uma camada de entrada ligada a uma
ou mais camadas intermediárias que são ligadas a uma camada de
saída (BERRY e LINOFF, 1997).
• A partir de um conjunto de treinamento, procura-se aprender padrões

gerais que possam ser aplicados à classificação ou à predição de
dados. A função básica de cada neurônio é avaliar valores de entrada,
calcular o total para valores de entrada combinados, comparar o total
com um valor limiar e determinar o valor de saída.
A fase de modelagem de um data mining agrega a seleção e aplicação

das técnicas sobre os dados selecionados. Inúmeras técnicas podem ser
empregadas para obtenção de padrões úteis, como por exemplo, a PMML
(predictive model mark-up language), que objetiva, via schemas XML, a
definição para modelos encontrados em associações, modelos de regressão e
clustering (CESPE/2013).
OLAP é uma ferramenta de consulta em bases de dados analíticas, que

visa extrair informações por meio de queries e utiliza as operações sobre os
cubos de dados. Data Mining (Mineração de Dados) é bem mais complexo
que OLAP, uma vez que busca padrões em grandes volumes de dados por meio
de técnicas estatísticas e de algoritmos de inteligência artificial, por exemplo.
Com o uso da Mineração de dados (Data Mining), é possível descobrir

informações relacionadas a associações, sequências, classificação,
aglomeração e prognósticos. Conforme destaca WIKIPEDIA (2016):
• “Associações: são ocorrências ligadas a um único evento. Por

exemplo: um estudo de modelos de compra em supermercados pode
revelar que, na compra de salgadinhos de milho, compra-se também um
refrigerante tipo coca-cola em 65% das vezes: mas, quando há uma
promoção, o refrigerante é comprado em 85% das vezes. Com essas
informações, os gerentes podem tomar decisões mais acertadas pois
aprenderam a respeito da rentabilidade de uma promoção.
• Sequências: aqui os eventos estão ligados ao longo do tempo.
Pode-se descobrir, por exemplo, que quando se compra uma casa, em

65% as vezes se adquire uma nova geladeira no período de duas

semanas; e que em 45% das vezes, um fogão também é comprado um
mês após a compra da residência.
• Classificação: reconhece modelos que descrevem o grupo ao qual

o item pertence por meio do exame dos itens já classificados e
pela inferência de um conjunto de regras. Exemplo: empresas de
operadoras de cartões de crédito e companhias telefônicas preocupam-se
com a perda de clientes regulares, a classificação pode ajudar a descobrir
as características de clientes que provavelmente virão abandoná-las e
oferecer um modelo para ajudar os gerentes a prever quem são, de
modo que se elabore antecipadamente campanhas especiais para reter
esses clientes.
• Aglomeração (clustering): funciona de maneira semelhante à

classificação quando ainda não foram definidos grupos. Uma ferramenta
de data mining descobrirá diferentes agrupamentos dentro da
massa de dados. Por exemplo ao encontrar grupos de afinidades para
cartões bancários ou ao dividir o banco de dados em categorias de
clientes com base na demografia e em investimentos pessoais.
• Prognóstico: Embora todas essas aplicações envolvam previsões, os

prognósticos as utilizam de modo diferente. Parte-se de uma série de
valores existentes obtidos de dados históricos bem como de
suposições controladas a respeito das condições futuras, para
prever outros valores e situações que ocorrerão e, assim, planejar
e preparar as ações organizacionais. Por exemplo um prognóstico
pode descobrir padrões nos dados que ajudam os gerentes a estimar o
valor futuro de variáveis com números de vendas”.
9. Aprendizado de máquina
• “Aprender”, segundo o dicionário Aurélio é “tomar conhecimento de algo,

retê-lo na memória, em consequência de estudo, observação,
experiência, advertência, etc.; tornar-se apto ou capaz de alguma coisa,
em consequência de estudo, observação, experiência, advertência, etc.”.
• Definição operacional de aprendizado: as “coisas” aprendem quando elas

alteram seu comportamento de uma forma que as fazem ter um
desempenho melhor no futuro.
• Herbert Simon: “Aprendizado é qualquer processo no qual um sistema

melhora seu desempenho através da experiência.”
• Aprendizado de máquina é uma subárea da inteligência artificial,

também conhecida como machine learning ou aprendizado automático.

o Surgiu da ideia de criar programas que aprendam um determinado

comportamento ou padrão automaticamente a partir de exemplos
ou observações.
o Guarda alguma relação com o aprendizado humano.
o Seres humanos (e outros animais) são capazes de generalizar a

partir de exemplos.
• Exemplos de utilização:
o Desenvolver sistemas que são muito difíceis/caros de construir

manualmente porque requerem conhecimentos detalhados de uma
determinada tarefa.
o Desenvolver sistemas que possam se adaptar a usuários

individualmente.
o Sistemas de educação personalizados.
o Extrair conhecimento de grandes bases de dados (mineração de

dados).
10. Aprendizado de máquina x Mineração de Dados
• A mineração de dados é o processo de extração automática de

conhecimento a partir de grandes bases de dados.
• Algoritmos de aprendizado automático podem ser vistos como

algoritmos que extraem um padrão de comportamento a partir de
dados (exemplos).
• Dessa forma, podem ser utilizados como algoritmos de mineração de

dados.
• Porém, algoritmos de aprendizado nem sempre utilizam bases de

dados. Podem aprender diretamente a partir da interação com o
ambiente ou com um simulador.
• Ambas as áreas “emprestam” muitos métodos da área de estatística.
11. Mineração de Texto (Text Mining)
• Turbam et al. (2009) destacam que a mineração de texto (text

Mining) é a aplicação de data mining em arquivos de texto não
estruturados ou menos estruturados.

• O data mining aproveita-se da infraestrutura de dados armazenados para

extrair informações adicionais úteis. Por exemplo, ao aplicar data mining
a um banco de dados de clientes, um analista pode descobrir que
qualquer pessoa que compra o produto A também compra os produtos B
e C seis horas depois.
• O text mining funciona com informações menos estruturadas.

Raramente os documentos têm uma estrutura interna sólida, e quando
têm, frequentemente está focada no formato do documento ao invés do
conteúdo do documento.
• O text mining ajuda as empresas a (Turbam et al , 2009):
o encontrar o conteúdo “escondido” dos documentos, incluindo

informações adicionais úteis;
o relacionar documentos ao longo de prévias divisões

despercebidas (Ex.: descobrir que os clientes de duas divisões
distintas de produto têm as mesmas características);
o agrupar documentos usando temas em comum (Ex.: encontrar

todos os clientes de uma companhia de seguro que têm
reclamações parecidas e cancelam suas apólices).
• O text mining envolve a criação de índices numéricos a partir de dados

não estruturados e, então, a aplicação dos algoritmos de data mining a
esses índices.
• O text mining não é a mesma coisa que mecanismos de busca na web.

Em uma busca, estamos tentando encontrar o que os outros prepararam.
Com text mining queremos descobrir novos padrões, pedaços de
informação que podem não ser óbvios ou conhecidos.
• São componentes de um sistema de text mining:
o um sistema para o manuseio de documentos em diversos formatos

(txt, pdf, etc.), provenientes de diferentes fontes (e-mail, web,
twitter, etc.);
o componentes para processar esses documentos e criar arquivos de

dados que possam, então, ser explorados (resumidores, classe
gramatical das palavras, etc.);
o ferramentas de data mining.
• Já existem algumas ferramentas proprietárias para mineração de textos

que estejam contidos em conteúdos da web, livros, comentários de blogs,
etc. Exemplos: Apache Mahout, SAS Text Miner e demais relacionadas

com a linguagem R, porém não são aplicáveis diretamente a NoSQL (Not

only Structured Query Language).
Nota: os novos modelos de bases de dados NoSQL não possuem uma

estrutura formal, não fornecem acesso via SQL, são distribuídos e
prometem maior escalabilidade e desempenho. Ao se popularizarem
criaram uma lacuna em termos de análise de dados, já que as
ferramentas de mineração de dados, por exemplo, usualmente foram
desenvolvidas para serem aplicadas a modelos relacionais, não a dados
sem estrutura ou semi-estruturados.
Sistema
As definições de sistemas vêm da Teoria de Sistemas.
• Um sistema é um conjunto de elementos inter-relacionados. Por

exemplo, sistema de ar-condicionado. Em outras palavras, trata-se de um
grupo de componentes inter-relacionados que trabalham juntos rumo
a uma meta comum, recebendo insumos e produzindo resultados num
processo organizado de TRANSFORMAÇÃO.
• Sistemas Abertos: interagem com o ambiente. Existem diversos

graus de abertura de sistemas.
• Sistemas Dinâmicos: recebem entradas do ambiente, as

processam e produzem resultados.
• Um sistema com intenções é um sistema criado pelo homem que

busca um conjunto de objetivos para o qual ele foi criado (SI têm
objetivos).
Sistema de Informação?
Um Sistema de Informação (SI) contém informação sobre uma
organização e seu ambiente. Podem auxiliar gerentes e usuários a analisar
problemas, criar novos produtos e serviços e visualizar questões complexas.
• SI: Sistema aberto, dinâmico, com intenções e que produz informação.

• Trata-se de um sistema que provê procedimentos para registrar e tornar

disponível informação, sobre parte de uma organização, para apoiar
atividades relacionadas com a própria organização.
• Um conjunto de procedimentos organizados que, quando executados,

proveem informações para apoiar processos de tomada de decisões e
controlar a organização.
Importante: os SIs devem estar relacionados com as atividades da

organização, isto é: alinhado com os objetivos e estratégia de
negócio da empresa.
Os sistemas de informação desempenham papéis vitais em qualquer tipo de

organização. Eles apoiam uma organização no que se refere a:
• processos e operações das empresas;
• tomada de decisões de seus funcionários e gerentes;
• estratégias em busca de vantagem competitiva.

Dentre as principais vantagens de um sistema de informação merecem

destaque:
• otimização do fluxo de informação permitindo maior agilidade e organização;
• redução de custos operacionais e administrativos;
• ganho de produtividade;
• maior integridade e veracidade da informação;
• maior estabilidade e segurança no acesso à informação.
Um dos principais desafios dos Sistemas de Informação é assegurar a

qualidade e agilidade da informação, imprescindível para as corporações e seus
gestores.
Com relação às necessidades dos gestores em relação à informação:

• agilidade => disponível no tempo certo;
• confiabilidade => coesa, correta.
Processo de negócio
É um conjunto de atividades inter-relacionadas ou interativas que
transformam insumos (entradas) em produtos ou serviços (saídas), que
têm valor para um grupo específico de clientes.
• Insumos: são as entradas de um processo e podem ser materiais,
equipamentos e outros bens tangíveis, mas também podem ser
informações e conhecimentos (bens intangíveis).

• Desenvolver um novo produto, gerar um pedido de compra ou contratar

um funcionário são exemplos de processos de negócios, e o modo como
as organizações realizam esses processos de negócios pode ser uma fonte
de força competitiva.
Sistemas de informação ajudam as organizações a:

• Alcançar grandes eficiências pela automatização de partes dos processos.
• Repensar e aperfeiçoar processos.
Atividades Básicas de um Sistema de Informação

As atividades básicas que produzem as necessidades de informação da
organização são detalhadas a seguir (O’BRIEN, 2006):
– Entrada (ou input): envolve a captação/coleta de dados brutos de
dentro da organização ou de seu ambiente externo.
• A entrada precisa ser criteriosa (dados corretos/completos) para
alcançar a saída desejada.
• Pode ter vários formatos (ex.: Em um sistema de marketing a entrada
poderia ser as respostas dos clientes nas pesquisas; cartões de ponto
dos empregados para SI que irá produzir contracheques, etc.).
• Pode ser manual ou automatizada (ex.: Um scanner de uma mercearia
que interpreta códigos de barras e registra preço do produto).
– Processamento: ação de converter (transformar) dados brutos em

forma significativa (informação). Pode incluir a realização de cálculos,
comparações, tomadas de ações alternativas.
– Saída (ou output): transferência da informação processada para

pessoas ou atividades onde será usada.
• Várias formas: relatórios impressos, apresentações gráficas, vídeos,
sons ou dados a serem enviados a outros Sistemas de Informações.
• Frequentemente, a saída de um sistema pode ser usada como entrada
para outros Sistemas de Informações.
– Feedback: dados sobre o desempenho de um sistema.

• Podem indicar erros/problemas. Ex.: a quantidade de horas
trabalhadas por um empregado inserida errada, como 400 em vez de
40 horas, em uma semana.

• Importante para gerência/tomada de decisão. Ex.: Saída de um SI

pode indicar que os níveis de estoque para alguns itens estão baixos.
• Um SI pode ser proativo, fazendo a previsão de eventos futuros para
evitar problemas. Pode ser usado para estimar as vendas futuras e
pedir mais estoque antes que ocorra uma escassez.
– Controle: envolve monitoração e avaliação do feedback e ajustes nos

componentes (caso tenha necessidade).
• Ex.: Um gerente de vendas exerce controle quando realoca vendedores
para novos territórios de vendas depois de avaliar o feedback sobre
seu desempenho de vendas.
A figura seguinte mostra as principais atividades necessárias em um
sistema de informação para produzirem as informações que precisam para
tomar as decisões, controlar operações, analisar problemas e criar novos
produtos ou serviços.
Figura - O sistema recebe os dados de um dispositivo de ENTRADA

onde é PROCESSADO e em seguida enviado para um dispositivo de
SAÍDA.
Vamos a um exemplo de concessionária de veículos com fábrica para
melhor entendimento dos conceitos aqui apresentados.
Imagine que estou utilizando um sistema para emissão de pedidos de

peças via Internet, junto à fábrica. No Sistema de Informação usado para
requisição de peças, a entrada de dados brutos do revendedor consiste no
número da peça, sua descrição e a quantidade de cada peça pedida,
juntamente com o nome do revendedor e o seu número de identificação.

O computador processa estes dados comparando cada número de peça e

a quantidade de cada peça requisitada com o montante de cada peça disponível
em estoque, e programa a remessa da peça ao distribuidor. Se a peça não
estiver no estoque, o computador notifica a fábrica para produzir mais daquele
artigo.
Os documentos e relatórios online para o revendedor confirmando que
aquele pedido foi recebido e a data prevista de remessa são a saída. Assim, o
sistema proporciona informação significativa, tais como as listas das quais o
revendedor requisitou cada peça, o número total de peças pedidas diariamente
à fábrica de Puebla, o número e o tipo de peças pedidas por cada distribuidor,
ou o número de peças em estoque. Fácil, não é mesmo!
Integração da Dimensão Tecnológica com a Dimensão Cultural,

Política e Organizacional
O estudo dos sistemas de informação trata de questões e percepções

levantadas por disciplinas técnicas e comportamentais, ou seja, são
SISTEMAS SOCIOTÉCNICOS.
▪ Abordagem Técnica
Dá ênfase a modelos matemáticos para estudá-los, assim como à
tecnologia física e às capacidades formais desses sistemas. As disciplinas que
contribuem para a abordagem técnica são a ciência da computação, a ciência da
administração e a pesquisa operacional. A ciência da computação preocupa-se
com o estabelecimento de métodos de computação e de armazenagem e acesso
eficiente aos dados. A ciência da administração enfatiza o desenvolvimento de
modelos de tomadas de decisões e práticas de administração. A pesquisa
operacional foca técnicas matemáticas para otimização de parâmetros
selecionados das organizações, como transporte, controle de estoque e custos
de transações.
▪ Abordagem Comportamental
Questões como integração estratégica da empresa, projeto,
implementação, utilização e administração não podem ser exploradas
convenientemente com os modelos usados na abordagem técnica.
A abordagem comportamental não ignora a tecnologia. Na verdade, a
tecnologia dos sistemas de informação quase sempre é o estímulo para um
problema ou questão comportamental. Mas, em geral, o foco dessa abordagem
não está sobre as soluções técnicas. Pelo contrário, concentra-se nas mudanças
em atitudes, administração e política organizacional e no comportamento.

Figura – Abordagens contemporâneas dos sistemas de informação
Os sistemas de informação são mais do que apenas

computadores. Para usá-los efetivamente, é necessário entender a
organização, a administração e a tecnologia de informação que são as
bases de sua configuração. Todos os sistemas de informação podem ser
descritos como soluções organizacionais e administrativas para os
desafios propostos pelo ambiente.
▪ Interdependência entre organizações e sistemas de informação
Nos sistemas contemporâneos, há interdependência cada vez maior
entre estratégias empresarial, regras e processos organizacionais e
sistemas de informação da organização, como ilustra a próxima figura.
Figura – Interdependência entre organizações e SI

Mudanças na estratégia, regras e processos exigem cada vez mais mudanças

em equipamentos, programas, bancos de dados e telecomunicações. Os
sistemas existentes podem funcionar como uma limitação para as organizações.
Aquilo que a empresa gostaria de fazer muitas vezes depende do que seus
sistemas permitirão que faça.
Componentes de um Sistema de Informação

• Banco de Dados: é uma coleção organizada de dados e informações,
guardados de uma maneira organizada para uso posterior.
• Rede: um sistema de conectividade que viabiliza o compartilhamento de
recursos entre computadores diferentes.
• Pessoas: são o elemento mais importante dos SIs. Incluem os profissionais
e os usuários finais.
• Procedimentos: incluem as estratégias, políticas, métodos e regras usadas
pelas pessoas para operar o Sistema.
• Hardware: consiste no equipamento do computador e periféricos usados
para executar as atividades de entrada, processamento e saída.
• Software: consiste nos programas de computador, que permite o
processamento de dados no hardware.
Figura. Componentes de um SI

Tipos de Sistemas de Informação em Ambiente Empresarial

Existem muitos tipos de sistemas de informação no mundo real. Todos
eles utilizam recursos de hardware, software, rede e pessoas para transformar
os recursos de dados em produtos de informação.
A seguir, listamos as principais classificações.

• Sistema de Processamento de Transações (SPT) – também conhecido
como Sistema de Informação Operacional (Transacional)
o Sistema administrativo básico que atende ao nível operacional.
o Registra as transações rotineiras necessárias ao funcionamento
da empresa.
o Comumente encontrado em todas as empresas automatizadas.
o Objetivo principal: processar dados, isto é, fazer cálculos, armazenar e
recuperar dados (consultas simples), ordenar e apresentar de forma
simples para os usuários.
o Principais benefícios proporcionados por esse tipo de sistema:
agilização das rotinas e tarefas, incluindo documentação rápida e
eficiente; busca acelerada de informações; cálculos rápidos e precisos;
confiabilidade; redução de pessoal e custos; melhor comunicação
(interna entre setores ou externa com clientes e fornecedores).
o Exemplos:
▪ Sistemas de cadastro em geral (inclusão, exclusão, alteração e
consulta), como de clientes, produtos, fornecedores, etc.
▪ Sistemas de Contabilidade Geral (contas a pagar e a receber,
balanços, fluxo de caixa, etc.);
▪ Requisição de materiais, etc.
▪ Sistemas de vendas e distribuição (processamento de pedidos,
entregas);
▪ Sistema de folha de pagamento, controle de estoque (PDV);
▪ Sistemas Financeiros (controle saldo, aplicações, etc.).
• Sistema de Informação Gerencial (SIG) - fornece aos usuários finais

administrativos produtos de informação que apoiam grande parte de suas
necessidades de tomada de decisão do dia a dia. Os SIGs fornecem uma
diversidade de informações pré-especificadas (relatórios) e exibições em
vídeo para a administração que podem ser utilizadas para ajudá-los a tomar
tipos estruturados mais eficazes de decisões diárias.
o Fornece informações de rotina aos administradores e
tomadores de decisão.

o Foco: produzir relatórios gerenciais (pagamento a fornecedores,

desempenho de vendas, níveis de estoque e outros) com vistas à
eficiência operacional (“Fazer as coisas direito”).
Exemplo de relatório de um SIG

o Focalizam a informação, disponibilizada aos usuários por meio de
relatórios ou consultas, que normalmente utilizam banco de dados.
o Possibilitam a comparação de resultados para estabelecer as metas da
companhia.
o Permitem a identificação de áreas com problemas e oportunidades de
aprimoramento.
o Os produtos de informação fornecidos aos gerentes incluem exibições
em vídeo e relatórios que podem ser providos: por solicitação;
periodicamente, de acordo com uma tabela pré-determinada e/ou
sempre que houver a ocorrência de condições excepcionais.
o Subsistemas de Informações Gerenciais:

• SIG Financeiro; SIG Industrial;

• SIG de Marketing; SIG de Recursos Humanos;
• SIG Contábil, etc.
Exemplo de interação entre SPT e SIG
• SAD - Sistemas de Apoio à Decisão (em inglês: DSS - Decision

Support Systems) - são sistemas de informação computadorizados que
fornecem aos gerentes apoio interativo de informações durante o processo
de tomada de decisão.
o Concentra-se em fornecer informações de forma interativa para apoiar
tipos específicos (não usuais) de decisões por parte de cada
gerente.
Oferece suporte à tomada de decisão de problemas
específicos, que se alteram com rapidez e que não são facilmente
especificados com antecedência.
Figura. Componentes de um SAD. Fonte: Adaptado de

Sprague e Watson (1991, p. 53)

Exemplos:
• Sistema de Apoio à Decisão para Diagnósticos Médicos.
• Outros exemplos incluem uma financiadora que verifica o crédito
de um solicitador de crédito ou de uma firma de engenharia que
tem um grande projeto e quer saber se podem ser competitivos
com os atuais custos.
o Embora os SADs usem informações internas obtidas do SPT (Sistema
de Processamento de Transações) e do SIG (Sistema de Informação
Gerencial), frequentemente recorrem a informações de fontes
externas, tais como o valor corrente das ações ou os preços dos
produtos dos concorrentes.
• Sistemas de Apoio ao Executivo (SAE) - são sistemas de informação para

executivos (nível estratégico).
o Possibilita que os executivos da alta administração interajam
diretamente com o sistema para obter informações que atendam às
suas necessidades específicas.
o Uso intensivo de dados do meio ambiente interno e externo da
empresa, contemplando acesso a serviços de banco de dados no
mercado financeiro e empresarial disponíveis.
o Ex.: Vendas do concorrente, capacidade de produção de outras
empresas, etc.
Resumindo, veja a relação entre Sistemas de Informações e o Apoio a

Atividades Organizacionais.

Outras Classificações relacionadas a Sistemas de Informações:

• Sistemas de Informação Integrados ou Interfuncionais
Os Sistemas de Informações no mundo real são normalmente combinações
integradas de vários tipos de sistemas de informação. Assim, os vários tipos
de sistemas da organização têm interdependências.
Deve-se ressaltar que cada um dos diferentes sistemas pode ter

componentes que são usados por níveis e grupos organizacionais que não
fazem parte do grupo principal a que foram designados. Uma secretária pode
encontrar uma informação em um SIG ou um gerente médio pode precisar
extrair dados de um SPT.
• Business Intelligence: sistemas e processos integrados para transformar

os dados coletados em grandes quantidades em informações mais fáceis de
ler pelo nível estratégico da empresa, gerando mais praticidade no
estabelecimento de planos de negócios para a instituição.
• Sistema Integrado de Gestão, também conhecido como Sistema de

Gestão Integrada ou ERP (Enterprise Resource Planning): é um
sistema de informação com módulos integrados que dão suporte a
diversas áreas operacionais, tais como vendas/marketing, manufatura/
produção, finanças, contabilidade e recursos humanos.
o Os sistemas integrados podem reunir todos os principais processos de
negócios de uma empresa em um único software de sistema que
permite que a informação flua sem descontinuidade através da
organização.

o Esses sistemas podem incluir transações com clientes e fornecedores.
SEM um ERP implantado na empresa, a informação é

processada INDIVIDUALMENTE em cada área da empresa, gerando
assim retrabalho, erros, alto custo, redução dos lucros e perda de
produtividade da empresa.
O sistema ERP integra, portanto, diversas atividades de uma empresa
através de um software, organizando e disseminando a informação de forma
integrada entre as diferentes áreas da companhia. Essa integração faz uso de
uma base de dados comum a toda empresa, consolidando assim toda a
operação do negócio em um único ambiente computacional. Dessa forma,
procura-se evitar redundâncias e inconsistências de dados, assegurando-se a
integridade do fluxo de informações.
O ERP é composto por vários módulos que conversam entre si trocando
informações. Cada módulo é responsável por uma atividade específica do
sistema, como por exemplo: planejamento da produção, vendas,
distribuição, finanças, controladoria, gerenciamento da manutenção, gestão
de projetos, gestão de materiais, qualidade, recursos humanos, dentre
outros.
• CRM (Customer Relantionship Management – Sistema de

Gestão do Relacionamento com o Cliente): sistemas que gerenciam e
organizam as informações relacionadas aos clientes da empresa de forma
personalizada, analisando suas preferências e perfis de compra. Usam um
conjunto de aplicações integradas para abordar todos os aspectos do
relacionamento com o cliente, inclusive atendimento, vendas e marketing.

Figura. Visão do Cliente e da Empresa em Relação à Presença de

CRM. Fonte: Fingar, Kumar e Sharma (2000, p. 111).
Veja a distinção entre CRM Operacional e CRM Analítico (Laundon
e Laundon):
• Operacional: aplicações voltadas ao cliente, tais como ferramentas

para automação da força de vendas, apoio ao atendimento e ao call
center e automação do marketing.
• Analítico: aplicações que analisam os dados do cliente gerados pelas
aplicações CRM operacionais. Baseado em data warehouses que
consolidam os dados dos sistemas CRM operacionais e dos pontos de
contato com o cliente.
• Supply Chain Management ou Gerenciamento da Cadeia de

Suprimentos (SCM): é uma ferramenta que, usando a Tecnologia da
Informação (TI), possibilita à empresa gerenciar a cadeia de suprimentos
com maior eficácia e eficiência, eliminando distribuidores e reduzindo custos
de armazenamento por exemplo.
A cadeia de suprimentos (Laundon e Laundon, 2007): rede de
organizações e processos de negócios para selecionar matérias-primas,
transformá-las em produtos intermediários e acabados e distribuir os
produtos acabados aos clientes.

• Parte upstream da cadeia de suprimentos: fornecedores da

empresa, os fornecedores dos fornecedores e processos para
gerenciar as relações entre eles.
• Parte downstream da cadeia de suprimentos: processos e
organizações envolvidos na distribuição e entrega de produtos ao
consumidor final.
Veja um exemplo na figura seguinte.
Figura. Exemplo da cadeia de suprimentos da Nike. Fonte: Laundon

e Laundon (2007).
• E-business: negociação feita pela Internet que não envolve

necessariamente uma transação comercial. É a união entre estratégias
de negócio e tecnologia via Web.
E-business refere-se a uma definição mais ampla de Comércio
Eletrônico, envolvendo não apenas a compra e venda de bens e serviços,
mas também o atendimento a clientes, colaboração com parceiros
empresariais, realização de e-learning e transações eletrônicas dentro de
uma organização (TURBAN, JR e POTTER, 2005).

Negócios Eletrônicos englobam Comércio Eletrônico
• E-commerce (Comércio Eletrônico): consiste na realização de negócios

por meio da Internet, incluindo a venda de produtos e serviços físicos,
entregues off-line, e de produtos que podem ser digitalizados e entregues
on-line, nos segmentos de mercado consumidor, empresarial e
governamental.
Segundo Laudon e Laudon (2007) “existem diferentes maneiras de

classificar as transações de comércio eletrônico”, na qual estão
envolvidas 3 partes: governo, empresa e consumidor.

A seguir, exemplificamos algumas relações entre esses agentes:

o Business to Consumer (B2C) - Comércio Eletrônico Empresa-
Consumidor: é a forma mais comum de comércio que envolve a empresa
vendendo seus produtos e serviços e o consumidor querendo adquiri-
los.
Figura. Site das Lojas Americanas como exemplo de B2C
o Business to Business (B2B) - Comércio Eletrônico Empresa-Empresa

▪ Esse tipo de comércio eletrônico é realizado entre empresas que
vendem ou compram produtos ou serviços pela Web.
▪ Por muitos anos, as empresas usaram sistemas proprietários para o
e-commerce empresa-empresa (B2B). Agora elas estão recorrendo
à tecnologia de Web e Internet. Eliminando processos em papel
ineficientes para encontrar os produtos e serviços a preços mais
baixos, os sites Web empresa-empresa podem proporcionar aos
participantes economias que podem variar entre 5 e 45 por cento
(LAUDON e LAUDON, 2007).
o Consumer to Consumer (C2C) - Comércio Eletrônico Consumidor-

Consumidor: é uma referência ao comércio eletrônico que se desenvolve
entre usuários pessoas físicas da Internet. Atualmente considera-se a
"terceira onda" do comércio eletrônico.

Figura. Site do Mercado Livre como exemplo de C2C
o Government to Consumer (G2C) e Consumer to Government (C2G):

transações envolvendo governo e consumidores finais. Referente
àquelas iniciativas no campo do governo eletrônico, voltadas para o
provimento de informações e serviços aos cidadãos, bem como de interação
direta entre o cidadão e o governo e inclusão digital, considerando tanto
meios virtuais e/ou físicos. Exemplos: pagamento de impostos, serviços de
comunicação.
o Business to Government (B2G): transações envolvendo empresas e

governo e Government-to-business (G2B): transações envolvendo
governo e empresas. Referente àquelas iniciativas no campo do governo
eletrônico, voltadas para o provimento de informações e serviços às
empresas. Exemplos: as compras pelo Estado através da internet por meio
de pregões e licitações, tomada de preços, etc. (Torres, 2004, p. 48). Os
exemplos comuns de B2G são licitações e compras de fornecedores.
o Government to Government (G2G): transações entre governo e governo.

Operações internas e relações intergovernamentais.
o M-commerce (Comércio Móvel): apresenta duas características que o

diferencia do e-commerce: mobilidade (os usuários podem carregar os
aparelhos móveis para onde quer que vão) e alcance amplo (que permite
que as pessoas possam ser alcançadas a qualquer hora) (TURBAN e KING,
2004, p. 270).

Fases e etapas de sistema de informação

• O ciclo de vida de um software, entre outras características, está
relacionado aos estágios de concepção, projeto, criação e
implementação (CESPE/Unb-2013).
• Nesse contexto, Sommerville destaca as quatro atividades

fundamentais do processos de software, comuns a todos eles, que
são:
Especificação de São definidas as funcionalidades do

Software software e restrições para sua operação.
Projeto e O software que atenda à especificação

Implementação de deve ser produzido.
Software
Validação de Software O software deve ser avaliado para

garantir que ele faça o que o cliente
deseja.
Evolução do Software O software evolui para atender às

necessidades de mudança do cliente.
Segundo o autor, essas atividades são organizadas de modo

diferente nos diversos processos de desenvolvimento. Como exemplo, no
modelo em cascata são organizadas em sequência, ao passo que, no
desenvolvimento evolucionário, elas são intercaladas. Como essas
atividades serão organizadas dependerá do tipo de software,
pessoas e estruturas organizacionais envolvidas.
• Pressman (2011) destaca que uma metodologia de processo genérica

para Engenharia de Software compreende cinco atividades:
Comunicação – Antes de iniciar o trabalho, é de vital importância

comunicar-se e colaborar com o cliente (e outros interessados, como:
executivos, usuários finais, engenheiros de software, o pessoal de
suporte, etc.). A intenção aqui é compreender os objetivos das partes
interessadas para com o projeto e fazer o levantamento das necessidades
que ajudarão a definir as funções e características do software.
Planejamento – Estabelecimento do plano de projeto de software,

que descreve as tarefas técnicas a ser conduzidas, os riscos prováveis, os
recursos que serão necessários, os produtos resultantes a ser produzidos
e um cronograma de trabalho.

Modelagem – Criação de modelos representativos do software

(para melhor entender as necessidades do software e o projeto que irá
atender a essas necessidades).
Construção – Essa atividade combina geração de código (manual

ou automatizada) e testes necessários para revelar erros na codificação.
Entrega (Implantação) – Entrega do produto ao cliente, que irá

avaliá-lo e fornecer feedback baseado na avaliação.
• As atividades metodológicas são complementadas pelas atividades de

apoio, como: controle e acompanhamento do projeto, administração de
riscos, garantia da qualidade, gerenciamento da configuração de software,
dentre outras.
• As sequências de atividades trazidas pelo Pressman e Sommerville são

essencialmente iguais e estão falando do mesmo processo: o
desenvolvimento de um software.
Deve-se notar ainda um aspecto do processo de software importante nesse

contexto, chamado fluxo de processo, destacado a seguir.
Fluxo de Processo
O fluxo de processo descreve como são organizadas as atividades
metodológicas, bem como as ações e tarefas que ocorrem dentro de
cada atividade em relação à sequência e ao tempo, como ilustrado nas
figuras desta seção.
1)Fluxo de Processo Linear

Executa cada uma das cinco atividades metodológicas em
sequência, começando com a de comunicação e terminando com a entrega
(ou emprego, ou implantação).
Figura. Fluxo de Processo Linear. Fonte: Pressman (2011)
2)Fluxo de Processo Iterativo

Repete uma ou mais das atividades antes de prosseguir para a
seguinte, conforme listado na próxima figura.

Figura. Fluxo de Processo Iterativo. Fonte: Pressman (2011)
3)Fluxo de Processo Evolucionário

Executa as atividades de forma “circular”. Cada volta pelas cinco
atividades conduz a uma versão mais completa do software.
Figura. Fluxo de Processo Evolucionário. Fonte: Pressman

(2011)
4)Fluxo de Processo Paralelo

Executa uma ou mais atividades em paralelo com outras atividades
(como por exemplo a modelagem para um aspecto do software poderia ser
executada em paralelo com a construção de um outro aspecto do software).
Figura. Fluxo de Processo Paralelo. Fonte: Pressman (2011)

Processo de Software
Processo de Software: é um conjunto de atividades, cuja meta é o
desenvolvimento ou a evolução do software.
No processo de software define-se um pequeno número de atividades de

arcabouço aplicáveis ao desenvolvimento de qualquer software, independente
do seu tamanho e complexidade. A seguir, apresentamos diferentes modelos
prescritivos de processo de software.
Modelos de Processo de Software

Todos os modelos de processo de software, segundo Pressman (2011) podem
acomodar as atividades metodológicas genéricas, aqui apresentadas, porém,
cada um deles dá uma ênfase diferente a essas atividades e define um
fluxo de processo que invoca cada atividade metodológica de forma
diversa.
Há vários processos de desenvolvimento propostos. Bezerra (2007) destaca que
é um consenso na comunidade de desenvolvimento de software o fato de que
não existe o melhor processo de desenvolvimento, aquele que melhor se aplica
a todas as situações de desenvolvimento. Segundo o autor, cada processo
tem suas particularidades em relação ao modo de arranjar e encadear
as atividades de desenvolvimento.
Existem vários modelos de processo de software propostos, vamos ao estudo
dos principais, importantes para a prova.
• Modelo em Cascata
Também chamado de clássico, ou linear, é o mais tradicional processo
de desenvolvimento de software.
Esse modelo sugere uma abordagem sequencial e sistemática para o
desenvolvimento de software, aplicando as atividades de maneira linear. Em
cada fase desenvolvem-se artefatos (produtos de software) que servem de
base para as fases seguintes.
Vide figura proposta por Pressman (2011) para esse modelo.
Figura. Modelo Cascata, segundo Pressman (2011)

Segundo proposta de Eduardo Bezerra, o modelo do ciclo de vida

clássico da engenharia de software é dividido em seis atividades. São
elas:
Em seguida, a proposta de Kruchten (2003).
O modelo em Cascata possui como vantagem principal a simplicidade

para a sua aplicação e gerência.
No entanto, algumas desvantagens podem ser observadas:
• projetos reais raramente seguem este fluxo sequencial.
• dificuldade do cliente em declarar todas as suas necessidades no início do
projeto.
• demora em apresentar resultados ao cliente.

Uma variação do modelo cascata, destacada por Pressman (2011) é o

modelo V. Segundo o autor, à medida que a equipe de software desce em
direção ao lado esquerdo do V, os requisitos básicos do problema são refinados
em representações progressivamente cada vez mais detalhadas e técnicas do
problema e de sua solução. Uma vez que o código tenha sido gerado, a equipe
sobe o V, realizando uma série de testes que validem cada um dos modelos
criados do outro lado do V.
Na realidade, segundo Pressman (2011) não existe diferença entre os
modelos. O modelo V fornece uma maneira para visualizar como a verificação e
as ações de validação são aplicadas ao trabalho de engenharia do ciclo de vida
em Cascata.
Figura. Modelo V. Fonte: Pressman (2011)
• Modelo Incremental
Este modelo foi proposto como uma alternativa ao modelo em cascata,
aplicando-o iterativamente, tendo como objetivo a elaboração de um
produto operacional a cada incremento. Os primeiros incrementos são versões
simplificadas do produto final, mas oferecem capacidades que servem ao
usuário, além de servir como uma plataforma de avaliação.
Em cada iteração uma parte é concebida como a menor unidade que pode ser
implementada e ainda assim fornecer alguma funcionalidade útil para os
usuários.

Os modelos incrementais combinam elementos dos fluxos de processos

lineares e paralelos.
Na figura seguinte, o modelo incremental aplica sequências lineares, de forma
escalonada, à medida que o tempo vai avançando. Cada sequência linear gera
“incrementais” (entregáveis/aprovados/liberados) do software.
Figura. Modelo Incremental. Fonte: Pressman (2011)

Este modelo possui como vantagem o fato de apresentar constantemente
novas versões aos usuários. Pode ser aplicado também quando não houver
mão-de-obra disponível para uma implementação completa, ou quando for
necessário gerenciar riscos técnicos.
A figura seguinte é bem mais interessante para ilustrar a diferença entre

incremental e iterativo!

Conforme destaca Pleeger (2004), para entender as diferenças entre o

desenvolvimento incremental e iterativo, pense em um pacote de
processamento de textos. Suponha que o pacote deva oferecer três tipos de
recursos: criar textos, organizar textos (ou seja, recortar e colar) e formatar
textos (como utilizar diferentes tamanhos e estilos de letras e números).
Para construir esse sistema utilizando o desenvolvimento incremental,

poderíamos fornecer, na Versão 1, somente a função de criação de textos. Na
Versão 2, poderíamos fornecer as funções de criação e organização de textos.
Finalmente, na Versão 3, ofereceríamos as três funções.
De outra maneira, utilizando o desenvolvimento iterativo, forneceríamos

formas primitivas das três funções logo na Versão 1. Por exemplo, podemos
criar textos e, então, recortar e colar partes deles, mas as funções de recortar e
colar podem ser ainda imperfeitas e lentas. Assim, na Versão 2, vamos dispor
da mesma funcionalidade, porém teremos aprimorado a qualidade; agora as
funções de recortar e colar são simples e rápidas. Cada versão aprimora a
anterior de algum modo.
• Prototipação (chamada também como Prototipagem)

O paradigma de prototipagem começa com a definição dos requisitos. Um projeto
rápido é realizado e concentra-se na representação daqueles aspectos que ficarão
visíveis pelo cliente. O protótipo é criado e avaliado e é ajustado para satisfazer as
necessidades do cliente.
Idealmente, o protótipo serve como um mecanismo para identificação dos requisitos do

software. A prototipagem pode ser problemática, pois o cliente vê o que parece ser
uma versão executável do software, ignorando que o protótipo apenas consegue
funcionar precariamente.
Processo de desenvolvimento de protótipo
Nesse contexto:
• o cliente não possui uma visão clara de todos os requisitos da aplicação;
• o cliente quer avaliar a viabilidade de desenvolvimento da aplicação;

• o cliente alocará um usuário-chave no projeto, em tempo integral, a fim de

que este possa participar ativamente de todas as fases do projeto;
• o cliente gostaria de ter uma versão preliminar do sistema, com base em

uma versão inicial dos requisitos, ainda que isto demande um investimento
inicial.
Em algumas situações, o cliente consegue definir apenas um conjunto de

objetivos gerais do software, não identificando claramente seus requisitos. Em
uma situação dessas, a Prototipação (Prototipagem) pode ser empregada
em conjunto com outros modelos para auxiliar no entendimento do sistema.
Os objetivos do software são estabelecidos na comunicação com o cliente.

A partir daí, um protótipo descartável é elaborado com o intuito de facilitar a
compreensão do sistema por parte dos usuários.
Apesar da prototipagem poder ser aplicada como um modelo, em geral

ela é mais utilizada como uma técnica para entendimento do sistema. A
próxima figura apresenta o esquema deste modelo.
Figura. O Paradigma da Prototipação. Fonte: Pressman (2011)
Vantagens da prototipagem:
• Maior participação e comprometimento dos clientes e usuários; e
• Os resultados são apresentados mais rapidamente.

Críticas:
• Forte dependência das linguagens e ambientes utilizados, bem como

da experiência da equipe;
• o cliente tende a considerar o protótipo como versão final, podendo

comprometer a qualidade do projeto; e
• o desenvolvedor tende a fazer concessões na implementação, a fim

de colocar um protótipo em funcionamento rapidamente. Estas
concessões podem se tornar parte integrante do sistema.
Veja os tipos de prototipação no processo de software:
-Prototipação Evolucionária
Uma abordagem para o desenvolvimento do sistema em que um protótipo
inicial é produzido e refinado através de vários estágios até atingir o sistema
final.
Na Prototipação Evolucionária, o protótipo evolui até se transformar no
próprio produto entregue ao cliente, enquanto na Prototipação Descartável o
protótipo é utilizado para esclarecer requisitos e avaliar riscos, sendo
descartado ao final do processo.
O objetivo da prototipação evolucionária é fornecer aos usuários finais um
sistema funcionando. O desenvolvimento começa com aqueles requisitos que
são melhores compreendidos.
-Prototipação Descartável
Um protótipo o qual é usualmente uma implementação prática do sistema
é produzida para ajudar a levantar os problemas com os requisitos e depois
descartado. O sistema é então desenvolvido usando algum outro processo de
desenvolvimento.
O objetivo da prototipação descartável é validar ou derivar os requisitos
do sistema. O processo de prototipação começa com aqueles requisitos que não
são bem compreendidos.

Pontos-chave
• Um protótipo de sistema pode ser usado para dar aos usuários finais uma
impressão concreta das capacidades desse sistema.
• A prototipação está se tornando cada vez mais comum para o
desenvolvimento de sistema onde o desenvolvimento rápido é essencial.
• Protótipos descartáveis são usados para a compreensão dos requisitos do
sistema.
• Na prototipação evolucionária, o sistema é desenvolvido pela evolução de
uma versão inicial em uma versão final do sistema.
• O desenvolvimento rápido é importante na prototipação de sistemas. Isso
pode levar à exclusão de algumas funcionalidades do sistema ou na
diminuição dos requisitos não funcionais.
• Entre as técnicas de prototipação estão o uso de linguagens de nível muito
elevado, a programação de bando de dados e a construção de protótipos a
partir de componentes reutilizáveis.
• A prototipação é essencial para o desenvolvimento de interfaces com o
usuário, as quais são difíceis de serem especificadas usando um modelo
estático. Os usuários deveriam estar envolvidos na avaliação e na evolução
do protótipo.
• Modelo Espiral
No modelo Espiral, assume-se que o processo de desenvolvimento
ocorre em ciclos, cada um contendo fases de avaliação e planejamento em
que a opção de abordagem para a próxima fase (ou ciclo) é determinada.
Neste modelo acrescenta-se a Análise dos Riscos ao ciclo de vida
para auxiliar as decisões a respeito da próxima iteração. A figura seguinte
apresenta o esquema desse modelo.

Figura. O Modelo Espiral Típico. Fonte: Pressman (2011)

No modelo de processo de desenvolvimento em espiral, cada loop na
espiral representa uma fase do processo de software. Este modelo exige a
consideração direta dos riscos técnicos em todos os estágios do projeto e,
se aplicado adequadamente, deve reduzir os riscos antes que eles se tornem
problemáticos.
Apesar desse modelo reunir as melhores características dos outros,
algumas críticas podem ser feitas:
• exige gerentes e técnicos experientes;
• uma vez que o modelo em espiral pode levar ao desenvolvimento em
paralelo de múltiplas partes do projeto, as tarefas gerenciais para
acompanhamento e controle do projeto são mais complexas;
• é necessário o uso de técnicas específicas para estimar e sincronizar
cronogramas, bem como para determinar os indicadores de custo e
progresso mais adequados.
• RAD (Rapid Application Development - Desenvolvimento Rápido de

Aplicação)
Trata-se de um modelo de processo de software incremental que
enfatiza um ciclo de desenvolvimento curto. É uma adaptação “de alta
velocidade” do modelo em cascata, no qual o desenvolvimento rápido é
conseguido com o uso de uma abordagem de construção baseada em
componentes.
Desvantagens: projetos grandes precisam de muitas equipes; exige
comprometimento dos clientes e desenvolvedores; sistemas não
modularizados são problemáticos; não é adequado para projetos com grandes
riscos técnicos.

• RUP (Rational Unified Process)

O Rational Unified Process (RUP) é um exemplo de modelo de
processo de desenvolvimento baseado no Unified Process (Processo Unificado)
desenvolvido pela Rational.
O RUP oferece uma abordagem baseada em disciplinas para atribuir
tarefas e responsabilidades dentro de uma organização de desenvolvimento.
Sua meta é garantir a produção de software de alta qualidade que atenda às
necessidades dos usuários dentro de um cronograma e de um orçamento
previsíveis.
O Rational Unified Process é um processo de desenvolvimento
iterativo e incremental, no qual o software não é implementado em um
instante no fim do projeto, mas é, ao contrário, desenvolvido e implementado
em partes. A cada iteração deste processo utiliza-se quatro fases, a saber:
Concepção, Elaboração, Construção e Transição.
Os projetos variam de acordo com o volume de formalidade que eles têm.
Projetos de muita formalidade têm muitos documentos formais a serem
entregues, reuniões formais, encerramentos formais. Projetos de pouca
formalidade podem ter uma fase de concepção que consiste de um bate-papo
de uma hora com o patrocinador do projeto e um plano que cabe em uma folha
de papel. Naturalmente quanto maior o projeto, mais formalidade precisa. O
fundamental de cada fase ainda acontece, mas de formas bem diferentes.
Após a fase de Transição de uma iteração completa, o produto pode voltar
a percorrer cada uma das fases para se produzir uma nova versão do produto.

Cada uma das quatro fases do RUP é dividida em iterações, onde

cada uma delas é um ciclo completo de desenvolvimento resultando em uma
versão de um produto executável que constitui um subconjunto do produto
final. Cada iteração é organizada em fluxos de trabalho (workflows) de
processo, com uma ênfase diferente em cada fase.
A figura ilustrada a seguir apresenta o relacionamento entre as fases e o
esforço de desenvolvimento em cada fluxo de trabalho de processo.
O RUP é composto por nove disciplinas e quatro fases!!!!
Figura. Fases e disciplinas do RUP. Fonte: (KRUCHTEN, 2003)
• Processo Ágil
A Engenharia de Software vem há anos criando técnicas de modelagem,
projeto e desenvolvimento de sistemas. Dentre os desafios dos pesquisadores
da área, pode-se citar a preocupação em desenvolver softwares com qualidade
garantida, no prazo estabelecido e sem alocar recursos além do previsto. No
entanto, muitas das metodologias criadas são consumidoras de muitos
recursos, aplicando-se principalmente a grandes sistemas.
Como a Engenharia de Software ainda está evoluindo, novos modelos
estão sendo apresentados, como: desenvolvimento ágil; dentre outros. Aqui
merecem destaque o SCRUM e eXtreme Programming

Visão Geral Sobre o Processo de Desenvolvimento de Software

• Há vários processos de desenvolvimento propostos.
• Bezerra (2007) destaca que é um consenso na comunidade de

desenvolvimento de software o fato de que não existe o melhor processo
de desenvolvimento, aquele que melhor se aplica a todas as
situações de desenvolvimento. Cada processo tem suas
particularidades em relação ao modo de arranjar e encadear as
atividades de desenvolvimento. Entretanto, podem-se distinguir
atividades que, com uma ou outra modificação, são comuns à maioria dos
processos existentes.
São elas:
**Modelagem de Negócio (Também chamada de Modelagem de

Processos de Negócio, Análise do Domínio ou Análise do Negócio)
Bezerra (2007, p. 28) destaca que na análise do domínio um primeiro
objetivo é identificar e modelar os objetos do mundo real que, de alguma
forma, serão processados pela aplicação em desenvolvimento.
Como exemplo Bezerra cita que um aluno é um objeto do mundo real que um
sistema
de controle acadêmico deve processar. Dessa forma, aluno é um objeto do
domínio.
Uma característica da análise do domínio é que os objetos identificados

fazem sentido para os especialistas do domínio, por conta de
corresponderem a conceitos com os quais esses profissionais lidam diariamente
em seu trabalho. Por isso,
segundo Bezerra (2007), na análise de domínio, os analistas devem interagir
com os
especialistas do domínio. Outros exemplos de objetos do domínio Instituição de
Ensino
são: professor, disciplina, turma, sala de aula, etc.
Outro objetivo da análise de domínio, mencionado por Bezerra (2007) é

identificar as regras do negócio e os processos do negócio realizados
pela organização.
**Engenharia de Requisitos
É o uso sistemático de princípios, técnicas, linguagens e ferramentas
comprovadas
para análise, documentação, evolução continuada das necessidades dos
usuários e

especificação do comportamento externo de um sistema para satisfazer as

necessidades do usuário, que sejam efetivas em termos de custos. Visa,
principalmente, o entendimento escrito do problema.
Algumas considerações importantes:

• É uma abordagem sistemática, ou seja, constituída por um conjunto de
processos estruturados para extrair, validar e manter os requisitos de um
sistema;
• Constitui a ponte entre a comunicação com o cliente, a documentação
gerada, o projeto e o desenvolvimento.
O objetivo do processo de engenharia de requisitos é criar e manter um

documento de requisitos de sistema.
O processo de Engenharia de Requisitos, seguindo a abordagem do
Sommerville
(2007), inclui:
• estudo de viabilidade;
• elicitação e análise de requisitos;
• especificação de requisitos;
• validação de requisitos;
• gerenciamento de requisitos.
Sommerville (2007) destaca que esses subprocessos estão

relacionados à avaliação de se o sistema é útil para a empresa (estudo
de viabilidade), obtenção de requisitos (elicitação e análise), conversão
desses requisitos em alguma forma-padrão (especificação) e
verificação de se os requisitos realmente definem o sistema que o
cliente deseja (validação).
Figura. Processo de Engenharia de Requisitos

Fonte: Sommerville (2007)

A Engenharia de Requisitos, segundo Pressman (2011), é composta por 7

tarefas distintas, que são:
1. Concepção;
2. Levantamento;
3. Elaboração;
4. Negociação;
5. Especificação;
6. Validação;
7. Gestão de Requisitos.
**ANÁLISE
Conceitos Gerais
Podemos definir “análise” como o processo de decompor o todo em suas
partes componentes, examinando estas partes, conhecendo sua natureza,
funções e relações.
A tarefa de construir Sistemas de Informação é bastante complexa,
configurando-se, na realidade em um processo de solução de problemas. Neste
sentido, dizemos que a análise de sistemas consiste nos métodos e técnicas de
avaliação e especificação da solução de problemas, para implementação em
algum meio que a suporte, utilizando mecanismos apropriados. É uma etapa no
processo de desenvolvimento de software.
Segundo Pressman todos os métodos de análise devem ser capazes de
suportar 5 atividades:
• representar e entender o domínio da informação;
• definir as funções que o software deve executar;
• representar o comportamento do software em função dos
eventos externos;
• particionar os modelos de informação, função e comportamento
de maneira a apresentar os detalhes de forma hierárquica;
• prover a informação essencial em direção à determinação dos
detalhes de implementação.
Para que a análise seja bem feita devemos não só entender o que vamos
fazer, mas também desenvolver uma representação que permita que outros
entendam o que é necessário para que o sistema que está sendo desenvolvido
atinja sua finalidade.
A grande maioria dos autores advoga que não devemos levar em conta a
tecnologia que empregaremos durante a análise de sistemas.
A análise deve se preocupar com “o que fazer” e nunca com o
“como fazer”. Para isso, fazemos a modelagem dos sistemas, utilizando
abstrações.

Abstração
Abstração é o processo mental de separar um ou mais elementos de
uma totalidade complexa, de forma a facilitar a sua compreensão. No nosso dia
a dia utilizamos a abstração para poder trabalhar com toda a informação que o
mundo nos fornece.
Rumbaugh destaca abstração como uma habilidade mental que permite
aos seres humanos visualizarem os problemas do mundo real com vários graus
de detalhe, dependendo do contexto corrente do problema.
Em outras palavras, abstração é a habilidade de concentrar nos aspectos
essenciais de um contexto qualquer, ignorando características menos
importantes ou acidentais.
Em uma modelagem orientada a objetos, cabe destacar que uma classe
é uma abstração de entidades existentes no domínio do sistema de software.
Um objeto é uma ocorrência específica (instância) de uma classe.
Como exemplo, imagine a abstração referente à classe Animais. Há
várias entidades na classe Animais como Anfíbios, Répteis e Mamíferos que são
também sub-classes da classe Animais, onde há objetos que contêm cada sub-
classe como Ser humano, Jacaré e outros.
ATENÇÃO AQUI!
Objetos
• Representam elementos do mundo real.
• É uma abstração de conjunto de coisas do mundo
real.
• Possuem:
Atributos (estado)
Operações (comportamento).
• O único acesso aos dados desse objeto é através de suas operações.
Classes
• Permitem que sejam representados no mundo computacional elementos
do mundo real, ou seja, do problema para o qual o software está sendo
desenvolvido.
• Elas permitem descrever um conjunto de objetos que compartilhem os
mesmos atributos, operações, relacionamentos e semântica, e
representam o principal bloco de construção de um
software orientado a objetos.

• Representam os tipos de objetos existentes no modelo, e são descritas a

partir de seus atributos, métodos e restrições.
A figura seguinte apresenta a simbologia para uma CLASSE

chamada ContaBancaria, utilizando a linguagem UML.
Figura. Classe ContaBancaria
Com as classes definidas, precisam-se especificar quais são seus

ATRIBUTOS (propriedades que caracterizam um objeto). Por
exemplo, uma entidade conta bancária possui como atributos o número e
o saldo. É bastante simples identificar os atributos de cada classe, basta
identificar as características que descrevam sua classe no domínio
do problema em questão. Cabe destacar que os atributos identificados
devem estar alinhados com as necessidades do usuário para o problema.
A figura seguinte apresenta a classe ContaBancaria com alguns de
seus atributos.
Figura. Classe ContaBancaria com alguns atributos

Identificadas as classes e seus atributos, o próximo passo é a
identificação das OPERAÇÕES de cada classe, também chamadas de
métodos ou serviços.
Fazendo um paralelo com objetos do mundo real, operações são
ações que o objeto é capaz de efetuar. Dessa forma, ao procurar por
operações, devem-se identificar ações que o objeto de uma classe é
responsável por desempenhar dentro do escopo do sistema que será
desenvolvido.
A figura seguinte apresenta algumas operações da classe
ContaBancaria. Ao contrário dos atributos, normalmente operações são
públicas, permitindo sua utilização por outras classes e objetos.

Figura. Classe ContaBancaria com seus atributos e operações
Modelagem
Como visto, um modelo é uma representação abstrata de algo real.
Ele tem o objetivo de imitar a realidade, para possibilitar que esta seja
estudada quanto ao seu comportamento. Os modelos permitem focalizar a
atenção nas características importantes do sistema, dando menos
atenção às coisas menos importantes. Seu uso torna o estudo mais barato e
seguro: é muito mais rápido e barato construir um modelo do que construir a
coisa “real”.
O objetivo do modelo é mostrar como será o sistema, para
permitir sua inspeção e verificação, a fim de poder receber alterações e
adaptações antes de ficar pronto. Qualquer modelo realça certos
aspectos do que está sendo modelado, em detrimento dos outros.
A ferramenta utilizada para modelar influi diretamente na forma como
pensamos sobre a realidade e determina quais aspectos serão mostrados e
quais ficarão escondidos.
Para modelarmos sistemas, necessitamos de ferramentas com as
seguintes características:
• Gráficas: com apoio de textos, como um mapa – legíveis, concisas e
padronizadas. A parte gráfica divide o sistema em componentes
interrelacionados, sem restrições de um texto linear. A parte textual
descreve os componentes e suas interconexões.
• Particionáveis: do geral para o específico, como atlas, tornando o
modelo mais fácil de entender. Precisamos ser capazes de ter a visão
geral do sistema sem nos preocupar com detalhes e de vermos o detalhe
sem perder a noção do todo.
• Rigorosas: como as escalas de uma planta. O modelo deve ser preciso,
sem erros, incompletudes e redundâncias. Porém, deve ser flexível e fácil
de mudar, pois o sistema está sempre em constante evolução.
• Capazes de predizer o comportamento do sistema: como um
protótipo.

• Capazes de mostrar pontos críticos do sistema: como fotos de vários

ângulos, com simplicidade. Cada modelo deve ser uma projeção do
sistema em um espaço simplificado.
O Papel do Analista
O Analista de Sistemas assume o papel de elo entre os usuários e o
computador. Ele deverá entender e avaliar as necessidades e expectativas de
cada usuário, a fim de que estas sejam organizadas e especificadas seguindo
uma formalidade técnica.
O analista deve ser capaz de lidar, ao mesmo tempo, com um grupo de
usuários, outros profissionais de informática e um corpo administrativo
(gerentes/diretores), cada qual trazendo formações, pontos de vistas,
vivências, experiências e maturidade totalmente distintas.
Os usuários, ou estarão preocupados em dinamizar seu serviço, tornando-
o automático e extremamente rápido, aumentando a confiabilidade de
resultados, ou ainda, estarão com medo da informatização, às vezes, até
obstruindo o trabalho do Analista de Sistemas. O pessoal técnico estará se
preocupando com aspectos de performance, estruturas de dados, topologia de
hardware e diversidade de recursos. Por fim, na administração, muitas vezes
estão aqueles que só querem saber do retorno sobre o investimento e a
proporção custo/benefício.
Por estes motivos, Yourdon alerta que a capacidade do analista não deve
estar restrita a fazer diagramas e modelos. Ele deve ter habilidade com as
pessoas, conhecimento do negócio da empresa e domínio da tecnologia.
Conceitos Principais Relacionados à Análise Estruturada

• A análise estruturada é uma metodologia para desenvolvimento de
sistemas que surgiu em meados da década de 70.
• Seu principal conceito é a construção de um modelo lógico (não físico)
de um sistema, utilizando-se de gráficos capazes de levar usuários e
analistas a formarem um quadro claro e geral do sistema e de como as
suas partes se encaixam para atender às necessidades daqueles que dele
precisam.
• O trabalho realizado com análise estruturada é também denominado
Modelagem Funcional.
o Este tipo de modelagem tem como objetivo definir O QUE o
sistema deve fazer.
o A modelagem faz uso de técnicas que exigem que a análise de um
sistema seja representada por agentes externos, processos (ou
funções), comunicações entre esses processos (fluxos de dados) e

os dados necessários para que os processos façam seu trabalho

(depósitos de dados).
• Esta metodologia envolve a construção de um sistema de forma top-

down (do geral para o particular), por meio de refinamentos
sucessivos, produzindo primeiro um fluxo de dados global do sistema,
para depois desenvolver fluxos detalhados. São então detalhadas as
estruturas de dados e a lógica dos processos.
• A análise estruturada usa linguagens (gráficas ou formais) que têm o

poder de restringir as interpretações possíveis do que queremos dizer e
que constituem as ferramentas usadas. Entre essas destacamos o
Diagrama de Fluxo de Dados (DFD), o Dicionário de Dados (DD) e
o Diagrama de Transição de Estados (DTE).
• O DFD é uma representação em rede dos processos (funções) do

sistema e dos dados que ligam esses processos. Ele mostra “o que”
o sistema faz e não “como” é feito. É a ferramenta de central da análise
estruturada, descrevendo o modelo funcional.
o Um DFD apresenta as partes componentes de um sistema e as
interfaces entre elas, formando um conjunto integrado de
procedimentos.
• Na elaboração de um DFD utilizaremos quatro símbolos que nos

permitirão debater e apresentar ao usuário todo o processo, sem
assumir nenhum compromisso com implementações e sem a
preocupação com a hierarquização e tomadas de decisão. Cada um
desses símbolos tem um nome e possivelmente um rótulo associado:

1 Processo (ou Bolha)

O processo mostra uma parte do sistema que realiza um
processamento. Os sinônimos mais conhecidos são bolha e função.
Logicamente, é necessário descrever a função de cada processo, sendo
atribuída uma identificação única para cada um.
CALCULAR
IMPOSTO
SOBRE
VENDAS
2 Fluxo de Dados
Podemos associar cada fluxo de dados com um “tubo” por onde
passam pacotes de dados. O fluxo é utilizado para mostrar o movimento
de informações de um ponto a outro do sistema.
Faremos referência ao Fluxo de Dados anotando seu nome, que
representa uma descrição do seu conteúdo, ao longo de sua extensão. Lembre-
se de que a descrição deve ser mais clara possível, de modo a simplificar o
trabalho do usuário que irá realizar a revisão do DFD.
O fluxo também mostra direção: uma seta em uma das extremidades
do fluxo (ou em ambas) indica de os dados entram ou saem do processo (ou as
duas coisas). Um fluxo com duas setas é chamado de diálogo.

3 Depósito de Dados
O depósito é usado para modelar uma coleção de dados em
repouso. Normalmente o nome escolhido para identificar o depósito é colocado
no plural.
Embora seja tentador referir-se aos depósitos como arquivos ou banco de
dados, é preciso manter a distinção entre a representação lógica e a
implementação.
O depósito pode existir devido a um requisito básico do usuário ou devido

a um aspecto de implementação. No primeiro caso, o depósito funciona como
uma área de armazenamento de espera entre dois processos que
ocorrem em momentos diferentes, independente da tecnologia que será usada
para implementar o sistema. No segundo caso, o depósito é criado devido a
restrições tecnológicas, como por exemplo, memória insuficiente ou hardware
não confiável.
4 Entidade
Identificamos como entidade, na maioria das vezes, categorias lógicas
de coisas ou pessoas que representam uma origem ou destino de
transações (Clientes, Fornecedores, Empregados, etc.). Também podemos
identificar como Entidades fontes ou destinos específicos tais como
Departamentos da empresa, Receita Federal, Almoxarifado.
É comum adotarmos a terminologia Entidade Externa, já que estão
sendo representados objetos que estão fora do controle do sistema que está
sendo modelado.
Quando um sistema recebe dados resultantes de outro sistema, ou gera
informações que servirão como dados de entrada para outro sistema, esse
outro sistema também é identificado como uma Entidade Externa.
Os fluxos que interligam as entidades externas aos diversos processos

representam a interface entre o sistema e o mundo externo. A entidade
externa é sempre um elemento ATIVO. Ela aciona processos, mediante o
envio de estímulos, representados pelos fluxos.

Observações:
• Um DFD não descreve uma sequência de execução ou qualquer
outra relação de controle. Se um fluxo indica que os dados passam
de um processo A para um processo B, é possível que A chame B, B
chame A ou ainda que um processo superior chame os dois e faça a
transferência dos dados.
• O DFD também não fornece nenhuma informação sobre a lógica
de execução, como repetições ou condições. Qualquer fluxo de
dados ou processo presente pode ou não executar, uma ou mais vezes.
• Finalmente, o DFD também não informa se algo acontece (ou
seja, se os fluxos de dados realmente comunicam os dados entre os
processos), mas sim que algo pode acontecer (ou seja, que é possível
que um processo envie seus fluxos de dados).
• Em um DFD de Contexto todo o sistema é representado por
apenas um processo. Não aparecem depósitos de dados internos ao
sistema em um DFD de Contexto, apenas entidades externas e
depósitos que pertençam a outros sistemas e que são utilizadas pelo
sistema sendo descrito. Geralmente o DFD de Contexto é o primeiro
diagrama de um DFD nivelado.
Alguns autores chamam de DFD nível zero o DFD de Contexto. Outros

chamam de DFD nível zero o DFD gerado pela expansão do processo que
aparece no DFD de Contexto. Ficaremos com a segunda opção, isto é: o
primeiro DFD é o de Contexto, contendo um único processo. Esse
processo é expandido para o DFD nível zero, que
contém um número razoável de processos.
Alguns autores preconizam que cada nível de DFD deve ter de 5 a 9 processos
(funções). Esta é uma boa maneira de se tratar a complexidade do sistema,
visto que um DFD com inúmeras funções é de difícil leitura.

Sempre que ocorre particionamento, deve ser garantida a consistência entre as

entradas e saídas de cada dois níveis de particionamentos sucessivos. Este
princípio é o de conservação de dados, pois dados não podem aparecer do
nada, como não podem desaparecer entre níveis consecutivos.
Dicionários de Dados (DD)

O dicionário de dados é um repositório de dados sobre os dados do
software. Ele deve fornecer informações sobre a definição, a estrutura
e a utilização de cada elemento de dados que o sistema utiliza. Um
Elemento de Dado é uma unidade de dados que não pode ser decomposta.
Diagrama de Transição de Estados (DTE)

Representa o comportamento de um sistema, descrevendo seus
estados e os eventos que fazem com que o sistema mude de estado,
devendo apresentar um único estado inicial e 0 ou vários estados finais!
O Paradigma da Orientação a Objetos

A expressão “orientado a objetos" significa que o software é organizado
como uma coleção de objetos separados que incorporam tanto a estrutura
quanto o comportamento dos componentes do sistema.
Isto é diferente da programação convencional, em que a estrutura
e o comportamento dos dados têm poucos vínculos entre si.
Aspectos da Orientação a Objetos

A orientação a objetos possui diferentes aspectos que a definem, as quais
podem variar de acordo com o autor.
1 Classificação
Classificação significa que os objetos com a mesma estrutura de dados
(chamados atributos) e o mesmo comportamento (chamados operações ou
métodos) são agrupados em uma classe. Classe é uma abstração que
descreve propriedades importantes para uma aplicação e ignora o restante.
A escolha de classes depende da aplicação. Cada classe descreve um
conjunto possivelmente infinito de objetos individuais e cada objeto é
uma instância de sua classe.
Uma instância da classe tem seu próprio valor para cada atributo, mas
compartilha os nomes de atributos e operações com outras instâncias da
mesma classe.

2 Identidade
Identidade é a subdivisão dos dados em entidades discretas e distintas,
que são objetos. Cada objeto tem sua própria identidade, ou seja, são distintos
mesmo que todos os valores de seus atributos sejam idênticos, como nome e
tamanho, por exemplo.
No mundo real, um objeto limita-se a existir, mas no que se refere à
linguagem de programação, cada objeto possui um ÚNICO indicador, pelo
qual ele pode ser referenciado sem erros.
3 Ênfase na Estrutura de Objetos

O desenvolvimento baseado em objetos dá maior ênfase na estrutura de
dados (em comparação com a estrutura de procedimentos) do que as
metodologias tradicionais de decomposição funcional.
O desenvolvimento baseado em objetos é similar às técnicas de
modelagem de informações utilizadas no projeto de bancos de dados,
acrescentando o conceito de comportamento dependente da classe.
4 Compartilhamento
O compartilhamento (herança) da estrutura de dados e do seu
comportamento permite que a estrutura comum seja compartilhada por
diversas subclasses semelhantes, sem redundâncias. O desenvolvimento
baseado em objetos não somente permite que as informações sejam
compartilhadas como também oferece a possibilidade da reutilização de
modelos e códigos em projetos futuros.
Uma das principais vantagens das linguagens baseadas em objetos é o
compartilhamento de código com utilização de herança, a qual reduz o trabalho
de codificação e mostra o conceito proveniente de que as diferentes operações
são, na realidade, as mesmas.
5 Polimorfismo
É quando a MESMA operação pode atuar de modos diversos em
classes diferentes. Uma operação é uma ação (ou transformação) que um
objeto executa (ou a que ele está sujeito). Uma implementação específica de
uma operação por uma determinada classe é chamada de método.
Pode haver mais de um método para a implementação de um operador
baseado em objetos, pois ele é polimórfico.
6 Encapsulamento
O encapsulamento, também conhecido como ocultamento de
informações, consiste na separação dos aspectos externos de um

objeto, acessíveis por outros objetos, dos detalhes internos da

implementação daquele objeto.
O encapsulamento impede que um programa se torne tão dependente que
uma pequena modificação possa causar grandes efeitos de propagação.
Modelagem Orientada a Objetos

A UML (Unified Modeling Language - Linguagem Unificada para
Modelagem ou UML) é a linguagem mais utilizada atualmente para
especificação e projeto de software na abordagem orientada a objetos.
A UML é o instrumento que permite a modelagem do software “visualmente”,
tornando fácil partir dos requisitos do sistema à implementação de uma forma
amigável.
Análise Orientada a Objetos x Análise Estruturada

O objetivo da Análise Orientada a Objetos é desenvolver uma série de
modelos que descrevem como o software irá se “comportar” para satisfazer
seus requisitos. Logo, a preocupação maior desta fase é representar “O
QUE” o sistema irá fazer, sem considerar “como”. Como na Análise
Estruturada, constroem-se modelos que representam diversas perspectivas,
descrevendo o fluxo de informações, as funções e o comportamento do sistema
dentro do contexto dos elementos do sistema. No entanto, diferentemente da
Análise Estruturada, aplica-se aqui os conceitos do paradigma da
Orientação a Objetos para realizar-se o estudo do sistema, buscando-se
um desenvolvimento mais adequado.
Seguindo os modelos do processo de software, a Análise Orientada a Objetos é

realizada a partir dos documentos de Especificação de Requisitos do software,
os quais descrevem, principalmente, as funcionalidades esperadas do sistema.
Nesta fase produz-se um conjunto de diagramas que descrevem as
características do software. Deve-se ressaltar que o emprego dos diagramas
difere de acordo com as características do sistema. Pode-se ainda desenvolver
um Dicionário de Dados descrevendo os componentes dos diagramas. Ao final
desta fase, se possível, deve-se revisar os documentos juntamente com
representantes do cliente.
Os diagramas produzidos nesta fase são modelos gráficos representativos do

sistema. Os diagramas gerados podem (e devem) ser empregados para a
prototipação do sistema, podendo-se avaliar se ele cumpre realmente seus
requisitos. Na Análise Orientada a Objetos, podem-se empregar
diferentes diagramas da UML, de acordo com a necessidade do projeto.
**PROJETO (Desenho)

Bezerra (2007) destaca que o foco principal da ANÁLISE são os

aspectos lógicos e independentes de implementação de um sistema (os
requisitos).
Já NA FASE DE PROJETO, determina-se “COMO” o sistema funcionará
para atender aos requisitos, de acordo com os recursos tecnológicos
existentes (a fase de projeto considera os aspectos físicos e
dependentes de implementação).
Aos modelos construídos na fase de análise são adicionadas as restrições
de tecnologia (Bezerra, 2007). Como exemplos de aspectos a serem
considerados na fase de projeto temos: arquitetura do sistema, padrão de
interface gráfica, a linguagem de programação, o gerenciador de banco de
dados, etc.
Essa fase produz uma descrição computacional do que o software
deve fazer e deve ser coerente com a descrição feita na análise. Em alguns
casos, algumas restrições da tecnologia a ser utilizada já foram amarradas no
levantamento dos requisitos. Em outros casos, essas restrições devem ser
especificadas. Mas, em todos os casos, a fase de projeto do sistema é
direcionada pelos modelos construídos na fase de análise e pelo planejamento
do sistema (Bezerra, 2007).
O projeto servirá como fundamento para as fases de codificação, teste e
manutenção.
IMPLEMENTAÇÃO
Nessa fase o sistema é codificado, ou seja, ocorre a tradução da
descrição computacional obtida na fase de projeto em código
executável mediante o uso de uma ou mais linguagens de programação
(Bezerra, 2007).
Em um processo de desenvolvimento orientado a objetos, a

implementação envolve a criação do código-fonte correspondente às classes de
objetos do sistema utilizando linguagens de programação como C++, Java etc.
Além da codificação desde o início, a implementação pode também reutilizar
componentes de software, dentre outros (Bezerra, 2007).

É importante observar o foco de cada desenvolvimento. No

Desenvolvimento Estruturado, o foco é o processamento dos sistemas, já no
Desenvolvimento Orientado a Objetos os componentes do sistema são
priorizados. Isto é diferente da programação convencional, em que a
estrutura e o comportamento dos dados têm poucos vínculos entre si.
TESTES
Diversas atividades de teste são realizadas para verificação do sistema

construído, levando-se em conta a especificação feita na fase de projeto. O
principal produto dessa fase é o relatório de testes, que contém informações
sobre erros detectados no software. Após a atividade de testes, os diversos
módulos do sistema são integrados, resultando finalmente no produto de
software (Bezerra, 2007).
Antes de continuar, gostaria de reforçar o entendimento de que o teste

NÃO é uma fase que deve ser executada ao final do projeto, mas uma
atividade que deve ser exercida ao longo do processo de
desenvolvimento do software.
Teste de software é uma atividade cara que exige tempo, planejamento,

conhecimento técnico, infraestrutura e comprometimento.
Por maior e mais organizado que seja o esforço para a realização das
atividades de testes, é impossível garantir 100% de cobertura de todos os
requisitos ou linhas de código existentes no sistema.
Edsger Dĳ kstra sabiamente resumiu este fato com a seguinte frase:

“Testes podem mostrar a presença de erros, mas não a sua ausência”. Dessa
forma, está em suas mãos a responsabilidade de conhecer e aplicar as melhores
práticas na gestão de testes para garantir a maior cobertura com o mínimo de
esforço.
Algumas observações:

• Teste de Integração: as equipes de testes têm acesso ao código-fonte do

sistema. Quando um problema é descoberto, a equipe de integração tenta
encontrar a origem do problema e identificar os componentes que devem ser
depurados. Os testes de integração geralmente estão relacionados à
descoberta de defeitos no sistema (SOMMERVILLE, 2007).
• Teste de Unidade: os pequenos elementos passíveis de teste são testados

individualmente, geralmente ao mesmo tempo em que são implementados
(KRUCHTEN, 2003).
• Testes “Caixa-Preta” (Black Box): analisam a funcionalidade e a

aderência aos requisitos, em uma ótica externa ou do usuário, sem se
basear em qualquer conhecimento do código e da lógica interna do
componente testado;
• Teste de Caixa Branca: é uma abordagem para projetar casos de teste na

qual os testes são derivados do conhecimento da estrutura e da
implementação do software. O entendimento do algoritmo usado em um
componente pode ajudar a identificar partições e casos de teste adicionais
(SOMMERVILLE, 2007). O teste “caixa-branca” avalia a lógica interna
do sistema!
Figura. Estratégia de Teste (Pressman, 2011)
IMPLANTAÇÃO
Nessa fase o sistema é empacotado, distribuído e instalado no ambiente do

usuário. Os manuais do sistema são escritos, os arquivos são carregados, os
dados são importados para o sistema, e os usuários treinados para utilizar o
sistema corretamente. Em alguns casos, aqui também ocorre a migração de
sistemas de software e de dados preexistentes (Bezerra, 2007).

HOMOLOGAÇÃO
É a etapa em que o cliente deverá testar as funcionalidades do sistema que

serão posteriormente colocadas em produção ou refeitas.
MANUTENÇÃO
Processo de melhoria e otimização de um software já desenvolvido (versão de

produção), como também reparo de defeitos.
Tipos de manutenção de software:
• Corretiva: Faz correção de erros encontrados na verificação ou na

validação;
• Adaptativa: Adaptação a mudanças externas;
• Melhoria (perfectiva): Melhorias requeridas pelos usuários;
• Preventiva ou de reengenharia: Abordagem proativa com foco na

melhoria da manutibilidade.

Memorex

Figura - Fases do CRISP-DM Process Model (Baseado em [The CRISP-

DM Consortium, 2000])
2. Atividades Básicas de um Sistema de Informação

3. Sistema Integrado de Gestão, também conhecido como Sistema de

Gestão Integrada ou ERP (Enterprise Resource Planning): é um
sistema de informação com módulos integrados que dão suporte a diversas
áreas operacionais, tais como vendas/marketing, manufatura/ produção,
finanças, contabilidade e recursos humanos.
Figura. Laundon e Laundon (2007)
4. Os sistemas empresariais são classificados de acordo com o tipo de

problema organizacional que resolvem (Laundon e Laundon, 2007).
• Estratégico – Envolvem objetivos da organização e sobrevivência a

longo prazo. Ex.: Sistemas para auxiliar na decisão sobre novos
produtos.
Suporte na Vantagem Estratégica. Os SIs projetados em torno dos

objetivos estratégicos da empresa ajudam a criar vantagens
competitivas no mercado.
• Gerencial (Tático) – Envolvem como atingir os objetivos. Ex.:

Acompanhamento de vendas (metas).
Suporte na Tomada de Decisão Gerencial. Assim como os SIs

podem combinar informações para ajudar a gerenciar melhor o negócio,
as mesmas informações podem ajudar os gerentes a identificarem

tendências e avaliarem o resultado de decisões anteriores. O SI ajuda os

gerentes a tomarem decisões melhores, mais rápidas e mais informadas.
• Conhecimento – Envolvem a criação, a distribuição e o uso das

informações. Ex.: Sistemas de escritório.
• Operacional –Envolvem a solução de problemas relativos à produção.

Ex.: Controle de maquinário, Contas a Pagar.
Suporte de Operações Empresariais. Desde a contabilidade até a

rotina de pedidos de clientes, os SIs fornecem gerenciamento com
suporte nas operações empresariais diárias. Uma vez que a resposta
rápida se torna mais importante, a capacidade dos sistemas de
informação de reunir e integrar informações ao longo das funções
empresariais está se tornando decisiva.
Deve-se ressaltar que cada um dos diferentes sistemas pode ter

componentes que são usados por níveis e grupos organizacionais que
não fazem parte do grupo principal a que foram designados. Uma
secretária pode encontrar uma informação em um SIG ou um gerente médio
pode precisar extrair dados de um SPT.
• O projeto de software começa quando a primeira iteração da

engenharia de requisitos chega a uma conclusão. O intuito do projeto de
software é aplicar um conjunto de princípios, conceitos e práticas que

levam ao desenvolvimento de um sistema ou produto de alta qualidade

(Pressman,2011).
• O objetivo do projeto é criar um modelo de software que irá

implementar corretamente todos os requisitos do cliente e trazer
satisfação àqueles que o usarem. Os projetistas de software devem
examinar completamente muitas alternativas de projeto e convergir para
uma solução que melhor atenda às necessidades dos interessados no
projeto (Pressman,2011).
Bem, por hoje é só!! Espero ter conseguido passar de forma bem
didática os fundamentos básicos que são muito importantes para
a prova. Vamos às questões!!

Questões de Provas Comentadas
1. (CESPE/2018/EBSERH/Analista de Tecnologia da Informação)
Julgue o item que se segue, a respeito de arquitetura e tecnologias de

sistemas de informação.
A descoberta de novas regras e padrões em conjuntos de dados fornecidos,

ou aquisição de conhecimento indutivo, é um dos objetivos de data mining.
Comentários
O conhecimento é classificado em indutivo e dedutivo. O conhecimento

dedutivo deduz novas informações baseadas na aplicação de regras lógicas
predefinidas de dedução sobre dados existentes. O Data Mining apoia o
conhecimento indutivo, que descobre novas regras e padrões nos dados
fornecidos. (ELMASRI, NAVATHE, 2005).
Gabarito: item correto.
2. (CESPE/TCE-PE/2017/AUDITOR DE OBRAS PÚBLICAS/Q119) Julgue o

item que se refere a CRISP-DM (Cross Industry Standard Process for Data
Mining).
Durante a fase de entendimento do negócio, busca-se descrever claramente o

problema, fazer a identificação dos dados e verificar se as variáveis relevantes
para o projeto não são interdependentes.
Comentários
A seguir, destacamos uma síntese das etapas pertencentes ao modelo

CRISP (The CRISPDM Consortium, 2000):
1 Entendimento do Negócio (Business Understanding)
Essa fase inicial tem o foco no entendimento do negócio que visa

obter conhecimento sobre os objetivos do negócio e seus requisitos, e então
converter esse conhecimento em uma definição de um problema de mineração
de dados, e um plano preliminar designado para alcançar esses objetivos.
2 Seleção dos Dados (Data Understanding)

Consiste no entendimento dos dados, que visa à familiarização com o

banco de dados pelo grupo de projeto, utilizando-se de conjuntos de dados
"modelo".
Uma vez definido o domínio sobre o qual se pretende executar o

processo de descoberta, o próximo passo é selecionar e coletar o conjunto de
dados ou variáveis necessárias. Essa fase se inicia com uma coleta inicial de
dados, e com procedimentos e atividades visando a familiarização com os
dados, para identificar possíveis problemas de qualidade, ou detectar
subconjuntos interessantes para formar hipóteses.
3 Limpeza dos Dados (Data Preparation)
A fase de limpeza dos dados consiste na preparação dos dados que

visa a limpeza, transformação, integração e formatação dos dados da
etapa anterior. É a atividade pela qual os ruídos, dados estranhos ou
inconsistentes são tratados.
Esta fase abrange todas as atividades para construir o conjunto de dados

final (dados que serão alimentados nas ferramentas de mineração), a partir do
conjunto de dados inicial.
A utilização de Data Warehouses facilita em muito esta etapa do processo

de mineração de dados, que costuma ser a fase que exige mais esforço,
correspondendo geralmente a mais de 50% do trabalho. Por isso, é muito
importante que a organização possua em seus processos habituais boas
práticas da administração de dados, como o Data Cleansing, que é uma parte
fundamental da cadeia da administração da informação, responsável pelas
etapas de detecção, validação e correção de erros em bases de dados
(Chapman, 2005).
4 Modelagem dos Dados (Modeling)
Fase que consiste na modelagem dos dados, a qual visa a aplicação

de técnicas de modelagem sobre o conjunto de dados preparado na etapa
anterior. Nessa fase, várias técnicas de modelagem são selecionadas e
aplicadas, e seus parâmetros são calibrados para se obter valores otimizados.
Geralmente, existem várias técnicas para o mesmo tipo de problema de
mineração.
Algumas técnicas possuem requerimentos específicos na forma dos dados.

Consequentemente, voltar para a etapa de preparação de dados é
frequentemente necessário. A maioria das técnicas de mineração de dados são
baseadas em conceitos de aprendizagem de máquina, reconhecimento de
padrões, estatística, classificação e clusterização.

5 Avaliação do processo (Evaluation)
A avaliação do processo visa garantir que o modelo gerado atenda às

expectativas da organização. Os resultados do processo de descoberta do
conhecimento podem ser mostrados de diversas formas. Porém, estas formas
devem possibilitar uma análise criteriosa para identificar a necessidade de
retornar a qualquer um dos estágios anteriores do processo de mineração.
Nesta etapa se construiu um modelo que parece de alta qualidade, de

uma perspectiva da análise de dados. Antes de prosseguir, é importante avaliar
mais detalhadamente o modelo, e rever as etapas executadas para construir o
modelo, para se certificar de que ele conseguirá alcançar os objetivos de
negócio. Deve se determinar se houve algum importante objetivo do negócio
que não foi suficientemente alcançado. No fim desta fase, uma decisão sobre o
uso dos resultados da mineração deve ser tomada.
6 Execução (Deployment)
Esta fase consiste na definição das fases de implantação do projeto

de Mineração de Dados. A criação do modelo não é o fim do projeto. Mesmo
se a finalidade do modelo for apenas aumentar o conhecimento dos dados, o
conhecimento ganho necessitará ser organizado e apresentado em uma
maneira que o cliente possa usar.
Observe que a banca misturou conceitos das fases 1 e 2 no enunciado da

questão. Durante a fase de entendimento do negócio, busca-se descrever
claramente o problema, e na fase de seleção de dados é possível fazer a
identificação dos dados e verificar se as variáveis relevantes para o projeto não
são interdependentes. Portanto, a assertiva está errada.
Gabarito: E.
3. (Elaboração Própria/Profa Patrícia Quintão/2017) O ciclo de vida de

um projeto de mineração de dados, segundo a abordagem CRISP-DM,
consiste de 5 (cinco) fases. A sequência dessas fases NÃO é obrigatória.
Comentários
Na figura seguinte é mostrado o ciclo de vida de um projeto de mineração

de dados, que consiste de 6 (seis) fases. A sequência dessas fases NÃO é
obrigatória, ocorrendo a transição para diferentes fases, dependendo do
resultado de cada fase, e que etapa particular de cada fase precisa ser

executada em seguida. As setas indicam as mais importantes e mais frequentes

dependências entre as fases.
O ciclo externo na figura simboliza o ciclo natural da mineração de

dados. Um processo de mineração de dados continua após a solução ter sido
desenvolvida. Processos subsequentes se beneficiarão das experiências de
processos anteriores.
Figura - Fases do CRISP-DM Process Model (Baseado em [The

CRISP-DM Consortium, 2000])
Gabarito: item errado.
4. (CESPE/2014/TCDF/Analista de Administração Pública/Sistemas de

TI) Com o uso da classificação como técnica de Data Mining, busca-se a
identificação de uma classe por meio de múltiplos atributos. Essa técnica
também pode ser usada em conjunto com outras técnicas de mineração de
dados.
Comentários
Classificar um novo objeto é determinar com que grupo (ou classe) de

objetos, já classificados anteriormente, esse novo objeto apresenta mais
semelhança. Outras técnicas podem ser utilizadas em conjunto com a
classificação, para otimizar a descoberta de conhecimento em bases de dados.

5. (CESPE/2013/SERPRO/Analista/Negócios em Tecnologia da
Informação) Clusterização é a tarefa preditiva relativa à identificação de
um conjunto finito de categorias empregadas para descrever uma
informação. Essas categorias nunca poderão ser mutuamente exclusivas.
Comentários
Clusterização é a tarefa de análise descritiva relativa à identificação de um

conjunto finito de categorias empregadas para descrever uma informação. As
categorias levantadas podem ser mutuamente exclusivas, a assertiva está
errada.
6. (CESPE/2013/CRPM/Analista em Geociências/Sistemas) A fase de

modelagem de um data mining agrega a seleção e aplicação das técnicas
sobre os dados selecionados. Inúmeras técnicas podem ser empregadas para
obtenção de padrões úteis, como por exemplo, a PMML (predictive model
mark-up language), que objetiva, via schemas XML, a definição para
modelos encontrados em associações, modelos de regressão e clustering.
Comentários
A PMML (predictive model mark-up language) é a linguagem padrão de fato

utilizada para representar os modelos de analítica preditiva. Trata-se de uma

linguagem baseada em XML para a descrição de modelos encontrados em Data

Mining. Veja mais:
http://www.ibm.com/developerworks/br/industry/library/ind-PMML1/
7. (ESAF/CVM/2010) Mineração de Dados é
(A) o processo de atualizar de maneira semi-automática grandes bancos de

dados para encontrar versões úteis.
(B) o processo de analisar de maneira semi-automática grandes bancos de

dados para encontrar padrões úteis.
(C) o processo de segmentar de maneira semi- automática bancos de dados

qualitativos e corrigir padrões de especificação.
(D) o programa que depura de maneira automática bancos de dados

corporativos para mostrar padrões de análise.
(E) o processo de automatizar a definição de bancos de dados de médio

porte de maior utilidade para os usuários externos de rotinas de mineração.
Comentários
Conforme visto o Data Mining é um processo de procura de padrões e

regras de associações em conglomerados de dados.
Esse processo é realizado com o uso de softwares com algoritmos que

implementam as técnicas de Data Mining conhecidas e também com a
supervisão de um especialista no domínio de negócio em estudo. Por isso,
podemos dizer que Data Mining é também semiautomático. Portanto, somente
a letra B está correta.
Gabarito: B.
8. (FCC/2010/TRF-4/Analista Judiciário-Informática) Sobre data

mining, é correto afirmar:
a) Não requer interação com analistas humanos, pois os algoritmos utilizados

conseguem determinar de forma completa e eficiente o valor dos padrões
encontrados.
b) Na mineração de dados, encontrar padrões requer que os dados brutos

sejam sistematicamente "simplificados", de forma a desconsiderar aquilo que é
genérico e privilegiar aquilo que é específico.

c) É um grande banco de dados voltado para dar suporte necessário nas

decisões de usuários finais, geralmente gerentes e analistas de negócios.
d) O processo de descobrimento realizado pelo data mining só pode ser

utilizado a partir de um data warehouse, onde os dados já estão sem erros,
sem duplicidade, são consistentes e habilitam descobertas abrangentes e
precisas.
e) É o processo de descoberta de novas correlações, padrões e tendências entre

as informações de uma empresa, por meio da análise de grandes quantidades
de dados armazenados em bancos de dados usando técnicas de reconhecimento
de padrões, estatísticas e matemáticas.
Comentários
A mineração de dados (ou Data Mining) é o nome dado ao conjunto de

técnicas que permite a extração de conhecimentos a partir de grandes volumes
de dados. Em outras palavras, é o processo de descoberta de novas
correlações, padrões e tendências entre as informações úteis em grandes
depósitos de dados. A letra E é a resposta dessa questão.
Gabarito: E.
9. (FGV/SEFAZ-RJ/Fiscal de Rendas/2007) DataWarehouse e DataMining

são recursos utilizados por muitas organizações para facilitar e agilizar o
processamento, a análise e a consulta de dados. Sobre esses recursos, é
correto afirmar que:
(A) um DataMining armazena dados extraídos de bancos de dados de diferentes

organizações.
(B) um DataWarehouse armazena dados por períodos não superiores a três

meses, o que dificulta previsões e análises de tendência.
(C) um DataWarehouse é repositório de dados históricos orientados a assunto,

organizados para serem acessíveis para atividades de processamento analítico.
(D) DataMining é uma técnica de análise de dados exclusiva para aplicação em

um DataWarehouse.
(E) num DataWarehouse, os usuários finais necessitam conhecer linguagem de

programação para acessar dados.

Comentários
Bill Inmon destaca que o “Data Warehouse é uma coleção de dados

orientados por assuntos, integrados, variáveis com o tempo e não
voláteis, para dar suporte ao processo de tomada de decisão.“
O Data Warehouse é um banco de dados multidimensional grande, de escopo

organizacional (ou seja, abrange toda a empresa) e reúne dados de todos os
departamentos de forma a permitir a busca rápida de informações para auxiliar
a tomada de decisões estratégicas.
A principal ideia do Data Warehouse é construir um depósito no qual será

mantida a memória histórica dos dados, possibilitando a utilização dos mesmos
para consulta e análise estratégica para a tomada de decisão!!
Data Mart: é um banco de dados multidimensional de escopo departamental

(ou seja, abrange apenas um determinado departamento). “Um subconjunto
lógico do Data Warehouse, geralmente visto como um data warehouse setorial”
(Kimball).
As diferenças entre o Data Mart e o Data Warehouse são apenas com relação ao
tamanho e ao escopo do problema a ser resolvido.
Data Mining (ou Mineração de dados): define uma série de procedimentos,

técnicas e ferramentas para recuperar e analisar dados de um Data Warehouse
ou Data Mart à procura de padrões e tendências a respeito dos dados
armazenados.
Gabarito: letra C.
10. (UFF/UFF/2009) O conjunto de técnicas que, envolvendo métodos

matemáticos e estatísticos, algoritmos e princípios de inteligência artificial,
tem o objetivo de descobrir relacionamentos significativos entre dados
armazenados em repositórios de grandes volumes e concluir sobre padrões
de comportamento de clientes de uma organização é conhecido como:
(A) Datawarehouse;
(B) Metadados;
(C) Data Mart;
(D) Data Mining;
(E) Sistemas Transacionais.

Comentários
O enunciado da questão dá fortes indicações de que a questão trata de Data

Mining. O texto diz: “descobrir relacionamentos significativos” e também
“concluir sobre padrões de comportamento de clientes de uma
organização”, tudo isso faz parte da descrição de Data Mining.
Contudo vamos comentar as demais opções:
A letra A cita o Data Warehouse. Uma das atividades de uma empresa que
pretende trabalhar com Data Mining é justamente coletar os registros das bases
de dados transacionais e organizá-los em bases de dados agrupadas por
assunto e destinadas a análises. Cada base de dados organizada por assunto
dá-se o nome de Data Mart, e ao conjunto de Data Marts dá-se o nome de Data
Warehouse. Essa organização dos dados é importante e muito válida, pois
tende a facilitar em muito o trabalho de mineração de dados.
A letra B cita o Metadados. Metadados são dados com a finalidade de

descrever outros dados. É como se fosse um dicionário, trata-se de um grupo
específico de registros em banco de dados cuja finalidade é permitir melhor
entendimento dos dados a que se referem.
A letra C cita o Data Mart, que é uma base de dados em que os dados já estão
organizados por assunto. Assim, numa grande empresa seria comum encontrar
um Data Mart de Vendas (tratando de registros sobre vendas), um Data Mart de
Recursos de Humanos, ou outro sobre Compras da Empresa, etc.
A letra E cita Sistemas Transacionais. Esses são os sistemas da empresa de

um modo geral. Pode ser tanto a loja virtual da empresa, como pode ser seu
sistema de gerenciamento de vendas ou de recursos humanos. Esses sistemas
são caracterizados inclusive por realizarem contínuas operações de consulta,
inserção, alteração e exclusão em banco de dados transacionais. Chamamos de
banco de dados transacionais os bancos de dados preparados para se
comportarem em transações (inserção, exclusão e alteração). Esses bancos de
dados são chamados de OLTP (On-line Transaction Processing).
Gabarito: D.
11. (FCC/INFRAERO/2011) Funcionalidade cujo objetivo é encontrar

conjuntos de dados que não obedecem ao comportamento ou modelo dos

dados. Uma vez encontrados, podem ser tratados ou descartados para

utilização em mining. Trata-se de
(A) descrição.
(B) agrupamento.
(C) visualização.
(D) análise de outliers.
(E) análise de associações.
Comentários
Esta questão merece atenção por tratar de uma atividade em Data Mining
chamada de Análise de Outliers. Na busca de padrões e associações em
banco de dados, é comum identificarmos numa amostra de dados alguns
registros que fogem aos padrões identificados, ou seja, num grupo de registros
é muito comum alguns registros apresentarem grande discrepância em relação
à maioria dos registros. E esses registros que apresentam grande discrepância
são chamados de Outliers.
É necessário em um processo de Data Mining eliminar os outliers, pois a

presença de alguns raros registros com grandes discrepâncias na amostra
podem induzir a tendências, médias estatísticas e padrões distorcidos. Por isso,
a atividade de Análise de outliers consiste em procurar os outliers, e
eliminá-los antes da apuração dos padrões e associações durante o Data
Mining.
Gabarito: letra D.
12. (FGV/DETRAN-RN/2010) Sobre Data Mining, pode-se afirmar

que:
(A) Refere-se à implementação de banco de dados paralelos.
(B) Consiste em armazenar o banco de dados em diversos computadores.
(C) Relaciona-se à capacidade de processar grande volume de tarefas em

um mesmo intervalo de tempo.
(D) Permite-se distinguir várias entidades de um conjunto.
(E) Refere-se à busca de informações relevantes a partir de um grande

volume de dados.

Comentários
O processo de Data Mining tem o objetivo de buscar informações relevantes

num conglomerado de dados. Essas informações relevantes são padrões,
tendências e associações que quando analisadas serão úteis para produção de
conhecimento sobre um dado domínio de negócio. Portanto, a opção correta é a
letra E.
Gabarito: letra E.
13. (FCC/TCE-SP/2010) NÃO é um objetivo da mineração de dados

(data mining), na visão dos diversos autores,
(A) garantir a não redundância nos bancos transacionais.
(B) conhecer o comportamento de certos atributos no futuro.
(C) possibilitar a análise de determinados padrões de eventos.
(D) categorizar perfis individuais ou coletivos de interesse comercial.
(E) apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis

de resultado para a empresa.
Comentários
O Data Mining tem entre seus objetivos a descoberta de padrões e tendências

e associações em conglomerados de dados. A partir desse conhecimento
adquirido ao minerar as bases de dados espera-se que seja possível à gestão
das empresas otimizar o uso de recursos e aumentar os resultados do negócio.
Portanto as letras C e E estão corretas.
Ainda o Data Mining também permite, a partir de tendências e análises

temporais, a previsão do estado futuro de atributos (características) do
negócio. Portanto a letra B está correta.
Estudamos também que uma das técnicas de Data Mining é a Classificação que
permite a organização dos registros em classes. A Letra D descreve um dos
usos da técnica de Classificação.
Vamos agora à Letra A. Essa opção afirma que “garantir a não redundância nos
bancos transacionais” é responsabilidade do Data Mining. Essa opção está
incorreta.
Os bancos de dados transacionais são os bancos de dados que estão por

trás da operação dos sistemas comerciais, em que são registradas todas as
transações do dia-a-dia de uma empresa. O processo de Descoberta de
Conhecimento em Bases de Dados tem uma etapa chamada de Preparação

de Dados que antecede o Data Mining. E a etapa de Preparação de Dados tem

a função de coletar os dados originais das bases de dados e purificá-los,
removendo redundâncias (ou seja, duplicações de dados), a fim de tornar
estes dados adequados para o processo de Data Mining.
Gabarito: letra A.
14. (FMP-RS/TCE-RS/2011) Mineração de dados consiste em
(A) explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar

padrões, como regras de associação ou sequências temporais, para detectar
relacionamentos entre estes.
(B) acessar um banco de dados para realizar consultas de forma genérica,

buscando recuperar informações (registros) que atendam um mesmo critério
de pesquisa.
(C) recuperar informações de um banco de dados específico, voltado a

representar e armazenar dados relacionados com companhias de exploração
petrolífera e de recursos mineralógicos.
(D) um banco de dados específico voltado à gestão de negócios usando

tecnologia de informação (TI) como, por exemplo, a área de BI (Business
Inteligence).
(E) representar informações de um banco de dados mediante vários modelos

hierárquicos como, por exemplo, o de entidade-relacionamento (ER).
Comentários
Conforme vimos anteriormente Data Mining é um processo “de identificar

informações relevantes, tais como padrões, associações, mudanças,
anomalias e estruturas, em grandes conglomerados de dados que
estejam em banco de dados ou outros repositórios de informações”.
Portanto não se trata apenas de “acessar um banco de dados para realizar
consultas genéricas” como diz a letra B.
A letra C está incorreta, por citar que o Data Mining recupera “informações de
um banco de dados específico” quando na verdade o processo de Data Mining
pode atuar sobre diversas bases de dados.
A letra D está incorreta por afirmar que Data Mining é um banco de dados,
quando na verdade é um processo.
E por fim, a letra E descreve Data Mining como uma forma de representar
dados, quando na verdade é um processo de busca de padrões e associações,
entre outros.
Gabarito: letra A.

15. (Elaboração Própria/Profa Patrícia Quintão/2018) O resultado da

Mineração de Dados pode descobrir os seguintes tipos de informação “nova”:
Regras de associação, Padrões Sequenciais, Regras de Classificação.
Comentários
Regras de associação: Por exemplo, se um cliente compra uma máquina

fotográfica, pode querer comprar também um cartão de memória.
Padrões sequenciais: Por exemplo, determinado cliente pega um empréstimo

para comprar um carro. Depois da quarta parcela, começa a atrasar o
pagamento. Depois de um ano, deixa de pagar. Isso pode se repetir de forma
mais ou menos igual para diversos clientes, e pode definir um padrão. Assim,
quando o cliente começa a atrasar muito, a empresa já pode se preparar para
ele deixar de pagar a dívida.
Regras de classificação: Por exemplo, clientes podem ser classificados por

frequência de visitas, por tipo de financiamento utilizado, por quantidade
comprada, por afinidades com alguns itens e assim sucessivamente. Algumas
estatísticas reveladoras podem ser geradas para cada classe de clientes.
16. (CESPE/2010/TRT-21ª Região/Analista Judiciário/Tecnologia da

Informação) O data mining é um processo automático de descoberta de
padrões, de conhecimento em bases de dados, que utiliza, entre outros,
árvores de decisão e métodos bayesianos como técnicas para classificação
de dados.
Comentários
Um conceito aqui explorado foi proposto na edição antiga do livro “Data

Mining Techniques: For Marketing, Sales, and Customer Support” , listada a
seguir:
A mineração de dados é a exploração e análise, por meios

automáticos ou semiautomáticos, de grandes quantidades de dados a fim
de descobrir padrões e regras significativas (1997).

A questão citou duas técnicas de classificação de dados corretamente, a

saber: árvores de decisão e métodos bayesianos. Cabe destacar que não existe
uma técnica que resolva todos os problemas de data mining. Diferentes
técnicas servem para diferentes propósitos, cada uma oferecendo
vantagens e desvantagens. A escolha da técnica está fortemente
relacionada com o tipo de conhecimento que se deseja extrair ou com o
tipo de dado no qual ela será aplicada.
17. (CESPE/2016/TRT-08/Analista de TI) Acerca de data mining,

assinale a opção correta.
A) A fase de preparação para implementação de um projeto de data

mining consiste, entre outras tarefas, em coletar os dados que serão
garimpados, que devem estar exclusivamente em um data warehouse interno
da empresa.
B) As redes neurais são um recurso matemático/computacional usado na

aplicação de técnicas estatísticas nos processos de data mining e consistem em
utilizar uma massa de dados para criar e organizar regras de classificação e
decisão em formato de diagrama de árvore, que vão classificar seu
comportamento ou estimar resultados futuros.
C) As aplicações de data mining utilizam diversas técnicas de natureza

estatística, como a análise de conglomerados (cluster analysis), que tem como
objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados
como semelhantes entre si, com base nas características analisadas.
D) As séries temporais correspondem a técnicas estatísticas utilizadas no

cálculo de previsão de um conjunto de informações, analisando-se seus valores
ao longo de determinado período. Nesse caso, para se obter uma previsão mais
precisa, devem ser descartadas eventuais sazonalidades no conjunto de
informações.
E) Os processos de data mining e OLAP têm os mesmos objetivos:

trabalhar os dados existentes no data warehouse e realizar inferências,
buscando reconhecer correlações não explícitas nos dados do data warehouse.

Comentários
Letra A, errada. Cita que os dados a serem garimpados devem estar

exclusivamente em um data warehouse interno da empresa, contudo a fonte de
dados pode ser qualquer uma: os dados podem estar em arquivos de texto no
file system ou em outro repositório, em banco de dados, em data warehouse,
enfim, a mineração ocorre em qualquer tipo de arquivo de dados e o mesmo
pode estar em qualquer tipo de repositório.
Letra B, errada. Diversos conceitos foram misturados nessa assertiva, o que a

tornou bastante confusa.
Redes neurais são soluções computacionais que utilizam estruturas

matemáticas de maneira a ser desenvolvido um programa de computador com
a habilidade de aprender padrões e auxiliar no processo de predição de eventos.
Entretanto redes neurais não representam a descrição em formato de diagrama

de árvore. As árvores de decisão é que realizam este tipo de representação de
conhecimento.
Cada técnica de mineração é usada com um propósito especifico, como

exemplo, a classificação vai permitir que você classifique novas entradas de
acordo com um conjunto predeterminado de saídas, que foram construídos em
uma etapa anterior do processo.
Letra C, definição correta e bem completa para a abordagem aqui apresentada.
Letra D, incorreta. Tendo-se em vista o fato de seu resultado ser uma análise
de seus valores de saída ao longo de determinado período, faz-se necessária a
análise dos efeitos sazonais e até mesmo a análise dos efeitos cíclicos contidos
na série.
Letra E, errada. Os processos de OLAP e Data mining são distintos! OLAP é

uma ferramenta de consulta em bases de dados analíticas, que visa extrair
informações por meio de queries e utiliza as operações sobre os cubos de
dados. Data Mining (Mineração de Dados) é bem mais complexo que OLAP, uma
vez que busca padrões em grandes volumes de dados por meio de técnicas
estatísticas e de algoritmos de inteligência artificial, por exemplo.
Gabarito: letra C.

18. (CESPE/2016/TCE-SC/AUDITOR FISCAL DE CONTROLE EXTERNO –

INFORMÁTICA)
Julgue os itens subsecutivos, acerca de mineração de dados. Para a

realização de prognósticos por meio de técnicas de mineração de dados,
parte-se de uma série de valores existentes obtidos de dados históricos bem
como de suposições controladas a respeito das condições futuras, para prever
outros valores e situações que ocorrerão e, assim, planejar e preparar as ações
organizacionais.
Comentários
A análise de prognóstico representa a área de investigação nos dados

que busca inferir resultados a partir dos padrões encontrados na análise
descritiva, ou seja, prognosticar o comportamento de um novo conjunto de
dados. Parte de uma série de valores obtidos de dados históricos bem como de
suposições controladas a respeito das condições futuras, para prever outros
valores e situações que ocorrerão e, assim, planejar e preparar as ações
organizacionais. Por exemplo um prognóstico pode descobrir padrões nos dados
que ajudam os gerentes a estimar o valor futuro de variáveis com números de
vendas.
Referência: https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados.
19. (ESAF/2016/ANAC/ANALISTA ADMINISTRATIVO/ANÁLISE DE

SISTEMAS)
São objetivos da Mineração de Dados:
A Distribuição, Identificação, Organização e Otimização
B Previsão, Priorização, Classificação e Alocação
C Previsão, Identificação, Classificação e Otimização
D Mapeamento, Identificação, Classificação e Atribuição
E Planejamento, Redirecionamento, Classificação e Otimização
Comentários
Diversos autores tratam os objetivos da mineração de dados de forma

diferenciada. Vejamos algumas opções:
1. Descoberta de conhecimento e predição;

2. Classificação, Estimação, Predição, Afinidade em grupos, Agrupamentos

(clustering) e Descrição.
3. Classificação, Detecção de sequência, Análise de dependência de dados e
Análise de desvio.
4. Previsão, Identificação, Classificação e Otimização.
5. Descrição e Predição.
A letra C apresenta uma das definições!
Gabarito: C.
20. (Q102329/FCC/2016/TRF-3aR/ANALISTA JUDICIÁRIO- ÁREA

ADMINISTRATIVA) Um Analista Judiciário da Área Administrativa do TRF3
deseja solicitar ao departamento de Tecnologia da Informação − TI o
desenvolvimento de um sistema de informação para fazer com que cada vez
que uma resma de 500 folhas de papel sulfite seja retirada do estoque, um
registro apareça, automaticamente, nos computadores da empresa
fabricante e fornecedora de papel sulfite, de forma que ela possa fabricar a
quantidade necessária e enviar diretamente ao TRF3, eliminando
distribuidores e reduzindo custos de armazenamento. Neste caso, o sistema
de informação que o Analista deseja solicitar é um
(A) Customer Relationship Management − CRM.
(B) Supply Chain Management − SCM.
(C) Enterprise Resource Planning − ERP.
(D) Knowledge Management System − KMS.
(E) Transaction Support System − TSS.
Comentários
Sistema de Informação é um conjunto de componentes inter-relacionados

que trabalham juntos para coletar (recuperar), processar, armazenar e
distribuir informação com a finalidade de facilitar o planejamento, o controle, a
coordenação, a análise e o processo decisório em empresas e organizações.
Letra A, incorreta. O termo CRM (Customer Relantionship Management

– Gestão de Relacionamento com o Cliente) é utilizado para designar os
sistemas que gerenciam e organizam as informações relacionadas aos clientes
da empresa de forma personalizada, analisando suas preferências e perfis de
compra. Usam um conjunto de aplicações integradas para abordar todos os

aspectos do relacionamento com o cliente, inclusive atendimento, vendas e

marketing.
Letra B, correta. O Supply Chain Management ou Gerenciamento da

Cadeia de Suprimentos (SCM) é uma ferramenta que, usando a Tecnologia
da Informação (TI), possibilita à empresa gerenciar a cadeia de suprimentos
com maior eficácia e eficiência, eliminando distribuidores e reduzindo custos de
armazenamento por exemplo.
Letra C, incorreta. ERP (Enterprise Resource Planning): é um sistema de

gestão integrada, também conhecido como sistema integrado de gestão
empresarial. Os ERPs são sistemas de informações que integram todos os dados
e processos de uma organização em um único sistema. A integração pode ser
vista sob a perspectiva funcional (sistemas de: finanças, contabilidade, recursos
humanos, fabricação, marketing e vendas, etc.) e sob a perspectiva sistêmica
(sistema de processamento de transações, sistemas de informações gerenciais,
sistemas de apoio à decisão, etc.).
Letra D, incorreta. Knowledge Management System – KMS – envolvem a

criação, a dlistribuição e o uso das informações. Ex.: Sistemas de escritório.
Letra E, incorreta. O sistema de informação Transaction Support System –

TSS, é também conhecido como SPT – Sistema de Processamento de
Transações. Sistema administrativo básico que atende ao nível
operacional. Trata-se de um sistema que registra as transações
rotineiras necessárias ao funcionamento da empresa, como a que foi
ilustrada na questão. Gabarito: B.
21. (FCC/SUPORTE TÉCNICO- MP-RN/2010) Em relação à

implementação de um ERP numa empresa, um aspecto que pode, ao mesmo
tempo, se constituir em vantagem e desvantagem do ERP, é a
A)eliminação do uso de interfaces manuais.

B)eliminação da redundância de atividades.
C)incorporação de melhores práticas nos processos internos da empresa.
D)redução dos limites de tempo de resposta ao mercado.
E)otimização do processo de tomada de decisão.

Comentários
A incorporação de melhores práticas (codificadas no ERP) aos processos

internos da empresa constitui-se em uma vantagem, mas também propicia a
incremento do grau de imitação e padronização entre as empresas de um
segmento.
Gabarito: C.
22. (ELABORAÇÃO PRÓPRIA/2018/PROFA PATRÍCIA QUINTÃO)
Os sistemas de informação podem prejudicar seriamente a expectativa de

sobrevivência e o sucesso de uma organização se não apoiarem
adequadamente os objetivos estratégicos, suas operações , estruturas
organizacionais e culturas da empresa.
Comentários
Espera-se que os sistemas de informação façam o seguinte:
• processem transações de forma rápida e precisa;
• forneçam suporte para a tomada de decisão;
• armazenem e acessem rapidamente grandes volumes de dados;
• permitam comunicação rápida ao redor do mundo;
• ajudem a melhorar a qualidade dos produtos de diferentes formas:

simplificar processo de produção; direcionar o produto às necessidades
dos clientes; reduzir ciclo de produção; diminuir possibilidade de erros
humanos....
23. (CESPE/2013/TRT - 10ª REGIÃO (DF E TO)ANALISTA JUDICIÁRIO

- TECNOLOGIA DA INFORMAÇÃO)
As atividades fundamentais relacionadas ao processo de construção de um

software incluem a especificação, o desenvolvimento, a validação e a evolução
do software.
Comentários

Um processo de software é um conjunto de atividades e resultados associados

que levam à produção de um produto de software.
Nesse contexto, Sommerville (2007, p. 43) destaca as quatro atividades

fundamentais do processos de software, comuns a todos eles, que são:
especificação de software, projeto e implementação de software,
validação de software e evolução do software.
Especificação de Software São definidas as funcionalidades

do software e restrições para sua
operação.
Projeto e Implementação de O software que atenda à

Software especificação deve ser produzido.
Validação de Software O software deve ser avaliado para

garantir que ele faça o que o cliente
deseja.
Evolução do Software O software evolui para atender às

necessidades de mudança do cliente.
Segundo o autor, essas atividades são organizadas de modo diferente nos

diversos processos de desenvolvimento. Como exemplo, no modelo em cascata
são organizadas em sequência, ao passo que, no desenvolvimento
evolucionário, elas são intercaladas. Como essas atividades serão organizadas
dependerá do tipo de software, pessoas e estruturas organizacionais
envolvidas.
Com algumas variações de nomes entre os principais autores da área

(Pressman e Sommerville), é correto destacar que as quatro atividades
básicas do processo de software são: especificação, desenvolvimento,
validação e evolução.
24. (CESPE/ 2013 /TRT - 10ª REGIÃO (DF E TO)/ANALISTA

JUDICIÁRIO - TECNOLOGIA DA INFORMAÇÃO)
O ciclo de vida de um software, entre outras características, está relacionado

aos estágios de concepção, projeto, criação e implementação.

Comentários
Sommerville (2007, p. 43) destaca as quatro atividades fundamentais do

processos de software, comuns a todos eles, que são: especificação de
software, projeto e implementação de software, validação de software
e evolução do software. Segundo o autor, essas atividades são organizadas
de modo diferente nos diversos processos de desenvolvimento.
Pressman (2011) destaca que uma metodologia de processo genérica

para Engenharia de Software compreende cinco atividades:
• Comunicação – Antes de iniciar o trabalho, é de vital importância

comunicar-se e colaborar com o cliente (e outros interessados, como:
executivos, usuários finais, engenheiros de software, o pessoal de suporte,
etc.). A intenção aqui é compreender os objetivos das partes interessadas
para com o projeto e fazer o levantamento das necessidades que ajudarão a
definir as funções e características do software.
• Planejamento – Estabelecimento do plano de projeto de software, que

descreve as tarefas técnicas a ser conduzidas, os riscos prováveis, os
recursos que serão necessários, os produtos resultantes a ser produzidos e
um cronograma de trabalho.
• Modelagem – Criação de modelos representativos do software (para melhor

entender as necessidades do software e o projeto que irá atender a essas
necessidades).
• Construção – Essa atividade combina geração de código (manual ou

automatizada) e testes necessários para revelar erros na codificação.
• Entrega (Implantação) – Entrega do produto ao cliente, que irá avalia-lo e

fornecer feedback baseado na avaliação.
Essas cinco atividades metodológicas genéricas podem ser utilizadas para

o desenvolvimento de programas pequenos e simples, para a criação de
grandes aplicações para a Internet e para a engenharia de grandes e complexos
sistemas baseados em computador (Pressman, 2011).
As atividades metodológicas são complementadas pelas atividades de

apoio (umbrella activities), como: controle e acompanhamento do projeto,
administração de riscos, garantia da qualidade, gerenciamento da configuração
de software, dentre outras.

Observe que os 2 autores trabalham com um modelo genérico de

processo de software, e não com o ciclo de vida do software. No entanto,
conceitualmente falando, o modelo de processo de software não se diferencia
do modelo de ciclo de vida, ambos trazem uma descrição, em alto nível, das
atividades envolvidas na construção de um software e suas dependências.
Ainda, cabe destacar que as sequências de atividades trazidas pelo Pressman e
Sommerville são essencialmente iguais e estão falando do mesmo processo: o
desenvolvimento de um software. Assim, pode-se destacar que o ciclo de vida
de um software, entre outras características, estará relacionado aos estágios de
concepção, projeto, criação e implementação.
25. (FCC/2014/CÂMARA MUNICIPAL DE SÃO PAULO – SP/CONSULTOR

TÉCNICO LEGISLATIVO - INFORMÁTICA)
O desenvolvimento de uma solução para um sistema de informação

baseia-se no processo de resolução de problemas. Esse processo pode ser
descrito em quatro passos:
1. Definição e entendimento do problema.
2. Desenvolvimento de soluções alternativas.
3. Escolha da melhor solução.
4. Implementação da solução.
A seguir são descritas três atividades que ocorrem neste processo:

I. Define cuidadosamente os objetivos do sistema modificado ou do novo
sistema e desenvolve uma descrição detalhada das funções que um novo
sistema deve desempenhar.
II. Define se cada alternativa de solução é um bom investimento, se a

tecnologia necessária para o sistema está disponível e pode ser administrada
pela equipe designada da empresa, e se a organização é capaz de acomodar as
mudanças introduzidas pelo sistema.
III. É a “planta” ou modelo para a solução de um sistema de informação e

consiste em todas as especificações que executarão as funções identificadas
durante a análise de sistemas. Essas especificações devem abordar todos os
componentes organizacionais, tecnológicos e humanos da solução.

A associação correta das atividades I, II e III aos passos ao qual pertencem no

processo de resolução de problemas está, correta e respectivamente,
apresentada em
a) Gerenciamento de Requisitos - Passo 1

Análise de Risco - Passo 3
Projeto de Sistema - Passo 3
b) Análise de Requisitos - Passo 1

c) Elicitação de Requisitos - Passo 1

Estudo de Viabilidade - Passo 2
d) Gerenciamento de Requisitos - Passo 1

e) Análise de Requisitos - Passo 1

Comentários
A primeira afirmativa refere-se à Análise de Requisitos, a qual é definida

como o uso sistemático de princípios, técnicas, linguagens e ferramentas
comprovadas para análise, documentação, evolução continuada das
necessidades dos usuários e especificação do comportamento externo de um
sistema para satisfazer as necessidades do usuário, que sejam efetivas em
termos de custos. Visa, principalmente, o entendimento escrito do problema.
Já a segunda afirmativa define um estudo de viabilidade define-se, dentre as

alternativas possíveis, qual solução será empregada, avaliando-se sob aspectos
tecnológicos e organizacionais se o projeto é viável.

Finalmente, a terceira afirmativa define a fase de Projeto, na qual cria-se uma

representação do domínio do problema do mundo real, levando para um
domínio da solução (software), baseando-se nos documentos da Análise. Nesta
fase, a preocupação maior é com o “Como”, sem considerar pequenos detalhes
de implementação. Gabarito: E.
26. (CESPE/EBC/2011) O termo e-business corresponde a uma definição

mais ampla de comércio eletrônico, incluindo, além da compra e venda de
produtos e serviços, a prestação de serviços a clientes, a cooperação com
parceiros comerciais e a realização de negócios eletrônicos em uma
organização.
Comentários
E-business (Negócios Eletrônicos) é umanegociação feita pela Internet que
não envolve necessariamente uma transação comercial. É a união entre
estratégias de negócio e tecnologia via Web. E-business
refere-se a uma definição mais ampla de Comércio Eletrônico, envolvendo não
apenas a compra e venda de bens e serviços, mas também o atendimento a
clientes, colaboração com parceiros empresariais, realização de e-learning e
transações eletrônicas dentro de uma organização (TURBAN, JR e POTTER,
2005).
E-commerce (Comércio Eletrônico): consiste na realização de negócios por
meio da Internet, incluindo a venda de produtos e serviços físicos, entregues
off-line, e de produtos que podem ser digitalizados e entregues on-line, nos
segmentos de mercado consumidor, empresarial e governamental.
Negócios Eletrônicos englobam Comércio Eletrônico!
27. (Q64562/CESPE/MMA/Agente Administrativo/2009) No que se

refere a tecnologias da informação, Internet e intranet, julgue os seguintes
itens.Os sistemas de informação são soluções que permitem manipular as
informações utilizadas pelas organizações, por meio de tecnologias de
armazenamento, acesso e recuperação de dados relevantes, de forma
confiável.

Comentários
Sistema de informação é um conjunto de componentes inter-relacionados
que trabalham juntos para coletar (recuperar), processar, armazenar e
distribuir informação com a finalidade de facilitar o planejamento, o controle, a
coordenação, a análise e o processo decisório em empresas e organizações
(O’BRIEN, 2006). Desempenham papéis vitais em qualquer tipo de organização
e apoiam uma organização no que se refere a: processos e operações das
empresas; tomada de decisões de seus funcionários e gerentes; estratégias em
busca de vantagem competitiva.
28. (CESPE/2010/BANCO DA AMAZÔNIA/Técnico Científico — Área:

Tecnologia da Informação — ANÁLISE DE SISTEMAS) Objetos têm
identidade própria. Isso garante que, mesmo tendo os mesmos valores de
variáveis e pertencendo à mesma classe, dois objetos sejam considerados
diferentes.
Comentários
Na orientação a objetos, o conceito de identidade define que um objeto é uma
instância única de uma classe, ocupando uma posição de memória específica.
Então, podemos ter dois objetos não idênticos (ocupam posições de memória
distintas), mas iguais (são da mesma classe e possuem os mesmos valores
para os atributos).
Além disso, cada objeto ao ser criado, aloca espaço de memória para si e possui
seus dados armazenados em estrutura própria. Não há confusão entre os
objetos, especialmente quanto à identidade. Para simplificar o entendimento,
podemos pensar em cada objeto como uma variável estruturada contendo os
atributos.
29. (CESPE/2010/TRE-MT/Técnico Judiciário/Programação de

Sistemas) A estrutura interna de um objeto possui dois componentes
básicos: atributos, que descrevem o estado do objeto; e métodos, que são
responsáveis pela comunicação entre objetos.
Comentários
Em orientação a objeto, um método é uma subrotina que é executada por um
objeto ao receber uma mensagem. Os métodos determinam o comportamento
dos objetos de uma classe e são análogos à funções ou procedimentos da
programação estruturada. A comunicação entre os objetos é realizada por
mensagens que um objeto envia a outro.

30. (ESAF/2005/AFRF) Analise as seguintes afirmações relacionadas à

análise e ao projeto orientados a objetos:
I. O principal propósito do diagrama entidade relacionamento (E-R) é

representar os objetos e suas relações.
II. As tabelas de objetos de dados podem ser “normalizadas”,
aplicando-se um conjunto de regras de normalização, resultando em um
“modelo relacional” para os dados. Uma dessas regras especifica que:
determinada instância de um objeto tem um e somente um valor para cada
atributo.
III. Um objeto em potencial não poderá ser utilizado ou considerado
durante a análise se a informação sobre ele precisar ser lembrada para que o
sistema possa funcionar.
IV. Devido à característica da reusabilidade da orientação a objetos, a
prototipação é um modelo de desenvolvimento de software que não pode ser
considerado nem utilizado na análise orientada a objetos.
Indique a opção que contenha todas as afirmações verdadeiras.

a) I e III
b) II e III
c) III e IV
d) I e II
e) II e IV
Comentários
Item I. O diagrama de entidades descreve o modelo de dados de um sistema
com alto nível de abstração. Ele é a principal representação do modelo de
entidades e relacionamentos. É usado para representar o modelo conceitual do
negócio. ITEM VERDADEIRO.
Item II. As tabelas de objetos podem ser "normalizadas" aplicando-se um

conjunto de regras de normalização, resultando num modelo relacional de
dados. As regras de normalização, quando aplicadas às tabelas de objetos de
dados, resultam em mínima redundância - ou seja, a quantidade de
informações que precisamos manter para satisfazer um problema em particular
é minimizada. ITEM VERDADEIRO.

Item III. A identificação de objetos inicia-se ao examinar a declaração do

problema ou ao executar uma "análise gramatical" da narrativa de
processamento do sistema a ser construído. Objetos são determinados
sublinhando-se cada nome ou cláusula nominal e colocando-se numa tabela. O
objeto em potencial será útil durante a análise somente se a informação sobre
ele precisar ser lembrada de forma que o sistema possa funcionar. Este deve
ter um conjunto de operações identificáveis que podem mudar o valor de seus
atributos de alguma forma. Esse conceito foi cunhado por Yourdon de
informação retida, necessária para identificação de objetos, tornando-a falsa.
ITEM FALSO.
Item IV. Prototipação é uma abordagem baseada numa visão evolutiva do

desenvolvimento de software, afetando o processo como um todo. Esta
abordagem envolve a produção de versões iniciais, ou seja, protótipos (análogo
a maquetes para a arquitetura) de um sistema futuro com o qual se pode
realizar verificações e experimentações para se avaliar algumas de suas
qualidades antes que o sistema venha realmente a ser construído. ITEM
FALSO.
Gabarito: letra D.
31. (CESPE/2008/SERPRO) O modelo em cascata consiste de fases e

atividades que devem ser realizadas em sequência, de forma que uma
atividade é requisito da outra.
Comentários
O modelo em Cascata (Waterfall), também chamado de Clássico, é o mais
tradicional processo de desenvolvimento de software. Este modelo sugere uma
abordagem sequencial para o desenvolvimento de software, aplicando as
atividades de maneira linear. Em cada fase desenvolvem-se artefatos (produtos
de software) que servem de base para as fases seguintes.
◼ Tendência na progressão sequencial entre uma fase e a seguinte.
32. (UEL/POSCOMP/2010) Sobre o Ciclo de Desenvolvimento de Software,

é correto afirmar:
I. O desenvolvimento em cascata tem como base a ideia de desenvolver uma

implementação inicial, mostrar e discutir tal implementação com o usuário e
fazer seu aprimoramento por meio de versões subsequentes, até que um
sistema adequado tenha sido desenvolvido.

II. No modelo de processo de desenvolvimento em espiral, cada loop na

consideração direta dos riscos técnicos em todos os estágios do projeto e, se
aplicado adequadamente, deve reduzir os riscos antes que eles se tornem
problemáticos.
III. O Rapid Application Development (Desenvolvimento Rápido de Aplicação)
é um modelo de processo se software incremental que enfatiza um ciclo de
desenvolvimento rápido. Este modelo é uma adaptação de modelo cascata,
no qual o desenvolvimento rápido é conseguido com o uso de uma
abordagem de construção baseada em componentes.
IV. O modelo incremental combina elementos do modelo em cascata
aplicado de maneira iterativa. Em um processo de desenvolvimento
incremental, os clientes identificam (esboçam) as funções a serem fornecidas
pelo sistema e a importância das mesmas. Em seguida, é definida uma série
de estágios de entrega, com cada estágio fornecendo um subconjunto das
funcionalidades do sistema.
Assinale a alternativa correta.
a) Somente as afirmativas I e II estão corretas.
b) Somente as afirmativas I e III estão corretas.
c) Somente as afirmativas III e IV estão corretas.
d) Somente as afirmativas I, II e IV estão corretas.
e) Somente as afirmativas II, III e IV estão corretas.
Comentários
Somente a alternativa I está incorreta, isso porque o modelo em cascata é
sequencial, e cada uma das fases integrantes do mesmo é entrada para a
próxima, o que significa que não existe uma etapa de implementação inicial e
uma conversa com o usuário para aprimorar tal implementação, só na fase de
entrega é que o desenvolvedor saberá se fora realizado o que o cliente
desejava.
Gabarito: letra E.

Considerações Finais
Bem, Pessoal,
O esforço de vocês com certeza valerá muito à pena, continuem focados,
e com fé em Deus, que tudo dará certo ao final.
Um abraço, Profa Patrícia Lima Quintão

Livro FCC/2014:
http://www.livrariadoponto.com.br/produto/5995/11391/informatica---fcc---
serie-questoes-comentadas
Livro CESPE/2017: 2ª. edição

http://www.grupogen.com.br/1001-questoes-comentadas-de-informatica-
cespe.html
Referências Bibliográficas
QUINTÃO, Patrícia Lima. Notas de aula, 2018.
Turbam, E. et al. Business Intelligence: um Enfoque Gerencial para a

Inteligência do Negócio. Bookman, 2009.
BERRY, M. J. A.; LONOFF, G.. Data Mining Techniques: for Marketing,

Sales and Customer Support. New York: John Wiley & Sons, Inc., 1997.
BERSON, Alex; SMITH, Stephen; THEARLING, Kurt. Building Data Mining

Applications for CRM. USA, New York: MacGrawHill, 1999.
DINIZ, Carlos Alberto; LOUZADA NETO, Francisco. Data Mining: uma

introdução. São Paulo: ABE, 2000.
ELMASRI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4. ed. Pearson.

2006.
FAYYAD, Usama; PIATETSKI-SHAPIRO, Gregory; SMYTH, Padhraic (1996) The

KDD Process for Extracting Useful Knowledge from Volumes of Data. In:
Communications of the ACM, pp.27-34, Nov.1996.

FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to

knowledge discovery: An overview : in Fayyad, Piatetsky-Shapiro, Smyth
and Uthurusamy, 1996.
HAN, J.; KAMBER, M.. Data Mining: concepts and techniques. Morgan
Kaufman Publishers, San Francisco, CA., 2001.
Navega, Sérgio. Princípios Essenciais do Data Mining. São Paulo: Cenadem,

2002.
PRASS, Fernando Sarturi . KKD: Processo de descoberta de conhecimento

em bancos de dados. Grupo de Interesse Em Engenharia de Software,
Florianópolis, v. 1, p. 10-14, 2004.
TAN, Pang – Ning; STEINBACH, Michael; KUMAR, Vipin. Introdução ao

DATAMINING Mineração de Dados. Rio de Janeiro: Editora Ciência Moderna
Ltda, 2009.
WITTEN I.; FRANK E.. Data Mining. Morgan Kauffmann, 2000.

http://www.scielo.br/pdf/pci/v11n3/a05v11n3
http://corporate.canaltech.com.br/noticia/business-intelligence/As-melhores-
ferramentas-do-mercado-para-Business-Intelligence/
http://www.din.uem.br/ia/mineracao/introducao/processo.html
ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/14.2/
en/CRISP_DM.pdf
http://www.sv-europe.com/crisp-dm-methodology/
Witten, I., Frank, E. Data Mining: Pratical Machine Learning Tools and
Techniques with Java Implementations. San Diego, California: Academic
Press.2000.
http://www.crisp-dm.org/
http://www.cin.ufpe.br/~tg/2006-2/tmas.pdf
BEZERRA, E. Princípios de Análise e Projeto de Sistemas com UML, 2.

ed., Rio de Janeiro: Elsevier, 2007.
PRESSMAN, R. S. Engenharia de Software: Uma Abordagem
Profissional, 7. ed. Porto Alegre: Editora Mc GrawHill, 2011.
SOMMERVILLE, I., Engenharia de Software, 8. ed., São Paulo: Pearson
Addison - Wesley, 2007.
PFLEEGER, Shari Lawrence. Engenharia de Software: Teoria e Prática.
2.ed., São Paulo: Prentice Hall, 2004.

Lista de Questões Apresentadas na Aula
1. (CESPE/2018/EBSERH/Analista de Tecnologia da Informação)
Julgue o item que se segue, a respeito de arquitetura e tecnologias de

sistemas de informação.
A descoberta de novas regras e padrões em conjuntos de dados fornecidos,

ou aquisição de conhecimento indutivo, é um dos objetivos de data mining.
2. (CESPE/TCE-PE/2017/AUDITOR DE OBRAS PÚBLICAS/Q119) Julgue o

item que se refere a CRISP-DM (Cross Industry Standard Process for Data
Mining).
Durante a fase de entendimento do negócio, busca-se descrever claramente

o problema, fazer a identificação dos dados e verificar se as variáveis
relevantes para o projeto não são interdependentes.
3. (Elaboração Própria/Profa Patrícia Quintão/2017) O ciclo de vida de

um projeto de mineração de dados, segundo a abordagem CRISP-DM,
consiste de 5 (cinco) fases. A sequência dessas fases NÃO é obrigatória.
4. (CESPE/2014/TCDF/Analista de Administração Pública/Sistemas de

TI) Com o uso da classificação como técnica de Data Mining, busca-se a
identificação de uma classe por meio de múltiplos atributos. Essa técnica
também pode ser usada em conjunto com outras técnicas de mineração de
dados.
5. (CESPE/2013/SERPRO/Analista/Negócios em Tecnologia da
Informação) Clusterização é a tarefa preditiva relativa à identificação de
um conjunto finito de categorias empregadas para descrever uma
informação. Essas categorias nunca poderão ser mutuamente exclusivas.
6. (CESPE/2013/CRPM/Analista em Geociências/Sistemas) A fase de

modelagem de um data mining agrega a seleção e aplicação das técnicas
sobre os dados selecionados. Inúmeras técnicas podem ser empregadas para
obtenção de padrões úteis, como por exemplo, a PMML (predictive model
mark-up language), que objetiva, via schemas XML, a definição para
modelos encontrados em associações, modelos de regressão e clustering.

7. (ESAF/CVM/2010) Mineração de Dados é
(A) o processo de atualizar de maneira semi-automática grandes bancos de

dados para encontrar versões úteis.
(B) o processo de analisar de maneira semi-automática grandes bancos de

dados para encontrar padrões úteis.
(C) o processo de segmentar de maneira semi- automática bancos de dados

qualitativos e corrigir padrões de especificação.
(D) o programa que depura de maneira automática bancos de dados

corporativos para mostrar padrões de análise.
(E) o processo de automatizar a definição de bancos de dados de médio

porte de maior utilidade para os usuários externos de rotinas de mineração.
8. (FCC/2010/TRF-4/Analista Judiciário-Informática) Sobre data

mining, é correto afirmar:
a) Não requer interação com analistas humanos, pois os algoritmos utilizados

conseguem determinar de forma completa e eficiente o valor dos padrões
encontrados.
b) Na mineração de dados, encontrar padrões requer que os dados brutos

sejam sistematicamente "simplificados", de forma a desconsiderar aquilo que é
genérico e privilegiar aquilo que é específico.
c) É um grande banco de dados voltado para dar suporte necessário nas

decisões de usuários finais, geralmente gerentes e analistas de negócios.
d) O processo de descobrimento realizado pelo data mining só pode ser

utilizado a partir de um data warehouse, onde os dados já estão sem erros,
sem duplicidade, são consistentes e habilitam descobertas abrangentes e
precisas.
e) É o processo de descoberta de novas correlações, padrões e tendências entre

as informações de uma empresa, por meio da análise de grandes quantidades
de dados armazenados em bancos de dados usando técnicas de reconhecimento
de padrões, estatísticas e matemáticas.
9. (FGV/SEFAZ-RJ/Fiscal de Rendas/2007) DataWarehouse e DataMining

são recursos utilizados por muitas organizações para facilitar e agilizar o
processamento, a análise e a consulta de dados. Sobre esses recursos, é
correto afirmar que:

(A) um DataMining armazena dados extraídos de bancos de dados de diferentes

organizações.
(B) um DataWarehouse armazena dados por períodos não superiores a três

meses, o que dificulta previsões e análises de tendência.
(C) um DataWarehouse é repositório de dados históricos orientados a assunto,

organizados para serem acessíveis para atividades de processamento analítico.
(D) DataMining é uma técnica de análise de dados exclusiva para aplicação em

um DataWarehouse.
(E) num DataWarehouse, os usuários finais necessitam conhecer linguagem de

programação para acessar dados.
10. (UFF/UFF/2009) O conjunto de técnicas que, envolvendo métodos

matemáticos e estatísticos, algoritmos e princípios de inteligência artificial,
tem o objetivo de descobrir relacionamentos significativos entre dados
armazenados em repositórios de grandes volumes e concluir sobre padrões
de comportamento de clientes de uma organização é conhecido como:
a)Datawarehouse;
b)Metadados;
c)Data Mart;
d)Data Mining;
e)Sistemas Transacionais.
11. (FCC/INFRAERO/2011) Funcionalidade cujo objetivo é encontrar

conjuntos de dados que não obedecem ao comportamento ou modelo dos
dados. Uma vez encontrados, podem ser tratados ou descartados para
utilização em mining. Trata-se de
(A) descrição.
(B) agrupamento.
(C) visualização.
(D) análise de outliers.
(E) análise de associações.

12. (FGV/DETRAN-RN/2010) Sobre Data Mining, pode-se afirmar

que:
(A) Refere-se à implementação de banco de dados paralelos.
(B) Consiste em armazenar o banco de dados em diversos computadores.
(C) Relaciona-se à capacidade de processar grande volume de tarefas em

um mesmo intervalo de tempo.
(D) Permite-se distinguir várias entidades de um conjunto.
(E) Refere-se à busca de informações relevantes a partir de um grande

volume de dados.
13. (FCC/TCE-SP/2010) NÃO é um objetivo da mineração de dados

(data mining), na visão dos diversos autores,
a)garantir a não redundância nos bancos transacionais.
b)conhecer o comportamento de certos atributos no futuro.
c)possibilitar a análise de determinados padrões de eventos.
d)categorizar perfis individuais ou coletivos de interesse comercial.
e)apoiar a otimização do uso de recursos limitados e/ou maximizar variáveis

de resultado para a empresa.
14. (FMP-RS/TCE-RS/2011) Mineração de dados consiste em
(A) explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar

padrões, como regras de associação ou sequências temporais, para detectar
relacionamentos entre estes.
(B) acessar um banco de dados para realizar consultas de forma genérica,

buscando recuperar informações (registros) que atendam um mesmo critério
de pesquisa.
(C) recuperar informações de um banco de dados específico, voltado a

representar e armazenar dados relacionados com companhias de exploração
petrolífera e de recursos mineralógicos.
(D) um banco de dados específico voltado à gestão de negócios usando

tecnologia de informação (TI) como, por exemplo, a área de BI (Business
Inteligence).
(E) representar informações de um banco de dados mediante vários modelos

hierárquicos como, por exemplo, o de entidade-relacionamento (ER).

15. (Elaboração Própria/Profa Patrícia Quintão/2018) O resultado da

Mineração de Dados pode descobrir os seguintes tipos de informação “nova”:
Regras de associação, Padrões Sequenciais, Regras de Classificação.
16. (CESPE/2010/TRT-21ª Região/Analista Judiciário/Tecnologia da

Informação) O data mining é um processo automático de descoberta de
padrões, de conhecimento em bases de dados, que utiliza, entre outros,
árvores de decisão e métodos bayesianos como técnicas para classificação
de dados.
17. (CESPE/2016/TRT-08/Analista de TI) Acerca de data mining,

assinale a opção correta.
A) A fase de preparação para implementação de um projeto de data mining

consiste, entre outras tarefas, em coletar os dados que serão garimpados, que
devem estar exclusivamente em um data warehouse interno da empresa.
B) As redes neurais são um recurso matemático/computacional usado na

aplicação de técnicas estatísticas nos processos de data mining e consistem em
utilizar uma massa de dados para criar e organizar regras de classificação e
decisão em formato de diagrama de árvore, que vão classificar seu
comportamento ou estimar resultados futuros.
C) As aplicações de data mining utilizam diversas técnicas de natureza

estatística, como a análise de conglomerados (cluster analysis), que tem como
objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados
como semelhantes entre si, com base nas características analisadas.
D) As séries temporais correspondem a técnicas estatísticas utilizadas no

cálculo de previsão de um conjunto de informações, analisando-se seus valores
ao longo de determinado período. Nesse caso, para se obter uma previsão mais
precisa, devem ser descartadas eventuais sazonalidades no conjunto de
informações.

E) Os processos de data mining e OLAP têm os mesmos objetivos: trabalhar os

dados existentes no data warehouse e realizar inferências, buscando reconhecer
correlações não explícitas nos dados do data warehouse.
18. (CESPE/2016/TCE-SC/AUDITOR FISCAL DE CONTROLE EXTERNO –

INFORMÁTICA)
Julgue os itens subsecutivos, acerca de mineração de dados. Para a

realização de prognósticos por meio de técnicas de mineração de dados,
parte-se de uma série de valores existentes obtidos de dados históricos bem
como de suposições controladas a respeito das condições futuras, para prever
outros valores e situações que ocorrerão e, assim, planejar e preparar as ações
organizacionais.
19. (ESAF/2016/ANAC/ANALISTA ADMINISTRATIVO/ANÁLISE DE

SISTEMAS)
São objetivos da Mineração de Dados:
A Distribuição, Identificação, Organização e Otimização
B Previsão, Priorização, Classificação e Alocação
C Previsão, Identificação, Classificação e Otimização
D Mapeamento, Identificação, Classificação e Atribuição
E Planejamento, Redirecionamento, Classificação e Otimização
20. (Q102329/FCC/2016/TRF-3aR/ANALISTA JUDICIÁRIO- ÁREA

ADMINISTRATIVA) Um Analista Judiciário da Área Administrativa do TRF3
deseja solicitar ao departamento de Tecnologia da Informação − TI o
desenvolvimento de um sistema de informação para fazer com que cada vez
que uma resma de 500 folhas de papel sulfite seja retirada do estoque, um
registro apareça, automaticamente, nos computadores da empresa
fabricante e fornecedora de papel sulfite, de forma que ela possa fabricar a
quantidade necessária e enviar diretamente ao TRF3, eliminando
distribuidores e reduzindo custos de armazenamento. Neste caso, o sistema
de informação que o Analista deseja solicitar é um
(A) Customer Relationship Management − CRM.
(B) Supply Chain Management − SCM.
(C) Enterprise Resource Planning − ERP.

(D) Knowledge Management System − KMS.
(E) Transaction Support System − TSS.
21. (FCC/SUPORTE TÉCNICO- MP-RN/2010) Em relação à

implementação de um ERP numa empresa, um aspecto que pode, ao mesmo
tempo, se constituir em vantagem e desvantagem do ERP, é a
A)eliminação do uso de interfaces manuais.

B)eliminação da redundância de atividades.
C)incorporação de melhores práticas nos processos internos da empresa.
D)redução dos limites de tempo de resposta ao mercado.
E)otimização do processo de tomada de decisão.
22. (ELABORAÇÃO PRÓPRIA/2018/PROFA PATRÍCIA QUINTÃO)
Os sistemas de informação podem prejudicar seriamente a expectativa de

sobrevivência e o sucesso de uma organização se não apoiarem
adequadamente os objetivos estratégicos, suas operações , estruturas
organizacionais e culturas da empresa.
23. (CESPE/2013/TRT - 10ª REGIÃO (DF E TO)ANALISTA JUDICIÁRIO

- TECNOLOGIA DA INFORMAÇÃO)
As atividades fundamentais relacionadas ao processo de construção de

um software incluem a especificação, o desenvolvimento, a validação e a
evolução do software.
24. (CESPE/ 2013 /TRT - 10ª REGIÃO (DF E TO)/ANALISTA

JUDICIÁRIO - TECNOLOGIA DA INFORMAÇÃO)
O ciclo de vida de um software, entre outras características, está relacionado

aos estágios de concepção, projeto, criação e implementação.
25. (FCC/2014/CÂMARA MUNICIPAL DE SÃO PAULO – SP/CONSULTOR

TÉCNICO LEGISLATIVO - INFORMÁTICA)
O desenvolvimento de uma solução para um sistema de informação

baseia-se no processo de resolução de problemas. Esse processo pode ser
descrito em quatro passos:

1. Definição e entendimento do problema.
2. Desenvolvimento de soluções alternativas.
3. Escolha da melhor solução.
4. Implementação da solução.
A seguir são descritas três atividades que ocorrem neste processo:

I. Define cuidadosamente os objetivos do sistema modificado ou do novo
sistema e desenvolve uma descrição detalhada das funções que um novo
sistema deve desempenhar.
II. Define se cada alternativa de solução é um bom investimento, se a

tecnologia necessária para o sistema está disponível e pode ser administrada
pela equipe designada da empresa, e se a organização é capaz de acomodar as
mudanças introduzidas pelo sistema.
III. É a “planta” ou modelo para a solução de um sistema de informação e

consiste em todas as especificações que executarão as funções identificadas
durante a análise de sistemas. Essas especificações devem abordar todos os
componentes organizacionais, tecnológicos e humanos da solução.
A associação correta das atividades I, II e III aos passos ao qual pertencem no

processo de resolução de problemas está, correta e respectivamente,
apresentada em
a) Gerenciamento de Requisitos - Passo 1

b) Análise de Requisitos - Passo 1

c) Elicitação de Requisitos - Passo 1


d) Gerenciamento de Requisitos - Passo 1

e) Análise de Requisitos - Passo 1

26. (CESPE/EBC/2011) O termo e-business corresponde a uma definição

mais ampla de comércio eletrônico, incluindo, além da compra e venda de
produtos e serviços, a prestação de serviços a clientes, a cooperação com
parceiros comerciais e a realização de negócios eletrônicos em uma
organização.
27. (Q64562/CESPE/MMA/Agente Administrativo/2009) No que se

refere a tecnologias da informação, Internet e intranet, julgue os seguintes
itens. Os sistemas de informação são soluções que permitem manipular as
informações utilizadas pelas organizações, por meio de tecnologias de
armazenamento, acesso e recuperação de dados relevantes, de forma
confiável.
28. (CESPE/2010/BANCO DA AMAZÔNIA/Técnico Científico — Área:

Tecnologia da Informação — ANÁLISE DE SISTEMAS) Objetos têm
identidade própria. Isso garante que, mesmo tendo os mesmos valores de
variáveis e pertencendo à mesma classe, dois objetos sejam considerados
diferentes.
29. (CESPE/2010/TRE-MT/Técnico Judiciário/Programação de

Sistemas) A estrutura interna de um objeto possui dois componentes
básicos: atributos, que descrevem o estado do objeto; e métodos, que são
responsáveis pela comunicação entre objetos.
30. (ESAF/2005/AFRF) Analise as seguintes afirmações relacionadas à

análise e ao projeto orientados a objetos:
I. O principal propósito do diagrama entidade relacionamento (E-R) é

representar os objetos e suas relações.
II. As tabelas de objetos de dados podem ser “normalizadas”,
aplicando-se um conjunto de regras de normalização, resultando em um

“modelo relacional” para os dados. Uma dessas regras especifica que:

determinada instância de um objeto tem um e somente um valor para cada
atributo.
III. Um objeto em potencial não poderá ser utilizado ou considerado
durante a análise se a informação sobre ele precisar ser lembrada para que o
sistema possa funcionar.
IV. Devido à característica da reusabilidade da orientação a objetos, a
prototipação é um modelo de desenvolvimento de software que não pode ser
considerado nem utilizado na análise orientada a objetos.
Indique a opção que contenha todas as afirmações verdadeiras.

a) I e III
b) II e III
c) III e IV
d) I e II
e) II e IV
31. (CESPE/2008/SERPRO) O modelo em cascata consiste de fases e

atividades que devem ser realizadas em sequência, de forma que uma
atividade é requisito da outra.
32. (UEL/POSCOMP/2010) Sobre o Ciclo de Desenvolvimento de Software,

é correto afirmar:
I. O desenvolvimento em cascata tem como base a ideia de desenvolver uma

implementação inicial, mostrar e discutir tal implementação com o usuário e
fazer seu aprimoramento por meio de versões subsequentes, até que um
sistema adequado tenha sido desenvolvido.
II. No modelo de processo de desenvolvimento em espiral, cada loop na
consideração direta dos riscos técnicos em todos os estágios do projeto e, se
aplicado adequadamente, deve reduzir os riscos antes que eles se tornem
problemáticos.
III. O Rapid Application Development (Desenvolvimento Rápido de Aplicação)
é um modelo de processo se software incremental que enfatiza um ciclo de
desenvolvimento rápido. Este modelo é uma adaptação de modelo cascata,
no qual o desenvolvimento rápido é conseguido com o uso de uma
abordagem de construção baseada em componentes.
IV. O modelo incremental combina elementos do modelo em cascata
aplicado de maneira iterativa. Em um processo de desenvolvimento

incremental, os clientes identificam (esboçam) as funções a serem fornecidas

pelo sistema e a importância das mesmas. Em seguida, é definida uma série
de estágios de entrega, com cada estágio fornecendo um subconjunto das
funcionalidades do sistema.
Assinale a alternativa correta.
a) Somente as afirmativas I e II estão corretas.
b) Somente as afirmativas I e III estão corretas.
c) Somente as afirmativas III e IV estão corretas.
d) Somente as afirmativas I, II e IV estão corretas.
e) Somente as afirmativas II, III e IV estão corretas.
Gabarito
1. Item correto. 15. Item correto. 29. Item errado.
2. Letra E. 16. Item correto. 30. Letra D.
3. Item errado. 17. Letra C. 31. Item correto.
4. Item correto. 18. Item correto. 32. Letra E.
5. Item errado. 19. Letra C.
6. Item correto. 20. Letra B.
7. Letra B. 21. Letra C.
8. Letra E. 22. Item correto.
9. Letra C. 23. Item correto.
10. Letra D. 24. Item correto.
11. Letra D. 25. Letra E.
12. Letra E. 26. Item correto.
13. Letra A. 27. Item correto.
14. Letra A. 28. Item correto.

Acompanhe a Evolução do seu Aproveitamento
Data Nº Acertos % Dat Nº Acertos %

questões acerto a questões acerto
32 32
Data Nº Acertos % Dat Nº Acertos %

questões acerto a questões acerto
32 32
Link:
https://www.pontodosconcursos.com.br/Professor/Cursos/44/p
atricia-quintao

Aula 16 PDF

Загружено:

Сведения о документе

Исходное описание:

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Aula 16 PDF

Загружено:

Авторское право:

Доступные форматы

Informática para PF (Teoria e Exercícios Comentados)

Turma: 30 – Foco: Banca CESPE/UnB

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 1

Aula 16 – Noções de Mineração de Dados, Sistemas de

Saudações querido(a)s amigo(a)s!

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 2

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 3

Data Mining (Mineração de Dados) e Tópicos Relacionados

De 1990 em diante o volume de informações armazenadas em meio

Figura. O Tsunami de Dados, O Que é e Como nos Afeta?

“Estamos nos afogando em informação mas com sede de

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 4

O fato é que nesse meio há um amontoado de dados que estão gravados

Há nesse “enxame” de dados, tidos como desnecessários por alguns,

É justamente nesse cenário que entra em cena o Data Mining

Um exemplo de Data Mining muito comum são as previsões

E também, alia-se a isso, o fato de que com o armazenamento de grandes

2. Motivos que Potencializam o Uso do Data Mining

• O volume de dados disponível atualmente é enorme.

• Os dados estão sendo organizados.

• Os recursos computacionais estão cada vez mais potentes.

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 5

• A competição empresarial exige técnicas mais modernas de decisão.

• Programas comerciais de mineração de dados já podem ser adquiridos.

3. Quando a Mineração de Dados é mais indicada?

Hoje praticamente não existe nenhuma área de conhecimento em que

• Marketing: redução dos custos com o envio de correspondências através

• Detecção de fraude: reclamações indevidas de seguro, chamadas

• Produção: empresas desenvolvem sistemas para detectar e diagnosticar

As áreas em que as aplicações de mineração de dados são mais bem

• exigem decisões baseadas em conhecimento;

• possuem um ambiente em mudança constante;

• possuem dados acessíveis, suficientes e relevantes;

• fornece um retorno significativo para decisões corretas.

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 6

4. O Processo de Descoberta de Conhecimento em Base de Dados (KDD

Descoberta de Conhecimento em Base de Dados (KDD):

• “é o processo não trivial de identificação de padrões/modelos em dados

KDD é pluridisciplinar pois envolve banco de dados, técnicas de

A figura seguinte ilustra o processo de KDD proposto por Usama Fayyad,

Figura. Processo de KDD. Adaptação da proposta realizada por Usama

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 7

O processo de KDD é interativo (pois o usuário pode intervir e

1. entendimento do domínio da aplicação e identificação do objetivo do

2. seleção: criação de um conjunto-alvo de dados;

5. pré-processamento: limpeza de dados e operações básicas como remoção

Algumas técnicas de pré-processamento conhecidas são:

Figura. Detecção de Outliers utilizando uma abordagem visual.

• remoção de ruídos ou dados espúrios (dados medidos errados);

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 8

4. transformação: encontrar características úteis para representar os dados,

5. mineração de dados (Data Mining): casar os objetivos do processo de

6. interpretação: interpretar e avaliar os padrões minerados, podendo

7. agir a partir do conhecimento descoberto.

Fayyad et al. (1996) destaca o processo de descoberta de conhecimento

Figura. Etapas do Processo de Descoberta de Conhecimento

Vejamos cada uma delas:

• Preparação: é a etapa que trata de preparar os dados antes de serem

www.pontodosconcursos.com.br | Profa. Patrícia Lima Quintão 9

inconsistências e incompletude de dados) e pré-processados

Esse passo é executado sob a supervisão de um especialista, pois é

• Data Mining: é a etapa em que os dados preparados são processados, em