Академический Документы
Профессиональный Документы
Культура Документы
Análise de Clusters 2
Inferindo sobre a funcionalidade dos Genes
Os investigadores pretendem conhecer as funções de novos genes
sequenciados
Análise de Clusters 3
Análise de Clusters 4
Dados dos Microarrays
Dados dos Microarrays são usualmente transformados
numa matriz de intensidade ou expressão
A matriz de intensidade permite aos biólogos efectuar
correlações entre diferentes genes (mesmo que não
sejam semelhantes) e perceber como as funções dos
genes podem ser relacionadas
Análise de Clusters 5
Análise de Clusters 6
Formação de clusters de dados de Microarrays
(cont.)
Clusters
Análise de Clusters 7
Análise de Clusters 8
Mau Clustering
Distâncias próximas
entre pontos de
clusters distintos
Distâncias longas
entre pontos do
mesmo cluster
Análise de Clusters 9
Bom Clustering
Análise de Clusters 10
Técnicas de Clustering
Análise de Clusters 11
Clustering Hierárquico
Análise de Clusters 12
Clustering Hierárquico: Um exemplo
Análise de Clusters 13
Análise de Clusters 14
Clustering Hierárquico: Um exemplo
Análise de Clusters 15
Análise de Clusters 16
Clustering Hierárquico: Um exemplo
Análise de Clusters 17
Análise de Clusters 18
Algoritmo de Clustering Hierárquico
Clustering Hierárquico(d , n)
1. Forme n clusters cada um com um elemento
2. Construa um grafo T atribuindo um vértice a cada cluster
3. Enquanto existir mais do que um cluster
4. Encontre os dois clusters mais próximos C1 e C2
5. Agrupe C1 e C2 num novo cluster C com #C1 +#C2 elementos
6. Calcule a distância de C a todos os outros clusters
7. Adicione um novo vértice C a T e conecte-o aos vértices C1 e C2
8. Remova as linhas e colunas de d correspondentes a C1 e C2
9. Adicione uma linha e coluna a d correspondente ao novo
cluster C
10. retorne T
Análise de Clusters 20
Erro quadrático de distorção
Análise de Clusters 21
Análise de Clusters 22
1-Means Clustering: Um caso simples
Análise de Clusters 23
Análise de Clusters 24
5
4
x1
3
x2
2
1
x3
0
0 1 2 3 4 5
Análise de Clusters 25
4
x1
x2
2
1
x3
0
0 1 2 3 4 5
Análise de Clusters 26
5
4 x1
2
x3
x2
1
0
0 1 2 3 4 5
Análise de Clusters 27
4 x1
2
x2
x3
1
0
0 1 2 3 4 5
Análise de Clusters 28
Algoritmo K-Means Conservativo
O algoritmo de Lloyd é rápido, mas em cada iteração
move muitos pontos, não causando necessariamente
melhor convergência
Análise de Clusters 29
Análise de Clusters 30
Grafos Clique
Análise de Clusters 31
Análise de Clusters 32
Problema dos Cliques Corruptos
Input: Um grafo G
Análise de Clusters 33
Grafos de Distâncias
Análise de Clusters 34
Transformando grafos de distâncias em
grafos clique
O grafo de distâncias Após a
(θ=7) é transformado transformação do
num grafo clique após grafo de distâncias
a remoção de duas num grafo clique o
arestas conjunto de dados
está agrupado em
três clusters
Análise de Clusters 35
Análise de Clusters 36
Algoritmo CAST
CAST(S, G, θ)
1. PØ
2. Enquanto S ≠ Ø
3. v vértice de grau máximo no grafo de distâncias G
4. C {v}
5. Enquanto existir um gene próximo i ∉C ou um gene distante i ∈C
6. Encontre o gene mais próximo i ∉C e adicione-o a C
7. Encontre o gene mais distante i ∈C e remova-o de C
8. Adicione o cluster C à partição P
9. SS\C
10. Remova os vértices do cluster C do grafo de distâncias G
11. devolva P
S – conjunto de elementos,
elementos, G – grafo de distância
distância,, θ – limiar da distância
Análise de Clusters 37
Referências
Estes acetatos foram adaptados de:
http://www.bioalgorithms.info/presentations/Ch10_Clustering.ppt
Análise de Clusters 38