Академический Документы
Профессиональный Документы
Культура Документы
Katia S. Guimarães
katiag@cin.ufpe.br
Pa ra a lg uns
Bio-informá tica é uma esp ec ia liza ç ã o d a
Info rm á tic a q ue tra ta d e d esenvo lver
ferra m enta s p a ra lid a r c om d a d os b iológ ic os.
Biologia (Molecula r) Computa ciona l á rea d e
p esq uisa q ue c om b ina c onhec im ento s d e
Quím ic a , Físic a , Biolog ia , C. Com p uta ç ã o,
Ma tem á tic a e Esta tístic a p a ra a ta c a r
p ro b lema s d e Biolog ia Molec ula r.
Históric o d a Era Genô m ic a - 1990
Iníc io : Outub ro d e 1990
La nç a m ento d o Projeto Genoma Huma no
- Seq üenc ia r o DNA huma no (3• 109 p b ) e
- Id entific a r os estima d os 100 m il g enes.
Ato res Princ ip a is:
Consórc io envolvend o EUA, Ing la terra ,
Fra nç a , Ja p ã o, Alema nha e China .
Pra zo: 15 a nos (term ina ria em 2005)
Orç a m ento: US$3 b ilhões d e d óla res
Históric o d a Era Genô m ic a - 1992
1992
Consórc io fa z ma p a s d os
c ro m ossom os huma nos
1998
Cra ig Venter se a ssoc ia c om a Ap p lied
Bio system s p a ra fund a r a Celera Genomics Corp.,
c o m o o b jetivo d e seq üenc ia r o g eno ma
huma no em 03 a nos (2001),
a o c usto d e US$300 m ilhões ( 1/ 10 d o
o rç a m ento d o p rojeto d o Consórc io ).
Históric o d a Era Genô m ic a – 99-00
O Co nsórc io revê a s sua s p revisões, e a nunc ia
a c o nc lusã o d o seq üenc ia m ento p a ra 2003,
c om um esb oç o em 2001.
Dez/ 1999
É a nunc ia d o o seq üenc ia m ento d o p rim eiro
c rom ossom o (no. 22) p elo c onsórc io mund ia l.
Jun/ 2000
Bill Clinton e Tony Bla ir a nunc ia m a c o nc lusã o
d o p rim eiro esb oç o d o g enoma huma no .
Históric o d a Era Genô m ic a – Fev 2001
Proteínas atuam
sozinhas ou em
complexos
O GenBank
Do ponto de vista da computação, foram criadas
inúmeras seqüências sobre o alfabeto {a, c, g, t}
1 gatcctccat atacaacggt atctccacct caggtttaga tctcaacaac ggaaccattg
61 ccgacatgag acagttaggt atcgtcgaga gttacaagct aaaacgagca gtagtcagct
121 ctgcatctga agccgctgaa gttctactaa gggtggataa catcatccgt gcaagaccaa
181 gaaccgccaa tagacaacat atgtaacata tttaggatat acctcgaaaa taataaaccg
241 ccacactgtc attattataa ttagaaacag aacgcaaaaa ttatccacta tataattcaa
301 agacgcgaaa aaaaaagaac aacgcgtcat agaacttttg gcaattcgcg tcacaaataa
361 attttggcaa cttatgtttc ctcttcgagc agtactcgag ccctgtctca agaatgtaat
421 aatacccatc gtaggtatgg ttaaagatag catctccaca acctcaaagc tccttgccga
481 gagtcgccct cctttgtcga gtaattttca cttttcatat gagaacttat tttcttattc
541 tttactctca catcctgtag tgattgacac tgcaacagcc accatcacta gaagaacaga
601 acaattactt aatagaaaaa ttatatcttc ctcgaaacga tttcctgctt ccaacatcta
661 cgtatatcaa gaagcattca cttaccatga cacagcttca gatttcatta ttgctgacag
721 ctactatatc actactccat ctagtagtgg ccacgcccta tgaggcatat cctatcggaa
781 aacaataccc cccagtggca agagtcaatg aatcgtttac atttcaaatt tccaatgata
841 cctataaatc gtctgtagac aagacagctc aaataacata caattgcttc gacttaccga
901 gctggctttc gtttgactct agttctagaa cgttctcagg tgaaccttct tctgacttac
961 tatctgatgc gaacaccacg ttgtatttca atgtaatact cgagggtacg gactctgccg
Link: http://www.ncbi.nlm.nih.gov/Genbank/index.html
O GenBank do NCBI
Aproxima-
damente
85 bilhões
de pares
de base
Link: http://www.ncbi.nlm.nih.gov/Genbank/index.html
O que fazer com tanta Letrinha?
O genoma
é como
um livro
dividido
em
capítulos
(cromos-
somos)
e
estes em
palavras
(genes)
Genes são transcritos e traduzidos
dando origem a proteínas
Mas se fosse muito simples não
seria tão interessante
Foram
encontrados
apenas cerca
de 25mil
genes, ao
invés dos 60 a
100 mil genes
estimados a
princípio.
Os genes dos eucariotos são
compostos por exons e introns …
Os introns sempre desaparecem
por ocasião do splicing.
Os exons podem permanecer ou não.
Os genes têm a sua expressão controlada
por Fatores de Transcrição
O foco da
atenção
passou
então
para as
proteínas
.
Os níveis de expressão de um gene variam
com os promotores que se ligam à região
reguladora, imediatamente antes do gene
O que é Proteômica?
Proteômica é o estudo das proteínas, com
suas estruturas e funções.
Nature
Biotech,
Out 2007
Dobramento de Proteínas
Um problema bem Difícil
Predição de Estrutura de Proteínas
Dob ra m ento d e Proteína s
Alp ha
Helix
Dobramento de Proteínas
Beta Barrel
Docking e o Projeto de Drogas
Detalhes como orientação e ângulo de ligação de
todos os resíduos do sítio ativo são essenciais.
The Blue Gene Projec t