CAMPUS DE PARNAÍBA CURSO DE BIOMEDICINA Disciplina: BIOINFORMÁTICA Prof. Jefferson Soares de Oliveira
Resumo aula – SNP’s
Os SNPs (Single nucleotide polymorphism) são as variações genéticas mais comuns
encontradas na espécie humana. Os SNPs consistem na troca de um único nucleotídeo na sequencia do DNA, por outro. Acredita-se que ocorra um NSP a cada 1000 nucleotídeos, o que contabiliza aproximadamente 3 milhões no genoma humano. Desta forma, os SNPs constituem o principal tipo de variação no código genético. Estas variações contribuem para variações fenotípicas entre os indivíduos, influenciando as características bioquímicas, propensão ao desenvolvimento de doenças e respostas frente a estímulos ambientais. Mudanças nas bases de DNA podem estar associadas à substituição de aminoácidos em proteínas ou alteração do padrão de expressão de genes. Estes eventos podem estar associados ao desenvolvimento de processos patológicos, o que torna o estudo dos SNPs uma abordagem de grande relevância. No banco de dados do NCBI encontramos uma ferramenta denominada SNP. Realizando uma busca pelo termo de interesse, encontramos uma lista de polimorfismos encontrados na região do gene de interesse. Clicando sobre o link “GeneView” ao lado do gene consultado acessamos uma tabela que disponibiliza informações sobre polimorfismos genéticos identificados em diferentes regiões do genoma humano. Dentre as informações apresentadas temos: - Chr.position e mRNA pos: indicam a posição de uma determinada alteração dentro do genoma e dentro da molécula do mRNA do gene correspondente, respectivamente. - dbSNP rs# cluster id: indica o número de acesso de um polimorfismo no banco de dados. Acessando um polimorfismo através do link correspondente do número de acesso, é possível obter informações adicionais sobre a mudança relacionada ao polimorfismo em diferentes grupos populacionais que foram alvos de estudo. Na guia “Population density” observamos diferentes grupos populacionais que foram investigados para o polimorfismo em questão. O número de amostras cromossômicas (Chrom. Sample Cnt.) apresenta uma ideia da quantidade de indivíduos que foram alvo de investigação. Uma vez que somos organismos diploides, e na maioria dos estudos a análise é realizada a partir de células somáticas, cada indivíduo contribui com das amostras cromossômicas. Assim dividindo o número de amostras cromossômicas por dois podemos sugerir o número de indivíduos analisados. Outra interessante informação que podemos obter é a frequência genotípica (Genotype Detail) e alélica (Alleles) para o polimorfismo em um dos diferentes grupos que foram estudados. Além disso, é possível verificar a mudança alélica (Allele change) e a sequência de nucleotídeo que flanqueia o polimorfismo (Fasta sequence). Esta sequencia de nucleotídeos pode ser utilizada como base para construção de primers para análises da região que contém o polimorfismo. - Heterozygosity: indica a heterozigozidade, ou seja, a frequência na qual a alteração é observada com base na análise de todos os dados dos grupos populacionais estudados e enviados para a base de dados. - Validation: Em alguns dos polimorfismos listados aparecem imagens que indicam que aquele polimorfismo passou por algum método de validação. Esta validação é dada quando o resultado apresentado foi obtido por algum projeto específico que desenvolve estudos de identificação de polimorfismos em grupos populacionais ou a partir da análise de múltiplas submissões para a base de dados. - Function: nesta coluna é apresentado o tipo de mutação associada ao polimorfismo. Elas podem ser classificadas como missense, quando a mudança do nucleotídeo promove mudança do aminoácido presente na proteína relacionada ao gene consultado; synonymous indica que a mudança do nucleotídeo não promoveu a mudança do aminoácido incorporado na proteína e frame shift quando é observado algum evento de inserção ou deleção de bases. - dbSNP allele e Protein residue: indicam, respectivamente, a mudança do nucleotídeo e aminoácidos observadas. É importante verificar que na tabela é indicado o DNA de referência (contig reference). Toda mudança observada deve ser feita com base na molécula de referência para o banco de dados. - Amino acid pos: indica a posição do polimorfismo na proteína, relacionando-o com o a posição do aminoácido na proteína. Como cada aminoácido indica um códon (trinca de nucleotídeo) seria o mesmo que informar o códon do mRNA.