Академический Документы
Профессиональный Документы
Культура Документы
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Universidade Federal de Alagoas
Instituto de Cincias Biolgicas e da Sade
Laboratrio de Ecologia Quantitativa
Maro de 2015
2
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Introduo ao uso do software R para as Cincias Biolgicas
Verso (possivelmente final) de maro de 2015
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
SUMRIO
1. Introduo ............................................................................................................................5
1.1. Obtendo e instalando o software no Windows. .............................................................. 5
1.1.1 Usando o R com um IDE ............................................................................................ 5
1.2. Primeiro contato. ........................................................................................................... 6
1.3. O R como uma calculadora ............................................................................................. 7
1.4. Usando funes no R ...................................................................................................... 8
1.5. Usando os mecanismos de ajuda .................................................................................... 9
1.6. Criando objetos ............................................................................................................ 10
1.7. Importando uma planilha de dados para o R ................................................................ 12
1.8. Instalando e ativando pacotes no R .............................................................................. 15
1.8.1. Pacotes com interface grfica ................................................................................ 16
1.9. Usando um script, inserindo comentrios e salvando tudo ........................................... 17
1.10. Resolvendo problemas comuns no R .......................................................................... 20
1.10.1. Objeto no encontrado ........................................................................................ 20
1.10.2. No foi possvel encontrar a funo qualquer ................................................... 21
1.10.3. Smbolo inesperado ............................................................................................. 21
1.10.4. Tio, um danado de um maiszinho fica aparecendo no lugar do >! ................... 22
1.10.5. Orientaes gerais ............................................................................................... 23
1.11. Funes utilizadas captulo 1 ................................................................................... 24
2. Dados e grficos ................................................................................................................. 25
2.1. Reconhecendo variveis de uma planilha ..................................................................... 25
2.2. Medidas de tendncia central e de disperso ............................................................... 26
2.3. Lidando com subconjunto de dados ............................................................................. 27
2.3.1. A funo tapply (e por que ns a amamos!) ........................................................... 28
2.4. Estudando a distribuio de frequncias de uma varivel: o histograma ....................... 29
2.5. Grficos, grficos, grficos! ........................................................................................... 29
2.5.1. Grficos de disperso ............................................................................................ 31
2.5.2. Grficos de barras.................................................................................................. 32
2.5.3. Boxplots e grficos de mdia com barras de erro ................................................... 32
2.6. Indo alm dos grficos bsicos ..................................................................................... 34
2.7. Funes utilizadas captulo 2 ..................................................................................... 35
3. Alguns testes estatsticos ................................................................................................... 36
3.1. A escolha de um teste estatstico.................................................................................. 36
4
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
3.2. O teste de qui-quadrado............................................................................................... 36
3.3. O teste T de Student ..................................................................................................... 38
3.3.1. Caudalidade do teste T .......................................................................................... 39
3.4. A anlise de varincia (ANOVA) .................................................................................... 40
3.5. A regresso linear simples ............................................................................................ 41
3.6. Pressupostos dos testes estatsticos ............................................................................. 43
3.6.1. Pressupostos do qui-quadrado .............................................................................. 43
3.6.2. Pressupostos do teste t.......................................................................................... 43
3.6.3. Pressupostos da ANOVA e da regresso linear simples........................................... 44
3.6. Funes utilizadas captulo 3 ..................................................................................... 46
4. E agora, o que vamos fazer? ............................................................................................... 47
4.1. Onde buscar ajuda? ...................................................................................................... 47
4.1.1. Documentao bsica e sistema de ajuda .............................................................. 47
4.1.2. Bibliografia ............................................................................................................ 49
4.1.3. Google ................................................................................................................... 49
4.1.4. Listas de email ....................................................................................................... 49
ANEXO 1: dados utilizados ..................................................................................................... 51
ANEXO 2: guia rpido! ............................................................................................................ 54
A2.1. Usando a ajuda. ......................................................................................................... 54
A2.2. Lendo os dados. ......................................................................................................... 54
A2.3. Grficos bsicos. ........................................................................................................ 54
A2.4. Testes estatsticos. ..................................................................................................... 55
A2.5. Testes de pressupostos. ............................................................................................. 55
5
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
1. INTRODUO
Nesta introduo ns vamos: instalar e ter um primeiro contato com o programa;
ter nosso primeiro contato com uma funo; aprender a usar os mecanismos de ajuda;
criar objetos; importar dados; instalar pacotes e, finalmente, criar e utilizar scripts!
Depois de ler e executar as instrues apresentadas aqui, voc estar preparado para
comear a usar o R pra valer.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
poderiam estar mais facilmente acessveis, como a visualizao dos objetos utilizados
durante uma seo, o acesso s pastas de trabalho e outras coisas do tipo. Pensando
nestes e em outros aspectos, algumas pessoas desenvolveram os IDEs, que uma sigla
para Integrated Development Environment (algo como ambiente de desenvolvimento
integrado). Os IDEs so programas que adicionam ao R uma interface de usurio mais
amigvel e com mais funcionalidades. Para os usurios de Windows, existem pelo
menos dois IDEs bem conhecidos para o R:
RStudio: http://www.rstudio.com/
Tinn-R: http://nbcgib.uesc.br/lec/software/desenvolvidos/editores/tinn-r/en
Us-los simples: basta ter o R instalado no computador e depois instalar um
dos programas. O RStudio bem conhecido e muito usado por a; o Tinn-R no tem
tanta visibilidade, mas bem conhecido aqui no Brasil, pois desenvolvido na
Universidade Estadual de Santa Cruz (UESC), em Ilhus, Bahia. Com certeza devem
existir outras opes por a, e pode ser interessante pesquisar um pouco antes de
escolher um IDE para se usar. Se quiser saber mais, um bom ponto de partida este
texto do criador do Tinn-R: http://nbcgib.uesc.br/lec/llec/avale-es/editor-gui-ide Agora,
claro que no h nada de errado em usar o R puro (eu mesmo trabalho sempre com
ele assim, sem nenhum acessrio), mas dar uma olhada nos IDEs uma boa, pois ele
pode facilitar bastante a vida do usurio, especialmente para quem ainda est se
habituando com o programa.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
tarefa desejada. Agora, claro que se voc escrever qualquer coisa, o R possivelmente
retornar uma mensagem de erro, pois ele no saber interpretar o que voc disse.
Mas no se preocupe; depois de aprender alguns comandos bsicos, as coisas vo
comear a fluir com mais tranquilidade e menos estranheza.
O fundamental, neste primeiro momento, no ficar intimidado com este modo
de uso em linhas de comando. Ele com certeza pode parecer assustador para quem est
comeando a usar o R e nunca usou programas que funcionam assim antes. Mas com
algum tempo de uso esta reao inicial ir passando, e voc ir ficar cada vez mais
vontade. Em resumo: no tenha medo, ok?
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Agora siga adiante e faa algumas operaes, para sentir um pouco o uso do
R. Para multiplicao use *, para diviso use / e para calcular potncias use o
smbolo ^ entre a base e o expoente (por exemplo, 2^3 para dois elevado ao cubo).
Lembre-se que para o R executar qualquer tarefa voc deve pressionar a tecla enter
quando terminar de escrever o comando desejado. Perceba, tambm, que o R entender
o ponto como separador decimal, e no a vrgula (este comportamento est associado
apenas aos dados inseridos diretamente no R; no caso de dados importados, o R
normalmente segue a configurao sobre separador decimal do computador,
convertendo as vrgulas em pontos sem problemas).
Bacana, no? Agora deixo uma dica bem geral sobre o uso do R. Como ele um
programa que a maioria das pessoas considera um pouco difcil de se dominar,
fundamental us-lo com frequncia, mesmo para as tarefas mais banais. Ento tente se
lembrar dele quando voc estiver no computador e precisar da calculadora. No lugar de
abrir a calculadora do Windows, abra o seu novo amigo R, e use-o para fazer as contas
necessrias. Parece besteira, mas o hbito de us-lo com certeza far diferena no seu
processo de aprendizado. E se precisar que o R resolva contas um pouco mais
complicadas, veja a prxima seo, onde vamos conhecer as primeiras funes.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
no R seguem a mesma lgica de uso: basta digitar o nome da funo seguido dos
argumentos necessrios, que devem estar entre parnteses. Ao longo desta apostila ns
vamos explorar muitas funes, e seu uso ficar cada vez mais familiar. Sempre que
voc vir, ao longo do texto, uma palavra em itlico seguida de (), estar diante de uma
funo.
Neste primeiro momento, vamos experimentar algumas funes matemticas
simples. Experimente, por exemplo, calcular a raiz quadrada de um nmero usando a
funo sqrt(). Se voc digitar sqrt(16), por exemplo, estar calculando a raiz quadrada
de 16. Agora vamos calcular um logaritmo com a funo log(), digitando log(100,10),
que o comando para se calcular o logaritmo de 100 na base 10. Note que como a
funo precisou de dois argumentos, ns os separamos por uma vrgula, e este um
outro aspecto geral das funes no R: os argumentos so sempre separados por vrgulas
(voc tambm pode incluir espaos entre os argumentos, o que no afeta o seu
funcionamento).
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
pginas de ajuda das funes fica ao seu final: quase sempre h um ou mais exemplos
de uso, o que uma tima ferramenta para aprendizado.
A prxima pergunta provavelmente : mas e se eu nem mesmo sei o nome da
funo que desejo?! Aqui entra o mecanismo de busca do programa, que em sua verso
mais simples pode ser chamado com uma dupla interrogao seguida do termo a ser
buscado. Experimente, por exemplo, usar o comando ??variance (para buscar funes
que faam referncia palavra varincia), e explore um pouco o resultado, composto
por diversas funes que se relacionam palavra utilizada. Uma verso um pouco mais
completa desta mesma funo o help.search(), na qual termos com mais de uma
palavra podero ser buscados, bastando estarem entre aspas simples. Experimente o
comando help.search(linear regression) e veja os resultados. Como toda
documentao do R est em ingls, lembre-se sempre em buscar utilizando as palavras
neste idioma, ok?
Uma caracterstica bacana do sistema de help do R o seu funcionamento no
formato html, aberto pelo navegador de internet padro do computador. Este sistema
permite que voc possa abrir novas janelas ou abas usando os links (que aparecem como
palavras azuis grifadas) que aparecem em diversas palavras-chave que possuem pginas
de ajuda prprias. Desta forma, a partir de uma funo voc pode explorar outras
relacionadas, navegando de funo em funo. E no se engane: apesar de utilizar o
navegador, as pginas de ajuda esto todas em seu computador, ento no h
necessidade de conexo com a internet.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
intuitiva: basta criar um nome e apontar uma seta para ele. A tal seta um comando
chamado de assign, e formada por um trao (o sinal de menos do teclado) e o smbolo
> ou < (a escolha do smbolo depende da direo). Exemplificando, digite o
comando: objeto1<-15. Se o R no der nenhuma resposta, ele criou corretamente o
objeto denominado objeto1, que composto pelo nmero 15. O fato do R ficar
silencioso aps o comando normal: ns mandamos o programa criar o objeto, e s;
ele s iria exibir algum tipo de resultado se fosse instrudo para tanto. Se quiser, voc
pode dar o mesmo comando apontando a seta para o outro lado, assim: 15->objeto1. O
resultado o mesmo.
Agora que criamos o objeto, podemos us-lo vontade. Por exemplo, podemos
chamar o objeto no R, simplesmente digitando seu nome e teclando enter.
Experimente fazer isso, e veja o resultado. Tambm podemos realizar operaes
matemticas. Experimente, por exemplo, digitar a operao objeto1*2. O R exibir o
resultado, mas perceba que o objeto continua inalterado (basta chama-lo de novo e
conferir)! Isto acontece porque ns apenas perguntamos ao R qual o resultado de se
multiplicar o objeto por 2. Se quisermos que ele armazene o resultado no lugar do
nmero original, ento o comando seria: objeto1<-objeto1*2.
Viu s?
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
precisa, pense duas vezes sobre o comando que voc utilizou, pois pode ser apenas uma
questo de comunicao. Antes de seguirmos, o contexto me obriga a contar uma velha
piada sobre programao! O programador chega em casa e encontra um bilhete da
esposa: v padaria e compre duas caixas de leite. Se tiver po, compre dez.
Chegando na padaria, ele pergunta: tem po? Como a resposta foi sim, ele comprou dez
caixas de leite. Tun-tun-tss! (se ouvir a piada durante a aula, tenha um mnimo de
educao, e ria um pouco para agradar o coitado do professor)
Mas voltemos ao que interessa. Um comando simples, mas bastante importante,
permite criar objetos com sequncias de valores (em um formato de vetor), e pode ser
chamado no R simplesmente com a letra c. Se precisarmos de um objeto com os
nmeros inteiros de 1 a 10, por exemplo, poderamos cria-lo assim: sequncia<-
c(1,2,3,4,5,6,7,8,9,10).
E nunca se esquea: ao nomear um objeto no R, voc sempre dever chama-lo
pelo nome exatamente como foi criado. Se mudar uma letra maiscula para minscula,
um acento ou qualquer outro pequeno detalhe, o programa no ir entender. Por fim, o
comando ls() sempre pode ser chamado quando se quiser saber quais objetos esto na
memria.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
informaes. O R oferece diversos comandos que permitem a importao de dados,
envolvendo diversos formatos de arquivo diferentes. Como no dia dia vocs podem se
deparar com arquivos de diferentes extenses, uma maneira de simplificar tudo
transformar os dados em um formato chamado de texto separado por tabulaes (com
a extenso .txt), e importa-los a partir da. O processo de converso de um formato de
planilha para o txt com tabulaes simples: podemos copiar e colar o contedo no
bloco de notas e salvar normalmente por l; ou usar a funo de salvar como do
gerenciador e selecionar o formato apropriado.
Uma vez criado o arquivo, devemos primeiro indicar para o R a sua localizao,
antes de import-lo de fato. Este um processo simples, feito pelo menu do R: basta
acessar o menu Arquivo e selecionar a opo Mudar dir..., e selecionar o diretrio
onde o arquivo se encontra (lembre-se de que o R no ver o arquivo, pois estamos
apenas selecionando o diretrio). Este procedimento estabelece o que chamamos de
diretrio de trabalho, e um aspecto bem importante para termos um bom uso do
programa. Uma vez que o diretrio de trabalho est estabelecido, tudo o que tentarmos
importar e tudo aquilo que exportarmos (ou seja, salvarmos para fora do R) ser
automaticamente feito ali. Uma boa recomendao criar uma pasta de fcil acesso, e
dentro dela criar subpastas para cada anlise, projeto ou outra coisa relevante. E caso
voc deseje definir o diretrio de trabalho manualmente, veja as funes setwd() para
determinar o diretrio e getwd() para saber qual o diretrio atual.
Aps a escolha do diretrio desejado, caso queira voc poder conferir quais
arquivos esto salvos dentro dele com o comando dir(). Aps conferir se o arquivo
desejado est ali, basta import-lo para um objeto usando o comando read.table(). O
14
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
comando pede apenas um argumento obrigatrio: o nome do arquivo (que deve estar
entre aspas e com a extenso). Mas usaremos outro argumento, este opcional:
informaremos ao R que a nossa planilha tem um cabealho, que uma linha que
identifica o nome das variveis. O comando completo, ento, ser:
read.table(nomedoarquivo.txt,header=T). O argumento header=T a indicao de
que existe um cabealho (o T a abreviao de TRUE).
Neste momento, siga os exemplos das imagens ilustrativas, e importe o arquivo
pratica1.txt para o R, pois vamos continuar a us-lo nas prximas sees. Caso no
tenha o arquivo, pule a parte da importao e veja como obter os dados no Anexo 1
desta apostila.
Normalmente seguimos com um attach(planilha) para reconhecer as variveis (veja na seo 2)!
Se por acaso voc precisar abrir um arquivo que, por algum motivo, est fora do
seu diretrio de trabalho, experimente usar a funo file.choose() como argumento no
lugar do nome do arquivo, e veja o que acontece! Legal, no ?
Agora que conseguimos importar um conjunto de dados para o R, podemos
conferir o que foi importado. A maneira mais bsica de se fazer isso simples: basta
chamar o objeto que recebeu os dados. Este mtodo, porm, no l muito prtico,
pois todos os dados iro aparecer no console, o que no til para planilhas com muitas
linhas e/ou colunas. Vamos preferir, ento, usar funes que permitam uma viso mais
compacta dos nossos dados. A funo head() uma delas: ela far o R mostrar no
console apenas as seis primeiras linhas da tabela importada, permitindo, por exemplo,
conferir os nomes das variveis. Outra funo bastante til summary(), que nos d
algumas estatsticas descritivas dos dados (o resultado exato depende da natureza das
variveis).
15
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
O comando summary() nos d: para variveis qualitativas, o nmero de vezes
que uma classe apareceu; e para variveis quantitativas, o valor mnimo, o primeiro
quartil, a mediana, a mdia, o terceiro quartil e o valor mximo (nesta ordem). Alm
desta utilidade bsica, summary() uma funo bastante til para se inspecionar
diversos objetos do R, como objetos que guardam os resultados de um teste estatstico,
por exemplo. Na medida em que aprender a usar o R, use esta funo de diversos tipos
de objetos para que voc possa se explor-la ao mximo. Neste contexto de explorao
de objetos tambm h outra funo bem importante: a str(). O seu resultado no l
muito intuitivo para um usurio iniciante, mas na medida em que compreendemos
melhor o funcionamento do R esta se torna uma funo muito til para se inspecionar
todo tipo de objeto e at mesmo funes.
Para os mais desesperados para mexer nos dados: se voc for muito ansioso e
quiser continuar a explorar os dados, pule as prximas pginas e rume direto para o
captulo 2, onde continuaremos a mexer neles. Mas depois volte aqui e veja o que
perdeu, pois h informaes bem importantes, ok?
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
pacote do R um conjunto de funes compiladas juntas com um objetivo e/ou tema em
comum. H pacotes voltados para anlise de diversidade biolgica (como o vegan e o
biodiversityR, por exemplo), pacotes para o uso de mtodos filogenticos comparativos
(como o pacote ape), pacotes com interface grficas de usurio (como o Rcmdr), e
muito mais.
Carregar um pacote que j esteja no seu computador bem simples: basta usar o
comando library() com o nome do pacote. Caso voc ainda precise instalar o pacote,
uma das maneiras mais simples fazer isso pelo prprio R pelo menu Pacotes, na
opo Instalar Pacotes. Esta funo necessita que o computador tenha uma conexo
com a internet, e ir perguntar qual servidor usar para o pacote ser baixado. Uma vez
baixado e instalado, o pacote j estar na pasta adequada, e poder ser carregado com a
funo library(). Ah, e se voc usar o comando library() sem nenhum argumento, s
com os parnteses vazios mesmo, o R mostrar para voc a lista de pacotes que j est
no seu computador.
Por fim, para saber qual o objetivo geral dos pacotes, voc pode acessar a
homepage do R e, seguindo o mesmo caminho para baixar o programa, acessar o link
packages e acessar a opo Table of avaliable packages, sorted by name. Voc ver,
em seguida, a lista de todos os pacotes oficiais do programa, com uma breve descrio
do seu propsito.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
fantstico termos uma interface de usurio mais amigvel, por outro devemos ter muita
cautela de no dependermos disso, pois pacotes com estes so sempre, por definio,
limitados a algumas funes.
Uma boa maneira de us-los como uma ferramenta acessria no aprendizado:
ambos permitem que voc veja os comandos das funes executadas, o que pode ser
muito til para se aprender a us-las. Em suma: vale pena conhec-los, mas eles
devem sempre ser usados com muita cautela, para que o usurio no acabe dependendo
completamente deles e acabe no dominando o uso do R. Se voc no ficar atento a
isso, pode acabar se dando muito mal no futuro, quando precisar executar uma funo
que no existe em um pacote destes (o que, na prtica, a realidade da maioria das
funes)! Ento resista tentao de us-los o tempo todo (especialmente o Rcmdr), e
no se deixe seduzir pelo lado negro da fora, ok?
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Mas voc pode se organizar ainda mais do que isso! Alis, no s pode como
deve. O console do R tende a ficar um tanto bagunado na medida que vamos usando o
programa, especialmente estamos aprendendo a usar. Ele vai juntando mensagens de
erro, resultados repetidos e coisas do tipo, e no final fica bem feioso de se usar para
alguma coisa. a que entram os scripts. Eles so sequncias de comandos que podem
ser armazenados e usados de novo quantas vezes quisermos. Podem ter quantos
comentrios quanto acharmos necessrio, e no acumulam informaes de resultados ou
mensagens de erros. E tem mais: no cotidiano do uso do R, bem comum que
precisemos fazer o mesmo procedimento diversas vezes com diferentes conjuntos de
dados. Isto pode se tornar bem trabalhoso (para no dizer um p no saco!) quando temos
que repetir linhas de comando muito longas, o que torna muito prtico armazenar linhas
prontas para que possam ser usadas novamente. E a entram novamente os scripts, que
podem conter modelos de anlises, para voc usar e modificar vrias vezes.
Criar um script no R bem fcil: v no menu Arquivo e selecione a opo
Novo script. O R ento ir abrir uma janela em branco, onde podemos digitar o nosso
script.
19
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Um script do R uma simples sequncias de comandos (que podem incluir
comentrios), que podem ser enviados para serem executados no console quando o
usurio assim o desejar. Basta selecionar a(s) linha(s) desejada(s) (ou selecionar todas
usando o atalho ctrl+a) e usar o atalho ctrl+r, e o console ir executar tudo. Uma vez
que a janela do script estiver selecionada, ele poder ser salvo pelo menu Arquivo na
opo Salvar. Os arquivos de script do R so salvos como a extenso .R, mas podem
ser abertos pelo bloco de notas se voc quiser.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
comentrios nos seus scripts! Assim voc alia a utilidade prtica deles para realizar
anlises com o processo de aprendizado. Recomendo fortemente us-los no dia dia do
R, pois com o tempo eles sero grandes aliados no seu uso e aprendizado.
Por fim, aps uma sesso de uso do R, voc pode achar interessante salvar tudo
o que se passou no console, para se ter registrados os procedimentos, seus resultados e
os eventuais comentrios adicionados. Este um procedimento bem simples: basta ir
novamente ao menu Arquivo e selecionar a opo salvar em arquivo. O R ento ir
salvar um arquivo de extenso .txt, que poder ser aberto em qualquer editor de texto.
Caso voc tenha problemas em abrir o arquivo depois de salv-lo, verifique se o R
inclui a extenso; caso ele no a tenha includo, basta renomear o arquivo incluindo a
extenso .txt no final do nome.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
O mesmo erro costuma aparecer quando importamos os dados mas nos
esquecemos de usar o comando attach() (veja-o na prxima seo) para que o R
reconhea os nomes das variveis. Soluo 2: use o comando attach() nos dados
importados.
Outra possibilidade ter tentado chamar uma funo de um pacote sem o ter
carregado previamente. Soluo 2: use o comando library() para carregar o pacote
necessrio.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Quando associado uma funo, o mais provvel ter esquecido uma vrgula
entre os argumentos ou ter feito alguma confuso com aspas ou parnteses. Soluo 2:
confira o comando, e lembre-se de que todos os argumentos de uma funo devem
ser separados por vrgula.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Aqui eu teclei esc, e ele voltou para o prompt
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
1.11. Funes utilizadas captulo 1
Estas foram as funes que vimos at aqui:
+, -, *, / operadores matemticos
sqrt() raiz quadrada
log() logartimo
?, ??, help.search() mecanismos de ajuda
<-, -> associa elementos (valores, nomes, planilhas, etc) a objetos do R
c combina elementos em um vetor ou uma lista
ls() lista os objetos na memria do R
dir() lista os arquivos no diretrio de trabalho
read.table() l uma planilhas em arquivo externo
head() lista as seis primeiras linhas de uma planilha
summary() resume as informaes de um objeto do R
str() funo para inspecionar um objeto ou funo, mostrando detalhes de sua
estrutura.
library() carrega um pacote que j esteja no computador
# permite a insero de comentrios
25
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
2. DADOS E GRFICOS
Neste captulo ns vamos lidar com conjuntos de dados no R, dando os
primeiros passos estatsticos com o programa. Especificamente, ns vamos aprender
funes bsicas para sumarizar e manipular dados, alm de aprender a criar os nossos
primeiros grficos. Em outras palavras: vamos meter a mo na massa e fuar os dados!
\o/
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Sem o attach(), a varivel
no reconhecida.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
As funes mean(), var() e sd() calculam, respectivamente, a mdia, a varincia
e o desvio padro. A funo quantile() permite calcular a mediana, os quartis e
quaisquer percentis desejados (veja o exemplo acima para entender o uso desta ltima
funo).
Legal. Mas e se eu quiser usar mais de uma condio de uma vez? Ou ainda, e se
eu quiser usar duas condies alternativas?! O R entende & como e, e entende |
28
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
como ou. Confuso? Veja os exemplos a seguir, pois na verdade bem simples e
prtico.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
2.4. Estudando a distribuio de frequncias de uma varivel: o histograma
Os histogramas so grficos que representam a distribuio de frequncias dos
valores de uma varivel quantitativa. uma excelente maneira de se comear a explorar
um conjunto de dados, e cri-los no R bastante simples: basta usar a funo hist(). No
uso bsico da funo o prprio R ir decidir em quantas classes dividir os intervalos
da varivel, o que pode ser alterado pelo argumento breaks. Tome algum tempo para
explorar o help da funo, dando especial ateno para os exemplos.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
para a frente, e continuar em segundo plano ou minimizada). Caso deseje salvar o
grfico, clique com o boto direito do mouse sobre a imagem ou, com a janela em
primeiro plano, v ao menu Arquivo e explore as opes disponveis.
Existem muitos argumentos comuns a todas as funes grficas do R, como xlab
e ylab (para dar nomes aos eixos), main (para atribuir ttulos ao grfico), axes (para se
adicionar ou remover os eixos) e muitas outras. A documentao de ajuda da funo
par() uma excelente fonte de informaes sobre argumentos gerais que podem ser
usados em diversos grficos diferentes. Ao explorar as funes grficas do R, use e
abuse dos exemplos que aparecem nas pginas de ajuda, pois eles so uma das melhores
maneiras de se aprender. Caso esteja com dificuldades, tente criar seu grfico passo
passo: crie um grfico bsico e depois v acrescentando, um a um, os argumentos
desejados, at chegar ao ponto ideal.
A partir deste ponto, vou considerar que voc, leitor, j crescidinho, e vai ser
capaz de fuar um pouco as coisas sem a minha ajuda. Ento vou adicionar, nos
exemplos, alguns argumentos que voc dever explorar, mesmo quando eu no der
muitas informaes detalhadas sobre eles, ok? Coragem! Mexer em argumentos (e errar
muitas vezes!) faz parte da experincia de aprendizado no R. Comece vendo o exemplo
a seguir:
Vamos olhar agora, bem brevemente, para outros grficos tpicos da estatstica.
Estes so grficos que mostram a relao entre duas variveis, situao na qual existe
31
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
uma conveno geral: sempre que existir uma varivel explicativa (ou independente),
ela deve ser representada no eixo x, enquanto a varivel resposta (ou dependente) deve
ser representada no y. A exceo, claro, so os grficos de barras, nos quais o eixo y
representa apenas frequncias, de maneira similar aos histogramas. Alguns destes
grficos deles sero vistos novamente mais adiante, quando lidarmos com os testes
estatsticos, e na ocasio poderemos ver mais detalhes e argumentos conforme
necessrio.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
2.5.2. Grficos de barras
Os grficos de barras podem ser usados para representar uma ou duas variveis
categricas, e so construdos no R pela funo barplot(). Em planilhas de dados
comuns, nas quais as linhas so as unidades amostrais e as colunas variveis, a funo
table() um intermedirio importante para chegarmos ao grfico desejado. Veja o
exemplo a seguir para aprender o funcionamento bsico da funo (percebam que usei o
argumento legend para identificar as cores das colunas).
Boxplots:
Uma das maneiras mais comuns de se representar medianas, normalmente
acompanhadas de quartis e/ou percentis, so os boxplots. Cri-los no R feito com a
funo boxplot(), como no exemplo a seguir (no qual usei alguns argumentos a mais
para modificar o grfico bsico). Para usar este comando, a relao entre as variveis foi
determinada usando o smbolo ~. Esta representao bem comum no R, e ir
33
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
aparecer no uso de diversos modelos estatsticos. A lgica desta representao ser
sempre varivel_resposta~varivel_explicativa.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
O argumento type usado para se definir se
o grfico ter linhas, pontos ou ambos.
Agora refazendo, mas desta vez representando o desvio padro nas barras. A
funo fica mais longa, mas no nada absurdo. Veja o help da funo se quiser
entender melhor o que eu fiz aqui:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
2.7. Funes utilizadas captulo 2
Vou resumir, a seguir, as funes que vimos nesta seo.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
3. ALGUNS TESTES ESTATSTICOS
Beleza! Voc agora uma pessoa quase ntima do R (ui!) e daqui para frente s
precisa de prtica, prtica e mais um pouco de prtica. Quanto mais atividades aprender
a realizar no R, mais sua linguagem ficar familiar, e mais fcil ser us-lo. Neste
captulo vamos aprender a realizar algumas anlises estatsticas que so bastante teis
no dia a dia de um bilogo. Sero quatro testes: qui-quadrado, teste T, ANOVA e a
regresso linear simples. Aprend-los, alm de til do ponto de vista prtico, servir de
base para que voc possa dominar outros testes no programa.
Neste ponto bom relembrar uma coisa: este no um guia para se aprender
estatstica! O objetivo deste material aprender a dominar o R, e somente isso. Caso
voc consiga fazer um teste mas no saiba bem o que est fazendo, pare tudo e v
estudar, ok? Executar um teste estatstico que no conhecemos pode ser bem fcil na
prtica, mas as chances de chegarmos a concluses completamente equivocadas (leia-
se: as chances de fazer cagada!) ficam muito grandes
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
significncia desta associao pelo teste de Qui-quadrado com a funo chisq.test(). A
funo mostra, como resultado, o valor de qui-quadrado, os graus de liberdade e o valor
de p, nesta ordem.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
3.3. O teste T de Student
O teste T possui trs variantes bsicas: a mais usada normalmente chamada de
teste t para amostras independentes, e permite a comparao de duas mdias; o teste t
para uma amostra compara uma mdia com um valor fixo; e o teste t pareado (ou teste t
para amostras dependentes) compara mdias de unidades amostrais dependentes aos
pares. Todos estas variaes do teste t podem ser executadas no R pela funo t.test(), e
o uso do teste t pareado e do teste t para uma amostra pode ser ativado com o uso dos
argumentos paired e mu, respectivamente, como pode ser visto nos exemplos a seguir.
Usualmente, o resultado de um teste t vem acompanhado de uma representao
grfica. Veja o exemplo de grfico de mdias com barras de erro na apostila anterior.
Independente da variante de teste T realizado, a apresentao do seu resultado no
R sempre comear com os valores de t, de graus de liberdade e de p, nesta ordem.
Veja:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
No teste T para uma amostra (bem pouco usado na biologia) comparamos uma
mdia com um valor de referncia qualquer:
O teste T pareado feito no R a partir de duas colunas, uma vez que duas
medidas so feitas em uma mesma unidade amostral:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Caso voc esteja realizando um teste T sem definir a caudalidade a priori, pense
duas vezes. Definir isto interessante tanto de um ponto de vista cientfico (a hiptese
normalmente ser mais clara quando estabelecemos uma direo) quanto do ponto de
vista estatstico (aumenta o poder do teste).
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
O objeto usado deve ser o prprio
modelo da ANOVA realizada.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
abaixo, com o nome da varivel explicativa, sempre do nosso interesse: ela verifica a
hiptese nula de que o parmetro a da equao seja igual a zero; ou seja, ao rejeitarmos
a hiptese nula ns conclumos que de fato h uma relao estatisticamente significativa
entre as duas variveis, e que o efeito desta relao medido por este parmetro. Por
fim, a interpretao da correlao, que est representada no parmetro Adjusted R-
squared tambm importante, e mede o quanto da variao na varivel resposta foi de
fato explicada pela varivel explicativa. Confuso? Ento vejamos os resultados do
exemplo acima: o teste rejeita a hiptese nula de que a riqueza de espcies no varia em
funo da rea do fragmento de mata (o valor de p foi pequenininho, est apresentado
em potncia de dez: 6,2510-6). O resultado da regresso permite concluirmos que, em
mdia, cada incremento de uma unidade de rea aumenta a riqueza em 0,13885 (este o
valor de a da equao). Por fim, o valor de R2 ajustado nos diz que 39,46% da riqueza
de espcies explicada pelo tamanho da rea dos fragmentos.
Os resultados de uma regresso linear que rejeita a hiptese nula so comumente
apresentados com uma representao grfica que mostra os dados (em um grfico de
disperso) e a equao (na forma de uma reta). Para adicionar a reta da equao ao
grfico criado pelo comando plot(), basta, com o grfico aberto, executar o comando
abline(), fazendo referncia ao objeto que contm o resultado da regresso:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
3.6. Pressupostos dos testes estatsticos
Todos os testes estatsticos possuem pressupostos, que so coisas que devem ser
verdade para que o resultado do teste seja confivel. Alguns destes pressupostos esto
ligados ao delineamento experimental: por exemplo, a maioria dos testes pressupe que
as suas unidades amostrais sejam independentes. Mas tambm existem pressupostos
especficos, que podem ser verificados nos dados em si, e sobre eles que falaremos
brevemente a seguir. Meu objetivo aqui tratar deles apenas rapidamente para fins
prticos, mas lembre-se de que verificar os pressupostos rotineiramente
importantssimo nos testes estatsticos, ok? Um bom livro de estatstica sempre vai
mencionar os pressupostos, ento basta consultar um caso voc fique em dvida. E se o
livro no falar nada sobre o assunto? Bom, provavelmente ele no um bom livro de
estatstica...
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Como vimos acima, se o pressuposto da homogeneidade de varincias for
rejeitado, h uma sada prtica: o teste t para varincias heterogneas. Na prtica, isto
est automaticamente feito no comando t.test(), a no ser que o usurio acrescente o
argumento var.equal=T (como fizemos no exemplo acima). Ou seja, se nada for dito, o
R j fara o teste t para varincias heterogneas.
Agora vejamos os exemplos. Primeiro o teste de Levene:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
U, por que juntar os dois?! Eu mencionei, talvez mais de uma vez (foi mesmo?
no sei, mas no vou rever todo o texto s por isso...), que ANOVA e regresso so
membros de uma famlia mais geral, os modelos lineares. Acontece que os modelos
lineares possuem pressupostos em comum, e por isso podemos verifica-los usando as
mesmas tcnicas. Bacana, n?
Um pressuposto em comum de todos os modelos lineares a normalidade dos
resduos. Isso mesmo: dos resduos, e no dos dados em si. uma confuso bem
comum testar a normalidade dos dados, mas isto desnecessrio e pouco parcimonioso.
Bom, ns j vimos como testar normalidade: basta usar o nosso amigo Shapiro-Wilk,
como vimos no teste T ali em cima. Mas como obter os resduos? Se voc seguiu a
minha recomendao de salvar o resultado do teste em um objeto, ento ser bem fcil:
objeto$residuals vai funcionar com qualquer modelo linear no R:
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
3.6. Funes utilizadas captulo 3
Vou resumir, a seguir, as funes que vimos nesta seo.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
4. E AGORA, O QUE VAMOS FAZER?
Parabns! Se a minha apostila no foi uma total perda de tempo, voc
acaba de aprender o basico do nosso amigo R. Deste momento em diante, voc
comear a andar com as prprias pernas, ento uma boa hora para respirar fundo e
tentar brincar um pouco com o R por conta prpria, e tentar aprender algumas coisas
por a. E quando eu digo por a, quero dizer na internet (e um pouco no prprio R
tambm).
Neste captulo quero deixar de lado os procedimentos, e falar um pouco sobre
como podemos aprender a fazer uma anlise no R mesmo que no tenhamos algum nos
ensinando. Fazer isso importante por dois motivos. Primeiro, temos que lembrar que o
R , devido sua natureza de software livre e de linguagem de programao,
extremamente flexvel (ou seja, ele faz coisa pra c@#$%&!). Ento obviamente
possvel que um usurio possa aprender tudo o que ele faz sem abrir mo de fazer outras
coisas da sua vida, como comer, dormir, etc. Mas a que est a beleza da coisa: se voc
aprende a fazer um punhadinho de coisas no R (como aprendeu nos dois primeiros
captulos at aqui) e aprende a buscar informaes por conta prpria, est pronto para
fazer qualquer tipo de anlise nele. Segundo, o R tem um aspecto muito interessante,
que uma das suas maiores foras: uma grande comunidade de usurios e
desenvolvedores. Isto significa que tem um monte de gente usando o R, um monte de
gente com dvidas e mais um outro monte tirando dvidas. Se buscar informaes sobre
o R fundamental, um lado bom que h muita informao disponvel!
O nosso objetivo neste captulo final, ento, olhar rapidamente para algumas
fontes importantes de informao, mecanismos de busca e comunidades de usurios.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Caso voc esteja usando muito as funes de um pacote, pode ser interessante
visitar a pgina do pacote no CRAN, seguindo as instrues l da seo 1.8, e
clicando no nome do pacote. Alguns pacotes possuem os Vignettes, que so manuais ou
tutoriais sobre as capacidades do pacote. Veja, por exemplo, os documentos na pgina
do pacote vegan na imagem a seguir:
Aqui!
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
4.1.2. Bibliografia
Livros e apostilas sobre o R jamais vo faltar! Na verdade existe tanta coisa, mas
tanta coisa, que pode ser difcil escolher o que usar... Mais importante do que deixar
sugestes, ento, lembrar que a escolha da bibliografia acaba sendo bem pessoal neste
caso. Ento, caso voc encontre um material de R e goste muito dele, siga adiante e use-
o! Ainda assim, para aqueles mais perdidos, deixo aqui apenas duas sugestes de livros
que considero bacanas para quem est aprendendo.
4.1.3. Google
Pois :o bom e velho google, amigo de todas as horas de dvida, um timo
companheiro para o usurio do R. Se voc quer saber como se faz alguma anlise,
busque no google e veja o que aparece. Caso o que voc busca seja algo mais ou menos
comum, as chances de voc encontrar um passo a passo bem mastigadinho de como
fazer e interpretar a anlise altssima! claro que, como em qualquer pesquisa na
internet, devemos ter um pouco de cautela com o que encontramos, j que existe muita
coisa de m qualidade publicada sobre qualquer assunto. Mas basta ter um pouco de
bom senso e olhar alguns sinais para fugir das coisas ruins online. Algumas sugestes:
- blogs e/ou sites muito movimentados e com muitos comentrios costumam ser uma
boa, pois os possveis erros so facilmente detectados e corrigidos se muitas pessoas
esto olhando.
- material escrito por autores que voc j conhece ou que foram indicados tambm
uma boa pedida. Algumas vezes possvel encontrar sites mantidos por autores de
pacotes oficiais do R, o que um bom indicativo do material ser de qualidade.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
comece dando uma olhada nas listas oficiais, que esto no CRAN. No site do R, v na
barra lateral e clique em Mailing Lists. A lista R-sigecology bem interessante!
Tambm h uma lista nacional bem ampla, a R-br: http://r-br.2285057.n4.nabble.com/
Por fim, buscando na internet voc certamente encontrar vrias listas, grande e
pequenas. Escolha as que achar mais adequadas e seja feliz! Mas lembre-se de algumas
coisas importantes:
- antes de escrever pela primeira vez, procure saber se h um guia de postagens.
Provavelmente ele existe, e deve conter as regras e sugestes sobre as mensagens da
lista. Ignorar isso aumenta muito a chance de se levar um puxo de orelhas virtual...
- antes de pesquisar alguma coisa, busque no google e na lista, pois sempre existe a
possibilidade da sua dvida j ter sido respondida por algum. Caso voc ache que sua
dvida muito bsica, ento isto provavelmente verdade! Nestas listas normalmente
considerado uma falta de educao perguntar coisas cuja resposta pode ser encontrada
com uma busca bsica na internet.
- algumas listas so muito movimentadas, e participar delas significa receber um monte
de mensagens todos os dias. Pondere isso antes de se cadastrar, e veja se a lista tem uma
opo de receber o digest, que um tipo de bloco de mensagens que voc recebe de
uma vez s no lugar das mensagens individuais.
51
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
ANEXO 1: DADOS UTILIZADOS
Caso voc no tenha os arquivos com os dados utilizados nos exemplos desta
apostila, basta copiar e colar o texto da caixa correspondente no console do R e pronto!
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L), .Label = c("primrio",
92L, 51L, 89L, 128L, 149L, 127L, 108L, 83L, 140L, 163L, 41L,
107L, 79L, 104L, 60L, 82L, 148L, 97L, 49L, 164L, 110L, 51L, 40L,
92L, 163L, 128L, 130L, 122L, 96L, 59L, 73L, 90L, 48L, 166L, 121L,
167L, 48L, 78L, 105L, 90L, 105L, 166L, 84L, 57L, 81L, 122L, 112L
), Riqueza = c(35L, 31L, 39L, 25L, 22L, 35L, 43L, 48L, 35L, 38L,
32L, 33L, 40L, 16L, 31L, 23L, 32L, 35L, 22L, 41L, 24L, 18L, 39L,
32L, 19L, 20L, 31L, 26L, 20L, 33L, 36L, 32L, 28L, 23L, 28L, 16L,
44L, 27L, 37L, 24L, 19L, 28L, 27L, 28L, 27L, 20L, 34L, 20L, 31L,
14L), Abund_sp1 = c(3L, 3L, 1L, 6L, 1L, 0L, 3L, 5L, 0L, 2L, 0L,
2L, 2L, 3L, 5L, 3L, 1L, 4L, 3L, 0L, 2L, 3L, 1L, 3L, 3L, 1L, 3L,
1L, 2L, 2L, 2L, 2L, 8L, 5L, 1L, 0L, 3L, 0L, 3L, 2L, 0L, 2L, 0L,
0L, 1L, 3L, 3L, 4L, 1L, 0L)), .Names = c("UA", "Ambiente", "rea",
-50L))
#Pronto, os dados esto salvos no objeto dados; pressione enter siga adiante!
52
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Dados do arquivo fumo.txt; as letras esto pequenas, mas est tudo a!
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,
3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), .Label = c("Moderado",
"No", "Pesado"), class = "factor"), Cncer = structure(c(1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L,
1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
2L, 2L), .Label = c("No", "Sim"), class = "factor")), .Names = c("Fumo", "Cncer"), class = "data.frame", row.names = c(NA, -1011L))
#Pronto, os dados esto salvos no objeto dados; pressione enter siga adiante!
53
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
Dados do arquivo peixes.txt (no exemplo de ANOVA):
3L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L,
#Pronto, os dados esto salvos no objeto dados; pressione enter siga adiante!
54
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
ANEXO 2: GUIA RPIDO!
Neste anexo, apresento um guia rpido de procedimentos no R. Pense nele como
um resumo das principais funes vistas ao longo desta apostila. O objetivo permitir
que quem j leu a apostila possa rever rapidamente as funes durante o uso do
programa.
Bioestatstica - Prof. Marcos Vincius Carneiro Vital (ICBS UFAL) - Material disponvel no endereo http://marcosvital.wordpress.com/
A2.4. Testes estatsticos.
- Qui-quadrado: chisq.test(tabela)
- tabela deve ser gerada com: tabela<-table(varivel_1, varivel_2)
- Teste T para duas amostras: t.test(varivel_resposta~varivel_explicativa,
var.equal=T)
- Se as varincias forem heterogneas, omitir var.equal=T
- Teste T pareado: t.test(medida1, medida2, paired=T)
- Teste T para uma amostra: t.test(varivel, mu=valor_de_comparao)
- ANOVA: resultado<-aov(varivel_resposta~varivel_explicativa)
- e depois: summary(resultado)
- se desejar a posteriori: TukeyHSD(resultado)
- Regresso linear: resultado<-lm(varivel_resposta~varivel_explicativa)
- e depois: summary(resultado)
- para o grfico, primeiro: plot(varivel_explicativa, varivel_resposta
- depois: abline(resultado)