Вы находитесь на странице: 1из 32

Aula 1

Álvaro João Pereira Filho

Curso de R
21/08/2018

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 1 / 32


O que é R?

O que é R?

Software com linguagem estatı́stica


O mais popular entre os cientistas sociais
• Disputa com Phyton e os recursos disponı́veis no Excel
Vantagens do R
• Software Livre
• Documentação completa e acessı́vel
• Trabalha com diversos tipos de arquivos
• Replicabilidade

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 2 / 32


Habilidades necessárias

Habilidades necessárias

Escrita
• Elementos
• Comandos básicos
• Composição do script
• Sensibilidade
Leitura
• Comandos básicos
• Diferentes soluções para o mesmo problema
• Alertas de erro
GOOGLE!!!
Autonomia

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 3 / 32


RStudio

RStudio

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 4 / 32


Inicializando

Para começar...

Hastags
# Insere comentarios sem rodar o comando
# # Importante para organizar e
# ## registrar

Crtl + Enter
• Roda a linha com o cursor ou selecionada • Possı́vel rodar no
próprio layout

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 5 / 32


Calculadora

Calculadora

Função básica de calculadora


Operadores básicos ou númericas
5 + 5

5 - 5

5 * 5 / 3

5 / (5 * 3)

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 6 / 32


Calculadora

Calculadora

> 5 + 5
[1] 10

> 5 - 5
[1] 0

> 5 * 5 / 3
[1] 8.333333

> 5 / (5 * 3)
[1] 0.3333333

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 7 / 32


Calculadora

Calculadora

O R também é capaz de fazer operações lógicas


Dessa vez, tanto entre números quanto palavras
5 == 5

5 <= 5 / 5

5 * 4 > 5

TRUE == TRUE

" R " ! = " Phyton "

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 8 / 32


Calculadora

Calculadora
O R também é capaz de fazer operações lógicas
Dessa vez, tanto entre números quanto palavras
5 == 5
[1] TRUE

5 <= 5 / 5
[1] FALSE

5 * 4 > 5
[1] TRUE

TRUE == TRUE
[1] TRUE

" R " ! = " Phyton "


[1] TRUE

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 9 / 32


Calculadora

Calculadora

Não podemos esquecer de operadores ’e’ (&) e ’ou’ (|)


• ATENÇÃO! Muita atenção com os ()
(5 == 5) & (6 > 8)

5 <= (5 == 7 | 8 >= 5)

(( T == F )|( F ! = T )) ! = (( T == F ) & ( F ! = T ))

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 10 / 32


Atribuição

Atribuição

Trata-se da famosa ”setinha”formada pelo sinal de desigualdade e o


sinal de menos
Sua função é atribuir algum valor, resultado, sequência, base de
dados, matriz, qualquer coisa a um label, ou etiqueta
Seja lá o que você atribuir, isso estará salvo na etiqueta e poderá ser
usado diretamente em operações ou mesmo visto quando rodado

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 11 / 32


Atribuição

Atribuição

sorte <- 5

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 12 / 32


Atribuição

Atribuição

sorte <- 5

Sorte
Error: object ’Sorte’ not found

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 13 / 32


Atribuição

Atribuição

sorte <- 5

sorte

> sorte
[1] 5

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 14 / 32


Tipos de informação

Tipos de informação

numeric
• 5, 10, 24, 3.4
logical
• TRUE, FALSE, NA
character
• Qualquer palavra entre ASPAS!
Descobrir o tipo de informação basta usar a função class()
class ( sorte )

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 15 / 32


Tipos de informação

Tipos de informação

ATENÇÃO: nesta disciplina usaremos majoritariamente as


informações do tipo númericas!
Entretanto, as informações lógicas, factor e textual nos auxiliarão,
não sendo abordadas de forma central como em ’text mining’, por
exemplo.

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 16 / 32


Tipos de informação

Tipos de informação

Descobrir o tipo de informação basta usar a função class()


class ( sorte )

> class ( sorte )


[1] " numeric "

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 17 / 32


Sequências

Vetores

Mais comum no R é atribuir labels aos vetores


Cada tipo de informação possui também um vetor possı́vel
No R, a forma de Combinar valores, seja ele qual for, é usando a
função c()
alturas <- c (1.67 ,1.70 ,1.70 ,1.78 ,1.92)

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 18 / 32


Sequências

Vetores

É importante saber algumas caracterı́sticas dos vetores


• Classe class()
• Comprimento length()
• Somatório do valores sum()
class ( alturas )
length ( alturas )
sum ( alturas )

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 19 / 32


Sequências

Vetores

É importante saber algumas caracterı́sticas dos vetores


• Classe class()
• Comprimento length()
• Somatório do valores sum()
> class ( alturas )
[1] " numeric "

> length ( alturas )


[1] 5

> sum ( alturas )


[1] 8.77

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 20 / 32


Sequências

Vetores

Se combinarmos em uma divisão entre o sum() e o length() obtemos


nossa primeira estatı́stica descritiva: a média
n
X
x̄ = xi /n (1)
i=1

> xbar <- sum ( alturas ) / length ( alturas )

[1] 1.754

> ( sum ( alturas ) / length ( alturas )) == mean ( alturas )

[1] TRUE

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 21 / 32


Estatı́sticas descritivas

Descritivas

Além da média, para calcular a mediana, podemos optar por duas


alternativas:
primeira é calcular diretamente através da função median()
> median ( alturas )

[1] 1.7

segunda é ordenar os valores de forma crescente sort() e em seguida


escolher o valor que divide seu vetor
> alt _ order <- sort ( alturas )
> alt _ order [ length ( alt _ order ) / 2]
[1] 1.7
> length ( alt _ order ) / 2
[1] 2.5

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 22 / 32


Estatı́sticas descritivas

Descritivas

A moda representa o valor com maior frequência dentro de uma


sequência numérica
> y <- unique ( alturas )

> y [ which . max ( tabulate ( match ( alturas , y )))]

ou ainda

> which ( table ( alturas ) == max ( table ( alturas )))

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 23 / 32


Estatı́sticas descritivas

Descritivas

O desvio-padrão, que é a média das distâncias de cada observação da


média amostral, pode ser calculado assim
> sd ( alturas )

[1] 0.1013903

sqrt ( sum ( alturas - mean ( alturas ))^2 / ( length ( alturas ) -1)

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 24 / 32


Pacotes

Pacotes

O R já possui diversas funções


• sum()
• c()
• class()
• etc
Outras, porém, estão disponı́veis em pacotes
Pacotes concentram diversas funções para diferentes demandas
• Importação de dados
• Organização
• Análises
• Gráficos

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 25 / 32


Pacotes

Pacotes

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 26 / 32


Pacotes

Pacotes

Para instalar pacotes utilizamos a função install.packages()


Pode demorar alguns segundos e o computador precisa estar
conectado à internet
install . packages ()

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 27 / 32


Pacotes

Pacotes

Para instalar pacotes utilizamos a função install.packages()


Pode demorar alguns segundos e o computador precisa estar
conectado à internet
> install . packages ( " PNADcIBGE " )

> install . packages ( " UsingR " )

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 28 / 32


Pacotes

Pacotes

O pacote ainda não instalado, no exemplo PNADcIBGE, precisa estar


entre aspas
Detalhes sobre cada pacote você encontrará na documentação
disponı́vel na internet
Para ativar o pacote, utilizamos a função library()
library ()

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 29 / 32


Pacotes

Pacotes

O pacote ainda não instalado, no exemplo PNADcIBGE, precisa estar


entre aspas
Detalhes sobre cada pacote você encontrará na documentação
disponı́vel na internet
Para ativar o pacote, utilizamos a função library()
> library ( PNADcIBGE )
> library ( UsingR )

Não precisa mais das aspas

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 30 / 32


Importação

Importação de base de dados

Várias bases de dados atualmente disponı́veis são acessadas através


de pacotes, evitando arquivos separados
Isto é, basta instalar um pacote, acionar a livraria e, por fim, utilizar
uma função para escolher a base

pnad <- get _ pnadc ( year = 2017 , quarter = 3 , design = F )

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 31 / 32


Importação

Aula 1

Álvaro João Pereira Filho

Curso de R
21/08/2018

Álvaro João Pereira Filho Aula 1 Curso de R21/08/2018 32 / 32

Вам также может понравиться