Академический Документы
Профессиональный Документы
Культура Документы
1 – IMPORTAR BIBLIOTECAS
a) Pandas
import pandas as pd
b) Numpy
Import numpy as np
c) Display
from IPython.display import display
pd.options.display.float_format = '{:,.2f}'.format
d) Matplotlib
import matplotlib
import matplotlib.pyplot as plt
%matplotlib inline
2 – CARREGAR DADOS
a) Arquivo CSV
base = pd.read_csv('nome do arquivo.CSV', sep = ';', encoding='latin1', skiprows=1,
decimal = ',')
Obs: sep -> utilizado para especificar o separador das colunas;
encoding -> utilizado para especificar os tipos de caracteris no dataset;
skiprows -> utilizado para iniciar os dados em uma determinada linha;
decimal -> especifica o separador decimal;
parse_dates -> Converte str para data.
Caso necessite salvar o arquivo em CSV usar a sintaxe: base.to_csv(‘nome_arq.csv’).
b) Arquivo TXT
c) Arquivo Excel
d) Json
e) Website
f) Converter Srting para data -> Para converter str para data primeiro utilizar o comando
“parse_dates” na importação da base, abaixo a sintaxe:
Sintaxe: parse_dates = ([‘nome da var1’, ‘nome da var2’])
a) Value_counts -> utilizado para contar a quantidade de vezes que um dado apareceu em
uma tabela;
Sintaxe: base[‘nome variavel’].value_counts()
b) Sum -> utilizado para somar uma variavel numérica;
Sintaxe: base[‘nome variavel’].sum()
c) Max() -> utilizado para apresentar o maior valor da variavel;
Sintaxe: base[‘nome variavel’].max()
d) Min() -> utilizado para apresentar o menor valor da variável;
Sintaxe: base[‘nome variavel’].min()
e) sort_values -> utilizado para ordenar uma variavel;
Sintaxe: base.sort_values(‘variavel’, ascending=False or True)
Obs: Caso as chaves não tenham o mesmo nome usar a sintaxe abaixo:
6 – MODELAGEM ESTATISTICA
a) Co