Вы находитесь на странице: 1из 9

Estatstica

Conceitos bsicos
Populao constutuida por todos os elementos que so passveis de ser analisados de tamanho N Amostragem Subconjunto da populao que efectivamente analisado com um dado tamanho n Amostra aleatria Amostra onde cada elemento da populao tm hipteses iguais de ser escolhido para a amostra. Estatstica descritiva Inclui grficos e procedimentos numricos que permitem sumarizar e processar dados por forma a transform-los em informao. Inferncia Estatstica fornece as bases para prevr, estimar e permite transformar informao em conhecimento

Estatstica Descritiva
Classificao de variveis As variveis podem ser numricas ou por categorias. No caso das numricas existem variveis discretas e continuas. Distribuio de frequncias Tabela que tm na coluna esquerda intervalos e na coluna direita a frequncia ou nmero de observaes. Os intervalos so habitualmente do mesmo tamanho, abrangerem todo o intervalo e no serem sobrepostos Tamanho da amostra vs. nmero de classes intervalos: At 50 5a6 50 a 100 6a8 > 100 8 a 10 Distribuio cumulativa de frequncia Mostra na coluna da direita o nmero total de observaes cujo valores so menores do que o limite superior do intervalo. Distribuio cumulativa da frequncia Mostra na coluna da direita o valor em percentagens acumuladas Histograma um grfico que consiste em barras verticais mostrando a frequncia. Ogiva uma linha onde so mostrados a percentagem relativa acumulada e que pode estar sobreposta ogiva. Caule e Folha Diagrama alternativo ao histograma que permite manter informao sobre as observaes individuais. Os nmeros inicias so mantidos na coluna da esquerda e os restantes nmeros surgem na coluna da direita

Diagrama de pareto um grfico de barras que mostra as causas principais mostrando esquerda as ocorrncias mais frequentes. Grficos de linha - Pode mostrar a evoluo de valores no tempo

Medidas de tendncia central


Estatstica uma medida descritiva calculado a partir de uma amostra Parmetro uma medida descrtiva calculada a partir da populao Mdia aritmtica

X
X =
i =1

x1 + x1 + ... + x n n

Mdia da populao

X
=
i =1

x1 + x1 + ... + x n N

Mediana A mediana o valor para o qual 50% das observaes so inferiores e 50% das observaes so superiores. No caso da amostra conter um nmero par de observaes a mediana a mdia das 2 observaes do meio. Moda A moda se existir a observao mais frequente. Forma da distribuio Simetria A forma de uma distribuio simtrica se as observaes forem balanceadas ou distibuidas de forma uniforme volta da mdia. Enviesamento - Uma distribuio enviadas se as observaes esto distribuidas de forma no simtrica. Um enviesamento positivo corresponde a a uma distribuio onde existem mais observaes esquerda da mdia Mdia geomtrica X g = n x1 * x1 * ... * x n usada em especial para calcular mdias de crescimentos

Medidas de variabilidade
Intervalo de variao - Diferena entre a observao maior e a observao menor Varincia simples a soma das diferenas quadradas entre cada observao e a mdia simples dividida pelo tamanho da amostra menos 1

(x
s2 =
i =1

+ X )2

n 1

Varincia da populao

(x
2 =
i =1

+ )2

Desvio padro simples a raz quadrada positiva da varincia

(x
s = s2 =
i =1

+ X )2

n 1

Desvio padro da populao

(x
= 2 =
i =1

+ )2

Regra Emprica Numa distribuio normal cerca de 68% das observaes esto a desvio padro da mdia, 95% esto a dois desvios padres da mdia e quase todas as observaes esto a 3 desvios padres da mdia.

Coeficiente da Variao - uma medida da disperso relativa que exprime o desvio padro como uma percentagem da mdia.
Coeficiente de variao simples s CV = x 100% , se X > 0 X
Coeficiente de variao da populao: CV =

x 100% , se >0

Percentis e quartis
Os percentis dividem as observaes em centsimos e os quartis em quartos. Q1 = (n + 1) 3(n + 1) e Q3 = 4 4

Intervalo interquartil - Diferena entre o terceiro e o primeiro quartil Box and Whisker Grfico no qual so mostrados os valores de 5 medidas contendo: Uma caixa interna que vai do 1 ao 3 quartil. Uma linha que desenhada na caixa correspondendo mediana. Os bigodes so as linhas 1 quartil ao mnimo e do 3 quartil ao mximo.

Descrio sumria de relaes entre variveis


Scatter Plot Permite mostrar os valores por cada par de variveis Covarincia simples

(x
Cov( x, y ) = S x , y =
i =1

X )( y i Y ) n 1

Coeficiente de correlao simples Cov( x, y ) rx , y = sx s y Relaes lineares Y = 0 + 1 X

Probabilidades
Experincia aleatria um processo que pode levar a dois ou mais resultados com incerteza sobre qual o resultado que ir ocorrer. Espao da amostra Conjunto de resultados possveis da experincia Evento Sub conjunto de resultados possveis Eventos mutuamente exclusivos So eventos onde a ocorrncia de um implica que o outro no ocorre Eventos colectivamente exaustivos So eventos que no seu conjunto abarcam todo o espao de resultados. Eventos complementares So os eventos dentro dum espao de amostra que no pertencem ao evento do qual so complementares Definio clssica de probabilidade - a proporo de vezes que um evento ocorrer assumindo que a possibilidade de ocorrer qualquer resultado igual. N P ( A) = A N Nmero de combinaes x itens tomados k de cada vez n! C xn = x!(n x)! Nmero de permutaes x itens tomados de n n! Pxn = (n x)! Nmero de ordenaes possveis x! Definio subjectiva de probabilidade o grau em que um individuo acredita que um evento posso ocorrer. Postulados das probabilidades 0 P ( A) 1 P ( A) = P (Oi )
i

P(S) =1

Regras das probabilidades Complementaridade :


P ( A ) = 1 P ( A) Adico: P ( A B ) = P ( A) + P ( B ) P ( A B )

Condicionada: P( A | B) = P ( A B ) P ( B A) = P ( B) P ( A)

Independncia estatstica: P ( A B ) = P ( A) P ( B )

Probabilidades conjuntas probabilidade de dois eventos acontecerem em simultneo Probabilidades marginais probabilidade de um evento ocorrer dado que ocorre outro Teorema de Bayes P ( B | A) P ( A) P( A | B) = P( B)

Variveis discretas aleatrias e distribuies de probabilidades


Uma varivel aleatria uma varivel que assume um valor numrico determinado por uma experincia aleatria. Uma varivel aleatria discreta se s pode assumir uma quantidade numervel de valores. Uma varivel aleatria continua se pode assumir qualquer valor dentro de um intervalo.

Funo de distribuio de probabilidade P(x)=P(X=x) Propriedades P( x) 0

P( x) = 1
x

Funo de probabilidade acumulada F ( x0 ) = P ( X x0 )


F ( x0 ) 0 F ( x0 ) =

P( x)
x x0

Valor esperado E ( x) = xP( x)


x

Varincia x2 = E ( X x ) 2 = ( x x ) 2 P( x)

O desvio padro a raz quadrada positiva da varincia Propriedade de funes lineares de uma varivel aleatria

Y = E (a + bX ) = a + b x 2 2 Y = Var (a + bX ) = b 2 x

Y = b x
Mdia e varincia normalizada X x Z=

E(Z)=0 Var(Z)=1

Distribuio de Bernoulli E( X ) =

x2 = (1 )
Distribuio binomial E ( X ) = n
2 x = n (1 )

Distribuio hiper geomtrica Probabilidade de tirar n objectos de N onde S a probabilidade de sucesso C S CnN S P ( x) = x N x Cn Distribuio de Poisson 1. Assume-se que a probabilidade de ocorrncia igual em diversos intervalos 2. No pode haver mais que uma ocorrncia em cada subintervalo 3. As ocorrncias so independentes
P( x) = e x , para x = 0,1,2,... x!

x =
2 x =

Soma de variveis aleatrias

E( X + Y ) = x + y E( X Y ) = x y
2 2 Var ( X + Y ) = x + y + 2 cov( X , Y )

Variveis aleatrias continuas e distribuies de probabilidade


F(x) = P(X x) P(a<X<b)=F(b)-F(a)

Funo de densidade de probabilidade


f ( x) 0
x0

F ( x0 ) =

f ( x) dx

xm

f ( x) dx = 1
Distribuio normal
f ( x) = 1 2 2
( x )2

2 2

Propriedades da distribuio normal

E( X ) = Var ( X ) = 2 X ~ N ( , 2 )
b a b a P ( a < X < b) = P <Z < = F F

Aproximao de uma distribuio binomial a uma distribuio normal Se n (1 ) > 9 ento :


a n b n P ( a X b) = P <Z< n (1 ) n (1 ) Se 5 < n (1 ) < 9 ento : a 0 .5 n b 0 .5 n <Z< P ( a X b) = P n (1 ) n (1 )

Distribuio exponencial f (t ) = e t F (t ) = 1 e t , E (t ) = 1 / , 2 = 1 / 2

Вам также может понравиться