Вы находитесь на странице: 1из 13

Estatstica

1. Mdia aritmtica:  =
  =   
     


2. Mdia populacional:  = 
 
     
 
=

3. Desvio em relao mdia:   

4. Desvios quadrticos:    

5. Varincia:   
    




6. Varincia populacional:   
   



7. Desvio padro:   1 1    


1
2 !

8. Desvio padro (p/ valores repetidos):   1 %"1 " #"  


1 2
$ ou

  1 &%"1 2" " !  


2 '
1

 fracionrio): s = 
     

9. Desvio padro (p/ (



10. Amplitude: a = mx.(x1, x2,..., xn) mn.(x1, x2,..., xn)

)

11. Coeficiente de variao: cv =

*+ 
,1 -. , -/
12. Mediana: *+ 
2 2

13. Quartis: 0  0)  0 ,) 
,1 3, 1 0. , 0/
4 4 2

14. Quartis quando o resultado no 0,5: 0 ,)  -4 , * ,) 5 -6  -4  onde:

* ,) = Mantissa do resultado do clculo do quartil;


v< e v>= O valor menor e maior dentre os dois valores do quartil calculado;

Letras latinas: estatsticas (descrevem caractersticas dos elementos da amostra):


Maisculas: variveis aleatrias;
Minsculas: observaes efetivas;
Letras gregas: parmetros (descrevem caractersticas dos elementos da populao).
Formulrio para Probabilidade e Estatstica

Probabilidade

15. Eventos igualmente provveis: P(A) =

16. Soma de probabilidades:


a. P (AB) = P(A) + P(B) P(AB)
b. P (ABC) = P(A) + P(B) + P(C) P(AB) - P(AC) - P(BC) + P(ABC)

89:
8:
17. Probabilidade condicional (probabilidade de A dado B): P(A|B) =

a. P(AB) = ;< ;>|<


18. Regra do produto:

b. P(ABC) = ;< ;>|< ;@|<>

19. Eventos independentes: ;A A A


  ;A  ;A  B ;A


20. Teorema da Probabilidade Total: ;C  D  ;A  ;C|A 

21. Teorema de Bayes: ;A |C 


8EF  8G|EF 
8G
, onde Ei = evento mutuamente
exclusivo e exaustivo e F = evento qualquer.

Variveis Aleatrias Discretas

ocorrncia: H   ;I   , HJKJ   1, 2, e deve satisfazer:


22. Funo de Probabilidade: Associa cada valor x sua probabilidade de

a. H  L 0;
b. H   1 ;

23. Funo de distribuio acumulada: C  ;I O , P Q R

24. Mdia / Valor esperado de uma varivel aleatria X:  AI  D  H ,


onde x = valor possvel e p = probabilidade de tal valor ocorrer;

25. Varincia:    TI  D     H ou TI  AI      , onde


AI    D   H

26. Desvio Padro:   U;I  VTJK I


Formulrio para Probabilidade e Estatstica

27. Propriedades:

a) Ec  c Vc  0
E(X) = Valor esperado / mdia; V(X) = Varincia; DP(X) = Desvio Padro

b) EX , c  EX , c VX , c  VX


f)

c) EcX  cEX VcX  cVX


g)

d) EX , Y  EX , EY DPcX  |c|DPX


h)

e) EX Y  EX EY


i)

28. Variveis aleatrias discretas independentes: `  I , I ;

a. TI , a  TI , Ta


29. Varincia de variveis aleatrias discretas independentes:

b. TI  a  TI , Ta

Distribuies Discretas

30. Distribuio de Bernoulli: observada a presena ou no de alguma


caracterstica desejada (p = P{sucesso}).

( b(
0 1p
1 p
Total 1

Outras caractersticas: AI  H TI  H 5 1 H

0, d  / 0
C  c1  H, d 0 O  / 1e
1, d  L 1

31. Distribuio Binomial: Consiste em n ensaios de Bernoulli, interessando apenas


o nmero X de ocorrncias de sucesso (possui reposio para garantir
independncia entre os ensaios).

a. Com variveis aleatrias independentes: I  I , I , B , I


!
b. Coeficientes Binomiais: # $ 


! !

H  #
$ 5 H  5 1  H

c. Expresso geral da distribuio binomial:

d. Valor esperado de uma distribuio binomial: AI   5 H


Formulrio para Probabilidade e Estatstica

e. Varincia de uma distribuio binomial: TI   5 H 1  H

32. Distribuio Hipergeomtrica: basicamente uma distribuio binomial sem


reposio. Se a populao for muito maior que a amostra, pode ser aproximada
pela Distribuio Binomial.
#hg $ #ijg
jh $
#i
$
a. Funo de probabilidade de X: , onde:
N = Populao (nmero total de elementos);
n = nmero de elementos de uma amostra;
r = Elementos classificados como insucesso;
x = [0, 1, ..., min(r, n)];

b. H 
k


K
c. AI   5 H ou AI   5
l

K K
d. TI   5 H 5 1  H 5 ou TI   5 5 1  ! 5



 l l 

33. Distribuio de Poisson: Expressa a probabilidade de certo nmero de eventos


ocorrerem numa dada unidade de medida (tempo, comprimento, rea, volume,
etc.), caso estes ocorram com uma taxa mdia conhecida e caso cada evento
seja independente do tempo decorrido desde o ltimo evento. As ocorrncias
dos eventos devem ser independentes.

a. Funo de probabilidade de X: H 


m jn ojh
!
,x0e
= nmero esperado (mdia) de ocorrncias que ocorrem num dado intervalo
de tempo (ou de outra unidade de medida).

b. AI  TI  p

c. Se n for muito grande e p for muito pequeno, p   5 H


Formulrio para Probabilidade e Estatstica

Variveis Aleatrias Contnuas

a. q L 0, P Q
34. Funo densidade de probabilidade: Deve possuir as seguintes propriedades:

b. rt qs  1
t

c. Se A = [a, b], ento P(A) = rt qs


t

35. Funo de distribuio acumulada: C  ;I O   rt qs, x




36. Valor esperado:   AI  rt  qs


t

37. Varincia:    TI  rt    qs ou TI  AI      , onde


t

AI    rt   qs


t

u, ,w tem a mesma probabilidade de ocorrer. Uma varivel aleatria X


38. Distribuio Uniforme: usada quando todo evento em um subintervalo de

tem distribuio uniforme de parmetros e , sendo > , se sua densidade

1
especificada por:
, HJKJ  Q uz, ywe
q  xy  z
0, HJKJ  { uz, yw
a. Valor Esperado: AI 
|}

} |

b. Varincia:
0, HJKJ  / z
c. Distribuio acumulada: C  x}| , HJKJ z O  / y e
|

1, HJKJ  L y

39. Distribuio Exponencial: Tem forte relao com o modelo discreto de Poisson.
Enquanto a de Poisson modela o nmero de ocorrncias em um perodo
contnuo (tempo, comprimento, etc.), a exponencial modela a varivel aleatria
contnua que representa o intervalo (de tempo, comprimento, etc.) entre as
ocorrncias.
Pode ser usada quando h independncia entre as ocorrncias e h uma

definida por um nico parmetro denominado mdia (define a


taxa mdia de ocorrncia constante no intervalo considerado.

a. Funo de densidade de probabilidade: q  d o


mdia de ocorrncias de um evento por unidade de medida).

b. Valor esperado: A  o


c. Varincia: T 

o
d. Distribuio acumulada: C  ;  L   d o
Formulrio para Probabilidade e Estatstica

dois parmetros: (mdia) e (desvio padro). E atravs destes dois valores possvel
40. Distribuio Normal: a distribuio mais importante e pode ser definida apenas com

calcular a percentagem de valores que devero estar acima ou abaixo de um

a. Funo densidade de probabilidade: Dados e , com > 0, a funo


determinado valor da varivel aleatria, ou entre esses dois valores definidos etc.

 hj 
dada por: q  d
  !



b. Valor esperado: E(X) = (a variao da mdia desloca horizontalmente o


grfico);

c. Varincia: V(X) = (a variao da varincia comprime ou estica


verticalmente o grfico).

Uma varivel aleatria X com distribuio normal, mdia e varincia


representada por X : N(,  e:
A curva do grfico simtrica em torno de ;
Teoricamente a curva prolonga-se de - a +, sendo lim t q  0;
A rea total sob a curva igual a 1 (rt qs  1);
t

A combinao linear de duas variveis aleatrias normais resulta em outra

 Aa  J ,  ;
normal, sendo aX1 e bX2 as variveis aleatrias independentes

 Ta  J   ,  

d. Distribuio Normal Padro: Seja X: N(, . Ento 




, que tem
distribuio normal com mdia = 0 e desvio padro = 1.

Aproximaes da Distribuio Normal em relao :

de 1. A aproximao considerada razovel se np L 5 e n(1-p) L 5;


41. Binomial: Pode ser aproximada se n bem grande e p no prximo de 0 ou

Os parmetros e da distribuio normal devem se identificar ao valor

   H e   VH 1  H
esperado e desvio padro do modelo bicondicional, ou seja:

Deve-se usar tambm uma correo de continuidade, pois ao aproximar


variveis aleatrias discretas (s assume valores inteiros) para contnuas
(que s assume intervalos), devemos considerar uma pequena parte
antes e depois do ponto para clculo de probabilidade (meia unidade
antes e aps o ponto).

42. Poisson: Se aproxima de uma normal quando grande. Ento:


  p e   p
Formulrio para Probabilidade e Estatstica

43. Grfico de Probabilidade Normal: Quando o nmero de observaes de uma


amostra grande, pode-se construir um histograma e verificar se sua forma
segue a forma de sino, sugerindo uma distribuio normal. Se n for pequeno, o
histograma pode ter uma forma muito diferente da sua real distribuio, alm
de poder ser influenciado por um valor discrepante. O grfico de probabilidade
normal mais adequado para verificar se o grfico da distribuio segue o
modelo normal. Se as observaes provm de uma distribuio normal, uma
relao aproximadamente linear entre os valores esperados (eixo y) e as
amostras (eixo x).

Distribuies Amostrais e Estimao de Parmetros

44. Definies:
a. Parmetro: medida descritiva (mdia, varincia, proporo, etc.) de valores
x1, x2,... associados populao.
b. Estatstica: medida descritiva das variveis aleatrias X1, X2,... associadas
amostra. A distribuio de probabilidades de uma estatstica denominada
distribuio amostral.
c. Amostra aleatria simples: conjunto de n variveis aleatrias
independentes {X1, X2,..., Xn}, cada uma com a mesma distribuio de
probabilidades de certa varivel aleatria X. Essa distribuio de
probabilidades deve corresponder distribuio de freqncias dos valores
da populao (x1, x2,..., xn).

Parmetros Estatsticas
 dd*d * JK  dd*d * JK
H ; 
l 
Proporo


1 1
   I  I
l 
Mdia
 

1
          
l 1
Varincia
 

Distribuies Amostrais

45. Distribuio Amostral da Mdia: Seja uma amostra aleatria simples {X1,
X2,...,Xn} e a estatstica I (mdia amostral):
a. AI  ;
b. TI  (se a amostragem for com reposio, ou N muito grande ou infinito);


c. TI 
 



(se a amostragem for sem reposio e N no muito grande, N < 20n)


( = fator de correo populacional finita).


d. Teorema do Limite Central: Se n for razoavelmente grande, ento a

normal. Em geral, n L 30 j d uma boa aproximao, porm se a


distribuio amostral da mdia pode ser aproximada pela distribuio

distribuio da populao no for muito distante de uma normal, a


aproximao pode ser usada com um n menor.
Formulrio para Probabilidade e Estatstica

46. Distribuio Amostral da Proporo: usada para estudar uma proporo dos
elementos que possuem um determinado atributo.
a. Distribuio de populao: pode ser representado por uma varivel aleatria
de Bernoulli com funo de probabilidade:

( b(
0 1p

b. A#;$  H
1 p

c. T#; $ 
 

(se a amostragem for com reposio, ou N muito grande ou

d. T#; $ 
infinito);

  



(se a amostragem for sem reposio e N no muito grande, N < 20n);
e. Se o tamanho da amostra for razoavelmente grande, pode ser aproximada
pela distribuio normal. Mas se n for pequeno, a distribuio exata
binomial ou hipergeomtrica (dependendo se a amostragem for com ou sem
reposio).

Estimao de Parmetros

um raciocnio tipicamente indutivo, em que se generalizam resultados da parte


(amostra) para o todo (populao). Pode-se ento realizar clculos sobre uma amostra
aleatria simples para estimar os parmetros de interesse. Os clculos poderiam ser:

I 
 I e `  
 I  I , que so os estimadores de e ,




respectivamente.

Uma estatstica T uma funo dos elementos da amostra (  I , I , , I


, .
Quando usada para avaliar certo parmetro , tambm chamada de estimador de
.

Um estimador uma varivel aleatria, pois depende da amostra a ser selecionada.


Realizada a amostragem, o estimador assume o valor do resultado do clculo, que
denominado estimativa.

a. A#;$  H
47. Intervalo de confiana para proporo:

b. T#;$ 
 

c. Erro Padro = 8  
 

d. Em todos os itens considerado que a populao bastante grande ou infinita.


Caso contrrio, necessrio o uso do fator de correo populacional finita.

e. Intervalo de Confiana: @H,   H 8 , onde:

H = proporo na amostra (pode ser calculada com base na amostra);


P = proporo na populao (parmetro que se quer estimar);

= nvel de confiana;

z = valor resultante da tabela da distribuio t-Student   ;

Formulrio para Probabilidade e Estatstica

8 = varincia da proporo da amostra. Geralmente no pode ser calculado


porque depende do parmetro desconhecido p. Nesse caso:
H 1  H 
@H,   H

Desde que a amostra seja grande (n L 50), a diferena entre 8 e 8 desprezvel.

V(X) = . Seja tambm uma amostra aleatria simples {X1, X2,..., Xn} de X.
48. Intervalo de confiana para mdia: Seja uma populao com E(X) = e

a. I 

 I (estimador natural de ).
Supondo X com distribuio aproximadamente normal:

b. AI   (mdia na populao)


c. TI 


(desvio padro / erro padro de I)



d.  

e. @,   


(se o desvio padro conhecido. Se no

  

      
 
       . Mas caso a amostra seja

grande, o uso da primeira frmula ainda permitido, pois a diferena entre


e s desprezvel. Caso a amostra seja pequena, usa-se uma correo (ver
abaixo)).


estatstica 
49. Distribuio t de Student: Supondo a populao com distribuio normal, a

tem distribuio de probabilidade conhecida como

distribuio t de Student, com gl = n 1 graus de liberdade.


Clculo do intervalo de confiana sem conhecer o desvio padro:
@,    
(  Olha-se a linha n-1 e a coluna  ).
) 

50. Tamanho da Amostra:


a. n = tamanho da amostra;

c. = nvel de confiana;
b. E0 = erro amostral mximo tolerado;

 
No caso de estimao de , temos:  L
E
(o valor final deve ser
arredondado para o menor inteiro que seja maior que o resultado final).

A varincia geralmente desconhecida, mas pode ser usada a varincia obtida


a partir de:
Estudos anteriores;
Argumentao terica;
Estudo piloto.
Formulrio para Probabilidade e Estatstica

  
Parmetro de interesse Valor inicial do tamanho da amostra

 
A
1. Uma mdia ():

 H1  H
 
A
2. Uma proporo (p):


  
4A
3. Vrias propores (p1, p2,...):

Populao infinita:    (arredondamento para o inteiro superior)


Tamanho da amostra

Populao de tamanho N:  




(arredondamento para o inteiro superior)

1
Caso se queira estimar uma proporo p (0 < p < 1):
   H 1  H O
4
No caso esteja sendo usado IC = 95%,   E


Formulrio para Probabilidade e Estatstica

Testes de Hipteses

51. Hipteses: Nula ou de Trabalho (H0) sempre uma igualdade; Alternativa (H1)
uma desigualdade;

52. Probabilidade de significncia: valor p;

53. Nvel de significncia do teste: ; se p > , ento a hiptese H0 aceita; se p < ,


ento a hiptese H0 rejeitada.

54. Tipos de erro: Tipo I: P(rejeitar H0 |H0 verdadeira) = ;


Tipo II: (aceitar H1 |Hfalsa) = ;

55. Abordagem clssica: ao planejar o experimento, monta-se uma regra de deciso em


termos da estatstica do teste sob H0.

56. Testes unilaterais / bilaterais: unilaterais: quando H0 H1;


bilaterais: quando H0 < H1 / H0 > H1;

57. Testes usando a distribuio binomial:  n 5 H   V 5 H 5 1  H


As probabilidades de cada n so somadas em uma cauda (unilateral) ou em duas (bilateral).
,
Se aproximado por uma distribuio normal, 

58. Teste para mdia:


a) Para conhecido (normal padro): 
  5

;
  5


b) Para desconhecido (t-Student): t ; (s = varincia de uma amostra)

Comparao entre Tratamentos

59. Teste t para duas amostras pareadas: H0: 1 = 2; H1: 1 2 (tambm < ou >);
, onde s a mdia das
+ 5

estatstica do teste:  
)
Diferena: D = X2 X1
diferenas e sd o desvio padro das diferenas.

60. Teste t para duas amostras independentes: H0: 1 = 2; H1: 1 2 (tambm < ou >);
Varincia agregada:  
) )


 5

Estatstica do teste (para amostras com tamanhos iguais):   
 

22J
,
onde  a mdia da amostra 2;  a varincia agregada das
 a mdia da amostra 1;
duas amostras.
Formulrio para Probabilidade e Estatstica

Estatstica do teste (para amostras com tamanhos diferentes):



  5) 
  5)
  



 
  ) 5



 

Sendo que as amostras so independentes, varincias populacionais so iguais nos dois grupos
e os dois conjuntos provm de distribuies normais.

Correlao e Regresso

61. Correlao: positiva e negativa; diagramas de disperso;

62. Coeficiente de correlao linear de Pearson:   , 


F  F 
)h )
, (i = 1, 2, ..., n)

K FF 5F 


(pode incorporar erros de arredondamento)
 5  5      5  
K
 5       5  5    
Sendo r pertencente ao intervalo [-1,1]. A fora da correlao pode ser ausente, fraca,
moderada, forte ou total. O sentido pode ser positivo ou negativo.

63. Coeficiente de correlao populacional:  @KKI, a  A  5 !


 

Onde X = E(X), Y = E(Y), X = VTI e Y = VTa.


64. Inferncia sobre : H0: = 0 (X e Y no so correlacionadas);
H1: 0 (X e Y so correlacionadas, podendo ser tambm > (positivamente)
ou < (negativamente)).
k 5

Teste (t-Student):  
V k 

65. Regresso Linear Simples: X = Varivel explicativa ou independente.


Y = Varivel resposta ou dependente.
66. Modelo de Regresso Linear Simples: A&a'  z , y, com e como parmetros do
modelo. Seja um conjunto de observaes (x1, y1), ..., (xn, yn): a  z , y , , onde Y a
varivel aleatria associada i-sima observao de Y e i o erro aleatrio da i-sima observao
de Y de forma aleatria.

67. Mtodo dos mnimos quadrados: Mtodo para encontrar a reta mais prxima
possvel dos pontos observados. Tal mtodo faz com que a soma dos erros
quadrticos seja a menor possvel.
Erro aleatrio da i-sima observao (i = 1, 2, ..., n):  a  z , y . Tal
mtodo consiste em obter os valores de e que minimizam:
`    &a  z , y '
Formulrio para Probabilidade e Estatstica

Resultando nas seguintes estimativas para (a) e (b):


F  F
 J

5F F  F 5 F 


5 F  F 

, onde (x1, y1), ..., (xn, yn) e a amostra

68. Equao (reta) de regresso:  J , .


efetivamente observada.
Valor predito:  J , 
Resduo:d  

seguinte equao:        ,   
69. Anlise de varincia do modelo: as somas dos quadrados dos desvios satisfazem

 F 
70. Coeficiente de determinao: 

F 
( uma medida descritiva da

variao de Y que pode ser explicada por variaes em X, segundo o modelo especificado;
R explica, 1-R = fatores no controlveis no processo).

 
71. Soma dos quadrados totais: (Com n-1 graus de liberdade)

`       


72. Soma dos quadrados do erro ou dos resduos: (com n-2 graus de liberdade)
`A        J 5  5 

73. Soma dos quadrados da regresso: `  ` `A;

74. Coeficiente de determinao:  1


E

Вам также может понравиться