Вы находитесь на странице: 1из 43

UNIVERSIDADE ESTADUAL PAULISTA

"JLIO DE MESQUITA FILHO"



Campus de Presidente Prudente









Principais Distribuies
de Probabilidade e Noes Bsicas
de SAS







Relatrio das atividades desenvolvidas no perodo
de 26/04/2008 a 27/02/2009 da Bolsa de Apoio
Acadmico e Extenso I (PAE)
.






Bolsista: Fabiano Jos dos Santos
Orientadora: Vilma Mayumi Tachibana







Presidente Prudente
2009
2

ndice


1 - Introduo....................................................................................................... 4
2 - O que faz um Estatstico................................................................................ 5

3 - Variveis Aleatrias Discretas......................................................................


6

3.1- Introduo......................................................................................................

6
3.2 - Funes discretas de probabilidade.............................................................. 6
3.3 - Esperana Matemtica (Mdia).....................................................................
6
3.4 -Varincia.........................................................................................................
7
3.5 - Desvio Padro...............................................................................................
7

4 - Principais Modelos Discretos........................................................................


9
4.1 - Modelo Uniforme Discreto........................................................................... 9
4.2 - Distribuio de Bernoulli.............................................................................. 9
4.3 - Modelo Binomial.......................................................................................... 10

5 - Outros Modelos Discretos..............................................................................


12
5.1 - Modelos Geomtricos................................................................................... 12
5.2 - Modelo de Poisson........................................................................................ 13
5.3 - Modelo Hipergeomtrica.............................................................................. 13

6 - Variveis Aleatrias Contnuas....................................................................


15
6.1- Introduo...................................................................................................... 15
6.2 - Esperana e Varincia.................................................................................. 16
6.3 - Distribuio Continua Uniforme................................................................... 16
6.4 - Distribuio Exponencial.............................................................................. 17
6.5 - Distribuio Normal...................................................................................... 18
6.6 - Funo Densidade de Probabilidade da Distribuio Normal...................... 18

7 - Outros Modelos Contnuos...........................................................................


22
7.1 - Distribuio gama......................................................................................... 22
7.2- Distribuio Qui-Quadrado 23
7.3 - Distribuio t-Student.. 25

8 - Variveis Aleatrias Multidimensionais......................................................


27
8.1- Distribuies Marginais................................................................................. 27








3

9 - Medidas de Posio e Disperso...................................................................

28
9.1 - Mdia............................................................................................................ 28
9.2 - Mediana. 28
9.3 - Moda. 28
9.4 - Varincia....................................................................................................... 28
9.5 - Desvio Padro ...................... 29
9.6 - Covarincia... 29
9.7 - Coeficiente de Correlao. 29
9.8 - Coeficiente de Variao ............... 29
9.9 - Amplitude 29

10 - SAS Programao


31
10.1 - Introduo....... 31
10.2 - Conceitos Basicos........... 31
10.3 - Estrutura do arquivo SAS........................................................................... 32
10.4 - Nomenclatura para arquivos de variveis................................................... 32
10.5 - Estrutura PROC STEP................................................................................ 33
10.6 - Procedimento PRINT.................................................................................. 34
10.7 - Sntese dos Comandos................................................................................ 34
10.8 - Comando LIBNAME.................................................................................. 35

11 - Alguns comandos bsicos de programao do SAS..................................


36
11.1 - Comando IF-THEN/ELSE.......................................................................... 37
11.2 - Comandos DO/END................................................................................... 39
11.3 - Comando INPUT........................................................................................ 40
11.4 - Input Colunado........................................................................................... 40
11.5 - Input Formatado.......................................................................................... 40
11.6 - Controles Especiais do Comando INPUT................................................... 41
11.7 - Detalhes do Comando INPUT................................................................... 45

12 - Referncias....................................................................................................


43









4
1 - Introduo


O cidado comum pensa que a estatstica se resume apenas a apresentar tabelas de n-
meros em colunas esportivas e ou econmicas de jornais e revistas, ilustradas com grficos,
pilhas de moedas, etc. ou quando muito associam a estatstica previso de resultados eleito-
rais. Mas estatstico de hoje no se limita a compilar tabela de dados e os ilustrar graficamen-
te. Pois partir de 1925, com os trabalhos de Fisher, a estatstica iniciou-se como mtodo ci-
entfico, ento, o trabalho do estatstico passou a de ajudar a planejar experimentos, interpre-
tar e analisar os dados experimentares e apresentar os resultados de maneira a facilitar a to-
mada de decises razoveis. Deste modo, podemos ento definir a estatstica como sendo a
cincia que se preocupa da coleta, organizao, apresentao, anlise e interpretao dos da-
dos. Didaticamente podemos dividir a estatstica em duas partes a estatstica descritiva e a
inferncia estatstica. A estatstica descritiva se refere maneira de apresentar um conjunto de
dados em tabelas e grficos, e ao modo de resumir informaes contidas nesses dados de me-
didas. J a inferncia estatstica baseia-se na teoria de probabilidade para estabelecer conclu-
ses sobre todo um grupo (chamado populao), quando se observou apenas uma parte (a-
mostra) desta populao.
necessrio ter em mente que a estatstica uma ferramenta para o pesquisador, nas
respostas dos por qus de seus problemas. E que para ela ser bem usada necessrio conhe-
cer seus fundamentos e princpios, e acima de tudo que o pesquisador desenvolva um esprito
critico e jamais deixe de pensar. Pois em cincia fcil mentir usando a estatstica, o difcil
falar a verdade sem usar a estatstica.
Este relatrio apresenta alguns resultados de estudo de estatstica descritiva, probabili-
dade e comandos bsicos de SAS, tendo como base os livros de Bussab (2005), Magalhes e
Lima (2002) e a apostila do curso Computao Aplicada Estatstica elaborada por Tachibana
(2007). Adotou-se como referncia esses livros por serem bastante didticos e por apresenta-
rem questes atuais e interessantes. Esses autores no sero referenciados ao longo do relat-
rio, mas todas as teorias e exerccios apresentados so retirados de seus livros. Esse relatrio
tem presente apenas uma sntese, desses estudos, com apresentao de resolues de alguns
exerccios propostos na literatura citada.



5
2 - O que faz um Estatstico

A atividade bsica de Estatstico coletar, analisa e interpretar numericamente as
informaes. assim que ele trabalha em uma pesquisa de opinio pblica ou de anlise de
mercado, planejando, dirigindo e efetuando levantamento estatstico de controle de qualida-
de e analisando dados obtidos em recenseamentos. O campo de atuao vai muito alm dis-
so: nas empresas (pblica ou privada) podem trabalhar como dirigentes (diretores, gerentes,
...), em reas de planejamento financeiro e de produo, aplicando mtodos estatsticos no
controle de qualidade de produtos. Na indstria farmacutica a Estatstica aplicada para
analisar e testar novos produtos. Na Medicina, a Estatstica vem sendo utilizada nos estudos
de epidemias, na anlise de novos mtodos clnicos e cirrgicos, no registro e coleta de da-
dos sobre a sade pblica. Na agroindstria, a busca de tcnicas que possibilitem aumento
na produo e diminuio nos custos, melhoria gentica, entre outros, tem exigido a partici-
pao efetiva de Estatsticos, para orientar, planejar e desenvolver e implementar novas tec-
nologias. Na indstria de manufatura propriamente dita, o Estatstico desempenha papel
fundamental: otimizando processos, buscando continuamente a melhoria da qualidade de
servios e produtos. Nas Cincias Atuariais, desenvolvendo e gerenciando planos de sade,
fundos de penso ou previdncia privada. Resumindo: O Estatstico um profissional que
produz informao especializada para um mundo cada vez mais especializado. graas a
isto e sua atuao diversa que o Estatstico est conquistando o mercado de trabalho num
crescimento constante e contnuo.










6
3 - Variveis Aleatrias Discretas

3.1 - Introduo
Neste captulo, incorpora-se o conceito de probabilidade no estudo de variveis associa-
das a caractersticas em uma populao. Na formalizao feita com a introduo de probabili-
dades, sero tratadas apenas variveis quantitativas. Haver distino entre o caso discreto e
contnuo, pois a atribuio de probabilidades ser diferente em cada situao. As variveis
qualitativas podem ser, em algumas ocasies e com devido cuidado, tratadas como discretas
na atribuio de probabilidades.

3.2 - Funes discretas de probabilidade
A funo que atribui a cada valor da varivel aleatria sua probabilidade denominada
de funo discreta de probabilidade ou simplesmente funo de probabilidade. A notao a
ser utilizada :
( ) ( ) , 1, 2,...
i i i
p X x p x p i = = = =
Uma funo de probabilidade satisfaz 0 1
i
p e 1.
i
i
p =


Note que, na maioria dos casos, X ter apenas um nmero finito de valores possveis e,
assim, a verificao de que a soma de probabilidade igual a 1 ser feita por uma soma finita.
As variveis aleatrias so completamente caracterizadas pela sua funo de probabilidade e
uma parte importante da Estatstica justamente obter, pra uma dada varivel de interesse, a
funo de probabilidade que melhor represente seu comportamento na populao.

3.3 - Esperana Matemtica (Mdia)
Assim como a mdia de uma distribuio de freqncias definida como soma de
produtos dos diversos valores observados pelas respectivas freqncias relativas, natural
definir a mdia de uma varivel aleatria (v.a.), ou de sua distribuio de probabilidade, como
a soma de produtos dos diversos valores de x
i
da v.a. pelas respectivas probabilidades P(x
i
).
A mdia de uma v.a. X tambm chamada valor esperado ou esperana matemtica,
ou simplesmente esperana de X. representada por E(X) e se define como:

=
= = = + + = + = =
n
1 i
i i n n 2 2 1 1
) x X ( P x ) x X ( P x ) x X ( P x ) x X ( P x ) X ( E
uma mdia ponderada dos x
i
, em que os pesos so as probabilidades associadas.

7
Funo de repartio ou de distribuio acumulada.
Uma maneira alternativa pela qual pode-se caracterizar a distribuio de probabilidade
de uma v.a por meio da sua funo de repartio ou distribuio acumulada, designada
por F(X). Essa funo definida por
( ) ( ) F X p X x =
Para as variveis aleatrias discreta tem-se que:
( ) ( )
i
i
x x
F X p x



3.4 - Varincia
Assim como a mdia uma medida de posio de uma v.a., natural que se procure
uma medida de disperso dessa varivel em relao mdia. Existem vrias formas de se ob-
ter essa medida, sendo a que melhor representa essa disperso a varincia, representada por
2

e definida por:

=
= = =
n
1 i
i
2
i
2
) x X ( P )) X ( E x ( ) X ( Var
Desenvolvendo o termo quadrtico do somatrio, obtem-se uma expresso mais fcil
de calcular a varincia dada por:
2 2 2
)] X ( E [ ) X ( E ) X ( Var = = ,
na qual

=
= =
n
1 i
i
2
i
2
) x X ( P x ) X ( E .

3.5 - Desvio Padro
O desvio padro () a raiz quadrada positiva da varincia. Tem sobre essa ltima a
vantagem de exprimir a disperso na mesma unidade de medida da v.a.:
2
=

Exerccios: Seja X uma v.a. discreta assumindo valores no conjunto {1,2,3} e com distribui-
o de probabilidade dada por

Tabela 1: Distribuio da varivel aleatria X


X 1 2 3
P(X = x) 1/3 1/6 1/2
8
a) Obtenha a distribuio da funo acumulada:
b) Calcule a mdia e a varincia de X;
c) Calcule ( 2) P X e ( 2). P X >

Soluo:
A funo de distribuio acumulada de X definida por

;
F (x) = P(X x) = P(X = y)
x
y y x



Para todo x . Portanto,


0 se x < 1
1/3 se 1 x < 2
F (x) =
1/2 se 2 x < 3
1 se x 3.
x


A mdia de X dada por:

1 1 1 13
E(X) = P(X = x) = 1. 2. 3.
3 6 2 6
x
x + + =


Como,

2 2
1 1 1 33
E(X ) =x P(X = x) = 1. 4. 9.
3 6 2 6
+ + =
Segue que a varincia de X dada por:

2
2 2
33 13 29
V (X) = E(X ) - [E(X)] =
6 6 36
| |
=
|
\

Outro modo de calcular V(X) seria calcular a soma

2 2
V (X) = E[(X - E(X)) ] = (x - (13/6)) P(X = x)
x


Finalmente,

2
P(X 2) = P(X = 2) + P(X = 3) =
3
e
1
P(X > 2) = P(X = 3) = .
2







9
4 - Principais Modelos Discretos

Algumas variveis aleatrias aparecem com bastante freqncia nas situaes prticas e
justificam um estudo mais aprofundado. Em geral nesses casos, a distribuio de probabilida-
de pode ser escrita de uma maneira mais compacta, isto , existe uma lei pra atribuir as proba-
bilidades.

4.1 - Modelo Uniforme Discreto
Seja X uma varivel aleatria cujos possveis valores so representados por
1 2
, ,..., x x .
Diz-se que X segue o modelo Uniforme Discreto se atribui a mesma probabilidade 1/k para
cada um desses k valores, isto sua funo de probabilidade dada por:
( ) 1/ ,
j
p X x k = = 1, 2,...., . j k =
Observe que a expresso so probabilidades, uma vez que seus valores esto no intervalo
[0,1] e a soma de todas as probabilidades igual a 1. O modelo Uniforme tem esse nome pois
todos os seus valores ocorrem com a mesma probabilidades e, assim, pode-se dizer que a pro-
babilidade se distribui uniformemente entre os diversos valores.

Exemplo: Nmero de Caras em nico arremesso de uma moeda honesta.
Neste experimento o espao amostral {H, T }, sendo H cara e T coroa. A varivel aleatria
que escreve o nmero de caras em um nico arremesso NH(H) = 1 e NH(T ) = 0. Como a
moeda honesta a distribuio de probabilidades P(x
j
) = 1/2 com x
j
no nulo em {0, 1}.

4.2 - Distribuio Discreta Bernoulli
Seja um experimento no qual s pode ocorrer sucesso ou fracasso e associa-se
uma v.a X aos possveis resultados, de forma que: x = 1 se o resultado for um sucesso e x = 2
se o resultado for um fracasso
Diz-se que a varivel aleatria assim definida tem distribuio de Bernoulli. Sendo p a
probabilidade de ocorrer um sucesso, a probabilidade de ocorrer um fracasso ser q = 1 p e
a funo probabilidade da distribuio Bernoulli ser:
, 1 ( )
( ) 1 0 ( )
0
p se k Sucesso
p X k p se k Fracasso
se outro caso
=

= = =


Pode-se observar que: p X E = ) ( e . ) ( pq X Var =

10
Obs: Essa distribuio tem importncia como geradora de outras distribuies.

Exerccio: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja
X: n de bolas verdes. Calcular E(X), Var(X) e determinar P(X).

Soluo:
1
30 3
0
50 5
( ) (2 5) .(3 5)
20 2
1
50 5
x x
q
X P X x
p

= =

= = =

= =



2
( )
5
( ) . (2 5).(3 5) 6 25
E X p
Var X p q
= =
= = =


4.3 - Modelo Binomial
Considere a repetio de n ensaios de Bernoulli independentes e todos com a mesma
probabilidade de sucesso p. A varivel aleatria que conta o nmero total de sucesso deno-
minada Binomial com parmetros n e p e sua funo de probabilidade dada por
( ) (1 ) , 0,1, 2,...., ,
k n k
n
p X k p n k n
k

| |
= = =
|
\

Com
n
k
| |
|
\
representando o coeficiente binomial calculado por
!
!( )!
n
n
k k n k
| |
=
|

\

Usa-se a notao X ~ b(n, p) para indicar que a varivel aleatria X segue o modelo Bi-
nomial com parmetros n e p. As probabilidades so caracterizadas pela informao dos pa-
rmetros.
Em situao prticas, a varivel Binomial aparece a partir de outras variveis, pela cri-
ao de duas categorias excludentes.
Na distribuio Binomial tem-se:
E(X) = Np e Var(X) = npq.

Exerccios: 1) Uma moeda perfeita e lanada quatro vezes. Seja Y o nmero de caras obtidas.
Calcule a distribuio de Y.

Soluo:
Observe que Y assume valores no conjunto {0, 1, 2, 3, 4}. Portanto, a distribuio de Y
dada por:
11
4 4
4
4
1 1
P(Y = y) = C 1
2 2 2
y y
y
y
C

| | | |
=
| |
\ \
, para y = 0, 1, 2, 3, 4.
2) Repita o problema anterior, considerando agora que a moeda viciada, sendo a probabili-
dade de cara dada por p, com 0 < p < 1.

Soluo:
Observe que Y assume valores no conjunto {0, 1, 2, 3, 4}. Portanto distribuio de Y
dada por:
4 4-y
P(Y = y) = C p (1 - p)
y
y
, para y = 0, 1, 2, 3, 4.
























12
5 - Outros Modelos Discretos

Apresenta-se neste captulo, os modelos Geomtricos, Poisson e Hipergeomtrico, que
tm vrias aplicaes prticas. No captulo anterior, os modelos definidos assumiram apenas
um nmero finito de valores distintos. Como ser visto a seguir, os modelos Geomtricos e
Poisson podem ter um nmero infinito de valores dentre os inteiros positivos.

5.1 - Modelos Geomtricos
Tem-se agora repetio da Bernoulli at que o sucesso ocorra. Assim a v.a. X assume os
valores possveis 1, 2, 3....., k, .... de nmero de repetio at ocorrer um sucesso .
Supe-se que um dado jogado at que se obtenha sucesso. Sendo + para sucesso e
para Fracasso, tem-se:
, , , , , , ..........., +

Desta forma pode-se fazer com que p seja a probabilidade de sucesso e q = 1 p a pro-
babilidade de fracasso, ento:

1
( ) 1, 2, .....
k
p X k q p para k

= = =
Para que a distribuio satisfaa as condies necessrias de uma distribuio Geomtri-
ca preciso que:
1)
00
1
( ) 1
k
p X k
=
= =

e 2) ( ) 0 p X k = .
Analogamente tem-se que
1
( ) E X
q
=
e
2
( )
q
Var X
p
=


Exerccios: 1)Suponha que uma moeda perfeita lanada at que cara aparea pela primeira
vez. Seja X o nmero de lanamento at que isso acontea. Obtenha a distribuio de X.

Soluo:
Observe que X assume valores no conjunto {1, 2, 3,....}. Portanto, a distribuio de X
dada por
1
1 1 1
P(X = x) =
2 2 2
X
X

| | | |
=
| |
\ \
, para x = 1, 2, 3,.....
2) Repita o problema anterior, considerando agora que a moeda viciada, sendo a probabili-
dade de cara dada por p, com 0 < p < 1.

13
Soluo:
Nesse caso a distribuio de X dada por
x-1
P(X = x) = (1 - p) p , para x = 1, 2, 3,.....

5.2 - Modelo de Poisson
Uma varivel aleatria X tem distribuio de Poisson com parmetros 0 > se sua fun-
o de probabilidade dada por:
( ) , 0,1, 2, 3........,
!
k
e
p X k k
k

= = =
Com o parmetro sendo usualmente referido como taxa de ocorrncia. A notao ser
0
~ ( ). X P a freqncia mdia ou esperada de ocorrncias num determinado intervalo de
tempo.
Analogamente tem-se que E(X) = t e Var(X) = t.

Exerccio: Em um processo de fabricao de perfil de alumnio aparece em mdia uma falha
a cada 400 metros. Qual a probabilidade de ocorrer 3 falhas em 1000 metros de perfil?

Soluo:
Sabe-se que ( )
!
k
e
p X k
k

= = . Logo, como k = 3 e
1
400
= , portanto:
3 3
1
400
1
.1000
400
1 1000
.1000
1 400 400
( 3) . 0, 2137
3! 6
P X e
e

| | | |
| |
\ \
= = = =

5.3 - Modelo Hipergeomtrica
Essa distribuio adequada quando se consideram extraes casuais feitas sem reposi-
o de uma populao dividida segundo dois atributos. Para ilustrar, considere uma populao
de N objetos, r dos quais tm atributos A e N r tm o atributo B. Um grupo de n elementos
escolhido ao acaso, sem reposio. de interesse calcular a probabilidade de que esse grupo
contenha k elementos com o atributo A. Pode-se ver facilmente, utilizando o princpio multi-
plicativo, que essa probabilidade dada por:
,
k
r N r
k n k
p
N
n
| || |
| |

\ \
=
| |
|
\

14
na qual os pares ( , )
k
k p constituem a distribuio hipergeomtrica de probabilidades. Se a v.a.
X for definida como os nmeros de elementos na amostra que tem atributos A, e ento,
0 min( , ). k r n

Analogamente, tem-se que ( ) E X np = e ( ) (1 )
1
N n
Var X np p
N

.

Exerccios: Uma caixa contem 12 lmpadas das quais 5 esto queimadas. So escolhidas 6
lmpadas ao acaso para iluminao de uma sala. Qual a probabilidade de que:
a) Exatamente duas estejam queimadas?
b) Pelo menos uma esteja boa?

Soluo :
a) Observe que:

Logo, tem-se que:
5 7
.
2 4
( 2) 0, 3788
12
6
P X
| | | |
| |
\ \
= = =
| |
|
\
.
b) Pelo que se pode observar, tem-se que ( 6) 0 P X = = , pelo fato de no existir 6 lmpadas
queimadas. Portanto: ( 6) ( 5) ( 6) 1 P X P X P X < = = = .









15
6 - Variveis Aleatria Contnuas

6.1 - Introduo
Neste captulo sero estudados modelos probabilsticos para variveis aleatrias cont-
nuas, ou seja, variveis para as quais possveis valores pertencem a um intervalo de nmeros
reais.
Uma funo X, definida sobre espao amostral e assumindo valores num intervalo
de nmeros reais, dita uma varivel aleatria contnua.
A caracterstica principal de uma v.a. contnua que, sendo resultado de uma mensu-
rao, o seu valor pode ser pensado como pertencente a um intervalo ao redor do valor efeti-
vamente observado. Por exemplo, ao dizer que a altura de uma pessoa 1,75 cm, est-se me-
dindo sua altura usando cm com unidade de medida e portando o seu valor observado , na
realidade, um valor entre 174,5 cm e 175,5 cm.

Definio: Seja X uma varivel aleatria. Suponha que os possveis valores de X seja um in-
tervalo que possui infinitos valores, ento se diz que X uma varivel aleatria contnua.

Se X uma v. a. contnua, a funo densidade de probabilidade f(X), indicada abrevia-
damente por fdp, uma funo que satisfaz s seguintes condies:
(a) f(X) 0, X;
(b) A rea sob a funo densidade de probabilidade 1, isto :

(c) P(a X b) = rea sob a funo densidade de probabilidade f(x) e acima do eixo x entre
os pontos a e b, isto :

(d) P(X = x
0
) = 0, porque:

Conseqncia: P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)

Se X uma v. a. contnua, a funo de distribuio acumulada (fda) de X definida
como:


= =
x
ds s f x X P x F ) ( ) ( ) ( .

1 dx ) x ( f =

=
b
a
dx ) x ( f ) b X a ( P
0 dx ) x ( f ) x X ( P
0
0
x
x
0
= = =

16
Exemplo: Considere a seguinte densidade de probabilidade: f(x) = 2x, para 0 x 1 e f(x) =
0, fora desse intervalo. Obtenha a F(x) de X.

>
= =
<
=

1 , 1
1 0 ,
0
2
0 , 0
) (
0
2 2
x
x x
x
s s
x
x F
x


6.2 - Esperana e Varincia
Se X uma v. a. contnua, o valor esperado de X (ou esperana matemtica de X) de-
notada por E(X) definido como:


= dx x f x X E ) ( ) (

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0 < x < 1, ento:
3
2
0
1
3
2
2 2 ) (
3
1
0
1
0
2
= = = =

x dx x dx x x X E

Definio: A varincia de uma varivel aleatria contnua definida por:
Var(X) = E(X
2
) [E(X)]
2
, onde


= dx x f x X E ) ( ) (
2 2
.

Exemplo: Para uma varivel que tm densidade f(x) = 2x, 0 < x <1, ento:
3
2
) ( = X E e
4
2
4
2
2 2 ) (
1
0
4
1
0
1
0
3 2 2
= = = =

x dx x dx x x X E . Logo, Var(X) = 2/4 (2/3)2 =1/18 =
0,056. Tambm se pode obter o Desvio Padro: 23 , 0 056 , 0 .

6.3 - Distribuio Continua Uniforme
Seja uma v. a. contnua que pode tomar qualquer valor no intervalo [a, b]. Se a proba-
bilidade da varivel cair em um subintervalo for a mesma para qualquer outra subintervalo de
mesmo comprimento, tem-se uma distribuio uniforme.
Sua funo densidade de probabilidade ser:
1
( ) f X para a x b
b a
=

e ( ) 0 f x caso contrrio = .
Tem-se que ( )
2
a b
E X
+
= e
2
( )
( )
12
b a
Var X

= .
Exerccios: Dada a v.a. X, uniforme em (5, 10), calcule as seguintes propriedades:
17
a) P(X < 7) b) P(8 < X < 9) c) P(X > 8,5) d)
( 7, 5 2) P X >


Soluo:
Tem-se que:
1
, 5 10
( ;5;10) 10
0 ,
se x
f x
caso contrario



=
`

)

a)
7 5
( 7) 0, 4
10 5
p X

< = =


b)
9 5 8 5
(8 9) (9) (8) 0,8 0, 6 0, 2
10 5 10 5
p x F F

< < = = = =


c)
8, 5 7, 5
( 8, 5) (8, 5) 0, 7
10 5
p X F

> = = =


d) ( 7, 5 2) P X > = logo, tem-se
7, 5 2
2 7, 5
9, 5
x
x
x
>
> +
>
ou
7, 5 2
2 7, 5
5, 5
x
x
x
+ >
>
<
. Portanto,
9, 5 5 5, 5 5
(5, 5 9, 5) (9, 5) (5, 5) 0, 8
10 5 10 5
p x F F

= < < = = =



6.4 - Distribuio Exponencial.
Uma v.a. contnua X que tome valores no negativos, ter distribuio exponencial
com parmetros 0 > , se sua funo densidade e probabilidade for dada por
( ) 0
( ) 0
x
f x e para x
f x Caso contrrio


= >
=

Assim,

dx x xf X E
1
) ( ) (


= = e
2
2
1
) ( )) ( ( ) (

dx x f X E x X Var = =


.

Exerccio: Para uma varivel Exponencial 1, determine a probabilidade de se sortear um va-
lor que se distancie no mximo 0,5 de mdia. Obtenha a expresso da funo de probabilidade
dessa varivel.Qual o valor do terceiro quartil?

Soluo:
Tem-se que : .
1
1
e ) 1 ( ~ = Exp X Logo,
1,5 1 1
`1 `1,5
0,5 1 1
5
0,5 1
0,5 1
0, 680
x x x x
e dx e dx e e e e e e


+ = + + =

.
18
6.5 - Distribuio Normal
A distribuio Normal uma das mais importantes distribuies contnuas de probabi-
lidade. Foi introduzida em 1730 por DMoivre e depois foi muito utilizada em Astronomia
pelo alemo fsico/matemtico Gauss, trazendo muita confuso para vrias pessoas que por
esse motivo, acham que foi Gauss que a descobriu.
Muitos dos fenmenos aleatrios de interesse comportam-se prximos a essa distribu-
io com valores muito freqentes em torno da mdia e diminuindo a freqncia medida
que se afasta da mdia.
Nem todos os fenmenos se ajustam distribuio Normal. Por exemplo, considere a
varivel tempo de durao, em horas, de uma lmpada de certa marca, conforme Figura 1.






Figura 1 Tempo de durao, em horas, de uma determinada lmpada

A experincia sugere que esta distribuio deve ser assimtrica com uma grande pro-
poro de valores entre 0 e 500 horas e uma pequena proporo de valores acima de 1500
horas
Obs: A distribuio utilizada nesse caso a Distribuio Exponencial.

6.6 - Funo Densidade de Probabilidade da Distribuio Normal
< < =
|

\
|

x e

x f

x
,
2
1
) (
2
2
1
2








Figura 2 - Grfico da densidade Normal


19

Propriedades:
A curva normal simtrica em torno da mdia ;
A moda e a mediana so iguais a ;
Os pontos de inflexo so e + ;
A rea sob a curva e acima do eixo horizontal igual a 1.

Parmetros: : mdia ou valor esperado

2
: varincia

Notao : X ~ N(,
2
)


A distribuio normal depende dos parmetros e
2








Figura 3 Curvas Normais com mdias diferentes e varincias iguais.



Figura 4 Curvas normais com a mesma mdia e varincias diferentes.

2
___N( ,
1
2
)
___N( ,
2
2
)
___N( ,
3
2
)

1
2
<
2
2
<


3
2
Curvas normais com
mesmo desvio padro,
mas com mdias dife-
rentes.
20
Clculo de Probabilidades
P(a < X < b)


rea sob a curva e acima do eixo horizontal (x) entre a e b.
a b
Figura 5 rea correspondente a P (a < X < b)

Se X ~ N( ;
2
), define-se:


=
X
Z . Ento, E(Z) = 0 e Var(Z) = 1.












Figura 6 Grficos das funes densidades de X ~ N (
2
, ) e Z ~ N (0, 1).

A varivel Z ~ N (0,1) denomina-se normal padro ou reduzida.
Portanto,
| || |

| || |

\ \\ \
| || |


< << < < << <


= == = | || |

| || |

\ \\ \
| || |


< << <


< << <


= == = < << < < << <
b
Z
a
P
b X a
P b X a P ) (

Dada a v.a. Z ~ N (0, 1) pode-se mos obter a v.a. X ~ N (,
2
) atravs da transformao in-
versa Z X + = .
a b x
f(x)
0 z
f(z)
a

b

21
Exerccios: A distribuio do tempo de durao de um certo tipo de pneu, em km, uma va-
rivel normal com durao mdia de 30.000 km e desvio padro 10.000 km,
a) Qual a probabilidade de um pneu escolhido ao acaso durar mais de 75.000km?
b) Qual a probabilidade de um pneu durar entre 63.500 e 70.000 km?
c) Qual a probabilidade de um pneu durar entre 50.000 e 70.000 km?
d) Qual a probabilidade de o pneu dura exatamente 65.555 km?
e) O Fabricante deseja do pneu uma garantia de quilometragem de tal forma que, se a du-
rao do pneu for inferior a garantia, o pneu deve ser trocado. De quanto deve ser a
garantia para que somente 1% dos pneus sejam trocados?

Soluo.
Pela definio sabe-se que a varivel aleatria X pode ser transformada em padro. Logo,
a) . 0668 , 0 4332 , 0 5 , 0 ) 5 , 1 ( 5 , 0 ) 5 , 1 (
10000
60000 75000
( ) 75000 ( = = < = > =

> = > Z P Z P Z P X P

b)
. 2045 , 0 1368 , 0 03413
) 35 , 0 0 ( ) 1 0 (
10000
60000 63500
0
10000
6000 70000
0
) 63500 60000 ( ) 700000 60000 ( ) 70000 63500 (
=
= < < < < = |

\
|
< < |

\
|
< <
= < < < < = < <
Z P Z P Z P Z P
X P X P X P

c)
. 6826 , 0 ) 3413 , 0 ( 2 ) 1 0 ( 2 ) 1 0 ( ) 0 1 (
) 1 1 (
10000
60000 70000
10000
60000 50000
) 70000 50000 (
= = < < = < < + < <
= < < = |

\
|
< <

= < <
Z P Z P Z P
Z P Z P X P


d) 0 ) 65555 ( = = X P , pelo fato de ser quase impossvel de ocorrer. A funo de densidade
contnua e pela definio de integral temse que em um ponto a integral 0.

e)


km. 36700 Portanto, . 23300 60000
33 , 2
10000
60000
Da, .
10000
60000
01 , 0 ) (
0 0
0 0
0
0
= =
=

\
|
<
= |

\
|
< = = >
x x
x x
Z P

x
Z P x X P




22
7 - OUTROS MODELOS

Juntamente com o modelo normal, esses modelos so teis para as v.a. de interesse
prtico, que na maioria dos casos assumem valores positivos e tendem a ter distribuies as-
simtricas direita.

7.1 - Distribuio Gama
Aplica-se a distribuio gama anlise de tempo de vida de equipamentos, de tempo
de retorno de mercadorias com falhas e a testes de confiabilidade.
A funo densidade de probabilidade para a distribuio gama dada por:

x r
r
e x
r
x f

=
1
) (
) ( para x 0
0 ) ( = x f para x < 0 ,
na qual os parmetros da distribuio gama, que podem assumir qualquer valor positivo, so:
, taxa mdia do processo; r, nmero especfico de eventos que ocorrem at que a varivel X
(tamanho do segmento de tempo ou espao) seja atingida e (r) a funo gama, definida
por:


=
0
1
) ( dx e x r
x r
Para r > 0

Esta funo tabelada, sendo alguns valores apresentados a seguir juntamente com
algumas propriedades dessa funo:
a) 1 ) 1 ( =
b) ) ( ) 1 ( r r r = +
c) ) 1 ( ) 1 ( ) ( = r r r
d) ! ) 1 ( k k = +
e) = ) 2 / 1 (
f)
k
k
k
2
) 1 2 ( * ... * 5 * 3 * 1
) 2 / 1 (

= +

A Figura 7 apresenta a funo f(x) para vrios valores de r.


23

f(x)

r=1 r=2 r=3


x
Figura 7 Funo Densidade de Probabilidade para a Distribuio Gama.

No caso especial de r = 1, tem-se a distribuio exponencial, pois (1) = 1, ficando-se
com:
x
e x f


= ) (

A distribuio gama se reduz distribuio qui-quadrado, que ser vista a seguir,
quando = 1/2 e r = d/2, em que d um parmetro inteiro positivo.
A distribuio de probabilidade expressa por:

=
x
dy y f x X P
0
) ( ) (
O valor esperado e a varincia so calculados por:

2

r
) X ( Var
r
) X ( E = =

Exerccio: Calcule a probabilidade de passado um minuto no mximo, dois carros tenha che-
gado a uma cabine de pedgio, considerando que = 5 carros por minuto.

Soluo:
Neste caso, r = 2, ficando-se com:

2
2 1
( ) 1 (1 )
1!
y x
P X x y e dy e


= = +


Como = 5, tem-se que: . 96 , 0 6 ) 006738 , 0 ( 1 ) 5 1 ( 1 ) 1 (
1 . 5
= = + = <

e X P

7.2 - Distribuio Qui-Quadrado
Um caso especial importante do modelo gama obtido fazendo-se / 2 v = e 2 = ,
com 0 v > inteiro.
24
Uma v. a. contnua Y, com valores positivos, tem uma distribuio qui-quadrado com
v graus de liberdade(denotada
2
( ( )) denotada v , se sua densidade for dada por
/ 2 1 / 2
/ 2
1
, 0,
( / 2)2 ( ; )
0, 0.
v y
v
y e y
v f y v
y

>

<


Tem-se que Y Var Y E 2 ) ( , ) ( = = e
0
( ) P Y y p > =
A distribuio qui-quadrado tem muitas aplicaes em Estatstica e, como no caso da
normal, existem tabelas para obter probabilidades. A tabela fornece os valores de
0
y tais que
0
( ) P Y y p > = , para alguns valores de p e de v.

OBS: Essa distribuio utilizada em testes de associao, homogeneidade e independncia
entre duas variveis, os famosos Testes Qui-Quadrados.

Exerccio: Verifique se h evidncia de associao entre as variveis tipo de propaganda
(comercial) e o gnero das crianas, em um teste realizado com 125 crianas.

Tabela 2: Nmeros de crianas segundo tipo de comercial escolhido e gnero.
Tipo de comercial
Gnero A B C Total
Menino 30 29 16 75
Menina 12 33 5 50
Total 42 62 21 125

Soluo:
Calcula-se o valor esperado da clula menino que prefere a propaganda A (cruzamento da
primeira linha com primeira coluna), se no houvesse influncia do sexo na preferncia:
75*42
25, 2
125
esperado = = . Assim calculando os valores esperados para todas as outras clu-
las tem-se:

Tabela 3 Valores observados, esperados e suas diferenas no teste qui-quadrado
Tipo de comercial
Gnero A B C Total
Menino

30 25,2 29 37,2 16 12,6 75
+4.8 -8,2 +3,4
Menina

12 16,8 33 24,8 5 8,4 50
-4,8 +8,2 -3,4
Total 42 62 21 125
25

Calculando o Qui-Quadrado tem-se
2 2 2 2 2 2
2
( 4,8) ( 8, 2) ( 3, 4) ( 4, 8) ( 8, 2) ( 3, 4)
25, 2 37, 2 12, 6 16, 8 24, 8 8, 4
amostra

+ + +
= + + + + +
2
0, 914 1, 808 0, 907 1, 371 2, 711 1, 376
amostra
= + + + + +
2
9, 09818
amostra
= ( 1).( 1) (2 1).(3 1) 1.2 2 onde r c = = = (grau de liberdade da distri-
buio qui-quadrado)

Grfico da distribuio Qui-Quadrado

Regio de Aceitao Regio de Rejeio
p = 0,95 1 p = 0,05

Pela destruio e pelo valor tabelado tem-se que:
2
( 1)( 1);
5, 991
r c p


= e
2
9, 09818
amostra
= .
Portanto pelos resultados obtidos tem-se que h evidncia de associao entre as variveis.

7.3 - Distribuio t-Student
A Distribuio t de Student importante no que se refere inferncia sobre mdias
populacionais.O nome Student vem do pseudnimo usado pelo estatstico ingls W. S. Gosset,
que introduziu essa distribuio no incio do sculo passado.
A v. a. X tem distribuio t de Student (ou simplesmente t) com mdia , parmetros
de escala e v graus de liberdade, denotando-se
2
~ ( , )
v
X t , se sua funo de densidade
dada por
2 ( 1)/ 2
(( 1) / 2)
( ; ) (1 / ) , 00 00
( / 2)
v
v
f t v t v t
v v
+
+
= + < <


Diz-se que tal varivel tem uma distribuio t de Student com v graus de liberdade e
indicada por t(v). Sua mdia ( ) 0 E t = e a varincia igual a ( )
2
v
Var t
v
=

.

26
Exerccio: Considere um teste de coliso de carros. A anlise de 12 carros danificados resulta
num custo de conserto que parece ter distribuio em forma de sino, com mdia igual a R$
26,227 e desvio-padro R$ 15,873. Determine:
a) a melhor estimativa pontual de (custo do conserto)
b) O intervalo de confiana para um nvel de confiana de 95%

Soluo:
a) dada pela mdia da amostra . 227 , 26 = x

b) Amostra pequena (n 30); desvio padro desconhecido; distribuio similar distribui-
o normal.
Na tabela: para a coluna 0,05 bilateral e grau de liberdade
2
n-1=11 t =2,201

. Logo,
2
15873
E= t . =2,201. 10.085, 29
12
s
n

= . Portanto, E x E x + < <



.
29 , 10085 227 , 26 29 , 10085 227 , 26 + < < 29 , 36312 71 , 16141 < <
Construindo-se tais intervalos para 100 amostras de 12 carros cada uma, 95% desses interva-
los contero a verdadeira mdia da populao, ou seja, a custo mdio do reparo.

















27
8 - Variveis Aleatrias Multidimensionais

Uma v.a. Bidimensional caracterizada por um par ordenado de valores assumidos
dentro de dado conjunto segundo as leis probabilsticas. Assim, se X for um ponto de um dado
branco e Y um ponto de um dado preto, considera-se a v.a. Bidimensional discreta (X, Y), tal
v.a. caracterizada pela seguinte funo de probabilidade:
1
( , )
36
p x y =
1, 2, 3, 4, 5, 6
1, 2, 3, 4, 5, 6
x
y
=
=

No caso de v.a. bidimensional contnua a distribuio de probabilidade ser caracte-
rizada por funo densidade de probabilidade bidimensional (ou conjunto) f(x,y).

Condies:
1) ( , ) 0 f x y
2)


=1 ) , ( dxdy y x f
Para uma dada regio
xy
R tem-se
[( , ) ] ( , )
xy
xy
R
p x y R f x y dxdy =



8.1 - Distribuio Marginais
Supondo que se tem a distribuio de varivel aleatria (X, Y), pode-se obter a distri-
buio apenas de X, independentemente do valor de Y, que ser denominada Distribuio
Marginal de X. Pode-se assim proceder tambm em relao a Y, obtendo ento a distribuio
marginal de Y.

Para uma dada Funo de probabilidade ( , )
i j
p x y tem-se que:
( ) ( , )
i i j
j
P X x p x y = =

Marginal de X
( ) ( , )
i i j
i
P Y y p x y = =

Marginal de Y

Para caso contnuo, sendo g(x) a funo densidade marginal de X, h(y) a funo de
densidade marginal de Y, so respectivamente,


= dy y x f x g ) , ( ) ( e


= dx y x f y h ) , ( ) (




28
9 - Medidas de Posio e Disperso

9.1 - Mdia (Esperana ou Expectncia) definida por:
) ( ) (
i
i
i
x p x X E = = para o caso discreto,
ou
00
00
( ) ( ) u E X xf x dx

= =

para caso contnuo.


A mdia tem as seguintes propriedades tais que (k uma constante)
1) ( ) E k k =
2) ( ) ( ) E kX kE X =
3) ( ) ( ) ( ) E X Y E X E Y =
4) ( ) ( ) E X k E X k =
5)Se X e Y so independentes, ento ( ) ( ) ( ) E XY E X E Y = .

9.2 - Mediana
o ponto que divide a distribuio em duas equiprovveis. denotada por md, sendo
que ( ) ( ) 0, 5 P x md P x md < = > = .
A mediana representa uma funo alternativa de caracterizao do centro da distribui-
o.

9.3 - Moda:
o ponto de maior probabilidade, no caso discreto, ou maior densidade de probabili-
dade, no caso contnuo.

9.4 - Varincia:
A varincia ser denotada por Var(X), ou simplesmente
2
. definida por:
2
( ) [( ) ] Var X E x u = ,
na qual ( ) E X u = ,
2 2
( ) ( )
i i
i
E X x p x =

, para o caso discreto e


00
2 2
00
( ) ( ) E X x f x dx

, para o
caso contnuo.
A varincia tem as seguintes propriedades:
1) Var(k) = 0
29
2)
2
( ) ( ) Var kX k Var X =
3) ( ) ( ) ( ) Var X Y Var X Var Y = +
4) ( ) ( ) Var X k Var X =

9.5 - Desvio Padro
a raiz da varincia, denotada por ( ) Dp X , tem a vantagem de ser expressa na mes-
ma unidade da varivel ( ) ( ) Dp X Var X =

9.6 - Covarincia
Esta medida tem como objetivo mensurar a relao entre as variveis aleatrias em
questo. Define-se ( , ) ( , ) ( ) ( ) Cov x y E x y E x E y =

9.7 - Coeficiente de Correlao
definido por:
) ( ). (
) , (
) , ( ) , (
Y Var X Var
Y X Cov
Y X Corr Y X = = tal que . 1 ) , ( 1 y X

9.8 - Coeficiente de Variao
definida como o quociente entre o desvio padro e a mdia. Serve quando se deseja
ter uma idia da disperso relativa
( )
. .( )
( )
Dp X
CV X
E X
=

9.9 - Amplitude
dada pela diferena entre o maior e o menor valor possvel da varivel. E denotada
por A.

Exerccio: Seja a funo densidade de probabilidade dada:


=
contrrio caso , 0
2 0 para ,
2
) (
x
x
x f . Deter-
mine mdia, mediana, moda, varincia e desvio-padro.

Soluo:
Mdia
2
3
0
4
( ) ( )
6 3
x
E X xf x dx dx = = = =


30

Mediana
2 2
0 0
( ) ( ) 0, 5
0, 5 0, 5 2
2 4 4
md
md
p x md p x md
x x md
dx md
< = > =
= = = =



Moda (2) 1 max mo f Valor i de probabilidade =

Varincia , )] ( [ ) ( ) (
2 2
X E X E X Var = com . 2
8
16
0
2
8 2
. ) (
2
2
0
2 2
= = = =

x
dx
x
x X E Portanto,
9
2
9
16
. 2
3
4
2 ) (
2
= = |

\
|
= X Var

Desvio-padro
2 2
( ) ( )
9 3
dp X Var X = = =


Coeficiente de variao
2
( ) 2
3
( ) 0, 35
4
( ) 4
3
Dp X
CV X
E X
= = =
















31
10. - SAS Programao

10.1 - Introduo
O SAS um dos pacotes estatsticos mais utilizados pelas grandes corporaes, em
mais de 100 diferentes pases, com cerca de 40.000 licenas distribudas e quase 4 milhes de
usurios. O nome nasceu como um acrnimo: Statistical Analysis System (SAS), mas a quan-
tidade de servios e produtos oferecidos pela SAS (a companhia que produz o SAS) foi se
tornando to diversa que hoje em dia o nome simplesmente SAS.
As origens do software datam da dcada de 70, quando os computadores ainda eram
operados por cartes perfurados (o comando CARDS, dentro do passo DATA, vem justamente
da) e o poder de processamento era muito baixo. O software composto por diversos mdu-
los, que provem solues para problemas especficos e os principais so:
SAS/Base: o sistema bsico do SAS, necessrio para rodar qualquer outro produto
SAS. Ele contm o passo DATA, para manipulao de dados e alguns procedimentos
estatsticos simples.
SAS/STAT: o mdulo que prov uma grande quantidade de mtodos estatsticos, co-
mo regresso, ANOVA, anlise multivariada, anlise de sobrevivncia entre outros.
SAS/GRAPH: o mdulo que permite fazer grficos em alta resoluo.
SAS/ETS: o mdulo que permite fazer anlise de sries temporais.
SAS/EG (ou Enterprise Guide): uma interface grfica para o SAS, permitindo fazer
algumas anlises estatsticas apontando e clicando.
Ao comprar uma licena do programa, necessrio pagar uma taxa adicional por cada
mdulo. Neste captulo ser apresentado alguns comandos bsicos de programao que po-
dem ser executados no SAS, resultado do estudo introdutrio deste software.
10.2 - Conceitos Bsicos
DATA SET: Arquivo de dados com estrutura SAS;

OBSERVAO: Registro de um arquivo de dados SAS;

JOB SAS: Arquivo com um programa SAS ( um conjunto de DATA Step's e PROC Step's);

32
DATA STEP: Diviso lgica de um programa SAS, no qual se cria e altera um, ou vrios ar-
quivos SAS (Data Set's ou conjunto de dados de entrada);

PROC STEP: Diviso lgica de um programa SAS, no qual se analisa e manipula os dados
contidos num arquivo SAS (Data Set's);

OBS: A funcionalidade do Sistema SAS foi construda em torno de quatro idias bsicas no
tratamento de dados:

Acessar dados; Administrar dados; Analisar dados; Apresentar dados;

10.3 - Estrutura dos arquivos SAS
O arquivo SAS um conjunto de dados arrumados num formato de tabela.

NOME SEXO IDADE ALTURA







As colunas nas tabelas so chamadas de variveis:
- Variveis correspondem aos campos de dados;
- Cada varivel recebe um nome;
- Para o SAS, s existem dois tipos de variveis: Caractere ou Numrica
As linhas na tabela so chamadas de observaes (ou registros). No existe limite para
o nmero de observaes.

Um Arquivo SAS dividido em duas partes:
Descritora : Contm a descrio do arquivo: Tamanho do arquivo, nmero de registros, no-
me, tipo, tamanho e formato de variveis, etc;
Dados : Contm os dados do arquivo.

10.4 - Nomenclatura para arquivos e variveis
Todos os nomes de arquivos e variveis devero seguir as seguintes regras:
CARLOS M 12 1.70
GILBERTO M 25 1.65
RICARDO M 30 1.80
. . . .
. . . .
. . . .
ALICE F 28 1.68
MARCIA F 22 1.75
33
- Possuir de 1 32 caracteres;
- Comear com letra (A-Z);
- Pode continuar com nmeros, letras ou travesses.

Exemplo 1: Foi usado o Comando INFILE: Comando que identifica e abre um arquivo ex-
terno de dados, somente para leitura.





Exemplo 2: Do seguinte conjunto, construir um arquivo de dados:
Nome Idade Peso Altura
Maria 23 57 1,65
Pedro 21 73 1,75
Cristina 19 55 1,63

data exemplo; nome do arquivo
input nome $ idade peso altura; declarao das variveis
cards; (ou datalines) indica que a linha dos dados vm em seguida
Maria 23 57 1.65
Pedro 21 73 1.75
Cristina 19 55 1.63
; indica que terminou o conjunto de dados
Run; est pronto para ser executado.(executa os comandos anteriores).

10.5 - Estrutura PROC Step
Introduo
- a seo de um programa SAS na qual se analisa os dados de um arquivo SAS, utilizando-
se procedimentos especficos para cada tipo de anlise.
- A maioria dos procedimentos SAS gera relatrios tcnicos;
- Todos os procedimentos iniciam com a palavra PROC seguida do nome especfico do pro-
cedimento ou rotina desejada;
- Os comandos em uma PROC no seguem uma hierarquia, ou seja, podem ser colocados em
qualquer ordem dentro da PROC;

DATA EXEMPLO1
INFILE C:\TEMP\CADASTRO.TXT;
INPUT PRIMEIRO_NOME $ 1-8 SEXO $ 10 IDADE 13-14 ALTURA 16-19 ;
RUN;
34
PROC <rotina> [opes] ;
[comando] ;
[comando] ;
RUN ;
rotina Palavra-chave que identifica o procedimento a ser executado.
opes Parmetros opcionais de configurao para execuo do procedimento.
comando Comandos de detalhamento na execuo do procedimento.
RUN Comando para execuo do procedimento SAS. Necessrio no ltimo procedimen-
to do programa SAS.

10.6 - Procedimento PRINT
- Procedimento do SAS que imprime, na sada padro, os dados contidos nos arquivos SAS;
- A sada padro , normalmente, a janela OUTPUT.

PROC PRINT [opes] ;
VAR <lista de variveis> ;
BY <lista de variveis> ;
SUM <lista de variveis> ;
opes DATA= Nome do arquivo SAS;
DOUBLE Espacejamento duplo;
NOOBS Suprime a coluna com o nmero de cada observao do arquivo;
LABEL Imprime os "label's" das variveis;
VAR Determina uma lista de variveis que sero impressas;
BY Determina a quebra ou agrupamento do relatrio, por uma ou mais variveis;
SUM Determina uma ou mais variveis numricas que sero totalizadas;

10.7 - Sintaxe dos Comandos
Todo comando SAS comea com uma palavra-chave (identificao) e termina com o
ponto e vrgula (;).
- Os comandos podem comear e terminar em qualquer parte da linha;
- Um comando pode se estender por diversas linhas;
- Vrios comandos podem ficar na mesma linha.

Exemplo:

35









10.8 - Comando LIBNAME
- Tipo: Comando de declarao;
- Uso: Livre;
- Comando opcional de configurao do processamento, que define uma ou mais reas de
trabalho e armazenamento (diretrios), para os arquivos SAS (Data Set's);
- Define o primeiro nvel de um nome de arquivo, a biblioteca SAS;

[biblioteca].<nome do arquivo>

- O comando LIBNAME, normalmente, colocado antes do comando DATA, e s ser ne-
cessrio ser executado uma nica vez durante uma sesso SAS WINDOWS.
LIBNAME <biblioteca> "<diretrio>" ;
Biblioteca Palavra de no mnimo 1 e no mximo 8 caracteres, que identifica o primeiro nvel
em um nome de arquivo.
Diretrio Nome de um diretrio que j exista no seu ambiente.

OBS: O SAS define uma biblioteca padro, temporria, de nome work.

Exemplo:
LIBNAME IN "C:\ALUNO" ;
DATA IN.EXEMPLO ;
INFILE "A:\CADASTRO" ;
INPUT NOME $ 1-30 SEXO $ 31 END $ 32-60 ;

PROC PRINT DATA=IN.EXEMPLO NOOBS ;
VAR NOME ENDERECO ;
RUN ;

DATA EXEMPLO1 ;
INFILE C:\TEMP\DADOS.DAT ;
INPUT NOME $ 1-8 SEXO $
IDADE $ 13-14 ALTURA 16-19 ;
RUN;

PROC PRINT DATA=EXEMPLO1 ;
RUN;

PROC FREQ DATA=EXEMPLO1 ; TABLES IDADE*ALTURA ; RUN ;
36
11 Alguns Comando Bsico de Programao do SAS

- Comando de Atribuio (=)
- Tipo: Comando de execuo;
- Uso: Data Step;
- Comando Caractere utilizado para criar novas variveis e editar as j existentes em um Data
Step.
<varivel> = <expresso> ;
varivel Nome com no mximo 32 caracteres.
expresso Expresses do tipo:
o - Operaes aritmticas simples: + - * / **
x2 = x ; Move valor;
soma = x+y ; Adio;
dif = x-y ; Subtrao;
dobro = x*2 ; Multiplicao;
met = x/2 ; Diviso;
cubo = x**3 ; Potenciao;
y = -x ; Mudana de sinal;

o - Constantes :
N=0 ; Constante numrica; SEXO="F" ; Constante caractere;

o - Concatenao de caracteres : ||
A=PAULO || ANTUNES; ==> A=PAULOANTUNES
A=PAULO || || ANTUNES; ==> A=PAULO ANTUNES

o - Expresses complexas com prioridade de avaliao:
( ) Funo ** * / + -
=================>
A = X+Y+Z ;
A = X+Y*Z ;
A = X/(Y/Z) ;
- Funes:
S = SQRT(X) ;
A = INT(X) ;
Z = ABS(SQRT(X)-2) ;
37
Exemplo Simulado no SAS:
LIBNAME ARQ "C:\SAS\TESTE" ;
DATA ARQ.LUCROS ;
INFILE C:\DADOS\NUMEROS.TXT;
INPUT ANO 1-2 RECEITA 4-7 DESPESAS 9-12;
VAL_DOL = 0.98 ;
ANO = ANO + 1900 ;
LUCRO = RECEITA - DESPESAS ;
DOLLAR = ( RECEITA - DESPESAS ) / VAL_DOL ;
RUN;

Arquivo: NUMEROS.TXT
01 02 03 04 05 06 07 08 09 10 11 12
9 4 5 6 5 0 1 0 5 0
9 5 6 2 8 0 1 1 4 0
9 6 8 4 5 0 2 4 5 0

PROC PRINT DATA=ARQ.LUCROS NOOBS DOUBLE ;
TITLE "Analise Contbil" ;
VAR ANO RECEITA DESPESAS LUCRO DOLLAR ;
SUM RECEITA DESPESAS LUCRO DOLLAR ;
RUN ;

Analise Contbil
ANO RECEITA DESPESAS LUCRO DOLLAR
1994 5650 1050 4600 4693.8775
1995 6280 1140 5140 5244.8979
1996 8450 2450 6000 6122.4489
===== ==== ===== =========
20380 4640 15740 16061.2240

11.1 - Comando IF-THEN/ELSE
- Tipo: Comando de Execuo;
- Uso: Data Step;
- Comando que condiciona a execuo de um outro comando SAS, de acordo com alguma
expresso, que determinar essa condio;
- Se a expresso, que determina a condio, for verdadeira, ser executado o comando que
vier aps o THEN. Se a condio for falsa, ser executado o comando que vier aps o ELSE.
Somente um comando aps o THEN e do ELSE
38
IF <expresso> [THEN] <comando> ;
[ELSE] <comando> ;
Expresso: Combinao de variveis com operadores de comparao e/ou operadores lgicos
que determinam uma condio.

Comando: Comando do SAS que ser executado de acordo com o resultado da condio.

Operadores de Comparao
GT > maior que
LT < menor que
EQ = igual a
LE <= menor ou igual a
GE >= maior ou igual a
NE ~= no igual (diferente)
NL no menor
NG no maior
IN est no conjunto

Operadores Lgicos
AND & e, ambos
OR | ou, , um ou outro
NOT ~ negao

Exemplo simulado no SAS.
LIBNAME TESTE "A:\" ;
DATA TESTE.CLASSE ;
INFILE C:\ESCOLA\CLASSE.TXT;
INPUT NOM E $ 1-7 SEXO $ 8 IDADE 10-11 @13 ALTURA 4.2 ;
IF (SEXO="1" AND ALTURA<1.55) OR (SEXO="1" AND IDADE<12)
THEN CLASSE="100" ;
ELSE IF (SEXO="2" AND ALTURA<1.55) OR (SEXO="2" AND IDADE<12)
THEN CLASSE="200" ;
ELSE CLASSE="300" ;
RUN;

Arquivo: CLASSE.TXT
01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16
P A U L A 1 1 1 1 . 6 0
F L A V I A 1 1 5 1 . 6 5
M A R C O S 2 1 1 1 . 6 0
L U I S 2 1 4 1 . 6 0

PROC PRINT NOOBS ;
VAR NOME CLASSE ;
RUN ;
39
The SAS System

NOME CLASSE

PAULA 100
FLAVIA 300
MARCOS 200
LUIS 300


11.2 - Comandos DO/END
- Tipo: Comando de execuo;
- Uso: Data Step
- Comando que define a execuo de um bloco de comandos do SAS;
- Todos os comandos existentes entre o comando DO e o comando END, devero ser execu-
tados imediatamente;
- Comandos DO e END podem ser usados para executar um grupo de comandos quando se
encontra uma condio, normalmente, para ampliar o comando IF-THEN/ELSE.
IF <expresso> THEN DO;
<comandos> ;

Exemplo simulado no SAS
DATA TRABALHO ;
INFILE "A:\EMPRESA.DAT" ;
INPUT NOME $ 1-8 DEP_NO $ 10-12 COM 14-17 SALARIO 19-23 ;
IF DEP_NO="201" THEN DO ;
DEP="VENDAS" ;
SAL=COM+SALARIO ;
END ;
ELSE DO ;
DEP="ADMINISTRATIVO" ;
SAL=SALARIO ;
END ;

PROC PRINT NOOBS ;
RUN ;

The SAS System
NOME DEP_NO COM SALARIO DEP SAL
CARLOS 201 1500 1500 VENDAS 3000
ELIANE 101 . 1800 ADMINI 1800
ALVARO 101 . 3800 ADMINI 3800
FATIMA 201 500 1500 VENDAS 2000

40
11.3 - Comando INPUT
- Tipo: Comando de execuo;
- Uso: Data Step;
- O comando INPUT serve para descrever ao SAS como esto armazenados e organizados os
dados em arquivos textos que foram especificados pelo comando INFILE.
- Todo arquivo aberto pelo comando INFILE, sempre necessitar de um comando INPUT
para ler o seu contedo;
- O comando INPUT ir ler registro a registro (leitura sequencial) at encontrar "fim de arqui-
vo (EOF)", e ir atribuir nomes (Variveis) para cada campo de um registro;
- Dois tipos bsicos de comando INPUT, so os mais utilizados:
- INPUT COLUNADO
- INPUT FORMATADO

11.4 - Input Colunado
- L as variveis especificando a sua posio na linha de dados (posio inicial e posio fi-
nal). As variveis devem estar alinhadas e colunadas no arquivo de leitura de dados.
INPUT <varivel> [$] <incio>-<fim> [.decimal] ;
varivel Nome da varivel, que ser associada a uma coluna de dados.
$ Caractere opcional que indica que a varivel s ir conter dados alfanumricos.
Sem o $, significa que a varivel ser numrica.
incio Valor que indica a posio inicial da varivel na linha de dados.
Fim Valor que indica a posio final da varivel na linha de dados.
.decimal Valor opcional, indica o nmero de posies decimais de uma varivel numrica.

11.5 - Input Formatado
- L as variveis especificando o tamanho e, opcionalmente, o formato do campo na linha de
dados.
- o tipo de INPUT mais poderoso e complexo do SAS.
INPUT <varivel> [$] <w.d> ou [fomatow.d] ;
varivel Nome da varivel, que ser associada a uma coluna de dados.
$ Caractere opcional que indica que a varivel s ir conter dados alfanumricos.
Sem o $, significa que a varivel ser numrica.
w. Valor que indica o tamanho de um campo na linha de dados.
w.d Valor que indica o tamanho de um campo numrico com casas decimais.
41
formatow.d Campo opcional. Nome de um formato especial de leitura de dados:
BINARYw.d L campo numrico no formato binrio e o converte para decimal;
COMMAw.d L campo numrico com vrgulas e as retira;
Ew.d L campo numrico com notao cientfica;
HEXw. L campo numrico em hexadecimal;
DDMMYYw. L campo no formato padro de datas dd/mm/yyyy.

11.6 - Controles Especiais do Comando INPUT
Indicador de COLUNA ( @ )
@n Move a leitura para a coluna n ;
Indicador de LINHA ( / ) / Avana a leitura em um registro;

Exemplo simulado no SAS
DATA POSICAO ;
INFILE "C:\SAS\POS.DAT" ;
INPUT A $ 1-5 @10 B $ 4. @17 C $ 4. / D $ 1-4 / E $ 4. @8 F $ 2. ;
RUN;
PROC PRINT ; RUN ;

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20
1 1 1 1 1 B B B B C C C C
D D D D
E E E E F F
2 2 2 2 2 b b b b c c c c
d d d d f f
e e e e

The SAS System
OBS A B C D E F
1 11111 BBBB CCCC DDDD EEEE FF
2 22222 bbbb cccc dddd eeee ff

11.7 - Detalhes do Comando INPUT
- Em campos numricos no so permitidos "brancos" entre os nmeros;
- Sinal (+ - ), ponto decimal (.) e notao cientfica para expoente (E) so permitidos em cam-
pos numricos;
- Campos tipo caractere podem ter, no mximo, 32K de caracteres;
42
- So permitidos caracteres "brancos", em qualquer posio, em campos do tipo caractere;
- Campos em branco (sem informao) so considerados como "missing value" (valor perdi-
do).
- Os campos de um registro de dados podem ser lidos em qualquer ordem.

INPUT PESO 17-20 NOME $ 1-8 IDADE 11-12 SEXO $ 9 ;

- Campos ou partes de um campo podem ser relidos.
INPUT NOME $ 1-8 PREFIXO $ 1-3 ENDERECO $ 10-40 APT $ 38-40 ;

- Dados caracteres sero armazenados, alinhados pela esquerda, e os dados numricos, alinha-
dos pela direita;
- Todos os tipos de INPUT, podem ser combinados num nico comando INPUT;


Ex: Detalhes de leitura
INPUT JAN 3. FEV 3. MAR 3. ABR 3. MAI 3. JUN 3. ;

INPUT (JAN FEV MAR ABR MAI JUN) (3.) ;

INPUT (MES1 MES2 MES3 MES4 MES5 MES6) (3.) ;

INPUT (MES1-MES6) (3.) ;











43
12 - Referncias

BUSSAB, W. O., MORETTIN, P. A. Estatstica Bsica. So Paulo: Saraiva. 5 edio, 2005.

MAGALHES, M. N., LIMA, A. C. P. Noes de Probabilidade e Estatstica, So Paulo:
Edusp, 5. edio, 2004

TACHIBANA, V. M. Notas de aulas de Computao Aplicada Estatstica. Presidente
Prudente, 2007.

Manuais do SAS.

Вам также может понравиться