Вы находитесь на странице: 1из 96

PLANEJAMENTO DE EXPERIMENTOS

1º. SEMESTRE/2014

2

O presente material foi elaborado com o objetivo de facilitar as atividades em sala de aula, seguindo muito de perto a bibliografia apresentada no final do texto. Esclarece-se que o material, não substitui a bibliografia apresentada, portanto, é necessário consultar os livros recomendados.

Profa. Sachiko Araki Lira

3

SUMÁRIO

1 INTRODUÇÃO

2 PLANEJAMENTOS EXPERIMENTAIS

2.1 Definições Importantes no Planejamento de Experimentos

2.2 Planejamento com um Único Fator

2.3 Diagnóstico do Modelo

3 EXPERIMENTOS FATORIAIS

3.1 Experimentos Fatoriais com 2 Fatores - sem Repetição

3.2 Experimentos Fatoriais com 2 Fatores - com Repetição

3.3 Comparações Múltiplas de Médias

3.3.1 Modelos de classificação a dois critérios (dois fatores) sem repetição

3.3.2 Modelos de classificação a dois critérios (dois fatores) com repetição

3.4

3.5

3.5.1 Experimento Fatorial

3.5.2 Experimento Fatorial

3.5.3

3.5.4

3.6 Experimentos Fatoriais Fracionados (Cada Fator com Dois Níveis)

3.6.1 Delineamento de um Experimento Fatorial Fracionário

4 EXPERIMENTO EM QUADRADO LATINO

5 MÉTODOS E PLANEJAMENTOS DE SUPERFÍCIE DE RESPOSTA

5.1 Método de Ascendente de Maior Inclinação (Steepest Ascent)

5.2 Análise de uma Superfície de Resposta de Segunda Ordem

5.2.1 Planejamento Composto Central (central composite design)

BIBLIOGRAFIA

TABELA A1 - DISTRIBUIÇÃO DE ‘t’ DE STUDENT

4

5

5

6

10

15

15

22

28

28

29

31

34

35

Determinação do Tamanho da Amostra

Experimento

2

k

Fatorial

2

2

2

3

Experimentos Fatoriais

 

40

sem Réplicas

43

2

k

E

48

51

51

68

74

75

79

79

82

84

85

86

87

88

89

90

91

Adição de Pontos Centrais a um Planejamento

TABELA A2 - DISTRIBUIÇÃO DE

2

TABELA A3 - DISTRIBUIÇÃO DE ‘F’ DE SNEDECOR (Nível de Significância de 1%)

TABELA A4 - DISTRIBUIÇÃO DE ‘F’ DE SNEDECOR (Nível de Significância de 5%)

TABELA A5 - DISTRIBUIÇÃO DE ‘F’ DE SNEDECOR (Nível de Significância de 10%)

TABELA A6 DISTRIBUIÇÃO DE F máx

TABELA A7 VALORES CRÍTICOS PARA TESTE DE COCHRAN (OUTLIERS DA VARIÂNCIA)

TABELA A8 - VALORES MÍNIMOS DE

PARA CERTOS VALORES MÁXIMOS DE

TABELA A9 - VALORES CRÍTICOS DA DISTRIBUIÇÃO DA ESTATÍSTICA

D

DE K-S, SEGUNDO

LILLIEFORS

TABELA A10 - COEFICIENTES

ani1

PARA O TESTE DE NORMALIDADE w

92

DE SHAPIRO-

WILK

TABELA A11 - VALORES CRÍTICOS DA ESTATÍSTICA

TABELA A12 VALORES CRÍTICOS PARA O TESTE DE COCHRAN

TABELA A13 - VALORES CRÍTICOS PARA

w DE SHAPIRO-WILK

q

(TESTE DE TUKEY)

93

94

95

96

4

1 INTRODUÇÃO

O planejamento de experimentos, chamado também de delineamento de experimentos,

compreende um conjunto de ensaios estabelecido com critérios científicos e estatísticos, e tem como objetivo determinar a influência de diversas variáveis nos resultados de um dado sistema ou processo.

A metodologia para elaboração de experimentos foi proposta por Ronald A. Fisher, em

seu livro Design of Experiments (1935). Ele descreveu como testar a hipótese da possibilidade

de uma certa senhora distinguir, só pelo sabor, se o leite ou o chá foi colocado primeiro na xícara. Esta aplicação lhe permitiu ilustrar as ideias mais importantes do desenho experimental. Nas diversas áreas que envolvem pesquisa, há interesse em saber quais variáveis são importantes no estudo que se está realizando, assim como a variabilidade das variáveis envolvidas. O planejamento experimental é atualmente amplamente utilizado para resolver esse tipo de problema. De acordo com o objetivo dos ensaios é possível:

a) determinar quais variáveis têm maior influência nos resultados;

b) atribuir valores às variáveis de maior influência de modo a otimizar os resultados;

c) atribuir valores às variáveis de maior influência de modo a minimizar a variabilidade dos

resultados;

d) atribuir valores às variáveis de maior influência de modo a minimizar a influência de variáveis

não controláveis.

O planejamento experimental é uma ferramenta essencial no desenvolvimento de novos

processos e no aprimoramento de processos em utilização. Um planejamento adequado possibilita, além do aprimoramento de processos, a redução da variabilidade de resultados, a redução de tempos de análise e dos custos envolvidos. No que se refere ao projeto de produtos, o planejamento experimental permite a avaliação e comparação de configurações (projetos) distintas, avaliação do uso de materiais diversos, a escolha de parâmetros de projeto adequados a uma ampla faixa de utilização do produto e a otimização de seu desempenho. Os métodos básicos usados para realizar um eficiente planejamento experimental têm como objetivos:

a) a seleção do melhor modelo entre uma série de modelos plausíveis;

b) a estimação eficiente de parâmetros do modelo selecionado.

Todo planejamento experimental começa com uma série inicial de experimentos, com o objetivo de definir as variáveis e os níveis importantes. Podem-se ter variáveis qualitativas (tipo de catalisador, tipo de equipamento, operador, etc.) e quantitativas (temperatura, pressão, ph do meio, etc.).

Antes de começar a realizar os experimentos, os objetivos e os critérios devem estar bem claros, de modo a dar subsídios para a escolha:

5

1)

das variáveis envolvidas nos experimentos;

2)

da faixa de variação das variáveis selecionadas;

3) dos níveis escolhidos para essas variáveis. No caso de muitos fatores, é melhor escolher inicialmente dois níveis;

4)

5) do planejamento experimental. Nessa etapa, há que se considerar o tamanho da amostra

(número de réplicas), a seleção de uma ordem de realização dos experimentos e se há vantagem em fazer a blocagem dos experimentos; dos métodos de análise dos resultados dos experimentos. Os métodos estatísticos são usados para guiar uma tomada objetiva de decisão. Análise do planejamento de experimentos foi construída sobre o fundamento da análise de variância, que é um conjunto de modelos em que a variação observada é dividida em componentes, devido a diversos fatores, que são estimados e / ou testados.

da variável de resposta;

2 PLANEJAMENTOS EXPERIMENTAIS

2.1 Definições Importantes no Planejamento de Experimentos

Experimento: É definido como um ensaio ou uma série de ensaios nos quais são feitas mudanças propositais nas variáveis de entrada de um processo ou sistema, de forma que se possa observar e identificar as razões para mudanças na resposta de saída (CALEGARE,

2009).

Fator (variável independente): Um fator é uma variável, podendo ser controlada ou não, que exerce influência sobre a resposta (variável dependente) que está sendo estudada no experimento. Um fator pode ser uma variável quantitativa, por exemplo, a temperatura em graus, o tempo em segundos, a pressão em pascal (Pa). Pode, também, ser variável qualitativa, como por exemplo, diferentes máquinas, diferentes operadores, interruptor ligado ou desligado.

Nível: Os níveis de um fator são os valores assumidos pelo fator. Para os fatores quantitativos,

cada valor constituiu um nível, isto é, se o experimento é conduzido em três temperaturas

diferentes, então o fator “temperatura” possuiu três “níveis”. Já, no caso dos fatores

qualitativos, “o interruptor ligado ou desligado” representa dois níveis para o fator interruptor;

caso estejam sendo utilizadas seis máquinas por três operadores, então o fator “máquina” tem

seis níveis, enquanto o fator “operador” tem três níveis.

Tratamento: Tratamento é um nível atribuído a um único fator durante um experimento, como

por exemplo, a temperatura a 800 graus.

6

Uma “combinação de tratamento” é o conjunto de níveis para todos os fatores num dado

experimento. Por exemplo, um experimento utilizando temperatura de 800 graus, máquina 3,

operador A, e interruptor desligado constituir-se-ia numa combinação de tratamento.

Unidades Experimentais: As “unidades experimentais” são os objetos, materiais ou unidades

aos quais se aplicam os tratamentos. Podem ser materiais naturais, objetos, pessoas, etc.

Bloco: Um fator no experimento que exerce influência como fonte de variabilidade é chamado “bloco”. Um Bloco é uma porção do material experimental ou do meio experimental que apresenta uma probabilidade maior de homogeneidade em si mesma do que entre porções diferentes. Por exemplo, amostras de um único lote de material têm mais probabilidade de serem uniformes do que amostras de lotes diferentes. Um grupo de amostras de um único lote

é considerado um bloco. As observações feitas num mesmo dia têm mais probabilidade de

homogeneidade (variação menor) do que observações feitas por dias a fio. “Dias” torna-se, então, um fator de blocagem.

Delineamento de Experimento: O plano formal para a condução do experimento é chamado “delineamento de experimento” ou “modelo experimental”. Ele inclui a escolha de respostas, fatores, níveis, blocos e tratamentos.

Aleatorização: A sequência de experimentos e/ou a atribuição de amostras a diferentes

combinações de tratamento de maneira puramente casual é denominada “Aleatorização”. Tal

atribuição aumenta a probabilidade de que o feito de variáveis incontroláveis seja eliminado.

Também aprimora a validade das estimativas da variância dos erros experimentais e torna

possível a aplicação de testes estatísticos de significância, além de construção de intervalos de

confiança. Sempre que possível, a aleatorização deve fazer parte do experimento.

Replicação : A “replicação” é a repetição de uma observação ou medição de modo a aumentar

a precisão ou fornecer os meios para medir a precisão. Uma replicação única consiste de uma

única observação ou realização do experimento. Proporciona uma oportunidade para que se eliminem os efeitos de fatores incontroláveis ou de

fatores desconhecidos pelo experimentador e assim, a aleatorização, atua como ferramenta diminuidora de tendências. A replicação também ajuda a detectar erros graves nas medições. Nas replicações de grupos de experimentos, diferentes aleatorizações devem ser aplicadas a cada grupo.

2.2 Planejamento com um Único Fator

Experimentos com um único fator são aqueles com apenas uma única variável de interesse para o estudo. Os testes de hipóteses para comparação de duas médias (ou dois

7

tratamentos), são casos particulares desse tipo de situação. No entanto, estes procedimentos

somente podem ser utilizados em situações onde o número de tratamentos em estudos é no

máximo igual a dois. Usualmente, os estudos experimentais têm por objetivo comparar três ou

mais tratamentos, ou ainda, nessa situação, estudar um fator de interesse que apresenta três

ou mais possíveis valores (tratamentos). Por exemplo, há interesse em estudar o rendimento

de uma dada reação química considerando três diferentes tipos de catalisadores. Nesse caso

existe um único fator.

Modelo Estatístico

A análise estatística para verificar o problema em estudo (igualdade ou não dos

tratamentos) passa pelo ajuste de um modelo linear estatístico definido da seguinte forma:

x

i

j

i

i

j

onde:

x

i

j

é a variável aleatória denotando o i-ésimo tratamento e j-ésima unidade experimental;

é o efeito comum a todos os tratamentos, chamado de média global;

i

é o efeito específico do i-ésimo tratamento;

i

j é o erro aleatório (parte da resposta não representada pelo modelo).

A suposição do modelo

é

de

que

os erros

ij

sejam normal, independentes e

identicamente distribuídos, ou seja,

i

j

são iid

N(0,

2

)

. Assim, cada tratamento pode ser

pensado como sendo uma população normal com média zero e variância

2

.

Notação utilizada:

N

número total de elementos observados;

i número de tratamentos: 1,2,

,a

j

número de observações de cada tratamento: 1,2,

ni

número de elementos no tratamento i;

X

i

X

 

n

j

1

x

i j

n

a

n



i

1

j

1

x

i

j

N

onde: N na

é a média dos tratamentos (i=1,2,

é a média total

,a)

,

n

8

TRATA-

MENTOS

OBSERVAÇÕES ( xi j )

SOMAS

MÉDIAS

1 x11

x12

x1n

x

1

X1

2 x21

x22

x

2n

x

2

X2

a xa1

xa2

xan

x

a

Xa

 

x

 

X

Cálculo das Variâncias

A ANOVA é um teste de médias, utilizando as variâncias e ela analisa as variações

dentro da amostra (variações aleatórias) e as variações entre amostras (variações explicadas).

Variância Total

A variância total

2 é estimada considerando-se todas as amostras reunidas em uma

única amostra. Isso será possível devido à hipótese inicial (suposição do

variâncias populacionais são todas iguais a

modelo) de que as

2 . A variância será estimada através de:

S

2

T

X



2

a

n



i

1

j

1

x

i j

N

1

A

expressão acima é denominada de Quadrado Médio Total (QMT) e o numerador, de

Soma de Quadrados Total (SQT), dado por:

SQT

a

n



i

1

j

1

( x

i j

X



)

2

a

n



i

1

j

1

x

2

i j

x

2



N

Essa estimativa terá sentido somente se a hipótese

H0

for verdadeira, o que implica em

se ter todas as populações normalmente distribuídas de mesma média e mesma variância.

Variância entre Amostras (Tratamentos)

Sendo verdadeira a hipótese

H0

, pode-se estimar a variância

2 , através das médias

de “a” amostras, ou seja, como se fosse uma amostra de “a” valores.

a

S

2

E

i

1

i

n (X

i

X



)

2

a

1

A expressão acima é denominada de Quadrado Médio entre Amostras (QME) e o

numerador, de Soma de Quadrados entre Amostras (SQE). Então:

SQE

a

i

1

n (X

i

i

X



)

2

a

i

1

x

2

i

n

i

x

2



N

9

Desta forma é possível comparar as duas estimativas da variância através de um teste

o valor do

quociente entre elas será próximo de 1. Por outro lado, se o valor de F for elevado, pode-se

F,

pois se

H0

for verdadeira, ambas serão estimativas não viesadas de

2

e

concluir que a

2

SE

superestima

2

e pode-se rejeitar H0 em favor de

H1

.

Variância Residual ( ou Variância Dentro da Amostra)

Consiste em estimar as variâncias dentro de cada amostra e em seguida estimar um

único valor

2 , através da combinação dessas k variâncias. A estimativa é obtida através de:

S 2

R



i

1

j

1

x

i j

X

i

2

a

n

a(n

1)

A expressão acima é denominada de Quadrado Médio Residual (QMR) e o numerador, de Soma de Quadrados Residuais (SQR).

SQR

a

n



i

1

j

1

( x

i j

X

i

)

2

Tem-se que:

SQR SQTSQE

QUADRO DA ANÁLISE DE VARIÂNCIA - ANOVA

FONTE DE

       

VARIAÇÃO

SOMA DE QUADRADOS

G.L

QUADRADOS MÉDIOS

 

F

Entre amostras

a

 

x

2

 

x

2

SQE

 
 

SQE

i



a 1

QME

(Tratamentos)

n i N

a

1

 

i

1

 

Dentro da amostra (residual)

SQRSQT SQE

 

a(n 1)

QMR

SQR

 

F

QME

 

2

a(n

1)

QMR

 

SQT

a

n



x

2

 

x



an 1

 

Total

i

j

N

 
 

i

1

j

1

 

Se

Fcalc Ftab

, para um nível de significância

com 1 (a 1);2 a(n 1) graus de liberdade.

, rejeita-se

H0

. O valor de

Ftab

é dado

No experimento com amostras de tamanhos diferentes (desbalanceado), pode-se

número de

utilizar o método apresentado fazendo uma adaptação para o índice j (

observações ). Este índice variará de 1 a

j

n

i

, sendo

n

i o tamanho da i-ésima amostra.

10

2.3 Diagnóstico do Modelo

Deve-se verificar se as suposições estabelecidas para obtenção do ajuste e teste dos

parâmetros, são satisfeitas.

A suposição do modelo é de que os erros

ij

são iid

N(0,

2

)

ij

sejam normal, independentes e

. Assim, cada tratamento pode ser

identicamente distribuídos, ou seja,

pensado como sendo uma população normal com média zero e variância

2

.

Para atender a suposição acima, faz-se necessário verificar as seguintes questões:

Presença de valores extremos (outliers)

Independência (aleatoriedade)

Normalidade

Homocedasticidade (variância constante)

a) Identificação de Valores Extremos (outliers)

A identificação de valores extremos (discrepantes) faz parte da análise descritiva e

exploratória dos dados. No caso de planejamento de experimentos, alguns procedimentos

específicos podem ser destacados, na busca da verificação da existência de valores extremos.

Procedimentos usuais que auxiliam na análise descritiva e exploratória destes dados é

o Box Plot. É possível utilizar esses procedimentos a partir de:

(i) dados originais: para se verificar a presença de valores extremos (ou dados discrepantes)

pode-se utilizar o Box Plot. Deve-se verificar, neste caso, valores que se destacam dos

demais na apresentação dos valores observados.

(ii) resíduos: uma alternativa para identificação de valores extremos é a utilização dos

resíduos do modelo estimado, ou seja:

ˆ

i j

e y ˆ

i j

i j

yi j

Nota: Diversos autores propõem o uso dos chamados resíduos padronizados no lugar dos

resíduos ordinários acima definidos. Os resíduos padronizados são definidos por:

 ˆ  ˆ i j  i j Var(  ˆ ) QMR i
 ˆ
 ˆ
i
j
i
j
Var(
 ˆ
)
QMR
i
j

Como procedimento alternativo, considerando que os erros têm distribuição

3

N(0,

2

)

,

contêm aproximadamente 68% dos dados, a média

contém aproximadamente

pode-se esperar que a média

2contêm aproximadamente 95% dos dados e a média

99% dos dados. Desta forma, podem ser considerados valores extremos aqueles que forem

11

Identificado um valor extremo, normalmente ele é excluído da análise. No entanto, na pratica, é o pesquisador quem deve definir se um valor extremo pode realmente ser assim considerado. Pois os valores extremos podem fornecer informações importantes sobre o experimento e estatisticamente demonstrar que uma outra distribuição deve melhor representar o comportamento dos dados.

b) Verificando a Independência ( erros não correlacionados):

A independência dos resíduos, é usualmente avaliada através de um gráfico dos valores preditos (ou ajustados) versus resíduos. Na hipótese de ser satisfeita a suposição de

independência não deverá existir nenhum padrão neste gráfico, ou seja, nenhum comportamento não aleatório dos valores observados.

nenhum comportamento não aleatório dos valores observados. FIGURA 1 – INDEPENDÊNCIA FIGURA 2 – NÃO

FIGURA 1 INDEPENDÊNCIA

dos valores observados. FIGURA 1 – INDEPENDÊNCIA FIGURA 2 – NÃO INDEPENDÊNCIA Existindo o registro da

FIGURA 2 NÃO INDEPENDÊNCIA

Existindo o registro da ordem de obtenção dos valores, recomenda-se o uso do gráfico dos resíduos versus a ordem de coleta de forma a verificar algum padrão na resposta

e, consequentemente uma dependência entre as observações.

12

c) Verificando a Normalidade

A suposição de normalidade dos resíduos pode ser verificada graficamente ou através

de testes. Graficamente, é usual a utilização do gráfico normal probabilístico e os testes mais utilizados são: Teste de Shapiro-Wilk e Kolmogorov-Smirnov com correção de Lilliefors.

Teste de Shapiro-Wilk

O método de Shapiro-Wilk fornece o valor da estatística W, variando de 0 a 1. A estatística do teste é dada por:

W

b

2

n

i 1

(x

i

X)

2

, onde

b

(n

n / 2

i 1

1) / 2

i 1

a 

n

i

1

(x



(n

i

a (x

n



i

1

(n



i

1)

1)

x

x

(i)

(i)

)

)

se n par

se n ímpar

em que

tabelados.

x1 x2

xn

são dados ordenados, em ordem crescente, e os

ais

são constantes

Ho

Este teste é utilizado quando o conjunto de observações é pequeno

A

(n 50)

.

Wtab

estatística

W

é comparada ao valor obtido em tabelas, caso

W

, o teste rejeita

, indicando a não normalidade das observações.

d) Verificando a Homocedasticidade:

A suposição de homocedasticidade significa que a variabilidade entre repetições de um

mesmo tratamento deve ser semelhante a dos demais tratamentos. A verificação desta suposição pode ser feita através do uso de testes ou por meio de análise gráfica.

(i) Testes de Homocedasticidade (homogeneidade das variâncias):

1º. Passo: Hipóteses

2

Ho : 1

2

2

2

k

(as variâncias entre as populações são homogêneas)

H1 :

i, i

t.q.

2

i

2

i

(as variâncias entre as populações são heterogêneas)

2º. Passo: Escolha do nível de significância

3º. Passo: Estatística apropriada 4º. Passo: Definição da região crítica 5º. Passo: Conclusão

Diferentes testes são propostos na literatura para testar a hipótese acima. Os testes mais conhecidos são:

a) Teste de Bartlett: Pode ser utilizado para qualquer número de repetições nos tratamentos; b) Teste de Cochran: Pode ser utilizado para qualquer número de repetições nos tratamentos.

13

Teste de Bartlett

O teste de Bartlett dever ser aplicado quando as populações cujas homogeneidades

serão testadas, apresentarem distribuição normal.

A estatística para testar a hipótese

H0 : 1

2

2

2

variâncias é diferente das demais, é dada por:



(n

k

i

S

2

i

2

2

em que:

n

A

c

n

k)log

i 1

k

i 1

 

 

k

n

i

i 1

i ni 1

C

1

 

1

1

k

1

 

 

3(k

1)

 

i 1

i

n

k



2

Si

ni

i

2,3026

k

log S

i

é a variância da amostra i, i=1,2,

,k

é o tamanho da amostra i, i=1,2,

,k

2

estatística

calculada pela expressão acima tem

se

2

k1

2

k

 

1;

, rejeita-se

H0

.

2

k

contra

H1 :

pelo menos uma das

k 1

graus de liberdade. Portanto,

Duas precauções na utilização do teste de Bartlett:

1) O teste de Bartlett é fortemente sensível à Normalidade das observações subjacentes.

2) A distribuição

deve ser usado caso

2 é apenas assintótica. Uma regra comum é considerar que o teste apenas

ni 5

,

i 1,2,

,k

.

Teste de Cochran

É um teste muito simples e de fácil execução, que consiste em calcular todas as

variâncias envolvidas no experimento e dividir a maior delas pela soma de todas. O valor resultante da divisão é então comparado com os valores críticos de uma tabela estatística apropriada, que leva em conta o número de variâncias envolvidas (k) e o número de graus de

liberdade utilizado nos cálculos. O tamanho da amostra

ni

deve ser igual para todos os grupos.

Estatística do teste para testar as hipóteses

Ho : 1

2

2

2

2

k

contra

H1 :

i, i

t.q.

2

i

2

i

é dada por:

C

S

2

max

k

i 1

S

2

i

Rejeita-se a hipótese

H0

se

C Ck,n,

.

14

(ii) Análise Gráfica para Verificação da Homocedasticidade:

a) Box Plot dos Tratamentos versus Resíduos:

Se existe homocedasticidade, espera-se que os Box Plots sejam semelhantes, ou seja, apresentem um variabilidade muito próxima nas “caixas” dos diferentes tratamentos. Se existe heterocedasticidade, a variabilidade é diferente entre as caixas. Às vezes, a heterocedasticidade pode ser também um indicio da falta de normalidade. Problema: Pequenas Amostras.

da falta de normalidade. Problema: Pequenas Amostras. FIGURA 3 – BOX PLOT DOS RESÍDUOS b) Gráfico

FIGURA 3 BOX PLOT DOS RESÍDUOS

b) Gráfico de Dispersão dos Valores Estimados versus Resíduos:

O gráfico dos valores estimados versus resíduos é, no caso de experimentos com

um fator (ONEWAY), semelhante ao gráfico de tratamento versus resíduos. Este não será

o caso quando dois ou mais fatores estiverem envolvidos na análise.

Se existe homocedasticidade, espera-se que os desvios se distribuam de forma homogênea

dentre de um mesmo intervalo. Se os desvios apresentarem variação com diferentes

amplitudes, tem-se a situação de heterocedasticidade.

amplitudes, tem-se a situação de heterocedasticidade. FIGURA 4 – VARIÂNCIA CONSTANTE FIGURA 5A –
amplitudes, tem-se a situação de heterocedasticidade. FIGURA 4 – VARIÂNCIA CONSTANTE FIGURA 5A –

FIGURA 4 VARIÂNCIA CONSTANTE

tem-se a situação de heterocedasticidade. FIGURA 4 – VARIÂNCIA CONSTANTE FIGURA 5A – VARIÂNCIA NÃO CONSTANTE
tem-se a situação de heterocedasticidade. FIGURA 4 – VARIÂNCIA CONSTANTE FIGURA 5A – VARIÂNCIA NÃO CONSTANTE

FIGURA 5A VARIÂNCIA NÃO CONSTANTE

15

15 FIGURA 5B – VARIÂNCIA NÃO CONSTANTE Violações aos pressupostos do comentários gerais: modelo não têm
15 FIGURA 5B – VARIÂNCIA NÃO CONSTANTE Violações aos pressupostos do comentários gerais: modelo não têm

FIGURA 5B VARIÂNCIA NÃO CONSTANTE

Violações aos pressupostos do comentários gerais:

modelo não têm sempre igual gravidade.

Alguns

1)

O teste F da ANOVA é relativamente robusto a desvios à hipótese de normalidade;

2)

As violações ao pressuposto de variâncias homogêneas são em geral pouco graves no caso

de delineamentos equilibrados, mas podem ser mais graves em delineamentos não

equilibrados;

3) A falta de independência entre erros aleatórios é a violação mais grave dos pressupostos e

deve ser evitada, o que é em geral possível com um delineamento experimental adequado.

3 EXPERIMENTOS FATORIAIS

Existem situações experimentais onde as unidades experimentais são heterogêneas, devido à presença de uma (ou mais) fonte(s) de variação(ções) conhecida(s) e que pode(m) ser controlada(s) quando da realização do experimento. O experimento fatorial é utilizado quando dois ou mais fatores estão sendo estudados em dois ou mais níveis e a interação entre os fatores pode ser importante. De acordo com o número de fontes de variabilidade conhecidas que tornam as unidades homogêneas, tem-se diferentes tipos de planejamento:

a) experimentos fatoriais com 2 fatores;

b) experimentos fatoriais com 3 fatores;

c) experimentos

2

k

fatorial.

3.1 Experimentos Fatoriais com 2 Fatores - sem Repetição

tratamentos. Deve-se realizar ensaios com todas as combinações dos tratamentos de A e B,

totalizando

Seja o experimento com um fator A com “

(ab)

ensaios.

a ” tratamentos e um fator B

com “

b

16

FATOR A

 

FATOR B (colunas)

 

(linhas)

C1

C2

 

Cb

L1

x11

x12

x1b

L2

x21

x22

x

2b

La

xa1

xa2

xab

Modelo Estatístico

yi

ji

j i j

,

i 1,2,

,a

;

j 1, 2,

,b

onde:

é o efeito comum que independe dos fatores;

i

j

é o efeito do fator A (linha);

é o efeito do fator B (coluna);

i

j

é o erro aleatório que apresenta média nula e variância

Notação utilizada:

i número de linhas:

1,2,

, a

;

j

número de colunas:

1, 2,

,b

;

N ab

número total de elementos observados.

2

.

As médias entre linhas (fator A), entre colunas (fator B) e total, são dadas por:

X

i

b

j

1

X

i

j

b

X

j

a

i

1

x

i

j

a

a b



x

i

j

X

i

1

j

1

N

média entre linhas

média entre colunas

média total

As hipóteses a serem testadas são:

1)

H01 : 1. 2.

a.

(linhas)

H02 : .1 .2

.b

(colunas)

2)

H11:

pelo menos uma das médias i. é diferente das demais

H12 :pelo menos uma das médias

.j

é diferente das demais

17

Estudo das variações

Variação total

SQT

a b



1

j

 

i

1

x

i j

X

2

a b



1

j

 

i

1

x

2

i j

a

b



j

i

1

 

1

x i

j

2

N

SQT tem distribuição

2 com (N-1) graus de liberdade.

Variação devido ao 1º. Fator (entre linhas)

SQL

b

a



j

i

1

 

1

X

i

X

2

SQL tem distribuição

a

i

1

b

2

b

a



x

i j

x

2

j

1

j

i

1

 

1

i j

b

N

 

2 com (n-1) graus de liberdade.

Variação devido ao 2º. Fator (entre colunas)

SQC

a b



i

1 j

 

1

X

j

X

2

SQC tem distribuição

b

1

j

a

i

1

x

i j

2

b

a

2



j

i

1

 

1

x

i j

a

N

2 com (k-1) graus de liberdade.

Variação residual ou aleatória

a b

SQR 

i

1

j

1

x

i j

X

i

 

X

j

2

X

SQT

SQL

SQC

SQR

tem distribuição

2 com (a-1)x(b-1) graus de liberdade.

Tem-se que:

SQT SQLSQCSQR

É possível demonstrar que cada uma das variações dividida pelos seus respectivos

graus de liberdade é uma estimativa não viesada de

diferenças significativas nas médias das linhas ou nas médias das colunas (

2 , quando se supõe que não hajam

H0

verdadeira).

 

b

a

X

 

2



i

X

S

2

j

1

i

1

 

L

a

1

 

a

b

X

 

2

 



j

X

S

2

i

1

j

1

C

b

1

 

2

S

2

a

b



i

1

j

1

x

i j

X

i

 

X

j

X

R

(a

1)(b

1)

 

18

O quadro da ANOVA para um experimento fatorial com 2 fatores - sem repetição

FONTE DE VARIAÇÃO (FV)

SOMA DE

GRAUS DE

   

QUADRADOS

LIBERDADE

QUADRADO MÉDIO (QM)

ESTATÍSTICA F

(SQ)

(G.L.)

 

S

S

2

Entre linhas

SQL

a-1

S

2

L

SQL

F

a

1

L

L

2

 

R

S

S

2

Entre colunas

SQC

b-1

S 2

C

SQC

F

b

1

C

C

2

 

R

 

S

2

SQR

Residual

SQR

(a-1) (b-1)

R

(a

1)(b

1)

Total

SQT

ab-1=N-1

Se

FL F(a1);(a1)(b1) ;

, rejeita-se

FC F(b1);(a1)(b1) ;

, rejeita-se

H0

Exemplos de aplicação:

H0

e conclui-se que há diferença de média entre linhas. Se

e conclui-se que há diferença de média entre colunas.

1) Um engenheiro resolveu testar a influência do fator umidade, no tempo para início de oxidação de certo metal ferroso. Para isso, delineou um experimento com 4 níveis de umidade relativa e temperatura em 3 níveis. Os resultados, em horas, são apresentados a seguir.

TEMPE-

 

UMIDADE RELATIVA (%)

 

RATURA

90

80

70

60

85 o C

32

34

40

36

75 o C

35

36

40

42

65 o C

37

39

43

45

Testar a influência dos dois fatores, com nível de significância de 5%. Solução:

1)

H01 : 1. 2.

a.

(linhas)

H02 : .1 .2

.b

(colunas)

2)

H11:

pelo menos uma das médias i. é diferente das demais

H12 :pelo menos uma das médias

.j

é diferente das demais

TEMPE-

   

UMIDADE RELATIVA (%)

 

SOMA DE

RATURA

90

80

70

60

x i

85 oC

32

34

40

36

142

75 oC

35

36

40

42

153

65 oC

37

39

43

45

164

SOMA DE

x

j

104

109

123

123

459

19

VALORES AO QUADRADO

TEMPE-

   

UMIDADE RELATIVA (%)

 

SOMA DE

RATURA

90

80

70

60

x

2

i

85

oC

1.024

1.156

1.600

1.296

5.076

75

oC

1.225

1.296

1.600

1.764

5.885

65

oC

1.369

1.521

1.849

2.025

6.764

   

2

SOMA DE

x

j

3.618

3.973

5.049

5.085

17.725

SQT

SQL

SQC

b

a

2

   

j

b

a

i

1

 

1

x

i j

2

17.725

459

2

 
 

 



j

i

1

 

1

x

i j

N

12

168,25

 
 

2

b

a



j

  1

i

1

 

2

 

a

b

1

j

x

i j

x

i j

2

153

2

164

2

459

2

60,50

i

1

b

  N

b

a

1

i

x

i

j

2

1

b

a



j

i

1

 

x

i

j

2

142

4

4

104

2

109

2

4

123

2

12

123

2

459

2

j

1


a


N

3

3

3

3

12

94,92

SQR SQT SQL SQC 168,25 60,50 94,92 12,83

Quadro da ANOVA a dois critérios de classificação - sem repetição

 

SOMA DE

GRAUS DE

   

FONTE DE

VARIAÇÃO (FV)

QUADRADOS

(SQ)

LIBERDADE

(G.L.)

QUADRADO

MÉDIO (QM)

ESTATÍSTICA F

Entre linhas

60,50

2

S

2

60,50

FL 14,143

L

2

Entre colunas

94,92

3

S

C 2

94,92

FC 14,792

 

3

Residual

12,83

6

S

2

12,83

R

6

Total

168,25

11

Conclusões:

Como

F L F0,05 ;2;6

5,14

, rejeita-se

H0

, portanto, existe diferença significativa entre os

tempos médios segundo as temperaturas (linhas);

Como

FC F0,05;3;6 4,76

, rejeita-se

H0

, portanto, existe diferença significativa entre os

tempos médios segundo as umidades relativas (colunas).

2) Um engenheiro de qualidade delineou um experimento para verificar se existe influência dos

fatores temperatura e pressão na quantidade percentual de impurezas resultantes na

20

fabricação de um produto químico. Os resultados são apresentados na tabela abaixo. Verificar

se existem diferenças nos diversos tratamentos, usando nível de significância de 1%.

     

PRESSÂO

   

TEMPERATURA

 

30

 

35

40

 

45

 

50

 

55

100

o F

 

3,0

 

4,3

3,8

 

4,6

3,5

 

2,8

125

o F

 

2,9

 

4,1

3,6

 

4,4

3,6

 

2,2

Solução:

H01 : 1. 2.

 

(linhas)

 

H02 : .1 .2

.6

 

(colunas)

 

H11:

pelo menos uma das médias

i.

é diferente das demais

 

H12 :pelo menos uma das médias

.j

é diferente das demais

Nível de significância:

0,01

 

Cálculo das Somas de Quadrados e Quadrados Médios

 
     

PRESSÃO (

x

i j

)

SOMA

TEMPERATURA

   

30

   

35

 

40

45

 

50

55

DE

x

i

 

100

o

F

 

3,0

4,3

3,8

4,6

 

3,5

2,8

22,0

 

125

o

F

2,9

4,1

3,6

4,4

3,6

2,2

20,8

SOMA DE

j

x 5,90

 

8,40

7,40

9,00

7,10

5,00

42,8

   

2

SOMA

 

x

i j

TEMPERATURA

   

DE

x

2

 

30

   

35

 

40

45

 

50

55

i

 

100

o

F

 

9,0

18,5

14,4

21,2

 

12,3

7,8

83,2

 

125

o

F

8,4

16,8

13,0

19,4

13,0

4,8

75,3

SOMA DE

 

2

   
 

x

j

 

17,4

35,3

27,4

40,5

 

25,2