Вы находитесь на странице: 1из 9

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof.

Djolse Dantas

Aula 01: Introduo estatstica aplicada a laboratrio e construo de grficos


1.

Objetivos

Aprender a:
o Sumarizar a coleo de observaes;
o Descrever o conhecimento de um dado assunto de forma matemtica;
o Evitar manipulao de resultados;
o Dar polimento a publicaes;
o Analisar a coleo de dados;
o Determinar correlaes;
o Saber o grau de certeza das concluses tiradas;
o Criar grficos.

2. A Estatstica
A estatstica um ramo da matemtica aplicada. Seu objetivo fornecer mtodos para
coleta, organizao, resumo, apresentao e anlise dos dados, visando obteno de concluses
vlidas e, finalmente, tomada de decises.
Dessa forma, a estatstica serve de instrumento de apoio a todos os campos de
conhecimento em que dados experimentais so manipulados. Dentre tantos, podemos citar:
Fsica, Qumica, Medicina, Engenharia , Cincias Sociais, Administrao de empresas, etc.
3.

Populao e Amostra
a. Populao:
Qualquer conjunto de informao que tenha entre si uma caracterstica comum que
delimite os elementos pertencentes a ela;
Fornece as estatsticas exatas de uma anlise;
As propriedades de da populao so designadas por smbolos de letras gregas.
Ex: - desvio padro da populao; - mdia da populao de dados.
b. Amostra:
um subconjunto de elementos pertencentes a uma populao;
Fornece uma estimativa das estatsticas;
As propriedades das amostras so designadas por letras latinas.
Ex: s desvio padro de uma amostra; mdia de uma amostra de dados.

Observao: Amostra no sentido estatstico do termo, significa um grupo de objetos selecionados


de uma populao, no uma poro (alquota) do material que est sendo analisado, ou estudado.
4.

Estatstica Descritiva e Indutiva


a. Estatstica Descritiva: Mtodos estatsticos que buscam somente descrever e analisar
dados, independentemente de fazerem parte de uma amostra ou de uma populao.
Anlise descritiva com resumo e interpretao dos dados coletados (grficos, distribuio
de frequncia, medidas de posio, medidas de disperso, etc.)
b. Estatstica Indutiva (Inferncia Estatstica): Se uma amostra representativa de uma
populao, concluses importantes podem ser inferidas de sua anlise. A parte da
estatstica que trata das condies sob as quais essas inferncias so vlidas chama-se
estatstica indutiva ou inferncia estatstica. Utiliza mtodos explicativos para o
comportamento do objeto em estudo que levam a anlise confirmatria dos dados.
(testes estatsticos)
1

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

5. Tipos de Variveis
a. Qualitativas: so variveis qualitativas quando representam qualidades de uma
populao: cor dos olhos, espcies encontradas em uma populao de microrganismos,
etc. So representadas apenas por qualitativos: Ex: olhos: azul, castanho, verde, ;
espcies: gato, cachorro, coelho, ...
b. Quantitativas: quando representam quantidades de uma populao: nmero de
habitantes, vazo, DBO, concentrao de slidos, etc. (normalmente so variveis que
podem ser expressas por nmeros)
6. Erros em anlises qumicas
Erros e incertezas: alguns so provenientes a equvocos cometidos pelo analista (padronizao).
a. Tipos de erros:
a) Erros aleatrios ou indeterminados: afetam a preciso da medida. No podem ser
totalmente eliminados. No podem ser claramente identificados
b) Erros sistemticos ou determinados: afetam a exatido do resultado. Podem ser tanto:
constantes (erro absoluto constante e o erro relativo varia) como proporcionais (erro
absoluto varia e o erro relativo constante)
c) Erros instrumentais: calibraes (equipamentos volumtricos), condies inadequadas.
d) Erros de mtodo: proveniente do comportamento qumico ou fsico no ideal, como
decomposio da amostra ou reagente, tempo de reao (amostras padres
certificadas, preparao de brancos).
e) Erros pessoais: falta de cuidado, ateno ou limitao do analista (amostras padres
certificadas, triplicatas).
7. Preciso e Exatido
a. Preciso: descreve a reprodutibilidade das medidas (concordncia), ou seja,
proximidade dos resultados obtidos. Pode ser avaliada atravs do desvio padro,
varincia e do coeficiente de variao.
b. Exatido: proximidade da medida com o valor verdadeiro. Pode ser expressa em
termos de erro absoluto ou erro relativo.
8. Erro absoluto (E) e erro relativo (Er):

9. Medidas de posio:
9.1 Medidas de tendncia central
As medidas de tendncia central so assim chamadas por indicarem um ponto em torno do qual
se concentram os dados. Este ponto tende a ser o centro da distribuio dos dados, ou o centro
de gravidade dos dados.
a. Mdia aritmtica ( ): Quando lidamos com um conjunto de dados, podemos calcular
diversos tipos de mdias. Em nosso estudo ser focada a media aritmtica. Alm dessas
importante estudar posteriormente a mdia geomtrica, a mdia harmnica e a mdia
ponderada.
2

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

A mdia aritmtica a soma dos valores observados da varivel dividida pelo nmero total
de observaes.

A mdia aritmtica a medida de tendncia central mais utilizada para representar a


massa de dados.
Propriedades e observaes sobre a mdia:
1. Depende de todos os dados coletados, sendo afetada por valores extremos;
2. nica em um conjunto de dados e nem sempre tem existncia real, ou seja, nem
sempre igual a um determinado valor observado.
3. Por depender de todos os valores observados, qualquer modificao nos dados far
com que a mdia fique alterada.
4. A soma dos desvios em relao a mdia zero.
(

) = 0

O desvio de extrema importncia para a definio de varincia, uma medida de disperso


a ser definida posteriormente. Desvio em relao a mdia a diferena entre cada
elemento de um conjunto de dados e a mdia aritmtica.
= ( )
Obs: se precisamos calcular a mdia de um conjunto de dados divididos em classes,
convencionamos que todos os valores includos no intervalo coincidem com o ponto mdio
deste intervalo, e utilizamos a seguinte equao:

b. Moda (Mo): Moda simplesmente o valor que mais se repete em uma sequncia de
dados.
Ex: Na srie: 1, 3, 4, 4, 4, 6, 8, 32.
Como o valor que aparece com maior frequncia o 4, ele o valor modal, ou
simplesmente a moda.
O uso da moda indicado quando se deseja obter, rapidamente, uma medida de tendncia
central. Um outro aspecto que favorece a utilizao da moda que seu valor no afetado
pelos valores extremos do conjunto de dados analisado.
c. Mediana (Md)
A mediana o valor que ocupa a posio central da srie de posies, o resultado central
quando as rplicas de dados so organizadas de acordo com uma seqncia crescente ou
decrescente de valores. Existe um nmero igual de valores que so maiores e menores que
a mediana. Para um nmero mpar de resultados, a mediana pode ser avaliada
diretamente. Para um nmero par de resultados, a mdia do par central usada:

utiliza-se o termo
, se N for mpar;

a mdia aritmtica dos termos e + 1, se N for par.

Ex:
- Observando os dados: 1,5, 8, 9, 12, 17, 20.
Como temos um nmero mpar de dados, a mediana o valor central, ou seja, o valor 9.
- Na srie 1, 5, 8, 9, 12, 17, 20, 22
Nesse caso, a mediana seria a mdia aritmtica dos dois dados centrais:
= 10,5

10. Medidas de Disperso.

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

As medidas de disperso auxiliam as medidas de tendncia central a descrever nosso


conjuntos de dados observados adequadamente. Indicam se os dados esto, ou no,
prximos uns dos outros.
a. Amplitude Total: simplesmente a diferena entre o maior e o menor valor coletado.
=
b. Desvio padro: empregado como uma medida da preciso. a medida mais comum da
disperso estatstica. Ele mostra o quanto de variao existe em relao mdia ou valor
esperado. Um baixo desvio padro indica que os dados tendem a estar prximos da mdia
ou valor esperado; um desvio padro alto indica que os dados esto espalhados por uma
gama de valores.

Outra forma de calcular o desvio padro em calculadoras que no possuem a funo desvio
padro, S.
!=

" #

( #

11. Construo de tabelas de distribuio de


frequncias e histogramas

Frequncia relativa

c. Coeficiente de variao (CV): uma medida de disperso relativa empregada para estimar
a preciso de experimentos. O desvio padro relativo do porcentual da mdia fornece uma
imagem mais clara da qualidade dos dados que os desvios padro absolutos.

A partir da experincia envolvendo um


grande nmero de determinaes, observamos que
a distribuio de rplicas de dados da maioria dos
experimentos analticos quantitativos se aproxima
da curva gaussiana mostrada na Figura 1. Uma
curva gaussiana ou curva normal de erro aquela
que apresenta uma distribuio simtrica dos
dados em torno da mdia de um conjunto infinito
de dados como aquele exibido na Figura 1. Como exemplo, considere os dados contidos na
planilha de clculos da Tabela 1, para a calibrao de uma pipeta de 10 mL. Nesse experimento,
um pequeno frasco e sua tampa foram pesados.
Figura 1. Curva gaussiana, ou curva normal de
Dez mililitros de gua foram ento transferidos
erro.
para o frasco com a pipeta e este foi fechado. O
frasco, a tampa e a gua foram pesados novamente. A temperatura da gua tambm foi medida
para se determinar sua densidade. A massa de gua foi ento calculada tomando-se a diferena
entre as duas massas. A massa de gua, dividida pela sua densidade, representa o volume
dispensado pela pipeta. O experimento foi repetido 50 vezes.
4

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas
Tabela 1. Dados de 50 medies de volume de uma pipeta volumtrica de 10 mL.

Na Tabela 1, a mdia pode ser calculada com a funo =MDIA( ) do Excel. Observe que,
uma vez que os dados se encontram em diferentes colunas, utilizamos a frmula
=MDIA(B3:B19,E3:E19, H3:H18) nos clculos. A mediana calculada usando a funo =MED( ). O
valor mximo pode ser encontrado com a funo =MXIMO( ) e o valor mnimo atravs da funo
=MNIMO( ). A faixa o valor mximo menos o valor mnimo. Os dados da Tabela 2 so aqueles
tpicos obtidos por um analista experiente a partir da pesagem at o miligrama mais prximo (que
corresponde a 0,001 mL) em uma balana de prato superior, sendo cuidadoso no sentido de evitar
erros sistemticos. Mesmo assim, os resultados variaram entre 9,969 mL e 9,994 mL. Esse
espalhamento dos dados em uma faixa de 0,025 mL resulta diretamente do acmulo de todas as
incertezas aleatrias envolvidas no experimento.
A informao contida na Tabela 1 mais facilmente visualizada se os dados forem
rearranjados em grupos de distribuio de frequncia, como na Tabela 2. Nesse caso agrupamos o
nmero de dados que se encontram em sries de faixas adjacentes de 0,003 mL e calculamos o
percentual de medidas contidas em cada faixa. Observe que 26% dos resultados ocorrem na faixa
de volume entre 9,981 e 9,983 mL. Este o grupo que contm os valores mdio e mediano de
9,982 mL. Observe tambm que mais da metade dos resultados esto na faixa de 0,004 mL dessa
mdia.
Tabela 3. Distribuio dos dados da Tabela 3.

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

Os dados da distribuio de frequncia da Tabela 3 esto representados como um grfico de


barras, ou histograma (indicado pela letra A na Figura 2). Podemos imaginar, com o aumento do
nmero de medidas, que o histograma aproxima-se do formato de uma curva contnua, apontada
como a curva B na Figura 2. Este grfico mostra uma curva gaussiana, ou curva de erro normal,
que se aplica a um conjunto infinitamente grande de dados.
A curva gaussiana tem a mesma mdia (9,982 mL), a mesma preciso e a mesma rea sob a
curva que o histograma.

Figura 2. Histograma (A) mostrando a distribuio de 50 resultados contidos na Tabela 4 e uma curva gaussiana (B)
para os dados, tendo a mesma mdia e desvio padro que os dados do histograma.

As variaes em medidas de rplicas, como aquelas indicadas na Tabela 1, resultam de


numerosos erros aleatrios pequenos e individualmente indetectveis que so atribudos a
variveis incontrolveis associadas ao experimento. Esses pequenos erros normalmente tendem a
cancelar uns aos outros, tendo assim um efeito mnimo sobre o valor mdio. Ocasionalmente,
entretanto, ocorrem na mesma direo, para produzir um grande erro lquido positivo ou
negativo.
As fontes de incertezas aleatrias na calibrao de uma pipeta incluem (1) julgamentos
visuais, tais como o nvel de gua em relao marca na pipeta e ao nvel de mercrio no
termmetro; (2) variaes no tempo de escoamento e no ngulo da pipeta, durante seu
escoamento; (3) flutuaes na temperatura, que afetam o volume da pipeta, a viscosidade do
lquido e o desempenho da balana; e (4) vibraes e correntes de ar que causam pequenas
variaes nas leituras da balana. Indubitavelmente, existem muitas outras fontes de incertezas
aleatrias nesse processo de calibrao que no listamos aqui. Mesmo o processo simples de
calibrao de uma pipeta afetado por muitas variveis pequenas e incontrolveis. A influncia
cumulativa dessas variveis responsvel pela distribuio dos resultados em torno da mdia.
12. Construindo grficos
Em muitas circunstncias a meta de realizao das medies descobrir ou estudar a
relao entre duas variveis. A presso e o volume de um gs, o volume e a temperatura de uma
substncia ou a cor de uma soluo e a intensidade dessa cor so exemplos de conjuntos de
variveis relacionadas. Quando uma varivel muda, a outra tambm muda.
6

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

Muitas vezes empregamos grficos para visualizar a relao entre duas variveis. Se existem
duas variveis, o grfico ser um plot bidimensional dos pontos que representam pares de valores
dessas duas variveis. Um exemplo de um grfico bem desenhado est mostrado na Figura 3.
Observe que o grfico tem vrios aspectos que ajudam a esclarecer seu significado.

Figura 3. Este um exemplo de um grfico bem feito. Observe a clareza do ttulo, como as legendas dos eixos so
adequadas, com os nomes das variveis e suas unidades, os pontos dos dados visivelmente marcados e a curva suave,
mostrando qual a tendncia observada e qual a tendncia extrapolada.

a. Caractersticas de um grfico
1. Ttulo. O ttulo de um grfico deve ser breve, mas suficiente para fornecer uma descrio
clara da relao em estudo. Ttulos como Laboratrio nmero 1" ou Volume e temperatura no
so aceitveis porque o significado fica claro apenas para aqueles que participaram do
experimento e ser perdido a medida que for esquecido com a passagem do tempo.
2. Eixos rotulados. Cada eixo do grfico deve ser claramente rotulado para mostrar as
quantidades que ele representa e as unidades empregadas para medir as quantidades. Deve-se
distinguir entre a quantidade medida (presso, volume, temperatura, tempo etc.), e as unidades
usadas para medir essa quantidade (atmosferas, litros, graus Celsius, segundos etc.).
conveniente rotular cada eixo com o nome da quantidade medida seguida pela unidade,
separando a unidade (geralmente abreviada) da quantidade com uma barra, por exemplo,
Volume/L. Portanto, somente nmeros precisam aparecer ao lado de cada eixo, e os eixos no
precisam ser poludos com as unidades em cada marcao. De fato, a barra significa que as
variveis representadas pelos nmeros com unidades foram divididas pelas unidades, deixando
nmeros adimensionais marcados ao longo dos eixos.
3. Escalas. A escala de cada eixo deve ser escolhida cuidadosamente, de tal forma que a
faixa de variao total dos valores possa ser marcada no grfico. Por razes prticas 2, 4, 5 ou 10
divises num grfico de papel devem representar uma unidade decimal da varivel. Essa
equivalncia facilitar estimar valores que caiam entre as divises da escala. Para maior exatido e
propores mais agradveis, as escalas selecionadas devem ser escolhidas de tal forma que o
grfico praticamente ocupe a pgina toda. Assegure-se, entretanto, de que nenhum ponto
marcado saia das margens do grfico.
Observe que o canto inferior esquerdo do grfico no precisa representar zero em nenhum
dos eixos. Se a amplitude dos valores marcados se estender para zero, essa pode ser uma boa
escolha, mas se no, haver muito espao desperdiado no grfico.
4. Pontos de dados. considerado til marcar a localizao de cada dado com um ponto
bem pequeno e ento fazer um crculo em torno dele para torna-lo mais visvel.
7

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

5. A curva. Uma curva suave deve ligar os pontos. Ela deve passar o mais perto possvel de
cada ponto, mas eles no devem ser ligados uns aos outros com curtos segmentos de reta. Se a
relao aparentar ser linear, a curva suave deve ser uma linha reta. Se a linha se estender alm da
amplitude dos valores medidos, essa extenso deve ser indicada por uma linha tracejada e no por
uma linha cheia.
b. Relaes Lineares
Ainda que muitas variveis em sistemas qumicos possam ser relacionadas de modo
complexo no linear, algumas relaes resultam em propores diretas, isto , o valor de uma
varivel um fator constante vezes o valor da outra varivel mais ou menos uma segunda
constante. Quando existe essa relao de proporcionalidade, o grfico de duas variveis ser uma
linha reta. Um exemplo de grfico linear mostrado na Figura 4, que um grfico do volume de
uma amostra de gs versus a temperatura do gs.

Figura 4. Relao entre a temperatura e o correspondente volume de uma amostra de hidrognio gasoso. uma
proporo direta, como representada pela Lei de Charles, V = kT = k(C + 273), marcada como uma linha reta.

A inclinao da linha um fator constante relacionando as duas variveis. A inclinao pode


ser determinada usando-se quaisquer dois pontos da linha, como mostrado na Figura A-2. Note
que a inclinao calculada em unidades das duas variveis.
Na Figura 4 o ponto na linha em que o valor do volume zero (que onde a linha cruza o
eixo de temperatura) chamado de intercepto.
Havendo relao entre as duas variveis, possvel estimar o valor que uma varivel teria
para qualquer valor da outra varivel usando-se o grfico. Se o ponto de interesse ficar dentro da
amplitude dos valores medidos, essa estimativa chama-se interpolao. Por exemplo, na Figura 3
podemos determinar por interpolao que a 125C a presso de vapor da gua de
aproximadamente 1800 torr.
Se a estimativa for feita alm da amplitude das medidas, o processo chama-se extrapolao.
Na Figura 3 podemos ver que a presso de vapor da agua a 155C de 4000 torr,
aproximadamente.
A interpolao e a extrapolao so tcnicas teis, mas ambas so estimativas e assumem
que o grfico seja exato ou que ele se estenda alm dos valores medidos. Especialmente na
extrapolao essa hiptese pode conduzir a concluses incorretas

Engenharia Qumica Laboratrio de Engenharia Qumica Unileste 2015.2 Prof. Djolse Dantas

EXERCCIO
1- Um analista determinou a concentrao de ferro em uma amostra de concentrao conhecida (20,00
mg/L), obtendo-se os seguintes resultados:19,4; 19,5; 19,6; 19,8; 20,1 e 20,3.
a) Valor mdio:
b) Mediana:
c) Erro absoluto:
d) Erro relativo da leitura 19,8 mg/L:
e) Desvio padro:
f) Coeficiente de variao (erro de reprodutibilidade):
2- Os dados relacionados nas Tabelas 1, 2 e 3 referem-se ao consumo de xilose, produo de xilitol e
crescimento celular observados durante cultivos da levedura C. parapsilosis. Os trs experimentos foram
realizados em condies idnticas. A partir dos dados experimentais disponveis, avalie o erro
experimental associado determinao de cada varivel estudada (calcular todas as variveis), analise a
reprodutibilidade dos experimentos a partir dos clculos de coeficiente de variao e construa, para
cada tabela grficos de concentrao x tempo.
Tabela 1. Dados experimentais do Cultivo 1 de C. parapsilosis para produo de xilitol.
Tempo (h)
CXILOSE (g/L)
CXILITOL (g/L)
CCLULAS (g/L)
0
84,9
0
1,6
22
69,1
10,8
4,3
35
54,7
18,0
7,0
48
44,8
24,8
10,4
59
33,1
31,5
11,9
69,5
20,8
38,7
13,3
80
13,2
44,5
14,5
94
3,9
48,6
17,4
101
1,5
47,0
18,2
Tabela 2. Dados experimentais do Cultivo 2 de C. parapsilosis para produo de xilitol.
Tempo (h)
CXILOSE (g/L)
CXILITOL (g/L)
CCLULAS (g/L)
0
89,7
0
1,7
22
69,9
11,0
5,5
35
54,7
17,6
8,2
48
43,6
26,7
10,7
59
31,2
33,3
13,5
69,5
19,1
39,6
13,7
80
11,5
43,0
16,9
94
2,9
47,3
19,7
101
1,2
45,6
20,6
Tabela 3. Dados experimentais do Cultivo 3 de C. parapsilosis para produo de xilitol.
Tempo (h)
CXILOSE (g/L)
CXILITOL (g/L)
CCLULAS (g/L)
0
87,2
0,0
1,7
11
77,6
5,5
4,1
23
67,5
11,4
7,2
44
49,9
21,0
13,1
55
40,6
25,8
16,0
66
31,4
30,2
18,4
77
22,1
34,4
20,2
88
12,9
38,4
21,0
99
3,7
42,2
20,7

Вам также может понравиться