Вы находитесь на странице: 1из 5

Quim. Nova, Vol. 30, No.

2, 346-350, 2007 DETERMINAO DE ACAR TOTAL EM CAF CRU POR ESPECTROSCOPIA NO INFRAVERMELHO PRXIMO E REGRESSO POR MNIMOS QUADRADOS PARCIAIS

Artigo

Marcelo A. Morgano* Centro de Qumica de Alimentos e Nutrio Aplicada, Instituto de Tecnologia de Alimentos, CP 139, 13073-001 Campinas SP, Brasil Cristiano Gomes de Faria Centro Nacional de Pesquisa Gado de Leite, Empresa Brasileira de Pesquisa Agropecuria, 36038-330, Juiz de Fora MG, Brasil Marco F. Ferro Departamento de Qumica e Fsica, Universidade de Santa Cruz do Sul, 96815-000, Santa Cruz do Sul RS, Brasil Mrcia M.C. Ferreira Instituto de Qumica, Universidade Estadual de Campinas, CP 6154, 13084-971, Campinas SP, Brasil Recebido em 16/1/06; aceito em 25/5/06; publicado na web em 31/10/06

DETERMINATION OF TOTAL SUGAR IN RAW COFFEE USING NEAR INFRARED SPECTROSCOPY AND PLS REGRESSION. In this work a fast method for the determination of the total sugar levels in samples of raw coffee was developed using the near infrared spectroscopy technique and multivariate regression. The sugar levels were initially obtained using gravimety as the reference method. Later on, the regression models were built from the near infrared spectra of the coffee samples. The original spectra were pre-treated according to the Kubelka-Munk transformation and multiplicative signal correction. The proposed analytical method made possible the direct determination of the total sugar levels in the samples with an error lower by 8% with respect to the conventional methodology. Keywords: total sugar; raw coffee; near infrared spectroscopy.

INTRODUO As tcnicas de espectroscopia no infravermelho prximo e mdio tm sido freqentemente utilizadas, como uma ferramenta analtica, na determinao de constituintes em alimentos. Diversos trabalhos demonstram o uso destas tcnicas na determinao do contedo de acar em alimentos 1-5. Os mtodos empregando a espectroscopia no infravermelho so rpidos e exatos e tm ampla aplicao analtica em anlises qumicas e de controle de qualidade de produtos da reas de agricultura e alimentos6-10. Na determinao de um componente em particular, a espectroscopia no infravermelho necessita de um conjunto de amostras de calibrao, uma vez que a resposta instrumental no fornece diretamente a informao desejada. Normalmente a propriedade de interesse determinada por meio de um mtodo de referncia. Neste estudo, o teor de acar total nas amostras de caf cru foi determinado empregando-se como mtodo de referncia o gravimtrico da Association of Official Analytical Chemists11. A regresso por mnimos quadrados parciais (PLS) vem sendo usada para estabelecer uma relao matemtica (modelo de calibrao) entre os valores qumicos de referncia e os dados espectrais para uma determinada propriedade medida12. Pr-tratamentos matemticos aplicados aos dados espectrais so, em geral, necessrios para facilitar a interpretao dos espectros e, tambm, melhorar a qualidade de previso dos modelos de calibrao. Em medidas de reflectncia na regio do infravermelho comum ocorrer o fenmeno conhecido como espalhamento de luz, que geralmente provocado pela falta de homogeneidade tica das amostras. Para compensar tal problema utilizada a tcnica de correo multiplicativa de sinal (MSC), que visa minimizar a interferncia relativa ao espalhamento de luz com base no espalhamento mdio de todos os espectros empregados na calibrao multivariada13.
*e-mail: morgano@ital.sp.gov.br

O objetivo deste trabalho foi desenvolver uma metodologia analtica no destrutiva para determinao do teor de acar total em amostras de caf cru, utilizando-se dos espectros no infravermelho prximo (NIR) e da aplicao do mtodo de regresso por mnimos quadrados parciais (PLS). PARTE EXPERIMENTAL Amostras Na construo dos modelos de regresso foram usadas 49 amostras de caf cru, da variedade arbica, procedentes de diferentes regies produtoras de caf do Brasil, dos estados de So Paulo, Minas Gerais, Bahia e Paran. Todas as amostras foram inicialmente homogeneizadas em moinho de facas at a obteno de partculas de tamanho reduzido e passaram por peneira de 0,84 mm de tamanho de abertura de poro. Mtodo de referncia O mtodo de referncia utilizado na determinao do teor de acar total foi o de Munson-Walker11, pela medida gravimtrica de xido cuproso formado. As determinaes do teor de acar total foram realizadas em duplicata nas amostras. Os teores de acar total nas amostras empregadas esto entre 6,46 e 11,24 g/100g. Espectroscopia no infravermelho prximo Os espectros no infravermelho prximo foram coletados em um espectrmetro Bomem DA-08, equipado com um acessrio de reflectncia difusa (Jasco), sendo os sinais expressos em log (1/R). Foram realizadas trs rplicas para cada amostra, com resoluo de 4 cm-1, 16 varreduras para cada espectro e a regio espectral utilizada foi de 4.500 a 10.000 cm-1.

Vol. 30, No. 2

Determinao de acar total em caf cru

347

Anlise dos dados O mtodo de regresso multivariada utilizado no tratamento dos dados foi o mtodo PLS e o software, o Matlab 5.114. Este mtodo bem conhecido da comunidade cientfica13 e, como qualquer outro mtodo de regresso, tem como objetivo encontrar uma relao entre a matriz (X) contendo os espectros das amostras de caf do conjunto de calibrao e o vetor que armazena os respectivos teores de acar (y). O resultado uma equao semelhante Equao 1 y = Xb + e (1)

Como estes erros podem ser medidos tanto para o conjunto de calibrao quanto para o de validao externa comum adicionar no final da sigla destes erros a letra C indicando serem estes relativos calibrao C (MSEC ou RMSEC) ou P quando forem relativos previso do conjunto de validao externa (MSEP ou RMSEP). Varincia relativa (REV): REV = 1 - MSE/s2 (5)

A estimativa da varincia total dos dados (s2) para n amostras, utilizada na expresso 5, determinada segundo a expresso: (6) o valor mdio. onde: y Erro relativo percentual (ER (%)) entre o mtodo de referncia e o mtodo desenvolvido (NIR-PLS): (7) Coeficiente de correlao entre os valores estimados e os valores experimentais do mtodo de referncia:

onde b o vetor de regresso e e o vetor que representa os erros do modelo. O mtodo PLS especialmente indicado quando X contm variveis altamente correlacionadas, como no presente trabalho (dados de espectroscopia). Outra vantagem desse mtodo que pode ser usado mesmo quando as amostras contm interferentes (que devem estar presentes nas amostras do conjunto de calibrao). No modelo PLS, a matriz X decomposta em escores, t, e pesos, w, i.e. XW=T, onde W = (w1, w2, ..., wk) escolhido de maneira que T = (t1, t2,..., tk) apresente covarincia mxima com y (k o nmero de variveis latentes). Assim, as informaes espectrais e as concentraes so usadas ao mesmo tempo na fase de calibrao. Um fator de suma importncia na construo de um modelo PLS a escolha do nmero de variveis latentes (VL), k, a serem includas no modelo. Estatstica O conjunto total de espectros foi dividido em dois subconjuntos: um de calibrao e outro de validao externa. Na determinao do nmero de VL utilizadas no modelo, feita uma validao cruzada (validao interna) no conjunto de calibrao: uma amostra do conjunto de calibrao excluda, o modelo construdo e, ento, estimado o seu teor de acar. O processo repetido at que todas as amostras sejam previstas para 1, 2, ... variveis latentes. A habilidade do modelo de calibrao para estimar (ou prever) o teor de acar baseado nos dados dos espectros NIR gerados foi avaliada usando os erros de previso e os coeficientes de correlao entre os valores dos teores de acar estimados pelo modelo utilizando espectros NIR e os valores do mtodo de referncia das amostras do conjunto de calibrao e de validao. Os parmetros de erro empregados esto apresentados nas Equaes 2 a 8: Soma dos quadrados dos erros de previso (PRESS): (2) onde n representa o nmero de amostras do conjunto de calibrao, ^ o valor estimado pelo modelo para a yi o valor de referncia e y i isima amostra. Erro quadrtico mdio (MSE) ou a raiz quadrada do mesmo (RMSE):

r=

(8)

RESULTADOS E DISCUSSO Para a construo dos modelos de regresso foram utilizados os valores mdios dos teores de acares totais obtidos na determinao empregando o mtodo de referncia e 147 espectros das amostras de caf cru. Para formar o conjunto de calibrao foram selecionados 81 espectros, correspondentes s 27 amostras, de forma a cobrir toda a faixa do teor de acar nas amostras. Os 66 espectros restantes, correspondentes s 22 amostras, foram utilizados para formar o conjunto de validao externa. Devido aos efeitos de espalhamento de luz provocados pela no-homogeneidade das amostras, decorrentes principalmente de diferena de granulometria, foi necessrio utilizar a tcnica de correo de espalhamento de luz (MSC) nos espectros transformados pela Equao de Kubelka-Munk15,16 antes de se proceder construo dos modelos de regresso. Os resultados das transformaes Kubelka-Munk e a correo multiplicativa de sinal (MSC) nos dados dos espectros originais podem ser visualizados na Figura 1. A matriz de dados resultante, a partir dos espectros transformados, foi escalada pela varincia, ou seja, cada coluna foi dividida pelo respectivo desvio padro. A seleo de variveis foi obtida atravs das informaes dadas pelo correlograma4. O correlograma foi gerado calculando-se o coeficiente de correlao linear (r) entre as variveis independentes, ou seja, os resultados de log(1/R) (R = reflectncia) (bloco-Y) e cada uma das variveis dependentes, ou seja, os resultados do teor de acar obtidos pelo mtodo de referncia (bloco-X), de modo que no final do processo se tem para cada varivel independente um valor associado de r, que ao serem dispostos em um grfico geram o correlograma. O coeficiente de correlao linear (ri) entre estes dois blocos foi utilizado para compor o correlograma em um grfico no qual a ordenada o coeficiente de correlao linear e a

(3)

(4)

348

Morgano et al.

Quim. Nova

abscissa, os comprimentos de onda lidos (os nmeros representativos de cada varivel).

Figura 1. a. Espectros NIR aps a transformao Kubelka-Munk (K M); b. Espectros NIR aps K M e a correo multiplicativa de sinal (MSC)

Para escolher qual o melhor valor de corte a ser empregado, acompanhou-se o valor do PRESS para o conjunto de calibrao e de validao externa fazendo-se variar o valor de corte, para modelos PLS usando diferentes variveis latentes. A Figura 2 apresenta estes resultados. Observa-se que o PRESS de calibrao aumenta significativamente, quando se utilizam valores de corte superiores a 0,3. Nesta figura observa-se, tambm, que o PRESS da calibrao diminui, medida que o modelo se torna mais complexo, no entanto, esta tendncia no observada com relao ao PRESS da validao externa. Como o que se pretende um modelo com uma boa capacidade de predio optou-se pelo modelo que apresentou o menor PRESS no conjunto de validao (assinalado com asterisco na Figura 2a), que corresponde ao modelo que utiliza 6 variveis latentes e um valor de corte igual a 0,1. O correlograma referente aos dados mostrado na Figura 2b. Observa-se que a correlao linear entre o bloco-X e o bloco-Y no muito pronunciada, apresentando valores inferiores a 0,6. Com um valor de corte de 0,1 foi possvel selecionar 831 variveis das 2250 variveis originais. Os intervalos de nmeros de onda selecionados esto relacionados principalmente com as bandas de combinao (estiramento + deformao angular) e sobretons das ligaes C-H de grupos CH3 (7353; 5900; 5865; 5797 cm-1) e ligao O-H (6757- 6329 cm-1) da glicose. Ajuste do modelo O nmero de variveis latentes, utilizado no modelo PLS, foi determinado a partir do PRESS exibido no conjunto de validao externa. A Figura 3 mostra o comportamento do PRESS para o conjunto de calibrao e de validao externa em funo do nmero de variveis latentes utilizadas nos modelos. O valor mnimo do PRESS exibido pelo conjunto de validao externa atingido quando se utiliza um

Figura 2. a. Grfico do PRESS de validao interna e de validao externa em funo do valor de corte do correlograma (selecionando apenas as variveis positivamente correlacionadas) dos modelos PLS utilizando 5, 6, 7 e 8 variveis latentes. b. Grfico do correlograma apresentando o valor de corte utilizado (0,1) e as variveis selecionadas

nmero de variveis latentes igual a 6. O comportamento do PRESS da validao indica que, se utilizando modelos com mais de 6 variveis latentes, os dados sofrem um sobre-ajuste (overfit), que fica evidenciado tambm no decrscimo monotnico do PRESS do conjunto de calibrao com o aumento da complexidade do modelo. Problemas de sub-ajuste (underfit) ficam evidenciados no aumento dos valores do PRESS de ambos os conjuntos ao se utilizar modelos com um nmero de variveis latentes inferiores a 6. Levando-se em conta os fatores abordados acima, concluiu-se que o uso de 6 variveis latentes o mais apropriado na construo do modelo de regresso PLS para determinar o teor de acar em amostras de caf cru. Com o modelo PLS utilizando 6 variveis latentes foi possvel descrever praticamente toda a variabilidade tanto do bloco Y como

Figura 3. Grfico do PRESS dos conjuntos de validao interna ( ) e externa ( ) em funo do nmero de variveis latentes utilizadas nos modelos

Vol. 30, No. 2

Determinao de acar total em caf cru

349

do bloco X, utilizados na calibrao. A Tabela 1 traz os valores de varincia capturados por cada VL; estes valores mostram que a estrutura dominante dos dados, tanto para o bloco-X quanto para o bloco-Y, descrita basicamente pela primeira VL. Tabela 1. Porcentagem de varincia obtida para cada varivel latente do modelo PLS VL* 1 2 3 4 5 6 Bloco-X Varincia Varincia (%) Acumulada (%) 99,99 0,01 0,00 0,00 0,00 0,00 99,99 99,99 99,99 99,99 100 100 Bloco-Y Varincia Varincia (%) Acumulada (%) 98,71 0,12 0,16 0,46 0,19 0,12 98,71 98,83 98,99 99,45 99,64 99,76

Validao do modelo O modelo de calibrao para a predio do teor de acar total foi validado por validao externa, utilizando um conjunto de 66 espectros, relativos a 22 amostras em triplicata. A Tabela 2 apresenta os valores mdios preditos pelo modelo, o resduo e o erro relativo percentual para as amostras do conjunto de validao externa. O histograma para estes dados, mostrado na Figura 6, indica que o erro relativo percentual para este conjunto fica, na maioria dos casos, confinado entre os valores de + 5%. O erro mximo obtido para o teor de acar total foi 7,7% para as 22 amostras do

*VL = Varivel latente. Os resultados da calibrao podem ser visualizados na Figura 4, que exibe os valores experimentais versus os valores preditos pelo modelo PLS com 6 variveis latentes. Os resduos da calibrao obedecem a uma distribuio normal como se pode ver pelo histograma apresentado na Figura 5. Os parmetros de erros (g/ 100 g) e ajuste relativos ao conjunto de calibrao encontrados foram os seguintes: PRESS = 16,41; MSE = 0,197; RMSE = 0,444; REV = 0,826 e r = 0,907.
Figura 6. Representao grfica da freqncia do erro relativo percentual (ER) para o conjunto de validao externa

Tabela 2. Resultados de predio do teor de acares totais para as amostras do conjunto de validao Resultados obtidos pelo mtodo referncia (g/100 g) 8,5 0,1 8,9 0,2 9,50 0,09 9,6 0,4 9,0 0,2 8,9 0,2 91 9,2 0,5 9,6 0,1 9,2 0,3 9,3 0,3 9,2 0,1 91 92 10,0 0,1 10 1 8,1 0,2 9,4 0,1 9,0 0,4 9,2 0,7 9,4 0,2 10,4 0,2 Resultados obtidos pelo mtodo NIR/PLS (g/100 g) 8,6 0,8 8,8 0,4 9,0 0,6 9,0 0,5 91 9,3 0,5 8,8 0,5 9,7 0,2 9,4 0,5 9,0 0,3 8,9 0,6 9,7 0,9 9,2 0,4 9,1 0,3 9,5 0,1 9,8 0,4 8,7 0,3 8,9 0,5 9,1 0,7 9,3 0,7 9,1 0,5 9,6 0,7 Resduo ER (g/100 g) (%) -0,1 0,1 0,5 0,6 0 -0,4 0,2 -0,5 0,2 0,2 0,4 -0,5 -0,2 -0,1 0,5 0,2 -0,6 0,5 -0,1 -0,1 0,3 0,8 -1,2 1,1 5,3 6,2 0 - 4,5 2,2 - 5,4 2,1 2,2 4,3 -5,4 -2,2 -1,1 5,0 2,0 -7,4 5,3 -1,1 -1,1 3,2 7,7

Figura 4. Valor experimental (Y exp) versus valor predito (Y pred) (em g /100 g de acares totais) para o conjunto de calibrao do modelo de regresso usando 6 variveis latentes

Figura 5. Histograma dos resduos da calibrao (%) do modelo PLS com 6 variveis latentes

Resduo: valor obtido pelo mtodo de referncia valor obtido pelo mtodo NIR/PLS; ER (%) = (resduo/ valor obtido pelo mtodo de referncia) x 100.

350

Morgano et al.

Quim. Nova

conjunto de validao, o menor erro foi 0% e a mdia 3,4%. Os parmetros de erro obtidos foram: PRESS = 3,354; MSE = 0,152; RMSE = 0,390; r = 0,645. CONCLUSES A espectroscopia no infravermelho prximo combinada com o mtodo de calibrao multivariada (PLS) uma tcnica fcil e rpida na determinao do teor de acar total em amostras de caf cru. Os modelos de regresso construdos apresentam melhor desempenho quando so empregadas as transformaes Kubelka-Munk e a correo multiplicativa de sinal (MSC) nos dados escalados pela varincia. As principais vantagens do mtodo proposto quando comparado com o mtodo tradicional gravimtrico so reduo do tempo de anlise, pouca manipulao das amostras, diminuio de resduos qumicos e reduo do custo de anlise. AGRADECIMENTOS Ao Consrcio Brasileiro de Pesquisa e Desenvolvimento do Caf e FUNAPE, pelo apoio financeiro para a realizao deste trabalho.

REFERNCIAS
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. Baker, D.; Cereal Food. World 1985, 30, 389. Baker, D.; Norris, K. H.; Appl. Spectrosc. 1985, 39, 618. Cadet, F.; Robert, C.; Offmann, B.; Appl. Spectrosc. 1997, 51, 369. Bellon-Maurel, V.; Vallat, C.; Goffinet, D.; Appl. Spectrosc. 1995, 49, 556. Kawano, S.; Fujiwara, T.; Iwamoto, M.; J. Jpn. Soc. Hortic. Scienc. 1993, 62, 465. Osborne, B. G.; Fearn, T.; Near-infrared spectroscopy in food analysis, Longman Scientific & Technical: Harlow, 1986. Barton, F. E.; Near-infrared technology in the agricultural and food industries, American Association Cereal Chemists: St. Paul, 1987. Parreira, T. F.; Ferreira, M. M. C.; Sales, H. J. S.; Almeida, W. B.; Appl. Spectrosc. 2002, 56, 1607. Ferro, M. F.; Carvalho, C. W.; Muller, E. I.; Davanzo, C. U.; Cinc. Tecnol. Aliment. 2004, 24, 333. Ferro, M. F.; Davanzo, C. U.; Anal. Chim. Acta 2005, 540, 411. Horwitz, W., ed.; Official Methods of Analysis of the Association of Official Analytical Chemists, 2000, vol. 9, method 44.1.6. Ferreira, M. M. C.; Antunes, A. M.; Melgo, M. S.; Volpe, P. L. O.; Quim. Nova 1999, 22, 724. Martens, H.; Naes, T.; Multivariate calibration, J. Wiley & Sons Ltd.: Chichester, 1989. MATLAB- The Language of Tecnical Computing, version 5.1.0.421; The MathWorks Inc., 1997. Olinger, J. M.; Griffiths, P. R.; Appl. Spectrosc. 1993a, 47, 687. Olinger, J. M.; Griffiths, P. R.; Appl. Spectrosc. 1993b, 47, 695.

Вам также может понравиться