Вы находитесь на странице: 1из 16

1.

Introduccin
Whisky es una bebida alcohlica con gran aceptacin mundial
Y alto valor comercial. Debido a estos factores, esta bebida
Ha sido un objetivo comn de varios tipos de falsificaciones,
Tales como: la presencia de otro tipo de bebida de color, la dilucin
Con agua y alcohol, y mezclando o reemplazando con otro
Whisky de menor calidad utilizando la botella comercial original. Por lo tanto,
Mtodos que permiten la autenticacin de bebidas son de interes
para los productores, las agencias reguladoras, la
y las instituciones de investigacin criminal (Mackenzie y Aylott, 2004).
Segn Hoffman (2008)el whisky se puede definir como una bebida destilada de
cereales, levadura y agua, que ha sido madurado en barriles de madera durante un cierto
perodo de tiempo. La verificacin de que una bebida cumple los requisitos para ser
clasificada como whisky se puede realizar por referencia anlisis clsico de la
AOAC Official Methods of Analysis Handbook (AOAC, 2000) y
El Manual Operativo de Bebidas y Vinagres del Ministerio de Brasil
de Agricultura, Ganadera y Abastecimiento (Ministerio de Agricultura,
Ganadera y Abastecimiento, 2010)
. Aparte de estos mtodos clsicos, Algunas falsificaciones tambin pueden ser
detectadas por el anlisis visual de la
Botella y caractersticas de contenido, residuos de evaporacin obtenidos,
La medicin del contenido alcohlico y la conductividad elctrica
(Talhavini y da Veiga, 2012).
Sin embargo, estos anlisis no
Son capaces de identificar falsificaciones como el llenado de una botella de alto valor
con un whisky de menor valor. En estos casos, los principales
Mtodos utilizados para confirmar la autenticidad se basan en la
De congneres presentes en whisky por cromatografa de gases.
Junto con la deteccin de espectrometra de masas con inyeccin directa
o por el uso de espacio de cabeza microextraccin en fase slida (Cmara
Et al., 2007; Demyttenaere, Snchez Martnez, Verh, Sandra,
De Kimpe, 2003; Lee, Paterson, Birkmyre, y Piggott, 2001; Wang,
Wang, y Choong, 2004).
Actualmente, las tcnicas de espectroscopia y los mtodos quimiomtricos
Han sido empleados en el anlisis de bebidas y alimentos para
Para mejorar el control de calidad, la deteccin de falsificaciones o adulteraciones,
y la identificacin de origen, entre otros (Alczar, Jurado, Palacios-
Morillo, de Pablos, & Martn, 2012; Bertone, Venturello, Giraudo,
Pellegrino, & Geobaldo, 2016; Botelho, Reis, Oliveira y Sena,
2015; Boyaci, Genis, Guven, Tamer, & Alper, 2012; Ferreira,
Galo, Pallone, & Poppi, 2014; Herranz, de la Serna, Barro, Martin,
& Cabezudo, 1989; Kaya-Celiker, Mallikarjunan, & Kaaya, 2015;
Lachenmeier, 2007; Picque et al., 2006). Entre estos
obra de Mignani et al. (2012) se pueden destacar. Ellos aplicaron
UV-Vis, Near Infrared (NIR) y espectroscopia de fluorescencia para distinguir
Whiskies de malta nica de una mezcla comercial y
para identificar el origen geogrfico de la produccin de la malta nica
En este trabajo se utilizaron 18 muestras / marcas:

De malta nica producida en destileras superiores situadas en dos


macro-reas de Escocia y 3 muestras de
Mezcla de whisky de grano. Inicialmente el Anlisis de Componentes Principales
(PCA) se aplic a cada uno de los datos espectroscpicos y las puntuaciones
Obtenidos en cada uno de los datos se combinaron para el anlisis discriminante lineal
(LDA). El mtodo fue capaz de identificar las muestras segn
A la zona de produccin y para distinguirlos de las
Mezclas Sin embargo, se utiliz una nica botella de cada muestra,
Que es una severa limitacin de muestreo que no incluye la
Variabilidad de cada marca / muestra para una adecuada validacin de la
mtodo.
Pontes et al. (2006) aplicaron NIR, suave Independiente Modelizacin de
Clase de Analoga (SIMCA) y PCA para realizar la clasificacin y
Verificacin de las muestras de falsificacin de cuatro bebidas diferentes
Tipos: whisky, brandy, ron y vodka. En este trabajo, la formacin de
Conjuntos se construyo con 10 muestras de diferentes lotes del mismo
Fabricante para cada tipo de bebida, totalizando 40 muestras.
La validacin se realiz con 24 muestras adulteradas preparadas
en el laboratorio y 5 muestras reales con sospecha de adulteracin
Proporcionado por un organismo regulador. El modelo PCA fue capaz
de agrupar las muestras originales en 4 clases diferentes, correspondiendo
a los 4 diferentes tipos de bebidas y el modelo SIMCA identificado
Las muestras adulteradas con una clasificacin correcta del 100%,
los mismos resultados se observaron en las muestras reales proporcionadas por
la agencia reguladora. Sin embargo, la distincin entre
marcas del mismo tipo de bebidas no ha sido evaluado.
McIntyre, Bilyk, Nordon, Colquhoun, y Littlejohn (2011) propuso
El uso del medio infrarrojo con una reflexin total atenuada
(FTIR-ATR) Sonda de inmersin para la determinacin in situ de la
la concentracin de etanol en el whisky y la identificacin de
Muestras. Un total de 17 muestras autnticas y falsificadas fueron
usadas. Los resultados de la regresin univariada y parcial de los mnimos cuadrados
(PLSR) demostraron ser equivalentes para el anlisis de etanol.
Las muestras falsificadas fueron analizadas por un modelo PCA construido con
El residuo seco y las soluciones de caramelo. El modelo PCA
fue capaz de distinguir entre diferentes colorantes de caramelo y
Etanol. Los resultados obtenidos fueron consistentes con
los suministrados por la compaa de whisky. Sin embargo, el mtodo
requiere una preparacin de muestras para la identificacin de falsificaciones
basado en la adicin de caramelo, que aumenta significativamente
El tiempo requerido para el anlisis.
De malta nica producida en destileras superiores situadas en dos
macro-reas de Escocia y 3 muestras de commercialgrade
Mezcla de whisky de grano. Inicialmente el Anlisis de Componentes Principales
(PCA) se aplic a cada uno de los datos espectroscpicos y las puntuaciones
Obtenidas en cada uno de los datos, se combinaron para el anlisis discriminante lineal
(LDA). El mtodo fue capaz de identificar las muestras segn
la zona de produccin y para distinguirlos de las
mezclas Sin embargo, se utiliz una nica botella de cada muestra,
que es una severa limitacin de muestreo que no incluye la
Variabilidad de cada marca / muestra para una adecuada validacin del
mtodo.
Pontes et al. (2006) aplicaron NIR, suave Independiente Modelizacin de
Clase de Analoga (SIMCA) y PCA para realizar la clasificacin y
Verificacin de las muestras de falsificacin de cuatro bebidas diferentes
Tipos: whisky, brandy, ron y vodka. En este trabajo, se dio la formacin de conjuntos
que fueron construidos con 10 muestras de diferentes lotes del mismo
fabricante para cada tipo de bebida, totalizando 40 muestras.
La validacin se realiz con 24 muestras adulteradas preparadas
En el laboratorio y 5 muestras reales con sospecha de adulteracin
Proporcionado por un organismo regulador. El modelo PCA fue capaz
de agrupar las muestras originales en 4 clases diferentes, correspondiendo
a los 4 diferentes tipos de bebidas y el modelo SIMCA identificado.
Las muestras adulteradas con una clasificacin correcta del 100%,
los mismos resultados se observaron en las muestras reales proporcionadas por
La agencia reguladora. Sin embargo, la distincin entre
marcas del mismo tipo de bebidas no ha sido evaluado.
McIntyre, Bilyk, Nordon, Colquhoun, y Littlejohn (2011) propuso
El uso del medio infrarrojo con una reflexin total atenuada
(FTIR-ATR) y la sonda de inmersin para la determinacin in situ de la
La concentracin de etanol en el whisky y la identificacin de
Muestras. Un total de 17 muestras autnticas y falsificadas fueron
usadas
. Los resultados de la regresin univariada y parcial de los mnimos cuadrados
(PLSR) demostraron ser equivalentes para el anlisis de etanol.
Las muestras falsificadas fueron analizadas por un modelo PCA construido con
el residuo seco y las soluciones de caramelo. El modelo PCA
fue capaz de distinguir entre diferentes colorantes de caramelo y
Etanol. Los resultados obtenidos fueron consistentes con
los suministrados por la compaa de whisky. Sin embargo, el mtodo
Requiere una preparacin de muestras para la identificacin de falsificaciones
basado en la adicin de caramelo, que aumenta significativamente
El tiempo requerido para el anlisis.
Recientemente, Cantarelli, Azcrate, Savio, Marchevsky, y Camia
(2015) propusieron la discriminacin de whiskys segn la edad
y la marca por espectroscopia UV-Vis usando PCA, LDA y parcial
Cuadrados Menores para Anlisis Discriminante (PLS-DA). Seis botellas de quince
se utilizaron diferentes marcas y las mediciones fueron
Adquiridos en cada botella. Cinco de estas marcas eran de alto valor comercial
y por esta razn fueron seleccionados para ser discriminados
Entre s y entre las otras diez marcas. la
Preparacin de muestras implic la adicin de una solucin tampn
Ajuste del pH (pH = 12) y dilucin. El modelo PCA fue capaz
de separar las muestras segn las marcas y los aos de
envejecimiento. El modelo LDA present el 99,15% de la clasificacin correcta
Segn marcas y 100% segn aos de envejecimiento. los
modelos PLS-DA fueron construidos utilizando las 5 muestras del
Value whiskies en el conjunto de entrenamiento, y clasificacin 100% correcta
segn los aos de envejecimiento. Sin embargo, en este ltimo
slo se utiliz un conjunto de datos de validacin muy pequeo y
el mtodo no se prob con muestras falsas / adulteradas reales para
para verificar su eficiencia.
Aunque diferentes mtodos de aplicacin de la espectroscopia UV-Vis
Que ya se han publicado sugiriendo la posibilidad de discriminar
Whiskys segn marcas y edades, todava hay una falta de resultados
Que demuestren la eficacia de este enfoque mediante una adecuada
Validacin utilizando tanto muestras autnticas como falsas y
la determinacin de las cifras apropiadas de mrito para el mtodo.
Por lo tanto, este trabajo tiene como objetivo proponer un mtodo simple para el anlisis
directo de
Whisky por espectroscopia UV-Vis y PLS-DA con el fin de
Alcanzar los siguientes objetivos. En primer lugar, para realizar la discriminacin entre
muestras autnticas de marca de whisky con diferentes edades, para
Falsificaciones como el llenado de botellas de whisky de alto valor con
Valor bajo. Segundo, hacer el anlisis de las diferentes falsificaciones comunes
de las muestras tomadas por la Polica Federal Brasilea para
Probar la eficacia del mtodo en casos forenses reales. En la discriminacin
se desarrollaron modelos para siete marcas diferentes y sus
eficacia evaluada con muestras autnticas y autnticas
no slo de las marcas modeladas sino tambin de otras once
marcas no incluidas en el paso de formacin. Adems,
se analizaron 73 muestras falsificadas de las siete marcas con el objetivo
de generar la aparicin de falsos positivos y falsos errores negativos y el resultado fue
analizado.

2. Materiales y mtodos
2.1. Descripcin de las muestras
2.1.1. Muestras autnticas
Las muestras autnticas consistieron en 164 botellas de dieciocho
Marcas obtenidas a travs de donaciones del Laboratorio Nacional
De Agricultura de Minas Gerais (LANAGRO - MG), DIAGEO
PLC, la Polica Federal de Brasil y adquiri en whisky certificado
distribuidores en tiendas de importacin de certificados de Brasilia, Brasil.
Todas las muestras autnticas adquiridas en Brasilia presentaron importacin
Certificados, documentos presupuestarios. Adems, fueron sellados y
Con los sellos comerciales autnticos. Adems, todas las muestras
de Braslia se analizaron mediante los mtodos de referencia de whisky de rutina
De la Polica Federal Brasilea para asegurar su autenticidad. Esta rutina
Se basa en el anlisis visual de la botella y las caractersticas del contenido,
Residuo de evaporacin, contenido de alcohol y
mediciones de conductividad (Ministerio de Agricultura, Ganadera y
Suministro de 2010. La Tabla 1 muestra la distribucin de estas muestras
Segn su edad y nmero de unidades en cada marca. En adicin,
Se seleccionaron estas marcas para representar algunas de las marcas ms Commer
whisky especia- en Brasil, para permitir la evaluacin de la
Discriminacin entre marcas similares (es decir, Red Label y Black
Etiqueta). El objetivo era evaluar si el mtodo propuesto podra resolver
Casos forenses como una botella de whisky de whisky de mayor calidad
Con un whisky de precio / calidad inferior (por ejemplo, una botella Black Label
Conteniendo la etiqueta roja o Natu Nobilis). Las otras marcas fueron utilizadas
para validar el mtodo con muestras autnticas pertenecientes a marcas
no incluidas en el conjunto de entrenamiento.

2.1.2. Muestras falsificadas


La Tabla 1 tambin presenta la descripcin de la falsificacin de setenta y tres
muestras pertenecientes a las siete marcas seleccionadas en el
seccin previa. Estas muestras fueron proporcionadas por
Polica Federal y obtenidas de operaciones de incautacin. Estas muestras
fueron atestiguados como falsificacin de acuerdo con el anlisis de rutina de whisky
realizado en el laboratorio forense del Instituto Nacional
De la Criminalstica de la Polica Federal Brasilea en Brasilia. Inicialmente
Todas las muestras fueron sometidas a inspeccin con respecto a los
Sellos comerciales legales, y seales de violacin del sello. Despus
que, los anlisis fsico-qumicos incluyeron la deteccin de partculas
Sobre el lquido, la concentracin de etanol, la determinacin del residuo seco,
Anlisis de GC / MS de perfil comparativo, FTIR, pH y analisis de conductometra.
Las muestras falsificadas fueron identificadas por el cumplimiento
de al menos uno de los siguientes requisitos: presencia de iones F _ y
Cl _ (que indica la presencia de agua del grifo), presencia de caramelo,
Colorantes y aguacate (cachaa brasilea), mezclas de etanol /
Agua / colorantes, pero baja concentracin de steres etlicos.

2.2. Anlisis UV-Vis


Todas las muestras se analizaron por triplicado sobre espectrofotmetro UV-Vis
Acoplado a una bomba peristltica (Agilent Technologies,
Modelo 8453, equipado con lmparas de deuterio y tungsteno) utilizando un
celda de flujo de cuarzo con 1 mM de camino ptico y el volumen de 62 m L
(Hellma). Los datos de absorbancia se adquirieron a una resolucin de 1 nm
Entre 190 y 1100 nm y exportado a la hoja de clculo
Utilizando el software UV-Visible Chemstation. Medidas de fondo
Se obtuvieron a partir de una solucin de 40:60 (v / v) de etanol: agua
Preparado a partir de un reactivo de etanol absoluto (Dynamic, PA) en ultrapuro
Agua (Millipore Direct-Q 5). No hay preparacin o dilucin de la muestra
Se llev a cabo para el anlisis de whisky.
La celda de flujo se utiliz para mejorar el rendimiento analtico,
minimizando el volumen de muestra requerido en cada anlisis y optimizando
tanto el tiempo requerido para llenar y limpiar el cuarzo
celda. Inicialmente, la celda de cuarzo se limpi bombeando un 40:60
(V / v) de etanol: solucin acuosa durante 10 s. Luego la muestra de whisky
Se bombe para llenar la celda de flujo y se detuvo el flujo para el espectro
medicin. Este procedimiento se repiti para el anlisis
En cada repeticin de todas las muestras. Sin normalizacin ni correccin
se realiz en los espectros antes del anlisis quimiomtrico.
El anlisis se realiz en das diferentes, en el que las muestras
fueron seleccionados al azar de todas las marcas para evitar
seleccin de muestras de capacitacin que pudieran introducir sesgo
Resultados.
2.3. Anlisis de Quimiometra
El anlisis de los datos se realiz utilizando la versin del software MATLAB
7.12 (R2011b) y el PLS Toolbox versin 6.5 aplicando la
Discriminacin por PLS-DA. Con el fin de
Desarrollar y validar un modelo PLS-DA un nmero mnimo de muestras
De cada marca. Por lo tanto, segn la distribucin de
muestras de autnticos presentan en la Tabla 1, slo siete marcas
fueron seleccionados para el desarrollo de los modelos PLS-DA: Rojo
Etiqueta, Etiqueta Negra, Caballo Blanco, Chivas Regal, Ballantine's Finest,
Parr viejo y Natu Nobilis. Las muestras de estas marcas se dividieron Sistemticamente
en dos conjuntos de datos independientes, para
Formacin y validacin. Las muestras se dividieron de modo que al
Al menos 2/3 de las muestras de las siete marcas objetivo estuvieron presentes
en la formacin de datos (Tabla S1 en el material complementario).
Se utilizaron las muestras de todas las muestras autnticas
Conjunto de datos de validacin. Cabe sealar que en la propuesta
Se desarrolla un modelo PLS-DA para cada marca especfica de
Inters, de modo que, despus de esta formacin, se pueda aplicar para
Muestras autnticas de estas marcas y diferentes tipos de
Adulteraciones de estas marcas (es decir, la adicin de otros componentes
El whisky, sustituir la parte o todo el volumen de la botella con una
Whisky de menor calidad / precio).
2.3.1. Los mnimos cuadrados parciales para el anlisis discriminante
PLS fue desarrollado originalmente como una calibracin multivariable
Mtodo, pero tambin se encontr aplicacin en el anlisis de discriminacin
(Hobro, Kuligowski, mueca, y Lendl, 2010; Sun, 2009). Diferente de
PCA, que slo permite un anlisis exploratorio o no supervisado de
Los datos, PLS-DA es un modelo supervisado que requiere muestras conocidas
Adems, tras las etapas de formacin y validacin,
El modelo PLS-DA permite concluir si una muestra desconocida
pertenece o no a una de las clases / marcas incluidas en la formacin
o si la muestra analizada representa algn tipo de falsificacin
o es una muestra autntica perteneciente a una clase / marca no incluida
En el modelo desarrollado. Matemticamente, la regresin PLS
la matriz de datos (X) y el vector variable dependiente (y) que contiene
los valores de referencia de la propiedad de inters por medio de una variable
multivariable
modelo lineal con el fin de obtener una mejor estimacin de y
partir de los datos instrumentales en X (Esbensen, 2009; Wold,
Sjstrm, y Eriksson, 2001). En el caso de PLS-DA el vector contiene y
La identificacin de clases (en este caso, clases de whisky). el
vector de respuesta y se compone de 0 y 1'S, donde el valor 1 es
Asignado a muestras pertenecientes a la clase objeto de discriminacin y
el valor 0 a las muestras pertenecientes a cualquier otra clase / marca incluida
en el conjunto de entrenamiento (de la Mata et al., 2012). Este modelo se descompone
X e Y y crea un nuevo sistema de ejes de coordenadas llamado latente
Variables, obtenidas para maximizar la covarianza entre
X e Y segn las Ecs. (1) y (2) (Naes, Isaksson, Feran, y
Davies, 2002).

X
XA
un 1
t a p T una
d e D1
y
XA
un 1
t un q T una
f2
donde t a es el vector de puntuacin, p A y Q a son las cargas para el latente
la variable A y E y F son las matrices de error de X e Y, respectivamente.
La estimacin del valor de la clase para una muestra desconocida que
un espectro de x i se obtiene por:
^ Y I x i W PW _ 1 q x i B D 3
donde W es la matriz de peso de X, P est cargando matriz de X y q
ganduleaje vector de y, todo obtenido en la etapa de formacin para una variables
latentes
Por el algoritmo PLS-DA. De acuerdo con la ecuacin (3), la formacin
parmetros W, P y Q tambin puede combinarse en un nico vector
b, que puede ser multiplicado por el espectro de la muestra desconocida
y da como resultado el valor estimado de clase (y).
Despus de la optimizacin del modelo, se calcula un umbral de discriminacin
basado en la dispersin de los valores de clase estimados (^ y) para
Las muestras de entrenamiento minimizando la aparicin de falsos positivos
Y errores negativos segn un enfoque bayesiano. Detalles sobre
Los antecedentes matemticos de PLS-DA y la estimacin de umbral
Pueden obtenerse en textos especficos de la quimiometra

Brereton y Lloyd, 2014; Ferreira, 2015). Una muestra genrica desconocida


i se clasifica como perteneciente a una clase / marca determinada si su estimada
valor de clase S I ^ resulta ser por encima de la correspondiente discriminacin
lmite. De lo contrario, esta muestra ser clasificada como perteneciente
A la clase 0, que contiene las muestras de todas las dems clases. Eso
Debe notarse que el valor de la clase atribuido a las muestras
Fueron arbitrariamente definidos como los nmeros adimensionales 1 (uno)
Y 0 (cero) para identificar las muestras como pertenecientes al grupo discriminado
Clase o pertenecientes a las otras clases, respectivamente.
2.3.2. Optimizacin de los modelos de discriminacin y outlier
identificacin
La optimizacin de los modelos de discriminacin se realiz
mediante la seleccin del mtodo de preprocesamiento, el nmero de
Variables y la eliminacin de valores atpicos, que se definen como muestras
mostrando algn tipo de salida de la mayor parte de los datos.
El mtodo de preprocesamiento y el nmero de variables latentes
(LV) se determinaron basndose en la raz del error cuadrtico medio de la cruz
Validacin (RMSECV) valores obtenidos por persianas venecianas crossvalidation,
Que se estima segn la siguiente ecuacin:
y donde i es el valor real de la clase atribuida a la muestra i, el valor ^ y i
es su estimacin obtenida por PLS-DA y n c el nmero de muestras en
El conjunto de entrenamiento.
El mtodo de preprocesamiento y el nmero de LV se eligieron
Como la condicin que proporcion el menor valor de RMSECV o la
LV ms baja despus de la estabilizacin de la RMSECV. Es importante
Obsrvese que el error de clasificacin de validacin cruzada (CVCE), definido
como la tasa de clasificacin correcta obtenida en el modelo PLS-DA en
La formacin mediante la validacin cruzada, no se utiliz en el
la determinacin del mtodo de preprocesamiento y LV en el
Modelos PLS-DA. El CVCE no se utiliz porque no penaliza
las muestras que presentan errores de altura en el valor de la clase estimado (^ y i) si
la muestra est correctamente clasificada. Sin embargo, para muestras que
altos errores en ^ yi los valores de la clase estimados podran ser una indicacin
de una muestra con diferentes caractersticas del conjunto de datos de formacin,
que constituyen un valor atpico. Por otro lado, el RMSECV, idealmente
proporciona la mayor separacin de los valores estimados para
clase discriminado (y = 1) a partir de las otras clases (y = 0), minimizando
los errores de estimacin y, y, en consecuencia, deberan proporcionar
Mayores tasas de clasificacin correctas

La etapa de optimizacin relacionada con la identificacin y


los valores extremos se bas en el trabajo de Borin y Poppi (2004), la
ASTM E1655-05 y adaptado de da Silva, Talhavini, Zacca,
Maldaner, et al. (2014) y da Silva, Talhavini, Zacca, Trindade,
y Braga (2014). Para ello se utilizaron tres parmetros:
Q residuales espectrales, T 2 de Hotelling y los errores en la estimacin
Clase, que se detallan a continuacin.
Q _ residuales espectrales: evaluar el ajuste de falta de de cada individuo
Espectro en el modelo PLS-DA. Se determina por la suma de
los cuadrados del vector residual de cada muestra (e i), expresado
para una muestra i por la ecuacin.

donde e i es el residual descomposicin obtenidos para la muestra i,


De acuerdo con la ecuacin (1). Si un espectro de muestra pertenece a uno de los
Clases / marcas incluidas en el conjunto de formacin (clases predefinidas)
Y no contiene ninguna contaminacin o error de medicin,
que debe presentar un valor Q compatible con los espectros utilizados en
La etapa de entrenamiento. De lo contrario, si la muestra presenta un valor Q de manera
significativa
Superiores a los observados en el conjunto de
Indicar la presencia de algn tipo de compuesto de adulteracin O por la muestra
perteneciente a una clase / marca no incluida
En el conjunto de entrenamiento.
_ T2 de Hotelling: medidas estadsticas de este parmetro hasta qu punto una muestra
Es desde el centro del modelo PLS-DA. En otras palabras,
Mientras que la estadstica Q se basa en la varianza residual de cada uno
muestra, la estadstica de T 2 se refiere a la varianza modelada en cada
Muestra dentro del modelo. Para una muestra i T2 del Hotteling es
determinado por:
T2i
t i K _ 1 t Ti

donde K (A, A) es una matriz diagonal que contiene los valores propios
asociado con la A variables latentes del modelo PLS-DA.
Para las decisiones objetivas en la deteccin de valores atpicos,
residuos Q y T 2 estadstica pueden estimarse en una cierta probabilidad
nivel. Detalles de la determinacin de estos umbrales
para T 2 y Q residuales pueden obtenerse en la obra de Borin
y Poppi (2004).
_ Los errores en los valores de la clase estimados (y): muestras de la formacin
conjunto que presenta altos errores en los valores de clase fueron identificados por
prueba t de Student para los residuos descritos en la ASTM E1655-
05 [28], teniendo en cuenta la correccin de sesgo sugerido por da
Silva, Talhavini, Zacca, Maldaner, et al. (2014), como sigue:
t de Student; I e i _ sesgo
sesgo RMSEC
Ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
1_hi
pD7
donde e i, y h i son el error en el valor de clase estimado (^ y i _ y i)
para la muestra i, RMSEC sesgo es el error cuadrtico medio estimado
Utilizando las muestras de calibracin / entrenamiento despus de la correccin de
sesgo,
sesgo es el sesgo observado para la clase 1 (class1 sesgo) o 0
(Clase sesgo 0), dependiendo de la muestra considerada, y h i es el
Muestra de apalancamiento estimado como:
hI
XA
un 1
t2i
; un
tT
un t una
D8
Basndose en estos tres criterios, los valores atpicos en las muestras de entrenamiento
se identificaron en dos etapas:
1) Si el espectro de la muestra present del Hotelling T2 y Q
valor residual por encima de los lmites del 99,9%, el espectro
Identificado como un valor atpico y retirado de la formacin
Conjunto de datos;
2) O si un espectro muestral presentaba un alto error para la estimacin
valor de la clase, de acuerdo con la prueba de Residuos
correccin de sesgo definida por la ecuacin (7) por encima del valor crtico de
la distribucin t -Estudiante con 99,9% de confianza y n c -A-
2 grados de libertad, sino que tambin fue identificado como un valor atpico.
el primer criterio se aplic de la misma manera para la validacin
muestras. Por otro lado, la prueba t de Student de residuos
Fue adaptada para establecer el lmite superior para las estimaciones de la
Clase 1 y el lmite inferior para las estimaciones de la clase 0 segn
Las ecuaciones (9) y (10):

donde _ h c es el apalancamiento media observada en las muestras de entrenamiento,


Class0 sesgos y prejuicios de clase 1 son el sesgo estimado para las clases 1 o 0
descrito por da Silva, Talhavini, Zacca, Trindade, et al. (2014),
respectivamente, t 99.9, es la referencia t-valor de la t de distribucin -Estudiante
con 99,9% de confianza y n c-VL-2 grados de libertad.

Las muestras del conjunto de validacin se consideraron


y si el valor estimado de clase era ms grande que y superior, clase 1 o
menor que y menor, clase 0. Segn el segundo criterio, la validacin de
muestras identificadas como valores atpicos sern las muestras
valores de clase significativamente ms altos que los valores de clase estimados
observado en las muestras de entrenamiento para la clase 1 o significativamente
inferior a los valores de clase estimados observados en las
Muestras para la clase 0, teniendo en cuenta la confianza del 99,9%

La identificacin y exclusin de los valores atpicos se


da en dos pasos. Inicialmente, se construy un primer modelo y se
Excluidos del conjunto de formacin. Luego se calcul el modelo
Con las muestras restantes y una nueva identificacin de los valores atpicos
Se realiz. Como el segundo modelo presentaba nuevos
fueron excluidos usando los mismos criterios, y el modelo fue recalculado
de nuevo. El tercer modelo se consider optimizado.

2.3.3. Validacin
La validacin del mtodo se realiz con dos mtodos independientes
conjuntos de datos que no se utilizaron en la etapa de entrenamiento,
el primero estaba compuesto de muestras autnticas y el segundo
Una de las muestras falsificadas. Inicialmente, el residuo Q, T 2 y el valor
el valor de la clase estimado (^ y) de una muestra i se comparan con
los respectivos valores umbral de cada parmetro, con un 99,9% de
confianza. Si el valor estimado para Q residual, T2 estaban por encima
los valores de umbral o el valor de la clase (^ y i) estaba fuera de los lmites
definido por las ecuaciones (9) y (10), la muestra i fue o bien no llama
compatible con las muestras / marcas incluidas en la etapa de entrenamiento
o no pertenecientes a las marcas incluidas en la discriminacin
modelo (clases modeladas o clases predefinidas). En un verdadero
Anlisis forense, se podra concluir que esta muestra debera
ser analizada de nuevo para confirmar su estado o analizados por la referencia
con el fin de presentar los resultados de dos estudios independientes
de anlisis y un slido resultado a presentar ante el tribunal. De lo contrario, si los
valores de Q, T 2 estaban por debajo de los umbrales y ^ y i estaba dentro del
lmites para los valores de clase, el resultado del modelo de discriminacin
indic que la muestra perteneca a una de las muestras.
Y el resultado se registra y se incluye en el clculo
de las cifras de mrito para demostrar la eficacia de la propuesta
mtodo, basado en la obra de Trullols, Ruisnchez, y Rius
(2004) y Botelho et al. (2015). Higo. 1S en el
material de muestra el esquema de anlisis adoptados para el anlisis de
Las muestras de validacin.
Las cifras de mrito utilizadas para la validacin de mtodos Fueron estimados
segn las siguientes ecuaciones (Botelho et al., 2015)
Donde FP y FN son el nmero de muestras clasificadas respectivamente
Como falsos positivos y negativos; TP y TN son el nmero de muestras
Clasificados respectivamente como verdaderos positivos y negativos verdaderos; FPR
es el
Tasa de falsos negativos, FPR es la tasa de falsos positivos, STR es la sensibilidad
Tasa, SPR es la tasa de especificidad y EFR la tasa de eficiencia.

Es importante sealar que el resultado esperado para el anlisis


de muestras de whisky falsificados es obtener Q residual, T 2 y clase valores (^ y i)
fuera de sus lmites con 99,9% de confianza, porque
No seran compatibles con las marcas predefinidas utilizadas
En el paso de entrenamiento. Adems, para el conjunto de datos compuesto por
las muestras falsas, no hay verdaderos positivos (muestras que pertenecen
A la clase discriminada) o negativos verdaderos (muestras que pertenecen
A las otras clases modeladas). Por lo tanto, en este caso slo
falsos positivos, lo que indica que una falsificacin
La muestra fue identificada como perteneciente a la
clase. Como consecuencia, las cifras de mrito descritas por las ecuaciones
(11) - (15) no se puede aplicar. Por consiguiente, la eficiencia
Mtodo se midi en trminos de tasa de clasificacin correcta
(CCR), calculado como

Donde N es el nmero total de muestras del conjunto de datos compuesto de


Slo las muestras falsificadas.
Finalmente, todas las muestras se analizaron por triplicado, de manera que una
clasificacin errnea
El resultado se consider slo si al menos dos repeticiones
de una misma muestra se clasificaron incorrectamente.

3. Resultados
Higo. La figura 1 muestra que hay diferencias en la intensidad entre el
Los espectros de absorbancia de las marcas de whisky, donde Black Label
En Negro) muestra la mayor intensidad y la Natu Nobilis
(Identificado en cian) muestra la menor intensidad. La absorbancia en
La regin UV puede explicarse por la presencia de congneres
Resultado del proceso de maduracin en barricas de roble, la
De compuestos fenlicos voltiles de la quema de turba en el secado
Paso de cebada malteada, as como presencia de caramelo para ajustar
el color de la bebida (Cantarelli et al, 2015;. Mackenzie y Aylott,
2004). Por lo tanto, a partir de la Fig. 1 se concluye que estos factores conducen
A una relacin entre el tiempo de envejecimiento y el contenido de congneres.
Boscolo, Andrade-Sobrinho, Lima-Neto, Franco y Ferreira
De absorcin (2002) UV-vis asociado en la regin cerca de 210 nm
Y 282 nm con la presencia de furfural e hidroximetilfurfural
En bebidas maduras en barricas de roble. Segn ellos, el furfural
Se extrae del barril de roble y hidroximetilfurfural
Es el componente principal del caramelo, siendo este ltimo responsable
Para aproximadamente el 60% de la absorbancia a 282 nm.

Higo. 1 tambin muestra que una diferencia significativa en la absorcin


Espectros se pueden observar en aproximadamente 205 nm, donde un claro
Separacin entre los espectros de marcas con 12 aos de envejecimiento
(Black Label, Old Parr y Chivas Regal) de los que presentan
8 aos o menos (Red Label, Ballantine's Finest, Caballo Blanco y
Natu Nobilis), donde las marcas de 12 aos de edad presentan mayores
Valores de absorbancia. Sin embargo, incluso con esta informacin cualitativa
De los espectros UV, todava no es posible determinar la
Identidad marcas de whisky de forma segura slo por el anlisis visual del espectro,
Lo que justifica un anlisis de datos multivariante. De hecho, la aplicacin
Del anlisis multivariado (es decir, PLS-DA) es bien conocido por ser
Capaz de detectar patrones relacionados tanto con las intensidades como con la forma
De datos espectroscpicos, incluso si estos pequeos cambios no son visibles para
Percepcin humana.
Los mtodos de pre-procesamiento utilizados para el anlisis de datos fueron
Centrado y derivado primero, este ltimo basado en el Savitsky-
Golay utilizando un filtro con 9 puntos y un segundo orden
Ventana polinomial

Los parmetros de los modelos de discriminacin se muestran en


Tabla S2. Se puede observar que el RMSEC y el RMSECV presentes
Valores similares en todas las clases, lo que indica que no hubo
En los modelos. Adems, los valores umbral estaban cerca
Al valor ideal de 0,5, excepto para el modelo Old Parr, que indica
Que no se observaron errores sistemticos significativos en la Valores de clase
estimados para la mayora de los modelos. Sin embargo, debido a la
Buena discriminacin observada entre las marcas (vase ms adelante), la
Desviacin del valor umbral observado para la discriminacin de los
La marca Old Parr no afect los resultados.

3.1. Validacin del mtodo mediante el anlisis de muestras autnticas


Higo. 2 A muestra la grfica de Hotelling T 2 frente a los residuos Q
Para el modelo de discriminacin de la marca Red Label. Dado que el anlisis
Los datos estn en la escala de la absorbancia, que es un parmetro adimensional,
los T 2 y Q residuos tambin son sin dimensiones, por lo que son Presentados en las
figuras en unidades arbitrarias. Muestra que la mayor
Las muestras autnticas pertenecientes a marcas no incluidas
presentan valores de paso de la formacin T 2 y Q por encima del lmite de confianza
Del 99,9%. Este resultado sugiere que el modelo es capaz de identificar
Cuando una muestra autntica de whisky de marcas no
Incluido en el modelo no es compatible con ninguna de las marcas
Incluidos en el conjunto de formacin (marcas objetivo). Esto hace posible
Para detectar cuando una botella de whisky de alto valor ha sido adulterada
Sustitucin total o parcial de su contenido por una
Valor del whisky. Este comportamiento se observ en cualquier otra discriminacin de
marca
Modelos.
La Fig. 2 B muestra un zoom del grfico presentado en la Fig. 2 A. Se
Puede observarse que slo dos repeticiones de la Etiqueta Negra
marca super los lmites de confianza del 99,9% para ambos T2 y residuos
Q. Sin embargo, como estas rplicas procedan de diferentes muestras,
Este resultado no caracteriza un error de clasificacin. De manera similar,
Tambin se ha observado que algunas rplicas de diferentes muestras
de las marcas no se incluye en el paso de la formacin tambin presenta T2, Q
Residuos o ambos por debajo de los lmites de confianza del 99,9%. Sin embargo, como
otros menos dos repeticiones de estas muestras presentaron T 2 y valores Q
Por encima de los lmites, fueron correctamente identificados como
Clases / marcas no modificadas. Es importante notar que el nmero
De los valores atpicos identificados en el paso de formacin fue muy bajo para todos
Modelos. El modelo que presenta el mayor nmero de espectros excluidos
(Outliers) fue para la marca Old Parr (6 espectros de 270 de formacin
espectros), tal como se presenta en la Tabla S2. La ocurrencia de estos
Los outliers pueden explicarse por las variaciones entre los lotes / lotes
De estas marcas. Higo. 2 C muestra los valores de la clase estimados de la
discriminacin
Entre muestras autnticas de la etiqueta roja de la
Muestras autnticas de las otras marcas. En este modelo, un valor de clase
Alrededor de 1 se espera para muestras pertenecientes a la marca Red Label,
Alrededor de 0 para todas las dems marcas incluidas en el conjunto de
Marcas) y fuera de los lmites para los valores de clase estimados
Para las muestras autnticas pertenecientes a las marcas no incluidas
En el conjunto de entrenamiento. Este grfico muestra una buena separacin entre
Las clases modeladas (marcas objetivo). Todas las muestras de la etiqueta roja
Correctamente clasificados (valores de clase cercanos a 1) y que
Muestras restantes de las marcas modeladas se identificaron como
Marcas (valor de clase cercano a cero). Se realiza una excepcin para una repeticin
De Black Label que exceda el umbral de discriminacin,
Que no configura un error de clasificacin como se discuti anteriormente.
Adems, se puede observar que algunas muestras pertenecientes a
Las clases no moduladas presentaron valores de clase significativamente
1 o inferior a cero. Para este modelo los lmites para las estimaciones de clase
fueron 1,35 y 0,55 _ para las clases 1 y 0, respectivamente. Por lo tanto,
10 espectros se pueden excluir por los lmites definidos por las ecuaciones. (9)
y (10). Como resultado de la combinacin de las estimaciones presentadas
en la Fig. 2 A-C, el modelo mostr sensibilidad, especificidad y eficiencia
tasas de 100%, como se muestra en la Tabla 2. Es importante observar
Que tres muestras de entrenamiento de Red Label exhibieron valores de clase
relativamente
Mayor que el comportamiento de la mayora de los dems
Muestras de esta marca (replicar nmeros entre 37 y 47).
Este comportamiento se atribuy a diferencias en el origen de la muestra y
Procesos de produccin de whisky.

Cabe sealar que, normalmente, cuando se identifica una muestra


Significa que, como resultado de una evaluacin experimental o
Error instrumental, debe ser eliminado del conjunto de datos. En el
Presente trabajo, esto ocurre slo cuando un espectro de la formacin Conjunto de
validacin compuesto por las muestras autnticas de la
marcas modelados presentes T 2 y Q residual o errores en los valores de la clase
Por encima de los lmites con un 99,9% de confianza. Como se discuti anteriormente,
El modelo de discriminacin que present la mayor incidencia de
Outliers fue para la marca Old Parr, para la cual 6 fuera 270 (2.2%)
Los espectros de entrenamiento fueron considerados como valores atpicos. Para el
anlisis de
Las muestras autnticas de las once marcas no incluidas en
El conjunto de formacin (y las muestras falsificadas que se analizan ms abajo) no
El espectro se elimin del anlisis. En este caso, el T2, Q
Residuos o errores en los valores de la clase por encima de los lmites
Muestras indican correctamente que no pertenecen a ninguna de las
Siete marcas objetivo (clases modeladas).
Los resultados de los valores de clase estimados para todos los
marcas se presentan en la Fig. S2, que indican una muy buena discriminacin.
Las cifras calculadas de mrito para estos modelos se muestran
en la Tabla 2. El mtodo present excelentes resultados para la discriminacin
Entre muestras autnticas de whisky, con la menor eficiencia
Tasa de 98,6%.

3.2. Anlisis de muestras falsificadas


La Fig. 3 A muestra la influencia (T 2) frente a grficos de residuos Q de
Falsificacin de muestras predicho por la Red Label discriminacin
modelo. Como era de esperar, la mayora de las muestras falsificadas
mostr T 2 y valores Q residuales por encima de los lmites de confianza del 99,9%.
Higo. 3 B muestra un zoom de la grfica por debajo del lmite de confianza,
Donde se puede ver que slo 6 muestras falsas (22 espectros) mostraron
T 2 y Q residual valores compatibles con las muestras autnticas
valores. Sin embargo, entre estas 6 muestras, slo una muestra
Valores de clase estimados compatibles con los observados
en las muestras de entrenamiento (dentro de los lmites definidos por las ecuaciones. (9)
y
(10)). Por lo tanto, slo se observ un falso positivo y
Tasa de clasificacin fue igual al 98,6% en la discriminacin
Modelo desarrollado para identificar la marca Red Label. Este comportamiento
Se observ en los modelos de todas las dems marcas. Higo. S3 (presentada
en la informacin complementaria) muestra la expansin de T 2 frente
Q residuos de grficos en la regin de los valores por debajo del lmite 99,9%
Para los otros modelos.

Sobre la base de la Fig. 3 C se puede observar que la mayora de las muestras presente
Valores de clase mucho mayores que 1 o menores que 0, han estado fuera de los lmites
De las ecuaciones (9) y (10), indicando que estas muestras provienen de una
Diferente de las utilizadas en la etapa de entrenamiento. Desde el
219 espectros de las muestras falsificadas 127 estn fuera de los lmites
Establecido por las ecuaciones (9) y (10). Este comportamiento fue tambin
observado en todos los dems modelos (Fig. S4). Combinando los resultados de
T 2, los residuos Q y los valores de la clase se puede concluir que la
El modelo de etiqueta roja mostr una buena discriminacin entre Y muestras
autnticas, ya que desde un conjunto que contiene 73 falsificaciones
Slo haba un falso positivo. Las cifras calculadas
de mrito se presentan en la Tabla 3. Se puede ver que la
Mtodo fue capaz de realizar una buena discriminacin entre
Muestras de whisky autnticas y falsificadas, con una clasificacin correcta
Tasa que vara de 93.1 a 100%. Es importante sealar que la
resultados presentados en la Tabla 3 consideran el anlisis de la 73 falsificado
Muestras en cada uno de los modelos de discriminacin desarrollados
Para las siete marcas objetivo. Por lo tanto, considerando todos estos
modelos, 511 predicciones (73 muestras falsificados _ 6 modelos)
Se realizaron con slo 8 errores falsos positivos, dado un promedio
Tasa de discriminacin correcta del 98,4%.

El resultado del anlisis de las muestras autnticas pertenecientes a


Las clases no modificadas y las muestras falsificadas demostraron Los modelos PLS-
DA fueron eficientes incluso con muestras de marcas no
Pertenecientes a cualquiera de las clases predefinidas (marcas
El conjunto de entrenamiento). Recientemente, Oliveri y Downey (2012) y
Rodionova, Titova, y Pomerantsev (2016) discute que discriminante
Modelos, como PLS-DA, pueden presentar serios problemas de anlisis
De muestras futuras no incluidas en las clases predefinidas y argumentan
Que estos modelos deberan utilizarse slo cuando todas las clases que
A la clase 0 estn disponibles para ser incluidos en el modelo PLS-DA.
Sin embargo, en estos documentos (Oliveri y Downey, 2012; Rodionova
et al., 2016) la T 2, los residuos Q y los lmites de los valores de clase
No se consideraron para la identificacin de muestras incompatibles
Con las clases incluidas formacin conjunto.

Los resultados obtenidos


Trabajo demostr que al menos en algunas situaciones el uso de
Parmetros en el PLS-DA puede reducir significativamente la limitacin descrito por
Oliveri y Downey (2012) y Rodionova et al.
(2016).

4. Conclusin
La tcnica de espectroscopa UV-Vis combinada con PLS-DA
Demostrado ser un mtodo eficaz para la discriminacin entre los
Siete marcas de whisky. Se adquirieron espectros que slo requeran
Pequeo volumen y sin preparacin de la muestra. La discriminacin propuesta
Modelos fueron prometedores, mostrando un pequeo nmero de valores atpicos
En las marcas predefinidas / modeladas y no ocurrencia de overfitting.
Aunque las publicaciones anteriores en la literatura
Abord la aplicacin de espectroscopia y mtodos quimiomtricos
Para el anlisis de whisky, el mtodo presentado en este trabajo
Ha sido debidamente validado. Se ha utilizado un conjunto de datos representativo.
Se compuso de muestras autnticas y falsificadas de la
siete marcas predefinidas y tambin de muestras autnticas de once
diferentes marcas, lo que resulta en una alta eficiencia global (_ 93,1%).
Por lo tanto, los resultados sugieren que el mtodo
utilizado para certificar el contenido de las botellas de whisky de los siete objetivos
de marcas. Es importante sealar que el rango de aplicacin de
El mtodo puede ampliarse mediante la inclusin de nuevas marcas
(aparte de los siete originales) en la etapa de formacin.

La clasificacin de muestras autnticas con el modelo


marcas mostraron muy buenos resultados, en los que slo 2 falsos positivos
Se produjeron muestras de clasificacin errnea. Uno de ellos para Ballantine's
y el otro para Old Parr (tasa de eficiencia _ 98.6). Otro importante
aspecto fue la validacin con muestras autnticas de once
marcas no incluidas en las clases predefinidas. En este caso los modelos
Fueron capaces de identificar todas las muestras como no pertenecientes a las marcas
incluidas en las muestras de entrenamiento. El mtodo demostr tambin ser
eficaz para el anlisis de diferentes tipos de muestras falsificadas
Con altas tasas de clasificacin correctas (93-100% dependiendo de la
marca). En general, slo 8 falsos resultados positivos se observaron entre
todos los modelos.
Para obtener resultados de identificacin correctos con PLS-DA
marcas no incluidas en las clases predefinidas y muestras falsificadas
Es necesario observar no slo el valor umbral para la clase
delimitacin, pero todos los resultados de la T2, los residuos Q y lmites para
Estimaciones de los nmeros de clase.

Вам также может понравиться