Вы находитесь на странице: 1из 8

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/307923821

Desde los Datos hasta el Valor: Procesos de Agregación de Información


basados en el Concepto de Mayoría

Article · September 2016

CITATIONS READS

0 104

3 authors:

Jose Ignacio Peláez Casado Ana Maria


University of Malaga University of Malaga
119 PUBLICATIONS   577 CITATIONS    25 PUBLICATIONS   35 CITATIONS   

SEE PROFILE SEE PROFILE

Estela del Rocio Yanez

9 PUBLICATIONS   1 CITATION   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

I am work in Soft-computing View project

Expert Systems in EKG View project

All content following this page was uploaded by Jose Ignacio Peláez on 08 September 2016.

The user has requested enhancement of the downloaded file.


Desde los Datos hasta el Valor: Procesos de Agregación de
Información basados en el Concepto de Mayoría
J.I. PELÁEZ
Dpto. Lenguajes y Ciencias de la Computación
Universidad de Málaga. España.
Investigador Proyecto Prometeo. Ecuador
jipeláez@uma.es

A.M. CASADO
Departamento de Economía y Finanzas
Universidad de Málaga
Málaga, España
acasado@uma.es

E.R. YANEZ
Grupo de Investigación SIBI
Universidad de Guayaquil
Guayaquil, Ecuador
Estela.yanezb@ug.edu.ec

RESUMEN este problema fueron propuestos los


denominados operadores de mayoría, que
Las transformaciones tecnológicas y de tratan de obtener valores representativos de
información que está experimentando la mayoría representando también a las
nuestra sociedad en la última década, está minorías. En este trabajo se realiza una
provocando un crecimiento exponencial de revisión de los principales operadores de
la información, no solamente para las agregación de mayoría, y su aplicación a
empresas u organizaciones, sino también diferentes tipos de problemas.
para todos los ciudadanos. Pero operar en el
entorno de mayor capacidad de generación Palabras Clave. Operadores de Agregación de
de datos de la historia conlleva la adaptación Mayoría, Toma de Decisión Multicriterio,
de herramientas y procesos. Así por ejemplo, Operadores OWA.
hay que abordar problemas de compresión y
disponibilidad de información, recuperación 1. INTRODUCCIÓN
de datos faltantes en las BBDD, tratamiento
de imágenes, o minería de datos para los Las transformaciones tecnológicas y de
procesos de toma de decisión. Entre todos información que está experimentando la
estos problemas destacan aquellos que tratan sociedad, especialmente en la última década,
de obtener información, dentro de este está produciendo un crecimiento
volumen de datos, para poder tomar las exponencial de los datos en todos los
mejores decisiones. Los procesos de toma de ámbitos de la sociedad [14]. Sirva de
decisión constan de dos pasos: un primer ejemplo los volúmenes de datos que
paso de agregación de la información, que recientes estudios han mostrado de las
trata de sintetizar un valor que represente al principales redes sociales en el año 2014:
conjunto de datos; y un proceso de Facebook: el número de usuarios activos por
explotación. Para resolver el problema de día es de 699 millones; el número total de
agregación de datos se utilizan operadores páginas en Facebook es de 50 millones; el
como la media aritmética, pero todos estos número promedio de fotos que se publican
operadores no obtienen resultados que en Facebook por día es de 350 millones.
representen a la mayoría. Para dar solución a Twitter: el número mensual de usuarios

ISSN: 1690-8627 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 7


activos en esta red es de 215 millones; el uso de operadores de agregación que actúan
número promedio de tweets enviados al día entre el mínimo y el máximo a través de
es de 500 millones. YouTube: el número operadores de medias [1, 2, 4, 17, 16, 18,
total de videos que se han subido a YouTube 19]. Pero estos operadores no obtienen
es superior a 4 billones, 300 horas de video valores que sean representativos de las
por minuto. LinkedIn: el número total de mayoría de los datos a agregar [6, 7, 8, 12],
usuarios de LinkedIn es de más de 238 ya que en la mayoría de los casos presentan
millones; cada segundo se unen dos usuarios los denominados problemas de reparto [8, 9,
nuevos a LinkedIn. Instagram: el número 11], beneficiando los datos minoritarios en
promedio de fotos que se suben a esta red por contra de los mayoritarios. Para dar solución
día es de 55 millones; el número total de a estos problemas, se presentaron los
fotos subidas a Instagram es de más de 16 operadores y modelos de mayoría [5, 6, 9].
billones. De manera que los volúmenes de
información han pasado de manejarse en El objetivo de este trabajo es mostrar los
poco tiempo de Gigabytes a Zettabyte. principales operadores de agregación de
mayoría y su aplicación en diferentes áreas
Los datos que se generan en los diferentes de investigación como la toma de decisión
ámbitos, como muestra la pirámide de la multicriterio, lógica fuzzy, imputación de
información (figura 1) son la mínima unidad información en BBDD, recuperación de
semántica, y se corresponden con elementos imágenes, y minería de opinión. Para ello el
primarios de información que por sí solos trabajo ha sido organizado como sigue: en la
son irrelevantes como apoyo a las tomas de segunda sección se presentan los operadores
decisiones. Para que estos datos puedan ser de mayoría como una familia de los
de utilidad en cualquier proceso de decisión, operadores OWA, mostrando los diferentes
es preciso que se conviertan en información, procesos de cálculo de los pesos de
es decir, en un conjunto de datos procesados ponderación así como su utilización con
con un significado, para ayudar a crear etiquetas lingüísticas; en la tercera sección
conocimiento. se presentan las diferentes aplicaciones; y
finalmente las conclusiones y referencias.

2. OPERADORES DE MAYORÍA

Los procesos de Mayoría son introducidos


por Peláez & Doña [7] como una nueva
forma de agregación cuyo objetivo principal
es obtener un resultado que represente el
valor/opinión de la mayoría, sin olvidar al
mismo tiempo a las minorías.
Posteriormente, trabajo como los realizados
Figura 1. Pirámide de la Información.
por Pasi & Yager [6] proponen un modelo de
mayoría para las tomas de decisión en grupo.
Los procesos de toma de decisión se
componen de dos pasos: un primer paso de
Los principales operadores de agregación de
agregación de datos para obtener
mayoría son el: el operador MA-OWA que
información, que supone el uso de uno o
utiliza la cardinalidad de los datos a agregar
varios operadores de agregación capaces de
para determinar su importancia [9]; el
proporcionar una relación de preferencia
operador LAMA-OWA que es utilizado en
colectiva; y un segundo paso de explotación
entornos lingüísticos [8]; el operador WC-
de la información, que permite transformar
OWA que es utilizado en procesos sociales
la información en conocimiento a través de
modelando los denominados grupos de
técnicas de minería de datos.
trabajo en los procesos de decisión en grupo
El proceso de agregación de ha convertido
[5]; y el operador SMA-OWA que incorpora
en la principal tarea de los procesos de toma
una variable que actúa como un
de decisión [18]. Para llevarla a cabo, tal
potenciómetro, que permite flexibilizar el
como hemos indicado anteriormente, se hace

8 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 ISSN: 1690-8627


concepto de mayoría en la agregación de etiquetas, donde i  i+1 para todo 1  i  n-
datos [3]. 1. El operador LAMA es la etiqueta pm
definida como [8]:
2.1. Operador MA-OWA
p m  LAMA p1 , 1 ,  p 2 ,  2 ,  ,  p n ,  n  
Se define el operador de pesos
ponderados de mayoría aditiva, FMA, = p1  1  p 2  2  p n  n
como [9]:
donde:
n
FMA a1 , a 2 ,, a n    w j  b j 
j 1  1
 if i=1
 d1
n
  f j b1 , b2 ,  , bn   b j  1 1  n 2
j 1 i    if i=2
 d1 1  n
1 1   n  i  2 i i  1
 
donde bj es el j-ésimo mayor valor de las 
 
 i 1 d  if i  2
an y los wj los pesos de ponderación, que  i 1 1   n  i  2
cumpliendo las condiciones de
normalización de los operadores OWA con
[18], son calculados en función de los
elementos a agregar como: 1 if i  1,n  1
 n 2 if i  1, n  2

w j  f j b1 ,, bn  
1 n 2
 2
j 1 n  j j2 j1
 
n di   n  if i  1, n  2
 h b ,, b 
k 1 n  n 2

kgj
  n  j  j  2   j  1 if i  1
 j  i 1
siendo gj una función que indica el
momento en que el elemento bj es
considerado en el proceso de agregación. y donde  es la suma de etiquetas y  es el
Este momento o paso, viene dado por el producto de una etiqueta por un real positive
número de elementos iguales a bj que defiido en [4].
existen en el intervalo [b1 , bj]; y
finalmente, hk es una función que indica 2.3. Operador WKC-OWA
el número de elementos que son
agregados en cada paso del proceso de El operador Work Committee-OWA es
definido para agregar información en
agregación:
problemas de decisión democrática, usando
el concepto de comités de trabajo. El
n
 pkj si k  1 operador es definido como [5]:
 j 1
hk b1 , b2 ,, bn   n  k 1
  pkj  1 n
FWKC a1 , a 2 ,  , a n    w j  a j 
en otro caso
 j 1
j 1

1 si b j  b j k 1 y b j  b j 1 n
   f j a1 , a 2 , , a n   a j
pkj  1 si j  1 y k  1 y b j  bk j 1
0
 en otro caso n

2.2. Operador LAMA-OWA


donde w j  0,1 y w
j 1
j  1.

wj es igual a:
Sea p1, p2,,..., pn,  P un conjunto de n
etiquetas, tal que t > 0 y sea  1 ,  2 ,..., n  FWKC a1 , a 2 ,, a n    w j  a j
N, la frecuencia o cardinalidad de las j 1

ISSN: 1690-8627 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 9


donde:

w j  f j b1 , , bn    
1
m (i)  k
max b1 ,..., bn   h j b1 ,..., bn   ik  
1   otro _ caso
hj es una función que indica el número de
elementos con cardinalidad  aj para todo δ es el factor de relevancia de la
ak {aj, ... ,an}, por ejemplo: cardinalidad factor (CRF) y 0 ≤ δ ≤ 1.
n
hk b1 , b2 ,, bn   1   Lki
i 1 3. APLICACIÓN DE LOS
donde OPERADORES DE MAYORÍA
La necesidad de obtener valores en los
1 if bi  C k with bi  bk  bi procesos
 bi 1 de agregación de datos que
Lki   represente a la mayoría, no es exclusivo de
0 otherwise los procesos de toma de decisión
k
multicriterio. Se puede encontrar en muchos
C k   pkj ámbitos de profesionales o de investigación.
j 1

A continuación se presentan algunos



1 if b j  bk   problemas donde el concepto de mayoría ha
pkj   sido utilizado con buenos resultados.

0 otro _ caso
El valor α modela el tamaño final de cada 3.1. Datos Faltantes en las BBDD
comité. Socialmente este grado es
determinado por la flexibilidad de los Los datos faltantes en las BBDD es motivo
ciudadanos para agruparse en grupos y de gran preocupación en la comunidad
reforzar sus opiniones. científica o empresarial, especialmente en el
campo de las ciencias sociales o médicas.
2.4. Operador SMA-OWA
Hacer frente a los datos faltantes suele ser un
El operador SMA-OWA es una función asunto difícil, por lo que se hace necesario
𝐹𝑆𝑀𝐴 : ℝ𝑛 × ℕ𝑁 → ℝ definida como [3]: aplicar métodos de recuperación para inferir
𝑛 datos que sean válidos.
∑ 𝑤𝑖,𝑁 𝑣𝜎(𝑗)
Una estratégica simple y común es ignorar
𝑖=1
los valores perdidos, lo que reduce el tamaño
de datos útiles, y puede introducir sesgos
donde: 𝑁 = max 𝑚𝑖 , importantes en los estudios, especialmente
1≤𝑖≤𝑛
𝜎 ∈ 𝑆𝑛 es una permutación ordenada, cuando los datos que faltan se distribuyen de
por ejemplo, tal que 𝑣𝜎(𝑖) ≥ 𝑣𝜎(𝑖+1) , y una manera no aleatoria.
los pesos son definidos por la relación de
recurrencia Otra forma es utilizar métodos para dar
respuesta a este problema como: (1) los
métodos simples de imputación, se basan en
1 1
𝑤𝑖,1 = = ; 𝑢1 = 𝑛 calcular un valor medio de la variable donde
𝑢1 𝑛 faltan los datos, o una media de clase o(1)
de
otra variable. Métodos basados en
𝛾𝑖,𝑘 + 𝑤𝑖,𝑘−1 regresiones; métodos Hot Deck; métodos del
𝑤𝑖,𝑘 = vecino más cercano; los Predictive Mean
𝑢𝑘
Matching; los Repeated Imputation; o los
𝑛 métodos basados en mayoría difusa (Fuzzy
majority imputation), los cuales están
𝑢𝑘 = 1 + ∑ 𝛾𝑗,𝑘 , 2≤𝑘≤𝑁
basados en el concepto de mayoría a través
𝑗=1

10 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 ISSN: 1690-8627


de los diferentes operadores expuestos mediante una operación de media aritmética,
anteriormente. Estos métodos han sido y en muchos casos, este cálculo no refleja de
aplicados en diferentes escenarios de manera adecuada las opiniones de todos los
recuperación de datos, obteniendo buenos usuarios.
resultados [13].

3.2. Tratamiento de Imágenes

La eliminación de ruido en imágenes


digitales es un aspecto de vital importancia,
ya que cualquier sistema de visión artificial Imagen con Ruido de
comienza con el procesamiento de los Imagen original
Poisson
valores de intensidades. Una manera de
eliminar ese ruido es mediante los
operadores lineales de convolución. Estos
operadores o filtros, eliminan el ruido en las
imágenes, calculando un nuevo valor de
intensidad para cada pixel de la imagen
mediante una convolución de los píxeles Filtro Media Filtro de Gauss
adyacentes, por ejemplo, mediante la media
aritmética.

En este tipo de problemas la aplicación del


concepto de mayoría, es decir, reemplazar
un pixel por un valor que represente a la Filtro Mediana Filtro MA-OWA
mayoría de la ventana de recuperación, a Figura 2. Imágenes de Lápices con Ruido de
través de los operadores de agregación ha Poisson y Filtros.
mostrado buenos resultados [10]. Por
ejemplo, tiene mejores resultados que la Para resolver este problema, los operadores
mediana, media o gauss, cuando es aplicado de agregación basados en el concepto de
en imágenes con ruido alto y medio, y mayoría, como por ejemplo el operador
buenos resultados con imágenes con ruido SMA-OWA [14], se han mostrado muy
bajo. La figura 2, muestra un ejemplo de adecuados tanto con sistemas de estrellas
imágenes con ruido de Poisson y diferentes como lingüísticos. Los resultados obtenidos
filtros. han resultado más precisos. Así mismo, el
proceso ha sido más dinámico y automático,
3.3. Minería de Opinión ya que los pesos se calculan cuando se
detecta una nueva votación.
En los últimos años, la adquisición de
productos los servicios a través de Internet También este tipo de operadores, aborda de
ha crecido de manera exponencial. Hoy en manera más eficiente opiniones
día, una persona pasa a través de diferentes desesperadas/extremas y el resultado refleja
sitios web en busca de mejores alternativas y mayor estabilidad que la media aritmética.
precios. En este proceso de búsqueda, él /
ella utilizan aplicaciones de medios sociales 3.4. Coalición de Criterios
para examinar las opiniones de las demás
personas que han adquirido este tipo de Finalmente, el concepto de mayoría está
servicios o productos. Entre la información trascendiendo el área de los operadores de
que ofrecen las web, está la satisfacción de agregación de datos, y se está generalizando
los compradores con dichos productos o a otras situaciones más complejas en los
servicios, la cual se hace mediante una procesos de toma de decisión multicriterio,
escala predefinida, expresada comúnmente como es el caso de la coalición de criterios
con un sistema de estrellas o etiquetas en problemas de toma de decisión [15].
lingüísticas. En la mayoría de los casos, el
sistema determina el valor de satisfacción

ISSN: 1690-8627 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 11


Modelar las interacciones entre criterios en multicriterio, minería de opinión, o en el
los procesos de toma de decisión modelado de las sinergias en las coaliciones
multicriterio es una tarea difícil. Esta de criterios.
complejidad surge cuando hay redundancias
y sinergias visibles entre criterios, que los
métodos tradicionales no pueden hacer
frente. Para dar solución a este problema,
Bernal et all en [15] proponen haciendo uso
de los procesos de mayoría y de la integral
de Choquet un método para determinar el
valor de los pesos de cada criterio.

En la figura 3, se muestra el diagrama de


flujo para el modelo propuesto para el
problema de Coalición de Criterios.

4. CONCLUSIONES

La sociedad actual junto con las


transformación tecnológicas y los
volúmenes de información que se están
generando, precisa de métodos que permitan
obtener a partir de los datos, información
que refleje el sentimiento o el sentir de la
mayoría de dichos datos.

Tradicionalmente, estos procesos de


conversión de datos en información se han
Figura 3. Diagrama de Flujo del Modelo.
llevado a cabo mediante operadores de
agregación que no reflejan un valor de la Agradecimientos. Este trabajo está
mayoría, todo lo contrario, potencian el financiado por el proyecto PROMETEO del
valor de las minorías. Este hecho es de gran Gobierno de Ecuador.
importancia, porque estamos utilizando
información que no refleja el sentir de la 5. REFERENCIAS
mayoría.
[1]. Calvo, T. & Mesiar, R. (2003).
Para dar respuesta a estos problemas, los “Aggregation operators: ordering and
cuales han sido denominados como bounds”. Fuzzy Sets and Systems,
problemas de reparto, han surgido los
procesos de mayoría, los cuales obtienen [2]. Fodor, J.C.; Marichal, J.L. & Roubens,
información que representa a la mayoría M. (1995). “Characterization of some
pero sin olvidar al mismo tiempo a las aggregation functions arising from MCDM
minorías. problems” en b. Bouchonmeunier, R. R.
Yager & L.A. Zadeh (eds.). Fuzzy logic and
Estos procesos de mayoría han sido soft computing. Series: Advances in fuzzy
modelados a través de diferentes operadores systems-Applications and theory, 4. World
o de modelos, destacando entre estos el Scientific Singapore, pp. 194-201.
operador MA-OWA, como origen del resto
de operadores o de modelos. [3] Karanik M, Peláez J.I. Bernal R, (2015
aceptado). Selective Majority Additive
Dichos operadores se han mostrado muy Ordered Weighting Averaging Operator.
adecuados en diferentes tipos de problemas, European Journal of Operational Research.
como por ejemplo en el tratamiento de [4]. Llamazares B. (2007). Choosing OWA
imágenes, recuperación de datos faltantes en operator weights in the field of Social
las BBDD, problemas de toma de decisión

12 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 ISSN: 1690-8627


Choice. Information Sciences: an [14] Peláez J.I. (2014). Bernal R. Karanik
International Journal. 177, 21, 4745-4756. M. Majority OWA Operator for opinion
ratting in social media. Soft Computing.
[5]. La Red D.L, Doña J.M, Peláez J.I,
Fernández E.B. (2011). WKC-OWA. A new [15] Bernal R, Karanik M, Peláez J.I.
neat-owa operator to aggregate information (2015) Fuzzy measure identification for
in democratic decision problems. criteria coalitions using linguistic
International Journal of Uncertainty information. Soft Computing.
fuzziness and knowledge based systems.
[16] Scott, M.J. Antonsson, E.K (1998).
[6]. Pasi G. & Yager R. (2006). Modeling “Aggregation functions for engineering
the Concept of Majority Opinion in Group design trade-offs”. Fuzzy Sets and Systems
Decision Making. Recent Advancements of
Fuzzy Sets: Theory and Practice. [17] Smolíkova, R. Wachowiak, M.P.
Information Sciences, 176, 4, 390-414. (2002). “Aggregation operators for selection
problems”. Fuzzy Sets and Systems,
[7] Peláez J.I. Doña J.M. (2001). LAMA: A
Linguistic Aggregation of Majority Additive [18] Yager R. (1998). On ordered weighted
Operator. Proceeding of the congress: averaging aggregation operators in multi-
Eurofuse. Granada. Spain. criteria decision making. IEEE Trans. On
Systems, Man and Cybernetics 18. 183-190.
[8] Peláez J.I. Doña J.M. (2003). LAMA: A
Linguistic Aggregation of Majority Additive [19] Zimmermann, H.J. (1991). Fuzzy sets
Operator. International Journal of Intelligent theory and its application. Kluwer
Systems.
Academia Publishers. Boston/ Dordrecht/
London.
[9] Peláez J.I. Doña J.M. (2003). Majority
Additive-Ordered Weighting Averaging: A
New Neat Ordered Weighting Averaging
Operators Based on the Majority Process.
International Journal of Intelligent Systems,
18, 4, 469-481.

[10] Peláez J.I. Doña J.M, Sánchez P, Mesas


A. (2005). Aplicación y uso del operador
MA-OWA en el tratamiento de imágenes.
Proceeding Conferencia Caepia.

[11] Peláez J.I. Doña J.M. (2006). A


Majority Model in Group Decision Making
Using QMA-OWA Operators. International
Journal of Intelligent Systems, 193-208.

[12] Peláez J.I. Doña J.M, Gómez-Ruiz J.A.


(2007). Analysis of OWA operators in
decision making for modelling the majority
concept. Applied mathematics and
Computation.

[13] Peláez J.I, Doña J.M, La Red D.L.


(2008) Fuzzy Imputation Method for
Database Systems. Hardbook of Research on
Fuzzy Information Processing in Databases.

ISSN: 1690-8627 SISTEMAS, CIBERNÉTICA E INFORMÁTICA VOLUMEN 13 - NÚMERO 2 - AÑO 2016 13

View publication stats

Вам также может понравиться