Академический Документы
Профессиональный Документы
Культура Документы
GESTIN DE LA PRODUCCIN
PROYECTO DE TESIS I
Informe de Paper
2017 2
Propsito del Paper
Antecedentes
J.Han and M. Kamber, Data Mining: Concepts and Techniques (2 nd ed.). Morgan Kaufmann, 2006.
Ngai, E. W. T., Xiu, L., & Chau, D. C. K., Application of data mining techniques in customer relationship management:
A literature review and classification, Expert Systems with Applications, 2009 , 2, 2592 2602.
Los estudiosos se han dedicado desde hace tiempo a la aplicacin de los datos
minera en el campo del CRM. Basndose en y, las cuatro dimensiones CRM
son:
multiple category data in e-commerce using a soft-clustering approach Electronic Commerce Research and
Applications, Volume10, Issue 3, MayJune 2011, Pages 331-341.
Kim, Y. H., & Moon, B. R., Multicampaign assignment problem. IEEE Transactions on Knowledge and Data
Engineering, 2006,18, 405414.
HyeaKyeong Kim, Jae Kyeong Kim, Qiu Yi Chen A product network analysis for extending the market basket
analysis, Expert Systems with Applications, Volume 39, Issue 8, 15 June 2012, Pages 7403-7410Garca, V., Snchez, J. S.,
&Mollineda, R. A., On the effectiveness of preprocessing methods when dealing with different levels of class imbalance,
Knowledge-Based Systems, 2012,1, 1321.
Russell, Stuart; Norvig, Peter Artificial Intelligence:A Modern Approach (2nd ed.). Prentice Hall. 2003.
Hallazgos y Propuestas
B. Reduccin Nominal
Dnde
C.Seleccin de funciones
Dnde
pertenece a la clase Ci
D. Clasificacin
J48: El clasificador J48 utiliza C4.5 de Quinlan, que es una extensin del
algoritmo ID3 anterior de Quinlan. Esogenera un rbol de decisin que puede ser
utilizado para la clasificacin. J48genera rboles de decisin a partir de un
conjunto de datos deel concepto de ganancia de informacin y entropa. Cada
atributo delos datos se pueden utilizar para tomar una decisin dividiendo los
datosen subconjuntos ms pequeos. El atributo con la informacin ms
altaganancia se utiliza para tomar una decisin. Entonces el algoritmo se repite
en los subconjuntos ms pequeos. El procedimiento de divisin se detiene si
todoslas instancias de un subconjunto pertenecen a la misma clase.
1) NaveBayes: El clasificador NaveBayes se basa enTeorema de Bayes. El
teorema de Bayes trata una forma de calcular elprobabilidad posterior. Se supone
que el efecto del valor deun predictor de una clase dada es independiente de los
valores deotros predictores.
3) KNN: Los clasificadores del vecino ms cercano comparan dada una tupla de
prueba con tuplas de entrenamiento que son similares a ella. Las tuplas de
entrenamiento son descritas por 100 atributos. La semejanza esdefinido
utilizando la distancia euclidiana.
E. 10 Validacin Cruzada
Apreciacin Crtica
En este paper se puede observar que el autor trata de comparar los distintos
modelos de agrupacin de existe, en este caso 4 de ellos, para ver cual tiene
un mejor desempeo para el caso de datos extremos y desequilibrados.