Академический Документы
Профессиональный Документы
Культура Документы
Marketing: analizan las bases de datos del cliente para identificar diferentes grupos de
Inversin: usa sistemas expertos, redes neuronales y algoritmos genticos para manejar
carpetas, deteccin de fraudes. HNC Falcon y Nestor PRISMA para monitorear fraudes en tarjetas
de crdito y CASSIOPEE se aplic, usando cluster para derivar familias de fallas, en tres
aerolneas grandes europeas para diagnosticar y predecir problemas en los Boing 737.
4.
Fabricacin: FAIS se utiliza para identificar transacciones financieras que podran indicar
5.
desde el stream de alarma y las presenta como reglas ofrece herramienta de poda, agrupacin y
ordenamiento.
6.
los usuarios crear su propio peridico libre y FARCAST busca informacin automticamente para
el usuario de una amplia variedad de fuentes, etc.
Tendencia popular de coleccionar y limpiar datos transaccionales para dejarlos disponibles para el
anlisis en lnea y de apoyo a la toma de decisiones. El data warehousing ayuda a establecer la
etapa para KDD de dos maneras importantes:
1.
que poseen una vista lgica unificada de una amplia variedad de datos y bases de
datos, tienen que preocuparse de mapear los datos a una convencin nica de nombres
representando y manejando datos faltantes uniformemente y, cuando sea posible,
manejando ruido y errores.
2.
Acceso a datos: Se debe crear mtodos uniformes y bien definidos para el acceso a
los datos y proveer rutas de acceso a los datos que, histricamente, son difciles de
obtener (por ejemplo, los datos almacenados fuera de lnea).
Definicin de OLAP
Es una solucin utilizada en el campo de la Inteligencia de Negocios, la cual consiste en consultas
a estructuras multidimensionales que contienen datos resumidos de grandes Bases de Datos o
Sistemas Transaccionales. Las herramientas OLAP se centran en proporcionar anlisis de datos
multidimensionales lo cual es superior a SQL en la computacin de resmenes y cortes de control
a travs de mltiples dimensiones. Las herramientas OLAP estn orientadas hacia la simplificacin
y el soporte del anlisis de datos interactivos, pero el objetivo de las herramientas KDD es
automatizar el proceso al mximo posible.
1.
relevante y la identificacin del objetivo del proceso KDD desde la perspectiva del cliente.
2.
3.
4.
5.
6.
7.
8.
pasos entre el paso 1 y 7 para iteraciones adicionales. Este paso puede tambin involucrar
la visualizacin de los patrones extrados y modelos o la visualizacin de los datos dados
los modelos extrados.
9.
2. Regresin es el aprendizaje de una funcin que mapea un tem de datos a una variable de
prediccin con valores en R.
3. Clustering es una tarea descriptiva comn donde se busca identificar un conjunto finito de
categoras o clusters para describir los datos
4. Sumarizacin involucra mtodos para encontrar una descripcin compacta para un conjunto
de datos.
nivel estructural del modelo especifica (generalmente en forma grfica) cul de las
escala numrica.
1. Representacin del Modelo es el lenguaje utilizado para describir los patrones descubribles.
2. Criterio de evaluacin del modelo son sentencias cuantitativas (o funciones de ajuste) sobre
qu tan bien, un patrn particular (un modelo y sus parmetros), satisface los objetivos del
proceso de KDD.
a)
Bsqueda de parmetro
b)
Bsqueda de modelo
1.
rboles de decisin y reglas que utilizan divisiones univariantes, tienen una simple forma de
representacin, haciendo el modelo inferido relativamente fcil de comprender para el usuario. Sin
embargo la restriccin de la representacin de un rbol particular o regla puede restringir
significativamente la forma funcional (y, as, el poder de aproximacin) del modelo. Si uno agranda
el espacio del modelo para permitir ms expresiones generales (tales como hiperplanos
multivariantes en ngulos arbitrarios), entonces el modelo es ms poderoso en su prediccin pero
puede ser mucho ms difcil de comprender. En una gran parte, ellos dependen de la probabilidad
de mtodos basados en la evaluacin de modelos, con variados grados de sofisticacin en
trminos de penalizar la complejidad del modelo.
2.
prediccin que hacen calzar combinaciones lineales y no lineales de funciones base (sigmoides,
splines, polinomios) con combinaciones de variables de entrada.
3.
Mtodos basados en ejemplos usan ejemplos representativos sacados de las bases de datos
para aproximar un modelo; esto es, las predicciones de nuevos ejemplos son derivadas de las
propiedades de ejemplos similares en aquellos modelos en donde la prediccin es conocida. Las
tcnicas incluyen clasificacin del vecino ms cercano, algoritmos de regresin y sistemas de
razonamiento. Una desventaja potencial de mtodos basados en ejemplos (comparados con los
mtodos basados en rboles) es que se requiere una mtrica de distancia bien definida para
evaluar la distancia entre puntos de datos.
4.
utilizando una estructura grfica. En su forma ms simple, el modelo especifica cules variables
son directamente proporcionales unas de otras.
5.
decisin est restringida a una lgica proposicional, el aprendizaje relacional (tambin conocido
como programacin de induccin lgica) usa el patrn de lenguaje de primer orden ms flexible.