Академический Документы
Профессиональный Документы
Культура Документы
CHIMBORAZO
FACULTAD DE INGENIERIA
BASE DE DATOS
QUINTO SEMESTRE
TEMA:MINERIA DE DATOS CON WEKA
DOCENTE
ING. DIEGO PALACIOS
INTEGRANTES:
JAYRON SILVA
FERNANDO BASANTES
2. INTRODUCCIN
Teniendo en cuenta el gran avance de herramientas que ayudan a
analizar grandes base de datos, las entidades educativas y
empresariales han
buscado maneras de explotar al mximo la
informacin existente en sus sistemas de informacin, esto basndose
en tcnicas y software especializados que permiten interpretacin fcil y
real de los resultados.
Es as como para dar apoyo en la toma de decisiones a niveles
administrativos o gerenciales, se crean metodologas especializadas y
tcnicas de extraccin adecuada de la informacin, haciendo que el
usuario final pueda ver los resultados en un solo clic o con pocos pasos.
Weka es una herramienta ya mencionada hecho en Java para realizar
Data Mining (Minera de Datos). Data Mining es el proceso mediante el
cual se explora grandes volmenes de datos en busca de patrones
interesantes para el usuario del conocimiento.
3. OBJETICOS
3.1. GENERAL
Investigar sobre la minera de datos con WEKA
3.2. ESPECIFICOS
Instalar WEKA
Copiar en el directorio de instalacin de weka el
archivo databaseUtils.props
Aplicar minera de datos a travs del rbol de
decisiones
4. DESARROLLO
Qu es y para qu sirve laminera de datos?
La minera de datos (Data Mining en ingls) es un rea
relativamente nueva y prometedora, se puede definir como el
proceso de descubrir la informacin procesable de conjuntos
enormes de datos, encontrando patrones y tendencias; puede
hacer uso de estadstica, Aprendizaje Automtico (machine
learning), Inteligencia Artificial y tcnicas de visualizacin de
datos.
Funcionalidad
La minera de datos hace uso de programas de bsqueda para
detectar desviaciones, tendencias y patrones ocultos en los datos
histricos.
Los mineros son programados pensados y creados por el usuario,
en los que se emplean tcnicas deferentes para la explotacin de
los datos, tales como clsters, asociaciones, clasificacin,
visualizacin, redes neurales, algoritmos genticos, deteccin de
desviaciones, entre otros. Todos ellos requieren de base de datos
de tamao considerable para que puedan ser eficientes.
La funcin de los programas mineros es correlacionar los criterios
de seleccin y bsqueda con los datos histricos; si encuentran
algo interesante lo presentan al usuario como un hallazgo.
La funcionalidad de minera de datos:
b) Descriptiva:
i. Agrupamiento (clustering): clasificar individuos en grupos en
base a sus caractersticas. Por ejemplo, clasificar pacientes del
hospital en base a los datos de sus analticas.
ii. Reglas de asociacin: conocer cmo se relacionan los datos
o campos. Por ejemplo conocer en el hipermercado que un
cliente que compra leche muy probablemente comprar
tambin pan.
iii. Secuenciacin: intentar predecir el valor de una variable en
funcin del tiempo. Por ejemplo la demanda de energa
elctrica.
Campos de aplicacin
Metodologa
rbol de decisiones
El rbol de decisin es un diagrama que representan en forma
secuencial condiciones y acciones; muestra qu condiciones se
consideran en primer lugar, en segundo lugar y as sucesivamente.
Este mtodo permite mostrar la relacin que existe entre cada
condicin y el grupo de acciones permisibles asociado con ella.
1.
http://www.cs.waikato.ac.nz/ml/weka/
2. Una vez descargado el instalador para nuestro sistema operativo
respectivo ahora debemos asegurarnos de tener instalado tanto en
centos como en Windows el paquete jdk, mquina virtual java.
3. En centos deberemos dar permisos de ejecucin con el comando
chmod y despus solo bastara con ejecutar el archivo con extensin
.jar
4. En Windows una vez descargado el instalador lo ejecutamos, y se nos
abrir una ventana como la siguiente, daremos a next.
7. Y a instalar.
10
2. Configuraciones
2.1. En el archivo DatabaseUtils tendremos que modificar la siguiente
lnea el cual ira el nombre de la base de datos que vamos a utilizar.
2.2.
12
14
Al dar ok
15
16
18
20
casos que el algoritmo predijo, mientras que cada fila representa los
casos en una clase real.
Para hacer un debido anlisis de esta matriz debemos fijarnos en la
diagonal de aciertos, el cual es la diagonal principal de una matriz.
Podemos observar que la clasificacin de las instancias de es
22
23
5. CONCLUSIONES
En esta prctica hemos podido demostrar que la instalacin
de Weka de muy sencilla tanto en sus dos plataformas.
6. RECOMENDACIONES
En caso de no funcionar el driver para la conexin con
postgreSQL, lo que debemos hacer es a cerrar todas las
ventanas de Weka e iniciar de nuevo.
7. BIBLIOGRAFIA
24
https://msdn.microsoft.com/eses/library/bb510516%28v=sql.120%29.aspx
https://silvercorp.wordpress.com/2013/04/24/mineria-de-datosque-es-y-para-que-sirve/
http://www.aprenderaprogramar.com/index.php?
option=com_content&id=252:mineria-de-datos-data-mining-iquees-ipara-que-sirve-1o-parte-dv00105a&Itemid=164
http://www.monografias.com/trabajos14/basededatos/basededatos
.shtml#ixzz41DVHPGq6
25