Академический Документы
Профессиональный Документы
Культура Документы
MINERIA DE DATOS
TRABAJO DE INVESTIGACIN
La minera de datos puede definirse como el proceso de extraer
conocimiento til y comprensible, previamente desconocido, a partir de
grandes volmenes de datos. En el mbito industrial, una de las
aplicaciones ms interesantes del proceso de minera de datos es el
modelado de sistemas.
TEMA:
MINERIA DE DATOS
ASIGNATURA:
Docente:
Presentado por:
MEDINA PRADO, Yessica Patricia
Ao y seccin: Cuarto ao NB
Lima - Per
Abril, 2017
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
ndice
Resumen
Introduccin
Captulo I.
Minera de Datos
1.1 Definicin
1.2 Proceso de Descubrimiento de Conocimiento en Base de Datos
1.3 Modelos y tareas de minera de datos
1.3.1 Modelo descriptivo
1.3.2 Modelo predictivo
1.3.3 Tareas de minera de datos
1.1.1.1. Agrupamiento (Clustering)
1.1.1.2. Reglas de asociacin
1.1.1.3. Correlaciones
1.1.1.4. Clasificacin
1.1.1.5. Regresin
1.4. Tcnicas de minera de datos
1.7. Sntesis
Captulo II
Anlisis de Datos
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
2.2.2. Observatorios
CAPITULO III
4.1. Qu es GeoIDEP?
CONCLUSIONES
BIBLIOGRAFIA 1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
RESUMEN
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
INTRODUCCIN
Una realidad actual de la minera de datos es su papel como una tecnologa de apoyo
que ha venido a resolver dos grandes retos:
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Captulo I
Minera de Datos
1.1. Definicin
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Para Witten y Frank (2005), el establecimiento de patrones es una prctica til, puesto
que permite explicar algo con relacin a los datos que se tienen. De la misma
manera, autores como Vazirgiannis et al. (2003) y Geng y Hamilton (2007) consideran
que la minera de datos facilita el relevar patrones existentes en el conjunto de datos,
los cuales generan informacin vlida, novedosa, til, comprensible y explotable.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Figura 1.1 Asociacin de las diversas disciplinas relacionadas a la minera de datos. Adaptado de
Hernndez et al. (2004)
En la Figura 1.1 son claras las diferentes disciplinas que se relacionan con la minera
de datos y, por tanto, es evidente la gran cantidad de reas en donde pueden ser
aplicadas: finanzas, anlisis de mercado, procesos industriales, medicina, biologa,
qumica, telecomunicaciones, anlisis cientfico, biometra, anlisis ambiental, anlisis
hidrolgicos, entre otros.
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Tabla 1.1. Factores climatolgicos mediante los cuales se infiere si se debe o no jugar tenis.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
En esta tarea se evalan similitudes entre los datos para construir modelos
descriptivos, analizar correlaciones entre las variables o representar un conjunto de
datos en un pequeo nmero de regiones (Sumathi y Sivanandam, 2006). Berry y
Linoff (2004) y Sumathi y Sivanandam (2006) consideran al agrupamiento como la
tarea de dividir una poblacin heterognea en un nmero de subgrupos homogneos
de acuerdo a las similitudes de sus registros. Dentro de esta tarea existen dos tipos
principales de agrupamiento (Larose, 2005): el jerrquico que se caracteriza por el
desarrollo recursivo de una estructura en forma de rbol, y el particional que organiza
los registros dentro de k grupos. Los mtodos particionales tienen ventajas en
aplicaciones que involucran gran cantidad de datos para los cuales la construccin de
un rbol resulta complicada. Una caracterstica de este tipo de agrupamiento es el
establecer a priori el nmero de grupos de entrada (k), por lo que en la prctica es
necesario repetir la prueba estableciendo diferentes nmeros de grupos, eligiendo la
solucin que mejor se adapte al objetivo del problema (Jain et al., 1999). Un mtodo
sugerido por Milligan (1980, 1985) y Hair et al. (1995) para determinar el nmero de
grupos de entrada (k) es usar el resultado obtenido por algn algoritmo jerrquico,
mediante el cual se obtiene el nmero deseado de grupos, posteriormente se aplica
algn algoritmo particional.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
de una transaccin (Sumathi y Sivanandam, 2006). El inters por esta tarea se debe
principalmente a que las reglas proporcionan una forma concisa de declarar la
informacin potencialmente til (Vazirgiannis et al., 2003). Las reglas se evalan
usando dos parmetros: precisin y cobertura. La cobertura es el nmero de
instancias o datos hallados correctamente, mientras que la precisin es el porcentaje
de instancias halladas correctamente (Witten y Frank, 2004). Las ventajas ms
frecuentes en las reglas de asociacin son el descubrimiento de asociacin y de
secuencia (Hernndez et al., 2004). El descubrimiento de asociacin encuentra
relaciones que aparecen conjuntamente a un acontecimiento y la secuencia la asocia
al tiempo.
1.3.3.3 Correlaciones
Las correlaciones son una tarea descriptiva que se usan para determinar el grado de
similitud de los valores de dos variables numricas. Un mecanismo estndar para
medir la correlacin es el coeficiente de correlacin, para este caso llamado R, el cual
es un valor real comprendido entre -1 y 1. As, si R es 1 las variables estn totalmente
correlacionadas; si R es -1 las variables estn correlacionadas negativamente; y si R
es cero no existe correlacin. Por consiguiente, cuando R es positivo, las variables
tienen un comportamiento similar y cuando R es negativo una variable crece y la otra
decrece (Hernndez et al., 2004). Una manera de visualizar la posible correlacin
entre las observaciones de dos variables (X e Y), es a travs de un diagrama de
dispersin, en el cual los valores que toman estas variables son representados por
puntos. Su principal desventaja es que no puede ser usada para hacer predicciones,
puesto que no es clara la forma que toma la relacin.
1.3.3.4 Clasificacin
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
1.3.3.5 Regresin
Como se mencion en la seccin anterior, la minera de datos utiliza tareas las cuales
requieren ser resueltas a travs de tcnicas o algoritmos especficos, que de acuerdo
con Hernndez et al. (2004) son un filtro donde al introducir los datos se produce una
serie de patrones relevantes que representan el nuevo conocimiento til. Esta postura
se ilustra en la Figura 1.4.
Figura 2.4. Proceso de extraccin de patrones mediante el uso de tcnicas de minera de datos.
Fuente: Adaptado de Hernndez et al. (2004)
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Las redes neuronales artificiales son sistemas de clculo que se asemejan a las redes
neuronales biolgicas al utilizar nodos (neuronas) interconectados. Estos nodos
reciben la informacin, realizan operaciones sobre los datos y transmiten sus
resultados a otros nodos, hasta proporcionar una respuesta de activacin de los nodos
de salida. De acuerdo a su aprendizaje, las redes neuronales se dividen en
supervisadas (por ej. perceptrn multicapa) aplicables a tareas de clasificacin y
regresin; y no supervisadas (por ej. redes de Kohonen) utilizadas principalmente para
el agrupamiento y reduccin de dimensionalidad. Su principal ventaja radica en que
cuando estn bien ajustadas se obtienen precisiones muy altas. Sin embargo, estas
tcnicas requieren de cierta experiencia para la eleccin precisa de los algoritmos, las
topologas y los parmetros.
Son tcnicas comnmente usadas en la minera de datos, puesto que son fciles de
usar y admiten valores tanto numricos y discretos (nominales). Estas tcnicas son
tolerantes al ruido y a valores faltantes; aportan claridad porque permiten desplegar los
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Son tcnicas que tratan de maximizar el margen entre los grupos y las clases
formadas. Para ello, se basan en transformaciones que aumentan la dimensionalidad
de los grupos. Estas transformaciones son conocidas como ncleos (kernels). Este
tipo de tcnicas son muy eficientes y precisas por trabajar con datos de alta
dimensionalidad. Se conoce como datos de alta dimensionalidad a la presencia de un
gran nmero variables de entrada. El inconveniente al usar estas tcnicas es que a
veces es necesario elegir una buena funcin de separacin para obtener buenos
resultados. Los campos donde las mquinas de soporte vectorial (SVM) han sido
aplicadas con xito son: visin por computadora, bioinformtica, recuperacin de la
informacin, procesamiento del lenguaje natural y anlisis de series temporales
(Hernndez et al., 2004).
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
En la Tabla 1.2, se presenta una relacin de tcnicas mencionadas, las cuales ayudan
a descubrir patrones o propiedades particulares del conjunto de datos para obtener
informacin til.
Tabla 1.2. Relacin existente entre las tareas y tcnicas de minera de datos.
Como se mencion cada una de stas tcnicas est enfocada a tareas especficas y,
por tanto, su empleo en la mayora de los casos, depende del tipo de dato que se tiene
y el modelo hacia el cual est enfocado. Adems, en la Tabla 2.2 se observa que todas
las tareas pueden ser resueltas por ms de una tcnica, y que algunas tcnicas
pueden resolver ms de una tarea, como es el caso de las redes neuronales, los
rboles de decisin, las regresiones (lineal, logartmica y logstica) y los algoritmos
genticos, entre otros.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Figura 1.5. Esquema de los cuatro niveles de abstraccin de la metodologa CRISP- DM.
Fuente: Chapman et al., 2000.
Figura 1.6. Fases del proceso de minera de datos, basado en la metodologa CRISP-DM.
Fuente: Chapman et al., 2000
La secuencia de las fases no es estricta, puesto que stas pueden interactuar entre s
durante el desarrollo del proyecto. De esta manera, la siguiente fase en la secuencia, a
menudo depende de los resultados asociados con la fase precedente. Las flechas
indican las dependencias significativas entre las diferentes fases, por ejemplo, si se
est en la fase de modelacin, es posible volver a la fase de preparacin de datos
para refinar los datos, antes de seguir con la fase de evaluacin (Larose, 2005).
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
El proceso no concluye cuando se encuentra una solucin, puesto que esta solucin
puede acarrear nuevas investigaciones a explorar (Chapman et al., 2000). A
continuacin se describe cada una de las fases:
1. Anlisis del problema. En esta fase inicial se debe comprender con claridad los
objetivos y requerimientos del proyecto, con la finalidad de elaborar una buena
planeacin en el desarrollo.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
A travs de la interfaz visual de Clementine se generan rutas, esto es, mapas visuales
que representan las distintas etapas del proceso analtico de la minera de datos. Esta
secuencia se denomina ruta de datos porque los datos fluyen registro por registro
desde el origen, pasando por cada manipulacin y, finalmente, hasta llegar al destino,
que es el modelo generado o un nodo de resultados.
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
(1) es el espacio o rea de trabajo que se denomina zona de rutas, en donde cada
operacin se representa con un nodo y estos nodos son vinculados entre s para
generar una ruta que representa el flujo de datos.
(4) es la zona denominada proyectos, que se utiliza para administrar los proyectos de
minera de datos. Mediante esta opcin se permite disponer de una ubicacin central
para el almacenamiento y seguimiento de los requerimientos asociados con el
proyecto.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Los mtodos de regionalizacin han sido utilizados de manera exitosa para el anlisis
regional, por ejemplo para determinar la tendencia y frecuencia de inundaciones,
sequas y el efecto de otras variables. Entre estos mtodos cabe destacar aquellos
enfocados a la clasificacin de conjuntos de datos, para el cual existe una coleccin
variada de herramientas de informtica, como las redes neuronales artificiales (redes
de Kohonen) y la lgica difusa, que permiten formar regiones homogneas con
caractersticas similares (Hall y Minns, 1999).
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
optimiza la estructura local o global de los datos agrupados (Vazirgiannis et al., 2003).
Los mtodos particionales tienen ventajas en aplicaciones que involucran gran
cantidad de datos para los cuales la construccin de un rbol resulta complicado
(Witten y Frank, 2005). El problema de los algoritmos particionales es la decisin del
nmero deseado de grupos de salida, por lo que en la prctica es necesario repetir la
prueba considerando un nmero diferente de grupos, eligiendo la solucin que mejor
se adapte al objetivo del problema. Algunos algoritmos dentro de este tipo de
agrupamiento son: K-medias, K-medianas, K-mode, PAM (Partitioning Around
Medoids), CLARA (Clustering Large Applications) y CLARAMS (Clustering Large
Applications based on Randomized Search), entre otros.
1.7 Sntesis
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Captulo II
Anlisis de Datos
Puerto y Paz (2001) definen una serie de tiempo como todo conjunto de valores
ordenados cronolgicamente que permiten predecir y describir el comportamiento de
una o ms variables en un determinado periodo. Algunas veces estas series pueden
ser muy extensas llegando a contener billones de observaciones (Chiu et al., 2003).
En las series temporales se identifican cuatro tipos de patrones: tendencia y
variaciones estacional, accidental y cclica.
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
2.2.2 Observatorios
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
las horas muestreadas para cada da, y en el caso de la velocidad y direccin del
viento cada 15 minutos de la hora muestreada. Asimismo, la red de observatorios
captura los datos a partir de 2001 a la fecha, en bases de datos sinpticas lo que ha
permitido enviar informacin a organismos internacionales como la Organizacin
Meteorolgica Mundial (OMM). Los observatorios miden elementos (variables)
climatolgicos y meteorolgicos, los cuales se realizan por instrumentos
especializados en forma constante y a horas establecidas durante el da; por lo
general, cada 3 horas en tiempo meridiano de Greenwich, GMT.
Michoacn cuenta con dos observatorios (Figura 3.2), el de Morelia (76665) con
coordenadas 1942' Norte/10111' Oeste a una elevacin de 1913 msnm y el de
Zamora (76662) con coordenadas 1951' Norte/10219' Oeste a una elevacin de
1562 msnm (SMN, 2006). Los registros de las variables en los observatorios de
Zamora y Morelia, capturados de forma tradicional y digitalizada, se tienen a partir del
1 de enero de 1981 y terminan el 31 de julio y 31 de agosto de 2004,
respectivamente. Estos datos se complementan con la base sinptica, cuyos registros
se tienen de 2001 a la fecha.
Figura 2.1. Estaciones climatolgicas de la base de datos CLICOM para el estado de Michoacn.
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
2.3.1 CLICOM
Para realizar el anlisis preliminar del total de estaciones listadas en la base de
datos del CLICOM se consideraron aquellas estaciones con suficientes
registros, esto es, que tuvieran periodos con datos con al menos 20 aos a
partir de 1981. Esto con la finalidad de tener periodos similares a los
reportados por los observatorios. As, se analiz la frecuencia de registros
(fecha de inicio y fecha final de operacin de la estacin) para el total de 239
estaciones, de las cuales se obtuvieron 111 estaciones que cumplan el criterio
establecido (ver Anexo B).
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Los nodos en la Figura 2.3 tienen asociada una funcin especfica y se conectan a
otros nodos formando una ruta que une el flujo de datos. A continuacin se describe en
forma breve cada elemento utilizado en la elaboracin del modelo de anlisis (Figura
2.3); para informacin ampliada de la configuracin de los nodos se sugiere al lector
revisar el Anexo C.
a. Nodo Archivo Variable (1), mediante el cual se leen los datos de los archivos de
texto. En su ejecucin, si el archivo no existe o no est disponible para leerlo se
produce un mensaje de error y la ejecucin finaliza. De no producirse ningn
problema, se leen todos los registros existentes en l. El mensaje de error se puede
asociar a problemas de ubicacin en la ruta de datos o por el cambio de nombre del
archivo.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
CAPITULO IV
1
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
4.1. Qu es GeoIDEP?
En esta pgina podr encontrar una lista visores mantenidos por entidades pblicas y
privadas, que permiten la exploracin de informacin georreferenciada en web
Si bien los enfoques tradicionales de la minera de datos son los ms utilizados en los
estudios de salud, con la reevaluacin de los datos espaciales en estas reas existe
una tendencia a incorporar enfoques de la minera de datos espaciales. Por ejemplo,
la aplicacin de reglas de asociacin espacial22 para encontrar relaciones entre
determinadas variables socioeconmicas y las cuatro causas principales de muerte
por cncer (colorrectal, pulmn, mama y prstata) en los Estados Unidos permiti
conocer qu reas de salud con ndices de educacin bajo, alto desempleo y trabajos
mal pagados tenian las mayores tasas de mortalidad por esta enfermedad.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
liberado bajo la licencia de software libre GNU General Public License (GPL), lo que
facilita el desarrollo de nuevas funcionalidades. Su implementacin es en lenguaje
C++ e interfaz en QT.
Minera de Datos
UNIVERSIDAD NACIONAL FEDERICO
FACULTAD DE INGENIERIA GEOGRFICA AMBIENTAL Y ECOTURISMO
ESCUELA DE INGENIERIA GEOGRFICA
CONCLUSIONES
Hoy en da, para que las organizaciones puedan alcanzar un mayor grado de
competitividad frente a las necesidades del mercado, deben utilizar la inteligencia de
negocio, proceso que se basa en la recoleccin, el procesamiento y el
almacenamiento de los datos generados por la empresa, con el fin de crear
conocimiento. La minera de datos espaciales, a diferencia de la minera tradicional,
rescata la importancia de los datos geogrficos que a diario pasan inadvertidos; sin
embargo, en ellos se oculta un conocimiento valioso como patrones de
comportamiento, que son sinnimo de mejoramiento en ndices de productividad y
competitividad empresarial.
BIBLIOGRAFIA
- http://www.mauro.com.mx/adoqu%C3%ADn/3734/introduccion-a-la-mineria-
de-datos-kumar-pdf-descarga.html
- http://geoportal.inigemm.gob.ec/
- http://www.geoidep.gob.pe/49-documentacion/datos-fundamentales
- http://www.scielo.org.mx/pdf/bsgm/v63n1/v63n1a6.pdf
- https://www.youtube.com/watch?v=DHdogtGYa-M
- http://www.bdigital.unal.edu.co/3086/1/299742.2010.pdf
- http://www.geoidep.gob.pe/geoportales
1
Minera de Datos