Вы находитесь на странице: 1из 7
aay: objedi vos s 25 Ehepas Mineria de datos y aplicaciones Pred KD) 109032962@alumnos.uc3m.es OBJETIVO a ta primera les de la minera bjauvos principal tieos en Ij Sonprendees, 1. INTRODUCCION 1 abajo se ‘datos, lox concepts Aierentes ae 3 Fa la segunda pate se cetrara en casos ‘sn de toy ba conseguido rsutiaos (Cass dio goneramos una gran canal de informaciéa, algunas ‘eves conscientes de que fa hacemos y otras veees inconscientes ‘8 ello porque lo desconocemas, Nos damox cuenta de uve acre infcaacide exc registrarios auesia entrahs eel shale, eusndo entrumos en un servidor pasa We nest vando pmzumes: con aus trjta de edo 0 cuando fesere oe ta biliste de avin. Otas veces an nos damos cveata is {generamos informacisn, come cuando conducimes por ures, done tin costabilzando el nmero de automsviles que pan por minvio. cuando se sigue nuestra navevacidn por Imerrct 0 fande nos sacan uaa fotgraf del rostral haber pasado cerca ‘5 uns offeina gobernaoenta. en qué finalidad queretoos generar informecién? Son iuchos Ys motivos que nos llevan a generar informacién, ya que nos ppoeden ayudar a contvlae, opdimizar, adminisran, examinan fnvextigar, planificar, predecir, someter, negociar 0 tomar Uecisiones de cualquier ambito segéa el dominio co que nus desamollemos. 2 infommacisn por si misma exté considerada un bien pational. De esa fora, si una empresa tiene una péndida feral o parcial de informacisn ‘provoca bastantes perjuicios. Es evidente que ta informacisn debe ser protesida, pero tambien exploada, Qué nos ha permitido poder generar tanta infarnscién? En tos tikinos aos, debido “al desarolo tecaolsgico a aiveles exponenciales tanto en el rea de edimputo como sa a de ‘wansmisign de datos, ha sido posible que se gestionen de una “mejor manera ef manejo y almacenamients de la informacicn. Sin dfuda existen ewato facores imporantes que aos han levado 1. Bl abaratmiento de los sistemas ge clmacenaraiento tanto tersporal como pemanence. Javier Roman Carri Universidad Carigs it IA 100095308 100035306@alumnos.uc3i.23 FL insremeno de procosdores lids de cstagute en i 4. El dexarot dos ms paderoo Actwalmente toss estas ventjas av hum Uvude «do almaeenamiea 2a informacion eax Pas cir que ls Eiteenin ate pc de los. En caw, &exton datos soa Been y sates roporcionar en cosiusta un vevdaden’ conven en la toma de SAS pues, e& necetird teenologias que nie sfuden a explecar el pol aos, 4a materia pris bruuz Ea el manenio q tes atribuye alin significado especial pasan a conse irse en informaciénfCuando los espeviatsts elaboran « encuentese lan modelo. haciendo que la intepeeaciin eonjante ete la informackin y exe modelo repesente un valor agregdo, emecs 08 refers al conocimientg? En Ia figura Ise losin. Jerarga yoe existe en una base de das ent dato. iafovmaciin ¥ conocimiento, Se chserva igvalmente cl volume que presen fn ca nivel y ef valor qu fos respaosahes de ax dssnenes ddan e0 esa jerargaia, HI ake intems denn eel tinge represen los byexvas que se han propuesto. La separate de trungulo zepresent lo estecba unign ene dato ¢ infeaacisa, no asi entre Ia informacidn y ct conocimiento, El dais inining taba fen el nivel superior buscando patrones, compuicamienton, ‘agrupaciones, secuencas, tendenclas a asociaciunes que pun fenciar algtin tiodelo que aos pemita eomprendct mcr el ‘Nomi para yudar en una posible toma de decisis Figura 3. Relaciéin entre co njormacidn y comociient Con todo to amctor poems decir que Data Mining es el proceso de descubrir parones de informacicn interesante y Potescialminte dies. inmeros en una gran base de dats <7 la que se inteructia consisnemente, Data Mining es una ccombinasion de sxeesas com * Bxrrweisnde dats iin de o Atporionss 8 Aoitisisde resultados, 2, MENERIA DE DATOS. CONCEPTOS E HISTORIA Aungus desc un punto de vista académico el término data wining es una etapa dentro de un proceso mayer llamarla extccidn de conocittienlo en bases de datos (Knowledge Discovery in Databases o KD) en el entorno comercial, aos ‘éaminos se wsan de manera indisinga. Lo que en verdad hac el loa mining es reunir las ventajas de varias areas como la Escdistca fa Ineligencia Arifiil, la Computaciin Grifiea, las Bases de Datos y el Processmicnto Masive, principalmente tuswido come materia prima las bases de datos. Una definicn traicional ex la siguiente: "Un proceso no trivial de identifiecign ‘lida, novedosa, potencisimente il y entendible de patrons ‘omprensibles que se eneventran eculto en los datos”. Desde wu pponto de vista se define eomo "ia intepracién de un coajunto de 4reas que tienen como propésito la identficacién de un ‘onacimiento obtenido a parr de Ins bases de datos que aporten in sesgo hacia la toma de decisiin’”. {idea de data mining no es neva, Ya desde tos afios sesent los «stadsticos mansjaban xaminos como da ishing, ata mining 0 data archaeology con la idea de encontrar corelaiones ain una cn fuses de ditay eon rua, peneypins ie fos Sesh Agrawal, Gig Wiedethold, Robert Blum 5 Sctshy-Shupico, ene otro, emyperaron a eornliit runing ¥ RD. 4 tnales de fos ation nehenta ly enstan un par de empress dics a sta teeny 2002 existian miy de LOD empresis en el mundo que often c 414) solociones. Las ists de discusidn sobre exe ioores de mis Je externa paises ote teenologia he sido un bucn punto de ener) entre pers prtenecientes al dmhico scainice yal de Is neocon 2 ache Gicsory Pi HI sta mining es uns tecnologta compesta por etapa ye Integra vavss areas y que 90 @ de software, Durunte el desarollo de wn proyecto de este tip se tan Uifremtes aplicaciones software en eada etapa que ped cstadiieas, de visualizacin de datos v ts Drincipslmente. Actwalmente existen ap! caciancs 0 het comeriales de data mining muy’ pads que fais desamollo de un prosevio. Sin embargs. cai siempie ss complementdndone con otra he eamieata sonfundir com an sha 3. DONDE SE DE DATOS? LTILIZA LA MINERIA La willed de Di Sixtemas_pamiaimente desconmeidoy Si el msi sel Sistema que preduce los datos es bien conucita, eaanees m nocesitars Ue la ineria de datos aque todas ls variables son de alguna manera predesibles. Este no es ei cw del feomercio eleetrnico, debido a tos eich comporamiento humano, el clima y de decisiones polite ‘entre ots, Em estos casos habr una pate de! sista que > conocida y habra una pare apurentemente de natrs lesions, Bajo cients cicunstancias, a partir de ura gia vantidad de datos asociada con sisioma, existe in osibilidad de encontrar nuevos aspectos previamente desconacidos del modelo, ‘Enorme ean‘idad de dios: Al coniar con mucha informacisa cn algunas bases de datos es importante pura una empress ‘conta [a forma de analizar“montaise™ de informacion {lo {que para an humano seria imposible) y gue ello le produces alga tipo de benefcio. Potente hardware v software: Muchas de las herramientas presentes en la mineria de datos estin buenas en el uso imensivo de la compotaeién, en conseevencia, un equipo onveniente y un software eficiente, con cl cual evente una compa, aumentaré ef desempefio del proceso de buscar y analizar informacién, el cuai a veces debe véryelas con pproducciones de ios del orden de les Gbyteslhors (repetimas, algo humanamente imposible). El uso del data ‘mining puede ser provechoso en el easo de poseer daton sobre SUS procesos productivos, datos de segnimiento de lentes, datos extemos de merea, dos sore la actividad de competidones, et 4. OBJETIVOS PRINCIPALES DE LA MINERIA DE DATO! Dati Mining persigue ciros objtivon ds manera epee Descripcdn: El principal produce del proceso de la mineria de laos es el descubrimiento de reglas. HSiay wpotrarin nuevas Telaciones ent las varablec exeepcianes de acuerdo alt ose utliee este prooesa, Ell viueceri el anslisis yuan em la planificacion jen el ivefio ue focu0s cambios, ES posible que algunas de Is reglas descubieras no pusan ser fsmbiadas, pero si reslte posible walizar_movificaciones ‘apropiaas en la organizacicn con ol propésito de mejorar vu ddesempeno, Proccsin(Forecastingy: Una vee descubiers rglasimporamtes, cesas. pueden ser uilzadas pera estimar algunas variables de ‘ida: Puede ser en el caso d2 8 no reaesionaban correcamente alos dobies marcas. GT ponyaé, ef cuerpo de entrenadores estudié cutdadsariente {nak las peliculas de juegos contia Chicago. Ohserearon lo jugadores de Chicago sompfan su able mseaje muy nip. de tl forma que podfan tapar ak encestato libre de fos Knicks antes de preparasse para efectar su sir. Con este conocimienta, tos fnirenadores eresron eststegias alternatives para tatar cost et Goble marcaje. Ta temporada pasads, IBM offecis el Advanced Scout a la NBA, que se convirié asf cn un pattocinador Corporaivo, Le NBA dio a soe veintinueve eguipos la ‘oportunidad de aplicalo. Diecioeho equipos lo estin haciento hasta e1 momento obveniendo descubrmientosinteresantes. 66 Textos: Text Mining Esudios recientes indican que ta mayor pare de tt coda la fnformaciSn de una compai‘a exif aliacenada en forms de ddocumertos. Sin dada, este campo de estdio es may complejo ¥ te dimensiones enormes, por lo que téeieas como pueden ser la categorizacin de text, el procesarmiento de lenguaje natural. 3 SSiracidn y recuperacién ée la informaciGn o ef aprendizaje “ruomilico, entre otas, apoyan al text mining (mineva de text). En ocasiones se confunde el text mining cop la recuperacin de la informacin (Informstion Retrieval o IR). Esta ulima consste en fa recuperacién automética de documentos relevantes mediante indexaciones de textos, clasficaciGn, categorizaci6n, ete Generalmente se uilizan palabras clave para encontrar una pina relevante, En cambio, ef text mining se reffere a exantinar una Calecciin de documentos» descubrir informacin no contenide fn ningin documents individual de ta coleccién; en otras palabeas, tata de obtener infouacin sin haber partido de algo. 66.1 Medicina {en aplisacin ns tats i T1909! Don Swanson injente ease informacion der folecciones de texts Leniendo et eet que fos expert pusden toer una peyutie parte de tks lo ye xe pan Sampo. 3 por lo eval tunic pk cn cata tos ftucvos desarrollo que se saceden fonts capa felaionalen, ¥ teniendo en cuenta gue ta catia! de never documentos ye Se publican es cada Ser mur lu ie la minsria de {tos en eolecio Swanson ha Jemosiado ovinu cadena de implica vento de la ieraura medics posden condacie a enfermedades pooo Ieeuentes, algunas dels ees 9 Pruchas de soports experimental Invesigando las caus de migrafa, dicho investigador extajo saris picvas de evden Dlr de utalos de arculos presenter en it literature homedics. Alounas de esas elses use + Hosts end sociad con ta migra + ELesrés puede enaducir a la peda de magnesio + Line blogueadares de canales de casio previenen ‘+ Elmagnesio es un bequeador nator del canal de exci La depeesia conical diseminasa CD) ets impleada en algunas migeatas + Los nivetes altos de magnesio inhiben fa DCD. + Lax pacientes con migrata sienen na alla plague + Elmagnesio poste siyrinitaay FExas claves sugieren que [a deficiencia de magnssio podria sepresentar un papel en algunos tos de migrafs, una hipitsis que no exists en la literatura y que Swanson enconré melanie esas ligas. De acuenlo con Swanson . estudios poseriores han probado experimentalmente esta hipitesis abtenida por text ‘ining con buenos results, 6.7 Internet: Web Mining ‘Una de 1a aplicaciones dela minesa de datos conssie en apicar ss tenicay a documentos y servicios Web, lo que se denomina ‘cominmente con el termina ings web mining (mincria de Web), ‘Cada vez que on usuario visita un sitio Web ¥a dejando tod tipo de “hucllas” Web (direciones de IP, navegador, galletas, te) ‘que los servidores automitcamenteslmscenan en una bese de datos log) Las hesramientas de wed mining analiza y procesan feta abundante cantidad de datos para produit informacion significativa, por ejemplo, oso es la navegacion de un cliente antes de hacer una compra en linea. Debido aque lot catenidos te Imemet consisten en varios tipos de datos, como texto, imagen, video, metadatos o hipettigas, investgaciones recientes usan el ‘érmino multimedia data mining (minetia de datos multimedia) corpo una instanea del wed mining para tatar ese tipo de datos. [Los aocesas totales por dominio, horaios de accesos mis fiecuentes y vistas por dia etre ctros datos, son registrados por hherramientas estadsicas que complementan todo el proceso de andlsis del web mining También es may imporate como los link en ls sitios Web son ilzados. Se puede saber cuartos links debe pasar et ussario en ve i eran camtadad de usuario ace pa pin ¥ av ahorrar tempo 2 To navevantes y gomenur un mayor ipenefici, © inelusr pubtiidal en dos thnks que se vistaran mis I se pes poner un acces directo desde fa ava Normalmente 1s miners de dvos de Web poste elasificrse en rs dominios de exizisciin de conecimictta de sever « lt raleva de los Utos 1. Weh content mining (minesta de contenice webs. Fs et proceso que consise en la extracckin de conocimicate del contenido ds documentos 0 ss descripciones. Lt localiacién de patranes on el texto de los documentos el descubrimieno del recuno faxade en concepts de indewacisn 0 la teenetogia basada en agentes tambien pueden formar parte de esta eategora 2. Web structure mining runeria de esrotura weh) #8 eb proceso de relacionar el conacimiente le te ‘ganiacisn de! Wwe y la estroctura de sO fas, 3. Web wsae mining (inesia de uso web). Es el process de extra in de modelos interesantes usando Los Io de los avers al web Algunos de Tos resus que padtian obienese tas la apis \lelos diferentes matodos de web mining a una pigina fetes san: Fl ochenta y cinco por cients de los clientes que aoceden 2 Jproductosfhameheml ya /productes/noticias uml eccedcn también a /productovhiseorias suceso.hunl, Esto podria indicar (que existe alguna noticia interesante de ta empresa que hace que los clientes se dinijan 2 historias de suceso. Igualmente, este resultado permitira deteciar la noticia sobresliente y coloceela \qizS en la pgina principal de la empresa, 0 también se pueden observar casos donde los clientes que hacen tina compra en linea cada semana en feompra/produetol ml lienden a ser de sectores de la poblacién determinada, com ‘estudiantes, pensionistas, funclonarios u ots. Exo “pocria revultar en proposer diversas oferas 4 ewe secior par y ai conseguir un polenciaminaio en las comprar por parte de esos grupos Et sesents por ciento de os clientes que hicieron una compra en nea en Feompra/productol htm también comprazon en ‘oompraiprodactot html después de-un mes. Esto indica que se pouirfs recomendar en Ia pigina del producto 1 comprae el producto 4y ahoramse el costo de envio de este producto, 6.7.1 Radio personalizada en Internet: Last.fm Las.fm es una radio via Internet y ademas un sicema de recomendaciOn de misiea que consirye perils y estadistieat sobre gustos musicales, basindose en lor datos eaviados por los vusuarios regisindos. En la radio se puede seleecionar lis canciones segin las preferenciss personales (Je acuerdo un algortmo y alas estauisticas) 0 de ats usuarios, El servicio es de esstno Avdiosera jerto. Se fesond con sy proyesta he fen agosto de 205, in usuario de Lastim puste comsnuir un pesfit musical usando dos méwalos:ewcochando su eoleccion musical personal en una aplicacién de musica con un plugin de AuowcrObbker. 0 fwcuchand et serwicio de radio tras de Internet de Lm normalmente con el reproducor de Latin. Las canciones sscuchada som afutidat 4 un fegivo dee rmnde ve eaularin Jos anifcon de barmas de Ws atta} chose farwtow ams ‘de las recomendaciones musicales Lay recomendaciones som calevladss usando un algwsitmo colaborativo de filvado. asf es usuarios pucden explorar un Ista {Ge artists Po istados en ss prepio peril pero que wi que fen otros usuarios eon gustossmiares Las ft tmbign permive a fscuchar misiea gue lia

Вам также может понравиться