Вы находитесь на странице: 1из 38

,r,o/,#tTIffi $fDEAFREf &rZHlE Despus de leer este captulo, usted podra:

1. Describir 1osconceptosbsicos dela organizacin de archivos y los problemas de administrar los recursos de datos en un entorno tradicional de archivos. Describir los principios de un sistema de administracin de bases de datos y las caractersticas de unabase de datos relacional. Aplicar los principios importantes del drsenode basesde datos. Evaluar 1asherramientas y para proporcionar tecnoJogas informacin de bases de datos para melorar e1desempeo empresarial y la toma de decisiones. 5. Evaluar e1ro1 de la po1ticade informacin, 1a administr acin de datos y e1aseguramiento de la cahdad de datos en la administracin de 1osrecursos de dar osd e l a o rg a n i z a c i o n

El.QtE*44 DEI, APfTILO:


6.7

. '.

,: :: :, :

1,

ORGANIZACION DE DATOS EN UNENTORO T RAD IC IONAL D E ARCH IVO S Conceptos de organizacin de archivos Problemas con el entorno tradicional de archivos ENFOQUE DE LASBASES DE DATOS PARA LA A D M I NISTRACION DE DATOS Sistemas de administracin de bases de datos Capacidadesde los sistemas de administracin de bases de datos Diseo de bases de datos USO DE BAEES DE DAIOS PARA MEIORAR EL DEEEMPENO EMPKESARIAL Y LA TOMA DE DEC/EIOES Almacenes de datos Intel i genci a negoci os, de anl i si sde datos multidimensionales y minera de datos Basesde datos y 1aWeb ADMINIs?RACION DE TOS RECURSOSDE DHTOE Establecimiento de una poltica de informacin Aseguramiento de Ia caTidadde datos MlS EACCI/ Mejora en la toma de decisiones: rediseo de 1abase de datos de clientes: Dirt Bikes USA Logro de la excelencia operaliva: construccin de una base de datos relacional oara administracin de inventarios Mejora en la toma de decisiones: bsqueda de recursos empresariales extranjeros en bases de datos en 1nea

6,2

2.

6,3

3.

6.4

6.5

Sesiones interactiu as:


Basesde datos de ADN: Arma par a luc h a r c o n tra e l c ri me n o amenaza a 7a pivacidad? Qu se puede hacer sobre 1a calidad de 1osdatos?

MDUL)S DE EEGUIMIENT) DEL APRENDIZAIE Diseo de bases de datos, norrnalizaciny diagramas entidad-relacin Introduccion a SCl Modelos de datos jerrquicos y de red

a National Association for Stock Car Auto Racing, mejor conocida como NASCAR, est en camino de convertirse en e1deporte espectculoms popular de EstadosUnidos. En 2005, 75 millones de personas acudieron alas caneras NASCAR, 7a cantidad tns aTta asistende tes a cualquier deporte en Estados Unidos tas carreras NASCAR estn en segundo lugar := tating televisivo, slo atrs de la National Football League CNFL).De 1995 a2004,labase de afi- onados de NASCAR creci de 63 miilones a 75 rnlllones, y 1asventas a1detalle de mercancia con --:encia de NASCAR se incrementaron ms de 250 por ciento, de aproxirnadamente 600 millones a I -00 millones de dlares Las empresas de Fortune 500 palrocinan a NASCAR ms que a cualquier ::o deporte. hay de malo en esta descripcin? No mucho, excepto que la administracin de NASCAR "Qu ,]'rsidera que la empresa podriab.acer a:nmejor las cosas.Cree que puede incrementar a:nrns -case . de aficionados de NASCAR, especialmente en reas diferentes al sur, donde NASCAR ha si:r tradicionaTrnente ms popular. Pero NASCAR necesita los datos correctos paraid,entihcar qui::.s son sus aficionados, y est teniendo problemas para conjuntar esos datos. Hasta hace cinco aos, NASCAR consideraba que 1os sistemas de informacin eran meras fun:-cnes administrativas. Tbdo su proceso para rnonlar carreras -obtener credenciales para 1os patealizar 1ascarreras, rnanejar las relaciones con los patrocinadores y pagar a los pilo-ocinadores, -''s Y s1ls equipos- eraprincipalmente rnanual ybasado enpapeT Los autdromos no tenian -=cnologapara transrnitir efectivamente los datos de 1ascarreras. EI panorarna carnbi cuando NASCAR empez a recTutar ejecutivos sobresalientes de empresas -:: Fortune 500, deportivos y de medios de difusin, quienes apreciaban1o que la TI puede hacer :rr un negocio. A Roger Love11, director de TI de NASCAR, se le dieron todas 1asfacultades para :=alizar una transformacin de Ia ernpresa con base en la TI Lovel1y su equipo de especialistasde sistemas de informacin desarrollatorrLtna infraesrructu:. de TI escalabley estable, estandari2aronla tecnologia de Informacin de 1a computadora de es-::rorio de NASCAR e implementaron un pTanparareforzar 1a seguridad de 1ossistemas Cornerva: r a recopilar rns datos de rnaTlera electrnica acerca del desempeo de 1os pilotos durante :una - -'tera y a anaTizatlos datos para qlre 1osaficionados pudieran seguir e1desempeo de los pilotos ''- Ltna rnarrera similar a la que ernpTean en el beisboT pan anaTizar los promedios de bateo. En -,'06, NASCAR implement un Centro de Tecnologa Mvi1 de vanguardia para recopilar y prooesar -r'ros sobre el tiempo y las califi-.-cionesen e1 momento que se :=a,fizabanlas carreras Enla ac,-.alidad, Lovel1 y Roger VanDerS::ick, vicepresidente de marke-rg de NASCAR, trabalan enTa --rstruccin de :una sola y am:--a base de datos de aficionados = -os autos de carreras que po' - : an c om p a rti r c o n s u s s o c i o s :: negocios y utllizarla con pro::sitos de marketing. Esta base *: dar ospod ra p ro p o rc i o n a ru n ::-,jorentendimiento de los perfi--s demogrficos,comportamien--s -. preferenciasde los aficiona- . de NASCAR para dfuigirTes , -.::aS comO ChamarraS de 7a . ,: -a NASCAR, oportunidades :::: .onocer alos pilotos durante .:.i .,rTe O productosy SenriciOS rS -' - . patrocinadores.Adems de

224

Parte Dos Infraestructura tecnoloqa informacin de de

generar ingresos, estas iniciativas podran incrementar lalealtad de 1os aficionados, apdat a NASCAR a alraer nuevos patrocinadores y convencer a los existentes de que aumenten los montos de sus patrocinlos. La creacin de una base de datos de aficionados consolidada representa un reto porque los datos estn almacenados en muchas bases de datos diferentes. NASCAR.com tiene su propia base de datos, al igtal que e1 club de miembros de NASCAR y 1os clubes de aficionados de cada uno de 1ospilotos. Es probable que estasbases de datos no alrnacenen los datos sobre 1osaficionados de una r:na:nera consistente, as que los datos tendrn que ser "depurados" de discrepancias, inconsistencias y efrores, y reesuctutarcepata que se ajusten aanforrnato esfndar. NASCARysus socios tendrnque establecer reglas para attlizar una base de datos de aficionados consolidada, con la fina7idad de que 1os aficionados de NASCAR no sean bombardeados con un exceso de anuncios de marketing y que se respeten los acuerdos de privacidad que las escuderas, 1ospilotos y los palrocT,nadoles hayan establecido con sus propios aficionados. Stoneacre Partners, que construy unabase de datos relacional parael Club de Miembros Oficial de NASCA\ esl a cargo del proyecto. Fuentes: MeridithLevinson, CIOMagazine, "ITSuperchargesNASCAR', 1defebrerode2006,y K.C.Jones,"NASCAR RevsUp Data Center on Wheels", InformationWeek, de mayo de 2006. Ig a experiencia de NASCAR ilustra la irnpottancia de la administracin de datos y de los sistemas de bases de datos paralas emptesas. NASCAR ha experimentado un crecimiento fenomenal. Pero su crecimiento y su desempeo futuros dependen de 1o que paeda o no pueda hacer con los datos de sus clientes. Larnanera en que las empresas almacenan, organnzany administran sus datos tiene un gran impacto en la efectividad deTa organizacin. EI dagtarna con que cornienza e1 captu1o resalta puntos importantes derivados de este caso y este captulo. Los datos acerca de los aficionados de NASCARy de 1os clientes potenciales han sido ahnacenados en una gran cantidad de bases de datos diferentes desde las cuales no se puedenteouperar y analizar flcilmente. La administracin decidi qae Ia estrategia de negocios de NASCAR necesitaba enfocarse encrear buenas relaciones con el cliente, 1o cual requetia integrarlos datos de todas estas fuentes diferentes en una sola y amplia base de datos de aficonados. Adems de uttlizar la tecnologia adecuada, NASCAR tuvo que corregir y reorganizar los datos en un formato esIndar y establecer reglas con sus socios de negocios para acceder a la informacin dela nueva base de datos.

Faltade conocmiento sobreel cliente Datosfragmentados cliente del Desarrolla estrategia la haciael cliente

Colabora los con sociosde negocios Disea reglasde accesoa los datos Diseauna basede datosde clientes amplia Utiliza tecnologa de base de datos relacional Estabiliza la nfraestructura Consolida datos los del cliente Analizalas preferencias del cliente . Incrementa ingresos los . Incrementa productividad la

Gaptulo Fundamentos la inteligencia negocios: de de administracin bases datose informacin 225 de de

AT EN C I N
Este captulo se enfoca en la administracin de datos y en la rr..arreta que las en empresas ltt]rizanla tecnologa de base de datos para aTcanzarsus obitivos. Unavez que las empresas utlTizan sistemas de administracin debases de datos para organizat adecuadamente sus datos, esos datos deben ser analjzados. La inforrnacin resultante se puede utizar pata desarrollar nuevos negocios, lograr la,excelencia operativa, comunicar 1asdecisiones de 1a administraciny ayud,ar ala ernpresa a cumplir sus requerimientos de presentacin de informls reglamentanios. Empresas completas como ups, compaas de tarjetas de crdi y Google, se cimientan en bases de datos. No sera ur'u afirmar qie "*ug.r"in las bases de datos son el fundamento de ras empresas actules y que la maytia de stas ftacasarian si sus bases de datos dejaran de existir. si su rea son las ftnanzas y la contabilidad, trabajat conbases de datos de transacciones financieras, como pagos,facturas o historiales crediticios. Si su trabajo son las finanzas, trabaja con bases de datos enormes que almacenan datos sobre precios de valores, carteras de inversin y estadsticaseconmicas. si su rea son los recursos humanos, frabajar con bases de datos que albergan datos sobre empleados, planes de prestaciones,planes de remuneraciones, programasde capaciraciny cumplimiento de reglamentaciones gubernamentales sobre salud, seguridad y oportunidades equitativas de empleo. o si su rea son 1ossistemas de informacin, desempefar un ro1 importante en el suministro de herramientas de administracin de datos y conocimientos especializadosa la empresa. usted dise.ar bases de datos, implernentary d.ar mantenimiento a la tecnologa de bases de datos y aywdara promover la rreaci1n de polticas y procedimientos para la administracin de datos. Si su rea es Ia manufaclura, Ia produccin o la administracin de operaciones, trabajar con grandesbases de datos que contienen informacin sobre productos terminados, materia prima en inventario, proveedores,componentes de los productos, calidad del producto y artculos en trnsito que se po"".r utlTizar para la administracin de 7a cadenade suministro. si su rea son las ventas y el marketing, ufTlizarbasesde datos para dar seguimiento a las compras de los clientes, analizar datos sobre los clientes paru d,igirles campaas de marketing o identificar a los clientes y productos rentables.

TRADICIONAL

0nenuzAcrN DATos uN ENToRNo DE EN

n sistema efectivo de informacin da a los usuarios informacin exaota, oportuna y relevante. La informacin exacta esl libre de errores. La informacin es oportuna'cuando est disponible en el momento que La requieren 1osencargados de la toma de decisiones. Lainformacin es relevante cuando es ti1 y adecada para los tipos de trabajo y decisiones que 1a necesitan. Se sorprendea de saber que muchas ernpresas no cuentan con informacin oportuna, exacta o relevante porque los datos de sus sistemas de informacin estn rr],alorganizados y con un mantenimiento deficiente. A esto se debe que la adminisrracin de datos sea tan importante. Para entender e1 problema veamos la rnanera en que los sistemas de informacin organizan los datos en archivos de comnutadora y los mtodos tradicionales de administracin de archivos.

226

ParteDos infraestructura tecnologa informacin de de

CONCEPTOSORGANIZACION DE DEARGHIVOS
un sistema de cmputo organza los datos en una jeratqtia que ernpieza con bi- -,b},tes y avarva a campos, registros,archivos ybases de datos (vealafigwaT-r). un's-: representa la lunidad ms pequea de datos que puede rnanejar una computado.: un grupo de bits, Tlamadoun byte, representa w carcter,el cual puede ser una lerr: un nmero u otro smbolo. lJna agrapacin de caracteres en ana palabta, un gmp,. de paTabras un nmero completo (como el nombre o la edad d.euna persona) se llao ma campo. un grupo de campos relacionados, como e1nombre de un estudiante, ccurso que torna, la fecha y el grado, conforma un registro; un grupo de registros del mismo tipo se llama archivo. Por ejemplo, los registros de la figura 6-1 podrian constituir e1 archivo de un curso de un estudiante. Un grupo de archivos relacionados forma una base de datos. El archivo de curso del estudiante que se ilustra enlafi,gt;;ra 6-1 se podraagrupar con archivos sobre 1osantecedentes personales y financieros de los estudiantes pata creat una base de datos de estudiantes. un registro describe una entidad una entidad es una persona, 1ugar, cosa o evento sobre el cual se aknacenay conserva informacin . Cada caracterstic a o c,1ralidad que describe a una entidad en parricular se llarna aftibuto. por ejemplo, F IGU R A -1 L A J E R A R QU N ON TOS OE Basede datos de estudiantes

Unsistema cmputo de organiza datos una los que en jerarqua empieza elbit,elcual con representa yasea 0 o un1.Los sepueden un bits para agrupar formar byte representar para un uncarcter, nmero smbolo. bytes pueden o Los para se agrupar formar campolos y campos un relacionados se pueden para agrupar formar registro. registros un Los relacionados sepueden para conjuntar formar y los unarchivo archivos relacionados sepueden organizaruna en base datos. de

e de de administracinbases datos informacin227 de de 6 Gaptulo Fundamentosla inteligencia negocios: valoID_Estudiante, curso, Fecha y Grado son atributos de 1a entidad cuRso. Los pueden tener estos atributos se encuentfan en los campos del res especficos que registro que describenTa entidad CURSO'

TRADICIONAL GON PROBLEMAS EL ENTORNO DEARCHIVOS


En 1a mayora de 1as organtzaciones, los archivos de datos y 1os sistemas marcaban plan a nivei de una tendencia a crecere maneraindependiente sin ajustarse a un humanos y ventas y todalaempresa. Contabilidad,ftttantzas,manufactura, IeCuISoS 6-2 marketing, desarrollaban sus propios sistemas y archivos de datos. La figura 1a informacin' ilustra e1 enfoque tradicional de1 procesamiento de Desdeluego, paraoperat,cadaaplicacinteqtetasuspropiosarchivosysup1.opopio program de cmputo. Por ejemplo, el deparfamento de reculsos humanos personal, un archivo de nmina, un archivo diaontar con un ur"hirro mae stro de y as de seguros mdicos, un archivo de pensiones, un archivo de listas de correo Ial vez cientos, de archivos y proglamas . EI depattahasta que se creaban decenas, de mento de ltnanzas tarnbin podia contat con un archivo de nrnina, un archivo de empleados para opelat Ia nrnina. A1 considerar a y una lista pensiones -u"tt* Ia cornpaa en su conjunto, este ploceso conduca a m1tip1es archivos maestros Al cabo creados, conservadosytperados por divisiones o departamentos separados. cientos de programas de 5 o 10 aos, 1a otgantzactlnse encuentlaCorlv]r'acargade ifi"i1es de mantener y rnanejat' Los problemas resultantes son y aplicacion", 'redundancia e -oy inconsistencia de datos, dependencia entre los proglamas y 1os datos, inflexibilidad, una escasa seguridad de datos y la \ncapacidad de compartir datos entre aplicaciones.

FI G URA. 2

D PR O C ES AMIE NT R AD IC ION A LE A R C H IV OS O
Archivomaestro de Elementos dalos de la A alaZ derivados Archivos

CONTABILIDAD Y FINANZAS

RECURSOS HUMANOS

VENTASY MARKETING

&-ffi@

MANUFACTURA

de corporarea a alientacada funcional una archivos para tradicional procesar de Eluso unmtodo de un requiere archivo datos aplicacin y archivos. Cada especializadas aplicaciones a cin desarrollar delarchivo Estos maestro. subconjuntos delarchivo un ser que nico probablemente subconjunt y enel dedatos, e nconsstencia inflexibilidad procesamiento a redundancia conducen maestro desperdiciados. de recursosalmacenamiento

228

ParteDos Infraestructuratecnologa informacin de de

La redundancia de datos es 1a presencia de datos duplicados en mltiples archivos de datos, de tal manera que los mismos datos estn almacenad.osen ms de un 1ugar. La redandancia de datos ocurre cuando diferentes grupos de uina organizacin captvrala de rnanera independiente la misma pieza de informacin yIa11acenan tatnbin de manera independiente de 1os dems grupos. La redund,ancia de datos desperdicia recursos de aknacenamiento y tambin conduce a la inconsistencia de datos, en la cual el mismo atributo podria tener valores diferentes. por ejemplo, en 1asinstancias de la entidad CURSO que se ilustra en la figura 6-1, la Fecha poria act'u'aTaarce algupos sistemas peto no en los dems. El atributo ID_Estuiante poen dria tener diferentes nombres en 1os diferentes sistemas de la organizacin. por ejemplo, algunos sistemas podrianatiTizat ID_Estudiante y otros, slo ID. Al utiTaat diferentes sistemas de codificacin para representan 1os valores de un atributo se podra ger;erar confusin adicional. Por ejemplo, los sistemas de ventas, inventario y manufactata de un detallista de ropapodrianusar cdigos diferentes para representar eltarnao de una prenda. Un sistema podnarepresentan eTlarnao de laprenda como "extra grande", en tanto que otro r:|lizariael coigo ,,XL,,con el mismo propsito. La confusin resultante difrcaltana que 1as compaias cteara1- sistemas de administracin de las relaciones con el cliente, de administracin de 1a cadena de suministro o empresariales, que integraranlos datos desde fuentes diferentes. La dependencia entre los programas y los datos se refiere a 1a estrecha relaci'n entre los datos almacenados en archivos y 1os programas especficos que se requie_ rel;l para actaalizar y mantener esos archivos, de tal rnarrera que los cambios en los programas requieren cambios a los datos. Tbdo programa tradicional de cmputo tiene que describir laubicaci1ny natutalezade los datos con que trabaja. En un entorno tradicional de archivos, cualquier cambio en un progr arrra de.oft*ur" podra requerir un cambio en los datos a que accede ese programa. por ejemplo, un prograrna se podra modificar para aaeptar un cdigo postal de nueve dgilos enligar de cinco dgitos. Si los cdigos postales de cinco dgitos se cambiaron a nueve dgitos en el archivo original de datos, entonces otros programas que requieren el cdigo postal de cinco dgitos no funcionarian adecuadamente. Implementar tales cambios de rnar'eta apropiadapodtia costar millones de dlares.

R edundanc a in c o n s s t e n c iad e d a t o s e

D ependenc i a n t r e lo s p r o g r a m a sy lo s d a t o s e

Ga re n ci a d e fl exibilidad
Un sistema tradicional de archivos puede enviar informes programados de rutina despus de extensos esfuerzos de prograrnacin, pero no pr"d" iransmitir informes con fines especficos o responder de rrranera oportuna a requerimientos imprevistos de informacin. La informacin requerida por las solicitudes con fines especficos esf en algnTagar de7sistema pero podra ser demasiado costoso recuprarla. varios ptogtarnadores tendran qae trabajar dutante semanas para rcunir en un nuevo archivo 1os elementos de datos requeridos.

S eguri dad es ca s a
Dado que hay poco control o administracin de datos, el acceso y la difusin de la informacin podnan salirsd de control. Es posible que la administracin no tenga fonna de saber quin est teniendo acceso a 1os datos de la organizacin, o incluso modificndolos.

Debido a q.oela informacin est fragmentada endiferentes archivos y en distintas partes de la organizacin no se puedenrelacionar entre s, es prcticamente imposible que la informacin se comparta o se acceda de manera oportuna. La inforacin no puede fluir libremente a travs de 1asdiferentes reas funcionales o distintas partes de Ia organizacin. Si los usuarios encuentran diferentes valores de 1a misma pieza de informacin en dos sistemas distintos, tal vez no deseen utilizar estos sistemas porque no pueden confiar en la exactitud de sus datos.

c arenc a de c o m p a r t ic i n y d is p o n ib r id a dd e lo s d a t o s

captulo Fundamentos la inteligencia negocios; de de administracin bases datose informacin de de

2zg

LA ADMINISTRACTIV DATOS O

EnrooueDELAs pARA BAsEs DATos DE

-= tecnologla de bases de datos puede reducir muchos de 1osproblemas que origina ''' organizacin tradicional de archivos. una definicin ms riirrosa de una base de datos es un conjunto_ de datos otganizados para servir efic[ntemente a muchas =licaciones a7 centralizar los datos y controlar su redundancia. En vez deque los itos se aknacenen en archivos seprados para cad.a apTicacin,se guardan fisica=ente para qtJe se presenten a los usuarios como si estuvieran almaienad,os en un s:io lugar. una sola base de datos da servicio a mltiples aplicaciones. por ejemplo, =:Lvez de que :una corporacin almacene los datos de-sus ft"uao, en sistemas de -::rbrmacin separados y en diferentes archivos pr.u p"rrorfl ,ru-rrru y prestacio_ :-es, podra creat .o.''asora base de datos comnde recursos humanos.

SISTEMAS ADMINISTRACIN BASES DATOS DE DE DE


-r sistema de adminisfracinde bases de datos cDBMSj es er software que per_ r:lte a una organizacin cenftaTizar 7os datos, administrarlos eficientemerrt" y pro:orcionar, mediante los programas de aplicacin, el acceso a 1osdatos almacenados. l DBMS acta como una intefiaz entr los n .je datos fisicos. Cuando el prograrna de _omo el sueldo bruto, el DBMS encuent rresenta al programa de aplicacin. Si ut programadot tendra que especificat el. -, iatos utilizado en el programa e indicar la computad ora enque se rocaTizatan. -{ separar 1asvistas rgica y fisica de los dats, er DBMS rlil,etl^at programador o :l usuario final de 7a tarea de comprender dnde y cmo ," ui-u""rrrn rearmente -s datos' La uista lgica ptesenta los datos como los deberianpercibir los usuarios irales o los especialistas de 7a ernptesa, en tanto que la uista fisicamuestra cmo :sn organizados y estructurados realmente los dtos en un medio de almacena=iento fisico. El software de administracin de bases de datos hace disponibles las diferentes -'-:stas igicas de la base de datos fsica requeridas por los usu'arios.por ejemplo, pa_ :a la base de datos de recursos humanos ilustrada n ra figura 6-3, on especialista en :restaciones podtia requerir una vista consistente del nmbre, ,r-"ro d.el seguro social y cobertara del seguro mdico del empreado. un miemb ro d,er departamento ie nmina podria necesitar datos como el nombre, nmero del seguro social, suel_. io bruto y sueldo neto del empleado. Los datos para todas estasvistas se almacenan en una sola base de datos, donde 7a organizacron los puede de una rna,'era ns sencilla. '.anejar

c m o r es uel v eun D .B Msros p r o b r e m a sd e r e n t o r n o de a rch ivo s tradi c tonal


n ' DBMS reduce la tedundancia y la inconsistencia de datos al minimizar la cantiaad de archivos aislarlos en los cuales se repiten los mismos datos. euiz er DBMS no permita a7a organizacin elirninar por completo la redund.anciade datos, pero ruede ayudarle a controlatTa. Aun cuandola orghnizacin conserve algunos datos :edundantes, un DBMS erimina ra inconsiste ncii d,eros datos porque puede ayud,ar zLa organizaci'n a aseguralse de que todas las ocurrencias de los dltos redundantes :engan los mismos valores. El DBMS elimina la depend.encia entre los programas y -os datos,permitiendo a estos ltimos ser autosuficientes. E1acceso y la disponibiliiad de 7a informacin se incrementarn y ros costos del desarroro y el manteni_ riento de 1osprogramas se-redu cirnporque,los usuarios y to, progrumadores pueien reaTizarconsultas con fines de la informu0. q'o" contiene ra base ".p""ifi"o, ie datos' El DMBS da a7a organizcin la posibilidad de central jzar laadministrac:n de datos, su uso y seguridad.

230

d de ParteDos Infraestructura tecnologa informacin F IG U R A6 -3 S H C D B AS ED E D A TOS E R E C U R S OSU MA N OS ONM LTIP LEV IS TAS

Vistade prestaciones

./
<--------->

ffiil
\
Vistade nmina

Basede datosde numanos recursos

proporciona vistas datos diferentes, segn muchas de humanos de Una base datos recursos sola de un vistas, para espeAqu dos del deinformacinusuario. seilustran posibles una requerimientos los y una denmina laempresa. de del un en cialista prestaciones para miembro departamento

D B MS re l a conal
Los DBMS conlemporneos utilizan diferentes modelos de bases de datos pata dar seguimiento a las entidades, atributos y relaciones. Actualmente, el tipo ms popu1ar de DBMS para PCs, as como para cornpl)tadoras ms grandes y mainframes, es e1DBMS relacional. Las bases de datos relacionales representan 1os datos como tablas bidimensionales (llamadas relaciones). Las tablas podrian considerarse como archivos. Cadatabla contiene datos acerca de una entidad y sus atributos. Microsoft Access es un DBMS relacionaT para sistemas de escritorio, en tanto que DB2, Oracle Database y Microsoft SQL Server son DBMS relacionales pararnainframes y computadoras de rango medio. MySQL es un popular DBMS de cdigo abietto, y Oracle Database Lite es un DBMS para peqaeos dispositivos de cmputo portti1es. Veamos crno ana base de datos relacional organiza los datos de proveedores y partes fveala fi,gura6-4). Labase de datos tiene una tablaindependiente paralaentidad pROVEEDOR y otraparata entidad PARIE. Ambas tablas constart de una utadrcu7a de columnas y filas de datos. Los elementos de datos individuales para cada entidad se aknacenan como campos independientes, y cada carnpo lepfesenta un atributo para esa entidad. Los campos de unabase de datos reTacionaltambin se deciudad, nominan columnas. Patala entidad PROVEEDOR, e1nmero, nombte, ca11e, estado y cdigo postal de1 proveedor se almacenan como campos separados dentro de Ia tabTaPROVEEDOR y cada campo leplesenta un atributo pata la entidad PROVEtrDOR. La informacin real sobre un solo proveedor que se encuentra err rra tabla se denomina fila. Por 1o general, a las filas se 1es11amaregistros, o en trminos muy tcnicos, tuplas. Los datos deTa entidad PARIE tienen su propia tabla separada. El campo para el Numero-Proveedor de la tabla PROVEEDOR identifica de rna' ne'raunca cada registro con la finaTidad de que se pueda eevperar, actvaTizaro clasificar, y se denominacarlnipo clave. Cadatablade unabase de datos relacional tiene an carnpo designado como clave principal. Este campo clave es el identificador inico para todal.a informacin en cualquier ftla de 7a tabla y su clave principal no se puede duplicar. Numero-Proveedor es 1a clave principal pataTa tabla PROVEEDOR y Numero_Parte es la clave princip al paraTa tabTaPARIE. Observe que Numero Proveedor ar,arecetanto en latabla PROVEEDOR como enlatabl.a PARIE. En la

Captulo6 Fundamentos la inteligencia negocios: de de administracin bases datose informacin de de FIGURA 6 . 4 PROVEEDOR TABLAS DE UNA BASE D E D A T O SR E L A C I O N A L Columnas (atributos,campos)

231

Filas (registros, tuplas)

Campo de clave iclave principat) PARTE

Glaveprincipal

Clave externa

de relacional organiza datos forma tablas --: 3ese datos los en de bidimensionales. seilustran Aqu i--::::cias lasentidades para PROVEEDOR y PARTE muestran que cmo representan a cada entidad y .-s Numero-Proveedor clave esuna principal la tablaPROVEEDOR clave para externa ':'ibutos. v una :=-= tablaPARTE. -::-a PROvEEDOR, Numero_proveedor es 1a clave principal. cuand.o el campo Nu_ :-::c-Proveedor apatece enlatabla pARrE se denomin a clave externa y "ri "r"rr_ --: :s un cafnpo para buscar datos sobre el proveedor de una parte especfica. - : = --ablasde anabase de datos relacional se pueden combinar fcilmente Dara ert:::-r los datos requeridos por los usuarios, siempre y cuando dos tablas copartan ::- :-emento de datos comn. suponga que necesitamos encontrar en esta base de :;--s ios nombres y direcciones de proveedores que pted.ansuministrarnos la nar--: ---;rnero r37 ola nmero 150. Necesitaramos informacin de dos tablas: pRo_ r-- =loR y PARTE. Observe que estos dos archivos tienen un elemento de datos : - --r-:artido : Numero_proveedor. =.- una base de datos relacional se ttlTizan tres operaciones bsicas, como se :-- :sra enrafrguita6-5, paragerrerar conjuntos de datos tiles: seleccionar,proyec_ .il: ,' .rnir. La opetacin seleccionar c ea un subconjunto que consta de todos 1os re_ 5b--1-i (filas) de la tabla que cumplen los criterios establecidos.En nuestro ejemplo j; -:::rnos seleccionar registros (filas) de la tabTapARrE donde el nmero de la [ar_ n: i:: a 137 o 150. La operacin unir cornlsina tablas relacionales para dar al usurio :.r' :rformacin de 7a que est disponible en las tablas individuales. En nuestro

0 p e r a c ones un D B MS re la c io n a l de

232

d ete a P ar t e Dos I nf r a e s tru c tu ra c n o l o gd ei n fo rmaci n

s a
o o tt o o

c O O

a
0 o
d n

a o

r o]
fJ

=
G

E) i

.r
N

E
O

1l

=
O G

E
ro o) o o o E

o c) o oI o o

E z z. c,
(J l
IJJ

E
O

d of a

o_ l

e -.4 ru

an

c o -o o,^

E l tr z =
c tn qt
th E tt) l r.O N tl
Q)

.on
OG a- a aE ( o cv

cu

z o
(J

E
l 4 C' an l E tn

fL

G
I

p>
ro o Orc c o a
O

6 E z (
c o c) a

rO

\o

O c O

, =
C'
J

Oo o

e de de administracinbases datos informacin233 de de 6 Captulo Fundamentosla inteligencia negocios: .slo


aflr

se Presentarn 1asParolatabla nueva. iste en las columnas de una

Numero-Probla solamente 1assiguientes columnas: Numero-Parte, Nombre-Patle, veedor y Nombre-Proveedor.

,ffi :""T,n:".i:t"#:i:;-

de red. Un DBMS jerrquico modela relaciones uno a lrl jerrquicos y 1osde red ya no se red modela relaciones muchos a muchos. Los DBMS mucho menos tttTizanpara construir nuevas aplicaciones para bases de datos. Son fines especficos, flexibles que los DBMS relacionales y no soportan consultas con de seguimiencomo 1asconsultas de informacin en lenguaje nal:u;tal.En e1mdulo de1 libro, encontrar to de1 aprendizaje de este captulo,localizado en e1 sitio web ms del1es sobre 1a narrera en que funcionan estos DBMS' proporcionar datos Los DBMS relacionales tienen mucho ms flexibilidad pata informacin de diferentes fuentes, y en consultas con fines especficos, combinar existenagregarnllevos datos y t"girttot sin alterar los proglamas y 1asaplicaciones vuelven lentos si requieren acceder v1'aga. res. Sin embargo, ests stemas se 1os comandos cantidadde veces a 1os datos almacenados en e1 disco para ejecutar Desde 1uego, es posible altnar Ia base de datos para seleccionar, unir y proyectar. acelerar consultas predeterminadas.

DBM S ori entados a obj eto s

que lengan Ia La gran mayora de aplicaciones actuales requierenbases de datos que no s1o contengan nmeros :apcid.ad. para almacenar y recuperar registros video' Los DBMS i, iaracteres, sino tambin dibujos, imgenes, fotografias, voz y fi1as y columnas no son muy ade;iseados para organzar datos structurados en de datos L:-iadospararnaneiar aplicaciones de grficos o multimedia' Las bases pala este propsito' Por ejemplo, lrrla err.-.ientadas a objetos son ms adecuadas que registros de :resa arquitectnica manejaprincipalmente objetos y dibujos ms :esto estructurados. que un DBMS orientado a objetos almacena 1os datos y 1os procedimientos que se Pueden recugerar Y inistracin de bases de datos o porque se Pueden emPlear subprogramas de Java que se mnmente integran la infor=-acin fragrnentada de diversas fuentes' pueden aknacenat tipos de infor-tunque las bases de datos orient adasa objetos lentas aofnpa' =-acin-ms complejos que 1osDBMS relacionales, son relativamente pafa plocesar grandes cantidades de transaccio:.jas con los DBMS relcionales a :::s. ya estn disponibles 1os sistmas hbridos DBMS relacional-orientado de DBMS orientado a objetos y relacional. objetos, parapropotcionar capacdades

DE SISTEMAS ADMINISTRACIN DE CAPACIDADESLOS DE DEBASES DATOS


---:-f BMS incluye capacidadesy herramientas para otganizar, manejar y accedet a , _:-brmaci On de uiabase de datos. Las ms importantes son su capacidad de defi: : : : r deda to s ,s u d i c c i o n a ri o d e d a to s ysul enguaj edemani pul aci ndedatos. de datos para especificar 1a estruc- r- DBMS tiene una capacidadde definicin patactear jel contenido de labase de datos. Esta capacidad se podra :utlltzat -;:. y pata defrnit las caracleristicas de los campos de cada ta;:-.-. de bases de datos en un diccio' : -, =:-rainformacin u"tiude la base de datos podria documentarse

234

ParteDos Infraestructuratecnologa informacin de de nario de datos. Un diccionario de datos es un archivo automatizado o manual que a\macena definiciones de elementos de datos y sus caractersticas. Microsoft Access integra :una caracterstica rudim entaa de diccionario de datos que despliega infotrnacin sobre nombre, descripcin, tarnao, tipo, formato y otras propiedades de cada carnpo de una tabTa cuando se trabaja en la vista Dise o cuando se emplea el Documentador. Los diccionarios de datos para grandes bases de datos corporativas podrian aaptar informacin adicionaT, como la propied,ad, (quin es responsable de dar mantenimiento a 1os datos en 7a organizacin), autorizacin, seguridad, y los individuos, funciones de negocios, programu, rrfor*", qae utlliza cada elernento de datos (veala figura 6_6). "

E l aborac i nd e c o n s u lt a s e n f o r m e s
Un DBMS incluye hertamientas para acceder y rnanipular la informaci n de una base de datos. La rnayoria de los DBMS tiene un lenguaje especializad.ollamado lenguaje de manipulacin de datos, el cual se utiliza putu igr"gur, cambia4 eliminar y teavperar la informacin de la base de datos. Este lenguaje contiene co_ mandos que permiten que 1os usuarios finales y los especialistas en prograrnacin extraigan datos de la base de datos para satisfacer requerimientos de informacin y desarrollar aplicaciones. E1 lenguaje actual de manipulacin de datos ms sobresaliente es el Lenguaje de consultas Estructurado, o sel,. La fr,g.oa 6-7 17usala consulta sQL que producitiaTa naevatabla resultante de la figura-o-s. En 1osmdu_ los de seguimiento de aprendizaje de este captulo puede rrr"r-igo", ms sobre cmo r ealizar consultas SQL.

F IG U R A6 -6

MU ES TR A E U N IN FOR ME E U N D IC C ION A R IO D A TOS D D DE

N OMB R E :SA L AR IO DESCRIPCIN: salario anual empleado del TAMANO: bytes I TIPO: (numrico) N FECHA MODIFICACIN: DE r/1/05 PROPI ETARIO: Compensaciones ACTUALIZAR SEGURIDAD: SEGURIDAD ACCESO: DE personat sitio del praneacin compensaciones Gerente, de planeacin Recursos Gerente, de Humanos Gerente, Asuntos lgualdad Oportunidades de de Gerente, Departamento prestaciones de

pOR: FUNCIONES NEGOCTOS DE UTILTZADAS Compensaciones Planeacin Recursos de Humanos Empleg Seguros Pensiones declaraciones K y 401 ptOiooo PROGRAMAS LO UT|L|ZAN: QUE Pt02000 Pt03000 INFORMES QUELO UTILIZAN: Informe seguimiento incrementos de de satariates Listado revisiones de salariales Listado referencia pensiones de de Lamuestra informe diccionario datos del del de para unabase datos recursos de de humanos proporciona informacin como tamao elemento datos, programas til, el del qu de e informes uiitizan to y grupo la organizacin propietario cuf de esel responsablesumantenimiento. de

de de de admlnistracin bases datose informacin 235 de Captulo Fundamentos la inteligencia negocios: FIGURA 6 .7 S EJ EM PLODE UNA CO NSU L T A q L

PROVEEDOR. PARTE.Nombre-Parte, SELECT PARTE.Numero-Parte, Proveedor PROVEEDOR.Nornbre Numero_Proveedor, PROVEEDOR FROMPARTE, = Proveedor Proveedor PROVEEDOR.NumeTo WHEREPARTE.Numero = AND Numero Parte= 137OR Numero_Parte 150; que los delas deSQL una Aqu ilustran instrucciones para consulta seleccionaproveedores parse las que en producenlista los resultados muestran se 137 Estas tes o 150. instrucciones una con mismos lafigura 6-5.
Los usuarios de un DBMS para cornpl:tadoras grandes o de rango medio, como DB2, Oracle o SQL Server, podrian utllizar SQL para recuperar la informacin que necesitaran de la base de datos. Microsoft Access ta:mbin atlliza SQL, pero ofrece su propio conjunto de l'Lerrarnientas amigables para e1 usuario para realizar consultas a 1abase de datos y para organizar la informacin de una base de datos en informes ms elaborados. Microsoft Access contiene 7as caracteristicas Asistente pata consultas y Vista Diseo de consultas que permiten a los usuarios crear consultas identificando las tablas y los campos que desean, as como los resultados, y luego seleccionando las filas de la base de datos que cumplen criterios especficos.A su vez, estasacciones se rraducen a instrucciones de SQL. La figura 6-8 ilustra \a rrranera en que se puede construir la misma consulta de SQL para seleccionar partes y proveedores, pero utilizando la Vista Diseo de consultas. Microsoft Access y otros DBMS incluyen caractersticas para generat informes que permitan desplegar los datos de inters en un formato ms estructurado y refinado del que sera posible con 1a sola consulta. Crysta1 Reports es un popular genelambin se puede utilirador de informes para grandes DBMS corporativos, a:orqloe zar corr Access. Este 1timo tarnbin cuenta co:n cataatersticas para desarrollar aplicaciones para sistemas de escritorio Incluye henarnienfas para crear pantallas de captara de datos, informes y para desarrollar 7algica para el procesamiento de ansacc10nes. F I G URA-8 EN U N AC O N SU L T A AGC E S S

:tu seilustra manera que podra de 6-7 laconsulta lafigura pormedio las de construir la en se ^e.ramientas Se muestran de deAccess. Diseo consultas de deconsultaslaVista deelaboracin en y los utilizadoslaconsulta. de :s tablas, campos criterios seleccin

236

ParteDos Infraestructuratecnoloqa informacin de de

DISENO BASES DATOS DE DE


Para crear una base de datos usted debe entender las relaciones entre los datos. ei tipo de datos que se conservarn enTabase de datos, cmo se utilizany cmo tendr qae cambiar 7a organizacin parc marrejar 1os datos desde una perspectiva de la empresa como un todo. La base de datos requiere tanto un diseo conceptual como un diseo fisico. El diseo conceptual, o lgico, de una base de datos es un modelo absffacto de labase de datos desde una perspectiva de negocios, en tanto que el diseo fisi.co muestra la rnaneta real en que la base de datos est otganizada en dispositivos de almacenamiento de acceso directo.

N o rma l i za ci n y diagr amas entidad- r elacin


E1diseo conceptual de labase de datos describe Tarnanera en que se agruparnlos elementos en la base de datos. El proceso de diseo identifica 1asrelaciones entre los elementos de datos ylarnanera ms eficiente de agruparlos para que cumplan los requerimientos de informacin de la empresa. E1proceso tarnbin identifica los elementos de datos redundantes y 1asagrupaciones de elementos de datos requeridos por programas de aplicacin especficos. Los grupos de datos se organizan, renan y simplifican hasta que surge una vista lgica general de las relaciones entre todos los elementos de datos en la base de datos. Para atllizar de manera efectiva un modelo de base de datos rclacionaT, es necesario simplificar las agtupaciones complejas de datos para rninirnizar elementos de datos redundantes y complicadas relaciones muchos a muchos. El proceso para crear estructuras de datos pequeas, estables, alr:nqueflexibles y adaptables aparfir de grupos complejos de datos se denominatornrlaliz,acin. Las figuras 6-9 y 6-10 ilustran este proceso. En e1 negocio especfico que se modela aqloi, w pedido puede contener ms de rLnaparte, pero cadapafiela surte solamente un proveedor. Si construyramos una reLacinTTarnadaPEDIDO con todos los campos incluidos aqui, tendriamos que repetir el nombre y 1a direccin de1 proveedor de cada parle del pedido, aun ouando el pedido corrlerrgapartes de un proveedor individual. Esta reTacin contiene 1o que se 11amagrupos de datos repetiuosporque un solo pedido puede contener vna gran cantidad de partes de un proveedor en particuTar. IJnarnanera ms eficiente de ordenar los datos es dividir PEDIDO en relaciones ms pequeas, cada una de las cuales describe a una sola entidad. Si vamos paso a paso y norrnalizamos 1arelacin PEDIDO, e1resultado son las relaciones que se ilustran enTaflrgara 6-10. En e1primer mdulo de seguimiento del aprendizaje de este captulo encontrarrns acerca delanormalizacin,1os diagramas entidad-relaciny el diseo de bases de datos. Los diseadores de bases de datos documentan sus modelos de datos con un diagrarna entidad-relacin, el cual se ilustra enlafrgara 6-11. Este diagrarnamuestra la relacin entre 1as entidades PEDIDO, ARTICULO_LINEA, PARIE y PROVEEDOR. Los cuadros representan entidades. Las 1neas que conectan 1os cuadros representan relaciones. Unalinea que conecta dos entidades y termina con dos marcas corfas designa:unarelacin uno a uno. Una lnea que correcta dos entidades y termina con vnapala de cuervo y vrrarrratca cortaindicaunareTacinuno a muchos. La figura 6-11 muestra que un PEDiDO puede contener muchos ARIICULO LiNEA.

FIGURA- 9

RE LA C ION N OR M AU Z AR AR A P E D ID O SIN P UN
(antes de la normalizacin) PEDIDO

@@w@@@@@@ffi@@@w@ffi@
grupos relacin normalizar puede partes Una sin para pedido. contiene repetidos. ejemplo, haber Por muchas y proveedores cada Existe slo correspondenciauno una uno a entre Numero Pedido Pedido. v Fecha

G ap t ulo6 Fundam en t o s l a i n t e l i g e n c i d e n e g o c i o s :d m i n i s t r a c i d e b a s e s e d a t o se i n fo r m a ci n 2 3 7 de a a n d FIGURA 6- 10 TABLAS NO RM ALI ZADASC R E A D A SA P A R T I RD E P E D I D O PARTE ARTICULO LINEA

t- - - - - - - - - - - - _ _ _ _ _ _ I

PRO VEEDOR

PEDIDO

ffiffiffiffi

ffiffi

Despuslanormalizacin, de larelacin original PEDID0 sido ha dividida cuatro en relaciones ms queda slo atributos relacin y la Larelacin PEDID0 con dos ARTICUL0 tiene cequeas. LINEA una por y Numero_Parte. :lave combinada, o concatenada, conformadaNumero_Pedido

Una PARTE se puede ordenar muchas veces y apatecet :o:nagran cantdad de veces como artculo deTinea en un solo pedido.) Cada PARIE puede tener slo un PRO\-EEDOR, pero e1 mismo PROVEEDOR puede suministrar vrra gra:n variedad de P\RIES. No est de ms recalcarlo: si 1a empresa no implementa su modelo de datos co1ecto, e1sistema serincapaz de servirbienalaempresa. Los sistemas deTacornpa:1ano sern tan efectivos como debieran porqlTe tendrn que trabajar con datos que '-.odranser inexactos,incompletos o dificiles detecaperar.Talvez 1aleccin ms im-,rortante que se puede aprender de este curso es la comprensin de los datos de 1a :ganizacin y de la rna:nera como se deben representar e:nnabase de datos.

Di s t r i b u ci n d e B a se s d e datos
-- diseo de bases de datos tarnbin abarcala rnanera en qrle se distribuyen 1osda. s Se pueden disear sistemas de informacin con una base de datos centralizada :: ie sea ttllizada por un procesador central nico o por mltiples procesadores en -rla red cliente,/servidor. Alternativamente, la base de datos puede ser distribuida. , ra base de datos distribuida es aquella que se aTrnacenaen ms de un lugar fi:--O.

Hay dos formas principales de distribuir una base de datos (vea7a figura 6-12). ::-- una base de datosparticionada, unas partes de la base de datos se almacenan y -:,ntienen fisicamente en un lugar y otras partes se almacenan y mantienen en , -:os lugares (veala figuta 6-I2a) de manera qte cada procesador remoto tenga los

: I G URA-1 1

D IAGR AMA T ID A D -R E LA GIN EN


es pedido penenecea

ES

por suministrado

contiene

r :grama las ARTICULO_LINEA, y PR0muestra relaciones lasentidades entre PEDlD0, PARTE que podran para utilizarse modelar labase datos lafiqura de de 6-10. -l

238

Parte Dos Infraestructura tecnoloqa informacin de de

FIGURA6-12

BASES DATOS DE DISTRIBUIDAS


(b) Base de datos duplicada

(a) Base de datos particionada

Particin de la base Particin de la base A B de datos remota de datos remota

Duplicado la base Duplicado la base de de de datos remota de datos remota

para Existen formas alternativas distribuir base datos. base datos una de La de central puede se (a)de particionar talmanera cada que procesador tenga datos para remoto los necesarios satisfacer propias (b) sus necesidades Labase datos locales. de central tambin puede se replicar entodas las ubicaciones remotas.

datos necesarios para abastecer su rea local. Los cambios en los archivos locales se pueden justificar con labase de datos central apartfu de lotes, con frecuenciaporla noche. Otra estrategia es replicar (es decir, duplicar por completo) la base de datos central (vealafigura 6-72b) en todas las ubicaclones remotas. Por ejemplo, Lufthansa Airlines reemplaz su base de datos de mainframe centtalizada corr vnabase de datos replicadapara quela informacin estuviera disponible de rnanera ms inme-. diata para los despachadores de vuelos. Cualquier cambio que se haga a7 DBMS de Lufthansa en Frankfort se replica autornticarnente en Nueva York y en Hong Kong. Esta estrategia tambin requiere que la aclulaTizacinde la base de datos central se Ttagaen horas de menos carga. Los sistemas distribuidos reducen 1avulnerabilidad de un solo sitio central masivo. Incrementan el servicio y el nivel de respuesta para los usuarios locales y con frecuencia pueden correr en computadoras ms pequeas y menos caras. Sin embargo, las bases de datos locales en ocasiones pueden desviarse de 1osestndaresy definiciones centrales de datos y pTantear problemas de seguridad por la amplia distribucin del acceso a datos delicados. Los diseadores de bases de datos necesitan ponderar estos factores en sus decisiones.

DE Uso oe BAsEs DATos PARA MEJoRAR


E L D E S E M P E OM P RE S A RI A LL A T O M A E Y D E D ECI S I O NE S
Las empresas utilizan sus bases de datos para dar seguimiento a las transacciones bsicas, como el pago a proveedores, el procesamiento de pedidos, e1 seguimiento de 1osclientes y el pago a los empleados. Pero tambin necesitan las bases de datos para suministrar informacin que aSrudara la empresa a rnanejar 1os negocios de rna:aera ms eficiente, y que aytdar a 1os gerentes y a ios empleados atomar rnejores decisiones. Si una empresa desea saber cu1 producto es el ms popular o quin es su cliente :msrcntable, puede e:nco:nlratla respuesta en los datos. Por ejemplo , aI analtzat los datos de compras de sus clientes con tarjeta de crdito, Louise's Ttattoria, :unacadena de restaurantes de Los ngeles, se dio cuenta de

Captulo Fundamentosla inteligencia negocios: 6 de de administracinbases datos informacin 23g de de e la -:'-'.e calidad era rns importante que el precio patala rnayotia de sus clientes, -.-rienestenian educacin universitaria y les gustaba el buen vino. En respuesta a =-i.ainformacin,7a cadena introdujo platos vegetarianos, ms varied.adde maris-:s v vinos ms caros, elevando sus ventas en ms de 10 por ciento. En una empresa grande, con robustas bases de datos o enotmes sistemas para ca*. funcin, como manufactura, ventas y contabilidad, se requier en capacid,ades hey especialespara analizar extensascantidadesde datos y paraacceder datos -:mientas --:sde m1tip1essistemas. Estas capacidades incluyen e7 aTmacenamientode datos, la ::---neria de datos y herramientas para acceder bases de datos internas a travs de .:- \\'eb

ALMACENES DATOS DE
S'-'congaque requiere inforrnacin concisa y confiable acercade las operaciones ac*a1es,las tendencias y los cambios a travs de toda 1a empresa. Si usted ttabajara una empresa gtande, podria dificultrsele obtener esta informacin porque ion -r: :::cuencia los datos se conservan en sistemas separados,como ventas, manufactu:= o contabilidad. Algunos de los datos que usted necesitarapodrian estar en el sisa de ventas, y offos fragmentos en el sistema de manufactura. Muchos de estos -:t : -i:emas son antiguos y heredados, que utlTizan tecnologas de administracin d.e -:--os obsoletaso sistemas de archivos en los cuales es dificil para los usuarios acce:-r a la informacin. Usted podra pasar cantidades de tiempo excesivas localizando y recopilando los 'r:'os que necesitara, o podria verse obiigado atornat sus decisiones conbase en co:- - :,miento incompleto, si requiriera informacin sobre tendencias, tambin podria ,-::er problernas para encontrar los datos acereade sucesospasados porque la rna::a de las empresas slo ponen a disposicin inmediata sus datos actuales. El a1:: =:enamiento de datos resuelve esos problemas.

,.Qu e s un al mac n de dat o s ?


: altnacn de datos es unabase de datos que almacena datos actuales e histri- . de potencial inters para los encargados deLatorna de decisiones de toda 1a :l--3resa Los datos se originan en muchos sistemas de transaccionesoperativas :::.-cia1es, como 1ossistemas de ventas, cuentas de clientes y manufacttra, y po-. :r incluir datos derivados de transacciones en sitios Web. El alrr'acn de datos :-,soliday estandariza inforrnacin de diferentes bases de datos operativas con el : -:sito de que 7a informacin se pueda utlTizar a travs de 1a ernpresa para .-:-Lllsis 1a toma de decisiones por parte de 7a administracin. y -, z figura 6-13 ilustra larnanera en que funciona un almacn de datos. El aTrna..:-- le datos pone los datos a disposicin de quien los necesite, pero no se pueden :- :-dcar. un sistema de al;rnacn de datos tarnbin proporciona unavaried.ad. d,e --::rmientas de consultas con fines especficos y estandarizadas, herramientas . '--,-icasy caractersticasgrficas parala elaboracin de informes. Muchas emrrreportales de intranets parapor.et la informacin de los almacenes ai aa-.: ---'fizan ' , .iisposicin de todaTa empresa. -.-

h e r c a d o s d e d a to s
:-.-:ecuencia, 1ascompaas construyen aTrnacenes datos a nivel general dela de : :':::sa, en los que un aTmacn datos centraTabastece atodaTa organizacin,o de :..-' zlmacenes descentralizadosms pequeos llamados mercados de datos. un nercado de datos es un subconjunto de an aTrnacnde datos en e1 que ur'a patte - : : --r- ,da o altamente enfocada de los datos de Ta organizacin se coloca en unaba' -: tratos separada para \7:na poblacin especfica de usuarios. por ejempl0, una - .:,-;'ia puede desarrollar mercados de datos de marketing y ventas para rnanejar , - :nacin de 1osclientes. Por 1o comnr 1r rrrercado de datos se enfoca en vrra , ;,::a objetivo o lnea de negocios,por 1o que usualmente se puede construir ms - : - -' a un costo ms bajo que un aTrnacnde datos a nivel de todala empresa.

240

ParteDos Infraestructuratecnoloqa informacin de de F IG U R A .T 3 C O MP O N E N TE S U N A LMA C N E D A TOS DE D

FUENTES DE DATOS INTERNAS

. Consultas e informes . OLAP . Minera de datos FUENTES DE DATOS EXTERNAS

Elalmacn datos de extrae actuales datos e histricos demltiples sistemas operativos dela dentro organizacin. datos combinan datos fuentes Estos se con de y se externas reorganizan base enuna de para datos central diseada elaborar y anlisis laadministracin. para informes Eldirectorioinforde macin suministra informacin usuarios delos a los acerca datos disponibles almacn datos. enel de

I N T E L I G E N C IA NEGOCIOS, DE ANL ISIS DAT OS DE MULTIDIMENSIONALES Y MINERN DATOS OE


una vez que se h.an captarado y organizado 1os datos en almacenes de datos y en rnercados de datos, estn a disposicin para anIisis ms profundos. Una serie de herralr;rientas permite a los usuarios anallzar estos datos para descubrir nuevos patrones, relaciones y conocimientos profundos para orientar latorrra de decisiones. Estas herramientas para consolidar, analizat y dar acceso a extensas cantidades de datos para ayudar a los usuarios a tomar mejores decisiones de negocios con frecuencia se denominan inteligencia de negocios (Br). Las principales lterra:nrienlas para 1a inteligencia de negocios incluyen software para consultas e informes de bases de datos, herramientas pata anlisis de datos multidimensionales (procesamiento ana\itico en lnea) y rnineria de datos. cuando pensamos enlainteligencia como se aplica a 1oshumanos, por 1ogeneral, pensamos enl'a capactdad deTa gerrle pata combinar el conocimiento aprendido con nueva informacin y carnbiar comportamientos con la idea de aTcanzar xito en su el actividad o adaptarse a vna nll.eva situacin. De manera similaq 1a inteligencia de negocios da a las empresas la capacidad de acumaTar informacin; desarrollar conocimiento sobre clientes, competidores y operaciones internas, y cambiar la rnanera de tomar decisiones patalograr una rentabilidad ms alta y otras metas de negocios. Por ejemplo Harrah's Entertainment, 1a segunda empresa de apuestas ms grande en su industria, anaTizacontinuamente los datos sobre sus clientes recopilados cuando la gente juega en sus mquinas tragamonedas o cuando acude a sus casinos y hoteles. El deparlarnento de marketing de Harrah's uttliza esta informacin para construir un perfil de apuestas detalTado,con bass en e1valor continuo de un cliente en particular paru7a empresa. Esta informacin orienta 1asdecisiones de 1a administracin sobre Tarnanera de cultivar a los clientes ms rentables, animar a esos clientes a gastar ms y atraer tns clientes con un potencial alto de generacin de ingresos. La inteligencia de negocios ha mejorado tanto las utilidades de Harrah,s que se ha convertido en 7a pieza central de 1a estrate gia de negocios de la empresa.

Captulo Fundamentosla inteligencia negocios: 6 de de administracinbases datos informacin 241 de de e La figura 6-14 ilustra la :nLaneraen que funciona la inteligencia d e negocios. Las :ases de datos operativas de la empresa dan seguimiento a las transacciones que se :eneran por e1 manejo de1 negocio. Estas bases de datos alimentan inforunaci|n a7 z--macnde datos. Los gerentes ulllizan las herramientas de inteligencia de nego:.os para encorrtrat paffones y significados en 1os datos. A continuacin, los geren:es aprovechan 1o que ltan aprendido del anlisis de 1os datos tomando decisiones ie inteligencia de negocios ms informadas Esta seccin le presentar las tecnologas y herramientas de inteligencia de ne=ocios ms importantes. En e1 captulo 12 1e proporcionaremos ms detalles acerca :e ias aplicaciones de inteligencia de negocios.

Pro ce sa mi ento anal ti c o en l n e a ( 0 L A p )


S;ponga que su empresa vende cuatro diferentes productos -tuercas, pernos, aran:e1as y tornillos- en las regiones Este, Oeste y CentraT.Si usted quisiera |tacer una :regunta bastante directa, como 1a cantidad de arandeTasvendidas durante el trilestre pasado, podria encontrar facilmente 1arespuesta consultando su base de da:os de ventas. Pero qlo pasaria si quisiera saber la cantidad de arandelas vendidas =:: cada una de sus regiones de ventas y comparar los resultados reales con las ven=s proyectadas? Para obtener la respuesta, usted necesitara el pr,ocesamiento analtico en lnea (OLAP). OLAP soporta e1anlisis de datos multidimensionales, el cual permi:e a ios usuarios ver los mismos datos en diferentes formas utllizando mltiples dirensiones. cada aspecto de la informacin -producto, precio, costo, regin o reriodo- representa una dimensin diferente. As, un gerente de producto podria ''jftzar waherrarnienta de anlisis de datos multidimensionales para saber cun--asarandelas se vendieron durante junio en e1 Este, cmo se cofnpata esto con el ::-es anterior y con el mismo mes de1 ao pasado, y cmo se compara con el prons-co de ventas. OLAP permite a los usuarios obtener respuestas enlineaa preguntas :specficas como las anteriores en un lapso de tiempo sumamente rpido, aan ::ando los datos estn almacenados en bases de datos bastante grandes, como las -:.zas de ventas de varios aos. La figura 6-15 muestra un modelo multidimensional que podria crearse parare::esentar productos, regiones, ventas reales y ventas proyectadas. rJna matrtz d.e F I G URA- 14 IN T E U GE N C IA E N EGOC IOS D
-.g-8.3@%ffi#::1,

Bases de datos

Almacn de datos

Inteligencia de negocios

..------->

--------)

Seguimento de las transacciones

Bsqueda de patrones y conocmentos profundos

Decisin para responder a los datos y los patrones

de analticas trabajan lainformacin con --= 'erie herramientas almacenada bases datos enlas de patrones :--encontrar y conocimientos profundos ayudarlos para y empleados a gerentes a tomar -E:'es decisiones una para mejora eldesempeo orqanizacin. en dela

242

ParteDos Infraestructuratecnoloqa informacin de de

FIGURA 6-15 MODELO DATOS DE MULTIDIMENSIONALES


Proyectado

Tuercas PRODUCTOPerno
Arandelas Torni l l os

que Lavista semuestra producto gira es regin. usted 90 grados cubo, cara se contra Si que el la y mostrar producto es ventas contra reales proyectadas.lo vuelve girar, Si a tendr vistade la una y regin contra ventas reales proyectadas. pueden Se tenerotras vistas. ventas reales se podra apilar sobre una rnatriz de ventas proyectadas para forrnar un cubo con seis caras. Si gira 90 grados e1 cubo en una sola direccin,la cata qlue se muestra ser e1producto contra las ventas reales y las proyectadas. Si girag0 grados el cubo de nu.eva cverrfa, ver7a regin contra 1asventas reales y 1asproyectadas. Si 1o gira 180 grados apartir de 1a vista original, ver las ventas proyectadas y el producto contra 1a regin. Los cubos se pueden anidat dentro de cubos para construir vistas de datos complejas. Una empres a podria rtlTizar una base de datos multidimensionaT especializada o unahetrarnienta que genere vistas de datos multidimensionales en bases de datos relacionales.

Mi nera de dat o s
Las consultas de bases de datos tradicionales responden preguntas como "Cuntas unidades de1 producto nmero 403 se ernbarcaron en febrero de 2007?" OLAI o anlisis multidimensional, soporta solicitudes de infotmacin mucho ms complejas, como "Comparar las ventas de1 producto 403 respecto de 1o planeado, por trimestre y regin de ventas, de los dos aos anteriores". Con OLAP y el anlisis de datos orientado a consultas, 1os usuarios necesitan tener unabuena idea sobre la informacin que estn buscando. La rninetia de datos est ms orientada a1 descubrimiento de informacin. La rnineria de datos proporciona conocimientos acerca de los datos corporativos que no se podran obtener con OLAI al enconlrar patrones y relaciones ocultas en robustas bases de datos e infiriendo reglas a partir de el1ospara predecir e1 comportamiento futuro. Los patrones y las reglas se utlTizan para orientar \a torna de decisiones y predecir el efecto de tales decisiones. Los tipos de informacin que se pueden obtener apartir delarnineria de datos incluyen asociaciones, secuencias, clasificaciones, agrapaciones y pronsticos. o Las asociacionesson ocurrencias enl,azadasa un solo evento. Por ejemplo, un estudio de los patrones de compras de un supermercado podtia revelar que cuando se compran hojuelas de rnaz tarnbin se compra, en un 65 por ciento de 1asveces, unabebida de co7a,pero cuando lnay alg:unapromocin se compravnabebida de cola en 85 por ciento de 1asveces. Esta informacin ayuda a los gerentes a tomar mejores decisiones porque se han dado ouenta de 7a rentabilidad de las promociones. En 1assecuencias,1os eventos se enlazan con e1paso del tiempo. Por ejemplo, podramos encontrar que si se compra una casa, 65 por ciento de las veces se

Gaptulo Fundamentosla inteligencia negocios: 6 de de administracinbases datos informacin 243 de de e cornprar un nuevo refrigerador dentro de 1assiguientes dos semanas, y que al mes de l.a cornpta de la casahabr un 4s por ciento de veces en oue se comprar un horno La clastficacin reconoce paffones que describen el grupo al caalpertenece un elemento por medio de1an1isisde 1oselementos existentes que se han clasificado y por medio de 1ainferencia de un conjunto de reglas. por ejemplo, 1as empresasde tarjetas de crdito o las telefonicas se preocupan pot 7ap&dda de clientes permanentes. La clasific acin aytda a descubrir las caractersticas de 1osclientes que se podran perder y puede aportar un modelo para a5ud,ara 1osgerentes a predecir quines son estos clientes e id,ear carnpafas especiales para retenerlos E\ agrupamiento funciona de una rnarrera semejante a la clasificacin cuando an no se han definido grupos. rJnahenamienta de mine'ria de datos puede descubrir diferentes agrupamientos dentro de 1os datos, como encontrar grupos de afinidadparatarjetas bancarias o particionar unabase de datos en grupos de clientes por sus caractersticasdemogrficas y e1tipo de sus inversiones personales. Aunque estas aplicaciones incluyen predicciones,la generacinde Ttronsticos t:.rlTiza predicciones de ulta rnar'era distinta. Emplea una serie de valores las existentes para pronosticar qu otros valores habr. por ejemplo ,la eTaboractn de pronsticos podra encontrar patrones en los datos para ayud.ata 1osgerentes a estimar el valor futuro de variables continuas, como ciflas de ventas. Estos sistemasrealizan anlisis de alto nivel sobre paones o tendencias, pero tam:-n pueden profundizar para ofrecer ms detalles cuando sea necesario. Existen .-rlicaciones de rnineria de datos paratodas las reas funcionales de una empresa, al -:.ral que para er gobierno y e1trabajo cientfico. uno de 1osusos populares de la mi'-'-era datos es ofrecer anlisis detallados de patrones existentes en los datos de de , --entes pata realizar campaas de marketin g o para identificar clientes rentables. Por ejemplo, Virgin Mobile Australia utllizaun aTrnacnde datos y nrinea de d,a, - s para incremenla'r TaIealtad del cliente y presentar nuevos servicios. El aTrnacn *= datos consolida e:nuna enorme base de datos la informacin de su srstema em::esarial, su sistema de administracin de las relaciones con el cliente y los siste::--asde factaracin a1 cliente. La rnine'ria de datos ha permitido a7a adrninrstracin --=erminar el perfil demogrfr.co nuevos clientes y relacionarlo con los equipos de hayan comprado. Tambinha ayudado a la administraciln a evalaar el desem-..-.e :.io de cadatienda y de las campaas en e1punto de venta,las reacciones del con. --midor a nuevos productos y servicios, los ndices de desercin de clientes y los generados por cada cliente. -r--:resos El anlisis predictivo atlizatcnicas dernineriade datos, datos histricos y supo. -rones sobre condiciones futuras para predecir resultados de eventos, como la pro':.cilidad de que un cliente responder aunaofertao cotnprarun producto especfiPor ejemplo, 1a divisin estadounidense de The Body shop International plc - --z an7isispredictivo con su base de datos de clientes de catIogo,la Web y de las --::das para identificar clientes que tuvieran ms probabilidad de realuar compas por :.-,-iogo Esa informacin ayr-rd la empresa a construir una lista de correos ms a -: ::isa y dirigida para sus catlogos, con 1o cual mejor la tasa de respuesta a los co::,)s con ofertas de catlogosy a los ingresos por ventas de cat7ogo. - a mineria de datos es una ltenarnienta poderosa y rentable, pero plantea ries> tara la proteccin de 1aprivacidad individual. La tecnologia de rnineria de datos ---ie combinar inforrnacin de muchas fuentes diversas palra crear Ltna',irnagerr : :atos" detaTlada sobre cada uno de nosotros -nuestros ingresos, nuestros hbi. -le conducir, nuestras aficiones, nuestras familias v nuestros intereses polticos. :--- =- captulo 4 se analiza la cuestin sobre si se debe permitir a las empresas reco: ': esta informacin deIaTladaacerca de los individuos. La Sesin Interactiva sobre .::-'-^:izacior'es explora e7 debale acerca de si 1asgrandes bases de datos que alma-

244

de de ParteDos Infraestructuratecnologa informacin

EL CONTRA CRIMEN0 LUCHAR PARA BAsEs DE DATosDEADN:ARMA A AMENAZA LA PRIVACIDAD?

no pudieron hallar ningun sospechoso Posterrorment", 1 to de rtarzo de 2006, detectives deColchester' Cnnecticut, anunciaron que Robert Sheiton,Mitchell' podra ser de 43 aos, de New Britain, Connecticut,

por otro delito. ' una poderoLu pro.budei ADN se ha convertido en enTa lucha contra el crimen' pues persa heriamienta proplos gemite identificar avn delincuente por sus es posibie nes. Mediante el anlisis por computadora de un delincuente al comparar descubrir la identidad que no inocentes si contienen datos sobre personas se ha recoson crlminales convictos En algunos casos

bajan con este sistema' de la poE1 sistema CODIS bta aytdado a 1os agentes sospechosos en ms de 11'000 casos' Iica a identificar

podria verse cia decidieta ignorarlas. Gente inocente si e1 ADN de envuelta en una rnvestigaci'n criminal

b.

de de administracin bases datose informacin 245 de de Captulo6 Fundamentos la inteligencia negocios: ,ino de sus cabellos o de su saliva en un vaso debelida :,Jarectera en un lugar pblico o privado en e1 cual tu-'reran todo el derecho de estar. auentes:StaceyStowe,"10 Yearsafter Girl's Murder, DNA Link Re. -:ltsin Arrest", y Harlan Ler.ry, "CaughtUp in DNAs GrowingWeb",
The New York Times, 77 de marzo de 2006; "Genetrc Privacy", www epic org, accedido e13 de agosto de 2006; y John Soiomon, "FBI's Massive DNA Database Helps ID Suspects", USA Tbdag, B de marzo de 2004

DE DE FREGU N T A S LC A S O EST UDIO


Cules son 1osbeneficios de 1asbases de datos de .{DN? Qu problemas plantean 1asbases de datos de ADN? Quines deben incluirse en una base de datos naciona1 de ADN? Debe limitarse a criminales condenados? Explique su respuesta. .:Quines deben tener 7a facultad de utlTizar bases de datos de ADN? Explore el sitio Web del Sistema Combinado de Calalogacin de ADN (CODIS) y responda 1as preguntas siguientes. 1. Cmo funciona ei CODIS? Cmo est diseado? 2. Clu informacin mantiene el CODIS? 3. Quin tiene autoriz acin para ttlTizar e1 CODIS? 4. Cno ayuda e1 CODIS en 1as investigaciones criminales?

perfiles de ADN utilizados en 1a lucha contra el crimen representan una . --itan '.naza alaprivacidady albienestar social.

Y BASES DATOS LAWEB DE


-- .nna vezlta intentado utllizar la Web para coLocarun pedido o ver un catlogo ': irroductos? Si es as, probablemente estuvo empleando un sitio Web enlazado a corporacin. Muchas empresas uttlizan altora r-..base de datos interna de aTguna . -,\eb para poner parte de la informacin de sus bases de datos internas a disposi:: de sus clientes y socios de negocios ?or ejemplo, suponga que un cliente con un navegador Web deseabuscar infor. ion de precios en la base de datos de un detallista en linea. La figura 6-16 ilus. ,a nranera en que ese cliente podria acceder alalase de datos interna del deta. ; a travs de la Web. El usuario accede al sitio Web del detallista por medio de ' .rnet, atlTizandoun navegador Web instalado en su PC de1cliente. EInavegador .'r de1usuario solicita datos a la base de datos de la organizacin, utilizando co,::dos de HTML para comunicarse con e1servidor Web '-,estoque muchas bases de datos "de respaldo" no pueden 77-rrerprelar coman. :scritos en HTML, el servidor Web pasa 1assolicitudes de datos a software que los --..rce comandos HTML en SQL para qe los pueda procesar el DBMS que fia' , ,'-con la base de datos. En un entorno cliente,/servidor, el DBMS reside en una .-:utadora dedicada denominada seavidor de base de datos. E1 DBMS recibe . rllcitudes de SQL y suministra los datos requeridos. E1 middleware transfiere . :'rrracindesde 1abase de datos lnterna deTaorganizacin de regreso al servidor - 'rara que se entregue en forma de pgina Web al usuario. -.- -igura 6-16 muestra que el middleware que funcion a e:ntreel servidor Web y el : lS podra ser un servidor de aplicaciones ejecutndoseen su propia computado. :',cada(vea e1captulo 5). El software servidor de aplicaciones maneja todas las .,.:iones de las aplicaciones, incluyendo e1procesamiento de transacciones y el - a datos, entre las computadoras con navegadoresy las aplicaciones de nego. -asbases de datos de respaldo de una empresa. El servidor de aplicaclones to, --citudes de1servidor Web, ejecuta 7algica de negocios para procesar transac. ) con base en dichas solicitudes, y proporciona 1a conectividad a los sistemas o - -re datos de respaldo deTa organizacin. De Ttra:nera aTlernativa, el software papodra ser un prograrnapetsonalizado o un script de ,,:-.ejar estas operaciones - r script de CGI es un programa compacto que ultTiza1a especificacin Interfaz ',-:LLertct EnlcLce (CGI) para plocesar los datos en un servidor Web. de

246

ParteDos Infraestructuratecnoloqa informacin de de F IGU R A6 -1 6 EN L A C E E LA SB A S E S E D A TOS TE R N A S ONLA W E B D D IN C

Cliente con un navegador Web

Servidor Web

Servidor de Servidor de aplicaciones basede datos

Baseoe datos

Los usuarios accedenla base datos a de interna unaorqanizacin de a travs laWeb, de utilizando y un susPCs escritorio navegador. de

Existen varias ventajas a7 utllizar la Web para acceder a las bases de datos internas de una organizacin. Primero, un navegador Web es ms sencillo de utITzar q.oe las herramientas de consulta propietarias. segundo, l,ainteaz web requiere pocos cambios o ninguno a la base de datos interna. cuesta mucho menos agregar una interfaz Web a un sistema heredado que redisear y volver a construir el sistema para rnejo'rar el acceso de 1osusuarios. E1 acceso a bases de datos corporativas a travs de la Web est creando nuevas eficiencias, oportunidades y modelos de negocios. ThomasNet.com proporciona un directorio enTinea actualizado de ms de 650,000 proveedores de productos industriales, como qumicos, metales, plsticos, hule y equipo automotriz. Con el nombre anterior de Thomas Register, la empresa acostumbrab a enviar enormes catlogos impresos con esta infornacin iGo.com es una empresa en Internet que vende bateras y accesorios para telfonos celulares y dispositivos de cmputo. Su sitio Web enlaza a una base de datos relacional de gran tarnao que contiene informacin de productos como bateras y perifericos para casi todas las marcas y modelos de telfonos celulares y dispositivos electrnicos porltiles.

Elsitio deInternet Web Movie Database seenlazauna a que enorme dedatos base incluye resmenes, informacin y biografas derepartos de actores casi de todas las pelculas sehan que filmado.

li ri6gqri3f

ltiirB;'_

tu

lT@ tuve | gbeE

I rtudr

Fh

I EE{.

| &!q

r"'tffi,nfii!tl F ne !t i

lblrGrffitffio[f,$Fffi
vFfred by @r 38 milotr tMe lNrs Qach hoh: AiMble JobB d lMOb

ilE^dPftt--rs,
ile@tE

i
I - --l

Welcome to the Intemel lvlovie Dslabase, lhe bigged, best, most awrd-wrning movie site on ihe p l a n d W a n t to m a ke l h 4 D byo u r h o m e p a g e ? D r a g i h i s l i n k o n to yo u r t H o m e b u n o n

tY:j1:]1|:j:#.*---__-i
:i-imefs--1ffi.-I il .!.,
Itir;:

lMDh Snapshot: Nw on the Site


Premere

ir*i

3s

Beer{est

Eveoorc's

Heru,Ike ita*lcarc, Halt Ches,

Wcicer Nelson,

fuln Tratslewers ]El?ts, Word Trade Ceiltel

NawT!.: TapI*ia:

Aile4cah PO1C:

LvaJ Mans

Tallaetu

More Tops Top Quoes - Prral: oflhP Cilbben oed fu'lan hEsi s " ' M! SUFr Ex'Grritileni

' SlRkes Dn a Plane ' Akelh ard the Ee

'tes[-q!]/c-Yr
" 9nolvreke ' Lndri ip SqhtsI

'E4tErq-rq!rd

de de administracin bases datose informacin 247 de de Gaptulo6 Fundamentos la inteligencia negocios:

DE DE Aomrnrsrnncln LosREcuRsos DATos


La implementacin de una base de datos es s1o el cornienzo. Para asegvrarse de que los datos de su negocio permanecern exactos,confiables y disponibles con facilidad para quienes los requieran, su empresa necesitar polticas y procedimientos especialespara la administracin de datos.

DEUNAPOLITICA ESTABLECIMIENTO
DEI NF O R M A C I O N
Todas1asemplesas, grandes y pequeas, necesitan una polti.cade informacin. Los datos de su emplesa son un reculso importante, y a usted noTe agradat que los demsh.agan con ellos 1o que se les antoje. Usted necestlar contar con reglas sobre 7a ma1neraen que se organizarn y rnantendrn 1os datos, y quin tendr autorizacin p ar a verlos o modifi carlos. especifica las reglas de 7a organtzacin para cornUna politica de informaciiln partir, distribair, adqtirir, eslandarizar, clasificar e inventariar la informacin. Una poltica de informacin establece procedimientos y responsabilidades especficos, que ldentifican cules usuarios y unidades dela organizacin pueden compartir inrcrmacin, dnde se puede distribuir la inforrnactn y quin es responsabTede ac.'alizar y mantener la informacin. Por ejemplo, una poltica de informacintpica todria especificar que s1omiembros seleccionados de 1os departarnentos de nmira 'de recursos humanos podrian tener autorizacin para modificar y vet datos de--cadossobre empleados, como sus salarios o sus nmeros de seguro social, y que =stosdepartamentos son responsablesde garantizar que tales datos sean exactos. Si usted est en una emptesapequ:efla, talvez 1ospropietarios o los gerentes es--iclezcan la poltica de informacin. En ana organtzacin gtande, e1 manejo y la !-aneacin de 1a informacin como un recurso corporativo con frecuencia requiere de datos es r--,a funcin formal de administracin de datos. La adrninistracin .sponsable de 1aspolticas y procedimientos especficospor medio de los cuales se :;eden manejar los datos como un recurso organizacional. Estas responsabilidades -:--lnven desarrollar Iapoltica de informacin, planificar los datos, supervisar e1di.::ro 1gico de 1a base de datos y el desarrollo de1 diccionario de datos, y vigilar 7a :'.-1era en que los especialistasen sistemas de informacin y los grupos de usua. - - s finales :uttlizan 1os datos. utlTizado para TzIvez haya escuchado el trmino gobierno de la informacin muchas de estas actividades. Promovido por IBM, el gobierno de la infor-.scribir ::--=;in se errcargade 1aspolticas y plocesos para manejar la disponibilidad, usabi:::- integridad y seguridad de los datos empleados en'o:naempresa, con un nfa.-= ;special en promoverTaprivacidad, la seguridad,Ta caTidadde los datos y el --::-climlento de 1asregulaciones gubernamentales' '--.ta orgarlizacin grande tarnbin tendr un grupo de diseo y administracin :. iases de datos dentro de la divisin de sistemas de informacin corporativa, resde - :---.able definir y organizar 1a estructura y contenido de labase de datos, as co:-. :: su mantenimiento. En estrecha cooperacin con los usuatios, e1grupo de di..r- :stablece labase de datos fisica, las relaciones lgicas entre 1os elementos, y . -.g-as de accesoy los procedimientos de seguridad. Las funciones que desempecomo administracin de la base de datos. ', -: -onocen

DE DELA ASEGURAMIENTO CALIDAD DATOS


- ; :ise de datos y una po1tica de informacinbien diseadas contrTbvirn a ga-"---:;r que la empresa tengala informacin que necesita. No obstante, se deben la r --::.:-ler acclones adicionales para aseglJrarq17e informacin de lasbases de '-a organrzacin sea exaola y confiabie.

248

de de ParteDos Infraestructuratecnologa informacin Qu pasara si e1nmero telefonico o el saldo dela cuenta de un cliente fueran incorrectos? Cul seria el impacto si la base de datos tuviera un precio errneo parael producto que usted vendi? Los datos imprecisos, a destiempo o inconsistentes en reTacin con otras fuentes de informacin conducen a tornar decisiones incorrectas, devolucin de productos e incluso prdidas financieras. De acuerdo con Forrester Research,20 por ciento de1correo y de las entregas de paquetes comerciales en Estados Unidos fueron devueltos debido a nombres o direcciones incorrectos. Los consultores de Gartner Group repofiaron que rns de 25 por ciento de la informacin crilica de las bases de datos de grandes empresas de Fofiune 1000 es imprecisa o est incompleta, incluyendo cdigos y descripciones de producto equivocados, descripciones de inventario deficientes, datos financieros errneos, informacin incorrecta de proveedores y datos incorrectos de empleados. Gartner clree que los datos de clientes pierden caTidada un ritmo de 2 por ciento mensual, lo cual hace que 7a calidad de datos deficiente sea uno de 1osprincipales obstculos para administrar con xito las relaciones con el cliente (Gage y McCormick, 2005; K1au, 2003). Piense en todas 1asocasiones en que ha recibido varias piezas de la misma publicidad por correo directo dutanle e1 mismo da. Muy probablemente ste sea e1 resultado de que su nombre est varias veces en una base de datos. Su nombre podria haber sido mal escrito o quiz :utiliz su segundo nombre en una ocasin y no en txa, o talvez 1a informacin se introdujo inicialmente en un formulario en papel y no se digitaliz de rnarrera adecaada en el sistema. Debido a estas inconsistencias, la base de datos lo trataria a usted como si ftteran diferentes personas! Con frecuencia recibimos coffeo repetitivo dirigido a Laudon, Lavdon, Lauden o Landon. Si una base de datos est debidamente diseada y se han establecido estndares de datos paratodala empresa, 1os elementos de datos duplicados o inconsistentes debern ser mnimos. Sin embargo, la mayora de 1os problemas de calidad de datos, como nombres mal escritos, nmeros traspuestos o cdigos incorrectos o faltantes, se derivan de errores durantelacaplu:ra de datos. La incidencia de tales errores se est incrementando a medida que las empresas desplazan sus negocios a 1a Web y permiten a los clientes y proveedores introducir datos en sus sitios Web que actualizan directamente sus sistemas internos. Ante s de que una nueva base de datos entre en funcionamiento, 1as o'rganizacioy establecer mejores rutinas nes tienen que identificar y corregir 1osdatos "rrln"o, qlJe sus bases de datos estn operando. El anlisis de la capara editar datos una vez lidad de datos suele ernpezat con,una arditoria de la calidad de los datos, que es un sondeo estructurado de la exactitud y nivel de completitud de los datos que hay en un sistema de informacin. Las auditoras de la calidad de los datos se pueden realizar sondeando archivos de datos completos, sondeando muestras de los archivos de datos o sondeando a 1os usuarios finales acerca de su percepcin de 7a calidad de datos. La depuracin de datos, tambin conocida como limpieza de datos, consiste en actividades para detectar y corregir datos de una base de datos que sean incorrectos o incompletos, tengan un formato inadecuado o sean redundantes. La deputacin de datos no s1ocorrige effores sino que tarnbinimpone 1a consistencia entre diferentes conjuntos de datos originados en sistemas de informacin separados. NASCAR, descrita en e1caso con que inicia el capitwTo,necesitaba uttzar la deptnacin de datos para eliminar inconsistencias y errores en los datos provenientes de m1tiples fuentes cuando gener su amplia base de datos de aficionados. Existe software de depuracin de datos especializado para sondear automticamente archivos de datos, corregir errores en los datos e integrar los datos en un formato consistente para toda 1a empresa. La Sesin Interactiva sobre Administracin describe algunas empresas que padeci.eron problemas de calidad de datos ylarnaneta en que trata'ron de solucionarlos. Estos problemas eran multifacticos. A medid a qwe lea e1 caso, busque 1os factores administrativos, organizacionales y tecnolgicos que produjeron estos problemas de caTidadde datos ylarnanera en que 1os enfrentaron.

G ap t ulo6 Fundam e n t o s l a i n t e l i g e n c i d e n e g o c i o s :d m i n i s t r a c i d e b a s e s e d a t o se in fo r m a ci n 2 4 9 de a a n d

qUE PUEDE SE HACE R BRE CALI DAD LO S SO LA DE DATO S ?


: - Group, antes British Telecom, bata77durante mu-s aos con los problemas de caTidadde datos. Datos . : :cientes sobre e1inventario de productos y errores en - acturacin a clientes fueron obstaculizando sus inte.,crones con proveedores y clientes. BT Group estaba .:.s:ando demasiado tempo y dinero en corregir datos BT Group comenz atomar en serio Ia calidad de da> en 1997. Nigel TUrner, getente de proyecto para 1os - , gramas de calidad de datos de BT, seleccion a un :.:r-rpen"de calidad de datos en cadauna de 1as prin---ales1neas de negocios de BT para conducir un foro '. administracin de 1a informacin. Cada grttpo de ad' :ristracin deTainforrnacin se enfoc en proyectos .:-.e cficos con retornos sobre 1a inversin demostra.-s como mejorar e1 mantenimiento de registros de in.:rrario prlado para inctententar e1 nmero de crcui. ciesconectados devueltos a1 inventario para , -.:ihzarlos o corregir nombres y direcciones en datos . :rarketing para reducir e1 nmero de cartas enviadas .s personas equivocadas A medida que el proyecto ,. =r,panda, el grupo de Thrner cenftaTiz la admlnis-,in de datos y desarroll una metodologia de caTidad '' jaros que incorpor las mejores prcticas tanto inter:! como externas a la empresa. \1 mejorar 7a calidad de sus datos, BT Group ahorr . :dedor de 800 millones de dlares en datos mejora. de inventario e interacciones con clientes y provee: es, e increment 1os ingresos por medio de wa fac..crn ms exacta. Para rnantener un alto nivel de .,-:lad de informacin en sus bases de datos, BT uttliza .::antientas de creacin de perfiles y depuracin . :aros de Tfillium Software para identifi.car y elimi.- datos errneos de maneta permanente. rlrerson Process Management, un proveedor mun.' ..-- lnstrumentos y sewicios de medicln, analticos cie j. , ,-, .!; ^it ^- ^i^ 15ua1rur4^ - urrurflS en AuStin, Texas, tuvO que uurr ^ t : ^ i ^ r-ar un afutacn de datos nLlevo, diseado para anali- a actividad de los c1lentes, pata ntejorar e1 servicio :' r-rarketing porque e7 alrnacn estaba repleto de da-:.nprecisosy redundantes Los datos de1 aTmacn --- "enan de numerosos sistemas de procesamiento de r.r--sacclones Europa, Asia y otras pattes del mundo. en r :r.rpo quehabia diseado e1 almacn habia dado por , :-o que 1os grupos de ventas de todas estas reas po.: ingresar 1os nombres y direcciones de los clientes ' -. r-nisma forma, independientemente de su ubica:- qeogrfica En la prctica, 1asdiferencias cultura. ::-Lcombinactn con 1as complicaciones derivadas , .. absorcin de empresas que Emerson habia adqui. -ondujeron a diversas formas de ingresar cotizacio:: -ctrs, embarques y otros datos :::rerson implement herramientas de software de :...d de datos de Group 1 Software Inc en Lanharn, Maryland, para ayudar en 1a creacin de perfiles, depuracin y combinacin de registros para el altnacn de datos La informacin de clientes para cotizaciones, facturas y embarques est enTazadaa registros de transacciones asociados, los registros duplicados se eliminaron y ios datos se combinaron utilizando herramientas de Group 1, software personaTizado y procesos manuales de revisin La integracin de datos de m1tip1es operaciones de negocios tanbin plante retos en 1a empresa Cintas, que cornenz en el negocio de uniformes para empleados y luego se expandi a 1a provisin de suministros de Tirnpieza a empresas y tambin a servicios de aTmacenamiento de documentos En Ia actualidad, Cintas tene m1tip1es divisiones para estas lneas de negoolos y desea integrar ios datos de sus clientes en un almacn de datos para mejorar las ventas cruzadas pero algunos clientes aparecian en mltiples bases de datos con suficientes variaciones de nombre y direccin de modo que se 1es considerara como personas distintas e, incluso, en ocasiones estas discrepancias conducian a que clientes anteriores fueran identificados como nuevos prospectos. Estos datos de clientes con tan deficiente calidad podan crear situaciones embarazosas para 1os representantes de ventas e incluso provocaban que stos desconltatan de 1os contactos de ventas que les proporcionab a eI rea de marketing. Por otra parte, 1os sistemas de Cintas podan identificar a dos clientes diferentes con nombres similares como si fueran el mismo cliente, privando a 1a empresa de una oportunidad de ventas. Cintas eligi reacondicionar su aTmacn de datos instalando software de admnistractn de caTidad de datos de Dataflux para identificar registros duplicados de clientes y eslandarzar 1os datos de clientes recopilados cada mes de las bases de datos de cada divisin La empresa est considerando cmo puede utiTzar 1as capacidades de cornpatactn de datos que ofrece e1 software de Dataflux paracotregk 1os datos atnedida que los empleados 1os ingresan a sus sistemas en vez de en el momento en que ingresan a su almacn de datos Bank of Americalta mantenido durante muchos aos un almacn de datos centraTizado con datos de cuentas provenientes de mltiples fuentes, uttTizado con propsitos de marketing y ventas cruzadas. En 2002 tuvo que reexallrinat sus proyectos de caTidad de datos para asegl:.rarse de que se apegaban a 1as clusulas contta eTTavado de dinero de 1a Ley USA Patriot El banco estableci un conjunto corr'(tn de prcticas para detectar, integrar y manejar los datos La administracin deterrnin que 1os administradores de datos de las unidades de negocios y el departamento de sistemas de informacin de1banco se reunieran mensualmente 1r,ara resolver los problemas de

250

Parte Dos Infraestructura tecnologa informacin de de

cahdad de datos E1 banco atiTizaherramientas de creacin de perfiles y comparacin de datos tanto comerciales como desarrolladas de rnanera inlerna.

Fuentes : zuck Whiting,,Aaww, Rubbish 1,, Informat:ton Week,B de ma_ yo de 2006, y Kym Gi1hooly, ,,Dirty Data Blights the Bottom Line,,, Computerworld,7 de noviembre de 2005

PREGUNTAS CASO ESTUDIO DEL DE


1. Cu1fue el impacto de 1os problemas de caTidadd,e datos en 1as empresas descritas en este caso de estudio? Qu factores de 7a admintstracin, organizacin y tecnologa ocasionaron estos problemas?
z-

Visite e1sitio Web de un proveedor de soft,rrarc cali,ad, de de datos como Dataflux, Tfillium Software o Group 1. Explore ei sitio y responda1aspreguntassiguientes: l. Culesson 1as capacidadesdel software para asegurar l a compl eLi tud, exacri tudv consi stenci a e d los datos? 2. Qapasos necesiLaria emprender su empresa para :utllizat este software?

De qu rr7al1etaresolvieron sus problemas de calidad de datos 1as empresas descritas en este caso? Qu problemas de adminstracin, organizacion y tecnologa tuvieron que enfrentar? caltdad de datos es qlle 1os gerentes de las empresas consideran 7a calidad de datos como un problema tcnico Analice de qu rnanera se ap1ca estaaftrmacin a 1as empresas descritas en este caso de estudio.

3. Se ha dicho que el mayor obstcu1o para me.jorar 7a

A CCI O N
Los proyectosde esta seccinle brindan experrencia prctica en e1rediseo de una base de datos de clientes para establecer un marketing enfocado, crear nabase de datos para administracin de inventarios y utllizar la Web para buscar recursos empresariales extranjeros en bases de datos enTinea

Me j o ra e n l a tom a de decisiones: r ediseo de la base d e d a to s cl ientes


conocimientos de software:Diseo, consultase informes de basesde datos. Conocimiento de negocios:Elaboracinde perfiles de clientes Las empresas mantlenen datos sobre sus cllentes que les pueden redituar valiosos conocimientos acerca de los intereses 5rpreferencias de corlpra de dichos clientes. Sin embargo, con frecuencia lasbases de datos de clientes ta7vez no estn calta:ndo los elementos correctos de los datos para tomar las decisiones de marketing o quiz su diseo no permita analizar 1os datos En este proyecto usted redisear una base de datos de clientes de ta7 rnanera que proporcione informacin utll para establecer un marketing enfocado. Dirt Bikes U.S.A. vende principalmente a travs de sus distribuidores. Mantiene una peqaea base de datos de clientes con 1ossiguientes datos: nombre de1cliente, direccin, nmero telefonico, modelo comprado, fecha de cornpra y distribuidor. A continuacin se muestra la base de datos y usted la puede encontrar en e1 sitio Web dei 71btopara ei captulo 6 Estos datos los recopilan los distribuidores al momento de realizar una venta y a continuacin los reenvan a Dirt Bikes. A Dirt Blkes 1e gustara conercializar sus productos a sus clientes de una tnaneta ms agresiva.

de Gaptulo Fundamentos la inteligencia negocios: de administracin bases datose informacin 251 de de

Al Deparlarnento de Marketing le gustara enviar por coffeo electrnico noticias de carreras especiales y de ventas de partes a sus clientes. Thmbin 1e gustara saber ms sobre los intereses y gllstos de sus clientes: su edad, aos de escolaridad, otro deporte en el cual estn interesados y si acuden alas carre'rasde minimotos. Adems, Dirt Bikes quisiera saber si sus clientes poseen ms de una minimoto. (Algunos de 1osclientes de Dirt Bikes poseen dos o tres minimotos que le han cornprado aDitt Bikes o a otros fabricantes). Si le compraron una minimoto a Dirt Bikes, a7a ernpresa 1e gustara saber Ia fecha de cornpra, e1 modelo comprado y e1 distribuidor. Si el cliente posee una minimoto de :u-na empresa diferente a Dirt Bikes, la empresa quisiera saber del fabricante y modelo de 1aminimoto (o minimotos) y el distribuidor a1 r:Lre Iahaya comprado. s Redisee 1abase de datos de clientes de Dirt Bikes de tal rnanera que pueda aTmacenary suministrarlatnfo'rrnacin necesariapara marketing. Usted tendr que desarrollar un diseo paraTa rrreva base de datos de clientes y luego implementarlo por medio de software de base de datos. Considere el uso de mltiples tablas en su nuevo diseo. Constituva cada :nveva tabla con 10 registros. Desarrolle varios informes qre pudieran interesar en gra:n rnedida al deparlamento de marketing y ventas (por ejemplo, listas de clientes repetidos de Dirt Bikes, clientes deTa ernpresa que acltden alas carreras o el promedio de edadesy aos de escolaridad) e imprmalos.

L o g r o de l a ex c el enc i aop e r a t v a : c o n s t r u c c nd e u n a b as e de datos rel ac i o n a l p a r a a d m in is t r a c i n d e in v entaros


Conocimientos de software: Diseo, consultas e informes de bases de datos. Conocimiento de negoc os: Administracin de inventarios. i as empresas actuales dependen de bases de datos para ofrecet informacin confiazie acerca de los artculos en inventario, artculos que requieren reabastecimiento ', costos de inventario. En este ejercicio tlllizar software de base de datos para disear una base de datos para administrar el inventario de una empresa pequea. S]'lvester's Bike Shop, ubicada en San Francisco, California, vende bicicletas de ,arreras, de rnontaa, hbridas, de turismo y para nios. Actualmente, Sylvester's =iquiere bicicletas de tres proveedores, pero planea conseguir nuevos proveedores = corto p7azo.EsIa empresa en rpido crecimiento necesita un sistema de base de -:atos para rnanejar esta informacin.

252

de de ParteDos Infraestructuratecnologa informacin En un principio, 1abase de datos debe contener informaci1n acerca de proveedores y productos. Labase de datos contendr dos tablas: una de proveedores y otta de productos. El nivel de reordenamiento se refiere ala cantidad de artculos en inventario que activan una decisin parapedir rns arliculos y evitar una escasez de existencias. [En otras palabras, sila cantidad de unidades de un artculo en particular del inventario cae por debajo de1nivel de reordenamiento, se debe realizar un nuevo pedido del artcu1o). E1 usuario debe tener Ia capacidad de realizar varias consultas y producir varios informes administrativos con base en los datos de las dos tablas. Utilice 7a inforrnacin que se encuentra en 1astablas de1 sitio Web dellibto para e1 captulo 6 y construy a unal:ase de datos relacional sencilla para Sylvester's. Una vez qve haya terminado la base de datos, realice las actividades siguientes. Prepare un informe que identifique las cinco bicicletas ms caras. E1 informe debe enlistar las bicicletas en orden descendente de 1a ms cara a 1a menos cara,7.a candad disponible de cada una y e1porcentaje de encarecimiento de cada'sna. Prepare un informe que enliste cada ptoveedol sus productos, 1ascantidades disponibles y 1osniveles de reordenamiento asociados. E1informe se debe ordenar alfabticamente por proveedor. Dentro de cada categoria de proveedor, 1osproductos se deben ordenar alfabticarnente. Preparc un informe que enliste solamente las bicicletas con pocas existenc as y que requietanrln nuevo pedido. E1 informe debe suministrar informacin del proveedor de 1os artculos identificados. Escriba anabreve descripcin de La rnaneta en qve se podra afinar 1abase de datos pararnejorar anrns 1a administracin de la empresa. Qu tablas o campos se deben agregar?Qu informes adicionales sean tiles?

Mej ora en l a t o m a d e d e c is io n e s :b s q u e d a e de rec urs ose m p r e s a r ia le s x t r a n e r o se n


b a se s d e d a tos en lnea
Conocimientos de software: Basesde datos en 1nea. Conocimiento de negocios: Investigacin de servicios pata operaciones extranjeras. Los usuarios de Internet tienen acceso a muchos miles de bases de datos habilitadas paralaWeb con informacin sobre servicios y productos en ubicaciones lejanas. Este proyecto desarrolla habilidades de bsqueda en estas bases de datos en 1nea. Su empresa se ubica en Greensboro, Carolina del Norte, y fabnca muebles para oficina de varios tipos. Recientemente usted adquiri varios clientes nuevos en Australia y un estudio que usted encatg indica que, con una presencia alti, podtia incrementar en glan rnedda sus ventas. Ms an, su estudio indica que podra tener un mejor desempeo si rnanrfactarara muchos de sus productos directamente en Australia. Primero, necesita establecer una oficina en Melbourne parater'et presencia y luego requiere cornerrzat a importar desde Estados Unidos. Despus puede planear cundo empezar a producir localmente' pronto estarviajando a Australiaparahacer pTanesacerca de establecer una oficina y lendr que reunirse con organizaciones que puedan ayudarle a realizar sus operaciones. Requerir corrlralar gente u organizaciones que ofrecen rragnarrtvariedad de servicios necesarios para qve pueda abrir su oficina, incluyendo abogados, contadores, expertos en importaciones y exportaciones, equipo y soporte de telecomunicaciones, e incluso capacitadores que pueden aytdarle a prepalal a sus futuros empleados para qlJe trabajen para usted. Empiece por buscar asesora del Departamento de Comercio de Estados Unidos sobre 1a manera derealizar negocios en Australia. Despus visite 1assiguientes bases de datos en Iineaparalocalizar empresas con las que le gaslaria reunirse durante su prximo viaje: Australian Business Register (abr.gov.au), AustraliaTtadeNowcom y el Nationwide Business Direc-

Gaptulo Fundamentosla inteligencia negocios: de de administracinbases datos informacin 253 de de e ,:--,- of Australia (www.nationwide.com.au). si es necesario, tambin puede buscar i:- lnototes de bsqueda como Yahool y Google. Enliste 1asempresas que quisiera corrtaatar para entrevtstarlas en su viaje y deterrninar si pueden ayudarTecon las funciones que considera esenciales para instalar su oficina. ' clasifique las bases de datos que emple por exactitud de nombre, completirud, facilidad de uso y utilidad generaT.

r Qu 1e indica este ejercicio acerca del diseo de bases de datos?

Moulos DEsEcurMrENTo ApRENDTZAJE DEL


ln-v:o d.ebasesde datos, normalizacin g diagramas enttdad-relacin. IJnabase de da:--s lelacionalbien diseada sigue ciertos principios, que se describen en este m::-o de seguimiento del aprendizaje junto con instrucciones sobre cmo crear un '-, al:a entidad-relacin. Este mdulo se puede localizar en el sitio Web del libro :r:a este captu1o. ----udtLccin a SQI SQL es e1 lenguaje de manipulacin de datos eslndar para sis--=:r-as bases de datos relacionales. Este mdulo de seguimiento del aprendizaje, de *r: se encuentra en el sitio Web de1 llbto para este captulo, describe 1a sintaxis de S lf v muestraTarnanera de elaborar una consulta SeL. v[.,-elosde datos jeruirquicosg de red. Muchos sistemas heredados an utilizan estos -r.:'os modelos de datos. E1 mdulo de seguimiento del aptendizaje, que se encuen=: en el sitio web de1 libio para este captulo, describe 7a rnanera en que estos mo:e-s de datos representan relaciones, sus fortalezas v sus limitaciones.

254

de Parte Dos Infraestructura tecnoloqa informacin de

R e s um e n
1.
Descibalos conceptos bdsicos de 7a organizacin de archiuos y los problemas de administrar los recursos de datos en un entorno tradicional de archiuos. Un sistema de cmputo organiza los datos en una jerarqaia que comienza con bits y bytes y progresa a campos, registros, archivos y bases de datos. Las tcnicas de administracin de archivos tradicionales difiotlIan alas organizaciones dar seguimiento de una rr.ar'era sistemtica a todas las piezas de datos que utilizan, y organtzar estos datos de rnanera que sea fc1l acceder a ellos. Las distintas reas funcionales y los diversos grupos tuvieron permiso para desarrollar sus propios archivos de manera independiente. Con el tiempo, este entorno tradicional de administracin de archivos crea problemas como redundancia e inconsistencia de datos, dependencia entre 1os programas y 1os datos, inflexibilidad, seguridad escasa y falta de compariicin y disponibilidad de datos.

2.

de bases de datos g las caracterscas de una baDescriba los princiytios de un sistema de adminis*acin se de datos relacional. Un sistema de administracin de bases de datos (DBMS) consta de software que permite 7a centtabzacin de datos y 1a administracin de datos con la finalidad de que las empresas tengan una sola fuente consistente para todos los datos que necesitan. Una solabase de datos da servicio a mltiples aplicaciones. La caracteristica ms importante de un DBMS es su capacidad para sepalrar las vistas lgica y fisica de los datos. E1 usuario trabaja con una vista lgica de 1os datos. El DBMS recupera informacin de taI rnaneta que e1 usuario no tenga que preocuparse de su ubicacin fisica. caracterstica de definicin de datos, rra caracLas principales capacidades de un DBMS incluyenna terstica de diccionario de datos y un lenguaje de manipulacin de datos. La caracterislica de definicin de datos especifica la estructura y el contenido de labase de datos. E1 diccionario de datos es un archivo autornatizado o manual que aknacena inforrnacin sobre los datos de la base de datos, incluyendo nombres, definiciones, formatos y descripciones de los elementos de datos. E1lenguaje de manipulacin de datos, como SQL, es un lenguaje especializado para acceder y manipular la informacin de la base de datos. Actualmente, la base de datos relacional es e1 principal mtodo para organizar y marrtener datos en sistemas de informacin. Organizalos datos en tablas bidimensionales con filas y columnas denominadas relaciones. CadaIabla contiene datos sobre una entidad y sus atributos. Cada fila representa un registro y cada columna representa un atributo o campo. CadatabTa contiene tambin un campo de clave paraidentificar de maneranica cada registro con propsitos de recuperacin o manipulacin. Aplique los princiTtios importantes del diseo de bases de datos. El diseo de una base de datos requiere tanto un diseo lgico como uno fisico. E1 diseo 1gico mode]a una base de datos desde una perspectiva de negocios. El modelo de datos deTa organizacin debe reflejar sus plocesos de negocios importantes y sus requerimientos paraTa toma de decisiones. E1 proceso de crear estructuras de datos pequeas, estables, flexibles y adaptables a partir de grupos de datos complejos cuando se disea una base de datos relacional se denomina notrnaTizacin. Una base de datos relacional bien disead a no lendr relaciones muchos a muchos, y todos 1os atributos pata v:na entidad especfica s1o se aplicarn a esa entidad. IJn diagratr.a entidad-relacin muestra grfr.camenIe 7a reTacin entre las entidades (tablas) de unabase de datos relacional. E1 diseo de bases de datos tarnbin considera si unabase de datos completa o partes de sta se pueden distribuir a ms de una ubicacil para tncrernentar Ia capacidad de respuesta y reducir la vulnerabilidad y 1os costos. Existen dos tipos principales de bases de datos distribuidas: las replicadas y las particionadas.

3,

4.

Euale las hewamientas A tecnologas para proporcionar informacin de bases de datos Ttara mejorar el desempea empresarial g la toma de decisiones. Existen herramientas potentes para analizar y acceder ala infotrnacin de las bases de datos. Un almacn de datos consolida los datos actuales e histricos de muchos sistemas operativos distintos en unabase de datos central diseada para elaborar informes y anlisis. Los almacenes de datos soportan anlisis de tarrrbin conocidos como procesamiento analtico enTinea (OLAP). OLAP redatos multidimensionales, que se puede visualizar copresenta las relaciones entre los datos como una estructura multidimensional, mo cubos de datos y cubos dentro de cubos de datos, para permitir un anlisis de datos ms complejo. La mineria de datos anaTiza grandes concentraciones de datos, incluyendo el contenido de los almacenes de datos, para encontrar patrones y reglas que se puedan utllizar para ptedecir el comportamiento futuro y orientar Talorna de decisiones. Las bases de datos convencionales se pueden enlazar a la Web a travs de middleware o de una interfazWeb para factlitar e1 acceso de 1os usuarios a los datos internos de una organizactn.

Gaptulo Fundamentos la inteligencia negocios: de de administracin bases datose informacin 255 de de 5 ttale eI rol de la polca de infonnacin, la administracin de datos g el aseguramiento de la calidad de datos en - administracin de los recursos de datos de la organizacin. El desarrollo de un entorno de base de datos requiere polticas y procedimientos para rnanejar 1os datos organi..cionales, as como un buen modelo de datos y tecnologa de bases de datos. Una poltica de informacin formal :-:e e1 mantenimiento, distribucin y uso de 1a informacin en la organizacin En las grandes corporaciones, una -:ncin forrnaT de administractn de datos es responsable de la poltica de informacin, as como de ).a planeacin :: datos, el desarrollo de un diccionario de datos y de viglTar el uso que se da a 1os datos en la empresa. r ^^ U4IUD UrrPrgL r^+^^ LU '-^.^..^tisos, incompletos o inconsistentes crean graves problemas operativos y financieros para las em:-resas porque podran generar imprecisiones en 1osprecios de productos, cuentas de clientes y datos de inventari<.rs, - :onducir a decisiones inadecuadas sobre las acciones que debe emprender 1a empresa. Las empresas deben seguir '- '<nq eqncrjqlcc na1 asegurarse de que cuentan con un alto nivel de calidad de datos. Estos pasos incluyen el uso -.: estndares de datos paratoda la empresa, bases de datos diseadaspararninirnizar 1os datos inconsistentes v re-:rndantes, auditoras deTa caTidad de los datos y software de depuracin de datos.

Trminos clave
o;ttrittistracin de bases de datos, 247 o-;,trittistracin de datos, 247 o--,mrutt datos, 239 de t- -.itrts is pre dictiu o, 24 3 -y*:ttito,226 ,"-:-.lruto, 226 ,-iirora de la calidad de los ilatos, 248 :** de datos (defnicin rigurosa), 229 ;;-* de datos distribuida, 237 t^--. de datos, 226 l-nnpo claue, 230 i*ntpo, 226 l-de externa,237 !.-ae principal, 230 - 3\IS orientado a objetos, 233 -3-\IS relacional orientado a objetos, 233 - 3\[S relacional, 230 -r:--tnirin de datos, 233 j,ttxndencia entre los Ttrogramas g los datos, 228 Depuracin de datos, 248 Diagrama entidail-relacin, 236 Diccionario de datos, 233 Entidod,226 Gobierno de la informacin, 247 Inconsistencia de datos, 228 Inteligencia de negocios, 240 Lenguaje de Consultas Estructurao (SQL), 234 Lengtaje de maniptulacin de datos, 234 Mercado de datos, 239 Minera de datos, 242 Normalizacin, 236 Polca de informacin, 247 Procesemiento analtico en lnea (OLAP ), 241 Redundancia de datos, 228 Registro, 226 Seruidor debase de datos,24S Sistema de administracin de bases de d"atos(DBMS), 229 Ihpla, 230

Preguntas repaso de
1. -?or qu es importante la administracin de archi-"'lspara el desempeo general de los sistemas? 2. = : r lis te y d e s c ri b a c a d a v n o d e l o s c omponentes -re 1ajerarqua de datos. 3" Defina y explique e1significado de entidades, atri-cutosy campos de clave. 4. Enliste y describa los problemas de1 entorno tralicional de archivos. 5. Defina una base de datos y un sistema de adrniristracin de bases de datos. 6. Enliste algunos beneficios de un DBMS y 1assolu:iones que ofrece para los problemas de un entorio tradicional de archivos. 7. ;Qu es un DBMS rel,acional? Crno organizalos datos? Cules son las tres operaciones de un DBMS relacional? 8. l.tencione y describa brevemente las capacidades :e un DBMS 9. ,rau es 1a normalizacin? Crno se relaciona ,:n las caractersticas de una base de datos rela,-cna1 bien diseada? I0. Qu es una base de datos distribuida y cules son las dos formas principales de distribuir datos? 11.QuesanaTmacndedatos? Cr . r r opuedebeneficiar aTas o'rganzaciones? 12. Qu es 1a inteligencia de negocios?Cmo se reIaciona conlatecnoTogia de bases de datos? 13. Describa 1as caractersticas del procesamiento analitico en Tirre (OLAP). a 14. Qu es la minera de datos? En qu difiere de OLAP? Qu tipos de infornacin se pueden obtener de 7a mineria de datos? 15. Cmo pueden los usuarios accedet informacin de las bases de datos internas de una emDresa a travs de 1aWeb? 16. Cules son 1osroles de 1apoltica de inforrnaciln v 1a administracin de datos enla adrinistracin de la informacin? -:^ ,, .Por qu son tan importantes _ Ll las auditoras de la calidad de 1os datos y 7a depuacin de los datos?

256

Parte Dos Infraestructura tecnoloqa informacin de de

para Preguntas debatir


l. Se ha dicho que no es necesario el software de administracin de bases de datos para crear un entorno de base de datos. Argumente su respuesta qu punto se deben involucrar los usuarios 2. Hasta finales en la seleccin de un sistema de administracin de bases de datos v e1diseo de la base de datos?

Caso vdeo en
En el sitio Web dei libro encontrarun caso en video que ilustra algunos de los conceptos de este capitulo, junto con preguntas que Ie ayadarn a anaTizarel caso.

Trabajo equpo: en Identificacin de y atributos unabase entidades en dedatos lnea en


En grupo con dos o tres de sus compaeros de c1ase, seleccione una base de datos para expTorar, como AOL Music, iGO.com o la Internet Movie Database. Explore estos sitios Web para ver qu informacin proporcionan. Despus enliste las entidades y atributos a 1os que deben dar seguimiento en sus bases de datos Diagrarne 1asrelaciones entre las entidades que haya identificado Si es posible, utilice soft,rrare presentade c ones electrnicas para mostrar sus conclusiones a 1a c1ase.

Cap t ulo Fundam e n t o s l a i n t e l i g e n c i d e n e g o c i o s : d m i n i s t r a c i d e b a s e s e d a t o se i nfo r m a ci n 2 5 7 de a a n d

anasonic es uno de los fabricantes de electrnicos 1deresen e1mundo Operabajo e1auspicio de la empresa :matriz Matsushita Electric Industrial Co. Ltd., un conglomerado de 600 empresas con base enKadoma, JaColectivamente, 1asempresas de Matsushita fa.:r 15,000productos para un rrte'rcado globa1y ::np1eoa 330,000personasen todo el mundo. . lo en Europa, Panasonictiene 15 subsidiarias ::.Ltas, plantas de rnanrfactura, cirtco centros de 14 ..rgacin y desarrollo y siete instalaciones admi..ir-as Agrega presencias principales en todo e1 -ro,incluyendo Asia y Norteamtica, y es claro -,.soperaciones de Panasonic abarcantodo e1 :: tantas fuentes diferentes de datos, la empresa ..-ontr de pronto con datos de productos y clien-- .e con frecuencia eran inconsistentes, duplicaDiferentes segmentos de 1a em'ncompletos. .." ::,ttlizabansus propias concentraciones de : que estaban completamente aisladas de los da-:,re utilizaba e1resto de 1a empresa. Estas condi:s se combinatoTLpara convettirse en un para 1a eficiencia operativa y consumieron .-..r-r1o .:radessignificativas de dinero de todaTa corpota- s tipos de datos requeridos paraTanzar un nue' rchrcto de Panasonic incluyen fotografias, espe.,,-1ones descripciones de1producto, manuales, y de precios e informacin de marketing sobre e1 '- de venta Los empleados adaptabanla inforrr de productos pata ajustarla a las necesidades -. : palsos o regiones. Tornabaun tiempo y un es, considerablesfiltrar todos 1osdatos y crear 7-r comn de datos paraTanzar productos de -.r'rto -: a g1oba1, cual aprovecTtan competidores 1o 1os ,. -::Illtrarse en 1osmercados a 1oscuales no llega':--asonicen la primera lase de unlanzarnienlo. - -- solucionar este problema, Panasonic decidi ir L1na versin del,averdad". Las activida"so1a . ,:dlanas reqaerian que 1osdatos pasaran alra- . sistemas heredados, mquinas de fax, correo - lico, llamadas telefnicas y correo tradicional. j.:rraspersonas que manejaban los datos en for. -an variados, 1asineficiencias e imprecislones . c eran un riesgo. La eliminacin de estos pro' , s prometa un incremento en la velocidad con .,..:rasonicTlberabaproductos al mercado. '---sonic estaba disfrutando de numerosos xitos: '-lzgo en e1mercado de TVs de plasma, una

transicin exitosa de los presidentes de 1a empresa, y una identidad de marketing bien recibida: "Panasonic: Ideas paraTa vida". Sin embargo, estos aspectos positivos fueron ecllpsados por 1oscostos administratlvos en que incurra una organizacin tan inmensa. Por 1o tanto, cuando Fumio Otsubo se erigi como presidente en juno de 2006, recibi una empresa con un 7'narger'de utilidad de tan s1o5 por ciento. E1 consejo de directores 1o sobrecarg con 7a rrteta de incrementar el rna'rgena 10 por ciento para 2010. En la industria de Panasonic,1osconsumidores esperan que el precio de 1a nueva tecnologa se reduzca con el paso de1tiempo, como ocurri con productos que fueron fortaTezasde Panasonic como las TVs de plasma y los reproductores de DVD. En consecuencia, Otsubo no puede basar su estrategia para tncretnentar los mrgenes de utilidad de 1a empresa mediante e1aumento de precios Envez de e11o, tiene que poner sus esfuerzos en reducir 1oscostos e incrementar las ventas. Empezando por Europa, Panasonicbusc reemplazar su modelo de "extracci7't" para 1a difusin de datos por uno de "envo". Antes, los empleados de marketing y ventas tenian que solicitar 1os datos de numerosos depsitos. En el modelo de envo, un banco de datos cenfiaTtzado rnanda la informacin al mismo tiempo a todos los empleados que la necesitan, con 1o cual asegura 1a uniformidad. Los destinatarios de los datos incluyen socios detallistas y proveedores de comercio electrnico, quienes reciben informacin completa de1producto en todas las etapas de 1a presentacin. Los empleados de Panasonic reciben datos de :natna:nerams enfocada. Los beneficios de Panasonic Europa son presentaciones de productos e informacin de productos ms consistentes. Esto ltimo garantiza que 1osclientes no se confundirn a7investigar sus compras, 1o cual podria motivar que se inclinaran por un competidor de Panasonic. La fuerza tcnica en que se fundament e1reacondicionamiento de la administracin de datos de Panasonic Europa fue el software de administracin de datos maestros (MDM) delaTineaWebSphere de IBM. El software permiti a Panasonic Europa consolidar datos, as como sistematizar los procesos de ne, gocios relacionados con 1osdatos. En general, 1,aernpresa obtuvo un mejor control sobre sus datos internos. En trminos generales, el software MDM tiene e1propsito de combinar registros separadosen un

258

ParteDos Infraestructuratecnoloqa informacin de c1e Panasonic Europa. Sin embargo, 1osrestos de reorganizar e7flujo de trabajo y consolidar la informacion de productos fue igual de dificil. Panasonic enfrent este problema cuando necesit proporcionar una vista consolidada de la informacin de productos para el gigante detallista Wal-Mart Panasonic comenz por identificar la informaci.n que Wal-Mart necesitaria, que eran datos que se apegaban estrechamente a 1osestndaresde la industna. A continuacin, el fabrlcante de eiectrnicos busc en sus sistemasheredados1asfuentes de datos requerldas. Por 1timo, Panasonic trabaj con IBM para crear un mecanismo de interfaz para recopTTar un de depsito los datos requerldos. Una parte de 1ainformacin, como aquella producida por procesos de negociosrecientes,no estabadisponible en 1ossistemas heredados Panasonic tuvo que incorporar nuevas interfaces para incluir esta informacin, y despus construir rra capa de integracin de aplicaciones para envtar e1paquete completo a Wal-Mart Cada una de 1asmltiples plantas de 1a empresa realiz sus propias contribuciones a nuevos productos. Ms importante, ias plantas tenan sus propias culturas e infraestructuras de informacin Tmbin vaTorabansu autonomia y 7a flexibilidad que les proporcionaba. Las distintas entidades de Panasonrc podrian estar poco dispuestas a ceder el control sobre la informactn debido alaprdida de poder percibida. La empresa requera reglas de administracin de datos maestros claras para impedir que clemasiadas personas manlpularan los datos, ) as lograr que e1archivo maestro se conservara puro. E1vicepresidente de Tecnologa de Informacin de Panasonic Norteamrica, Bob Schrvartz,tena7a esperanzade que 1aferoz conpetencia qLreamenazaba1a estabilidad de sr1empresa ayudara a convencer a 1ostradicionallstas de que apoyaran 1a comparticin de datos. Sin embargo, estaba consciente de que convencer de esto a la empr:esasera una batalla dlficil Adems de todas las unidades de Panasonic Norleamrica, haba socios dertanufactura que se deban inclulr Sln ellos, el sistema no podra desarro11ar todo su potencial Esto haba representado un serio desafio para Panasonic Europa, donde 1a mayora de los socios eran de Asia y estaban satisfechos con sus procesos manuales paraTa administracin de datos de productos. Paul Bolton, director de comercio electrnico y soluciones de administracin de 1as relaciones con el cliente, despleg primero enPanasonic 1abase de datos de informacin de productos. Unavez que prob su efectividad, present sus capacidadesa 1osdems fabricantes ;r 1osconvenci. Por tanto, Schwartz tenia una estrategia y una gua para superar los obstcu1osLo q:uefaltaba era quiz el obstculo ms grande: convencer a la oficina corporativa en Japn de que su estrategia de admi-

archivo maestro cifrado. Muchas empresas han adoptado MDM pata arregTar1asdiscrepancias entre 1as bases de datos utilizadas por sus diversos deparLamentos (por ejemplo, que el departanento de contabllidad tenga registros de menos clientes que e1 nmero de IDs de cllentes en la base de datos de CRM). MDM es particularmente ti1 para las empresas que tienen problemas de integracin de datos como resuitado de fusiones o adquisiciones. Por lo general, las empresaspequeasy medianas no tienen los tipos de desafos que podran requerir una solucin MDM. La implementacin de MDM es un proceso de varios pasos que incluye anlisis de procesosde negocios, evaluacin de datos, depuracin de datos, consolidacin y reconclliacin de datos, mlgracin de datos y desarrollo de una capa de servicio de datos en un archivo maestro. Estospasosproducen un s1sten-a de registros que almacenan el archivo maestro p a ra L o dos dat osde l a e m p l e s a E s c ru c i a l p a ra l a los empresa instituir po1ticasestrictas contra 1asactividades computacionalesque puedan comprometer 1a autenticidad de los datos.Unavez que se ha implementado el MDM, los empleadosy 1asaplicaciones acceden a una vista consolidada de los datos de la empresa. La implementacin debe poner en funcionamiento estndares pata e7 formateo r almacenamiento de los datos,como e1nmero de campos en un registro de direccin o el nmero de dgitos en un cdigo postal. La capa de servicio del MDM preserva la vista de ios datos maestros para las aplicaciones y sincroniza 7as actuaTizaciones archivo de1 maestfo. En el caso de Panasonic, e1despliegue del software MDM de IBM produjo rpidos divldendos En un ao y medio Panasonic Europa estabalanzando rns rpido sus productos al mercado 5rgastaba50 por ciento menos tiempo pata ctear y mantener la informacin sobre productos. El tiempo que un producto tardaba en 1legaral mercado se redujo de crnco a sels meses a uno o dos meses.Segn c1cu1os internos, PanasonicEuropa mejor su eficiencia en un factor de 5 y proyectaba ahorrar un milln de euros anuales ) aumentar 3.5 por ciento las ventas. No obstante, e1analista Paul Jackson, de Forrester Inc., recomend cautela contta las altas expectativas de impulsar las ventas con base en mejoras a7a adn-rinistracinde datos. Seal que 1a fijacin de precios,la innovacin y las asoclaciones estratgicas eran mejores estrategiaspata rncrementar Ia participacin de mercado aLargo p1.azo. Cuando Panasonic Norteamrica tuvo que reconclliar sus datos, no se enlrent a1reto de m1tip1espases con mrltiples idiomas y monedas que complicae los lanzamientosde productos.como 1e ocurri a

ffi1"

G ap t ulo6 Fundam e n t o s l a i n t e l i g e n c i c l en e g o c i o s : de a a d m i n i s t r a c i c i eb a s e s {e a t o se i n fo r m a ci n n c d

z5 g

s:racinde datos mereca adoptarseen todo e1 ,llrdol S1oas la apTicacin ios principios de de I D\4 alcanzara todos sus beneficios. Mientras tanto, : :rrr'artz atrajo a los proveedores de panasonic en : >:adosUnldos y obtuvo utilidades adicionales de los

P RE G UNT A S [ . CA S ODE E S T U D I O DE
1. Evale la estrategia cie negocios de panasonlc utili_ zando los modelos de fuerzas competitivas y de ia cadena de valor 2 Dequ maneta 1osproblemas de adminstracin de 1ainformacin d,epanasonic afectaron su de_ sempeo de negocios y su capaciclad,para elecufat su estrategia?eu factores de administru"irl, o._ gantzaciny tecnologafueron responsables de es_ tos problemas? 3 Cmo aborda estos problemas la administracin de datos en archivos maestros? eu tan efbctiva fue esta solucin? 4. Qu retos enfrent panasonic al implementar es_ ta solucin?

Fuentes: DuffMcDonald, ,,Case Study: panasonic Searchcsthe ,,ier Data fbr a Single Version of Ttuth,,, CIO Insight,22 d.e nayo 1006; Susana Schwartz, ,,Out of Man), O'rle,, , DB2 MagLtnne, ac_ ,rdo a travs de db2mag.com el 15 dejulio c1e 2006; S. Jae yang, r :mer; Master Data Managem ent,,,Baseline Magazine, l0 de junio t005.

Вам также может понравиться