Академический Документы
Профессиональный Документы
Культура Документы
developerWorksenespaol
Caractersticasytiposdebasesdedatos
TemasTcnicos
Informationmgmt
Bibliotecatcnica
Caractersticasytiposdebasesdedatos
Durantelasdcadasdelos60y70surgeelconceptodelasbasesdedatossinembargo,elobjetivoprincipal
siemprehasidolaadministracinptimadelainformacinyelusoqueselepuededaralamisma.Hoy,las
necesidadesdelasempresashancambiadoylanecesidaddeinteractuarcondiversasfuentesdeinformacinha
desafiadoalasbasesdedatos.Loanteriorhaprovocadoquelosvolmenesdeinformacinseanmayores,su
formatomuydiversoloqueincrementaaslostiemposderespuestaparaanalizarlainformacinytomardecisiones.
JorgeDanielAnguianoM.sedesempeacomoDatabaseMigrationSpecialistparaInformationManagementenIBMparaMxicoy
Latinoamricayhatrabajado17aoscondistintasTecnologasdelaInformacincomoAnalista,Diseador,DesarrolladoreImplementador
deSistemas.CuentaconcertificacionesenIBMDB2paraLUWdelaversin9.710.1,IBMITSpecialist,OPENGroupMasterITSpecialist
yOCPenOracle.Paracontactaralautorenvecorreoajanguian@mx1.ibm.com
30062014
Existemuchainformacinacercadelasbasesdedatos,porlotantoel
objetivodeesteartculonoeshacerlounexpertoeneltemasinosoloser
unaguadelosconceptosquesemanejanactualmente,conocer
brevementelascaractersticasdelasbasesdedatosylassolucionesque
existenhoyenda.
Quesunabasededatos?
Desarrolleydesplieguesu
prximaappenBluemix,
laplataformacloudde
IBM.
Comiencesu
pruebagratuita
Deunamanerasimple,esuncontenedorquepermitealmacenarla
informacindeformaordenadacondiferentespropsitosyusos.Por
ejemplo,enunabasededatossepuedealmacenarinformacindediferentesdepartamentos(Ventas,
RecursosHumanos,Inventarios,entreotros).Elalmacenamientodelainformacinporssolanotiene
unvalor,perosicombinamosorelacionamoslainformacincondiferentesdepartamentosnospuede
darvalor.Porejemplo,combinarlainformacindelasventasdelmesdejuniodel2014paraelproducto
Xenlazonanortenosdaunindicativodelcomportamientodelasventasenunperiododetiempo.
Tiposdebasesdedatos
Existenmuchasempresascondiferentesgirosydependiendodelgirosereltipodeprocesamientoque
seledaralainformacin,estodeterminareltipodebasededatosautilizar.Existendiferentestipos
debasesdedatosperolasmscomunessonlasOLTPyOLAP.
LasbasesdedatosdetipoOLTP(OnLineTransactionProcessing)tambinsonllamadasbasesde
datosdinmicasloquesignificaquelainformacinsemodificaentiemporeal,esdecir,seinsertan,se
eliminan,semodificanyseconsultandatosenlneadurantelaoperacindelsistema.Unejemploesel
sistemadeunsupermercadodondesevanregistrandocadaunodelosartculosqueelclienteest
comprandoyasuvezelsistemavaactualizandoelInventario.
Figura1.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
1/23
5/5/2015
Caractersticasytiposdebasesdedatos
LasbasesdedatosdetipoOLAP(OnLineAnalyticalProcessing)tambinsonllamadasbasesdedatos
estticasloquesignificaquelainformacinentiemporealnoesafectada,esdecir,noseinsertan,nose
eliminanytampocosemodificandatossoloserealizanconsultassobrelosdatosyaexistentesparael
anlisisytomadedecisiones.EstetipodebasesdedatossonimplementadasenBusinessIntelligence
paramejorareldesempeodelasconsultascongrandesvolmenesdeinformacin.
Figura2.
Lanecesidaddeimplementaruntipouotrodependerdelgiroynecesidadesdecadaempresa.Esmuy
importanteidentificareltipodebasededatosqueserequiereantesdeimplementarunmanejadorde
basededatos.PorejemplopodemoscitaralmanejadordebasededatosDB210.5withBLU
Acceleration,lacualproporcionaunasolucinparalapartetransaccionalyparalapartedeanalticos.
http://www01.ibm.com/software/data/db2/linuxunixwindows/db2bluacceleration/
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
2/23
5/5/2015
Caractersticasytiposdebasesdedatos
Tipodeinformacinquesepuedealmacenar
Cuandosurgenlasbasesdedatoseltipodeinformacinquesepodaalmacenareradetipo
estructurada.LainformacinesalmacenadaenunobjetollamadoTablalacualnospermiteorganizar
lainformacin.Porejemplo,latabladeEmpleadoscontieneinformacinrelacionadaal#Empleado,
Nombre,Apellido,#SeguroSocial,etc.Cadaunodeestoselementosenunabasededatosrecibeel
nombredeCampoyelconjuntodeestoselementosrecibeelnombredeRegistro(Tambinllamado
ColumnayRengln,HileraoFila).
Figura3.
Lostiposdedatosquesepuedenalmacenarsondiversos,perolosmscomunessondetipoNumrico,
DecimalesytipoTexto.Conformehanevolucionadolasbasesdedatossehanexpandidolostiposde
datosquepuedenalmacenar.PormencionaralgunostiposestnlosCLOB(CharacterLargeObject)y
BLOB(BinaryLargeObject).LosCLOBsonutilizadosparaalmacenardocumentosylosBLOBpara
almacenarunaimagenovideo.
OtrotipodedatorelevantehoyendaeseltipodedatoXML.Esteesuntipodedatojerrquicoporque
partedeunnodoinicialoraz,yasuvezpuedetenernnivelesysubniveles.Muchosmanejadoresde
basesdedatospuedemanipularestetipodedatosinembargo,nodeformanativacomolohaceDB2,
esdecir,eldocumentoesalmacenadocomounCLOB.LadesventajadealmacenarlocomounCLOB
implicadividireldocumentoyguardarloendiferentesreas(comosifueraunrompecabezas),ypara
consultarlosedebearmarparamostrarsuinformacin(locualimplicaproblemasdedesempeo).
UnaventajacompetitivaquetieneDB2esquelosdocumentosXMLsealmacenandeformanativa,es
decir,eldocumentosealmacenadentrodelabasededatos,loquepermiteconsultarlainformacinde
formadirectayconmuchomejordesempeo.InclusosepuedencrearndicesaniveldocumentoXML
paraconsultarunnodoenespecfico,yasaccedermsrpidoalainformacin.Otraventajaesla
compresindedocumentoXMLlocualincrementaelahorroenalmacenamiento.
Figura4.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
3/23
5/5/2015
Caractersticasytiposdebasesdedatos
Existenotrasbasesdedatosquepermitenalmacenardiferentestiposdedocumento,comoporejemplo:
Cloudant,elcualseveramsadelante.
Conlaevolucinenlastecnologasdelainformacinylasnuevasnecesidadesenelmanejodela
informacinnaceelconceptoBigData.Existendiferentesdefiniciones,perolamssencillaeselmanejo
degrandesvolmenesdeinformacinquevienendediferentesfuentesdedatos(Estructurados,No
estructurados,XML,HTML,etc.)deunamanerarpidasinafectarladisponibilidaddelainformaciny
operacindelossistemas.LasconsultashechasenBigDataayudanalanlisisyalatomade
decisiones.
http://www.ibm.com/developerworks/ssa/local/im/queesbigdata/
OtradelasventajascompetitivasquetienelasbasesdedatoscomoDB2eInformixesquepermite
hacerlaexplotacindelainformacinquevienedediferentesfuentespermitiendoaslaintegracincon
otrossistemasylenguajesqueutilizansentenciasSQLyNoSQL.
https://www.ibm.com/developerworks/ssa/library/bddatossqlynosqlendb2/
Informacinatravsdeltiempo
Cuandosecreaunabasededatosyseiniciasuoperacinelvolumendelainformacinesmnimayel
desempeodelaaplicacinybasededatosesptima.Sinembargoconformepasaeltiempoel
volumendeinformacinincrementayenconsecuenciasurgenlossiguientesproblemas:
1. Problemasdeespacioendisco.
2. Incrementosdecostoenalmacenamientoyprocesamiento.
3. Problemasdedesempeoenlasconsultas.
4. Fallasenelaplicativoafectandoladisponibilidaddelosdatos.
5. Problemasconlabasededatosylaprdidadeinformacin.
Delosproblemasanterioressurgelanecesidaddehacermejorasalasbasesdedatosy/ocrear
arquitecturasparadarsolucionesalosproblemasanteriores.Sehanimplementadovariassolucionesa
nivelSoftwareyHardware.
Unodelosprincipalesproblemasasolucionaresladisponibilidadylaprdidadelainformacin.EnDB2
existendossoluciones,laprimeraevitaperderlainformacinencasodedesastres,contingencia,etc.y
lasegundaevitaqueladisponibilidaddelainformacinseveaafectada,esdecir,lainformacinestar
disponible24x7(Entodomomento).Estassolucionesson:
1. HADR(HighAvailabilityandDisasterRecovery)Altadisponibilidad
2. PureScaleDisponibilidadcontinua
QuesHADR?
SussiglaseninglssignificanHighAvailabilityDisasterRecovery.Esunacaractersticadereplicacin
dedatosquebrindaunasolucindeAltaDisponibilidadcuandosurgeunafallaparcialototalenunode
losservidoresprincipales.EsunasolucinquesoportaunServidorcomoPrimarioyhastatres
ServidorescomoSecundarios.Sielservidorprimariofalla,unodelosservidoressecundariostomarel
controlypasaraserahoraelservidorprimario.Lareplicacindelainformacinsehaceatravsdelos
archivoslogdetransacciones.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
4/23
5/5/2015
Caractersticasytiposdebasesdedatos
Ventajas
Minimizaelimpactodeinterrupcionesplaneadaynoplaneadas.
Permitelaactualizacindelsoftwaresininterrumpirlaoperacin.
Paraelaplicativoestransparente,noserequieremodificarlaaplicacin.
NoserequiereHardwareespecializado.
Fciladministracinyconfiguracin.
Figura5.
QuesPureScale?
EsunaarquitecturabasadaenClster.UnClsteresunconjuntodevariosordenadoresunidosporuna
reddealtavelocidad,detalformaqueesvistocomounsolocomputadormspotente.Esuna
caractersticadeDB2quereduceelriesgoyloscostosdelcrecimientodelnegocioalproporcionar
capacidadextrema,disponibilidadcontinuaytransparenteparaelaplicativo.Capacidadextrema
significaquepuedecrecersusistemacomoseanecesario.
Ventajas
Evitarriesgosycostosencambiosalaaplicacin.
Diseadoparasistemasquerequierendedisponibilidadcontinua(24x7).Siunoovariosmiembros
fallanlatransaccinyoperacindelsistemacontinua.
UtilizalamismaarquitecturadelindiscutibleestndardeOro,losSistemasZ.
Agregaroquitarmiembrosdeunamanerafcil.
Noserequieretunearlainfraestructuradelabasededatos.
Balanceoautomticodecargasdetrabajo.
ConstruidoydisponibleenPowerSystemsyservidoresSystemx.
Elncleodelsistemaesunaarquitecturadediscocompartido.
Figura6.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
5/23
5/5/2015
Caractersticasytiposdebasesdedatos
LaimplementacindeHADRoPureScaledependerdelasnecesidadesycapacidadesdecada
empresa.
Otrassolucioneshansidoimplementadasanivelbasededatosparahacerfrentealosproblemasde
performance.DB2ofreceunagranvariedaddealternativasparahacerfrentealosproblemasde
performance.
1. DPF(DatabasePartitionFeature).Particionamientodebasesdedatos.
2. TablePartitioning.Particionamientodetablas.
3. MDC(MultiDimensionClustering).Convertirtablasenmltiplesdimensiones.
Paratenerunmejorentendimientodeltemadeparticionamientosehacelaanalogadelafrasedividey
vencers.EselmismoprincipioutilizadoenestascaractersticasdeDB2.
Unadelasventajasdeestascaractersticasesquesehaceunaprovechamientodelpoderdemltiples
procesadoresenmltiplesnodosfsicos.Losdatosquesonconsultadosomodificadosson
descompuestosautomticamenteyejecutadosencadaunadelasparticiones.Elusodeesta
caractersticaestransparenteparaelusuarioqueejecutasentenciasSQL.
Ventajas
MenoresEntradas/Salidasadisco.
Secentraenunsubconjuntodedatos.
Porcionespequeasdivididaenmsprocesadores.
Disponibilidaddedatosmsrpido.
Mejoradministracin.
Mantenimientofcilparapequeasporcionesdedatos.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
6/23
5/5/2015
Caractersticasytiposdebasesdedatos
QuesDPF(DataPartitioningFeature)?
EsunacaractersticadeDB2,lacualpermitehacerelparticionamientodebasededatos.Conesta
caractersticasemejoraeldesempeoylaescalabilidaddegrandesbasesdedatos.Cuandoexisten
grandesvolmenesdeinformacinenunabasededatos,estaesunadelassolucionesaimplementar.
CadaparticindebasededatostienesupropioconjuntoderecursosinformticosincluyendoCPU,
Memoriayunidadesdealmacenamiento.EnunambienteDPFlosregistrosdecadatablason
distribuidosenlasdiferentesparticiones(DB2utilizaunalgoritmoparadeterminarenquparticin
deberestarlainformacin).DPFesunacaractersticadeescalabilidad.
Figura7.
DPFaceptadiferentesconfiguraciones:
1. Discoscompartidos.
2. Discosdedicados.
3. Permiteelusodeparticioneslgicasyfsicas.
4. Loscomandosparalaadministracindelabasededatossonejecutadosencadaunadelas
particionesdeformaautomticaytransparente.
5. Estransparenteparaelaplicativo.
Figura8.
QuesTablePartitioning?
EselmismoconceptoqueDPFsoloqueestoaplicaparatablasdentrodeunabasededatos,esdecir,
eselparticionamientodelosdatosdeunatablaenunsubconjuntodedatos.Enlamayoradeloscasos
lasbasesdedatosconservaninformacindemuchosaosatrs(histricos)loqueprovocaqueal
ejecutarconsultassobreesatablaeldesempeoseveaafectadoyelconsumodelosrecursossea
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
7/23
5/5/2015
Caractersticasytiposdebasesdedatos
muchomayor.
Porejemplo,siseejecutaunaconsultasobreunmillnderegistrostardarmsquesiserealizasobre
100,000registros.SupongamosquetenemoslatabladeVentaslacualcontiene10millonesderegistros
correspondientealasventasde10aos(2004,2005...2014).Siconsultamosinformacindelao2005
probablementeeltiempodeesperaparamostrarlainformacinseralto.Encambiosisehaceun
particionamientodelasventasporao,alconsultarlainformacindelao2005elmanejadordelabase
dedatossoloconsultarsobreunmillnderegistrosynosobrelos10millonesderegistros.Dichode
otramaneraelmotordelabasededatosconsultarsololaparticindondeseencentranlasventasdel
ao2005.
Figura9.
Ventajas
Incrementaeldesempeodelasconsultas.
Mejoroptimizacinparaloscostosdealmacenamiento.
Rpidacreaciny/oeliminacindeparticionamientodedatos.
Noafectaladisponibilidaddelosdatosalagregaroquitarparticiones.
Incrementaeltamaodelastablas.Lastablasestnlimitadasenalmacenarunmontomximode
datos,utilizandoTablePartitioningpodemosincrementareltamaodelatablamedianteelusode
diferentesparticiones.
QuesMDC(MultiDimensionClustering)?
Proporcionaunmtodoeleganteparapermitirquelosdatosdeunatablapuedanseragrupados
fsicamenteenvariasdimensionessimultneamentedeunamaneraflexibleyautomtica.Estopuede
mejorarmuchoeldesempeodelasconsultas.
Ventajas
Reduceelgastodemantenimientoenlosdatostalescomoreorganizacionesymantenimientode
ndicesdurantelacreacin,eliminacinyactualizacindedatos.
PensadoinicialmenteparaDataWarehouseybasesdedatoscongrandesvolmenesdeinformacin,
perotambinpuedeserutilizadoenbasesdedatosdetipoOLTP.
EnambientesDataWarehousenormalmentelasconsultassehacensobregrandesvolmenesde
informacinloqueconllevaatenerproblemasenlostiemposderespuesta.Lasconsultasquese
realizansiemprevanrelacionadasconfechas,clculos,productos,regiones,tipos,reasgeogrficas,
etc.Porejemplo,sinuestrasconsultasdeVentassiempresonporFecha,TipodeproductoyForma
depagoentoncespodemoshacerelusodeMDCparalatabladeVentasparapodertenerunmejor
desempeodurantelasconsultas.CuandonosotrosrealicemosunaconsultafiltrandoporFechadel
productoelmanejadordelabasededatosutilizarsolounadimensin(unsegmentodedatos).Sien
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
8/23
5/5/2015
Caractersticasytiposdebasesdedatos
nuestraconsultautilizamoslosfiltrosporFechadeventayTipodeproductoentonceselmanejador
delabasededatosutilizardosdimensiones(dosSegmentosdedatos)yassucesivamente.Similara
DPFelmotordelabasededatosconsultarsegmentosespecficosdedatosincrementandoel
desempeoenlasconsultas.
Figura10.
Esimportantemencionarquepodemoshacerunacombinacindetodasestascaractersticaspara
enfrentaralosproblemasquenosenfrentamoscuandohacemosconsultassobregrandesvolmenesde
informacin.HoyendayaexistenotrasoptimizacionesquesehanhechoalmotordeDB2,elcualse
podrvermsadelante.
Elsegundopuntoimportantesonlosproblemascomunesalosqueseenfrentanlasbasesdedatosylas
empresas,elincrementodelosvolmenesdeinformacin.Delladodelasbasesdedatosimplica
problemasdedesempeoalhacerconsultassobregrandesvolmenesdeinformacinydelladodela
compaaimplicaincrementosenloscostosdealmacenamiento.Deaqusurgelanecesidadde
implementarnuevosmecanismosparareducirlostiemposycostos,yesaqudondesurgeeltemadela
compresindedatos.
QueslaCompresindedatos?
Esbsicamentelareduccindelvolumendeinformacinutilizandolamenorcantidadposiblede
espacio.Haymuchastcnicasyalgoritmosquesehanimplementandoenlasbasesdedatos,sin
embargounaventajacompetitivadeDB2esqueadicionalmenteincluyelacompresindelosdistintos
tiposdeobjetos.
1. Compresinderegistros.
2. Compresindetablas.
3. Compresindendices.
4. Compresindetablastemporales.
5. Compresindeobjetoseimgenes.
6. CompresindedocumentosXML.
7. CompresindeLogdetransacciones.
8. Compresindebackup.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
9/23
5/5/2015
Caractersticasytiposdebasesdedatos
EnestetemasehaavanzadomuchoperoDB2tieneelliderazgo.Ahoraconelnuevoconceptode
basesdedatosenmemoriayconalmacenamientoporcolumnassepuedelograrmayorestasasde
compresin,mejoresalasqueyasevenanobteniendoenversionesprevias.
http://www.ibm.com/developerworks/ssa/data/library/DB2BLU/
Ventajas
Reduceloscostosdealmacenamiento.
Incrementaelperformanceenlasconsultas.
ReducelaEntrada/Salidaaldisco.
Reduccindecostosdeenerga.
Trabajarcondatosenmemoriaycondatoscomprimidos.
Enlasiguientefigurasemuestraunejemplodecmoserealizalacompresinconbaseapatronesde
repeticin.Paralacompresindedatosseutilizaundiccionariodondesealmacenarundigitoen
hexadecimalquerepresentarlosdatosqueserepiten.Estosdgitosenhexadecimalreemplazarna
losdatosenlatabla.
Figura11.
Unodeloscostosmsaltosyrelevantesescuandoconsultamosinformacinconaccesoadiscos.
Dependiendodelascaractersticasdeldiscoserlavelocidadconquelosdatossernrecuperadospor
labasededatosydevueltosalusuariofinal.AlcomprimirdatossereducenlasEntradas/Salidasal
disco,debidoaqueconmenosaccesoaldiscoseobtendrnmayoresvolmenesdeinformacin.
Existendiferentestiposdediscos,losdiscosdurosotambinllamadosdiscosrgidosquesondiscosde
almacenamientodedatosnovoltilqueempleanunsistemadegrabacinmagnticaparaalmacenar
datosdigitalesylosdiscosdeestadoslidoconocidoscomoSSD(SolidStateDisk)queesun
dispositivodealmacenamientodedatosquepuedeestarconstruidoconmemoriavoltilynovoltil.
Estosdiscossonmuyrpidosyconsumenmenosenergaylatendenciaindicaqueenunfuturo
sustituirnalosdiscosduros.Suprincipalinconvenienteesquesoncaros.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
10/23
5/5/2015
Caractersticasytiposdebasesdedatos
QuesunDataWarehouse?
Esunalmacndedatosqueesutilizadoparaexplotargrandesvolmenesdeinformacin(entreellos
informacinhistrica)paraefectosdeanlisisqueayudenalatomadedecisionesenlasgrandes
empresas.LasbasesdedatosorientadasaDataWarehousenocontienendatosactuales,esdecir,no
esunabasededatostransaccionalOLTP,esuntipodebasededatosOLAP.Sehamencionadoque
lasbasesdedatostienenmuchosretosyunodeellosesquenosepuedeutilizarlamismabasede
datosparatransaccionesyparaefectosdeanlisis.Estonosepuederealizarporlaslimitantesquese
puedentenerconelHardware,Software,Memoria,dispositivosdealmacenamiento,procesadores,etc.
Debidoaloanteriorsedebeespecificarqutipodebasededatosdebemosutilizar(OLTPuOLAP).
Conlasnuevasnecesidadesyelavancetecnolgicosehanmodificadolasbasesdedatosytambinse
hancreadonuevasarquitecturasdesolucin(DB210.5withBLUAcceleration,Informix,PureDatafor
Analyticsentreotros).
LasempresascuandotomanladecisindecrearunDataWarehousedebenrealizarunprofundo
anlisisdelainformacinquedeseananalizaryconocercualessernlosdatosamigrar.Losdatosque
alimentanaunDataWarehousepuedenvenirdediferentesfuenteseinclusodediferentesproveedores
debasesdedatos.Parahacerlaintegracindelainformacinserequierendeherramientasquenos
permitanhacerlaconcentracindelainformacinenelDataWarehouse.Lasherramientassonvariadas
yexistendiferentesproveedores,estassonconocidascomoherramientasETL.
QuesunETL?
SussiglaseninglssignificanExtractTransformLoad.Extracteselprocesodeextraerlainformacin
quepuedevenirdediferentesfuentesdedatosobasesdedatosdedistintosproveedores.Porejemplo,
consolidarlospresupuestosdeMxicoyCanad,cuyainformacinestalmacenadaenunabasede
datosInformixyMySQLrespectivamente.AtravsdeunaconexinvaODBCpuedehacerlaextraccin
delainformacinparaconcentrarlaenelDataWarehouse.
Transformeselprocesodetransformarlosdatosqueseestnextrayendoantesdeseralmacenadosen
elDataWarehouse.Tomandoelejemploanterior,latransformacinserahacerlosclculosdelos
presupuestosdeMxicoyCanadporao,mesyregin.
Porltimo,elLoadeselprocesodelacargadelosdatosyatransformadoshaciaelDataWarehouse.
EnelejemploanteriorestamosalmacenandolospresupuestosyacalculadosdelasregionesMxicoy
Canadporao,mesyregin.
Figura12.
UnaherramientaqueayudaenestetipodeactividadeseselproductodeIBMInfoSphereDataStage.
http://www03.ibm.com/software/products/en/ibminfodata/
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
11/23
5/5/2015
Caractersticasytiposdebasesdedatos
QuesunDataMart?
EssimplementeunsubconjuntodedatosdeunDataWarehouseparaunreaespecfica.EnunData
Warehousesetienelainformacinconcentradadeunaempresaydetodoslosdepartamentos.LosData
Martnospermitenhacerunaseparacindelosdatosparafuncionesespecficas,usuariosespecficosy
reasespecficas.LainformacinquealimentaaunDataMarttambinpuedenprovenirdeunabase
datostransaccional.EstaesunadelasnuevascaractersticasdelproductoDB210.5withBLU
Acceleration.LaadministracinsimpledeDB210.5withBLUAccelerationpermitegenerarDataMartde
unaformarpidaparasercapazdereaccionaralosrequerimientosdelnegocio.DB2tambinpermitela
ejecucindereportesanalticosentiemporealparaayudaralatomadedecisiones.
Figura13.
http://www01.ibm.com/software/data/db2/linuxunixwindows/db2bluacceleration/
QumodelodedatosseutilizaenunDataWarehouseoDataMart?
ElmodelodedatosqueseutilizaenunabasededatosdetipoOLTPesunmodelorelacionaldonde
existeunarelacindedatosdeceroauno,deunoaunoydeunoamuchos.Pararelacionaryexplotar
lainformacinenunmodelorelacionalserequieredelacreacindendicesprimariosycompuestosque
enunambienteDataWarehousenoesviableporelvolumendeinformacinqueseutiliza.Losbasesde
datosparaDataWarehouseoDataMartmanejanmuchosvolmenesdeinformacinydependiendodel
diseodecadaunadeestas,losdatosyaestarncalculadosoprecalculadosloquepermitequelos
tiemposderespuestasseanmuchomejor.UnodelosmodeloscomnmenteutilizadoseselmodeloStar
Schemaounesquemaenestrella.Unesquemaenestrellaesaquelquetieneunatabladehechos
tambinllamadaFactTableyalrededorsusdimensiones.Lasdimensionesestnrelacionadasalatabla
dehechosatravsdeunallaveprimaria.Estetipodeesquemaesidealparabasesdedatosdetipo
OLAPyDataMartporsusimplicidadylavelocidadparahaceranlisis.DB2tienemuchas
optimizacionesinternasparahacerelusodeestetipodeesquemas.Porejemplohaimplementadoel
usodelnuevomtodoZigzag.
Figura14.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
12/23
5/5/2015
Caractersticasytiposdebasesdedatos
InformixWarehouseAcceleratorIWA
SussiglaseninglssonInformixWarehouseAcceleratorelcualesunoptimizadordecargasde
trabajoquepermitelaintegracinenlosprocesosoperacionalesparaconducirestrategias
ganadoras.Aceleralasconsultascontiemposderespuestassinprecedentes.ElIWAesuna
tecnologadevanguardiaparamejorarelperformanceyofrecelassiguientescapacidades:
1. CompresinextremanecesariaporquelamemoriaRAMeselfactorlimitante.
2. Basededatosporrenglnparacargasdedatostransaccionales(OLTP)yporColumnaparaaccesar
adatosvaelaceleradorparaOLAP.
3. Tercerageneracindebasesdedatosenmemoria.EvitalaEntrada/Salidaaldiscodebidoaquela
compresinpermitetenerlosdatosresidentesenmemoria.
4. Frecuenciadeparticionamiento.Habilitadoparaelaccesoefectivodelosdatoscomprimidos.
5. Paralelismomasivo.Todoslosprocesadoressonutilizadosenlasconsultas.
6. Evaluacindepredicadoscondatoscomprimidosloqueincrementaeldesempeoenlasconsultas.
7. ActualizacinautomticaaniveldeparticinlocualpermiterefrescarenlosDataMartsololosdatos
quehancambiado.
8. Soporteparadatosdeseriesdetiempos.Sepuedenanalizarenmemorialosdatosquevienende
censoresinteligentes,medidas,localizacinGPS,uotrosdispositivosentiemporeal.
Figura15.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
13/23
5/5/2015
Caractersticasytiposdebasesdedatos
QusonlosPureSystem?
Sonunanuevaclasedesistemasintegradosexpertosqueestndiseados,prefabricados,configurados
yoptimizadosparaejecutarcargasdetrabajomuycomplejasyespecificas.Lasventajasqueofrecen
estetipodesistemasson:
1. Construidoconbasealacoleccindeconocimientoscolectivosdemilesdeimplementaciones,
mejorespracticas,experienciadesociosdenegociosyproveedores.
2. Integradospordiseo.TodosloscomponentesdeHardwareySoftwareestnperfectamente
integradosysincronizadosparalascargasdetrabajoquevaaejecutar.
3. ProporcionaunaperfectasincronaentreelHardwareySoftwareyaquevienenpreviamente
diseados,integrados,configurados.Alinstalarloyconectarloalaredustedtieneunsistemalisto
paraoperar.
4. Seobtienevalorencuestindedasyaquelaexperienciadelosexpertosestincorporadajuntocon
laintegracindelossistemas.
FamiliadelosPureSystem
ExistentresfamiliasdePureSystemloscualesestndiseadosparadarsolucinalosproblemasque
enfrentanlosdiferentestiposdecargasdetrabajo,cambiandolaeconomaylaexperienciadelas
tecnologasdelainformacin.
PureFlex:Estossistemasproporcionanserviciosdeinfraestructuraypermitenconstruirsupropia
aplicacinoentornosdeinfraestructuraenunentornoescalable,dealtadisponibilidadyfcilde
mantener.Sihaysolounaplataformaydeseaconstruircualquieraplicacinindependientementedelos
sistemasquetenga,PureFlexeslasolucin.
PureApplications:EstabasadoenlosmismosprincipiosdePureFlexyproporcionaserviciosde
plataforma.SeintegratodoelSoftwareylasherramientasquesenecesitanparaconstruiruna
plataformadeaplicacionesaltamenteescalable.Elobjetivoesofrecerunaplataformadeaplicaciones
tipoWeb.SiustedtieneaplicacionesWeboaplicacionesqueutilizanmemoriaytieneninteraccincon
labasededatosentoncesPureApplicationseslasolucin.
PureData:Porultimo,estossistemassondesarrolladosparaofrecerserviciosdedatosalas
aplicacionesindependientementedequesetratedeaplicacionestransaccionalescomopuntodeventa
oCRM,osistemasdeanlisiscomoperdidadeclientesy/oadministracindecampaas.Paradatos
especficos,aplicacionesOLTP,aplicacionesysistemasdeanlisisprofundoentoncesPureDataesla
solucin.
CuandohablamosdelossistemasPureDatatenemosdiferentesdispositivosPureData,porquesus
aplicacionesdedatos,elaccesoalostiposdedatosylastransaccionessonmuydiferentes.Yesaqu
dondeseofrecennuevosdispositivos.
Figura16.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
14/23
5/5/2015
Caractersticasytiposdebasesdedatos
SistemasPureDataparaHadoop
Estedispositivoestoptimizadoparaalmacenar,catalogar,analizarytransformargrandesvolmenes
deinformacinenmuchosformatosdiferentes.Tambinsepuedeutilizarparamantenermayoresdatos
relacionadosqueseaccedenconmenorfrecuenciadesdeunDataWarehouse,porlotantomantieneun
fcilaccesosinocuparespacioyrecursosenelDataWarehouse.Optimizadotambinparaelanalizar
archivosenlnea.
http://www01.ibm.com/software/data/puredata/hadoop/
SistemasPureDataparatransacciones
Estedispositivoestdiseadoparaelcomercioelectrnico,comercioWebtransaccional.Comopor
ejemplo,lasaplicacionespuntosdeventadondeseescaneauncdigoyatravsdeeselsedetermina
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
15/23
5/5/2015
Caractersticasytiposdebasesdedatos
suprecio.Tambinconocidocomoserviciosdeclusterdebasesdedatosoptimizadoparael
rendimientoyescalabilidadtransaccional.
http://www01.ibm.com/software/data/puredata/transactions/
SistemasPureDataparaanalticos
Estedispositivotieneunaoptimizacindiferentedebidoaquehayunainteraccinconlabasededatos,
conlamemoria,yoptimizadeformadiferentelascargasdetrabajoparaanlisisyDataWarehouse.
Estoesparaaplicacionescomoelanlisisdeclientes,anlisispredictivo,altavelocidaddeanlisisen
datos(petabyte)conlamximasimplicidad.EstoestdesarrolladoconlaTecnologadeNetezza.El
sistemaN200xsigueofreciendo:
1. Mismasoptimizacionesparagrandesvolmenesdedatos.
2. Ningunaadministracintctil.
3. Msde150funcionesanalticasoptimizadas.
4. RendimientooptimizadodeanlisisdeBigData.
5. Administracinsencillaparaundesplieguerpidoyfcil.
6. TresvecesmsrpidoqueelmodeloN1001.
7. 50%msdecapacidaddedatosporrac.EstoayudaaoptimizarlaeficienciadelDataCentersin
incrementarlapotenciaolosrequisitosderefrigeracin.
http://www01.ibm.com/software/data/puredata/analytics/
SistemasPureDataparaanlisisdeoperaciones
Estedispositivodaunasolucincomomezcladelainformacindeloqueustedtiene,loqueustedsabe
ylosanlisis,peroustedtienebsquedaspuntuales.Porejemplo,siustedestabuscandoladeteccin
deunfraudeentiemporealenelqueesthaciendoprofundasexploracionesamuchosdatose
identificaquepuedehaberproblemaenalgunosregistros,ustedluegorealizaunabsquedapuntuala
esosregistros.Estoptimizadoparaequilibrarelaltorendimientoparaelanlisisdedatosyoptimizado
paraequilibrarelrendimientooperativoentiemporeal.
http://www01.ibm.com/software/data/puredata/operationalanalytics/
Cuandosetieneunnmerodeconsultaspuntualesdetipotransaccionalsedebeinclinarhacialos
sistemasPureDataparaAnlisisdeOperaciones.Sinecesitaconsultasmuycomplejasdealtavelocidad
entoncessedebeinclinarporPureDataparaAnalticos(EsteeselsistemabasadoenNetezza).
LatendenciaBasesdedatosenMemoria
Comohemosvisto,conformepasaeltiempolasnecesidadesdelnegociocambianycrecen,porlotanto
sehanagregadonuevascaractersticasalasbasesdedatosparahacerfrentealosproblemasdealta
disponibilidad,desempeo,seguridad,ahorrosenalmacenamiento,etc.Unodelosrecursosms
costosoeselalmacenamientodelainformacinyhoyconelnuevoconceptodeBigDatalanecesidad
demanejargrandesvolmenesdeinformacinsehaincrementado.Elaccesoadiscoeselaccesoms
lentoparaobtenerlainformacin.Actualmenteelcostodelamemoriahadisminuidoylatendenciaes
hacerunmejorusodelamismaporquesehademostradoqueelreaprincipaldeunabasededatos
paraobtenerunmejordesempeoeslamemoria,altenerlosdatosenmemoria,elaccesoala
informacinserealizadeunamaneramsrpida.Lasbasesdedatoscuandobuscanlainformacinen
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
16/23
5/5/2015
Caractersticasytiposdebasesdedatos
eldiscoparadespussubirlaamemoriageneracuellosdebotella,estodependertambindeltipode
discoquesetenga.EnlaseccinpreviasecomentqueelusodediscosdeestadoslidoSSDes
tambinlatendencia,peroporelmomentosonmuycostososynoesunasolucinviableparamuchas
empresas.
ParahacerfrentealmejorusodelamemoriayentregarmejoresresultadosenbasesdedatosOLAP,en
DB2eInformixsehanagregadonuevascaractersticasquepermitennosolotenerlosdatosenmemoria
sinoquetambinpermiteobtenermayorestasasdecompresindedatos,locualpermitemanipular
mayoresvolmenesdeinformacin.Latendenciaestenermsdatosenmemoriademanera
comprimida,conloanteriorsereduceelaccesoadiscoyseincrementaeldesempeoparaelanlisis
delainformacin.
http://www01.ibm.com/common/ssi/cgibin/ssialias
TiposdeOLAP
ROLAP
SussiglaseninglssignificanRelationalOLAP.EnROLAPlosdatossonalmacenadosenunStar
SchemacontablasdeHechosyDimensiones.LasconsultasSQLanalticastienenungrannmerode
Joins,Scanyenormescantidadesdedatosagregados.PorejemploDB2CubeViewsyCognos
FrameworkManagerwithRelationalDatasource.
Figura17.
MOLAP
SussiglaseninglssignificanMultidimentionalOLAP.EsladescripcindeunservidorOLAPque
almacenaelcubocompletoOLAPenmemoria.Normalmentelasagregacionessonprecalculasy
almacenadasenmemoria.Estotraecomoresultadorespuestasmuyrpidasaconsultasdedatosy
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
17/23
5/5/2015
Caractersticasytiposdebasesdedatos
permiteunaaltaconcurrenciaenejecucindeconsultas.EjemploCognosPowerCubes,CognosTM1y
Essbase.
Figura18.
HOLAP
SussiglaseninglssignificanHybridOLAP.ComosussiglasloindicanesunacombinacindeROLAP
YMOLAP.CombinamuchasdelascaractersticasdeROLAPYMOLAPdondenoexistelmitedel
tamaodedatoscomoROLAPyproporcionatodaslascapacidadesparaobtenerdetallesdela
informacin,conunaaltaconcurrenciayaltorendimientoparalosdatossolicitados.Silosdatos
solicitadosestnencachenoserealizalaconsultaenlabasededatos,delocontrariolaconsultase
ejecutarenlabasededatos.EjemplosCognos10.1.1DMRyCognosDynamicCubes.
Figura19.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
18/23
5/5/2015
Caractersticasytiposdebasesdedatos
QuesIBMBLUAccelerationforCloud?
EsunasolucindeDataWarehouseyAnlisisenlaNube.ElconceptodeNubedeunamanerasimple
sonlosserviciosinformticosqueseofrecenatravsdeInternet.Unadelasventajasdeestas
arquitecturasesquelasempresasyanorequierendeunainfraestructurapropiaypermitealosusuarios
accesaralasaplicacionesdesdecualquierpuntodondeseencuentren.Paralosprogramadorespermite
elrpidodesarrollodeaplicaciones.
http://bluforcloud.com/
QuesCloudant?
Esunabasededatosdecomoservicio(DBaaS)lacualpermitecentrarseeneldesarrollorpidode
aplicacionesenInternetyaplicacionesmvilesenlugardepreocuparseporlaexpansinygestindela
basededatosporsucuenta.Tienealtadisponibilidad,esduraderaycontieneampliasfunciones.El
almacndedatosseconstruyeparalaescalabilidadyestoptimizadaparalecturasyescrituradedatos
simultneas.Manejatambinunaamplavariedaddetiposdedatosestructuradosynoestructurados
entreellosJSON,textoscompletosygeoespacial.
Figura20.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
19/23
5/5/2015
Caractersticasytiposdebasesdedatos
https://cloudant.com/
LabasededatosCloudanteslaprimeraplataformadegestindedatosparaaprovecharla
disponibilidad,escalabilidad,yelalcancedelaNubeparacrearunareddedistribucinglobaldedatos
(DDN)quepermitaalasaplicacionesestardisponiblesparalosusuariosdondequieraqueseencuentre.
Figura21.
QuesJSON?
SusnomenclaturaseninglssignificanJavaScriptObjectNotation,elcualesunformatoligeroparael
intercambiodedatos.JSONestbasadoenunsubconjuntodellenguajedeprogramacinJavaScript.
Susimplicidadhahechoquesuusoseestampliando,algosimilaralmanejodedatostipoXMLdonde
esfcildeimplementar,deleerydeutilizar.Tambinesindependientedellenguajedeprogramacinya
quemuchoslenguajestienencaractersticasparamapearconJSON.Seempleaenambientesdondeel
flujodelosdatosesdevitalimportanciacomoporejemploGoogle,Yahoo,etc.queatiendenamillones
deusuarios.JSONestsoportadoenDB210.5eInformix12.1conelcualsepermiteguardar,consultar
yactualizardocumentos.Combinadatosdesdeotrossistemascondatostradicionalesenlamismabase
dedatos,comoporejemplolasaplicacionesWebomviles.JSONdaelpoderalosprogramadoresde
reducirladependenciadelastecnologasdelainformacin,esdecir,nosenecesitancrearesquemasy
tampocotablas.Ejemplodeunsimpledocumento:
{
"nombre"
:"Daniel",
"apellido" :"Anguiano",
"edad"
: "40",
"direccion":
{
"calle" :"Prados 100",
"ciudad :"Mexico",
"cp"
:"52034"
},
"telefono" :
[
{
"tipo"
:"celular",
"numero" :"5564239823"
}
{
"tipo"
:"trabajo",
"numero" :"5553706234"
}
]
}
LaimportanciadeJSONesqueayudaahabilitarlanuevaeradeaplicacionesmviles,socialesyNube
convirtindoseasenunodeloslenguajesparalaWeb.Solosoportaseistiposdevaloresyson:
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
20/23
5/5/2015
Caractersticasytiposdebasesdedatos
1. Cadena(String)
2. Numrico
3. Booleano
4. Valoresespecialescomoelvalornulo
5. Objetos
6. Arreglos
Nosoportaestructurasdedatoscclicos,esdecir,utilizarunconjuntodeaccionesquesepueden
ejecutarunaovariasveces(Para For 1 to 10 , Mientras While v_cont 100,
Repetir Repeat ).
Internetdelascosas(IoT)
Hoy,elmundoestahperconectadocondiferentesfuentesdeinformacin(redessociales,unidades
mviles,censoresytodoloqueestanuestroalrededor)loqueestprovocandoestarencontactocon
muchainformacin.TodoestemundodeinformacinhaceelInternetdecosascreandonuevas
oportunidadesenmuchasreas.Elobjetivonoesalmacenargrandesvolmenesdeinformacinsino
actuarsobrelamismaatravsdelanlisisdeunaformarpidaparaelaprovechamientodelamisma.El
objetivoesdarlevaloralainformacinparaofrecerloquequiereelconsumidor,paraidentificarfraudes,
optimizarreabastecimientodeinventarios,etc.ElInternetestaaccesible24x7los365dasdelaoyla
informacinestahcomounaoportunidaddehacernegocio.Estemundodeinformacinnopuedeser
explotadaporcualquiermanejadordebasededatoslocualhacecomplicadoelmanejoyanlisisde
estemundodeinformacin.Lasrazonessonlassiguientes:
1. Losdatossongeneradosdediferentessistemas,conformatoscomplejos,diferentesfuentesytipos
dedatos,estructurados,noestructuradosyvienendediferentescontextos.
2. Sondifcilesdeanalizarporelvolumendeinformacin,requierenmsprocesamiento,modeladode
datos,anlisiscomplejodetextosycorrelacindedatosatravsdelosdistintos.
3. Ustednecesitasercapazdevisualizarlainformacinparaactuarsobreella.Serequierensofisticados
algoritmosdebsquedaparatomardecisiones.
IBMInformixBasededatosinteligenteparaIoT
IBMInformixesunabasededatosinteligentepararesolverlosproblemasdeIoT.Suscaractersticas
nicaslepermitenquefuncioneendispositivosperifricosytambinenlaNube.EnlaNube,Informix
tienelaescalabilidadyelrendimientoparaservircomoplataformadeanlisisavanzadosqueconsolidan
lainformacindemillonesdedispositivos.Tambintienelacapacidaddeproporcionarinteligencialocal:
Consolidacindedatoslocales,anlisisytomadedecisioneslocales,tieneelalmacenamientoencache
siesnecesario,elcontrolylareplicaalanubeparacopiasdeseguridadyrecuperacin.Dondequiera
implementarloobtendrfacilidaddeuso,estabilidadyunconjuntodecaractersticasquelaconvierten
enlasolucindebasededatosSimplementePotenteparaInternet.
Figura22.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
21/23
5/5/2015
Caractersticasytiposdebasesdedatos
Conclusin
Eltemadebasesdedatosesmuyampliodeexplorarydifcildeseleccionarculeslamejor
arquitecturaautilizar.NormalmenteseseparanlasbasesdedatosparaoperacionesTransaccionalesy
paraAnalticos.Esnecesariohacerunbuenanlisisdeltipodeoperacinquesevaaejecutarenla
basededatosparapoderelegirlaarquitecturamsadecuadayasrealizarunbuenusodelas
capacidadesdelasbasesdedatosparaobtenerlosmejoresresultados.Paralascompaasesdifcil
mantenerunequilibrioentreinvertirenHardwareySoftware.Yahemosvistodiferentestiposde
solucionesqueseadaptanalosdistintosgirosdeempresas.Lacompresindedatos,elmanejode
grandesvolmenesdeinformacin(EstructuradosyNoEstructurados),datosenmemoria,lenguajesde
programacinqueutilizansentenciasSQLyNoSQL,sistemashbridos(TransaccionalesyAnalticos),
reduccindecostosdealmacenamientoylostiemposmnimosderespuestaparaobtenerunresultado
hansidolosmotivosparaeldesarrollodenuevasarquitecturasanivelSoftwareyHardware.
Referencias
InformationCenterDB210.5
DB2withBLUAcceleration
DB2PureScale
DB2HighAvailability
DataWarehouseAnalytics
BigDataandAnalytics
PureSystem
IBMPureSystems
Lanuevafamiliadesistemas
expertosintegradosdeIBMest
aqu.
Lacarrerahacomenzado!
ObtengaWASpara
desarrolladoressincosto.
Descargagratuita:
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
22/23
5/5/2015
Caractersticasytiposdebasesdedatos
RationalTeamConcertforPower
SystemsSoftwareStandard
Edition
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html
23/23