Вы находитесь на странице: 1из 23

5/5/2015

developerWorksenespaol

Caractersticasytiposdebasesdedatos

TemasTcnicos

Informationmgmt

Bibliotecatcnica

Caractersticasytiposdebasesdedatos
Durantelasdcadasdelos60y70surgeelconceptodelasbasesdedatossinembargo,elobjetivoprincipal
siemprehasidolaadministracinptimadelainformacinyelusoqueselepuededaralamisma.Hoy,las
necesidadesdelasempresashancambiadoylanecesidaddeinteractuarcondiversasfuentesdeinformacinha
desafiadoalasbasesdedatos.Loanteriorhaprovocadoquelosvolmenesdeinformacinseanmayores,su
formatomuydiversoloqueincrementaaslostiemposderespuestaparaanalizarlainformacinytomardecisiones.

JorgeDanielAnguianoM.sedesempeacomoDatabaseMigrationSpecialistparaInformationManagementenIBMparaMxicoy
Latinoamricayhatrabajado17aoscondistintasTecnologasdelaInformacincomoAnalista,Diseador,DesarrolladoreImplementador
deSistemas.CuentaconcertificacionesenIBMDB2paraLUWdelaversin9.710.1,IBMITSpecialist,OPENGroupMasterITSpecialist
yOCPenOracle.Paracontactaralautorenvecorreoajanguian@mx1.ibm.com

30062014

Existemuchainformacinacercadelasbasesdedatos,porlotantoel
objetivodeesteartculonoeshacerlounexpertoeneltemasinosoloser
unaguadelosconceptosquesemanejanactualmente,conocer
brevementelascaractersticasdelasbasesdedatosylassolucionesque
existenhoyenda.

Quesunabasededatos?

Desarrolleydesplieguesu
prximaappenBluemix,
laplataformacloudde
IBM.

Comiencesu
pruebagratuita

Deunamanerasimple,esuncontenedorquepermitealmacenarla
informacindeformaordenadacondiferentespropsitosyusos.Por
ejemplo,enunabasededatossepuedealmacenarinformacindediferentesdepartamentos(Ventas,
RecursosHumanos,Inventarios,entreotros).Elalmacenamientodelainformacinporssolanotiene
unvalor,perosicombinamosorelacionamoslainformacincondiferentesdepartamentosnospuede
darvalor.Porejemplo,combinarlainformacindelasventasdelmesdejuniodel2014paraelproducto
Xenlazonanortenosdaunindicativodelcomportamientodelasventasenunperiododetiempo.

Tiposdebasesdedatos
Existenmuchasempresascondiferentesgirosydependiendodelgirosereltipodeprocesamientoque
seledaralainformacin,estodeterminareltipodebasededatosautilizar.Existendiferentestipos
debasesdedatosperolasmscomunessonlasOLTPyOLAP.
LasbasesdedatosdetipoOLTP(OnLineTransactionProcessing)tambinsonllamadasbasesde
datosdinmicasloquesignificaquelainformacinsemodificaentiemporeal,esdecir,seinsertan,se
eliminan,semodificanyseconsultandatosenlneadurantelaoperacindelsistema.Unejemploesel
sistemadeunsupermercadodondesevanregistrandocadaunodelosartculosqueelclienteest
comprandoyasuvezelsistemavaactualizandoelInventario.
Figura1.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

1/23

5/5/2015

Caractersticasytiposdebasesdedatos

LasbasesdedatosdetipoOLAP(OnLineAnalyticalProcessing)tambinsonllamadasbasesdedatos
estticasloquesignificaquelainformacinentiemporealnoesafectada,esdecir,noseinsertan,nose
eliminanytampocosemodificandatossoloserealizanconsultassobrelosdatosyaexistentesparael
anlisisytomadedecisiones.EstetipodebasesdedatossonimplementadasenBusinessIntelligence
paramejorareldesempeodelasconsultascongrandesvolmenesdeinformacin.
Figura2.

Lanecesidaddeimplementaruntipouotrodependerdelgiroynecesidadesdecadaempresa.Esmuy
importanteidentificareltipodebasededatosqueserequiereantesdeimplementarunmanejadorde
basededatos.PorejemplopodemoscitaralmanejadordebasededatosDB210.5withBLU
Acceleration,lacualproporcionaunasolucinparalapartetransaccionalyparalapartedeanalticos.
http://www01.ibm.com/software/data/db2/linuxunixwindows/db2bluacceleration/
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

2/23

5/5/2015

Caractersticasytiposdebasesdedatos

Tipodeinformacinquesepuedealmacenar
Cuandosurgenlasbasesdedatoseltipodeinformacinquesepodaalmacenareradetipo
estructurada.LainformacinesalmacenadaenunobjetollamadoTablalacualnospermiteorganizar
lainformacin.Porejemplo,latabladeEmpleadoscontieneinformacinrelacionadaal#Empleado,
Nombre,Apellido,#SeguroSocial,etc.Cadaunodeestoselementosenunabasededatosrecibeel
nombredeCampoyelconjuntodeestoselementosrecibeelnombredeRegistro(Tambinllamado
ColumnayRengln,HileraoFila).
Figura3.

Lostiposdedatosquesepuedenalmacenarsondiversos,perolosmscomunessondetipoNumrico,
DecimalesytipoTexto.Conformehanevolucionadolasbasesdedatossehanexpandidolostiposde
datosquepuedenalmacenar.PormencionaralgunostiposestnlosCLOB(CharacterLargeObject)y
BLOB(BinaryLargeObject).LosCLOBsonutilizadosparaalmacenardocumentosylosBLOBpara
almacenarunaimagenovideo.
OtrotipodedatorelevantehoyendaeseltipodedatoXML.Esteesuntipodedatojerrquicoporque
partedeunnodoinicialoraz,yasuvezpuedetenernnivelesysubniveles.Muchosmanejadoresde
basesdedatospuedemanipularestetipodedatosinembargo,nodeformanativacomolohaceDB2,
esdecir,eldocumentoesalmacenadocomounCLOB.LadesventajadealmacenarlocomounCLOB
implicadividireldocumentoyguardarloendiferentesreas(comosifueraunrompecabezas),ypara
consultarlosedebearmarparamostrarsuinformacin(locualimplicaproblemasdedesempeo).
UnaventajacompetitivaquetieneDB2esquelosdocumentosXMLsealmacenandeformanativa,es
decir,eldocumentosealmacenadentrodelabasededatos,loquepermiteconsultarlainformacinde
formadirectayconmuchomejordesempeo.InclusosepuedencrearndicesaniveldocumentoXML
paraconsultarunnodoenespecfico,yasaccedermsrpidoalainformacin.Otraventajaesla
compresindedocumentoXMLlocualincrementaelahorroenalmacenamiento.
Figura4.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

3/23

5/5/2015

Caractersticasytiposdebasesdedatos

Existenotrasbasesdedatosquepermitenalmacenardiferentestiposdedocumento,comoporejemplo:
Cloudant,elcualseveramsadelante.
Conlaevolucinenlastecnologasdelainformacinylasnuevasnecesidadesenelmanejodela
informacinnaceelconceptoBigData.Existendiferentesdefiniciones,perolamssencillaeselmanejo
degrandesvolmenesdeinformacinquevienendediferentesfuentesdedatos(Estructurados,No
estructurados,XML,HTML,etc.)deunamanerarpidasinafectarladisponibilidaddelainformaciny
operacindelossistemas.LasconsultashechasenBigDataayudanalanlisisyalatomade
decisiones.
http://www.ibm.com/developerworks/ssa/local/im/queesbigdata/
OtradelasventajascompetitivasquetienelasbasesdedatoscomoDB2eInformixesquepermite
hacerlaexplotacindelainformacinquevienedediferentesfuentespermitiendoaslaintegracincon
otrossistemasylenguajesqueutilizansentenciasSQLyNoSQL.
https://www.ibm.com/developerworks/ssa/library/bddatossqlynosqlendb2/

Informacinatravsdeltiempo
Cuandosecreaunabasededatosyseiniciasuoperacinelvolumendelainformacinesmnimayel
desempeodelaaplicacinybasededatosesptima.Sinembargoconformepasaeltiempoel
volumendeinformacinincrementayenconsecuenciasurgenlossiguientesproblemas:
1. Problemasdeespacioendisco.
2. Incrementosdecostoenalmacenamientoyprocesamiento.
3. Problemasdedesempeoenlasconsultas.
4. Fallasenelaplicativoafectandoladisponibilidaddelosdatos.
5. Problemasconlabasededatosylaprdidadeinformacin.
Delosproblemasanterioressurgelanecesidaddehacermejorasalasbasesdedatosy/ocrear
arquitecturasparadarsolucionesalosproblemasanteriores.Sehanimplementadovariassolucionesa
nivelSoftwareyHardware.
Unodelosprincipalesproblemasasolucionaresladisponibilidadylaprdidadelainformacin.EnDB2
existendossoluciones,laprimeraevitaperderlainformacinencasodedesastres,contingencia,etc.y
lasegundaevitaqueladisponibilidaddelainformacinseveaafectada,esdecir,lainformacinestar
disponible24x7(Entodomomento).Estassolucionesson:
1. HADR(HighAvailabilityandDisasterRecovery)Altadisponibilidad
2. PureScaleDisponibilidadcontinua

QuesHADR?
SussiglaseninglssignificanHighAvailabilityDisasterRecovery.Esunacaractersticadereplicacin
dedatosquebrindaunasolucindeAltaDisponibilidadcuandosurgeunafallaparcialototalenunode
losservidoresprincipales.EsunasolucinquesoportaunServidorcomoPrimarioyhastatres
ServidorescomoSecundarios.Sielservidorprimariofalla,unodelosservidoressecundariostomarel
controlypasaraserahoraelservidorprimario.Lareplicacindelainformacinsehaceatravsdelos
archivoslogdetransacciones.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

4/23

5/5/2015

Caractersticasytiposdebasesdedatos

Ventajas
Minimizaelimpactodeinterrupcionesplaneadaynoplaneadas.
Permitelaactualizacindelsoftwaresininterrumpirlaoperacin.
Paraelaplicativoestransparente,noserequieremodificarlaaplicacin.
NoserequiereHardwareespecializado.
Fciladministracinyconfiguracin.
Figura5.

QuesPureScale?
EsunaarquitecturabasadaenClster.UnClsteresunconjuntodevariosordenadoresunidosporuna
reddealtavelocidad,detalformaqueesvistocomounsolocomputadormspotente.Esuna
caractersticadeDB2quereduceelriesgoyloscostosdelcrecimientodelnegocioalproporcionar
capacidadextrema,disponibilidadcontinuaytransparenteparaelaplicativo.Capacidadextrema
significaquepuedecrecersusistemacomoseanecesario.
Ventajas
Evitarriesgosycostosencambiosalaaplicacin.
Diseadoparasistemasquerequierendedisponibilidadcontinua(24x7).Siunoovariosmiembros
fallanlatransaccinyoperacindelsistemacontinua.
UtilizalamismaarquitecturadelindiscutibleestndardeOro,losSistemasZ.
Agregaroquitarmiembrosdeunamanerafcil.
Noserequieretunearlainfraestructuradelabasededatos.
Balanceoautomticodecargasdetrabajo.
ConstruidoydisponibleenPowerSystemsyservidoresSystemx.
Elncleodelsistemaesunaarquitecturadediscocompartido.
Figura6.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

5/23

5/5/2015

Caractersticasytiposdebasesdedatos

LaimplementacindeHADRoPureScaledependerdelasnecesidadesycapacidadesdecada
empresa.
Otrassolucioneshansidoimplementadasanivelbasededatosparahacerfrentealosproblemasde
performance.DB2ofreceunagranvariedaddealternativasparahacerfrentealosproblemasde
performance.
1. DPF(DatabasePartitionFeature).Particionamientodebasesdedatos.
2. TablePartitioning.Particionamientodetablas.
3. MDC(MultiDimensionClustering).Convertirtablasenmltiplesdimensiones.
Paratenerunmejorentendimientodeltemadeparticionamientosehacelaanalogadelafrasedividey
vencers.EselmismoprincipioutilizadoenestascaractersticasdeDB2.
Unadelasventajasdeestascaractersticasesquesehaceunaprovechamientodelpoderdemltiples
procesadoresenmltiplesnodosfsicos.Losdatosquesonconsultadosomodificadosson
descompuestosautomticamenteyejecutadosencadaunadelasparticiones.Elusodeesta
caractersticaestransparenteparaelusuarioqueejecutasentenciasSQL.
Ventajas
MenoresEntradas/Salidasadisco.
Secentraenunsubconjuntodedatos.
Porcionespequeasdivididaenmsprocesadores.
Disponibilidaddedatosmsrpido.
Mejoradministracin.
Mantenimientofcilparapequeasporcionesdedatos.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

6/23

5/5/2015

Caractersticasytiposdebasesdedatos

QuesDPF(DataPartitioningFeature)?
EsunacaractersticadeDB2,lacualpermitehacerelparticionamientodebasededatos.Conesta
caractersticasemejoraeldesempeoylaescalabilidaddegrandesbasesdedatos.Cuandoexisten
grandesvolmenesdeinformacinenunabasededatos,estaesunadelassolucionesaimplementar.
CadaparticindebasededatostienesupropioconjuntoderecursosinformticosincluyendoCPU,
Memoriayunidadesdealmacenamiento.EnunambienteDPFlosregistrosdecadatablason
distribuidosenlasdiferentesparticiones(DB2utilizaunalgoritmoparadeterminarenquparticin
deberestarlainformacin).DPFesunacaractersticadeescalabilidad.
Figura7.

DPFaceptadiferentesconfiguraciones:
1. Discoscompartidos.
2. Discosdedicados.
3. Permiteelusodeparticioneslgicasyfsicas.
4. Loscomandosparalaadministracindelabasededatossonejecutadosencadaunadelas
particionesdeformaautomticaytransparente.
5. Estransparenteparaelaplicativo.
Figura8.

QuesTablePartitioning?
EselmismoconceptoqueDPFsoloqueestoaplicaparatablasdentrodeunabasededatos,esdecir,
eselparticionamientodelosdatosdeunatablaenunsubconjuntodedatos.Enlamayoradeloscasos
lasbasesdedatosconservaninformacindemuchosaosatrs(histricos)loqueprovocaqueal
ejecutarconsultassobreesatablaeldesempeoseveaafectadoyelconsumodelosrecursossea
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

7/23

5/5/2015

Caractersticasytiposdebasesdedatos

muchomayor.
Porejemplo,siseejecutaunaconsultasobreunmillnderegistrostardarmsquesiserealizasobre
100,000registros.SupongamosquetenemoslatabladeVentaslacualcontiene10millonesderegistros
correspondientealasventasde10aos(2004,2005...2014).Siconsultamosinformacindelao2005
probablementeeltiempodeesperaparamostrarlainformacinseralto.Encambiosisehaceun
particionamientodelasventasporao,alconsultarlainformacindelao2005elmanejadordelabase
dedatossoloconsultarsobreunmillnderegistrosynosobrelos10millonesderegistros.Dichode
otramaneraelmotordelabasededatosconsultarsololaparticindondeseencentranlasventasdel
ao2005.
Figura9.

Ventajas
Incrementaeldesempeodelasconsultas.
Mejoroptimizacinparaloscostosdealmacenamiento.
Rpidacreaciny/oeliminacindeparticionamientodedatos.
Noafectaladisponibilidaddelosdatosalagregaroquitarparticiones.
Incrementaeltamaodelastablas.Lastablasestnlimitadasenalmacenarunmontomximode
datos,utilizandoTablePartitioningpodemosincrementareltamaodelatablamedianteelusode
diferentesparticiones.

QuesMDC(MultiDimensionClustering)?
Proporcionaunmtodoeleganteparapermitirquelosdatosdeunatablapuedanseragrupados
fsicamenteenvariasdimensionessimultneamentedeunamaneraflexibleyautomtica.Estopuede
mejorarmuchoeldesempeodelasconsultas.
Ventajas
Reduceelgastodemantenimientoenlosdatostalescomoreorganizacionesymantenimientode
ndicesdurantelacreacin,eliminacinyactualizacindedatos.
PensadoinicialmenteparaDataWarehouseybasesdedatoscongrandesvolmenesdeinformacin,
perotambinpuedeserutilizadoenbasesdedatosdetipoOLTP.
EnambientesDataWarehousenormalmentelasconsultassehacensobregrandesvolmenesde
informacinloqueconllevaatenerproblemasenlostiemposderespuesta.Lasconsultasquese
realizansiemprevanrelacionadasconfechas,clculos,productos,regiones,tipos,reasgeogrficas,
etc.Porejemplo,sinuestrasconsultasdeVentassiempresonporFecha,TipodeproductoyForma
depagoentoncespodemoshacerelusodeMDCparalatabladeVentasparapodertenerunmejor
desempeodurantelasconsultas.CuandonosotrosrealicemosunaconsultafiltrandoporFechadel
productoelmanejadordelabasededatosutilizarsolounadimensin(unsegmentodedatos).Sien
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

8/23

5/5/2015

Caractersticasytiposdebasesdedatos

nuestraconsultautilizamoslosfiltrosporFechadeventayTipodeproductoentonceselmanejador
delabasededatosutilizardosdimensiones(dosSegmentosdedatos)yassucesivamente.Similara
DPFelmotordelabasededatosconsultarsegmentosespecficosdedatosincrementandoel
desempeoenlasconsultas.
Figura10.

Esimportantemencionarquepodemoshacerunacombinacindetodasestascaractersticaspara
enfrentaralosproblemasquenosenfrentamoscuandohacemosconsultassobregrandesvolmenesde
informacin.HoyendayaexistenotrasoptimizacionesquesehanhechoalmotordeDB2,elcualse
podrvermsadelante.
Elsegundopuntoimportantesonlosproblemascomunesalosqueseenfrentanlasbasesdedatosylas
empresas,elincrementodelosvolmenesdeinformacin.Delladodelasbasesdedatosimplica
problemasdedesempeoalhacerconsultassobregrandesvolmenesdeinformacinydelladodela
compaaimplicaincrementosenloscostosdealmacenamiento.Deaqusurgelanecesidadde
implementarnuevosmecanismosparareducirlostiemposycostos,yesaqudondesurgeeltemadela
compresindedatos.

QueslaCompresindedatos?
Esbsicamentelareduccindelvolumendeinformacinutilizandolamenorcantidadposiblede
espacio.Haymuchastcnicasyalgoritmosquesehanimplementandoenlasbasesdedatos,sin
embargounaventajacompetitivadeDB2esqueadicionalmenteincluyelacompresindelosdistintos
tiposdeobjetos.
1. Compresinderegistros.
2. Compresindetablas.
3. Compresindendices.
4. Compresindetablastemporales.
5. Compresindeobjetoseimgenes.
6. CompresindedocumentosXML.
7. CompresindeLogdetransacciones.
8. Compresindebackup.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

9/23

5/5/2015

Caractersticasytiposdebasesdedatos

EnestetemasehaavanzadomuchoperoDB2tieneelliderazgo.Ahoraconelnuevoconceptode
basesdedatosenmemoriayconalmacenamientoporcolumnassepuedelograrmayorestasasde
compresin,mejoresalasqueyasevenanobteniendoenversionesprevias.
http://www.ibm.com/developerworks/ssa/data/library/DB2BLU/
Ventajas
Reduceloscostosdealmacenamiento.
Incrementaelperformanceenlasconsultas.
ReducelaEntrada/Salidaaldisco.
Reduccindecostosdeenerga.
Trabajarcondatosenmemoriaycondatoscomprimidos.
Enlasiguientefigurasemuestraunejemplodecmoserealizalacompresinconbaseapatronesde
repeticin.Paralacompresindedatosseutilizaundiccionariodondesealmacenarundigitoen
hexadecimalquerepresentarlosdatosqueserepiten.Estosdgitosenhexadecimalreemplazarna
losdatosenlatabla.
Figura11.

Unodeloscostosmsaltosyrelevantesescuandoconsultamosinformacinconaccesoadiscos.
Dependiendodelascaractersticasdeldiscoserlavelocidadconquelosdatossernrecuperadospor
labasededatosydevueltosalusuariofinal.AlcomprimirdatossereducenlasEntradas/Salidasal
disco,debidoaqueconmenosaccesoaldiscoseobtendrnmayoresvolmenesdeinformacin.
Existendiferentestiposdediscos,losdiscosdurosotambinllamadosdiscosrgidosquesondiscosde
almacenamientodedatosnovoltilqueempleanunsistemadegrabacinmagnticaparaalmacenar
datosdigitalesylosdiscosdeestadoslidoconocidoscomoSSD(SolidStateDisk)queesun
dispositivodealmacenamientodedatosquepuedeestarconstruidoconmemoriavoltilynovoltil.
Estosdiscossonmuyrpidosyconsumenmenosenergaylatendenciaindicaqueenunfuturo
sustituirnalosdiscosduros.Suprincipalinconvenienteesquesoncaros.
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

10/23

5/5/2015

Caractersticasytiposdebasesdedatos

QuesunDataWarehouse?
Esunalmacndedatosqueesutilizadoparaexplotargrandesvolmenesdeinformacin(entreellos
informacinhistrica)paraefectosdeanlisisqueayudenalatomadedecisionesenlasgrandes
empresas.LasbasesdedatosorientadasaDataWarehousenocontienendatosactuales,esdecir,no
esunabasededatostransaccionalOLTP,esuntipodebasededatosOLAP.Sehamencionadoque
lasbasesdedatostienenmuchosretosyunodeellosesquenosepuedeutilizarlamismabasede
datosparatransaccionesyparaefectosdeanlisis.Estonosepuederealizarporlaslimitantesquese
puedentenerconelHardware,Software,Memoria,dispositivosdealmacenamiento,procesadores,etc.
Debidoaloanteriorsedebeespecificarqutipodebasededatosdebemosutilizar(OLTPuOLAP).
Conlasnuevasnecesidadesyelavancetecnolgicosehanmodificadolasbasesdedatosytambinse
hancreadonuevasarquitecturasdesolucin(DB210.5withBLUAcceleration,Informix,PureDatafor
Analyticsentreotros).
LasempresascuandotomanladecisindecrearunDataWarehousedebenrealizarunprofundo
anlisisdelainformacinquedeseananalizaryconocercualessernlosdatosamigrar.Losdatosque
alimentanaunDataWarehousepuedenvenirdediferentesfuenteseinclusodediferentesproveedores
debasesdedatos.Parahacerlaintegracindelainformacinserequierendeherramientasquenos
permitanhacerlaconcentracindelainformacinenelDataWarehouse.Lasherramientassonvariadas
yexistendiferentesproveedores,estassonconocidascomoherramientasETL.

QuesunETL?
SussiglaseninglssignificanExtractTransformLoad.Extracteselprocesodeextraerlainformacin
quepuedevenirdediferentesfuentesdedatosobasesdedatosdedistintosproveedores.Porejemplo,
consolidarlospresupuestosdeMxicoyCanad,cuyainformacinestalmacenadaenunabasede
datosInformixyMySQLrespectivamente.AtravsdeunaconexinvaODBCpuedehacerlaextraccin
delainformacinparaconcentrarlaenelDataWarehouse.
Transformeselprocesodetransformarlosdatosqueseestnextrayendoantesdeseralmacenadosen
elDataWarehouse.Tomandoelejemploanterior,latransformacinserahacerlosclculosdelos
presupuestosdeMxicoyCanadporao,mesyregin.
Porltimo,elLoadeselprocesodelacargadelosdatosyatransformadoshaciaelDataWarehouse.
EnelejemploanteriorestamosalmacenandolospresupuestosyacalculadosdelasregionesMxicoy
Canadporao,mesyregin.
Figura12.

UnaherramientaqueayudaenestetipodeactividadeseselproductodeIBMInfoSphereDataStage.
http://www03.ibm.com/software/products/en/ibminfodata/
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

11/23

5/5/2015

Caractersticasytiposdebasesdedatos

QuesunDataMart?
EssimplementeunsubconjuntodedatosdeunDataWarehouseparaunreaespecfica.EnunData
Warehousesetienelainformacinconcentradadeunaempresaydetodoslosdepartamentos.LosData
Martnospermitenhacerunaseparacindelosdatosparafuncionesespecficas,usuariosespecficosy
reasespecficas.LainformacinquealimentaaunDataMarttambinpuedenprovenirdeunabase
datostransaccional.EstaesunadelasnuevascaractersticasdelproductoDB210.5withBLU
Acceleration.LaadministracinsimpledeDB210.5withBLUAccelerationpermitegenerarDataMartde
unaformarpidaparasercapazdereaccionaralosrequerimientosdelnegocio.DB2tambinpermitela
ejecucindereportesanalticosentiemporealparaayudaralatomadedecisiones.
Figura13.

http://www01.ibm.com/software/data/db2/linuxunixwindows/db2bluacceleration/

QumodelodedatosseutilizaenunDataWarehouseoDataMart?
ElmodelodedatosqueseutilizaenunabasededatosdetipoOLTPesunmodelorelacionaldonde
existeunarelacindedatosdeceroauno,deunoaunoydeunoamuchos.Pararelacionaryexplotar
lainformacinenunmodelorelacionalserequieredelacreacindendicesprimariosycompuestosque
enunambienteDataWarehousenoesviableporelvolumendeinformacinqueseutiliza.Losbasesde
datosparaDataWarehouseoDataMartmanejanmuchosvolmenesdeinformacinydependiendodel
diseodecadaunadeestas,losdatosyaestarncalculadosoprecalculadosloquepermitequelos
tiemposderespuestasseanmuchomejor.UnodelosmodeloscomnmenteutilizadoseselmodeloStar
Schemaounesquemaenestrella.Unesquemaenestrellaesaquelquetieneunatabladehechos
tambinllamadaFactTableyalrededorsusdimensiones.Lasdimensionesestnrelacionadasalatabla
dehechosatravsdeunallaveprimaria.Estetipodeesquemaesidealparabasesdedatosdetipo
OLAPyDataMartporsusimplicidadylavelocidadparahaceranlisis.DB2tienemuchas
optimizacionesinternasparahacerelusodeestetipodeesquemas.Porejemplohaimplementadoel
usodelnuevomtodoZigzag.
Figura14.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

12/23

5/5/2015

Caractersticasytiposdebasesdedatos

InformixWarehouseAcceleratorIWA
SussiglaseninglssonInformixWarehouseAcceleratorelcualesunoptimizadordecargasde
trabajoquepermitelaintegracinenlosprocesosoperacionalesparaconducirestrategias
ganadoras.Aceleralasconsultascontiemposderespuestassinprecedentes.ElIWAesuna
tecnologadevanguardiaparamejorarelperformanceyofrecelassiguientescapacidades:
1. CompresinextremanecesariaporquelamemoriaRAMeselfactorlimitante.
2. Basededatosporrenglnparacargasdedatostransaccionales(OLTP)yporColumnaparaaccesar
adatosvaelaceleradorparaOLAP.
3. Tercerageneracindebasesdedatosenmemoria.EvitalaEntrada/Salidaaldiscodebidoaquela
compresinpermitetenerlosdatosresidentesenmemoria.
4. Frecuenciadeparticionamiento.Habilitadoparaelaccesoefectivodelosdatoscomprimidos.
5. Paralelismomasivo.Todoslosprocesadoressonutilizadosenlasconsultas.
6. Evaluacindepredicadoscondatoscomprimidosloqueincrementaeldesempeoenlasconsultas.
7. ActualizacinautomticaaniveldeparticinlocualpermiterefrescarenlosDataMartsololosdatos
quehancambiado.
8. Soporteparadatosdeseriesdetiempos.Sepuedenanalizarenmemorialosdatosquevienende
censoresinteligentes,medidas,localizacinGPS,uotrosdispositivosentiemporeal.
Figura15.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

13/23

5/5/2015

Caractersticasytiposdebasesdedatos

QusonlosPureSystem?
Sonunanuevaclasedesistemasintegradosexpertosqueestndiseados,prefabricados,configurados
yoptimizadosparaejecutarcargasdetrabajomuycomplejasyespecificas.Lasventajasqueofrecen
estetipodesistemasson:
1. Construidoconbasealacoleccindeconocimientoscolectivosdemilesdeimplementaciones,
mejorespracticas,experienciadesociosdenegociosyproveedores.
2. Integradospordiseo.TodosloscomponentesdeHardwareySoftwareestnperfectamente
integradosysincronizadosparalascargasdetrabajoquevaaejecutar.
3. ProporcionaunaperfectasincronaentreelHardwareySoftwareyaquevienenpreviamente
diseados,integrados,configurados.Alinstalarloyconectarloalaredustedtieneunsistemalisto
paraoperar.
4. Seobtienevalorencuestindedasyaquelaexperienciadelosexpertosestincorporadajuntocon
laintegracindelossistemas.

FamiliadelosPureSystem
ExistentresfamiliasdePureSystemloscualesestndiseadosparadarsolucinalosproblemasque
enfrentanlosdiferentestiposdecargasdetrabajo,cambiandolaeconomaylaexperienciadelas
tecnologasdelainformacin.
PureFlex:Estossistemasproporcionanserviciosdeinfraestructuraypermitenconstruirsupropia
aplicacinoentornosdeinfraestructuraenunentornoescalable,dealtadisponibilidadyfcilde
mantener.Sihaysolounaplataformaydeseaconstruircualquieraplicacinindependientementedelos
sistemasquetenga,PureFlexeslasolucin.
PureApplications:EstabasadoenlosmismosprincipiosdePureFlexyproporcionaserviciosde
plataforma.SeintegratodoelSoftwareylasherramientasquesenecesitanparaconstruiruna
plataformadeaplicacionesaltamenteescalable.Elobjetivoesofrecerunaplataformadeaplicaciones
tipoWeb.SiustedtieneaplicacionesWeboaplicacionesqueutilizanmemoriaytieneninteraccincon
labasededatosentoncesPureApplicationseslasolucin.
PureData:Porultimo,estossistemassondesarrolladosparaofrecerserviciosdedatosalas
aplicacionesindependientementedequesetratedeaplicacionestransaccionalescomopuntodeventa
oCRM,osistemasdeanlisiscomoperdidadeclientesy/oadministracindecampaas.Paradatos
especficos,aplicacionesOLTP,aplicacionesysistemasdeanlisisprofundoentoncesPureDataesla
solucin.
CuandohablamosdelossistemasPureDatatenemosdiferentesdispositivosPureData,porquesus
aplicacionesdedatos,elaccesoalostiposdedatosylastransaccionessonmuydiferentes.Yesaqu
dondeseofrecennuevosdispositivos.
Figura16.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

14/23

5/5/2015

Caractersticasytiposdebasesdedatos

SistemasPureDataparaHadoop
Estedispositivoestoptimizadoparaalmacenar,catalogar,analizarytransformargrandesvolmenes
deinformacinenmuchosformatosdiferentes.Tambinsepuedeutilizarparamantenermayoresdatos
relacionadosqueseaccedenconmenorfrecuenciadesdeunDataWarehouse,porlotantomantieneun
fcilaccesosinocuparespacioyrecursosenelDataWarehouse.Optimizadotambinparaelanalizar
archivosenlnea.
http://www01.ibm.com/software/data/puredata/hadoop/

SistemasPureDataparatransacciones
Estedispositivoestdiseadoparaelcomercioelectrnico,comercioWebtransaccional.Comopor
ejemplo,lasaplicacionespuntosdeventadondeseescaneauncdigoyatravsdeeselsedetermina
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

15/23

5/5/2015

Caractersticasytiposdebasesdedatos

suprecio.Tambinconocidocomoserviciosdeclusterdebasesdedatosoptimizadoparael
rendimientoyescalabilidadtransaccional.
http://www01.ibm.com/software/data/puredata/transactions/

SistemasPureDataparaanalticos
Estedispositivotieneunaoptimizacindiferentedebidoaquehayunainteraccinconlabasededatos,
conlamemoria,yoptimizadeformadiferentelascargasdetrabajoparaanlisisyDataWarehouse.
Estoesparaaplicacionescomoelanlisisdeclientes,anlisispredictivo,altavelocidaddeanlisisen
datos(petabyte)conlamximasimplicidad.EstoestdesarrolladoconlaTecnologadeNetezza.El
sistemaN200xsigueofreciendo:
1. Mismasoptimizacionesparagrandesvolmenesdedatos.
2. Ningunaadministracintctil.
3. Msde150funcionesanalticasoptimizadas.
4. RendimientooptimizadodeanlisisdeBigData.
5. Administracinsencillaparaundesplieguerpidoyfcil.
6. TresvecesmsrpidoqueelmodeloN1001.
7. 50%msdecapacidaddedatosporrac.EstoayudaaoptimizarlaeficienciadelDataCentersin
incrementarlapotenciaolosrequisitosderefrigeracin.
http://www01.ibm.com/software/data/puredata/analytics/

SistemasPureDataparaanlisisdeoperaciones
Estedispositivodaunasolucincomomezcladelainformacindeloqueustedtiene,loqueustedsabe
ylosanlisis,peroustedtienebsquedaspuntuales.Porejemplo,siustedestabuscandoladeteccin
deunfraudeentiemporealenelqueesthaciendoprofundasexploracionesamuchosdatose
identificaquepuedehaberproblemaenalgunosregistros,ustedluegorealizaunabsquedapuntuala
esosregistros.Estoptimizadoparaequilibrarelaltorendimientoparaelanlisisdedatosyoptimizado
paraequilibrarelrendimientooperativoentiemporeal.
http://www01.ibm.com/software/data/puredata/operationalanalytics/
Cuandosetieneunnmerodeconsultaspuntualesdetipotransaccionalsedebeinclinarhacialos
sistemasPureDataparaAnlisisdeOperaciones.Sinecesitaconsultasmuycomplejasdealtavelocidad
entoncessedebeinclinarporPureDataparaAnalticos(EsteeselsistemabasadoenNetezza).

LatendenciaBasesdedatosenMemoria
Comohemosvisto,conformepasaeltiempolasnecesidadesdelnegociocambianycrecen,porlotanto
sehanagregadonuevascaractersticasalasbasesdedatosparahacerfrentealosproblemasdealta
disponibilidad,desempeo,seguridad,ahorrosenalmacenamiento,etc.Unodelosrecursosms
costosoeselalmacenamientodelainformacinyhoyconelnuevoconceptodeBigDatalanecesidad
demanejargrandesvolmenesdeinformacinsehaincrementado.Elaccesoadiscoeselaccesoms
lentoparaobtenerlainformacin.Actualmenteelcostodelamemoriahadisminuidoylatendenciaes
hacerunmejorusodelamismaporquesehademostradoqueelreaprincipaldeunabasededatos
paraobtenerunmejordesempeoeslamemoria,altenerlosdatosenmemoria,elaccesoala
informacinserealizadeunamaneramsrpida.Lasbasesdedatoscuandobuscanlainformacinen
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

16/23

5/5/2015

Caractersticasytiposdebasesdedatos

eldiscoparadespussubirlaamemoriageneracuellosdebotella,estodependertambindeltipode
discoquesetenga.EnlaseccinpreviasecomentqueelusodediscosdeestadoslidoSSDes
tambinlatendencia,peroporelmomentosonmuycostososynoesunasolucinviableparamuchas
empresas.
ParahacerfrentealmejorusodelamemoriayentregarmejoresresultadosenbasesdedatosOLAP,en
DB2eInformixsehanagregadonuevascaractersticasquepermitennosolotenerlosdatosenmemoria
sinoquetambinpermiteobtenermayorestasasdecompresindedatos,locualpermitemanipular
mayoresvolmenesdeinformacin.Latendenciaestenermsdatosenmemoriademanera
comprimida,conloanteriorsereduceelaccesoadiscoyseincrementaeldesempeoparaelanlisis
delainformacin.
http://www01.ibm.com/common/ssi/cgibin/ssialias

TiposdeOLAP
ROLAP
SussiglaseninglssignificanRelationalOLAP.EnROLAPlosdatossonalmacenadosenunStar
SchemacontablasdeHechosyDimensiones.LasconsultasSQLanalticastienenungrannmerode
Joins,Scanyenormescantidadesdedatosagregados.PorejemploDB2CubeViewsyCognos
FrameworkManagerwithRelationalDatasource.
Figura17.

MOLAP
SussiglaseninglssignificanMultidimentionalOLAP.EsladescripcindeunservidorOLAPque
almacenaelcubocompletoOLAPenmemoria.Normalmentelasagregacionessonprecalculasy
almacenadasenmemoria.Estotraecomoresultadorespuestasmuyrpidasaconsultasdedatosy
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

17/23

5/5/2015

Caractersticasytiposdebasesdedatos

permiteunaaltaconcurrenciaenejecucindeconsultas.EjemploCognosPowerCubes,CognosTM1y
Essbase.
Figura18.

HOLAP
SussiglaseninglssignificanHybridOLAP.ComosussiglasloindicanesunacombinacindeROLAP
YMOLAP.CombinamuchasdelascaractersticasdeROLAPYMOLAPdondenoexistelmitedel
tamaodedatoscomoROLAPyproporcionatodaslascapacidadesparaobtenerdetallesdela
informacin,conunaaltaconcurrenciayaltorendimientoparalosdatossolicitados.Silosdatos
solicitadosestnencachenoserealizalaconsultaenlabasededatos,delocontrariolaconsultase
ejecutarenlabasededatos.EjemplosCognos10.1.1DMRyCognosDynamicCubes.
Figura19.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

18/23

5/5/2015

Caractersticasytiposdebasesdedatos

QuesIBMBLUAccelerationforCloud?
EsunasolucindeDataWarehouseyAnlisisenlaNube.ElconceptodeNubedeunamanerasimple
sonlosserviciosinformticosqueseofrecenatravsdeInternet.Unadelasventajasdeestas
arquitecturasesquelasempresasyanorequierendeunainfraestructurapropiaypermitealosusuarios
accesaralasaplicacionesdesdecualquierpuntodondeseencuentren.Paralosprogramadorespermite
elrpidodesarrollodeaplicaciones.
http://bluforcloud.com/

QuesCloudant?
Esunabasededatosdecomoservicio(DBaaS)lacualpermitecentrarseeneldesarrollorpidode
aplicacionesenInternetyaplicacionesmvilesenlugardepreocuparseporlaexpansinygestindela
basededatosporsucuenta.Tienealtadisponibilidad,esduraderaycontieneampliasfunciones.El
almacndedatosseconstruyeparalaescalabilidadyestoptimizadaparalecturasyescrituradedatos
simultneas.Manejatambinunaamplavariedaddetiposdedatosestructuradosynoestructurados
entreellosJSON,textoscompletosygeoespacial.
Figura20.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

19/23

5/5/2015

Caractersticasytiposdebasesdedatos

https://cloudant.com/
LabasededatosCloudanteslaprimeraplataformadegestindedatosparaaprovecharla
disponibilidad,escalabilidad,yelalcancedelaNubeparacrearunareddedistribucinglobaldedatos
(DDN)quepermitaalasaplicacionesestardisponiblesparalosusuariosdondequieraqueseencuentre.
Figura21.

QuesJSON?
SusnomenclaturaseninglssignificanJavaScriptObjectNotation,elcualesunformatoligeroparael
intercambiodedatos.JSONestbasadoenunsubconjuntodellenguajedeprogramacinJavaScript.
Susimplicidadhahechoquesuusoseestampliando,algosimilaralmanejodedatostipoXMLdonde
esfcildeimplementar,deleerydeutilizar.Tambinesindependientedellenguajedeprogramacinya
quemuchoslenguajestienencaractersticasparamapearconJSON.Seempleaenambientesdondeel
flujodelosdatosesdevitalimportanciacomoporejemploGoogle,Yahoo,etc.queatiendenamillones
deusuarios.JSONestsoportadoenDB210.5eInformix12.1conelcualsepermiteguardar,consultar
yactualizardocumentos.Combinadatosdesdeotrossistemascondatostradicionalesenlamismabase
dedatos,comoporejemplolasaplicacionesWebomviles.JSONdaelpoderalosprogramadoresde
reducirladependenciadelastecnologasdelainformacin,esdecir,nosenecesitancrearesquemasy
tampocotablas.Ejemplodeunsimpledocumento:
{
"nombre"
:"Daniel",
"apellido" :"Anguiano",
"edad"
: "40",
"direccion":
{
"calle" :"Prados 100",
"ciudad :"Mexico",
"cp"
:"52034"
},
"telefono" :
[
{
"tipo"
:"celular",
"numero" :"5564239823"
}
{
"tipo"
:"trabajo",
"numero" :"5553706234"
}
]
}

LaimportanciadeJSONesqueayudaahabilitarlanuevaeradeaplicacionesmviles,socialesyNube
convirtindoseasenunodeloslenguajesparalaWeb.Solosoportaseistiposdevaloresyson:
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

20/23

5/5/2015

Caractersticasytiposdebasesdedatos

1. Cadena(String)
2. Numrico
3. Booleano
4. Valoresespecialescomoelvalornulo
5. Objetos
6. Arreglos
Nosoportaestructurasdedatoscclicos,esdecir,utilizarunconjuntodeaccionesquesepueden
ejecutarunaovariasveces(Para For 1 to 10 , Mientras While v_cont 100,
Repetir Repeat ).

Internetdelascosas(IoT)
Hoy,elmundoestahperconectadocondiferentesfuentesdeinformacin(redessociales,unidades
mviles,censoresytodoloqueestanuestroalrededor)loqueestprovocandoestarencontactocon
muchainformacin.TodoestemundodeinformacinhaceelInternetdecosascreandonuevas
oportunidadesenmuchasreas.Elobjetivonoesalmacenargrandesvolmenesdeinformacinsino
actuarsobrelamismaatravsdelanlisisdeunaformarpidaparaelaprovechamientodelamisma.El
objetivoesdarlevaloralainformacinparaofrecerloquequiereelconsumidor,paraidentificarfraudes,
optimizarreabastecimientodeinventarios,etc.ElInternetestaaccesible24x7los365dasdelaoyla
informacinestahcomounaoportunidaddehacernegocio.Estemundodeinformacinnopuedeser
explotadaporcualquiermanejadordebasededatoslocualhacecomplicadoelmanejoyanlisisde
estemundodeinformacin.Lasrazonessonlassiguientes:
1. Losdatossongeneradosdediferentessistemas,conformatoscomplejos,diferentesfuentesytipos
dedatos,estructurados,noestructuradosyvienendediferentescontextos.
2. Sondifcilesdeanalizarporelvolumendeinformacin,requierenmsprocesamiento,modeladode
datos,anlisiscomplejodetextosycorrelacindedatosatravsdelosdistintos.
3. Ustednecesitasercapazdevisualizarlainformacinparaactuarsobreella.Serequierensofisticados
algoritmosdebsquedaparatomardecisiones.

IBMInformixBasededatosinteligenteparaIoT
IBMInformixesunabasededatosinteligentepararesolverlosproblemasdeIoT.Suscaractersticas
nicaslepermitenquefuncioneendispositivosperifricosytambinenlaNube.EnlaNube,Informix
tienelaescalabilidadyelrendimientoparaservircomoplataformadeanlisisavanzadosqueconsolidan
lainformacindemillonesdedispositivos.Tambintienelacapacidaddeproporcionarinteligencialocal:
Consolidacindedatoslocales,anlisisytomadedecisioneslocales,tieneelalmacenamientoencache
siesnecesario,elcontrolylareplicaalanubeparacopiasdeseguridadyrecuperacin.Dondequiera
implementarloobtendrfacilidaddeuso,estabilidadyunconjuntodecaractersticasquelaconvierten
enlasolucindebasededatosSimplementePotenteparaInternet.
Figura22.

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

21/23

5/5/2015

Caractersticasytiposdebasesdedatos

Conclusin
Eltemadebasesdedatosesmuyampliodeexplorarydifcildeseleccionarculeslamejor
arquitecturaautilizar.NormalmenteseseparanlasbasesdedatosparaoperacionesTransaccionalesy
paraAnalticos.Esnecesariohacerunbuenanlisisdeltipodeoperacinquesevaaejecutarenla
basededatosparapoderelegirlaarquitecturamsadecuadayasrealizarunbuenusodelas
capacidadesdelasbasesdedatosparaobtenerlosmejoresresultados.Paralascompaasesdifcil
mantenerunequilibrioentreinvertirenHardwareySoftware.Yahemosvistodiferentestiposde
solucionesqueseadaptanalosdistintosgirosdeempresas.Lacompresindedatos,elmanejode
grandesvolmenesdeinformacin(EstructuradosyNoEstructurados),datosenmemoria,lenguajesde
programacinqueutilizansentenciasSQLyNoSQL,sistemashbridos(TransaccionalesyAnalticos),
reduccindecostosdealmacenamientoylostiemposmnimosderespuestaparaobtenerunresultado
hansidolosmotivosparaeldesarrollodenuevasarquitecturasanivelSoftwareyHardware.

Referencias
InformationCenterDB210.5
DB2withBLUAcceleration
DB2PureScale
DB2HighAvailability
DataWarehouseAnalytics
BigDataandAnalytics
PureSystem
IBMPureSystems
Lanuevafamiliadesistemas
expertosintegradosdeIBMest
aqu.

Lacarrerahacomenzado!
ObtengaWASpara
desarrolladoressincosto.

Descargagratuita:
http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

22/23

5/5/2015

Caractersticasytiposdebasesdedatos

RationalTeamConcertforPower
SystemsSoftwareStandard
Edition

http://www.ibm.com/developerworks/ssa/data/library/tipos_bases_de_datos/index.html

23/23

Вам также может понравиться