Академический Документы
Профессиональный Документы
Культура Документы
ESCUELA DE POSTGRADO
PROGRAMA DE MAESTRIA
MAESTRA EN INFORMTICA
TESIS
MTRICAS DE PERFORMANCE EN ADMINISTRACIN DE BASES DE
DATOS DISTRIBUIDAS EN INTERNET
PRESENTADA POR:
WILLY ENRIQUE QUISPE ACCHA
PARA OPTAR EL GRADO ACADMICO DE:
MAGISTER SCIENTIAE EN INFORMTICA
MENCIN EN INGENIERA DE SOFTWARE
PUNO, PERU
2014
PRESENTADA POR:
WILLY ENRIQUE QUISPE ACCHA
PARA OPTAR EL GRADO ACADMICO DE:
MAGISTER SCIENTIAE EN INFORMTICA
MENCIN EN INGENIERA DE SOFTWARE
APROBADA POR EL SIGUIENTE JURADO:
PRESIDENTE
.
M.Sc. ERNESTO NAYER TUMI FIGUEROA
PRIMER MIEMBRO
.
M.Sc. PEDRO LEONARDO QUISPE TICONA
SEGUNDO MIEMBRO
.
M.Sc. REYNALDO SUCARI LEON
ASESOR DE TESIS
.
M.Sc. PACO WILSON MARCONI QUISPE
DEDICATORIA
Dedico este trabajo principalmente a Dios, por haberme dado la vida y permitirme
el haber llegado hasta este momento tan importante de mi formacin profesional.
A mi madre, a pesar de nuestra distancia fsica, siento que ests conmigo siempre
y aunque nos faltaron muchas cosas por vivir juntos. S que este momento
hubiera sido tan especial para ti como lo es para m. A mi padre, por ser el pilar
ms importante y por demostrarme siempre su cario y apoyo incondicional sin
importar nuestras diferencias de opiniones. A mi esposa Lurdes, a quien quiero
como una compaera, por compartir momentos significativos conmigo y por
siempre estar dispuesta a escucharme y ayudarme en cualquier momento y a mis
hijos Max Brandon y Betsy Shamira, porque sin ellos no hubiera logrado esta
meta.
AGRADECIMIENTOS
-
ii
INDICE GENERAL
Pg.
DEDICATORIA
AGRADECIMIENTOS
ii
INDICE GENERAL
iii
INDICE DE CUADROS
vi
INDICE DE FIGURAS
vii
RESUMEN
viii
ABSTRACT
ix
INTRODUCCIN
CAPTULO I
PROBLEMTICA DE LA INVESTIGACIN
1.1
1.2
OBJETIVOS DE LA INVESTIGACIN
CAPTULO II
MARCO TERICO
2.1
2.2
ANTECEDENTES DE LA INVESTIGACI
MARCO REFENCIAL..
12
12
13
18
2.2.4
SISTEMAS
CENTRALIZADOS
SISTEMAS
DISTRIBUIDOS.
16
19
21
23
24
iii
25
27
28
30
2.2.12
INTEGRIDAD
DE
DATOS
EN
ENTORNOS
DISTRIBUIDOS
2.3 GLOSARIO DE TERMINOS BSICOS
30
34
CAPTULO III
METODOLOGA
3.1
37
37
37
3.2
MTODO......................................
38
3.3
UNIDAD DE ANLISIS..
38
CAPTULO IV
RESULTADOS Y DISCUSIN
4.1
39
4.3
DE
BASE
DE
DATOS
RELACIONAL.
40
40
4.1.4
4.2
CARACTERSTICAS
39
DISEO
DE
LAS
BASES
DE
DATOS
RELACIONALES
41
42
43
43
44
48
iv
48
51
64
CONCLUSICIONES
67
RECOMENDACIONES
69
BIBLIOGRAFA.
70
INDICE DE CUADROS
Pg.
Cuadro 1 Especificaciones tcnicas base de datos Postgre ........... 44
Cuadro 2 Especificaciones tcnicas base de datos Mongo ..... 44
Cuadro 3 Especificaciones tcnicas base de datos MySQL............ 44
Cuadro 4 Especificaciones de escenarios....... 45
Cuadro 5 Estructura de la tabla/coleccin para los escenario ..... 45
Cuadro 6 Variables para evaluacin.. ...... 46
Cuadro 7 Tiempos de insercin escenario N 1. .... 47
Cuadro 8 Tiempos de insercin escenario N 2. .... 47
Cuadro 9 Consumo de recursos escenario N 1. ....... 48
Cuadro 10 Consumo de recursos escenario N 2 .. 51
Cuadro 11 Errores de insercin en escenario N 1......... .. 55
Cuadro 12 Errores de insercin en escenario N 2......... .. 56
Cuadro 13 Error de acceso de BD. En escenario N 1... .. 57
Cuadro 14 Error de acceso de BD. En escenario N 2... .. 58
Cuadro 15 Resumen de pruebas .......... .. 60
vi
INDICE DE FIGURAS
Pg.
Figura 1: Topologas de Redes de Comunicacin ....... 27
Figura 2: Paginacin escenario N 1 ................. 48
Figura 3: Acceso a disco fsico en escenario N 1 ...... 49
Figura 4: Uso de procesador en escenario N 1 .......... 50
Figura 5: Consumo de memoria RAM en escenario N 1 ...... 51
Figura 6: Paginacin en escenario N 2 ........ 52
Figura 7: Acceso a disco fsico en escenario N 2... ...... 52
Figura 8: Uso de procesador en escenario N 2 ....... 53
Figura 9: Consum de memoria RAM en escenario N 2 ...... 54
Figura 10: Porcentaje de errores de insercin en escen. N 1 ..... 55
Figura 11: Porcentaje de errores de insercin en escen. N 2 ..... 56
Figura 12: Porcentaje de errores de acceso a bd. N 1 ........ 58
Figura 13: Porcentaje de errores de acceso a bd. N 2 ........ 59
Figura 14:Porcentaje de xito en implementacin. de solucin ............. 60
vii
RESUMEN
Esta tesis describe el anlisis de mtricas de performance en administracin
de bases de datos distribuidas en Internet, para cumplir con dicho objetivo se
hizo el anlisis de bases de datos relacionales y no relacionales y finalmente
se hizo un anlisis comparativo entre las bases de datos relacionales y no
relacionales. La metodologa empleada para cumplir con los objetivos se
emple el mtodo analtico pues se har un anlisis de las ventajas y
desventajas de Software MongoDB, MySQL y PostgreSQL. Este trabajo
de investigacin pretende proponer una alternativa de base de datos que es
el de tipo de no relacional (NoSQL) frente a las bases de datos de tipo
relacional, de forma que puedan ser competitivas y hagan uso de las
tecnologas emergentes que abordan las necesidades de hoy en da. Las
conclusiones de la investigacin luego de realizado el anlisis de mtricas de
performance en administracin de bases de datos distribuidas en Internet se
concluye que la mejor opcin al momento de implementar una solucin para
el desarrollo datos NoSQL documental, ya que el porcentaje de tener xito
es del 70%, el cual es notablemente superior al caso en el que se
implemente una base de datos relacional.
Palabras clave: anlisis, Base de datos, Internet
viii
ABSTRACT
be
analyze
of
advantange
and
disadvantange
of
Software
ix
INTRODUCCIN
Actualmente las organizaciones que manejan bases de datos operan con
gran cantidad de datos, esto se debe a la cantidad de usuarios, aplicaciones
y necesidades internas o externas. Tanto es el crecimiento de estas
tecnologas que no es mantenible ni escalable continuar en algunos casos
con los mismos motores de bases de datos ya que dificulta la
administracin y mantenimiento de la informacin.
Hasta ahora se pueden identificar a grandes rasgos dos tecnologas de
gestin para el almacenamiento de datos: Las basadas en SQL y las que
no siguen este estndar, denominadas NoSQL; las primeras son las
mayormente conocidas como MySQL y Oracle de la compaa Oracle,
SQL Server de Microsoft, PostgreSQL de PostgreSQL Global Developer
Group.
Las bases de datos NoSQL surgieron como consecuencia de los
rendimientos de los motores basados en SQL, ya que no cumplan las
expectativas de tiempo de respuesta. Esta siguiente generacin de sistemas
de gestin de bases de datos contiene unas caractersticas particulares, ya
que es no relacional, distribuida, de cdigo abierto y horizontalmente
escalable estas caractersticas se explicarn en detalle ms adelante-,
de esta forma se optimiza el tiempo de consulta sobre las bases de datos y
soportan una mayor cantidad de datos.
La presente tesis se encuentra dividida por cuatro captulos, exponiendo a
continuacin
CAPITULO I
PROBLEMTICA DE INVESTIGACIN
1.1
La
utilizacin
de
bases
de
datos
OBJETIVOS DE LA INVESTIGACIN
Se plante los siguientes objetivos:
CAPITULO II
MARCO TERICO
2.1
ANTECEDENTES DE LA INVESTIGACIN
LEONEL
DE
CERVANTES,
Antonio
Francisco
GUTIRREZ,
Jos
Carlos
(1999).
Anlisis
de
BORJA,
Henry
Daniel
(2012).
Desarrollo
de
hasta llegar a su actual versin HTML5. Esta tesis est basado en aquella
nueva versin, desarrollando as una aplicacin web orientada a redes
sociales, con el objetivo de exponer cambios y mejoras que han surgido a la
par con HTML5 y aadiendo una nueva alternativa para el almacenamiento
de datos como lo es MongoDB, una base de datos NoSQL, que
intenta solventar limitaciones del modelo relacional al momento de trabajar
con una cantidad masiva de datos.
RUIZ CARRETE, Jos Guadalupe (2004). Procesamiento de consultas
en bases
de
datos
paralelas. Tesis
para
optar
el
grado
de
de
de
datos
distribuidas y
CONCEPCION,
Luzmila
Elisa
(2010).
Base
de
datos
longitud
de
la
cola
del
recurso.
Probabilidad
de
LLERENA,
Luis
Robert
(2005).
Diseo
de
bases
de
aplicaciones
computacionales.
continuamente
en
Existen
circuitos,
avances
dispositivos
10
11
2.2
MARCO REFERENCIAL
sistema
distribuido
es
una
coleccin
de
computadoras
independientes que aparecen ante los usuarios del sistema como una nica
computadora (Tanenbaum, 1996).
El desarrollo de la tecnologa y en particular la de los sistemas
distribuidos de cmputo ha tenido como metas a alcanzar, el tener sistemas
cada vez ms rpidos, eficientes, confiables, precisos y adaptables. Algunos
sistemas buscan brindar mayor calidad de servicio y rapidez al aumentar
el nmero de servidores. En los sistemas de misin crtica, lo que se busca
es la continuidad en la operacin del sistema, donde lo ms importante no es
la rapidez sino su disponibilidad, an a expensas de realizar inversiones
redundantes en tecnologa que slo ser usada en caso de falla. En otro
tipo de sistemas lo que se busca es la precisin o capacidad de cmputo,
pasando a un segundo plano el tiempo que el sistema tarde en entregar los
resultados. Otro tipo de necesidades son aquellas que surgen cuando lo
ms importante es el tiempo de entrega, si el resultado es correcto pero
tardo, se convierte en invlido para todo el sistema, o peor an, ocasiona
que el sistema se colapse; este ltimo tipo de sistema se conocen como
Sistemas de Tiempo - Real (Garcia, 2003).
12
puede gestionar
por
administracin
una
de
red
Base
de
comunicaciones. Generalmente,
de
Datos
Distribuida
se
la
encuentra
14
mltiples
sitios
conectados
por
alguna
especie
de
red
de
es
heterogneo.
Otro
factor
relacionado
con
el
grado
16
Distribuida
(Breitbart,
Komondoor,
Rastogi,
Seshadri,
&
Silberschatz,1999):
Distribucin y autonoma de unidades de negocio. Las organizaciones se
encuentran esparcidas geogrficamente y cada unidad organizacional
necesita disponer de sus datos en forma local.
Compartir los datos. Las decisiones empresariales se toman en funcin
de las necesidades globales de la empresa.
Costo y disponibilidad en las comunicaciones de datos. El costo de las
comunicaciones es generalmente elevado. Mantener copias locales de
los datos es una forma confiable y econmica para tener un acceso
rpido y econmico a la informacin dentro de la organizacin.
Recuperacin de Base de datos. Replicar la informacin en diferentes
estaciones de trabajo es una estrategia para asegurar que una Base de
Datos daada pueda ser rpidamente recuperada, permitiendo de
esa forma aumentar la disponibilidad de los datos.
Los principales objetivos que se persiguen con Base de Datos
Distribuida consisten en proveer al usuario de un acceso a los datos desde
diferentes ubicaciones.
Desde
aqu
estar
se
provistas
pueden
en
los
derivar
algunas
sistemas
que
Autonoma local: cada sitio donde residan datos tiene el control exclusivo
sobre ellos. Esto se logra mediante un DBMS que acta como
administrador local de los datos. Cada sitio, si bien cuenta con autonoma,
coopera con el resto de los sitios, compartiendo la informacin y
controlando el uso correcto de la misma Comparado con las Bases de
Datos centralizadas, una Base de Datos Distribuida presenta ventajas
que se describen a continuacin:
las
aplicaciones que
llevan
la
tecnologa
18
sistemas
distribuidos,
adems,
tiene
asociadas
diferentes
Se
presentan a
contras de los
las
desventajas
asociadas
los
sistemas
distribuidos
pueden mencionarse:
que una localidad deje puertas abiertas por donde puedan efectuarse
accesos indebidos. El control sobre la seguridad de los recursos
resulta ms complejo.
21
diversos tipos
de
conexiones,
redes WAN
por
equipos
esta
estandarizaciones que
heterogeneidad.
solucionan
el
Para
ello,
problema.
se
La
dispone
arquitectura
de
de
22
transmisiones. En
redes.
Esto
es,
una
organizacin
puede
tener,
en
distintas
tecnologas
de
informacin
que
23
soporten el
cmputo
intensivo
hacia
comunicacin
intensiva
(informacin
objetivo fundamental de
diseo de la
al
usuario la
tecnologa de
ilusin que
sistemas
todos
los
24
un conjunto de relaciones
25
los
datos
sobre
algn
dispositivo
(disco
rgido,
por
ejemplo) controlado por el DBMS. Por ltimo, manipular una Base de Datos
incluye aquellas funciones de consulta con el fin de obtener ciertos
resultados especficos a partir de los datos almacenados.
Las ventajas que se tienen al utilizar una Base de Datos son (Hoffer &
Prescott, 2002):
Minimizar el mantenimiento.
26
2.2.9 PROCESAMIENTO
DE
CONSULTAS
EN
BASE
DE
DATOS DISTRIBUIDA
Una consulta expresada en un lenguaje de alto nivel como SQL,
primero debe pasar por un anlisis lxico, un anlisis sintctico y una
validacin. El analizador lxico identifica los smbolos del lenguaje en el texto
de la consulta, mientras que el analizador sintctico revisa la sintaxis de la
consulta para determinar si est formulada de acuerdo con las reglas
sintcticas del lenguaje de consulta. Adems, la consulta se debe validar,
para lo cual se debe comprobarse que todos los nombres de atributos y de
relaciones sean vlidos y tengan sentido desde el punto de vista semntico
en el esquema de BD que se est utilizando.
Adems, una consulta tiene muchas posibles estrategias de ejecucin,
y el proceso de elegir la ms adecuada para procesar una consulta se
conoce como optimizacin de consulta. El proceso de optimizacin de
consultas consiste en determinar cul es el mejor esquema de resolucin, el
cual debera ser el que mejor respuesta tenga en performance.
en
cuenta
para
la
optimizacin
de
consultas
en
un
27
autorizacin
forma que los sistemas centralizados. Todas las reglas deben estar
disponibles, replicadas, para todos los sitios de la red.
29
Las transacciones locales son las que tienen acceso y actualizan datos
slo en una Base de Datos local, residente en un nodo o localidad, en
tanto que las transacciones globales tienen acceso y actualizan datos en
varios nodos o localidades de la red. Asegurar las propiedades de las
transacciones
locales es
similar al
proceso realizado en
entornos
centralizados.
Sin embargo, en caso de transacciones globales, esta tarea es
mucho ms compleja y requiere un estudio mucho ms detallado
2.2.12 INTEGRIDAD DE DATOS EN ENTORNOS DISTRIBUIDOS
2.2.12.1
Los sistemas distribuidos pueden sufrir los mismos tipos de fallos que
los sistemas centralizados (por ejemplo, errores de software, errores de
hardware o fallos graves de disco). Sin embargo, hay otros tipos de fallos
con los que tratar en los entornos distribuidos (Tanenbaum, 1996). Los tipos
principales de fallo, que ahora aparecen, son:
Fallo de una estacin de trabajo o nodo
Prdida de mensajes
Fallo en el enlace de comunicaciones
Divisin de la red.
30
lo
que
respecta
conceptos
como
fallo
en
el
enlace
Fuente: http://wikitel.info/wiki/Redes_de_comunicaciones
31
32
comunicaciones, aumentando
comunicaciones, habra
su
costo.
Si
fallara
un
enlace
de
para
poder
continuar
de
un
modo
normal
su
33
el
diccionario
de
datos
distribuidos
para
que
34
Intercambio
de
informacin
que
fluye
de
forma
Convertir
una
representacin
analgica
en
una
35
un
agregado
natural
de
partes
componentes
encontradas en la naturaleza.
36
CAPITULO III
METODOLOGA
3.1
37
3.2
MTODO
Dentro de las bases de datos relacionales y no relacionales existen dos
grupos los cuales son: las gratuitas y las que necesitan el pago de
licenciamiento para funcionar. Para cumplir con los objetivos de la presente
investigacin se opt por utilizar las bases de datos que son gratuitas de
cdigo no propietario, lo que permite descargarlas y hacer uso de la
funciones sin ningn costo.
Se emplear el mtodo analtico pues se har un anlisis de las
ventajas y desventajas de Software MongoDB, MySQL y PostgreSQL.
Para lograr el objetivo final de este trabajo de investigacin, el cual es
identificar una alternativa viable NoSQL, es necesario un conocimiento
suficiente de informacin tanto de bases de datos de este tipo SQL, as
como los requisitos y sus necesidades
3.3
UNIDAD DE ANLISIS
El estudio y el desarrollo del presente proyecto se realizaron sobre el
38
CAPITULO IV
RESULTADOS Y DISCUSIONES
4.1
bases
de
datos
ya
planificadas.
Permiten
establecer
40
4.1.3.2 DESVENTAJAS
Presentan deficiencias con datos grficos, multimedia, CAD y sistemas
de informacin geogrfica.
No se manipulan de forma manejable los bloques de texto como tipo
de dato.
Las bases de datos orientadas a objetos (BDOO) se propusieron con el
objetivo de satisfacer las necesidades de las aplicaciones anteriores y
as, complementar pero no sustituir a las bases de datos relacionales.
4.1.4 DISEO DE LAS BASES DE DATOS RELACIONALES
El primer paso para crear una base de datos, es planificar el tipo de
informacin que se quiere almacenar en la misma, teniendo en cuenta dos
aspectos: la informacin disponible y la informacin que necesitamos.
La planificacin de la estructura de la base de datos, en particular de
las tablas, es vital para la gestin efectiva de la misma. El diseo de la
estructura de una tabla consiste en una descripcin de cada uno de los
campos que componen el registro y los valores o datos que contendr cada
uno de esos campos.
Los campos son los distintos tipos de datos que componen la tabla, por
ejemplo: nombre, apellido, domicilio. La definicin de un campo requiere: el
nombre del campo, el tipo de campo, el ancho del campo, etc.
Los registros constituyen la informacin que va contenida en los
campos de la tabla, por ejemplo: el nombre del paciente, el apellido del
paciente y la direccin de este. Generalmente los diferentes tipos de campos
41
de
la
carencia
de
un
esquema
predeterminado, la
42
se
pretende
desarrollar
una
aplicacin
que
datos y que
requiera
la
pueda dar
43
44
WEB 2.0: es un trmino asociado con aplicaciones web que facilitan el compartir informacin y la
colaboracin en la web. Ejemplos los servicios de red social, las wikis, blogs, etc
45
en
tecnologa
ya
existente:
bases
de
datos
47
48
Cuadro 1
Especificaciones tcnicas base de datos PostgreSQL
Caractersticas
Soporte
Versin
9,1,4
Tipo
Relacional
ACID
Si
Tamao mximo de la base de datos
Ilimitado
Tamao mximo de la tabla
32 TB
Tamao mximo de campo
1 GB
Cantidad mxima de columnas por tabla
250- 1600 (dependiendo del tipo)
Linux y Unix, Mac OS X y Windows 32/64 bit
Sistemas operativos
Fuente: PostgreSQL. http://www.postgresql.org.es/sobre_postgresql.
Cuadro 2
Especificaciones tcnicas base de datos MongoDB
Caracterstica
Soporte
Versin
10gen
Tipo
NoSQL documental
ACID
No
Tamao mximo de la base de datos
Ilimitado
Tamao mximo del nodo
3 TB
Cantidad mxima de nodos
Ilimitado
Tamao mximo de documentos por nodo 12 millones
Linux y Unix, Mac OS X y Windows 32/64 bit
Sistemas operativos
Fuente: PostgreSQL. http://www.10gen.com/use-case/high-volume-data-feeds.
Versin
Tipo
Cuadro 3
Especificaciones tcnicas base de datos MySQL
Caracterstica
Soporte
5,5,24
Relacional
ACID
Si
Ilimitado
2 TB
1 GB
1- 15(dependiendo del tipo)
Linux y Unix, Mac OS X y Windows 32/64 bit
49
Descripcin
Polticas de insercin
50
Cuadro 6
Variables para evaluacin
Tipo de variable
Variables
Tiempo entre
inserciones
Internas de entrada Cantidad de inserciones
Tiempo total de
inserciones
Tiempo de respuesta
Consumo de recursos
Internas de salida
Porcentaje de fallo
Disponibilidad
Fuente: elaboracin propia.
continuacin se
variables que
procesador
espacio
en
disco
utilizado
durante
las
Cuadro 7
Tiempos de insercin escenario N 1
Parmetros
PostgreSQL MySQL MongoDB
Total de accesos
501 517 199 959
760 120
Intentos de inserciones cada 15 seg.
100
100
100
Tiempo medio por insercin (ms.)
212
1640
107
Fuente: elaboracin propia.
53
durante la
realizacin de las
pruebas del
escenario 1
se
54
Figura 4
Uso de procesador en escenario N 1
uso
de
procesador,
por
parte
de
PostgreSQL
de
55
Figura 5
Consumo de memoria RAM en escenario N 1
56
Figura 6
Paginacin en escenario N 2
57
Figura 9
Consum de memoria RAM en escenario N 2
El
59
Cuadro 11
Errores de insercin en escenario N 1
Parmetros
PostgreSQL MySQL MongoDB
Total de accesos
501 517 199 959
760 120
Duracin de la prueba (min.)
10
10
10
Inserciones fallidas
17 603
48 950
152
Inserciones exitosas
483 914 151 009
759 968
Porcentaje de error
3,51%
24,48%
0,02%
Fuente: elaboracin propia.
60
61
4.3.2.4 DISPONIBILIDAD
La medicin del grado de disponibilidad se bas en la medicin
de cuntos usuarios pudieron hacer uso del servicio de la base de datos y
realizar el intento de insercin a la base de datos.
No hay que confundir las inserciones fallidas con las fallas de
disponibilidad, ya que en el caso de inserciones fallidas el usuario tuvo
acceso al servicio y en el caso de fallas de disponibilidad indica que el
usuario no pudo si quiera acceder a la base de datos para realizar el intento
de insercin.
En el cuadro 13 que se presenta a continuacin se resumen los
accesos fallidos y exitosos a la base de datos.
Cuadro 13
Errores de acceso a base de datos en escenario N 1
Parmetros
PostgreSQL MySQL MongoDB
Total de accesos
501 929 200 100
760 125
Duracin de la prueba (min.)
10
10
10
Inserciones fallidas
412
141
5
Inserciones exitosas
501 517 199 959
760 120
Porcentaje de error
0,08 %
0,07 % 0,0006 %
Fuente: elaboracin propia.
62
Figura 12
Porcentaje de errores de acceso a base de datos N 1
en todas las bases de datos, a pesar del aumento como se observa la base
de datos NoSQL documental continua poseyendo un porcentaje de error
menor del 1 %.
Figura 13
Porcentaje de errores de acceso a base de datos N 2
64
PostgreSQL
MySQL
2
3
3
2
1
2
MongoDB
3
2
2
3
2
3
1
1
1
1
3
1
de
datos
NoSQL
documental
MongoDB
en
la
mayora
de
66
CONCLUSIONES
Luego de realizado el anlisis de mtricas de performance en
administracin de bases de datos distribuidas en Internet se concluye que la
mejor opcin al momento de implementar una solucin para el desarrollo de
un sitio web de alto rendimiento, es la implementacin de una base de datos
NoSQL documental, ya que el porcentaje de tener xito es del 70%, el cual
es notablemente superior al caso en el que se implemente una base de
datos relacional.
Las bases de datos relacionales, es una base de datos que cumple con
el modelo relacional, el cual es el modelo ms utilizado en la actualidad para
implementar bases de datos ya planificadas.
Las bases de datos no relacionales (NoSQL) documental es la ms
utilizada en la actualidad, por las compaas debido a las mltiples ventajas,
como la funcionalidad intuitiva, es MongoDB 10gen. Las bases de datos
NoSQL documentales, como es el caso de MongoDB 10gen, no poseen
seguridad o integridad de datos, es por esta razn que no se deben utilizar en
transacciones importantes, por ejemplo, transacciones bancarias. Las bases de
datos no relacionales (NoSQL) de acuerdo a los resultados obtenidos en las
67
contenido,
68
RECOMENDACIONES
PRIMERO.- Al realizar este tipo de proyectos debemos tener en cuenta que
se debe de realizar un anlisis bastante minucioso, es vital determinar los
requerimientos y sus caractersticas para de esta manera se pueda cubrir
con las necesidades requeridas para de esta manera evitar gastos
innecesarios.
SEGUNDO.- Se debe desarrollar un buen diseo de la Base de Datos que la
informacin no contenga datos redundantes, en el caso de una base de
datos relacional.
TERCERO.- Es importante saber que al momento de utilizar software libre para
disminuir costos y mantener un buen rendimiento, se debe tener en cuenta la
capacidad que deben tener estos programas para el buen manejo de la
informacin.
69
BIBLIOGRAFA
Bell, D., & Grimson, J. (1992). DISTRIBUTED DATABASE SYSTEMS.
Addsion Wesley.
Bobak, A. (1993). DISTRIBUTED AND MULTIDATABASE SYSTEMS.
The Bantam Books.
Breitbart, Y., Komondoor, R., Rastogi, R., Seshadri, S., & Silberschatz,
A.
(1999).
UPDATE
PROPAGATION
PROTOCOLS
FOR
DATABASES.
Computer
Science
Departament,
Stanford University.
Colouris, G. (2001). DISTRIBUTED SYSTEMS: CONCEPTS AND
DESIGN. Addison-Wesley.
Darwen,
H.
(1998).
FOUNDATION
FOR
OBJECT
RELATIONAL
DATABASES.
Elmasri, R., & Navathe, S. (2002). FUNDAMENTO DE SISTEMAS DE
70
71
72
7
3