Вы находитесь на странице: 1из 8

Introduccin

En esta sntesis hablaremos sobre el primer tema que veremos en clase para tener ya tener conocimiento
sobre de lo que se hablara en el aula.
Se trataran temas sobre las bases de datos distribuidas as como sus caractersticas y el cmo han ido
evolucionando a travs del tiempo para facilitar el trabajo a las personas para que toda informacin que
est en una base de datos sea ms sencilla de manejar.
Tambin se describe las caractersticas de la administracin de transacciones para soportar el uso
concurrente de una base de datos, explicar las propiedades de las transacciones ACID y los conceptos
de recuperacin y transparencia de concurrencia y entender la funcin de las herramientas de
recuperacin para manejar las fallas en las bases de datos.
Veremos ms conceptos que nos ayudara a entender mejor el tema como es el caso de la colocacin de
los datos y sus transparencias esto para poder implementarla posteriormente en un proyecto en el mbito
laboral.
Analizaremos las controversias que hay entre la arquitectura cliente/servidor y las bases de datos
distribuidas.

Sistema de Administracin de Base de Datos Distribuidas de


Transaccin y Control de Concurrencia
Un sistema de gestin de bases de datos actualiza mltiples datos a travs de una transaccin. La
transaccin es un conjunto de instrucciones la cual tiene que realizar todas sus instrucciones o ninguna
de ellas, teniendo esta definicin tambin se puede decir que la transaccin es una unidad lgica de
trabajo.

Tambin es un conjunto de sentencias SQL que se tratan como una sola instruccin (atmica). Una
transaccin puede ser confirmada (commit), si todas las operaciones individuales se ejecutaron
correctamente, o, abortada (roUback) a la mitad de su ejecucin si hubo algn problema (por ejemplo, el
producto pedido no est en stock, por tanto no se puede generar el envo).
Trabajar con transacciones puede ser esencial para mantener la integridad de los datos. Por ejemplo, se
puede dar el caso de que se descuenta el stock de un producto antes de proceder a su envo, pero
cuando se va a generar la cabecera del pedido, la aplicacin cliente sufre un corte en las comunicaciones
y no da tiempo a generarlo. Esto supone una prdida de stock. La transaccin garantiza la atomicidad de
la operacin: O se hacen todas las operaciones, o no se hace ninguna.
Transaccin es unidad de trabajo que se debe procesar en forma confiable. Los sistemas de gestin de
bases de datos ofrecen servicios de recuperacin y control de concurrencias para procesar las
transacciones de manera eficiente y confiable.
Cada transaccin individual debe exhibir atomicidad, consistencia, aislamiento y durabilidad. Estas
propiedades se conocen a veces como prueba ACID. Adems, cuando se ejecuten mltiples
transacciones, el sistema de gestin de bases de datos debe programar la ejecucin concurrente de las
operaciones de la transaccin. El programa de esas operaciones de la transaccin debe mostrar la
propiedad de seriacin.

La atomicidad requiere que todas las operaciones de una transaccin se completen; si no es as,
la transaccin se aborta. Si una transaccin T1 tiene cuatro solicitudes de SQL, las cuatro
peticiones deben completarse con xito; de otro modo toda la transaccin se aborta. En otras
palabras una transaccin es tratada como una sola unidad de trabajo lgica indivisible

La consistencia indica la permanencia del estado consistente de la base de datos. Una


transaccin lleva una base de datos de un estado consistente a otro. Cuando se a completa una
transaccin la base de datos debe estar en un estado consistente; si cualquiera de las partes de la
transaccin viola una restriccin de integridad toda la transaccin se aborta.

El aislamiento significa que los datos empleados durante la ejecucin de una transaccin no
pueden ser usados por una segunda transaccin sino hasta que se complete la primera. En otras
palabras, si una transaccin T1 est siendo ejecutada y est usando el elemento X de datos, no se
puede tener acceso con ninguna transaccin a ese elemento de datos (T2Tn) sino hasta que T1
termine. Esta propiedad es particularmente til en ambientes de bases de datos multiusuario por
que varios usuarios pueden tener acceso y actualizar la base de datos al mismo tiempo.

La durabilidad asegura que una vez realizados los cambios de transaccin (registrados), no
pueden deshacerse o perderse, incluso en caso de una falla del sistema.

La seriacin asegura que el programa para la ejecucin concurrente de las transacciones de


resultados consistentes. Esta propiedad es importante en base de datos distribuidas y
multiusuario, donde es probable que varias transacciones sean ejecutadas de manera
concurrente. Claro, si solo se ejecuta una transaccin la seriacin no es problema.

En las bases de datos varios usuarios tienen acceso concurrente, es decir, al mismo tiempo. Si el acceso
estuviera limitado a un usuario a la vez, se realizara una parte mnima del trabajo y la mayora de los
usuarios se llevaran su negocio a otra parte. Sin embargo, los usuarios concurrentes no se pueden

interferir entre ellos. El objetivo del control de la concurrencia es maximizar el caudal de procesamiento
de transacciones y al mismo tiempo, evitar la interferencia entre varios usuarios.
El control de concurrencia coordina la ejecucin simultnea de transacciones. La ejecucin concurrente
de transacciones puede resultar en tres problemas principales: actualizaciones perdidas, datos no
registrados y recuperacin consistente.
El control de concurrencia con mtodos de bloqueo impide el acceso a un registro de la base de datos
por una segunda transaccin hasta que la primera transaccin haya completado todas sus acciones.
Se pueden usar dos tipos de bloqueo en sistemas de bases de datos: binarios y compartidos/exclusivos.
Un bloqueo binario puede tener solo dos estados: bloqueado (1) y desbloqueado (0). Un bloqueo
compartido se usa cuando una transaccin desea leer datos de una base de datos y ninguna otra
transaccin est actualizando los mismos datos. Pueden existir varios bloqueos compartidos o de
lectura para un elemento en particular. Se emite un bloqueo exclusivo cuando una transaccin desea
actualizar a la base de datos y no se retiene ningn otro bloqueo en la base de datos.
El control de concurrencia con mtodos de estampas de tiempo asigna a una estampa de tiempo nica a
cada transaccin y programa la ejecucin de transacciones en conflicto segn el orden de esa marca. Se
usan dos esquemas para decidir cual transaccin se deshace y cual continua en ejecucin: el esquema
esperar/morir y el esquema herir/esperar.
El control de concurrencia con mtodo optimista asume que mltiples transacciones se pueden completar
frecuentemente sin interferir entre s. Mientras se ejecutan, las transacciones utilizan recursos de datos
sin adquirir bloqueos en esos recursos. Antes de hacer el commit, cada transaccin verifica que ninguna
otra transaccin ha modificado los datos que ha ledo. Si la comprobacin revela modificaciones en
conflicto, la transaccin que iba a hacer commit hace un rollback y se puede reiniciar.
La administracin de recuperaciones es un servicio que restaura la base de datos a un estado
consistente despus de una falla. La recuperacin de bases de datos restablece estas de un estado
determinado a un estado consistente previo. La recuperacin de una base de datos se activa cuando
ocurre un evento critico, como un error en hardware o de aplicacin.
Existen dos fuerzas que han impulsado la evolucin de los sistemas de bases de datos. Por un lado los
usuarios como parte de organizaciones ms complejas han demandado una serie de capacidades que
se han ido incorporando en los sistemas de bases de datos. Un ejemplo de esto es la necesidad de
integrar informacin proveniente de fuentes diversas. Por otro lado la tecnologa ha hecho posible que
algunas facilidades inicialmente imaginadas solo en sueos se conviertan en realidad. Por ejemplo las
transacciones en lnea que permite el sistema bancario actual no hubieran sido posibles sin el desarrollo
de los equipos de comunicacin.
La aparicin de Internet y el comienzo de la era de la informacin, crean nuevos requerimientos para
bases de datos. La cantidad de informacin comienza a crecer en proporciones desconocidas hasta el
momento. De esta forma, se crean las bases de datos distribuidas, que consisten en multiplicar el nmero
de ordenadores que controlan una base de datos (llamados nodos), intercambindose informacin y
actualizaciones a travs de la red. Este increble aumento de datos a almacenar, organizados muchas
veces en datos estadsticos recopilados con el trascurso de los aos, hizo necesaria la aparicin de un
software llamado Software de ayuda a la decisin. Este software avanzado trata de dar respuestas
concretas examinando mltiples datos estadsticos que se han recopilado a lo largo del tiempo en bases
de datos multidimensionales, formando lo que se denominan cubos de informacin.
El procesamiento distribuido es la divisin del procesamiento lgico de una base de datos entre dos o
ms nodos de red. Las bases de datos distribuidas requieren procesamiento distribuido. Un sistema de

administracin de base de datos distribuidas (DBMS) administra por medio de sistemas de cmputo
interconectados, el procesamiento y almacenamiento de datos lgicamente relacionados.
Con la creciente importancia de las redes de cmputo y la Internet, el procesamiento distribuido se est
convirtiendo en una funcin vital de los DBMS. El procesamiento distribuido permite que computadoras
que se encuentran dispersas geogrficamente cooperen para proporcionar el acceso a los datos. Una
gran parte del comercio electrnico de Internet involucra el acceso y la actualizacin de bases de datos
remotas. Muchas bases de datos de las tiendas departamentales, bancos y comercio seguro se
encuentran disponibles en Internet. Los DBMS utilizan la capacidad disponible de la red y del
procesamiento local para proporcionar un acceso remoto eficiente.
Un sistema de base de datos distribuida de manera lgica almacena datos en dos o mas sitios
fsicamente independientes conectados a travs de una red de computadoras. La base de datos se divide
en fragmentos que pueden ser horizontales o verticales. Cada fragmento puede ser asignado a un nodo
diferente de red. Una base de datos distribuida est formado por una coleccin de sitios, cada uno de los
cuales opera un sistema de base de datos para el procesamiento de las actividades que solo requieren
de datos locales. Adicionalmente cada lugar puede procesar transacciones que requieren datos que
estn almacenados en otros sitios (datos globales). Esto requiere que las base de datos locales sean
capaces de comunicarse datos entre si. Las conexiones de comunicacin que proporcionan las
capacidades necesarias de transferencias se llaman enlaces. La estructura de enlace brinda la
arquitectura bsica de un sistema de gestin de base de datos distribuidas que es el sistema de software
que gestiona las base de datos distribuidas.
Componentes de un sistema de base de datos distribuido

El hardware que compone una base de datos distribuida se reduce a servidores y la red.

Software:
o Sistema manejador de base de datos distribuida (DDBMS): Este sistema est formado por
las transacciones y los administradores de la base de datos distribuidos.
o Administrador de transacciones distribuidas (DTM): Este es un programa que recibe las
solicitudes de procesamiento de los programas de consulta o transacciones y las traduce en
acciones para los administradores de la base de datos
o Sistema manejador de base de datos (DBMS): Es un programa que procesa cierta porcin
de la base de datos distribuida. Se encarga de recuperar y actualizar datos del usuario y
generales de acuerdo con los comandos recibidos de los DTM.

Nodo: Un nodo es una computadora que ejecuta un DTM o un DBM o ambos. Un nodo de
transaccin ejecuta un DTM y un nodo de base de datos ejecuta un DBM.

Las caractersticas de un sistema de base de datos distribuidas se describen mejor como un conjunto de
transparencias: de distribucin, transaccin, falla, heterogeneidad y desempeo. Todas las
transparencias comparten el objetivo comn de hacer que la base de datos distribuidas se comporte
como si fuera un sistema de base de datos centralizada; esto es, el usuario final ve los datos como parte
de una sola base de datos centralizada, lgica y no tiene informacin de las complejidades del sistema.
En el procesamiento de bases de datos distribuidas, la transparencia se relaciona con la independencia
de datos. Si la distribucin de la base de datos es transparente, los usuarios pueden escribir consultas sin
conocimiento de su distribucin. Adems, los cambios en la distribucin no causarn cambios a las
consultas y transacciones existentes. Si la distribucin de base de datos no es transparente, los usuarios

deben referirse a ciertos detalles de distribucin en las consultas, y los cambios de distribucin pueden
conducir a cambios en las consultas existentes.
Esta seccin describe niveles comunes de transparencia y proporciona ejemplos de formulacin de
consultas con cada nivel. Antes de discutir los niveles de transparencia, se presenta un ejemplo
motivacional.
En una base de datos distribuida es deseable que cuente con las transparencias de distribucin, que
facilita al usuario de la misma, realizar las tareas con mayor eficacia, las cuales son:

Transparencia de Localizacin.- Permite a los usuarios accesar a la informacin de un archivo


cualquiera de la BD sin necesidad de indicar en que computadora se encuentra el archivo.

Transparencia de Fragmentacin.- Permite al usuario accesar a la informacin de un archivo


fragmentado como si todos los datos del archivo estuvieran en una misma computadora. Es decir,
cuando se crea transparencia de fragmentacin, el sistema crea la ilusin de que los archivos no
estn fragmentados.

o Transparencia de Mapeo Local.- Es la forma en la que el DDBMs mapea los datos para
realizar consultas distribuidas.
La transparencia de transaccin en un entorno sistema de gestin de base de datos distribuidas
garantiza que todas las transacciones distribuidas mantengan la integridad y coherencia de la base datos
distribuida. Una transaccin distribuida accede a datos almacenados en ms de una ubicacin.
La transparencia de desempeo y optimizacin de consultas permiten al sistema tener un rendimiento
como si fuera un DBMS centralizado. El sistema no sufrira ninguna degradacin en su rendimiento
derivado de su uso en una red o derivado de las diferencias en una plataforma de red. Esto aseguro que
el sistema encontrara la ruta ms efectiva en costos para Accesar datos remotos.
El diseo de un sistema de base de datos distribuidas puede resultar una tarea compleja. Se debe hacer
consideraciones muy cuidadosas sobre los objetivos y las estrategias que deben servir al diseo y se
deben en paralelo tomar decisiones sobre cmo hay que distribuir los datos entre los sitios de la red se
debe considerar la fragmentacin y replicacin de datos. El diseo debe tambin decidir como asignar
cada fragmento o replica para obtener mejor tiempo de respuesta general y asegurar disponibilidad de
datos al usuario final.
La fragmentacin de los datos nos permite romper un objeto en uno o ms segmentos o fragmentos. El
objeto puede ser almacenado en cualquier sitio en la red de computadoras. La informacin de la
fragmentacin de datos es almacenada en el catalogo de datos distribuidas DDC, el cual lo acceso el
procesador de transacciones TP para procesar las peticiones de usuarios.
Una base de datos puede ser replicada en varios sitios en una red de computadoras. La rplica de
fragmentos de la base de datos tiene el objetivo de mejorar la disponibilidad de datos, con lo cual se
reduce el tiempo de acceso. Una base de datos puede ser replicada en forma parcial, total o no ser
replicada. Se disean estrategias de asignacin para determinar la ubicacin de los fragmentos o replicas
de la base de datos.
Un sistema que maneja replica de datos si una relacin dada o en
trminos ms generales, un fragmento dado de una relacin se puede representar en el nivel fsico
mediante varias copias o replicas almacenadas en nodos distintos
Colocacin de datos. Para la ubicacin de los datos se deben observar tres estrategias de alojamiento:

Centralizado. Toda lavase de datos esta almacenada en un solo sitio.


Particionada. La base de datos est dividida en varios fragmentos y almacenados en diversos
sitios.
Replicada. Copias de uno o ms fragmentos de base de datos estn almacenados en diversos
sitios.

Debido a la tendencia hacia bases de datos distribuidas est firmemente establecida numerosos
vendedores de base de datos han empleado la leyenda Cliente/servidor para iniciar la funcin de base
de datos distribuidas. No obstante las bases de datos distribuidas no siempre reflejan con precisin las
caractersticas implicadas por la leyenda cliente/servidor.
La arquitectura cliente/servidor se refiere a la forma en la que interactan las computadoras para formar
un sistema. La arquitectura cliente/servidor representa un usuario de recursos o un cliente y un proveedor
de recursos o un servidor. La arquitectura cliente/servidor se puede usar para implementar un DBMS en
el que el cliente es el TP y el servidor es el DP.

Conclusin

A la administracin de las bases de datos le concierne bsicamente el asegurar que la informacin


precisa y consistente est disponible para los usuarios y para las aplicaciones cuando la necesiten y en la
forma requerida.
Los sistemas de bases de datos distribuidas estn evolucionando al pasar el tiempo, y esto hace que la
informacin sea ms manipulable.
Tambin obtuvimos el conocimiento de los criterios para disear las bases de datos distribuidas, as
como la colocacin de datos y los elementos de estas.

Bibliografa
Gestin de Bases de Datos
LOPEZ MONTALVAN IVAN
DE CASTRO VAZQUEZ MANUEL
2a Edicin
Editorial Garceta Grupo Editorial
Diseo y Administracin de Bases de Datos
W. HANSEN GARY

V. HANSEN JAMES
2a Edicin
Editorial Prentice Hall
Administracin de Bases de Datos, Diseo y Desarrollo de Aplicacin
V. MANNINO MICHAEL
3a Edicin
Editorial Mc Graw Hill
Fundamentos de Bases de Datos
SILBERSCHATZ ABRAHAM
F. KORTH HENRY
4a Edicin
Editorial Mc Graw Hill

Вам также может понравиться