Вы находитесь на странице: 1из 6

Bases de Datos Distribuidas (BDD)-Conceptos Prof.

Sergio Ortiz Gama

BASES DE DATOS DISTRIBUIDAS (BDD)

Definicin 1 Un sistema de bases de datos distribuidas se compone de un conjunto de sitios conectados entre s mediante algn tipo de red de comunicaciones en el cual: Cada sitio es un Sistema de BD por s mismo Los sitios han convenido en trabajar juntos con el fin de que un usuario de cualquier sitio pueda obtener acceso a los datos de cualquier punto de la red tal como si todos los datos estuvieran almacenados en el sitio propio del usuario. Definicin 2 Es un tipo de BD virtual cuyas partes componentes estn almacenadas en varias BD reales distintas que se encuentran en varios sitios distintos (de hecho, es la unin lgica de esas BD reales). Cada sitio local tiene: Sus propias BD reales Sus propios usuarios locales Su propio DBMS local Software de administracin de transacciones (incluyendo su propio software local para bloqueo, registro en bitcora, recuperacin, etc.) As como su propio administrador de comunicacin de datos local.

CUERNAVACA

MONTERREY

BD

BD

ORACLE CANAL DE COMUNICACIONES

INFORMIX

MEXICO

VERACRUZ

BD

BD

DB2

MySQL

Bases de Datos Distribuidas (BDD)-Conceptos Prof. Sergio Ortiz Gama

Bases de Datos Distribuidas (BDD)-Conceptos Prof. Sergio Ortiz Gama

SGBDD (Distributed DBMS)


Es el software que administra todas las bases de datos de los sitios y proporciona un mecanismo de acceso que hace transparente esta distribucin a los usuarios. MySQL-MySQL Cluster MySQL Cluster es una versin de alta disponibilidad, alta redundancia de MySQL adaptada para el entorno de computacin distribuida. o Usa el motor de almacenamiento NDB Cluster para permitir la ejecucin de varios servidores MySQL en un cluster.

Ventajas
Las empresas ya estn generalmente distribuidas al menos de manera lgica (en divisiones, departamentos, grupos de trabajo, etc.) y muy probable estn de manera fsica (en plantas, fbricas, laboratorios, etc.); Se deduce que los datos ya estn distribuidos, ya que cada unidad organizacional dentro de la empresa mantendr los datos que son importantes para su propia operacin El valor de la informacin total de la empresa est divido en lo que a veces se le llama islas de informacin Un Sistema Distribuido proporciona los puentes necesarios para conectar a esas islas entre s o Permite que la estructura de la BD refleje la estructura de la empresa los datos locales son conservados localmente en el lugar donde pertenecen de manera ms lgica o Al mismo tiempo, permite tener acceso a datos remotos cuando sea necesario. El arreglo distribuido combina eficiencia de procesamiento (los datos se mantienen cerca del punto en donde se usan ms frecuentemente). Con una mayor accesibilidad (es posible acceder a una cuenta remota y viceversa, por medio de la red de comunicaciones). Autonoma local Mejora la confiabilidad / disponibilidad Mejora de la eficiencia, Expansibilidad Economa en cuanto a crecimiento incremental Compartimiento de recursos.

Desventajas
Los sistemas distribuidos son complejos (al menos desde el punto de vista tcnico). Altos costos Administracin de la distribucin del control, seguridad, dificultad al cambio

reas de problemas en los SBDD


Diseo de base de datos distribuidas. Procesamiento de querys distribuidos. Administracin del diccionario de datos. Control de concurrencia distribudo. Administracin del deadlock distribudo. Recuperacin de transacciones en ambientes distribuidos. Base de datos heterogneas (Multibase de datos). Relacin cruzada entre los problemas anteriores

Bases de Datos Distribuidas (BDD)-Conceptos Prof. Sergio Ortiz Gama

Principio fundamental de las BD Distribuidas


Desde el punto de vista del usuario un sistema de base de datos distribuido deber ser idntico a uno no distribuido. Esta regla conduce a 12 objetivos o reglas secundarias.

Las 12 reglas de los SBDD


1. Independencia o autonoma del sitio local. Cada sitio local puede actuar como un SGBD independiente, autnomo, centralizado. La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. Cada sitio es responsable de la seguridad, del control de concurrencia, el respaldo y la recuperacin 2. Independencia del sitio central. Ningn sitio en la red depende de un sitio central o de cualquier otro sitio. No debe haber ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central. Razones por las cuales no debera haber un sitio central: o El sitio central puede ser un cuello de botella o El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema 3. Independencia de fallas. El sistema no se ve afectado por fallas de nodos. El sistema contina operando, incluso en el caso de una falla de nodo o de una expansin de la red Operacin contina. Proporcionan mayor confiabilidad y mayor disponibilidad. o Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. o Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado. 4. Transparencia de ubicacin. Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local. Esto simplifica los programas de los usuarios. En particular, permite que los datos migren de un sitio a otro sin invalidar ninguno de estos programas o actividades. 5. Transparencia de fragmentacin. El sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico. o o La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna.

Bases de Datos Distribuidas (BDD)-Conceptos Prof. Sergio Ortiz Gama

6.

Transparencia (independencia) de replicacin. El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos. Las rplicas son necesarias por dos razones principales: 1) 2) Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras est disponible al menos una copia).

La principal desventaja de las rplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacin de la actualizacin. 7. Procesamiento de consulta distribuida. Una consulta distribuida puede ser ejecutada en varios sitios diferentes de procesamiento de datos. o En una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente.

8.

Procesamiento de transacciones distribuidas. Una transaccin puede actualizar datos en varios sitios diferentes Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia. o Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. o Una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios. o Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transaccin no caiga en un bloqueo mortal (basado en el bloqueo). o Para el control de la recuperacin, es necesario asegurarse que una transaccin dada sea atmica en el ambiente distribuido, el sistema debe por lo tanto asegurarse de que la transaccin sea confirmada o deshecha (se puede utilizar el protocolo de confirmacin de dos fases).

9.

Independencia del Hardware. El sistema debe funcionar en cualquier plataforma de Hardware

10. Independencia del Sistema Operativo. El sistema debe funcionar con cualquier plataforma de Software de sistema operativo 11. Independencia de la Red. El sistema debe funcionar con cualquier plataforma de Red 12. Independencia de la Base de Datos. El sistema debe soportar cualquier producto de BD provisto por cualquier proveedor

Bases de Datos Distribuidas (BDD)-Conceptos Prof. Sergio Ortiz Gama

Arquitectura de una BD Distribuida


ESQUEMA GLOBAL NIVEL LOGICO DE UNA BD

ESQUEMA DE FRAGMENTACION ESQUEMAS INDEPENDIENTES DEL SITIO

ESQUEMA DE ASIGNACION

ESQUEMA DE MAPEO LOCAL 1

ESQUEMA DE MAPEO LOCAL 2

SGBD1

SGBD2

BD EN EL SITIO No.1

NIVEL FISICO

BD EN EL SITIO No. 2

Вам также может понравиться