Вы находитесь на странице: 1из 55

Teora de la Informacin II

Salazar German & Correa Monica

Unidad I Base de datos: es una coleccin de datos relacionados. Datos: hechos conocidos que pueden registrarse y que tienen significado implcito. Propiedades de una base de datos Representa algunos aspectos del mundo real (minimundo o universo del discurso). Coleccin coherente de datos con significados inherentes. (conjunto de datos relacionados referidos a algo). Se disea, construye y puebla con datos para propsitos especficos. Esta destinada a un grupo de usuarios concreto. Una base de datos puede tener cualquier tamao y complejidad. Esta gran cantidad de informacin debe organizarse y gestionarse de forma que los usuarios pueden localizar, recuperar y actualizar los datos segn lo necesiten. Banco de datos: hace referencia a una coleccin de base de datos. Sistema de base de Datos: es un conjunto de base de datos y el SGBD
SISTEMA DE BASE DE DATOS Usuarios/Programador es Programas de aplicaciones/Consulta

SISTEMA DE BASE DE DATOS SOFTWARE DEL SGBD

Software para procesar Consultas/Programas

Software para tener acceso a los datos almacenados

Descripcin de la BD almacenada (metatadatos) CATALOGO

BA almacenada ARCHIVOS

43

Teora de la Informacin II

Salazar German & Correa Monica

Caractersticas del Enfoque de Base de Datos Naturaleza auto descriptiva de los sistemas de base de datos Esta trata de una descripcin completa de la estructura de la base de datos y sus restricciones. Esta definicin se almacena en el catalogo del sistema que contiene informaciones tales como la estructura de cada archivo, el tipo de formato de almacenamiento de cada elemento y varias restricciones sobre los datos. La informacin almacenada en el catalogo se denomina META-DATOS. El catalogo es utilizado por el software del SGBD y tambin por los usuarios que precisan informacin sobre la estructura de la base de datos. Separacin entre los programas y los datos y abstraccin de los datos Los programas de acceso del SGBD no requieren modificaciones si la estructura de un archivo debe ser modificada. Debido a que la estructura de los datos se almacena en el catalogo del SGBD separado de los programas de acceso. A esta propiedad se la denomina independencia entre programas y datos. En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los datos como parte de la definicin de la base de datos. Una operacin (tambin llamada funcin) se especifica en dos partes. La interfaz (o signatura) de una operacin incluye el nombre de la operacin y los tipos de datos de sus argumentos (o parmetros). La implementacin (o mtodo) de la operacin se especifica separadamente y puede modificarse sin afectar a la interfaz. Los programas de aplicacin de los usuarios pueden operar sobre los datos invocando a dichas operaciones a travs de sus nombres y argumentos sea cual sea la forma en la que se han implementado. Esto podra determinarse independencia entre programas y operaciones. La caracterstica que permite la independencia entre programas y datos y la independencia entre programas y operaciones se llama abstraccin de datos. Un SGBD ofrece a los usuarios una representacin conceptual de los datos que es proporcionada por un modelo de datos y este modelo de datos oculta los detalles de almacenamiento e implementacin que no interesan a la mayora de los usuarios de la base de datos. Soporte de Mltiples vistas de los datos Una base de datos suele tener muchos usuarios, y cada uno de estos puede requerir una perspectiva o vista diferente de la misma. Una vista puede ser un subconjunto de una base de datos o puede contener datos

43

Teora de la Informacin II

Salazar German & Correa Monica

virtuales derivados de los archivos de la base de datos pero que no estn directamente almacenados. Compartimiento de datos y procesamiento de transacciones multiusuario Todo SGBD debe permitir a varios usuarios tener acceso simultneo a la base de datos. Si los datos de las aplicaciones se deben integrar y mantener en una sola base datos, el SGBD debe incluir un software de control de concurrencia para asegurar que cuando varios usuarios intenten actualizar los mismos datos lo hagan de manera controlada para que el resultado de las actualizaciones sea correcto.

Los actores en escena Son aquellas personas que participan en el diseo, utilizacin y mantenimiento de una base de datos. Entre ellos estn: Administradores de base de datos El ABD se encarga de autorizar el acceso a la base de datos, de coordinar y vigilar su utilizacin y de adquirir los recursos de software y hardware que sean necesarios; es la persona responsable cuando surgen problemas como violaciones de la seguridad o una respuesta lenta del sistema. Diseadores de base de datos Los DBD se encargan de identificar los datos que se almacenaran en la base datos y de elegir las estructuras apropiadas para representar y almacenar dichos datos; tambin tienen la responsabilidad de comunicarse con todos los futuros usuarios de la base de datos con el fin de comprender sus necesidades, y de presentar un diseo que satisfaga esos requerimientos. Usuarios finales Son personas que acceden a la base de datos para consultarla, actualizarla y generar informes. Ellos son: Usuarios finales ocasionales: acceden de vez en cuando a la base de datos. Utilizan un lenguaje de consulta de base de datos avanzado para especificar sus solicitudes y suelen ser gerentes u otras personas que accedan ocasionalmente. Usuarios finales simples o paramtricos: constituyen una gran parte de la totalidad de los usuarios finales y su funcin principal se basa en consultas y actualizaciones constantes de la

43

Teora de la Informacin II

Salazar German & Correa Monica

base de datos; ejemplo de estos usuarios son cajeros de bancos, encargados de reservas de lneas areas, etc. Usuarios finales avanzados: pueden ser ingenieros, analistas de negocios y otros familiarizados con los recursos del SGBD como para implementar sus aplicaciones. Usuarios autnomos: mantienen bases de datos personales mediante la utilizacin de paquetes de programas comerciales. Analistas de sistemas y programadores de aplicaciones (ingenieros de software) Los analistas de sistemas determinan los requerimientos de los usuarios finales y plantea soluciones para satisfacer dichos requerimientos. Los programadores de aplicaciones implementan esas soluciones en forma de programas, y luego prueban, depuran y mantienen los mismos.

Los trabajadores entre bastidores Son personas que tienen que ver con el diseo, creacin y funcionamiento del software y entorno del sistema del SGBD. Por lo general a estas personas no les interesa la base de datos en si misma. Entre ellos tenemos: Los diseadores e implementadores del SGBD son las personas que disean e implementan los mdulos e interfaces del SGBD en forma de paquetes de software. Los desarrolladores de herramientas son personas que disean e implementan herramientas, es decir, los paquetes de software que facilitan el diseo y utilizacin del sistema que ayudan a mejorar el rendimiento. Los operadores y personal de mantenimiento son el personal de administracin del sistema que son los responsables del funcionamiento y mantenimiento reales del entorno hardware y software del sistema de base de datos. Sistema de gestin de base de datos Es una coleccin de programas que permite a los usuarios la facilidad de definir, construir y manipular una base de datos para distintas aplicaciones. La definicin de una base de datos consiste en especificar los tipos de datos, las estructuras y restricciones para los datos que se van a almacenar en dicha base. La construccin de la base de datos es el proceso de almacenar datos concretos sobre algn medio de almacenamiento controlado por el SGBD.

43

Teora de la Informacin II

Salazar German & Correa Monica

La manipulacin de la base de datos incluye funciones tales como consultar la base de datos para recuperar datos especficos, actualizar la BD para reflejar los cambios ocurridos en el minimundo, y generar informes a partir de los datos.

Categoras de los modelos de datos Los modelos de datos se pueden clasificar dependiendo de los tipos de conceptos que ofrecen para describir la estructura de la base de datos. Entre ellos tenemos: Modelos de datos de alto nivel o conceptuales que utilizan conceptos como entidades, atributos y relaciones. Una entidad es un objeto o concepto del mundo real que se describe en la base de datos. Un atributo es una propiedad que da una descripcin ms amplia de una entidad. Un vnculo describe una interaccin entre dos o ms entidades. Modelos de datos de representacin (o de implementacin) utilizan conceptos que pueden ser entendidos por los usuarios finales, muestran la forma en que los datos se organizan dentro del computador ocultando algunos detalles de sobre cmo se almacenan los datos. Estos son los ms utilizados en los SGBD tradicionales, el ms utilizado es el modelo de datos relacional, tambin se encuentran los de red y jerrquicos. Modelos de datos de bajo nivel o fsicos describen como se almacenan los datos en el ordenador, por ejemplo: formato de registro, orden de registro y caminos de acceso. Camino de acceso es una estructura que realiza la bsqueda de determinados registros de la base de datos eficientemente.

Esquemas, instancias y estado de la base de datos Esquema de la base de datos es la descripcin de la misma, la cual se especifica durante el diseo de la base de datos. La representacin de un esquema se denomina diagrama del esquema y el diagrama del esquema muestra nicamente algunos aspectos del esquema tales como entidades, atributos y algunos tipos de restricciones. El estado de la base de datos es el contenido (o sea los datos) de la base de datos en un instante dado. A esto tambin se lo llama instancia u

43

Teora de la Informacin II

Salazar German & Correa Monica

ocurrencia. En la base de datos, los datos pueden cambiar, por lo tanto el Estado tambin lo har. Se parte de Esquema de la Base de Datos, y a medida que la actualizamos (insertar, eliminar o modificar el valor de un elemento de informacin) se habla de Estado de la Base de Datos.
DIAGRAMA DEL ESQUEMA PARA UNA BASE DE DATOS ESTUDIANTE Nombre / NumEstudiante / Grado / Carrera CURSO Nom_Curso / NmCurso / HorasCred / Dpto REQUISITOS Nm_Curso / NmRequisito SECCION Iden_secc / Nm_Curso / Semestre / Ao INFORME_NOTAS NmEstudiante / Iden_secc / Notas

ESTADO VACIO

ESTADO INICIAL

ESTADO FINAL

0 ESQUEMA DE LA BD

ESTADOS DE LA BD segn los cambios que se van haciendo

Es importante la distincin entre Esquema y Estado de la Base de Datos. Cuando definimos una nueva Base de Datos, solo especificamos el esquema al SGBD, en ste momento su Estado es vaco (sin datos), Cuando cargamos los Datos por primera vez, la Base de Datos pasa al Estado Inicial. El SGBD se encarga que cada vez que se aplique una operacin a la BD cambie el Estado y controla que sea vlido, es decir, verifica que los datos satisfagan la estructura y las restricciones especificadas en el esquema (o sea en la descripcin de la BD). Arquitectura de las bases de datos Un Sistema de Gestin de Bases de Datos (DBMS) es un conjunto de procedimientos, ayudas de documentacin, lenguajes y programas de software que administran los archivos de la BD. Uno de los objetivos del SGBD es proporcionar a los usuarios una visin abstracta de la informacin. Una arquitectura de BD debe poseer 3 niveles: Nivel Interno: este nivel describe los datos tal como estn almacenados fsicamente en la computadora. Este nivel es descripto por medio de un esquema interno o vista interna. Por lo tanto, este nivel describe la estructura fsica del almacenamiento y los caminos de acceso a la BD. En este nivel se describen: o Los archivos. o Los registros de los archivos (longitud, campos, etc.). o Las rutas de acceso a los registros (ndices, encadenamientos, archivos invertidos, etc.). Adems la implementacin del esquema interno requiere de: o Archivos de datos: almacenan la base de datos. o Archivos de ndices: permiten un acceso rpido a la informacin adecuada.

43

Teora de la Informacin II

Salazar German & Correa Monica

Diccionario de datos: Almacenan la informacin relativa ala estructura de la base de datos. Nivel Conceptual: este nivel es descripto por medio de un esquema conceptual al decidir que informacin se guarda en la BD correspondiente a la estructura organizacional de la BD. A la parte del esquema conceptual que es de inters para un usuario, se los llama subesquema conceptual. Los archivos conceptuales no existen fsicamente. Este nivel describe la estructura lgica de toda la BD, detallando: entidades, tipos de datos, vnculos, operaciones de los usuarios y restricciones. En ste podemos usar un Modelo de Datos de Alto Nivel o de Implementacin. Nivel Externo: representa la percepcin individual de los usuarios de la BD y describe la parte de inters para ellos. Los archivos externos no existen fsicamente. El esquema externo debe ser definido para el acceso a los datos. Este nivel incluye varias vistas de usuarios. o

Mapeo de datos o transformacin de los datos Cuando se efecta una solicitud en el esquema externo, el SGBD la transforma a una solicitud expresada en el esquema conceptual, y luego en una solicitud expresada en el esquema interno que se procesar sobre la BD almacenada. En caso de que la solicitud sea para la obtencin de datos, ser preciso modificar el formato de la informacin extrada de la BD para que coincida con la vista externa del usuario. El proceso de transformar solicitudes y resultados de un nivel a otro se denomina Correspondencia o Mapeo de datos (data mapping). Con 3 niveles de arquitectura, existen 2 etapas de transformacin: Externa / Conceptual: permite el paso de una vista externa especfica a la vista conceptual y viceversa. Conceptual / Interna: permite el paso de la vista conceptual a la base de datos almacenada y viceversa.

ARQUITECTURA DE TRES ESQUEMAS


USUARIOS FINALES NIVEL EXTERNO Correspondencia externa/conceptual NIVEL CONCEPTUAL Correspondencia conceptual/interna ESQUEMA CONCEPTUAL Interdependencia lgica VISTA EXTERNA_1

...

VISTA EXTERNA_n

NIVEL INTERNO

ESQUEMA INTERNO Interdependencia fsica

43

Teora de la Informacin II

Salazar German & Correa Monica

BASE DE DATOS ALMACENADA

Esquema externo p/programa Vtas de Dpto Concepto Depto Cantidad

Esquema externo p/programa Relacin de empleados Nombre Depto

Esquema Conceptual Empleados DNI Vtas DNI Nro Cantidad Fecha ... Artculos Nro

Nombre

Depto

...

Concepto

p/p

..

Esquema de Indices

Archivo d/Vtas Datos codificados para DNI Nro Cantidad Fecha ...

Indice p/empleados Clave

Puntero Archivo d/empleados Datos codificados para DNI Nombre


Usuario A1

Indice p/artculos Clave Puntero Indice p/vtas Clave Esquema Externo


Usuario A1

Depto

,,,
Usuario B3

Usuario B1 Usuario B2 Archivo d/Artculos Datos codificados Puntero para Subesquema Externo A Subesquema Externo B Nro Concepto p/p ,,,

Correspondencia Externa / Conceptual

Esquema Conceptual

Vista Conceptual

SGBD

Correspondencia Conceptual / Interna

Esquema Interno

43

Teora de la Informacin II

Salazar German & Correa Monica

Independencia de datos Se llama independencia de los datos a la capacidad de modificar una definicin de esquema en un nivel de la arquitectura sin afectar para nada la definicin del esquema en el nivel inmediatamente superior. Independencia fsica de los datos es la capacidad de modificar el esquema fsico tanto en la estructura del archivo como en las caractersticas de los campos, sin obligar que se vuelvan a escribir los programas de aplicaciones. Independencia lgica de los datos es la capacidad de variar el esquema conceptual sin necesidad de que se vuelvan a escribir de nuevo los programas de aplicaciones. Las modificaciones en el nivel conceptual son necesarias cuando se cambia la estructura lgica de la base de datos.

Caractersticas deseables de un SGBD 1) Control de redundancia: en la creacin de programas con procesamiento de archivos, cada grupo de usuarios mantiene sus propios archivos para manejar sus aplicaciones de procesamiento de datos. Una buena parte de los datos se almacenara dos veces: una vez en los archivos de cada grupo de usuarios. Otros grupos de usuarios podran duplicar buena parte de estos datos o todo en sus propios archivos. A veces, ante la redundancia de almacenamiento de los mismos datos provoca varios problemas. En primer lugar es necesario realizar una misma actualizacin lgica varias veces, una vez en cada archivo en el que se registran datos. Esto implica una duplicacin de trabajo. En segundo lugar se desperdicia espacio de almacenamiento al guardar los mismos datos en varios lugares, y este problema puede ser grave si las BD son demasiado grandes. En tercer lugar, es posible que los archivos que representan los mismos datos se vuelvan

43

Teora de la Informacin II

Salazar German & Correa Monica

inconsistentes, quizs porque una actualizacin se haya aplicado a ciertos archivos pero no a otros. Con el enfoque de BD, las vistas de los diferentes grupos de usuarios se integran durante el diseo de la BD. Para conservar la consistencia debe crearse un diseo que almacene cada dato lgico en un solo lugar de la BD. Ello evita la inconsistencia y ahorro de espacio de almacenamiento. En algunos casos puede convenir la redundancia controlada para mejorar el rendimiento de las consultas. Si colocamos juntos todos los datos, no tendremos que buscar en varios archivos los datos que deseamos obtener. En tales casos, el SGBD deber ser capaz de controlar esta redundancia para que no haya inconsistencia entre los archivos. 2) Restriccin de los accesos no autorizados: cuando muchos usuarios comparten una misma BD, es probable que no todos tengan la autorizacin para tener acceso a toda la informacin que contiene. Por ejemplo, es comn considerar que los datos financieros sean confidenciales y que solo ciertas personas puedan tener autorizacin para tener acceso a ellos. Adems, es posible que solo algunos usuarios tengan permiso para recuperar datos, en tanto que a otros se les permita obtenerlos y actualizarlos. Por lo tanto es preciso controlar el tipo de operaciones de acceso ya sea obtencin o actualizacin. Por lo regular, a los usuarios o grupos de usuarios se les asigna nmeros de cuenta protegidos con contraseas, que son los mismos que sirven para tener acceso a la BD. El SGBD debe contar con un subsistema de seguridad y autorizacin que permita al ABD crear cuentas y especificar restricciones para ellas. El SGBD deber entonces obligar automticamente al cumplimiento de dichas restricciones. Cabe sealar que el mismo tipo de controles se puede aplicar al software del SGBD. 3) Suministro de almacenamiento persistente de objetos y estructuras de datos de programas: una aplicacin de la BD consiste en ofrecer almacenamientos persistentes para objetos y estructuras de datos de programas. Este es una de las principales razones de que se hayan creado los SGBD orientados a objetos. Los valores de las variables de un programa se desechan una vez que se termina a menos que el programador explcitamente los almacene en archivos permanentes. Para ello, suele requerirse la conversin de esas estructuras complejas a un formato adecuado para su almacenamiento en archivos. Cuando hay que leer otra vez estos datos, el programador debe convertir del formato de archivo a la estructura de variables del programa. El almacenamiento persistente de objetos y estructuras de datos, es una funcin importante para los sistemas de BD. Los SGBD tradicionales a menudo, adolecan del llamado problema de incompatibilidad de impedancia, porque las estructuras de datos proporcionadas por el SGBD eran incompatibles con las del lenguaje de programacin. Los sistemas de BD

43

Teora de la Informacin II

Salazar German & Correa Monica

4)

5)

6)

7)

orientados a objetos, suelen ofrecer compatibilidad de las estructuras de datos con uno o ms lenguajes de programacin orientada a objetos. Capacidad de realizar inferencias y acciones usando reglas: otra aplicacin de los sistemas de BD, consiste en ofrecer recursos para definir reglas de deduccin que permitan deducir o inferir informacin nueva a partir de los datos almacenados. A estos sistemas se los conoce como BD deductivas. Por ejemplo, puede haber reglas complejas en la aplicacin del minimundo para determinar cuando un estudiante est a prueba. Estas reglas se pueden especificar de manera decorativa como reglas de deduccin, con cuya aplicacin ser posible determinar cules estudiantes estn a prueba. En un SGBD tradicional se tendr que escribir un programa por procedimientos explcito para apoyar tales aplicaciones. Pero si cambian las reglas del minimundo, casi siempre es ms fcil modificar las reglas de deduccin declaradas que volver a codificar los programas por procedimientos. Suministro de mltiples interfaces de usuario: muchos tipos de usuarios con diversos niveles de conocimientos tcnicos utilizan las BD, el SGBD debe ofrecer diferentes interfaces. Entre estas podemos mencionar los lenguajes de consulta para usuarios espordicos, las interfaces de lenguaje de programacin para programadores de aplicaciones, las formas y cdigos de rdenes para los usuarios paramtricos y las interfaces controladas por mens y en lenguaje natural para los usuarios autnomos. Representacin de vnculos complejos entre los datos: una BD puede contener numerosos conjuntos de datos que estn relacionados entre s de muchas maneras. El registro de Lpez en el archivo estudiante se relaciona con cuatro registros del archivo informe_notas. De manera similar, cada registro de seccin se relaciona con un registro de curso y tambin con varios registros de informe_notas, uno por cada estudiante que haya concluido la seccin. Es preciso que el SGBD pueda representar diversos vnculos complejos de los datos y tambin obtener y actualizar con rapidez y eficiencia datos que estn mutuamente relacionados. Garantizar el cumplimiento de las restricciones de integridad: la mayor parte de las aplicaciones de BD, tienen ciertas restricciones de integridad que deben cumplir los datos. El SGBD debe ofrecer recursos para definir tales restricciones y hacer que se cumplan. La forma ms simple de restringir consiste en especificar un tipo de dato para cada elemento de informacin, por ejemplo, podemos especificar que el tipo de valor del elemento grado dentro de cada registro de estudiante debe ser entero entre 1 y 5, y que el valor de nombre debe ser una cadena de no ms de 30 caracteres alfabticos. Otro tipo de restriccin compleja implica especificar que un registro de un archivo debe relacionarse con registros de otros archivos. Por ejemplo, podemos decir que todo

43

Teora de la Informacin II

Salazar German & Correa Monica

registro de seccin, debe estar relacionado con un registro de curso. Otro tipo de restriccin especifica, sera que los valores de los elementos de informacin sean nicos. Por ejemplo, cada registro de curso debe tener un valor nico de numcurso. Estas restricciones se derivan de la semntica de los datos y del minimundo que representan. Es responsabilidad de los diseadores de la BD, identificar las restricciones de integridad durante el diseo. Algunas restricciones se pueden especificar en el SGBD, el cual har automticamente que se cumplan; otras pueden requerir verificaciones mediante programas de actualizacin o en el momento en que se introducen los datos. Es posible introducir errneamente un dato sin violar las restricciones de integridad. Por ejemplo, si un estudiante obtiene una nota de A pero se introduce una C en la BD, el SGBD no podr descubrir este error automticamente porque C es un valor permitido del tipo de datos de notas. Esta clase de errores solo puede descubrirse manualmente y corregirse despus de actualizada la BD. El SGBD puede rechazar automticamente una nota de X, porque este no es un valor permitido para el tipo de datos de notas. 8) Suministro de copias de seguridad y recuperacin: todo SGBD debe contar con recursos para recuperarse de fallos de hardware o de software. Para ello, est el subsistema de respaldo y recuperacin del SGBD; por ejemplo, si el sistema falla mientras se est ejecutando un complejo programa de actualizacin, el subsistema de recuperacin se encargar de asegurarse de que la BD se restaure al estado en el que estaba antes de que comenzara la ejecucin del programa. Como alternativa, el subsistema de recuperacin puede asegurarse de que el programa reanude su ejecucin en el punto en que fue interrumpido, de modo que su efecto completo se registre en la BD.

Lenguajes del SGBD Una vez diseada la BD y elegido el SGBD, (que nos proporciona el lenguaje y las vistas internas correspondientes segn donde se lo vaya a aplicar) podemos distinguir los siguientes lenguajes: 1) Lenguaje de Definicin de Datos (DDL): cuando en los SGBD no existe una separacin de Niveles (interno y conceptual), se utiliza el DDL. En caso de que exista una separacin de estos Niveles, este lenguaje servir solo al Esquema Conceptual. Aunque en la mayora de los SGBD el DDL se utiliza para describir el esquema conceptual como el externo. 2) Lenguaje de Definicin de Almacenamiento (SDL): se utiliza para especificar el Nivel Interno. 3) Lenguaje de Definicin de Vistas (VDL): se utiliza para especificar las Vistas de los usuarios y su correspondencia con el Esquema Conceptual.

43

Teora de la Informacin II

Salazar German & Correa Monica

4) Lenguaje de Manipulacin de Datos (DML): es utilizado para realizar las operaciones de manipulacin de datos ms comunes (recuperacin, insercin, eliminacin y modificacin). Existen dos tipos: a. LMD de Alto Nivel o de No Procedimiento: utiliza de manera independiente para operaciones complejas de la BD. Tambin se lo llama DML de conjunto. Las consultas especifican que datos hay que obtener y no cmo obtenerlos. b. LMD de Bajo Nivel o de Procedimiento: es cuando al DML se le incorpora un Lenguaje de Programacin, obtiene registros individuales de las BD y los procesa por separado. Tambin se le llama DML de Registro por Registro. Siempre que las rdenes de un DML (de Alto o Bajo Nivel) se incorporan a un Lenguaje de Programacin, se le denomina Lenguaje Anfitrin y al DML Sublenguaje de Datos. Los usuarios finales, para especificar sus solicitudes, emplean el Lenguaje de Consulta de Alto Nivel, mientras que los programadores utilizan el DML en su forma incorporada (Lenguaje Anfitrin). Lenguaje Anfitrin = Ordenes del DML (Alto o Bajo) + Lenguaje de Programacin Lenguaje Integrado = Lenguaje Anfitrin + Sublenguaje de Datos Interfaces del SGBD Las interfaces del SGBD son lenguajes de programacin que permiten la interaccin entre la BD y el usuario. Entre las interfaces se pueden distinguir: 1) Interfaces para navegacin basados en men: presentan al usuario listas de opciones, llamadas men, que guan al usuario para formular solicitudes. Los mens hace innecesario memorizar las rdenes, pues permiten construir la solicitud paso a paso, eligiendo la opcin que el men presenta. 2) Interfaces basados en formularios: presentan un formulario a cada usuario, se llenan todos los espacios de la forma para insertar nuevos datos, o bien se llenan solo ciertos espacios para obtener datos, en cuyo caso el SGBD obtendr los registros que coincidan con los datos especficos. 3) Interfaces graficas de usuario: presentan al usuario los esquemas en forma de diagrama, por lo tanto, se puede especificar una consulta manipulando el diagrama a travs de un dispositivo apuntador para escoger ciertas partes del diagrama. 4) Interfaces de lenguaje natural: estas aceptan solicitudes escritas. Suelen tener su propio esquema. La interfaz consulta las palabras de su esquema para interpretar la solicitud. Si la interpretacin tiene xito, la enva al SGBD para su procesamiento, caso contrario le inicia un dilogo con el usuario para esclarecer la solicitud.

43

Teora de la Informacin II

Salazar German & Correa Monica

5) Interfaces para usuarios paramtricos: los usuarios como los cajeros tienen un conjunto pequeo de operaciones que deben realizar repetidamente. Generalmente se incluye un conjunto de rdenes abreviadas con el fin de reducir al mnimo el nmero de digitaciones requeridas para cada solicitud. 6) Interfaces para el ABD: los sistemas de BD contienen rdenes privilegiadas que solo el personal de ABD puede utilizar. Entre ellas estn las rdenes para crear cuentas bancarias, establecer los parmetros del sistema, otorgar autorizaciones a las cuentas, reorganizar la estructura de almacenamiento de una BD, etc. Clasificacin de los SGBD Existen varios criterios: Segn el modelo de los datos en que se basa: o Relacional: representa una BD como una coleccin de tablas. Cada una de las cuales se puede almacenar en forma de un archivo individual. Casi todas las BD relacionales tienen lenguajes de consulta de alto nivel y manejan una forma limitada de vistas de usuarios. o Red: representa los datos como tipos de registros y tambin un tipo de vnculo llamado tipo de conjunto. Tiene un lenguaje de registro por registro asociado que se debe incorporar en un lenguaje de programacin, teniendo as un lenguaje anfitrin. o Orientado a Objetos: define una base de datos en trminos de objetos, sus propiedades y sus operaciones. Todos los objetos que tienen la misma estructura y comportamiento pertenecen a una clase, y las clases se organizan en jerarquas (o grficos acclicos) las operaciones de cada clase se especifican mediante procedimientos predefinidos denominados mtodos. o Jerrquico: representa los datos como estructura jerrquica de rbol. Cada jerarqua representa varios registros relacionados entre s. Segn el nmero de usuarios a los que da servicio el sistema: o Sistema monousuario: solo atiende a un usuario a la vez. o Sistema multiusuario: atiende a varios usuarios al mismo tiempo. Segn el nmero de sitios en los que est distribuida la BD: o Centralizados: los datos se almacenan en una sola computadora, pero pueden atender a varios usuarios. o Distribuidos (SGBDD): la BD real y el SGBD pueden estar distribuidos en varios sitios conectados por una red de computadora. Segn el costo. Segn el camino de acceso de que dispone para almacenar los archivos. Segn sean sus propsitos generales o propsitos especiales: cuando el rendimiento es de primordial importancia. Se disea y se construye un SGBD de propsito especial, el cual no servir para otras aplicaciones

43

Teora de la Informacin II

Salazar German & Correa Monica

Sistema de Administracin de Base de Datos (DBMS/SGBD/SABD) El sistema de administracin de BD (DBMS/SABD) es el conjunto de programas que maneja todo acceso a la BD. Lo que sucede es lo siguiente: 1) Un usuario solicita el acceso empleando algn Sublenguaje de datos determinado. 2) El DBMS interpreta esa solicitud y la analiza. 3) El DBMS inspecciona en orden el esquema externo de ese usuario, la correspondencia externa conceptual asociada, el esquema conceptual, la correspondencia conceptual interna y la definicin de la estructura de almacenamiento. 4) El DBMS ejecuta las operaciones necesarias sobre la BD almacenada. Las funciones del DBMS, son: 1) Definicin de datos: el DBMS debe ser capaz de aceptar definiciones de datos o sea un esquema externo, esquema conceptual, esquema interno y todas las correspondencias asociadas, en versin fuente y convertirlas en la versin objeto apropiado. En otras palabras, el DBMS debe incluir entre sus componentes un procesador DDL, o compilador DDL en el sentido que deba poder utilizar este conocimiento para analizar y responder a las peticiones de manipulacin de datos. 2) Manipulacin de datos: El DBMS debe ser capaz de manejar peticiones para recuperar, actualizar o eliminar datos existentes en la base de datos o agregar nuevos datos a sta. En otras palabras, el DBMS debe incluir un componente procesador DML o compilador DML para tratar con el DML (lenguaje de manipulacin de datos). En general, las peticiones DML pueden ser "planeadas" o "no planeadas": a. Peticin planeada: es aquella cuya necesidad se previ mucho tiempo antes de que tuviera que ejecutarse por primera vez. El ABD habr afinado con toda probabilidad el diseo fsico de la BD a fin de garantizar un buen desempeo para estas solicitudes. b. Peticin no planeada: es una consulta ad hoc o sea una solicitud cuya necesidad no se previ, sino que surgi de improviso. El diseo fsico de la BD puede ser o no ideal para la solicitud especfica de que se trate. El logro del mejor desempeo posible con solicitudes no planeadas representa un reto considerable para el DBMS. 3) Seguridad e integridad de los datos: el DBMS debe supervisar las solicitudes de los usuarios y rechazar los intentos de violar las medidas de seguridad e integridad definidas por el ABD. 4) Recuperacin y concurrencia de datos: el DBMS debe cuidar del cumplimiento de ciertos controles de recuperacin y concurrencia. 5) Diccionario de datos: el DBMS debe incluir una funcin de diccionario de datos. Puede decirse que el diccionario de datos es una BD por derecho propio. El contenido del diccionario de datos puede considerarse

43

Teora de la Informacin II

Salazar German & Correa Monica

como datos acerca de los datos, o sea, definiciones de otros objetos en el sistema y no solo datos en bruto. En el diccionario de datos se almacenan fsicamente todos los diversos esquemas y correspondencias tanto en sus versiones fuentes como en las versiones objeto. 6) Desempeo: el DBMS deber ejecutar todas las funciones recin identificadas en la forma ms eficientemente posible.

43

Teora de la Informacin II

Salazar German & Correa Monica

Unidad II Entidad Entidad es una cosa del mundo real con existencia independiente y se puede clasificar en: 1) Tangible o fsica: Por ejemplo: empleado, alumno, artculo. 2) Intangible o conceptual: Por ejemplo, materia, cuenta corriente. Cada entidad tiene propiedades especficas, llamadas atributos que la describen. Entidades dbiles Las entidades dbiles son aquellas que no tienen atributo clave propio. Se identifican por su relacin con otras entidades especficas en combinacin con algunos de los valores de sus atributos. Esta otra entidad se denomina propietario identificador y el tipo de vnculo que relaciona a ambas se denomina vnculo identificador del tipo de entidad dbil. Siempre tiene una restriccin de participacin total con respecto a su vnculo identificador, porque una entidad dbil no se puede identificar sin una entidad propietaria. Tienen clave parcial que es un atributo que identifica de manera nica a la entidad dbil, relacionadas con la entidad propietaria. Atributo Los atributos son las caractersticas o propiedades que describen a una entidad; por ejemplo, nombre, apellido, domicilio, de un paciente en particular. Podemos distinguir los siguientes tipos de atributos: 1) Simple o compuestos: a. Atributo simple o atmico: es un valor nico el cual no admite divisin. Por ejemplo, el apellido de una persona. b. Atributo compuesto: se pueden dividir en componentes ms pequeos. Por ejemplo, el domicilio en calle, n, ciudad, pas y cdigo postal. El atributo compuesto es una concatenacin de atributos simples. 2) Monovaluados o multivaluados: a. Atributo monovaluado: es un atributo que tiene un solo valor para una entidad en particular. Por ejemplo, la edad de las personas. b. Atributo multivaluado: es cuando un atributo que puede tener distintos nmeros o grados de valores para el mismo. Por ejemplo: ttulo primario, secundario y terciario de un alumno. 3) Derivado o almacenado: a. Atributo derivado: es aquel valor que se obtiene a partir de otro atributo. Por ejemplo, la edad a partir de la fecha de nacimiento. b. Atributo almacenado: es aquel que sirve para obtener otros atributos. Por ejemplo, la fecha de nacimiento que permite obtener la edad. En trminos matemticos, un atributo A de un tipo de entidad E cuyo conjunto de valores es V se puede definir como una funcin de E del conjunto potencia P(V) de V (es el conjunto de todos los subconjuntos de V): A : E P(V)

43

Teora de la Informacin II

Salazar German & Correa Monica

El valor del atributo A para la entidad e lo llamaremos A(e). La definicin anterior abarca los atributos monovaluados y multivaluados, adems de los nulos. Un valor nulo se representa con el conjunto vacio. En el caso de atributos monovaluados, A(e) solo puede ser un conjunto unitario (es un conjunto de un solo elemento) para cada entidad e de E, mientras que no existe esta restriccin para los atributos multivaluados. En el caso de un atributo compuesto A, el conjunto de valores V es el producto cartesiano de P(V1), P(V2), P(Vn) donde V1, V2 Vn son los conjuntos de valores de los atributos componentes simples que constituyen A: V = P(V1) x P(V2) x x P(Vn) *Los atributos multivaluados se muestran entre llaves { }. Los atributos compuestos se muestran entre parntesis ( ). Vinculo Un vnculo se da cuando un atributo de una determinada entidad hace referencia a un atributo de otra entidad. Por ejemplo, empleado pertenece a departamento. Utilizamos tres tipos de vnculos, segn la relacin de cardinalidad: 1) 1:1 uno a uno: una instancia de la vinculacin E 1 se corresponde con una instancia de la vinculacin E 2. 2) 1:N uno a N: una instancia de la vinculacin E 1 se corresponde con varias instancias de la vinculacin E2. 3) M:N M a N: muchas instancias de la vinculacin E1 se corresponde con varias instancias de la vinculacin E 2. Son las ms difciles de resolver. No todos los SGBD lo aceptan, por lo tanto se debe descomponer de N:1 y de 1:M. Concepto de vnculo segn la teora de conjunto Un tipo de vnculo R con n tipos de entidades (E1,E2,...,En) define un conjunto de asociaciones entre estas entidades de estos n tipos de entidades. En trminos matemticos: R es un conjunto de ejemplares de vnculos rj, donde cada rj asocia n entidades (e1,e2,...,en) y cada entidad ej de rj es miembro del tipo de entidades Ej, siendo 1 j n. Por lo tanto, un tipo de vnculo R es una relacin matemtica sobre n tipos de entidades (E1,E2,...,En), que tambin puede definirse como un subconjunto del producto cartesiano E1 x E2 x ... x En. Se dice que cada uno de los tipos de entidades (E1,E2,...,En) participa en el tipo de vnculos R y de manera similar, que cada una de las entidades Ej. del vnculo individuales e1,e2,...,en participa enPERTENECE_A el ejemplar de vnculo rj=(e1,e2,...,en).
EMPLEADO (entidad) e1 PERTENECE_A (Vnculo) r1 e2 r2 e3 r3 d1 DEPARTAMENTO (entidad)

43
d2

e4 r4

. . .

Teora de la Informacin. II
. .

Salazar German & Correa Monica

Concepto de restricciones de participacin (Vnculos) Las restricciones son las que limitan las posibles combinaciones de las entidades que pueden participar en los ejemplares de vnculos. Podemos distinguir dos tipos de restricciones de vnculos: 1) Razn de cardinalidad para vnculos binarios: especifica el nmero de ejemplares de vnculos en los que puede participar una entidad. Las razones de cardinalidad ms comunes en el caso de vnculos de tipo binario son 1:1, 1:N, M:N. 2) Restriccin de participacin y dependencia de existencia: especifica si la existencia de una entidad depende de que est relacionada con otra entidad a travs del tipo de vnculo. Hay dos clases de restricciones de participacin: a. Participacin total: cuando la totalidad de instancias de una entidad esta relacionada con al menos una instancia de la otra entidad vinculante. b. Participacin parcial: cuando algunas o parte de las instancias de una entidad esta relacionada con una instancia de la otra entidad vinculante, pero no necesariamente todas. Ejemplo: consideremos dos entidades: Empleados y Departamentos. El vnculo PERTENECE A: tiene una participacin total ya que todos los empleados pertenecen a un departamento. El vnculo DIRIGE A: la participacin es parcial ya que solo algunos empleados dirigen los departamentos y el resto son empleados pero no dirigen. En los diagramas ER, la participacin total se indica con una lnea doble, y la participacin parcial se indica con una lnea simple. Atributo de un vnculo Los tipos de vnculos tambin pueden tener atributos, similares a los de los tipos de entidad. En el caso de tipo de vinculo 1:1 el atributo del vinculo se puede trasladar a una de las entidades participantes, por ejemplo el atributo fecha_inicio del vinculo DIRIGE puede ser atributo tanto de EMPLEADO como de DEPARTAMENTO, aunque conceptualmente pertenece a DIRIGE. En el caso de un tipo de vinculo 1:N el atributo de este solo se podr trasladar a la entidad del lado N, por ejemplo si el vinculo TRABAJA_PARA tuviese un atributo fecha_inicio dicho atributo se puede incluir como atributo de empleado. En el caso de un tipo de vinculo M:N algunos atributos pueden estar determinados por la combinacin de las entidades participantes. Tales atributos debern especificarse como atributos de vnculo, por ejemplo

43

Teora de la Informacin II

Salazar German & Correa Monica

el atributo horas del vnculo M:N TRABAJA_EN el nmero de horas que un empleado trabaja en un proyecto lo determina una combinacin empleado-proyecto, y no cualquiera de las dos entidades individualmente. Valor El valor, es el posible dato que puede tener el atributo. Por ejemplo, el n de empleado 43262 valor. Dominio Un dominio D es un conjunto de valores atmicos (indivisibles). Tambin resulta til especificar un nombre para el dominio que ayude a interpretar sus valores. Tambin debe especificarse un tipo de datos o formato para cada dominio. As pues cada dominio debe tener un nombre, un tipo de datos y un formato. Tambin puede incluirse informacin adicional para interpretar los valores de un dominio por ej. un dominio numrico como pesos de personas deber especificar las unidades de medicin: libras o kilogramos. Propiedad La propiedad, es el par ordenado formado por (atributo, valor). Por ejemplo, (codmat, 007). Atributo Nulo Un atributo es nulo cuando no posee un valor aplicable. Por ejemplo, el nmero de piso de una persona que vive en una casa. Atributo Identificador o Atributo Clave El atributo identificador es el que permite identificar de manera nica a cada entidad. Por ejemplo, el DNI de una entidad persona. Instancia de una Entidad La instancia de una entidad, representa la informacin o los datos de una entidad. Son todos los atributos con sus valores, los que constituyen una instancia. Propiedad Identificadora La propiedad identificadora es el par ordenado formado por (atributo identificador, valor). tem Elemental de Datos El tem elemental de datos est formado por una tupla conformada por (entidad, atributo, valor). Por ejemplo, (empleado, DNI, 324442). Registro Natural El registro natural, es el conjunto de tem elemental de datos. Archivo Natural El archivo natural, es el conjunto de registros naturales.

43

Teora de la Informacin II

Salazar German & Correa Monica

Modelos de datos conceptuales de Alto Nivel para Diseo de Bases de Datos Los modelos de datos conceptuales de alto nivel para diseo de BD, constan de cuatro pasos: 1) Es la recoleccin y anlisis de requerimientos durante el cual, el diseador entrevista a los futuros usuarios de la BD para entender y documentar sus requerimientos de informacin y en paralelo con las especificaciones de los requerimientos de datos, conviene especificar los requerimientos funcionales que consisten en las operaciones definidas por el usuario que se aplicarn a la BD y que incluyen la obtencin de datos y la actualizacin. Se acostumbra a usar tcnicas como diagramas de flujo de datos, diagramas de secuencia, escenarios, etc. para especificar los requerimientos funcionales. 2) Consiste en el diseo del esquema conceptual para la BD mediante un modelo de datos conceptual de alto nivel. Este paso se denomina diseo conceptual de la BD. El esquema conceptual es una descripcin concisa de los requerimientos de informacin de los usuarios y contiene descripcin detallada de los tipos de datos, los vnculos y las restricciones. Permite a los diseadores de la BD concentrarse en especificar las propiedades de los datos, sin tener en cuenta el Minimu almacenamiento y pudiendo as, ndo elaborar un buen diseo conceptual. En este momento se puede modificar el esquema conceptual sino resulta factible especificar los requerimientos funcionales en el esquema inicial. 3) Este paso se denomina diseo lgico de la BD o transformacin de RECOLECCION Y ANALISIS los modelos de datos. Consiste en implementar la BD con un SGBD DE REQUERIMIENTOS comercial. El esquema conceptual se traduce del modelo de datos de alto nivel al modelo de datos de implementacin del SGBD. 4) Es la fase de diseo fsico de la BD durante el cual se especifica la estructura de almacenamiento interna, los caminos de acceso y la organizacin de los archivos de la BD, en paralelo con estasde actividades, Requerimientos funcionales Requerimientos la BD se disean e implementan programas de aplicacin en forma de transacciones de BD.
ANALISIS FUNCIONAL DISEO CONCEPTUAL

Especificacin de transacciones de alto nivel

Esquema conceptual (en un modelo de datos de alto nivel)

Independiente del SGBD Especfico para cada SGBD

DISEO LOGICO (TRANSFORMACION DE MODELO DE DATOS)

DISEO DE PROGRAMAS DE APLICACION

Esquema (conceptual) lgico (en el modelo de datos de un SGBD)

DISEO FISICO IMPLEMENTACION DE TRANSACCIONES

43
Programas de aplicacin

Esquema interno (para el mismo SGBD)

Teora de la Informacin II

Salazar German & Correa Monica

43

Teora de la Informacin II

Salazar German & Correa Monica

Concepto del Modelo ENTIDAD RELACION El modelo de entidad-relacin es un modelo de datos conceptual de alto nivel muy utilizado. Este modelo se emplea en el diseo conceptual de aplicaciones de BD y en muchas herramientas de diseo de BD aplican sus conceptos. En el modelo relacional una fila se denomina tupla, una cabecera de columnas es un atributo y la tabla se denomina relacin; el tipo de datos que describe los tipos de valores que pueden aparecer en cada columna se llama dominio. El modelo E-R permite representar las entidades y las relaciones a travs de un modelo grfico.
EJ. DE UN MODELO DE E-R

Cantidad NomProv NombrePro y

PROVEEDOR

SUMINISTR AR

PROYECTO

PROYECTO

NombrePro y

NOTACION PARA LOS DIAGRAMAS E-R

Tipo de entidades Tipo de entidades dbiles Tipo de vnculos

Atributo compuesto

Atributo derivado

Tipo de vnculos identificador

E1

E2

Participacin total de E2 en R

Atributo

E1

N R

E2

Participacin parcial de E2 en R

Atributo clave R Atributo multivaluad o

(mx, min)

E2

Restriccin estructural (mx, mn) de la participacin de E en R

43

Teora de la Informacin II

Salazar German & Correa Monica

MODELOS DE ORGANIZACIN DE INFORMACION Existen fundamentalmente tres alternativas disponibles para disear las bases de datos: el modelo jerrquico, el modelo de red y el modelo relacional. Modelo Jerrquico Utiliza dos conceptos principales de estructuracin de datos: registros y vnculos padre-hijo. 1) Registros: es una coleccin de valores de campos que proporcionan informacin sobre la entidad. Los registros del mismo tipo se agrupan en tipos de registros, cada uno de los cuales recibe un nombre y su estructura es una coleccin de campos de ese nombre, cada uno de los cuales tiene un cierto tipo de datos como entero, real o cadena. Nodos Entidades Registros. 2) Vnculos Padre-Hijos: es un vnculo 1:N entre dos tipos de registros. El tipo de registro del lado 1 se denomina tipo de registro padre y el del lado N se denomina tipo de registro hijo. Por ejemplo, Artistas Relacione Vnculo padre-hijos.
Nombre del padre o raz Atributos (conjunto de campos)

NOMBRE D

DEPARTAMENTO NUMERO NOMBREGT FECHAINICGT D E E


Numero de hijos

EJ. DE UN ESQUEMA JERARQUICO

PROYECTO NOMBREP NUMERO LUGARP R P

Un esquema de la BD jerrquica consiste en varios esquemas jerrquicos donde cada uno comprende varios tipos de registros padre-hijos y varios tipos de vnculos padre-hijos. Los esquemas jerrquicos se representan en diagramas jerrquicos en los cuales los nombre de los registros aparecen en rectngulos y los tipos de vnculos se dibujan con lneas que conectan el tipo de registro padre y el tipo de registro hijo. Ocurrencias Una ocurrencia del tipo de vnculo padre-hijo es un registro del tipo de registro padre y varios tipos de registros hijos. O sea que son los valores que en un instante pueden tomar los registros. Ocurrencia valores registros.

43

Teora de la Informacin II

Salazar German & Correa Monica

Propiedades del Modelo Jerrquico Podemos distinguir las siguientes: 1) Un tipo de registros raz de esquema jerrquico no puede participar como tipo de registro hijo en ningn tipo de vnculo padre hijo. 2) Todo tipo de registro excepto la raz, participa como tipo de registro hijo en uno y solo un tipo de vnculo padre hijo. 3) Un tipo de registro puede participar como tipo de registro padre en cualquier cantidad de tipos de vnculos padre hijo. 4) Un tipo de registro que no participa como tipo de registro padre en ningn tipo de vnculo padre hijo se denomina hoja del esquema jerrquico. 5) Si un tipo de registro participa como padre en ms de un tipo de vnculo padre hijo, entonces sus tipos de registros hijos estn ordenados y el ordenamiento es de izquierda a derecha. Desventajas que presenta el Esquema Jerrquico 1) Solo es aplicable para vinculaciones 1:N, M:N no se puede representar directamente porque los vnculos son 1:N y un tipo de registro no puede participar como hijo en dos o ms vnculos padre hijos distintos. En el modelo jerrquico es posible manejar los vnculos M:N si se pueden duplicar los ejemplares de registros hijos, o sea incorporar una redundancia controlada o mnima. 2) Ningn registro a excepcin de la raz, puede existir si no est relacionado con un padre. Ningn registro hijo se puede eliminar de su padre, pero la eliminacin de un padre causa la eliminacin de todos sus hijos. Arboles Un rbol, es un esquema jerrquico en el que existen muchas ocurrencias jerrquicas, cada una de las cuales se llama rbol de ocurrencias, cuya raz es un solo registro del tipo de registro raz. El rbol de ocurrencia contiene todas las ocurrencias de registros hijos del registro raz, todas las ocurrencias del registros hijos dentro de los vnculos padre hijo de cada uno de los registros hijo del registro raz y as sucesivamente hasta los registros hojas. En una estructura rbol se dice que la raz tiene nivel 0. El nivel de un nodo no raz es el nivel del nodo padre 1. Por lo tanto, un rbol es un conjunto de nodos, en donde existe un nodo llamado raz y del cual va a derivar el resto de los nodos, los cuales formarn parte de los subrboles del rbol principal. La terminologa es: Grado: es la cantidad de hijos que tiene un nodo. El grado de un rbol est dado por el nodo de mayor grado. Nivel: se dice que la raz se encuentra en el nivel 0 y el resto de los nodos se encuentran en un nivel 1 con respecto a su anterior. Profundidad: est determinada por el mximo nivel en que se encuentran las hojas. rbol binario: son los ms utilizados. Es aquel en el que podemos distinguir un subrbol a la izquierda y un subrbol a la derecha y el grado del rbol debe ser 2. Estos pueden clasificarse en:

43

Teora de la Informacin II

Salazar German & Correa Monica

o o o

rbol binario oblicuo: son los que estn formados solamente por un subrbol ya sea a la izquierda o a la derecha. rbol binario completo: son aquellos en donde todos los nodos son de grado 2. rbol binario incompleto: son aquellos en donde existen nodos que no son de grado 2.

Correspondencia La correspondencia puede ser: 1) Simple: es cuando la correspondencia es de hijo a padre o sea que decimos que un hijo tiene un solo padre. 2) Compleja: es cuando la correspondencia es de padre a hijo, o sea de uno a muchos, porque un padre puede tener varios hijos. Camino Jerrquico Un camino jerrquico es la secuencia de nodos que parten de la raz, siendo completo cuando llega a la hoja. Retama Una retama es el conjunto de caminos jerrquicos. Son todos los caminos jerrquicos de un subrbol MODELO DE REDES. CARACTERISTICAS El modelo de redes es ms flexible que la estructura de rbol porque un nodo hijo puede tener ms de un padre (N:1). Existen dos estructuras de datos en el modelo de redes: 1) Registros: consiste en un grupo de valores de datos relacionados entre s. Se clasifican en tipos de registros, cada uno de los cuales describe la estructura de un tipo de registro que almacena el mismo tipo de informacin. Los elementos de informacin pueden ser de dos tipos: a. Reales: porque sus valores se almacenan verdaderamente en los registros. b. Virtuales o derivados: porque se obtienen a partir de los reales mediante un clculo. 2) Conjunto: es un grupo repetitivo que permite incluir un conjunto de valores compuestos para un elemento de informacin en un solo registro. Es el nombre de la vinculacin entre los registros propietarios y los registros miembros, los cuales forman pares ordenados. El conjunto es vaco cuando no tiene ningn miembro que cumple con la vinculacin. La ocurrencia de un conjunto, es la relacin entre un registro del tipo de registro propietario con el conjunto de registros del

43

Teora de la Informacin II

Salazar German & Correa Monica

tipo de registro miembro (1:N). Un registro miembro no puede pertenecer a dos ocurrencias distintas. GRAFOS. ESTRUCTURA DE GRAFOS. El modelo de datos de red utiliza grafos como estructura de datos para representar las entidades y sus vinculaciones. Los grafos, son pares ordenados formados por un conjunto de vrtices y un conjunto de aristas (entidades, vinculaciones). GRAFOS DIRIGIDOS Los grafos son dirigidos cuando tiene aristas con orientacin, por lo tanto se puede identificar un vrtice origen (a 1) y un vrtice destino (a2). GRAFOS CICLICOS Un grafo cclico es aquel que tiene como entidad descendiente a un antepasado. Si existe una nica entidad, el ciclo se llama lazo. RELACION PROPIETARIO MIEMBRO Un registro miembro (hijo) puede tener varios registros propietarios (padres). Sus caractersticas son: 1) Tipo del conjunto: la relacin entre un registro propietario y sus registros miembros se etiqueta con un nombre de conjunto. 2) Propietario y miembro: el registro padre de un conjunto se llama propietario del conjunto. Un conjunto consiste en un solo registro propietario y uno o ms registros miembros. 3) Registro mltiple: un conjunto de tipo miembro puede asociarse con ms de un tipo propietario. 4) Niveles mltiples: un registro puede ser miembro en un tipo de conjunto y al mismo tiempo propietario en otro tipo de conjunto. CICLOS Se dice que existe un ciclo cuando un nodo tiene como descendiente un antepasado, de modo que la relacin padre-hijo se representan a travs de un lazo entrelazado. Los SGBD no pueden trabajar con ciclos por lo que se rompe el ciclo y se usa un nodo conector.
CICLO

Proyecto

equipo
empleado

proyecto

equipamien to

LAZO Un lazo, es un ciclo particular en el cual el propietario y el miembro es del mismo tipo de registro.
LAZO

43

Teora de la Informacin II

Salazar German & Correa Monica

RELACIONES O VINCULOS MULTIPLES Las vinculaciones binarias se representan grficamente mediante lneas nicas, no identificadas. La situacin se complica cuando existen varios vnculos entre los mismos datos.

43

Teora de la Informacin II

Salazar German & Correa Monica

Unidad III MODELO RELACIONAL En el modelo relacional (es el modelo ms usado), la BD es representada como una coleccin de relaciones. El orden de sus atributos no es importante mientras se mantenga la correspondencia entre atributo y valor. Si se visualiza una relacin como una tabla de valores, cada fila representa un registro, el cual es una coleccin de valores de datos relacionadas entre si. Dichos valores se pueden interpretar como hechos que describen una entidad, y las columnas representan campos (atributos). El nombre de la tabla y los nombres de las columnas ayudan a interpretar el significado de los valores que estn en las filas de la tabla. Los nombres de las columnas especifican como interpretar el significado de los valores de datos de cada fila. Todos los valores de una columna tienen el mismo tipo de dato. Una fila se denomina tupla, una cabecera de columna es un atributo y la tabla es una relacin. El rango de los valores que puede tomar el tipo de dato que puede aparecer en cada columna se llama dominio el cual debe tener un nombre y un tipo de dato. Una estructura de relacin queda definida a partir de un esquema de relacin. En un esquema de relacin el nmero de atributos sirve para describir el grado de relacin. En el esquema de relacin R (A1, A2,..., An); r es un conjunto de tuplas r={t 1, t2,..., tn} en donde cada tupla t es una lista de valores, t={v1, v2,..., vn}. El valor de cada casillero se denomina valor atmico porque es indivisible, no puede ser compuesto ni multivaluado. El valor nulo es aquel que se desconoce o no existe. Para relacionar informacin de dos tablas se utilizan valores coincidentes. Por ejemplo: ESTUDIANTE (DNI, nombre, apellido, direccin)

BASE DE DATOS RELACIONAL


ESTUDIANTES MATERIAS PROFESORES

Existen diferencias importantes entre las relaciones y los archivos : Las tuplas de una relacin no tienen un orden especfico, en cambio en los registros de un archivo, se almacenan fsicamente en el disco de modo que siempre existe un orden entre ellos.

43

Teora de la Informacin II

Salazar German & Correa Monica

Las tuplas no forman parte de la definicin de una relacin, porque la relacin intenta expresar los hechos en un nivel lgico o abstracto, ya que en realidad no existe para preferir que un valor aparezca antes que otro en una tupla. Una tupla de la relacin puede ser identificada a travs del valor de un atributo clave (siempre va subrayada). Adems puede existir una clave secundaria.

RESTRICCIONES RELACIONALES 1) Restriccin de dominio Las restricciones de dominio especifican que el valor de cada atributo A debe ser un valor atmico del dom(A). Los tipos de datos asociados a los dominios por lo regular incluyen los tipos de datos numricos estndar de los nmeros enteros (como entero corto, entero, entero largo) y nmeros reales (flotante y flotante de doble precisin).Tambin disponemos de caracteres, cadenas de caracteres de longitud fija y cadenas de caracteres de longitud variable, as como tipos de datos fecha, hora, marca de tiempo y dinero. Otros dominios posibles se pueden describir mediante un subintervalo de valores de un tipo de datos o como tipos de datos enumerado en el que se listan explcitamente todos los valores posibles. 2) Restricciones en la clave y restricciones sobre nulos Por definicin todos los elementos de un conjunto son distintos; por tanto, todas la tuplas de una relacin deben ser distintas. Por lo regular existen otros subconjuntos de atributos de un esquema de relacin R con la propiedad de que no debe haber dos tuplas en un estado de relacin r(R) con la misma combinacin de valores para estos atributos. Supngase que denotamos un subconjunto as de atributos con SC; entonces, para dos tuplas distintas cualesquiera t 1 y t2 en un estado de relacin r(R), tenemos la siguiente restriccin: t 1 [SC] t2 [SC]. Todo conjunto de atributos SC se denomina superclave del esquema de relacin R. Una superclave SC especifica una restriccin de unicidad que significa que dos tuplas distintas en un estado r(R) no pueden tener el mismo valor para SC. Toda relacin tiene por lo menos una superclave: el conjunto de todos sus atributos. Sin embargo, una superclave puede tener atributos redundantes, as que un concepto mucho mas til es el de clave, que carece de redundancia. Una clave K de un esquema de relacin R es una superclave de R con la propiedad adicional de que la eliminacin de cualquier atributo A de K deja un conjunto de atributos K que no es una superclave de R. Por tanto, una clave es una superclave mnima, es decir, una superclave a la cual no podemos quitarle atributos sin que deje de cumplirse la restriccin de unicidad. En general, un esquema de relacin puede tener mas de una clave. En tal caso, cada una de ella se denomina clave candidata. Es habitual

43

Teora de la Informacin II

Salazar German & Correa Monica

designar a una de las claves candidatas como clave primara de la relacin, es conveniente elegir una clave primaria con un solo atributo o un nmero reducido de atributos. Esta es la clave candidata cuyos valores sirven para identificar las tuplas en la relacin. Adoptaremos la convencin de subrayar los atributos que forman la clave primaria de un esquema de relacin. Hay otra restriccin sobre los atributos que especifica si se permiten o no los valores nulos.

3) Base de datos relacionales y esquemas de base de datos Un esquema de base de datos relacional S es un conjunto de esquemas de relaciones S:{R1, R2, Rm} y un conjunto de restricciones de integridad RI. Un ejemplo de base de datos relacional seria:
EMPRESA = {EMPLEADO, DEPARTAMENTO, LOCALIZACIONES_DEPT. PROYECTO, TREABAJA_EN, DEPENDIENTE}

Un estado de base de datos relacional de S es un conjunto de estados de relaciones BD = {r1, r2, , rm} tal que cada ri es un estado de R y tal que los estados de relaciones ri satisfacen las restricciones de integridad especificadas en RI. 4) Integridad de entidades, integridad referencial y claves externas La integridad de entidades establece que ningn valor de clave primaria puede ser nulo. Esto es porque el valor de la clave primaria sirve para identificar las tuplas individuales en una relacin, el que la clave primaria tenga valores nulos implica que no podemos identificar algunas tuplas. La restriccin de integridad referencial establece que una tupla en una relacin que haga referencia a otra relacin deber referirse a una tupla existente en esa relacin. Un conjunto de atributos CE (clave externa) en el esquema de relacin R1 es una clave externa de R1 si satisfacen las dos reglas siguientes: 1. Los atributos de CE tienen el mismo dominio que los atributos de la clave primaria CP de otro esquema de relacin R 2, se dice que los atributos CE hacen referencia o se refieren a la relacin R 2. 2. Un valor de CE en una tupla t1 del estado actual r1(R1) ocurre como valor de CP en alguna tupla t2 del estado actual r2(R2) o bien es nulo. En el primer caso tenemos que t 1 [CE] = t2[CP], y decimos que la tupla t1 hace referencia o se refiere a la tupla t2. R1 se denomina relacin referenciante y R2 es la relacin referenciada. VENTAJAS DE ESTE MODELO

43

Teora de la Informacin II

Salazar German & Correa Monica

1) Simplicidad de su representacin. 2) Ofrece flexibilidad para establecer relaciones de datos. 3) Las consultas pueden ser manejadas de una manera eficiente. CARACTERISTICAS DE ESTE MODELO 1) Sencillez en el manejo de la informacin. 2) Dentro de la relacin no deben existir grupos repetitivos. 3) Los datos son homogneos por columnas. 4) Las filas son diferentes. En cada una de las filas se representa un registro o una instancia diferente.

REPRESENTACION TABULAR La representacin tabular es una manera de representar datos en tablas bidimensionales. Se acepta una redundancia mnima o controlada. Para la vinculacin de tablas, las cuales son matrices rectangulares que pueden ser descriptas matemticamente. PROPIEDADES GENERALES 1) Cada entrada a la tabla representa un grupo diferente, es decir, no se repite. 2) Son homogneas por columnas, es decir, de la misma clase. 3) Cada columna tiene nombre propio. 4) Todas las filas son diferentes, no se admiten filas duplicadas. 5) Tanto las filas como las columnas pueden ser consideradas en cualquier momento, de esta manera no se ver afectado el contenido de informacin o semntica de cualquier funcin que utilice la tabla. 6) Sencillez en el manejo de la informacin. TERMINOLOGIA 1) Relacin: es un archivo conceptual que consta de ocurrencias con la misma composicin de campos y puede ser representada mediante una tabla. 2) Atributos: son los encabezados de las columnas que presenta una relacin y es equivalente a un campo, y son utilizados para describir una relacin. 3) Dominio: es el conjunto de valores posible que puede tomar el atributo. 4) Tupla: se llama as a cada uno de los renglones de la tabla. Cada una representa la ocurrencia del registro. Una relacin est formada por un conjunto de tuplas. Si la relacin tiene n columnas y m tuplas, se dice que es de grado n y consta de un conjunto de m tuplas. 5) Cardinalidad: es la cantidad de tuplas o filas que tiene una relacin.

43

Teora de la Informacin II

Salazar German & Correa Monica

6) Grado: es el nmero de columnas que tiene una relacin. 7) Clave: tambin conocida como llave, es un dato elemental en un registro al cual se lo utiliza como identificador. Podemos distinguir las siguientes: a. Primaria: es cuando la clave identifica de manera exclusiva a un registro. b. Secundaria: es cuando no identifica de manera exclusiva a un registro. Se utiliza para seleccionar a un grupo de registro que pertenece a un conjunto. ALGEBRA RELACIONAL El lgebra relacional es un conjunto de operaciones que sirve para manipular relaciones enteras. Estas operaciones sirven para seleccionar tuplas de relaciones individuales y para combinar tuplas vinculadas a partir de varias relaciones vinculadas a fin de especificar una consulta de la BD. El resultado de esta operacin es una nueva relacin, la cual podr ser manipulada en una ocasin futura. Las operaciones del lgebra relacional se pueden clasificar en dos grupos: Grupo 1: operaciones de la teora de conjunto: estas se pueden aplicar al mdulo relacional, porque las relaciones se definen como conjunto de tuplas, y pueden servir para procesar las tuplas de dos relaciones como conjuntos o sea para combinar de diversas maneras los elementos de dos conjuntos. Las ms utilizadas son la unin, la interseccin y diferencia, siendo estas operaciones binarias porque se aplican a dos relaciones. Las dos relaciones a las que se pueden aplicar estas operaciones relacionales debern tener el mismo tipo de tuplas, esta condicin se denomina compatibilidad de unin. Dada las relaciones R (A1, A2,..., An) y S (B1, B2,..., Bm) cumplen con la compatibilidad de unin si tienen el mismo grado n y su dom(A1)= dom(B1), esto significa que las dos relaciones tienen el mismo nmero de atributos y que cada par de atributos correspondientes tienen el mismo dominio. Dada dos relaciones que cumplen con la condicin de compatibilidad de unin R y S podemos definir las siguientes operaciones de la teora de conjuntos: a) Unin: (RUS) el resultado es una relacin que incluye todas las tuplas de R o S o en ambas. Las tuplas repetidas se eliminan. b) Interseccin: (RS) el resultado es una relacin que tienen las tuplas comunes de R y S. c) Diferencia: (R-S) el resultado es una relacin que incluye las tuplas que estn en R pero no en S. d) Producto cartesiano: (RxS) en esta no es necesaria la compatibilidad de unin. Sirve para combinar tuplas de dos relaciones y de esta manera poder identificar las tuplas relacionadas entre s. Dadas dos relaciones R (A 1,

43

Teora de la Informacin II

Salazar German & Correa Monica

A2,..., An) y S (B1, B2,..., Bm), el resultado de RxS es una relacin Q con n+m atributos Q (A1, A2,..., An, B1, B2,..., Bm) en el mismo orden. La relacin Q tiene una tupla por cada combinacin de tuplas, una de R y una de S, por lo tanto, si R tiene mR tuplas y S tiene nS tuplas, RxS tendr nS* mR tuplas. 2) Grupo 2: operaciones creadas especficamente para BD relacionales, incluyen: a. Operacin seleccionar: sirve para seleccionar un subconjunto de las tuplas de una relacin que satisfacen una condicin de seleccin de esta manera se seleccionan algunas filas y se desechan otras; la notacin es: <condicin de seleccin> (<nombre de la relacin>). Dentro de la condicin de seleccin se encuentra el nombre del atributo, el operador de comparacin (=, <, >, , , ) y un valor del dominio del atributo. Estas condiciones pueden ser compuestas por operadores and, or, not. Como resultado de la operacin de seleccin se obtiene todas las tuplas que se cumplen con la condicin, esta operacin es unaria, es decir, se aplica para una sola relacin y el grado de la relacin resultante ser el mismo que el de la relacin R por tener los mismos atributos que R, el nmero de tuplas de la relacin resultante es menor o igual que la relacin R. b. Operacin proyectar: selecciona ciertas columnas y desecha las dems. Se utiliza para conservar aquellos atributos que nos interesa, desechando el resto de las columnas. La notacin es <lista de atributos> (<nombre de la relacin>) . La lista de atributos, son los atributos de la relacin R que queremos conservar y en el mismo orden en que aparezcan en la lista. El grado de la relacin resultante est dado por el nmero de atributos que figura en <lista de atributos>. El nmero de tuplas de la relacin resultante ser menor (en caso de que existan tuplas repetidas y cuando no se incluya el atributo clave) o igual (porque se incluy el atributo clave o no hubo tuplas repetidas) que la relacin R, esta operacin es unaria, es decir, se aplica en una sola relacin. c. Operacin renombrar: (rho). La operacin renombrar es aquella que nos permite modificar el nombre de una relacin, los nombres de los atributos, o ambos. Notacin S(B1,B2,,Bn)(R) o S(R) o (B1,B2,,Bn)(R) donde el smbolo se usa para denotar el operador renombrar, S es el nuevo nombre de la relacin, y B 1, B2 , Bn son los nuevos nombres de los atributos. La primera expresin renombra tanto la relacin como sus atributos; la segunda relacin renombra nicamente la relacin; y la tercera renombra

43

Teora de la Informacin II

Salazar German & Correa Monica

solo los atributos. Si los atributos de R son (A1,A2,An) en ese orden, entonces cada Ai se renombra como Bi. d. Operacin reunin: (R S) sirve para combinar tuplas relacionadas de dos relaciones vinculadas, en una sola tupla. Permite procesar vnculos entre relaciones cuando exista ms de una relacin. La forma general de una operacin de reunin con dos relaciones R (A1, A2,..., An) y S (B1, B2,..., Bm) es una relacin Q con n+m atributos: Q (A1, A2,..., An, B1, B2,..., Bm), en ese mismo orden, Q tiene una tupla por cada combinacin de tuplas (una de R y una de S), siempre que la combinacin satisfaga la condicin de reunin. A diferencia del producto cartesiano en el cual se incluyen todas las combinaciones de tuplas. Dentro de la <condicin de reunin> se especifica el nombre del atributo de la relacin R, el operador de comparacin y el nombre del atributo de la relacin S. Esta condicin se evala para cada combinacin de tuplas y aquellas que cumplan la condicin se incluirn en la relacin resultante Q como una sola tupla. Dentro de <condicin de reunin> se pueden incluir varias condiciones mediante los operadores lgicos. e. Operacin divisin: es til para un tipo especial de consultas, que se presenta a veces en aplicaciones de bases de datos. La operacin divisin se aplica a dos relaciones R(Z) % S(X)= T(Y), donde X Z (condicin para realizar la divisin). Sea Y = Z X (y por lo tanto Z = X Y); es decir, sea Y el conjunto de atributos de R que no son atributos de S. El resultado de la divisin es una relacin T(Y) que incluye una tupla t si hay tuplas t R que aparecen en R, con tR(Y) = t y con tR(X) = ts para cada tupla ts en S. Esto significa que, para que una tupla r aparezca en el resultado T de la DIVISIN, los valores de t deben aparecer en R en combinacin con las tuplas de S.

Calculo Relacional El clculo relacional es un lenguaje formal basado en la lgica matemtica llamado clculo de predicado para las BD relacionales. Diferencia entre Calculo Relacional y Algebra Relacional 1) La principal diferencia es que en el clculo relacional escribimos una expresin declarativa {t.NOMBREEMP , t.APELLIDO|Empleado (t) and t.SALARIO>50000} para especificar una solicitud de obtencin de datos, mientras que en el lgebra relacional debemos escribir una secuencia de operaciones. R1 <- SALARIO > 50000 (EMPLEADO) R2 <- NOMBREEMP, APELLIDO (R1)

43

Teora de la Informacin II

Salazar German & Correa Monica

2) En el lgebra relacional se especifica un cierto orden de las operaciones dentro de una expresin. Este orden sirve para evaluar la consulta, se especifica como debe obtenerse, funciona por procedimiento. En el clculo relacional no se describe como evaluar una consulta. Una expresin del clculo relacional especifica qu debe obtenerse, no cmo debe hacerse, por lo tanto se considera un lenguaje declarativo, es decir, que no funciona por procedimiento. 3) El poder de expresin de los dos lenguajes son idnticos, ya que cualquier obtencin de datos que se puede especificar en el lgebra relacional tambin puede ser especificada en el clculo relacional.

Algoritmo de transformacin de ER en relacional PASO 1. Por cada entidad fuerte E del esquema ER, se crea una relacin R que contenga todos los atributos simples de E. Si tuviere atributos compuestos se incluyen solo los atributos simples que lo componen. Se elige uno de los atributos clave de E como clave primaria de R. Si la clave elegida es compuesta, el conjunto de atributos simples que la forman constituir la clave primaria de R. PASO 2. Por cada tipo de entidad dbil W en el esquema ER con tipo de entidades propietario E, se crea una relacin R, y se incluyen todos los atributos simples (o componentes simples de los atributos compuestos) de W como atributos de R. Adems, se incluyen como atributos de clave externa de R el atributo o los atributos de clave primaria de la relacin o relaciones que corresponden al tipo o tipos de entidades propietarias, con esto indicamos el tipo de relacin identificador de W. La clave primaria de R es la combinacin de las claves primarias de los propietarios y la clave parcial del tipo de entidad dbil de W, si la hubiese. PASO 3. Por cada tipo de relacin binaria 1:1 R del esquema ER, se identifican las relaciones S y T que corresponden a los tipos de entidades que participan en R. Se elige una de las relaciones, por ejemplo S, y se incluye como clave externa en S la clave primaria de T. Es mejor elegir un tipo de identidad con participacin total en R en el papel de S. Se incluyen todos los atributos simples(o componentes simples de los atributos compuestos) del tipo de relacin 1:1 R como atributos de S. PASO 4. Por cada tipo de relacin binaria 1: N, se identifica la relacin S que representa el tipo de entidad participante del lado N del tipo de relacin. Se incluye como clave externa en S la clave primaria de la relacin T que representa el otro tipo de entidad que participa en R. Se incluyen todos los

43

Teora de la Informacin II

Salazar German & Correa Monica

atributos simples (o componentes simples de los atributos compuestos) del tipo de relacin 1: N como atributos de S. PASO 5. Por cada tipo de relacin binaria M:N R, se crea una nueva relacin S para representar a R. Se incluyen como atributos de clave externa en S las claves primarias de las relaciones que representan los tipos de entidad participantes; su combinacin constituir la clave primaria de S. Tambin se incluyen todos los atributos simples (o componentes simples de los atributos compuestos) del tipo de relacin M: N como atributos de S. PASO 6. Por cada atributo multivaluado A, se crea una nueva relacin R. Esta relacin R incluir un atributo correspondiente a A, clave primaria de K (como clave externa de R) de la relacin que representa el tipo de entidades o tipo de relaciones que tiene a A como atributo. La clave primaria de R es la combinacin de A y K. Si el atributo multivaluado es compuesto, se incluyen sus componentes simples. PASO 7. Por cada tipo de relaciones n-arias (n>2), se crea una nueva relacin S que representa a R. Se incluyen como atributos de clave externa en S las claves primarias de las relaciones que representan los tipos de entidades participantes. Tambin se incluyen los atributos simples (o los componentes simples de los atributos compuestos) del tipo de relaciones n-arias como atributos de S. La clave primaria de S casi siempre es una combinacin de todas las claves externas que hacen referencia a las relaciones que representan los tipos de entidades participantes. No obstante, si la restriccin de cardinalidad de uno de los tipos de entidades E que participan en R es 1, entonces la clave primaria de S no debera incluir el atributo de clave externa que haga referencia a la relacin E que corresponde a E. Informacin redundante y anomalas de Actualizacin Informacin redundante es todo dato ingresado reiteradamente sin necesidad. Anomalas de Actualizacin son ciertos problemas que aparecen con frecuencia en el manejo de BD cuando el diseo de las mismas no ha sido realizado de forma Normalizada. Se pueden distinguir 3 tipos de Anomalas: 1) Anomala de insercin: dada una relacin Empleado_Departamento se pueden generar 2 tipos de anomalas de insercin: al ingresar datos sin tener los atributos principales (claves) que conformen la tupla (fila). Por ej: Al ingresar un empleado y no tener un departamento especifico para el mismo, o viceversa, ingresar un departamento nuevo que no posee aun empleado.

43

Teora de la Informacin II

Salazar German & Correa Monica

al ingresar un mismo dato en otra tupla pero con inconsistencia. Por ej: ingresar un empleado con un cdigo de dpto existente pero un nombre que no coincide en las tuplas anteriores.

2) Anomala de eliminacin: perdida de informacin por dar de baja una tupla. Por ej: si se elimina un nico empleado que pertenece a un dpto especfico de la relacin Empleado_Departamento se perdera la informacin de dicho dpto. 3) Anomala de modificacin: dado el caso de tener redundancia de datos en una relacin, la modificacin de un atributo implementara la posterior modificacin de las dems tuplas que contengan los mismos datos. Por ej: cambiar el NSS_JEFED de la relacin Empleado_Departamento. Empleado_Departamento NOMBR NS FECHA_NC EE S TO

DIRECCI ON

NUMER OD

NOMBR ED

NSS_JEF ED

Definicin de dependencia funcional Una dependencia funcional es una relacin entre atributos de una misma relacin (tabla). Si X e Y son atributos de la relacin R, se dice que Y es funcionalmente dependiente de X (se denota por X Y) si cada valor de Y tiene asociado un solo valor de X (X e Y pueden constar de uno o varios atributos). A X se le denomina determinante, ya que X determina el valor de Y. Se dice que el atributo Y es completamente dependiente de X si depende funcionalmente de X y no depende de ningn subconjunto de X. Normalizacin La normalizacin es una tcnica para obtener estructuras de datos eficientes. Cuando se desarrolla el modelo relacional o sea cuando se realizan operaciones relacionales, suelen cometerse anomalas en el manejo de informacin como ser: 1) Relaciones con informacin redundante (1FN). 2) Atributos que tienen una dependencia incompleta con respecto a atributos claves (2FN). 3) Atributos no primos que dependen de atributos no primos (3FN). Para eliminar estas anomalas, es que se lleva a cabo el proceso de normalizacin, el cual es un conjunto de etapas: 1) Informacin redundante: se eliminan los atributos repetitivos (1FN). 2) Dependencia funcional total: debe existir una dependencia de los atributos no primos (no son clave principal) con respecto a los atributos primos (claves principales) (2FN).

43

Teora de la Informacin II

Salazar German & Correa Monica

3) Dependencia funcional transitiva: o sea que no debe haber transitividad: ABC. (3FN) Como consecuencia de llevar a cabo estas 3 etapas, es que se crean nuevas relaciones. VENTAJAS DE LA APLICACIN DEL PROCESO DE NORMALIZACION 1) Permite la recuperacin sencilla de datos. 2) Simplifica el mantenimiento de datos. 3) Facilidad de implementacin. 4) Podemos implementar controles de seguridad. 5) Precisin en cuanto al manejo de la relacin. 6) Claridad con que podemos mostrar las relaciones.

43

Teora de la Informacin II

Salazar German & Correa Monica

UNIDAD IV El Ciclo de Vida de un Sistema de Informacin En una organizacin grande el sistema de base de datos suele ser parte del sistema de informacin, que incluye todos los recursos que participan en la obtencin, administracin, uso y diseminacin de los recursos de informacin de la organizacin. Se suele llamar macro ciclo de vida al ciclo de sistema de informacin, y micro ciclo de vida al ciclo de vida del sistema de base de datos. Por lo general el macro ciclo de vida incluye las siguientes fases: 1) Anlisis de factibilidad: en esta fase se analizan las reas de aplicacin, se identifica el costo asociado a la obtencin e interpretacin de la informacin, se realizan estudios preliminares de costo-beneficios, se determina la complejidad de los datos y procesos, y establecer prioridades entre las aplicaciones. 2) Obtencin y anlisis de requisitos: se obtienen los requisitos detallados interactuando con los usuarios para as identificar sus problemas y necesidades especficamente. 3) Diseo: esta fase tiene dos aspectos, el diseo del sistema de base de datos y el diseo de los sistemas de aplicacin (programas) que usan y procesan la base de datos. 4) Implementacin: se implementa el sistema de informacin, se carga la base de datos y se implementan y prueban las transacciones de datos. 5) Validacin y prueba de aceptacin: se evala la aceptacin del sistema en cuanto a la satisfaccin de los requisitos de los usuarios y a los criterios de rendimiento. 6) Despliegue, operacin y mantenimiento: esta fase suele estar precedida por la capacitacin de los usuarios. La fase operativa comienza cuando todas las funciones del sistema estn disponibles y han sido validadas. La supervisin del rendimiento del sistema y el mantenimiento del sistema son actividades importantes durante la fase de operacin. METODOLOGIA PARA EL DISEO DE LAS BASES DE DATOS La metodologa ms utilizada para el diseo de las BD es el (micro) ciclo de vida del sistema de aplicacin para la BD, el cual consta de las siguientes etapas: 1) Definicin del sistema: se definen el alcance del sistema de datos, sus usuarios y sus aplicaciones. Se identifican las interfaces para varias categoras de usuario, las restricciones del tiempo de respuesta y las necesidades de almacenamiento y proceso.

43

Teora de la Informacin II

Salazar German & Correa Monica

2) Diseo de la base de datos: al final de esta fase estar listo un diseo lgico y fsico completo del sistema de base de datos en el SGBD elegido. 3) Implementacin de la BD: esto comprende el proceso de especificar las definiciones conceptual, externa e interna de la BD, crear ficheros de la BD vacios e implementar las aplicaciones de software. 4) Carga o conversin de los datos: las base de datos se llenan de datos ya sea cargndolos directamente o convirtiendo ficheros ya existentes al formato del sistema de BD. 5) Conversin de aplicaciones: cualquier aplicacin de software que se usaba en un sistema anterior se convierte en nuevo sistema. 6) Prueba y validacin: se prueba y valida el sistema. 7) Operacin: el sistema de BD y sus aplicaciones se ponen en operacin. Normalmente, el sistema antiguo y el nuevo operan en paralelo por un tiempo. 8) Supervisin y mantenimiento: durante la fase de operacin, el sistema se vigila y mantiene constantemente. Puede haber crecimiento y expansin tanto en el contenido de datos como en las aplicaciones de

43

Teora de la Informacin II

Salazar German & Correa Monica

software. Es posible que de vez en cuando se requieran modificaciones y reorganizaciones importantes. ** En general suele haber retroalimentacin entro los diversos pasos porque a menudo surgen requisitos en todas las etapas. Esta figura muestra el ciclo de retroalimentacin que afecta a las fases de diseo conceptual y lgico como resultado de la implementacin y ajuste del sistema.**

El proceso de Diseo de Base de Datos Los objetivos del diseo de bases de datos son mltiples: Satisfacer los requisitos de contenido de informacin de los usuarios y aplicaciones especificados. Proporcionar una estructuracin de la informacin natural y fcil de entender. Soportar los requisitos de procesamiento y cualesquier otros objetivos de rendimiento, como el tiempo de respuesta, el tiempo de procesamiento y el espacio de almacenamiento. Podemos identificar 6 etapas principales del proceso de diseo de bases de datos: o Etapa 1: Obtencin y anlisis de requisitos: para poder disear eficientemente una BD, debemos conocer las expectativas de los usuarios y de los usos que se piensa darle a la BD. Por lo general esta etapa incluye las siguientes actividades: 1) Se identifican las principales reas de aplicacin y grupos de usuarios que utilizaran la BD o cuyo trabajo se ver afectado por ella. Se eligen individuos clave y un comit dentro de cada grupo para llevar a cabo los pasos subsiguientes de obtencin y especificacin de requisitos. 2) Se estudia y analiza la documentacin existente relativa a las aplicaciones. Se repasa otra documentacin (manuales de poltica, formularios, informes y diagramas de organizacin) para determinar si tiene alguna influencia sobre el proceso de obtencin y especificacin de requisitos. 3) Se estudia el entorno de operacin actual y los planes de utilizacin de la informacin. Esto incluye en el anlisis de los tipos de transacciones y de sus frecuencias as como del flujo de la informacin dentro del sistema. Se estudian las caractersticas geogrficas de los usuarios, el origen de las transacciones, el destino de los informes, etc. Se especifican los datos de entrada y de salida de las transacciones. 4) A veces se pasan cuestionarios (por escrito) a los posibles usuarios o grupos de usuarios de la base de datos. Sus preguntas se refieren a las prioridades de los usuarios y a la importancia que dan a las diversas aplicaciones. Posiblemente se entrevisten

43

Teora de la Informacin II

Salazar German & Correa Monica

individuos clave que ayudaran a estimar el valor de la informacin y a establecer las prioridades. El anlisis de requisitos lo lleva a cabo un grupo de analistas o expertos en requisitos para los usuarios finales de la BD. La etapa de obtencin y anlisis de requisitos puede consumir bastante tiempo pero es esencial para el xito del sistema de informacin. Corregir un error de requisitos es mucho ms caro que corregir un error cometido durante la implementacin, porque los efectos de los errores en los requisitos normalmente afectan al trabajo posterior, y por tanto la mayora de este trabajo posterior a de reimplementarse. No corregir el error significa que el sistema no podr satisfacer al cliente y que puede incluso no ser utilizado. o Etapa 2: Diseo conceptual de la BD: implica dos actividades paralelas: a) Diseo del esquema conceptual: a partir de los requerimientos de datos (resultantes de la Etapa recoleccin y anlisis de requerimientos), se produce el esquema de BD conceptual mediante el uso de un modelo de datos de alto nivel, independiente del SGBD. Esta independencia es importante para que el SGBD no influya en el diseo del esquema conceptual, permitindole un entendimiento completo de la estructura, el significado, los vnculos y las relaciones, adems para que la eleccin posterior del SGBD no altere el esquema conceptual. Aqu es importante usar un modelo de datos de alto nivel que tenga las siguientes caractersticas: Expresividad: que pueda distinguir los distintos tipos de datos, vnculos y restricciones. Sencillez y compresin: para que los usuarios no especialistas comprendan y usen sus conceptos. Minimalidad: que tenga un nmero mnimo de conceptos bsicos con significado distinto. Representacin grfica: para que el esquema conceptual sea fcil de interpretar. Formalidad: los conceptos deben definirse con exactitud y sin que haya posibilidad de confusin. Para disear un esquema conceptual, debemos identificar los componentes bsicos del esquema, los tipos de entidades, los tipos de vnculos, sus atributos, los atributos claves, la cardinalidad y las restricciones de participacin en los vnculos. Este diseo se deriva de los requerimientos recabados durante la Etapa de recoleccin y anlisis de requerimientos. Hay dos enfoques para el diseo conceptual: Enfoque centralizado: los requerimientos se combinan y a continuacin se disea un solo esquema, cuando los usuarios son muchos es una tarea laboriosa y lenta.

43

Teora de la Informacin II

Salazar German & Correa Monica

Enfoque de integracin de vistas: no se fusionan los requisitos y a continuacin se disea un esquema, para cada grupo de usuarios o aplicacin teniendo en cuenta sus requerimientos. Luego estos esquemas se combinan o integran para formar un esquema conceptual global para toda la BD. b) Diseo de transacciones: su propsito es disear las caractersticas de las transacciones conocidas de la BD con independencia del SGBD. Por lo general, los diseadores saben que transacciones y aplicaciones conocidas se ejecutarn en la BD, por lo tanto es importante especificar las caractersticas funcionales de estas transacciones en una etapa temprana del proceso de diseo, lo cual garantizar que el esquema incluir toda la informacin requerida por dichas transacciones. Las transacciones pueden agruparse en tres grandes categoras: Transacciones de recuperacin: obtiene datos para exhibirlos en pantalla o en un informe. Transacciones de actualizacin: introducen datos nuevos o modifica datos existentes. Transacciones mixtas: se utilizan en aplicaciones complejas que obtienen y actualizan los datos. Es conveniente llevar a cabo en forma paralela el diseo del esquema conceptual y el diseo de transacciones, mediante ciclos de retroalimentacin para refinar, hasta lograr un diseo estable del esquema y las transacciones. Etapa 3: Eleccin del SGBD: la eleccin del SGBD depende de varios factores: Factores tcnicos: debe cumplir con las condiciones especficas para las tareas en cuestin. Lo que debemos considerar es el tipo de SGBD (jerrquico, red, relacional), las estructuras de almacenamiento y caminos de acceso que maneja el SGBD, las interfaces de los usuarios y programadores, los tipos de lenguaje de consulta de alto nivel, etc. Factores econmicos: al escoger un SGBD debemos considerar los siguientes costos: Costo de adquisicin de software: es un gasto inicial que varia segn las caractersticas del S.O que se utilizara, el lenguaje, la interfaz grafica del usuario (GUI,Gragic User Interface), opciones de recuperacin/respaldo y documentacin, etc. Costo de mantenimiento: es el costo del servicio de mantenimiento del proveedor para la actualizacin de la versin del SGBD. Costo de adquisicin de hardware: es la compra de recursos adicionales (RAM, HDD, controladores, terminales).

43

Teora de la Informacin II

Salazar German & Correa Monica

Costo de creacin y conversin de BD: es el costo para crear un sistema de BD desde cero o bien convertir uno existente al nuevo software de SGBD. Es difcil de pronosticar este costo y con frecuencia se subestima. Costo de personal: dado que se adopta un sistema nuevo se ve necesario crear puestos nuevos para el ABD y para su personal, esto sucede cuando se incorpora por primera vez un SGBD. Costo de capacitacin: casi siempre es preciso capacitar al personal para el uso y programacin del SGBD adquirido. La capacitacin es necesaria en todos los niveles (Programacin, Desarrollo de aplicaciones, Administracin de la BD). Costo de operacin: no se lo incluye en la evaluacin de las alternativas porque es independiente del SGBD que se seleccione.

Factores de organizacin: se distinguen los siguientes: Estructura de datos: si los datos que se almacenan en la BD tienen una estructura jerrquica, deber considerarse un sistema jerrquico. Si los datos tienen muchos vnculos, ser un SGBD de red o relacional. Disponibilidad de servicios del proveedor: es conveniente que exista una oficina de proveedores cercana para ayudar a resolver cualquier problema que presente el sistema.

Antes de adquirir un SGBD, la organizacin debe tener en cuenta la configuracin de hardware y software que se requiere para su ejecucin. Tambin deber considerarse la necesidad de aplicaciones para respaldo, recuperacin, rendimiento, integridad y seguridad. o Etapa 4: Diseo lgico de la BD, transformacin al modelo de datos: consiste en crear un esquema conceptual y esquemas externos en el modelo de datos del SGBD elegido. Esto se logra transformando el esquema conceptual y externo producido en el diseo del esquema conceptual del modelo de datos de alto nivel al modelo de datos del SGBD. La transformacin se establece en dos etapas: Transformacin independiente del sistema: no considera como el SGBD implementa el modelo de datos. Adaptacin de los esquemas a un SGBD especfico: aqu se ajustan los esquemas obtenidos en el paso anterior para adaptarlos a las caractersticas especficas del modelo de datos del SGBD seleccionado.

43

Teora de la Informacin II

Salazar German & Correa Monica

Etapa 5: Diseo fsico de la BD: el diseo fsico de la BD es el proceso de seleccin de estructuras de almacenamiento y caminos de acceso especficos para que los archivos de la misma tengan un buen rendimiento con las diversas aplicaciones de la BD. Los SGBD ofrecen varias opciones de organizacin de archivos y caminos de acceso. Se utilizan los siguientes criterios para guiar la eleccin de opciones de diseo fsico: Tiempo de respuesta: es el tiempo que transcurre entre la introduccin de la transaccin y la obtencin de una respuesta. Aprovechamiento de espacio: se refiere a la cantidad de espacio de almacenamiento que ocupan los archivos y sus estructuras de acceso. Productividad de las transacciones: es el promedio de transacciones que la BD puede procesar por minuto. Etapa 6: Implementacin y ajuste del sistema de BD: comprende el proceso de escritura de la definicin conceptual interna y externa de la BD, crear los ficheros de la BD e implementar el software.

Objetivos del diseo de base de datos por etapa o Etapa 1: Obtencin y anlisis de requisitos: clarificar los requisitos que debe poseer el sistema. o Etapa 2: Diseo conceptual de la BD: producir un esquema conceptual de la BD que sea independiente de un SGBD especifico. o Etapa 3: Eleccin de un SGBD: seleccin de un SGBD apropiado segn los factores tcnicos, econmicos y de organizacin. o Etapa 4: Diseo lgico de la BD: disear un esquema conceptual y esquemas externos segn el SGBD elegido. o Etapa 5: Diseo Fsico de la BD: seleccionar estructuras de almacenamiento y caminos de acceso especficos que brinden un buen rendimiento con las aplicaciones. o Etapa 6: Implementacin y ajuste del sistema de BD: carga de los datos y la implementacin de las aplicaciones VISION DE USUARIO Y DE CONTEXTOS El problema principal del diseo de una BD, se encuentra en el identificador de las identidades, vnculos y atributos. Para resolver este problema se usa: 1) Visin del usuario: es una descripcin lgica de la informacin requerida por los usuarios. Un usuario puede tener mltiples visiones y mltiples usuarios pueden compartir una visin. 2) Visin de contexto: es un conjunto de sentencias que describen la organizacin, sus recursos y su modo de operacin. Esta visin tiende a completar la anterior, aportando conocimiento sobre las estructuras de datos, ya que explica las vinculaciones entre las mismas.

43

Teora de la Informacin II

Salazar German & Correa Monica

OBTENCION DE LAS VISIONES Las visiones pueden ser obtenidas a travs de: 1) 2) 3) 4) 5) 6) Entrevistas con usuarios finales. Entrevistas con funcionarios no usuarios. Analizando los informes emitidos. Analizando las pantallas de procesamiento. Analizando la BD ya implementada. Analizando archivos y transferencias de datos entre programas ya implementados. 7) Observacin. DISEO LOGICO El diseo lgico es complejo, porque hay que encontrar entre distintos factores. Un factor podra expresarse como posibilidad vs performance. Por diseo se entiende el generar un conjunto de esquemas de relaciones que permiten almacenar la informacin con mnima redundancia, pero al mismo tiempo, facilitar su recuperacin. OBJETIVOS DEL DISEO LOGICO Cuando mltiples usuarios, a travs de mltiples procesos de diferentes caractersticas interactan con una misma BD, pueden ocasionar situaciones de incompatibilidad en los aspectos de performance, seguridad e integridad de datos. La solucin a dichos conflictos es uno de los objetivos del diseo lgico. PROPIEDADES DEL DISEO LOGICO El diseo lgico debe presentar las siguientes propiedades: 1) 2) 3) 4) 5) 6) 7) Satisfaccin del usuario. Satisfacer la necesidad y la organizacin. Flexibilidad frente a cambios y crecimiento. Integridad. Seguridad y confiabilidad de la informacin. Performance global del sistema, costo operativo. Factibilidad de operacin.

43

Teora de la Informacin II

Salazar German & Correa Monica

UNIDAD V BASES DE DATOS DISTRIBUIDAS Una BD distribuida es una coleccin de datos que pertenece lgicamente al mismo sistema pero que est dispersa fsicamente entre los sitios de una red de computadora. Como ventajas de la BD distribuida podemos nombrar las siguientes: 1) La naturaleza distribuida de algunas aplicaciones de BD: muchas de estas aplicaciones estn distribuidas naturalmente en diferentes lugares. Por ejemplo, un banco puede tener mltiples sucursales. Es natural que las BD empleadas para ese uso estn distribuidas en esas sucursales. Muchos usuarios locales tienen acceso exclusivamente a los datos que estn almacenados en varias de esas sucursales. Las fuentes de los datos y la mayora de los usuarios y usos de la BD local residen fsicamente en ese lugar. 2) Mayor fiabilidad y disponibilidad: la fiabilidad se define como la probabilidad de que un sistema est en funcionamiento en un momento determinado, y la disponibilidad, es la probabilidad de que el sistema est disponible continuamente durante un intervalo de tiempo. Cuando los datos y el software del SGBD estn distribuidos en varios sitios (se han replicado), cuando un sitio falle los dems seguirn operando, y solo los datos y el software que fallaron estarn inaccesibles. En un sistema centralizado el fallo de un sitio hace que el sistema deje de estar disponible para todos los usuarios. 3) Posibilidad de comparar los datos al tiempo que se mantienen en un cierto grado de control local: en algunos tipos de SGBD distribuidos es posible controlar los datos y el software localmente en cada sitio. Adems los usuarios de otros sitios remotos pueden tener acceso a ciertos datos a travs del software del SGBD distribuido. Esto hace posible el compartimiento controlado de los datos con todo el sistema distribuido (los locales y los de otros sitios remotos). 4) Mejor rendimiento: cuando una BD grande est distribuida en mltiples sitios, hay BD ms pequeas en cada uno de estos. En consecuencia, las consultas locales y las transacciones que tienen acceso a datos de un solo sitio tienen un mejor rendimiento porque las BD locales son muy pequeas, el nmero de transacciones de cada sitio es menor que si todas las transacciones se enviaran a una BD Centralizadas. Si las transacciones implican acceso a ms de un sitio pueden efectuarse en paralelo reducindose as el tiempo de respuesta. Para obtener estas ventajas, el software del SGBD distribuido debe contar con las funciones de un SGBD centralizado y adems con las siguientes: La capacidad de tener acceso a sitios remotos y trasmitir consultas y datos entre los diversos sitios a travs de una red de comunicaciones. La capacidad de seguir la pista a la distribucin y la replicacin de los datos en el catlogo del SGBD.

43

Teora de la Informacin II

Salazar German & Correa Monica

La capacidad de elaborar estrategias de ejecucin para consultas y transacciones que tienen acceso a datos de ms de un sitio. La capacidad de decidir a cul copia de un elemento de informacin replicado se tendr acceso. La capacidad de mantener la consistencia de las copias de un elemento de informacin replicado. La capacidad de recuperarse de cadas de sitios individuales y de nuevos tipos de fallos, como el fallo de enlace de comunicacin.

En el nivel fsico (hardware), los principales factores que distinguen un SGBD de un sistema centralizado son los siguientes funciones: Hay mltiples computadores, llamados sitios o nodos.

...
SERVIDOR CLIENTE CLIENTE CLIENTE SERVIDOR

Sitio 1

Sitio 2

Sitio 3

Sitio 4

Red de Comunicaciones Arquitectura fsica cliente-servidor simplificada para un SGBD.

Estos sitios deben estar comunicados por medio de algn tipo de red de comunicaciones para trasmitir datos y ordenes entre los sitios.

Los sitios pueden estar fsicamente muy cerca (mismo edificio) y conectados a travs de una red de rea local, o pueden estar distribuidas a grandes distancias (distintos pases) y conectados a travs de una red de larga distancia (telfono o satlite)
CLIENTE CLIENTE

...

CLIENTE

Red de Comunicaciones

SERVIDOR

SERVIDOR

43 ...

SERVIDOR

Arquitectura Lgica cliente-servidor para un

Teora de la Informacin II

Salazar German & Correa Monica

TIPOS DE SISTEMAS DE BASES DE DATOS DISTRIBUIDAS 363pag.segunda edicion Los SGBD distribuidos presentan muchas diferencias entre si. El punto principal que todos estos sistemas tienen en comn es el hecho de que los datos y el software del SGBD estn distribuidos en sitios conectados por una red de comunicacin. Podemos tener en cuenta para ello, sus factores: 1) El primer factor que consideramos es el grado de homogeneidad del software del SGBD distribuido, si todos los servidores (o SGBD individuales) utilizan software idntico y todos los clientes emplean aplicaciones idnticas, se dice que el SGBD distribuido es homogneo, caso contrario es heterogneo. 2) Otro factor relacionado con el grado de homogeneidad es el grado de autonoma local. Si todo acceso al SGBD distribuido debe hacerse a travs de un cliente, el sistema no tiene autonoma local. Por otro lado, si se permiten las transacciones locales con acceso directo al servidor, el sistema tendr un cierto grado de autonoma local (federados). 3) Un tercer aspecto que sirve para clasificar las BD distribuidas es el grado de transparencia de la distribucin o de manera alternativa, el grado de integracin de los esquemas. Si el usuario percibe un solo esquema integrado sin informacin alguna relativa a la fragmentacin, se dice que el SGBD distribuido tiene alto grado de transparencia de distribucin (o de integracin de esquema). Por otro lado, si el usuario puede ver toda la fragmentacin, el reparto y la replicacin, el SGBD distribuido no tiene transparencia de distribucin ni integracin de esquema. En este caso el usuario debe hacer copias especficas de fragmentos en sitios especficos, anexando el nombre del sitio como prefijo de cada nombre de fragmento. En un SGBD distribuido se debe Fragmentacin: es la tcnica partir de la cual se divide dar un nombre lo cual hace ms complejo a dichoa sistema. la BD en unidades lgicas llamadas fragmentos y son Homogneo:en cuando todos los servidores utilizanpuede el almacenadas diversos sitios. La fragmentacin mismo software. ser: Horizontal: un fragmento horizontal de una relacin es un Tipos de BD Heterogneo: cuando cada desarrolla su propio subconjunto de tuplas de esa uno relacin. distribuidas software. Vertical: una fragmentacin vertical de una relacin Tcnicas de mantiene solo ciertos atributos de la relacin. Federados: cuando tienen cierto de autonoma Mixta: podemos entremezclar los grado dos tipos de fragmentacin, fragmentacin para obtener una fragmentacin mixta. local. replicacin y reparto para Replicacin: si un se almacena en ms de un Transparencia de fragmento la Distribucin. SGBD sitio, se dice que est replicado. Resulta til para mejorar la disponibilidad de datos. Replicacin total: toda la BD est replicada en todos los sitios del sistema distribuido. Replicacin parcial: algunos fragmentos de la BD pueden 43y otros no. estar replicados Reparto: cada fragmento se debe asignar a un sitio

Teora de la Informacin II

Salazar German & Correa Monica

TIPOS DE USUARIOS FINALES Podemos distinguir los siguientes cuatro tipos: 1) Usuarios finales espordicos: tienen acceso de vez en cuando a la BD, posiblemente requiriendo informacin diferente en cada ocasin. Por ejemplo, el gerente. 2) Usuarios finales simples: consultan y actualizan constantemente la BD utilizando tipo Standard para estas operaciones (transacciones programadas). 3) Usuarios finales avanzados: son ingresos, cientficos, etc., que conocen los recursos del SGBD para satisfacer sus complejos requerimientos. 4) Usuarios autnomos: utilizan BD personalizadas gracias a los paquetes de programas comerciales. SEGURIDAD Y AUTORIZACION EN BASES DE DATOS. TIPOS DE SEGURIDAD Los tipos de seguridad de las BD abarcan un rea amplia, entre ellas las siguientes: Cuestiones ticas y legales relativas al derecho a tener acceso a cierta informacin. Es posible que parte de sta se considere privada y que las personas no autorizadas no puedan tener acceso a ella legalmente. Cuestiones de poltica en el nivel gubernamental, institucional o corporativo, relacionadas con las clases de informacin que no deben estar disponibles para el pblico. Cuestiones relacionadas con el sistema, como los niveles de sistema en los que deben manejarse las diversas funciones de seguridad. La necesidad de algunas organizaciones de identificar mltiples niveles de seguridad y clasificar los datos y los usuarios segn estos niveles.

Actualmente, se acostumbra hablar de 2 tipos de mecanismos de seguridad en las bases de datos: Los mecanismos de seguridad direccionales: se usan para otorgar privilegios a los usuarios, incluida la capacidad de tener acceso a

43

Teora de la Informacin II

Salazar German & Correa Monica

archivos, registros o campos de datos especficos en un determinado modo (como modo lectura, de escritura o de actualizacin). Los mecanismos de seguridad obligatorios: sirven para imponer seguridad de mltiples niveles clasificando los datos y los usuarios en varias clases (o niveles) de seguridad e implementando despus la poltica de seguridad apropiada de la organizacin.

Otro mecanismo de seguridad es el cifrado de datos, que sirve para proteger datos confidenciales que se transmiten por satlite o por algn otro tipo de red de comunicaciones o por algn otro tipo de red de comunicaciones. As mismo, el cifrado puede proveer de proteccin adicional a secciones confidenciales de una BD. Los datos se codifican mediante algn algoritmo de codificacin. LA SEGURIDAD DE LA BD Y EL ABD El administrador de la BD (ABD) es la autoridad central que controla un sistema de este tipo. Entre las obligaciones del ABD estn la de otorgar privilegios a los usuarios que necesitan usar el sistema y clasificar los usuarios y los datos de acuerdo con la poltica de la organizacin. El ABD tiene una cuenta privilegiada en el SGBD, a veces denominada cuenta del sistema, que confiere capacidades extraordinarias no disponibles para las cuentas y usuarios ordinarios de la BD. Las rdenes privilegiadas del ABD incluyen rdenes para otorgar o revocar privilegios a cuentas individuales, usuarios o grupos de usuarios, y para efectuar los siguientes tipos de acciones: Creacin de cuentas: esta accin crea una nueva cuenta y contrasea para un usuario o grupo de usuarios, a fin de que puedan tener acceso al SGBD. Concesiones de privilegios: esta accin permite al ABD otorgar ciertos privilegios a ciertas cuentas. Revocacin de privilegios: esta accin permite al ABD revocar (cancelar) ciertos privilegios que se haban concebido previamente a ciertas cuentas. Asignacin de niveles de seguridad: esta accin consiste en asignar cuentas de usuarios al nivel apropiado de clasificacin de seguridad. El ABD es el responsable de la seguridad global del sistema de BD. PROTECCION DE ACCESO, CUENTAS DE USUARIOS Y AUDITORIAS DE LA BASE DE DATOS Siempre que un usuario tenga necesidad de informacin de un determinado sistema, el ABD puede otorgarle una cuenta y una contrasea con la que se loguear en dicho sistema. El ABD tendr una tabla donde consigne estos datos. El sistema tambin deber llevar un control con todas las sesiones y operaciones del usuario que tendr un registro por accin.

43

Teora de la Informacin II

Salazar German & Correa Monica

Esto sirve a la hora de auditar un sistema donde existen grandes transacciones y muchos usuarios. La bitcora de la BD que la usa para fines de seguridad suele recibir el nombre de registro de intervenciones. CONTROL DE ACCESO DISCRECIONAL BASADO EN PRIVILEGIOS El mtodo ms comn para imponer el control de acceso discrecional en un sistema de BD consiste en otorgar y revocar privilegios, funcin que ser ejercida por el ABD. En SQL2, con el concepto de identificador de autorizacin se hace referencia a una cuenta de usuario, y se utiliza como sinnimo de ella a las palabras cuenta o usuario. El SGBD debe ofrecer acceso selectivo a cada relacin de la BD. En trminos informales, hay dos niveles de asignacin de privilegios para usar el sistema de BD: 1) El nivel de cuenta: en este nivel, el ABD especifica los privilegios particulares que tiene cada usuario, independientemente de las relaciones de las BD. 2) El nivel de relacin: en este nivel, podemos controlar el privilegio para tener acceso a cada relacin o vista individual de la BD.

DIFERENCIA ENTRE EL ENFOQUE DE BASE DE DATO Y EL ENFOQUE TRADICIONAL DE ARCHIVOS ENFOQUE DE BASE DE DATOS ENFOQUE TRADICIONAL DE ARCHIVOS Almacn de datos que se definen una sola vez y tienen acceso muchos usuarios Varios lenguajes Mas costoso Ms seguro Mayor complejidad del diseo La descripcin de la BD se almacena en el Catlogo Independencia con respecto a los programas, lo que permite modificar Archivos sin modificar los programas Mltiples usuarios y mltiples Cada usuario define e implementa los archivos necesarios para cada aplicacin Lenguaje nico Menos costoso Menos seguro Menor complejidad de diseo La descripcin de los datos suele ser parte de los programas de aplicacin La modificacin de los archivos requiere modificar los programas nico usuario y una aplicacin

43

Teora de la Informacin II

Salazar German & Correa Monica

aplicaciones a la vez

En el enfoque tradicional de archivos cada usuario define e implementa los archivos requeridos para una aplicacin especfica, no pudiendo usar los datos de los archivos de otros usuarios. Esto ocasiona una redundancia la cual trae aparejada un desperdicio de espacio y de esfuerzo para mantener actualizados los datos comunes. En el enfoque de bases de datos se mantiene un nico almacn de datos que se define una sola vez y al cual tienen acceso muchos usuarios. Las principales caractersticas del enfoque de BD, en comparacin con el enfoque tradicional de archivos son: 1) Naturaleza auto descriptiva de los sistema de BD a. Enfoque de BD: El enfoque de BD contiene una descripcin completa de la BD, la cual se almacena en el Catlogo del Sistema. Esta informacin se denomina METADATOS, los cuales describen la Estructura de la BD (Estructura de los archivos, tipo, formato y restriccin de los datos). El SGBD, y a veces los usuarios, consultan el catlogo para informarse sobre la estructura de la BD para poder trabajar con las aplicaciones. As el SGBD puede acceder a diversas BD. b. Enfoque tradicional de archivos: En el enfoque tradicional de archivos, la descripcin de los datos es parte de los programas, por lo tanto, dichos programas solo pueden trabajar con una BD especfica. 2) Separacin entre los programas y los datos a. Enfoque de BD: los programas de acceso del SGBD son independientes de los archivos. La estructura de los archivos se almacena en el catlogo, aparte de los programas de acceso. Esta propiedad se llama Independencia con respecto a los programas y datos. b. Enfoque tradicional de archivos: la estructura de los archivos est integrada en el programa de acceso, por lo tanto, cualquier modificacin en la estructura de un archivo puede requerir modificacin del programa que tiene acceso a dicho archivo. 3) Manejo de mltiples vistas de los datos a. En el enfoque de BD, los SGBD multiusuario cuyos usuarios tienen varias aplicaciones proporcionan mecanismos para definir muchas vistas diferentes de BD. 4) Compartimiento de datos y procesamiento de transacciones multiusuario a. En el enfoque de BD, los SGBD debe incluir un software de control de concurrencia para que las actualizaciones de los mismos datos se realice de manera controlada. Estas son llamadas aplicaciones de procesamiento de transacciones, las cuales aseguran que las

43

Teora de la Informacin II

Salazar German & Correa Monica

transacciones concurrentes se realicen de manera correcta sin interferencias. COMPARACION DE LOS TRES MODELOS DE DATOS DE REPRESENTACION O IMPLEMENTACION MODELO DE DATOS MODELO DE DATOS DE MODELO DE DATOS RELACIONAL RED JERARQUICO Los datos y relaciones entre ellos se representan mediante un conjunto de tablas. Los datos se representan mediante un conjunto de registros y las relaciones mediante enlaces (los tipos de registros se organizan mediante grafos orientados). Grafos orientados. Las consultas se realizan a travs de lgica de grafos. Los datos se representan mediante un conjunto de registros y las relaciones entre estos mediante enlaces. Los registros se organizan como una coleccin de rboles. Estructuras jerrquicas (rboles). Las consultas se realizan a travs de lgica de rboles.

Tablas: columnas (atributos) y filas (registros). Las consultas se realizan a travs del lgebra Relacional y Clculo Relacional.

43

Вам также может понравиться