Вы находитесь на странице: 1из 18

Bases de Datos

1. Sistema de informacin Un Sistema de Informacin es dinmico, sujeto a influencias de cambio de informacin. Tambin es relativo ya que dentro de una empresa hay varios sistemas de informacin. Todo tipo de informacin ha de poseer las siguientes cualidades: -

Precisin: Lo ms correcta posible. Oportunidad: Disponer de ella en el momento preciso. Complecin: Ha de ser completa para cumplir sus fines. Informacin significativa: Que est dentro de ese contexto.
- Confidencialidad.

Seguridad: Ha de estar protegida


-Integridad.

Componentes de un Sistema de informacin: -

Equipo Fsico (Hardware) -Sistema Operativo. Soporte Lgico (Software) -Sistema Gestor de Base de Datos. - Ficheros: Orientacin Procesos.

Contenido/Datos - BD: Orientacin Datos, la Base de D. va a estar unificada. Administrador: Administrador de Datos y Administradores Informticos. Usuarios: Informticos y no informticos.

Fichero: Estructura de dato que reside en una memoria secundaria, y est formado por un conjunto de
informacin estructurado en unidades de acceso denominadas Registros Lgicos.

Registro Lgico: Cada uno de los componentes del fichero que poseen una estructura idntica para
todos ellos con objeto de almacenar la informacin referente al tema del archivo, o bien el objeto del cual se necesita la informacin. Construye la mnima unidad de acceso.

Campo de Datos: Conjunto de caracteres que representa la mnima informacin a la que se puede
hacer referencia en un tratamiento o proceso, es cada uno de los datos que constituye el registro lgico.

Campo Clave: Es el campo del registro lgico cuyo valor sirve para identificar el registro al que
pertenece. Se utiliza para localizar un registro concreto dentro del fichero. Pgina 1 de 18

Registro fsico: Es una unidad de informacin que se transfiere desde un soporte de almacenamiento
externo a la memoria interna en una sola operacin de entrada/salida.

Factor de Bloqueo: Es el nmero de Registros Lgicos que hay en un registro Fsico. Tipos de Ficheros segn su organizacin Organizacin de archivos: modo o manera como se encuentran colocados los registros sobre el
soporte.

Mtodo de acceso: Procedimiento necesario para situarse en un registro determinado para realizar
una operacin de lectura/escritura sobre el mismo. Los bsicos son el secuencial y el directo.

Acceso secuencial: Cuando para usar un registro se tienen que leer obligatoriamente todos los
anteriores.

Tipos de organizacin
Secuencial Secuencial indexada Relativa (puede ser directa o aleatoria)

Organizacin Secuencial
Decimos que un archivo tiene una organizacin secuencial cuando los registros se graban en un soporte externo en posiciones contiguas y en el mismo orden en que se encuentran. o o Orden fsico: orden en que se almacenan los registros. Orden lgico: Orden de acuerdo al campo clave.

En este tipo de ficheros es habitual la operacin de clasificacin/ordenacin. Es decir, reordenar los registros del fichero segn el campo clave para facilitar la bsqueda (evitando que compruebe todo el fichero para buscar un registro). No coinciden Orden lgico y fsico.

Organizacin Secuencial Indexada


Se compone de tres reas o zonas y se puede construir a partir de un fichero secuencial.

1. rea primaria: En ella se graban los registros por orden ascendente de su clave en el
momento de la creacin del fichero, por tanto el orden lgico y el orden fsico coinciden. Esta zona est dividida en segmentos, en cada uno de los cuales se almacenan cierto nmero de registros consecutivos. El acceso a cada segmento es directo, y dentro de cada segmento el acceso es secuencial.

2. rea de ndices: Tiene la estructura de un archivo de organizacin secuencial con dos campos
por registro. Uno de los campos contiene la clave del ltimo registro de cada segmento. El otro campo contiene la direccin de cada uno de los segmentos del rea primaria.

3. rea de desbordamiento (overflow): Esta zona est vaca en el momento de la creacin del
fichero y sirve para almacenar registros en la actualizacin (altas de registro) del fichero. Pgina 2 de 18

En este tipo de ficheros existe la reorganizacin.

Campo puntero: Nos indica en qu direccin se


encuentra el siguiente registro segn el orden lgico. El tipo de bsqueda es: Secuencial en el ndice, directo al segmento y secuencial dentro de este.

Organizacin Relativa
Los registros se colocan sobre el soporte teniendo en cuenta una posicin relativa que se obtiene aplicando a su clave un algoritmo de transformacin. Por lo tanto, la posicin que ocupa un registro dentro del fichero no depende del orden temporal en que haya sido grabado, si no nicamente del valor de su clave. Orden lgico y orden fsico no coincidentes. El algoritmo lo decide el programador en funcin de las caractersticas que presenten las claves de un archivo concreto. Si la clave no precisa ninguna transformacin para corresponder con una posicin del fichero, el fichero se llama directo. En caso contrario, se le llama aleatorio. Ejemplo de algoritmo directo: Clave= direccin (el problema de esto es que pueden quedar espacios vacos de memoria. Ejemplo de algoritmo aleatorio: Dividir las claves entre un mismo valor para calcular la direccin. (El problema es que se pueden dar los llamados REGISTROS SINNIMOS, es decir, que dos o ms claves tengan la misma direccin. Por ejemplo si el algoritmo fuese dividir entre 5 la clave, las claves 15, 18 y 19 coincidiran en la direccin 3). A la hora de crear un algoritmo para una organizacin aleatoria, hay que tener en cuenta un tratamiento de sinnimos. Por ejemplo en el caso anterior, podra leer las posiciones antes de grabar y en caso de coincidir, mandar el nuevo registro a una zona de overflow en lugar de sobrescribir. Otro ejemplo sera incorporar un campo ms a cada registro, cuyo contenido sea un cdigo que indique si est ocupado, libre o dado de baja. 2. De los Ficheros a las Bases de Datos Si analizamos la situacin de algunos sistemas de informacin, podemos encontrar sistemas en los que existe una proliferacin de ficheros. Estos datos se recogen varias veces y se encuentran repetidos en los distintos archivos, esta Redundancia adems de malgastar recursos origina a menudo divergencias en los resultados dando lugar a inconsistencias.

Pgina 3 de 18

Redundancia: o

Inconsistencia: A menudo provocada por la Redundancia. Un dato, est almacenado en


diversos sitios pero no posee la misma informacin. Esta inconsistencia siempre provoca falta de integridad.

o o

Falta de Integridad: La informacin, al no ser correcta, prueba que el sistema es poco fiable. Se requiere de ms espacio de almacenamiento: Repeticin de Entradas y Validaciones. Mayor dificultad de mantenimiento.

Incremento del tiempo de proceso.

Dependencia entre Datos y Programa, esto implica una Reprogramacin, es decir tengo que modificar el programa. No satisface demandas inesperadas de informacin Los datos no estn interrelacionados.

3. Ventajas y Desventajas las Bases de Datos respecto a los Ficheros Ventajas: o o o o o o o Independencia de los datos respecto al tratamiento y viceversa. Coherencia de los resultados. Mejor disponibilidad de los datos. Mayor Valor Informativo. Mejor y ms normalizada documentacin de la informacin, la cual est integrada en los datos. Mayor eficiencia en la recogida, validacin e introduccin de los datos en el sistema. Requiere de menor espacio de almacenamiento.

Desventajas: o o o o o o Instalacin costosa. Requiere de Personal Especializado. Implantacin larga y difcil. Falta de Rentabilidad a corto plazo. Escasa estandarizacin, cada vez hay ms. Desfase entre Teora y Prctica.

4. Concepto de Base de Datos

Christopher J. Date:
Coleccin de datos, almacenados de forma integrada en un soporte de acceso directo y que pueden ser compartidos por varios usuarios y programas autorizados para ello.Los datos deben estar interrelacionados y estructurados con el modelo capaz de recoger el mximo contenido semntico.

Pgina 4 de 18

Adoracin de Miguel:
Coleccin o depsito de datos integrados, almacenados en soporte secundario (no voltil) y con redundancia controlada. Los datos, que han de ser compartidos por diferentes usuarios deben mantenerse independientes de ellos, y su definicin (estructura de la base de datos) nica y almacenada junto con los datos, se ha de apoyar en un modelo de datos, el cual ha de permitir captar las interrelaciones y restricciones existentes en el mundo real. Los procedimientos de actualizacin y recuperacin, comunes y bien determinados facilitarn la seguridad del conjunto de datos. Caractersticas esenciales de una base de datos: Los datos estn interrelacionados y estructurados de acuerdo con un modelo capaz de recoger el mximo contenido semntico. La redundancia debe ser controlada de forma que no existan duplicidades perjudiciales ni innecesarias. Esto quiere decir que en la base de datos no debe existir redundancia lgica, pese a que si admite redundancia fsica. (Y es la propia base de datos la que actualiza todas las entradas que estn repetidas, a este proceso se le conoce como: Propagacin de las Actualizaciones. Han de atender a mltiples usuarios y a diferentes aplicaciones. Independencia tanto fsica como lgica, entre datos y tratamientos. Estructura de la base de datos debe ser nica y estar integrada con los mismos datos. La actualizacin y recuperacin de los datos debe realizarse mediante procesos bien determinados. El Sistema de Gestin de Bases de Datos (SGBD) es el conjunto de programas que permiten la implantacin, acceso y mantenimiento de la base de datos. El SGBD junto con la base de datos y los usuarios, constituyen el Sistema de Base de Datos. 5. Distintos niveles de abstraccin de una Base de Datos Uno de los objetivos del SGBD es proporcionar a los usuarios una visin abstracta de la informacin, es decir, ocultar ciertos detalles referentes a la forma en que los datos se almacenan y mantiene, pero siempre permitiendo una recuperacin eficaz de la informacin.

Pgina 5 de 18

Existen varios paquetes de SGBD en el mercado con diferentes arquitecturas; una de ellas, la ms estandarizada, es la que cumple los requerimientos de la normativa ANSI/X3/SPARC (Comit de Planificacin y Requerimientos del Instituto Nacional de Estados Unidos de Estndares en Computacin y Procesamiento de la Informacin en su divisin X3) establece que la arquitectura de una base de datos debe poseer tres niveles de abstraccin: INTERNO, CONCEPTUAL Y EXTERNO; cada uno de ellos pertenece a un tipo de vista diferente: el de almacenamiento fsico, del programador y del usuario, respectivamente. NIVEL INTERNO: es el nivel ms bajo de abstraccin de una base de datos. Se ven los datos tal como estn almacenados. Este nivel es descrito por el SGBD por medio de un esquema interno o vista interna. El esquema interno emplea un modelo fsico de datos y describe todos los detalles para su almacenamiento. NIVEL CONCEPTUAL: representa la estructura lgica y global de la informacin de la empresa. El nivel conceptual define un esquema conceptual que describe la estructura de toda la base de datos para una comunidad de usuarios. El esquema conceptual oculta los detalles de las estructuras fsicas de almacenamiento y se concentra en describir entidades, tipos de datos, vnculos, operaciones y restricciones. En este nivel se usa el modelo de datos de alto nivel. A este nivel se debe realizar la descripcin de todos los datos y las interrelaciones entre ellos. NIVEL EXTERNO: es el nivel ms alto de abstraccin y por ello el ms cercano al usuario. A este nivel se definen esquemas externos o vistas de usuarios. Cada uno de estos esquemas describe la parte de la base de datos que interesa a un usuario o grupo de usuarios determinado, y oculta a ese grupo el resto de la base de datos. Puede haber usuarios que acceden a ms de un esquema externo y un esquema externo puede ser utilizado por ms de un usuario. Para cada base de datos hay un nico esquema interno, un nico esquema conceptual, pero puede haber varios externos. Los esquemas que se obtienen a los tres niveles no son ms que descripciones de los datos; los nicos datos que existen realmente estn en el nivel fsico.

En un SGBD basado en este tipo de arquitectura, cada grupo de usuarios hace referencia exclusivamente a su propia esquema externo; por ello, el SGBD debe transformar una solicitud

expresada en trminos de un esquema externo a una solicitud expresada en trminos de esquema conceptual y luego a una solicitud en el esquema interno que se procesar sobre la base de datos almacenada.
El proceso de transformar solicitudes y resultados de un nivel a otro se denomina CORRESPONDENCIA O TRANSFORMACIN (MAPPING). TRANSFORMACIN DE DATOS El SGBD con tres niveles de abstraccin tiene dos niveles de transformacin: 1. CONCEPTUAL/INTERNA: permite el paso de la vista conceptual a la base de datos almacenada y viceversa. 2. EXTERNA/CONCEPTUAL: permite el paso de una vista externa especfica a la vista conceptual y viceversa. Pgina 6 de 18

6. Lenguajes de Manipulacin de Datos Es un lenguaje proporcionado por el sistema de gestin de base de datos, que permite a los usuarios mediante una poderosa capacidad de clculo, llevar a cabo consultas o manipulacin de datos, organizados por el modelo de datos adecuado. Los lenguajes de Manipulacin se clasifican por su control: Lenguaje de consultas procedimentales o de bajo nivel: Tipo de lenguaje donde el usuario da rdenes al sistema para que realice una serie de procedimientos u operaciones en la base de datos para calcular un resultado final. Lenguaje de consultas no procedimentales o de alto nivel: El usuario describe la informacin deseada sin ningn procedimiento especfico para obtener la informacin. Se pueden clasificar segn su independencia: Husped: Requiere de un anfitrin para funcionar. Autocontenido: No requiere de ningn lenguaje anfitrin.

Se pueden clasificar segn su uso: Diferido: El lenguaje no nos da respuestas Interactivo: Le hacemos una peticin al sistema, nos da la respuesta, y le volvemos a preguntar. Se pueden clasificar segn su unidad de operacin: Registro a Registro (Navegacional) Conjunto de Registros ( Especificacin)

Interfaces de un SGBD: Basadas en Mens, en Formas, Grficas, de Lenguaje Natural, para usuarios paramtricos y para el DBA. 7. Funciones de los Sistemas Gestores de Bases de Datos El Sistema Gestor posee 3 funciones esenciales: 1. Funcin de Definicin o Descripcin: Debe permitir al diseador especificar los elementos de los datos que lo integran, su estructura y las relaciones que existen entre ellos, las reglas de integridad; as como las caractersticas de tipo fsico y las vas lgicas de los usuarios. a. Nivel Interno: Se ha de indicar el espacio reservado para la base, la longitud de los campos o elementos de datos o su modo de representacin. b. Nivel Externo y Lgica Global: Ha de proporcionar los instrumentos para la definicin de objetos, as como su identificacin, atributos de los mismos, interrelaciones entre

Pgina 7 de 18

ellos, autorizaciones de acceso. Las descripciones de las estructuras lgicas han de estar referidas a la estructura lgica Global. 2. Funcin de Manipulacin: Una vez descrita la base de datos, es preciso cargar los datos en las estructuras previamente creadas con lo que la base de datos estar ya dispuesta para su utilizacin. a. Consultas: i. Totalidad de los datos: en la que se recuperan todos los datos de la base o todos los de un determinado tipo. ii. Consulta selectiva: se tendrn que localizar los registros que cumplan una determinada condicin(Criterio de Seleccin) b. Filtros: consultas y filtros recuperan un subconjunto de registros de una tabla o consulta base. Un filtro se utiliza para visualizar o modificar temporalmente un subconjunto de registros mientras se encuentra en un formulario o en una hoja de datos. c. Actualizaciones i. Insercin: Cuando aparezcan nuevos elementos. ii. Borrado: Han desaparecido algunos elementos (Dar de baja). iii. Modificacin de los Datos: Poner al da datos existentes. 3. Funcin de Control: Rene todas las interfaces que necesitan los diferentes usuarios para comunicarse con las base y proporciona un conjunto de procedimientos para el administrador 8. Clasificacin segn el Modelo de Datos de los SGBD Relacionales: El modelo de datos relacional representa una base de datos como una coleccin de tablas, cada una de las cuales se puede almacenar en forma de archivo individual. Casi todas las bases de datos relacionales tienen lenguajes de consulta de alto nivel y manejan una forma limitada de vistas de usuario. De Red: El modelo de datos de red representa los datos como tipos de registros y tambin representa un tipo limitado de vnculos 1:N, llamado tipo de conjunto. El modelo de red, tambin conocido como modelo CODASYL DBTG, tiene un lenguaje de registro por registro asociado que se debe incorporar en un lenguaje de programacin anfitrin. Jerrquico: El modelo jerrquico representa los datos como estructuras jerrquicas de rbol. Cada jerarqua representa varios registros relacionados entre s. No existe un lenguaje estndar para el modelo jerrquico, aunque la mayor parte de los SGBD jerrquicos cuentan con lenguajes de registro por registro. Orientado a Objetos: El modelo orientado a objetos define una base de datos en trminos de objetos, sus propiedades y sus operaciones. Los objetos con la misma estructura y comportamiento Pgina 8 de 18

pertenecen a una clase, y las clases se organizan en jerarquas. Las operaciones de cada clase se especifican en trminos de procedimientos predefinidos llamados mtodos. Adems, los SGBD relacionales han estado extendiendo sus modelos para incorporar conceptos orientados a objetos y otras capacidades; a stos se les conoce como sistemas relacionales extendidos. 9. Objetivos de los Sistemas Gestores de Bases de Datos Los principales objetivos de un sistema de gestin de bases de datos: 1. Independencia de los datos: Lgica y Fsica : Gran parte de las aplicaciones actuales son dependientes de los datos, lo que significa que la forma en que estn organizados en el dispositivo de almacenamiento secundario y la manera en la que se accede a los mismos dependen en gran medida de la aplicacin, es decir, hay dependencia lgica y fsica. Se llama independencia de los datos a la capacidad de modificar una definicin de esquema en un nivel de arquitectura sin afectar a la definicin del esquema en el nivel inmediatamente superior. a. Independencia Fsica: Es la capacidad de modificar el esquema fsico, tanto en la estructura del archivo como en las caractersticas de los campos, sin obligar a que se vuelvan a escribir los programas de aplicaciones. Para lograr esta independencia es necesario eliminar las definiciones de los archivos de los programas y guardarlas en un esquema aparte. b. Independencia Lgica: Es la capacidad de variar el esquema conceptual sin necesidad de que se vuelvan a escribirlos programas de aplicaciones. Las modificaciones del nivel conceptual son necesarias cuando se cambia la estructura lgica de la base de datos. 2. Reserva y Seguridad: La informacin almacenada en una base de datos es de gran valor para la empresa, por ello debe estar protegida contra su posible prdida o robo. a. Seguridad se refiere a la proteccin de los datos contra el acceso accidental o intencionado de individuos no autorizados y contra su indebida destruccin o alteracin. b. Reserva se refiere al derecho de los individuos y organismos para determinar por ellos mismos cundo, cmo y en qu medida y circunstancias se permitir la comunicacin de la informacin a terceros. 3. Integridad: se refiere a las medidas de seguridad empleadas para conservar correctos los datos. El que los datos no sean correctos se puede deber a: a. Fallos del Hardware b. Defectos del Software c. Actualizacin incompleta d. Insercin de datos nos vlidos Pgina 9 de 18

4. Respaldo y Recuperacin: Es recomendable conservar una copia de seguridad de cada archivo en prevencin de posibles fallos. Al proceso de copiar un archivo de forma peridica para dejar reflejados los cambios habidos se le llama Respaldo. El proceso de utilizar la copia para corregir cualquier tipo de problema se llama Recuperacin. Hay dos mtodos de recuperacin: a. Recuperacin hacia adelante o en avance b. Recuperacin hacia atrs o en retroceso 5. Redundancia mnima y controlada: En un sistema que no utiliza bases de datos, cada aplicacin ejecuta sus archivos particulares, diseados a la medida de sus necesidades, para el procesamiento eficaz de las operaciones de E/S, lo que a menudo origina redundancia en los datos almacenados, con el consecuente aumento de los costes de almacenamiento. Sin embargo, no es conveniente eliminar toda la redundancia, sino mantener a los diferentes archivos ligados entre s por medio de un campo comn. 6. Consistencia de los datos: Es una consecuencia del punto anterior. Si un empleado tiene dos entradas diferentes y una se actualiza y la otra no. Da lugar a un error en la consistencia. 7. Capacidad de auditora: Su objetivo es el de vigilar el entorno de la base de datos para que los datos estn protegidos, para lo cual se deben utilizar de forma adecuada los procedimientos de seguridad, respaldo y recuperacin. 8. Control de concurrencia o simultaneidad: Controla la interaccin entre las transacciones concurrentes para conservar la coherencia de la base de datos. a. Problema de concurrencia: Es la prdida de operaciones y por tanto de actualizaciones, con lo cual la base de datos va a perder su coherencia. La solucin a este problema consiste en una tcnica denominada cerrado. Lo cual impide ejecutar una actualizacin hasta que no finalice la actualizacin en proceso. b. Bloqueo Mutuo: tiene lugar cuando se origina una espera circular entre dos o ms transacciones y cada una solicita actualizacin sobre el mismo archivo. Soluciones al problema: i. Impedir que suceda: Opcin ms deseable, pero no siempre es posible impedir el bloqueo ii. Detectarlo cuando aparece y tomar las decisiones adecuadas. 9. Capacidad de Bsqueda: El usuario de una base de datos suele acceder a la misma desde diversos puntos de vista que pueden haber sido previstos o no en el diseo de la base. 10. Equilibrio en los requerimientos contradictorios: El DBA puede elegir una representacin de los datos que ofrezca un rpido acceso a los mismo de las aplicaciones ms importantes, o para Pgina 10 de 18

el uso interno de la empresa, en detrimento de los usuarios individuales y de un determinado nmero de aplicaciones a los que se le brinda un servicio de menor calidad. 11. Capacidad para la representacin de relaciones: Diferentes programadores solicitan diferentes archivos lgicos que deben obtenerse de la misma coleccin de datos. 12. Desempeo: La base de datos diseadas para ser utilizadas por los usuarios finales desde un terminal deben asegurar un tiempo de respuesta idneo para el dialogo entre el usuario y el terminal. 13. Los datos pueden compartirse: El que los datos puedan compartirse no slo significa que puedan ser usado por diversas aplicaciones, si no de que se puedan crear nuevas aplicaciones sin crear nuevos archivos. 14. Se deben cumplir las normas establecidas: El administrador debe garantizar que se cumplan las normas establecidas para la representacin de los datos. 10. Usuarios de la Base de Datos En una base de datos personal pequea lo normal es que una sola persona la defina, construya y manipule. En cambio, muchas personas participan en el diseo y mantenimiento de una base de datos grande con muchos usuarios.

Administradores de bases de datos


En cualquier organizacin en la que muchas personas utilicen los mismos recursos, se requiere un administrador que supervise y controle dichos recursos. En un entorno de bases de datos, el recurso primario es la propia base de datos, y el secundario es el SGBD y el software relacionado. La administracin de estos recursos es responsabilidad del administrador de bases de datos (DBA). El DBA se encarga de autorizar el acceso a la base de datos, de coordinar y vigilar su empleo y de adquirir los recursos necesarios de software y hardware. El DBA es la persona responsable cuando surgen problemas como violaciones a la seguridad o una respuesta lenta del sistema. En las organizaciones grandes, el DBA cuenta con la ayuda de personal para poder desempear estas funciones.

Diseadores de bases de datos


Los diseadores de bases de datos se encargan de identificar los datos que se almacenarn en la base de datos y de elegir las estructuras apropiadas para representar y almacenar dichos datos. Estas tareas se realizan antes de que se implemente la base de datos. Los diseadores tienen la responsabilidad de comunicarse con todos los futuros usuarios de la base de datos, a fin de comprender sus necesidades y de presentar un diseo que satisfaga esos requerimientos. En muchos casos los diseadores forman parte del personal del DBA y tal vez asuman otras responsabilidades una vez terminado el diseo de la base de datos.

Pgina 11 de 18

Usuarios finales
Son personas que necesitan tener acceso a la base de datos para consultarla, actualizarla y obtener informacin; la base de datos existe primordialmente para que ellos la usen. Hay varias categoras de usuarios finales, destacando: Los usuarios finales espordicos tienen acceso de vez en cuando a la base de datos, pero es posible que requieran informacin diferente en cada ocasin. Generalmente la informacin que necesitan no est prevista de antemano y utilizan un lenguaje de consulta de base de datos para especificar sus solicitudes. Suelen ser gerentes de nivel medio o alto que utilizan de modo ocasional la base de datos. Usuarios finales simples o paramtricos: constituyen una parte importante de la totalidad de los usuarios finales. Son usuarios no especializados que utilizan la base de datos a travs de programas de aplicacin que les proporcionan usuarios tcnicos.

Usuarios tcnicos: analistas de sistemas y programadores.


Los analistas de sistemas determinan los requerimientos de los usuarios finales, sobre todo los de los simples o paramtricos, y desarrollan especificaciones para los programas que satisfagan dichos requerimientos. Los programadores de aplicaciones implementan esas especificaciones en forma de programas, y luego las prueban, depuran, documentan y hacen su mantenimiento. 11. Administrador de la Base de Datos El Administrador de la Base de Datos (DBA) tiene las siguientes responsabilidades: Definicin del esquema: se consigue al escribir una serie de definiciones que el compilador del lenguaje de definicin de datos traduce a un conjunto de tablas. Definicin de la estructura de almacenamiento y del mtodo de acceso: Se lleva a cabo al escribir la definicin de la estructura de almacenamiento, mediante el lenguaje de definicin de datos, que posteriormente son traducidas por el compilador del lenguaje de almacenamiento y definicin de datos. Concesin de autorizacin para el acceso a los datos: Mediante este acceso se regulan las partes de la base de datos a las que van a tener acceso los diversos usuarios. Se debe especificar la correspondencia entre cualquier esquema externo y el esquema conceptual. Definicin de los procedimientos de validacin: Puede considerarse una extensin lgica del esquema conceptual. Definicin de una estrategia de respaldo y recuperacin: En el caso de que se produzca algn fallo, el administrador debe definir y poner en marcha una estrategia de recuperacin. Modificacin del esquema y de la organizacin fsica: Aunque estos cambios son poco frecuentes, el administrador necesitar de varios programas de utilidad para realizar estas modificaciones. Especificacin de las restricciones de integridad.

Pgina 12 de 18

12. Los Modelos de Datos en el Diseo de Bases de datos Los Modelos de Datos son un eficaz instrumento en el diseo de bases de datos, es conveniente distinguir la fase de modelado conceptual, que es la descripcin del mundo real de acuerdo con un modelo altamente semntico e independiente del SGBD. A veces no se formaliza este paso y el analista, sin una metodologa precisa, hace una abstraccin del mundo real, que es lo que hemos llamado estructura percibida. A continuacin se obtiene el esquema lgico, y de este se pasa al esquema interno, donde el objetivo es conseguir la mxima eficiencia de cara a la mquina y al problema especfico. En el primero de estos dominios, el mundo real (Universo del Discurso), existen objetos y asociaciones entre ellos; ambos tienen propiedades y hay reglas que imponen ciertas limitaciones. Ser necesaria una abstraccin de este mundo real por parte del diseador de la base de datos, que ser ms perfecta cuanto ms se asemeje al mundo real que se est contemplando. 13. Estructura del Modelo Relacional La Relacin es el elemento bsico del modelo relacional, y se puede representar como una tabla. Pero aun pudindose representar como tal posee una serie de elementos caractersticos que la distinguen de la tabla, ya que no admite filas duplicadas, las filas y columnas no ests ordenadas y es plana, es decir, que en el cruce de una fila y de una columna , slo puede haber un valor. (No se admiten atributos multivaluados). Se trata de restricciones inherentes al modelo que ms adelante analizaremos. En una tabla se puede distinguir una cabecera que define la estructura de la tabla, es decir sus atributos con los dominios subyacentes, y un cuerpo que est formado por un conjunto de tuplas que varan en el tiempo. 1. Dominio y atributo: Un domino D es un conjunto finito de valores homogneos y atmicos V1, V2,,Vn, caracterizado por un nombre. Decimos homogneos porque son todos del mismo tipo, y atmicos porque son indivisibles en lo que al modelo se refiere. a. Pueden definirse por intensin o por extensin. b. Se podra pensar que un dominio es igual a una relacin de grado, pero no es cierto pues el dominio contiene todos los valores que puede tomar un atributo y es esttico, mientras que la relacin es dinmica por su misma naturaleza c. El universo del discurso de una base de datos relacional, representado por U, est compuesto por un conjunto finito y no vaco de atributos, donde cada atributo toma sus valores de un nico dominio (Dominio Subyacente) y varios atributos pueden tener el mismo dominio subyacente. d. Es muy usual dar el mismo nombre al atributo y al dominio subyacente. En el caso de que sean varios los atributos de una misma tabla definidos al mismo dominio, habr que

Pgina 13 de 18

darles nombres diferentes, ya que una tabla no puede tener dos atributos con el mismo nombre. e. Muy pocos productos tratan adecuadamente el concepto de dominio; ni tampoco, en general, los productos son capaces de trabajar con atributos compuestos. 2. Definicin formal de Relacin: Para definir la relacin desde el punto de vista de las Bases de datos, es preciso distinguir los siguientes elementos: a. Nombre: Las relaciones se identifican por un nombre b. Cabecera de Relacin: Conjunto de n pares atributo-dominio. c. Cuerpo de la Relacin: Conjunto de m tuplas donde cada tupla es un conjunto de n pares atributo-valor. d. Esquema de la Relacin: Constituido por el nombre y la cabecera. e. El estado de Relacin R: al que denominaremos simplemente relacin constituido por el cuerpo de la relacin, siendo el cuerpo el conjunto de tuplas que, en un instante dado, satisface el correspondiente esquema de relacin. Por tanto cabe concluir que una Base de datos relacional es una base de datos percibidos por los usuarios como una coleccin de relaciones que varan en el tiempo, es decir, una coleccin de variables de relacin. 3. Clases de relacin: Existen diversas clasificaciones de las relaciones. En primer lugar las dividiremos en relaciones nominadas y sin nombre. a. Relaciones Nominadas: i. Persistentes: Son aquellas relaciones cuya definicin permanece a la base de datos. Requiere la accin del usuario para ser borradas. Se dividen en: Relaciones base: Existen por s mismas, no en funcin de otras relaciones y se crean especificando explcitamente su esquema de relacin. Vistas: Son relaciones derivadas que se definen dando un nombre a una expresin de consulta ii. Temporales: A diferencia de las relaciones persistentes, las temporales desaparecen de la base de datos en un cierto momento sin necesidad de una accin especfica por parte del usuario. b. Relaciones sin nombre: Son resultado de las consultas que no se materializan, sino que se entregan al usuario que ha realizado la consulta, y pueden ser tanto resultados finales como intermedios, en consecuencia las relaciones no nominadas son siempre temporales.

Pgina 14 de 18

14. Claves Una clave candidata de una relacin es un conjunto mnimo y no vaco de atributos que sirven para identificar de forma inequvoca cada posible tupla de una relacin. Esto debe ser cierto para cualquier posible extensin. Para que un atributo o conjunto de atributos pueda ser considerado clave candidata debe satisfacer las siguientes propiedades: 1. Unicidad: El valor de los atributos a lo largo de las entidades no se repite. 2. Minimalidad: si el atributo es compuesto, no ser posible eliminar ningn componente del mismo sin destruir la propiedad de unicidad. Es decir, no existen atributos sobrantes. Como una de las condiciones de una relacin es que no pueden existir tuplas duplicadas, siempre tiene que haber al menos una clave candidata, que en el peor de los casos, est formada por todos los atributos. Una relacin pude tener ms de una clave candidata, entre las cuales se debe distinguir entre: 1. Clave Primaria: Clave escogida para identificar las tuplas de relacin. 2. Clave Alternativa: Son las claves candidatas que no fueron escogidas como Clave Primaria. Se denomina Clave Ajena de una relacin a un conjunto no vaco de atributos cuyos valores han de coincidir con los valores de clave primaria de otra relacin, o bien tomar el valor nulo. La clave ajena y su correspondiente clave primaria han de estar definidas sobre el mismo dominio. 15. Grado de participacin 1. Parcial: Cundo hay algn cero. 2. Total: Cundo hay algn uno. 16. Cardinalidad a. (1:N). Nunca la clave ajena puede ser indexada sin duplicados. b. (N:1). Lo mismo pero la clave se propaga a la inversa. c. (N:M). Se crea una tabla con claves ajenas a partir de ambos tipos de relaciones. d. (1:1). Clave ajena indexada sin duplicado. 17. Tipos de entidades 1. Fuertes o regulares: necesarias para el funcionamiento. 2. Dbiles: se dan de baja al eliminar su relacin. Depende de una fuerte. a. Por existencia: Todas. b. Por identificacin: si la dbil necesitase un atributo de identificacin.

Pgina 15 de 18

18. Restricciones En el modelo relacional, al igual que otros modelos, existen restricciones, es decir, estructuras u ocurrencias no permitidas, siendo preciso distinguir entre restricciones inherentes y restricciones

semnticas.
1. Restricciones Inherentes: a. No hay dos tuplas iguales. b. El orden de las tuplas no es significativo. c. El orden de los atributos no es significativo. d. Cada atributo slo puede tomar un nico valor del dominio sobre el que est definido, no admitindose por tanto los grupos repetitivos.. Reglas Generales: a) Regla de la integridad de las entidades: Ningn atributo que forme parte de la clave primaria de una relacin puede tomar un valor nulo. b) Regla de la integridad referencial: Si una relacin tiene un descriptor que es una clave primaria de la relacin, todo valor de dicho descriptor debe concordar con un valor de la clave primaria o bien ser nulo. Adems de definir las claves ajenas, hay que determinar las consecuencias que pueden tener ciertas operaciones (Borrado y Modificacin): Operacin Restringida: El borrado de tuplas de la relacin que contiene la clave referenciada (o la modificacin de dicha clave) slo se permite si no existen tuplas con este valor en la relacin que contiene la clave ajena. Operacin con Transmisin en Cascada: El borrado de tuplas de la relacin que contiene la clave referenciada (o la modificacin de dicha clave) lleva consigo el borrado (o modificacin) en cascada de las tuplas de la relacin que contiene a la clave ajena. Operacin con Puesta a nulos: El borrado de tuplas de la relacin que contiene la clave referenciada (o la modificacin de dicha clave) lleva consigo el poner a nulos los valores de las claves ajenas de la relacin que referencia. Operacin con Puesta a valor por defecto: El borrado de tuplas de la relacin que contiene la clave referenciada (o la modificacin de dicha clave) lleva consigo poner el valor por defecto a la clave ajena de la relacin que referencia. La opcin seleccionada en caso de borrado es independiente de la de modificacin, es decir, las opciones de borrado y modificacin pueden ser distintas. 2. Restricciones Semnticas: estas restricciones no son muchas veces suficientes para captar toda la semntica del universo del discurso que se est tratando de modelar. Por ello, algunos productos aaden ciertas facilidades que permiten programarlas. Las principales restricciones semnticas son: Pgina 16 de 18

a. Clave Primaria: Permite declara un atributo o conjunto de atributos como clave primaria de una relacin, por lo que sus valores no se podrn repetir ni se admitirn los nulos. La

obligatoriedad de la clave primaria es una restriccin inherente del modelo relacional.


b. Unicidad: Mediante la cual se indica que los valores de un conjunto de atributos no pueden repetirse en una relacin. c. Obligatoriedad: De uno o ms atributos con lo que se indica que el conjunto de atributos no admite valores nulos. 19. Grafo Relacional Grafo compuesto de un conjunto de nodos multiparticionado donde cada nodo representa un esquema de la relacin, es decir, una tabla de la BD. 20. Teora de la Normalizacin Nos permite asegurar que un esquema relacional cumple unas ciertas propiedades. Entre los problemas que puede presentar un esquema relacional cuando el diseo es inadecuado cabe destacar: Incapacidad para almacenar ciertos hechos. Redundancias y, por tanto, posibilidad de inconsistencias. Ambigedades. Prdida de informacin. Prdida de ciertas restricciones de integridad que dan lugar a interdependencias de los datos. Aparicin de anomalas en la base de datos, como consecuencia de las redundancias, de estados que no son vlidos en el mundo real. Los principales problemas debidos a la redundancia son: Anomalas de Insercin. Anomalas de Modificacin. Anomalas de Borrado. Imposibilidad de almacenar ciertos hechos. Desaparicin de informacin que desearamos mantener en la base de datos.

El principio Bsico en todo diseo es: Hechos distintos deben ser almacenados en objetos distintos Si se siguiera la metodologa de diseo propuesta, realizando un buen diseo conceptual en el modelo Entidad/Relacin seguido de una cuidadosa transformacin al modelo relacional se evitaran en gran parte estas Anomalas, obtenindose en general un sistema exento de errores. La teora de la normalizacin puede definirse como una tcnica formal para organizar datos la cual nos ayuda a determinar qu es lo que est equivocado en un diseo y nos ensea la manera de corregirlo. 1. Nocin intuitiva de las formas normales: Consiste en la prohibicin de que en una relacin existan grupos repetitivos, esto es, que un atributo pueda tomar ms de un valor del dominio Pgina 17 de 18

subyacente. Dentro de este enfoque intuitivo podemos decir que un esquema de relacin si todos los atributos que no forman parte de ninguna clave candidata suministran informacin acerca de la clave completa, y no de una parte de la clave. 2. Dependencias Funcionales: La teora de la normalizacin se basa en el concepto de dependencias. La existencia de una dependencia no se puede demostrar, pero si afirmar por observacin del mundo real, si conocemos que una dependencia es cierta para un esquema de relacin, podremos asegurar que una extensin de dicho esquema no es vlida si no la cumple. Las dependencias funcionales son un tipo especial de dependencia en el cual se basan las primeras formas normales. 3. Definicin formal de las tres primeras formas normales: a. Primera Forma Normal (1FN): Para que una tabla pueda ser considerada una relacin no debe admitir grupos repetitivos, esto es, debe estar en Primera Forma Normal. b. Segunda Forma Normal (2FN): Una relacin est en 2FN s: i. Est en 1FN. ii. Cada atributo principal tiene dependencia funcional completa respecto de cada una de las claves. c. Tercera Forma Normal (3FN): i. Est en 2FN. ii. No existe ningn atributo no principal que dependa transitivamente de alguna de las claves de relacin. iii. Todo atributo no clave slo facilita informacin acerca de la clave. 4. Descomposicin de Relaciones: a. Descomposicin sin prdida de informacin: Se dice que una descomposicin se ha realizado sin prdida de informacin cuando la combinacin natural de las proyecciones resultantes nos devuelve la relacin original. b. Descomposicin sin prdida de dependencias funcionales: Las dependencias funcionales recogen la semntica del mundo real, por lo que es conveniente conservarlas en el proceso de descomposicin. c. Descomposicin en proyecciones independientes: La descomposicin de una relacin en un conjunto de Relaciones se dice que se ha realizado en proyecciones independientes si no ha habido prdida de informacin de dependencias funcionales. Anexo Campos y Propiedades en Access Tipos de campo: Texto, Memo, Numrico, Moneda, Si/No, Fecha/hora, etc. Propiedades: Tamao: Longitud mxima. Longitud Cero: cadena que no contiene caracteres. Format: no ayuda a la integridad, ayuda a la visualizacin. Mscaras: afectan a la integridad, proporcionan algn control sobre qu datos pueden introducirse. Pgina 18 de 18