Академический Документы
Профессиональный Документы
Культура Документы
Noviembre de 2015
Versin 1.0
Pgina 1 de 23
Noviembre de 2015
Versin 1.0
Pgina 2 de 23
2. INTRODUCCIN
El buen anlisis y diseo de una base de datos es fundamental para el desarrollo de un sistema
de informacin ya que si la base datos qued mal diseada no va a ser funcional el sistema de
informacin. Las bases de datos son la base fundamental de cualquier sistema ya que en ella se
almacenan los datos.
3. OBJETIVO
4. CONOCIMIENTOS PREVIOS
Comprensin de lectura.
Qu s?
Qu quiero saber?
Qu aprend
Qu puedo transferir
a mi entorno productivo, personal y
profesional de este aprendizaje
5. MATERIAL DE CONSULTA
http://es.wikipedia.org/wiki/Base_de_datos_relacional
http://www.jorgesanchez.net/bd/bdrelacional.pdf
Noviembre de 2015
Versin 1.0
Pgina 3 de 23
4. Una vez tenga el Diccionario de Datos, haga un anlisis y ejecute el proceso de normalizacin,
hasta llegar a la Tercera Forma Normal.
5. El estudiante debe entregar al instructor un documento, con todos los pasos del anlisis, de
cada forma normal, con la respectiva justificacin detallada de cada uno de los pasos que
conduzcan al resultado final.
Ambiente(s) requerido:
Saln de clases
Grupos de 2 personas
Papel, esfero y lpiz
Noviembre de 2015
Versin 1.0
Pgina 4 de 23
6. EVIDENCIAS Y EVALUACION
EVIDENCIA:
Documento
Tipo de Evidencia:
Desempeo
Resultados de aprendizaje
asociados a la evidencia:
Descripcin:
Producto entregable:
Forma de entrega:
Presencial
Criterios de Evaluacin:
Instrumento de Evaluacin:
Conocimiento
Producto
8. BIBLIOGRAFIA
http://es.wikipedia.org/wiki/Base_de_datos_relacional
http://www.jorgesanchez.net/bd/bdrelacional.pdf
http://biblioteca.sena.edu.co/
Noviembre de 2015
Versin 1.0
Pgina 5 de 23
LISTA DE VERIFICACIN
G.
Integrantes
Diccionario
de datos
1 FN
2 FN
3 FN
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
E = Excelente; B = Bueno; A = Aceptable; I = Insuficiente; D = Deficiente
Noviembre de 2015
Versin 1.0
Pgina 6 de 23
Permitir a los usuarios acceder y manipular la base de datos proveyendo mtodos para
construir sistemas de procesamiento de datos para aplicaciones que requieran acceso a los
datos.
Proveer a los administradores las herramientas que les permitan ejecutar tareas de
mantenimiento y administracin de los datos.
CARACTERISTICAS DE UN DBMS
Control de la redundancia de datos: Este consiste en lograr una mnima cantidad de espacio de
almacenamiento para almacenar los datos evitando la duplicacin de la informacin. De esta
manera se logran ahorros en el tiempo de procesamiento de la informacin, se tendrn menos
inconsistencias, menores costos operativos y har el mantenimiento ms fcil.
Compartimiento de datos: Una de las principales caractersticas de las bases de datos, es que los
datos pueden ser compartidos entre muchos usuarios simultneamente, proveyendo, de esta
manera, mxima eficiencia.
Noviembre de 2015
Versin 1.0
Pgina 7 de 23
Noviembre de 2015
Versin 1.0
Pgina 8 de 23
FIGURA 1
En la tabla anterior, la tabla Empleados consiste en tres columnas y tres filas. Las columnas o
campo conforman un registro lgico, correspondiente a un empleado. La tabla Empleados est
relacionada con la tabla de Departamentos por medio de una columna "Numero de
Departamento" que aparece en ambas tablas.
Llave Primaria: Hemos visto que los datos son almacenados de manera lgica en tablas en la Bases
de datos relacionales. Cada tabla tiene un nombre nico. Para identificar una fila particular en una
tabla, se usa una columna o combinacin de columnas. Esta columna debe ser tal que identifique
de manera nica e inequvoca cada fila. No puede haber ms de dos filas (registros) en una tabla
que tengan el mismo valor para la columna que haya sido elegida como llave primaria. Una
columna identificada como la llave primaria no puede tener valores duplicados no nulos. Por
ejemplo, considerando la tabla de Empleados presentada en la Figura No. 1, podemos ver que
cada empleado tiene un nico nmero de empleado. La columna "NUM-EMP" puede ser escogida
Noviembre de 2015
Versin 1.0
Pgina 9 de 23
FIGURA 2
En la figura No. 2 hemos establecido la siguiente convencin: En los esquemas de tablas, las llaves
primarias estn subrayadas. Igualmente diagramaremos restricciones de integridad referencial a
travs de lneas de conexin que van desde cada llave fornea hasta la llave primaria que
referencie. Para que haya mejor claridad, la punta de la flecha deber apuntar hacia la llave
primaria de la tabla referenciada.
Nulos: Un Nulo se puede interpretar como un valor indefinido o como ningn valor. Los nulos son
usados en las columnas donde se desconozca su valor. Un nulo no significan espacios en blanco.
Un valor "nulo" no puede ser usado para hacer ningn clculo u operaciones de comparacin. Un
"nulo" puede ser comparable a un infinito. Un "nulo" no es igual a otro "nulo".
Ing. ANGLICA RAMREZ
Noviembre de 2015
Versin 1.0
Pgina 10 de 23
Vistas: Los RDBMS gestionan la estructura fsica de los datos y su almacenamiento. Con esta
funcionalidad, el RDBMS se convierte en una herramienta de gran utilidad. Sin embargo, desde el
punto de vista del usuario, se podra discutir que los RDBMS han hecho las cosas ms complicadas,
ya que ahora los usuarios ven ms datos de los que realmente quieren o necesitan, puesto que
ven la base de datos completa.
Conscientes de este problema, los RDBMS proporcionan un mecanismo de vistas que permite que
cada usuario tenga su propia vista o visin de la base de datos. El lenguaje de definicin de datos
permite definir vistas como subconjuntos de la base de datos. Las vistas, adems de reducir la
complejidad permitiendo que cada usuario vea slo la parte de la base de datos que necesita,
tienen otras ventajas:
Las vistas proporcionan un nivel de seguridad, ya que permiten excluir datos para que ciertos
usuarios no los vean. Las vistas proporcionan un mecanismo para que los usuarios vean los
datos en el formato que deseen.
Una vista representa una imagen consistente y permanente de la base de datos, incluso si la
base de datos cambia su estructura.
Un sistema de bases de datos (DBMS) puede ser considerado como relacional si sigue las tres
reglas de oro, las cuales se enuncian a continuacin:
1. Toda la informacin debe estar representada en tablas.
2. La recuperacin de los datos debe ser posible usando sentencia de SELECT, JOIN y PROJECT.
3. Todas las relaciones entre los datos deben ser explcitamente representadas en los mismos
datos.
Para definir los requerimientos de una base de datos relacional RDBMS mas rigurosamente, Codd
ha formulado 12 reglas comnmente conocidas como las Reglas de Codd . De un producto se
puede decir que es real y completamente relacional si sigue todas las reglas, pero no existe
ninguno que efectivamente si las cumpla. Por eso es que se ha generalizado el uso de la regla No.
0 que reza: "Cualquier base de datos relacional verdadera debe ser administrable enteramente a
travs de sus propias capacidades relacionales".
10
Noviembre de 2015
Versin 1.0
Pgina 11 de 23
11
Noviembre de 2015
Versin 1.0
Pgina 12 de 23
12
Noviembre de 2015
Versin 1.0
Pgina 13 de 23
RESUMEN
TAL COMO LO ANUNCIAMOS, A CONTINUACIN PRESENTAREMOS UN RESUMEN EN
TERMINOLOGA DE FCIL COMPRESNSION, QUE ILUSTRA LOS PRINCIPALES CONCEPTOS DE LAS
BASES DE DATOS Y LAS REGLAS DE CODD LLEVADAS A LA PRACTICA.
Un RDBMS debe proporcionar un mecanismo que garantice que todas las actualizaciones
correspondientes a una determinada transaccin se realicen, o que no se realice ninguna.
Una transaccin en el sistema informtico de los empleados de una empresa (por ejemplo)
sera dar de alta a un empleado o eliminar un cargo. Una transaccin un poco ms complicada
sera eliminar un Departamento o divisin y reasignar todos sus empleados a otro
Departamento. En este caso hay que realizar varios cambios sobre la base de datos. Si la
transaccin falla durante su realizacin, por ejemplo porque falla el hardware (o se va la
13
Noviembre de 2015
Versin 1.0
Pgina 14 de 23
Un RDBMS debe proporcionar un mecanismo que garantice que slo los usuarios autorizados
pueden acceder a la base de datos. La proteccin debe ser contra accesos no autorizados,
tanto intencionados como accidentales.
Un RDBMS debe ser capaz de integrarse con algn software de comunicacin. Muchos
usuarios acceden a la base de datos desde terminales. En ocasiones estos terminales se
encuentran conectados directamente a la mquina sobre la que funciona el RDBMS. En otras
ocasiones los terminales estn en lugares remotos, por lo que la comunicacin con la
mquina que alberga al RDBMS se debe hacer a travs de una red. En cualquiera de los dos
casos, el RDBMS recibe peticiones en forma de mensajes y responde de modo similar. Todas
estas transmisiones de mensajes las maneja el gestor de comunicaciones de datos. Aunque
este gestor no forma parte del RDBMS, es necesario que el RDBMS se pueda integrar con l
para que el sistema sea comercialmente viable.
Un RDBMS debe proporcionar los medios necesarios para garantizar que tanto los datos de la
base de datos, como los cambios que se realizan sobre estos datos, sigan ciertas reglas. La
integridad de la base de datos requiere la validez y consistencia de los datos almacenados. Se
puede considerar como otro modo de proteger la base de datos, pero adems de tener que
ver con la seguridad, tiene otras implicaciones. La integridad se ocupa de la calidad de los
datos. Normalmente se expresa mediante restricciones, que son una serie de reglas que la
base de datos no puede violar. Por ejemplo, se puede establecer la restriccin de que el
nmero de cdula de un empleado no puede tener caracteres alfanumricos, o por ejemplo
que para dar de alta un empleado ste debe pertenecer obligatoriamente a un
Departamento. En este caso sera deseable que el RDBMS controlara que no se violen esas
reglas cada vez que se ingresen los datos de un empleado a la base de datos de la empresa.
NORMALIZACIN
Una base de datos tiene que ser diseada antes de que pueda ser creada y usada. El diseo debe
ajustarse a estndares que permitan ahorro de memoria, acceso rpido, fcil mantenimiento,
Ing. ANGLICA RAMREZ
14
Noviembre de 2015
Versin 1.0
Pgina 15 de 23
FIGURA 3
A primera vista, parece conveniente almacenar todos los detalles en una sola tabla.
Pero ciertas anomalas se pueden manifestar durante la insercin, actualizacin y borrado de
datos. La normalizacin provee un mtodo de remover todas estas indeseables anomalas
haciendo la base de datos mas confiable y estable.
Anomala de insercin (INSERT): Suponga que un nuevo Departamento ha sido creado, el cual no
tiene empleados todava, por lo tanto, en nuestra tabla original, los datos correspondientes al
empelado estaran vacos (nulos), y solo tendramos la informacin del Departamento: Columnas
"numDept" y "descDept".
Anomala de Actualizacin (UPDATE): Suponga que el nmero del Departamento de "Sistemas"
ha sido cambiado a AB108. Esto involucra tener q1ue cambiar el numero del departamento para
todos los empleados que pertenezcan al departamento de "Sistemas", lo cual representa tiempo y
recursos de sistema adicionales.
Ing. ANGLICA RAMREZ
15
Noviembre de 2015
Versin 1.0
Pgina 16 de 23
PROCEDIMIENTOS DE NORMALIZACION
El proceso de normalizacin involucra bsicamente tres pasos. Despus de cada paso, la base de
datos se convierte en formas llamadas "formas normales". Generalmente, la "tercera forma
normal" es el estado que debe alcanzar una base de datos para que se diga que est totalmente
normalizada. La cuarta y la quinta forma normal tambin existen, pero no son usadas en el diseo
de una base de datos.
A continuacin, consideremos un pequeo ejercicio acerca de un Documento de Orden de
Compra, el cual trataremos de convertirlo a una forma normalizada. Pero antes explicaremos unas
pequeas reglas:
Propiedades de una relacin: Un tabla debe satisfacer ciertos criterios previos antes de calificar
para convertirse en una relacin.
No duplicados: No debe haber nunca dos columnas o filas totalmente idnticas. Si dos filas son
totalmente idnticas, entonces hacen falta algunos atributos que las haga diferentes y
distinguibles. Ejemplo: Dos registros de discos compactos en una tienda seran idnticos si son dos
copias del ltimo lbum de Shakira, si no fuera porque cada disco compacto tiene un numero
cdigo que los hace diferentes.
16
Noviembre de 2015
Versin 1.0
Pgina 17 de 23
Clave nica: Cada registro tiene que tener una llave nica que lo identifique. Cualquier atributo
puede ser una llave, pero en lo posible trataremos de elegir como llave nica al atributo que tenga
una longitud menor y fija, como por ejemplo un numero de ID. Si un atributo es insuficiente para
identificar un registro de manera nica, entonces mas de un atributo puede conformar la llave
nica.
En tal caso, el nmero de atributos que conformen una llave debe ser el mnimo necesario y
suficiente.
Insignificancia del orden: La secuencia en la cual los atributos son escritos no debe importar.
Podemos escribir el ID del empleado de primero, o el nombre y el apellido de primero, y esto no
afectar las relaciones que establezcamos con otras tablas. Por otro lado, los registros deben ser
totalmente independiente de su secuencia o posicin en la base de datos (dependencia
posicional). Esto significa que si intentamos identificar un registro por su posicin dentro de la
tabla, estaremos creando una llave invlida.
Forma no-normalizada: Los datos, en su forma elemental, no estn normalizados. Por lo tanto, lo
primero con lo que debemos comenzar es con los datos elementales o bsicos que conformarn el
diccionario de datos. El diccionario de datos es creado a partir de los documentos o diagramas de
flujo de la compaa. Se deben listar los elementos uno debajo del otro.
As, obtendremos la forma no-normalizada para el ejercicio de ARD (Anlisis Relacional de Datos),
con el cual deberemos obtener al final distintos grupos de elementos. Ms tarde, dichos grupos se
combinarn con los grupos de otros documentos al cual tambin se les ha hecho el anlisis ARD, y
se establecern relaciones entre ellos.
17
Noviembre de 2015
Versin 1.0
Pgina 18 de 23
EJERCICIO
Consideremos el documento ORDEN DE COMPRA de la figura 4, usado para colocar una
orden de pedido al proveedor de discos compactos.
Figura 4
Descripcin
Nmero de Orden de Compra
Fecha de la Orden de Compra
Numero del Proveedor
Nombre del Proveedor
Direccin del Proveedor
NIT o Cdula del Proveedor
Cdigo del CD o lbum
Titulo del CD o lbum
Cantidad de CDs a pedir
Valor unitario del CD o lbum
Incluso las formas no normalizadas deben tener una llave. En el ejemplo de arriba, podemos
deducir que ORD-NO es la llave. Las llaves usualmente son subrayadas durante el anlisis ARD.
Ing. ANGLICA RAMREZ
18
Noviembre de 2015
Versin 1.0
Pgina 19 de 23
Grupo Repetitivo
CODIGO
TITULO
CANT
VR-UNIT
El grupo repetitivo tiene a CODIGO como llave. Sin embargo, esta llave no es nica, dado que se
puede repetir en otros nmeros de orden. Necesita ser combinada con la llave del primer grupo.
Al combinar el campo ORD-NO junto con el campo CODIGO para el segundo grupo, podemos
deducir que esta combinacin puede actuar como llave nica, ya que no puede haber una misma
orden que tenga 2 cdigos iguales. Por lo tanto, despus de aplicar la primera forma normal,
obtenemos estos grupos:
GRUPO 1
ORD-NO
ORD-DATE
PROV-NO
PROV-NAME
PROV-DIR
PROV-NIT
GRUPO 2
ORD-NO
CODIGO
TITULO
CANT
VR-UNIT
19
Noviembre de 2015
Versin 1.0
Pgina 20 de 23
GRUPO 2
ORD-NO
CODIGO
CANT
GRUPO 3
CODIGO
TITULO
VR-UNIT
En este nivel, ya nos podemos imaginar mentalmente la utilidad de separar el diccionario de datos
en distintos grupos. Imaginmonos que queremos ingresar 50 ordenes al sistema, y en todas est
incluido el CD de Juanes, cuyo cdigo es 1520. El ttulo asociado al cdigo 1520 es "Fjate bien". Si
no existiera el grupo 3, para cada una de las ordenes estaramos ingresando no solo 50 veces el
cdigo 1520, sino que tambin nos toca digitar 50 veces el texto "Fjate bien" . Consideramos que
esto ltimo es un trabajo que se puede ahorrar al aplicar la segunda forma normal, ya que si
dejamos una tabla separada para CODIGO y TITULO, al ingresar las ordenes solo nos toca digitar 50
veces el cdigo 1520 en la tabla del grupo 2 (cada vez asociado a un nmero de orden distinto y
nico), y UNA sola vez el mismo cdigo en la tabla 3, con lo cual el texto "Fjate bien" solo tendra
Ing. ANGLICA RAMREZ
20
Noviembre de 2015
Versin 1.0
Pgina 21 de 23
que ser digitado una sola vez por ende. En el evento en que se nos pida consultar el titulo del CD
en un registro de la tabla 2, simplemente usaremos el valor del campo CODIGO de dicho registro
para trasladar la consulta a la tabla 3, quien nos devolver la informacin buscada del Titulo.
Si han logrado entender la justificacin de la normalizacin con el ejemplo anterior, tenemos ya un
gran terreno ganado en el proceso de aprender a disear bases de datos.
GRUPO 1
ORD-NO
ORD-DATE
PROV-NO
GRUPO 2
ORD-NO
CODIGO
CANT
GRUPO 3
CODIGO
TITULO
VR-UNIT
GRUPO 4
PROV-NO
PROV-NAME
PROV-DIR
PROV-NIT
RESUMEN DE LA NORMALIZACION
UNF - FORMA NO NORMALIZADA
Diccionario de datos
1NF - PRIMERA FORMA NORMAL
Separar el grupo repetitivo
2NF - SEGUNDA FORMA NORMAL
Separar dependencias de llaves compuestas
3NF - TERCERA FORMA NORMAL
Separar dependencias de los campos no llaves
21
Noviembre de 2015
Versin 1.0
Pgina 22 de 23
Evitar poner en los nombres de las columnas caracteres que no sean maysculas (AZ), nmeros (0-9) o el subrayado (_). Cualquier otro caracter puede no ser aceptado
por la base de datos. Algunos sistemas de bases de datos son sensibles al uso de
maysculas y minsculas en los nombres de las columnas, otros no.
Procurar que los nombres de las columnas sean relativamente cortos. Cada tipo de
base de datos soporta un nmero distinto de caracteres (p.ej., 30 en el caso de
Oracle, 64 para Microsoft Access o 10 si es DBF). Intentar que los nombres de las
columnas varen en los primeros caracteres y no en los ltimos, con el fin de evitar
que se duplique alguno de los nombres por error al cortarlos para abreviar durante el
proceso de conversin (p.ej., utilizar COL1 y COL2, en lugar de
NOMBRE_COLUMNA_LARGA_1 Y NOMBRE_COLUMNA_LARGA_2).
22
Noviembre de 2015
Versin 1.0
Pgina 23 de 23
Observar que el poner nombres cortos a las columnas puede ser incompatible con procurar que
sean descriptivos para los nuevos usuarios. Comprobar que se est realizando una buena
combinacin.
Es importante recordar que stas son reglas no estrictas, basadas nicamente en la experiencia,
no leyes absolutas! Se pueden romper las reglas si es necesario, pero justificando la decisin.
23