Вы находитесь на странице: 1из 11

Historia de las Bases de

Datos
una base de datos es un conjunto de informacin relacionada que se encuentra
agrupada o estructurada.
Desde el punto de vista informtico, una base de datos es un sistema formado
por un conjunto de datos almacenados en discos que permiten el acceso directo a
ellos y un conjunto de programas que lo manipulen.
Por su parte, un sistema de Gestin de Bases de datos es un tipo de software
muy especifico dedicado a servir de interfaz entre la base de datos, el usuario y las
aplicaciones que la utilizan; o lo que es lo mismo, una agrupacin de programas
que sirven para definir, construir y manipular una base de datos, permitiendo as
almacenar y posteriormente acceder a los datos de forma rpida y estructurada.
Origenes
En 1884 Herman Hollerith cre la mquina automtica de tarjetas perforadas,
siendo nombrado as el primer ingeniero estadstico de la historia. En esta poca,
los censos se realizaban de forma manual.
Posteriormente, en la dcada de los cincuenta se da origen a las cintas
magnticas, para automatizar la informacin y hacer respaldos. Esto sirvi para
suplir las necesidades de informacin de las nuevas industrias. Y a travs de este
mecanismo se empezaron a automatizar informacin, con la desventaja de que
solo se poda hacer de forma secuencial.
Dcada de 1960
Otro de los principales logros de los aos sesenta fue la alianza de IBM y
American Airlines para desarrollar SABRE, un sistema operativo que
manejaba las reservas de vuelos, transacciones e informaciones sobre los
pasajeros de la compaa American Airlines.

Y, posteriormente, en esta misma dcada, se llevo a cabo el desarrollo del IDS


desarrollado por Charles Bachman la creacin de un nuevo tipo de sistema de
bases de datos conocido como modelo en red que permiti la creacin de un
standard en los sistemas de bases de datos gracias a la creacin de nuevos
lenguajes de sistemas de informacin.
CODASYL (Conference on Data Systems Languages) era un consorcio de
industrias informticas que tenan como objetivo la regularizacin de un
lenguaje de programacin estndar que pudiera ser utilizado en multitud
de ordenadores.
Los miembros de este consorcio pertenecan a industrias e instituciones
gubernamentales relacionadas con el proceso de datos, cuya principal meta era
promover un anlisis, diseo e implementacin de los sistemas de datos ms
efectivos; y aunque trabajaron en varios lenguajes de programacin como COBOL,
nunca llegaron a establecer un estndar fijo, proceso que se llevo a cabo por ANSI.
Dcada de 1970
Por lo que respecta a la dcada de los setenta, Edgar Frank Codd, cientfico
informtico ingles conocido por sus aportaciones a la teora de bases de datos
relacionales,
Como consecuencia de esto, durante la dcada de 1970, Lawrence J. Ellison, ms
conocido como Larry Ellison, a partir del trabajo de Edgar F. Codd sobre los
sistemas de bases de datos relacionales, desarroll el Relational Software System,
o lo que es lo mismo, lo que actualmente se conoce como Oracle Corporation,
desarrollando as un sistema de gestin de bases de datos relacional con el mismo
nombre que dicha compaa.
Posteriormente en la poca de los ochenta tambin se desarrollar el SQL
(Structured Query Language) o lo que es lo mismo un lenguaje de consultas o
lenguaje declarativo de acceso a bases de datos relacionales que permite efectuar
consultas con el fin de recuperar informacin de inters de una base de datos y
hacer cambios sobre la base de datos de forma sencilla; adems de analiza
grandes cantidades de informacin y permitir especificar diversos tipos de
operaciones frente a la misma informacin, a diferencia de las bases de datos de
los aos ochenta que se disearon para aplicaciones de procesamiento de
transacciones.

Dcada de 1980
Por su parte, a principios de los aos ochenta comenz el auge de la
comercializacin de los sistemas relacionales, y SQL comenz a ser el estndar de
la industria, ya que las bases de datos relacionales con su sistema de tablas
(compuesta por filas y columnas) pudieron competir con las bases jerrquicas y de
red, como consecuencia de que su nivel de programacin era sencillo y su nivel de
programacin era relativamente bajo.
Dcada aos 1990
En la dcada de 1990 la investigacin en bases de datos gir en torno a las bases
de datos orientadas a objetos. Las cuales han tenido bastante xito a la hora de
gestionar datos complejos en los campos donde las bases de datos relacionales no
han podido desarrollarse de forma eficiente. As se desarrollaron herramientas
como Excel y Access del paquete de Microsoft Office que marcan el inicio de las
bases de datos orientadas a objetos.
SIGLO XXI
En la actualidad, las tres grandes compaas que dominan el mercado de las bases
de datos son IBM, Microsoft y Oracle. Por su parte, en el campo de internet, la
compaa que genera gran cantidad de informacin es Google. Aunque existe una
gran variedad de software que permiten crear y manejar bases de datos con gran
facilidad, como por ejemplo LINQ, que es un proyecto de Microsoft que agrega
consultas nativas semejantes a las de SQL a los lenguajes de la plataforma .NET. El
objetivo de este proyecto es permitir que todo el cdigo hecho en Visual Studio
sean tambin orientados a objetos; ya que antes de LINQ la manipulacin de datos
externos tena un concepto ms estructurado que orientado a objetos; y es por eso
que trata de facilitar y estandarizar el acceso a dichos objetos.

Los SGBDs jerrquicos fueron los primeros en aparecer. Una base de datos jerrquica se puede
visualizar como una estructura en rbol. Una vez diseada la base de datos, es complejo
cambiarla y, adems, es necesario un conocimiento amplio de la forma en la que se han
almacenado los datos para poder recuperarlos de forma efectiva.
Los SGBDs en red fueron una evolucin del modelo jerrquico. cada uno de los registros estn
enlazados entre si pero no necesariamente siguiendo una estructura en rbol. El modelo en red
elimina parte de las rigideces del modelo jerrquico, pero aumenta la complejidad para modificar la
estructura de la base de datos
Los SGBDs relacionales. En una base de datos relacional, se representan los datos como un
conjunto de tablas bidimensionales compuestas de filas y columnas. Cada fila representa una
relacin entre un conjunto de valores y est identificada por una clave nica. Los SGBDs
relacionales son muy flexibles y de fcil manejo, lo que los ha convertido en el modelo dominante
en la actualidad. Un factor decisivo en la implantacin de los SGBDs relacionales, ha sido el
lenguaje SQL (Structured Query Language) para la interrogacin y el manejo de datos del modelo
relacional.
A pesar de que los avances en el campo de los SGBDs han sido muy grandes y de que los SGBDs
actuales proporcionan un rendimiento muy elevado, an estn lejos de satisfacer todas las
demandas de las aplicaciones ms avanzadas. Siguen existiendo hoy en da numerosas reas
cientficas e industriales, en las que los SGBDs relacionales estn escasamente introducidos.
Muchos de estos campos exigen la manipulacin de nuevos tipos de informacin o suponen unos
volmenes de datos de difcil manejo por los sistemas actuales.

2.6.2.1 Definiciones de Base de Datos y Sistema de Gestin de


Bases de Datos
Base de datos (BD)
Es un conjunto de datos no redundantes, almacenados en un soporte informtico, organizados de
forma independiente de su utilizacin y accesibles simultneamente por distintos usuarios y
aplicaciones.
Es decir, la diferencia de una BD respecto a otro sistema de almacenamiento de datos, es que
stos se almacenan de forma que cumplan tres requisitos bsicos:
No redundancia. Los datos se almacenan una sola vez. Si varias aplicaciones necesitan los
mismos datos, no crearn cada una su propia copia sino que todas accedern a la misma.
Independencia. Los datos se almacenan teniendo en cuenta la estructura inherente a los propios
datos y no la de la aplicacin que los crea. Esta forma de trabajar es la que permite que varias
aplicaciones puedan utilizar los mismos datos.
Concurrencia. Varios usuarios, ejecutando la misma o diferente aplicacin, podrn acceder
simultneamente a los datos.
Arquitectura de un SGBD
Esta arquitectura divide la base de datos en tres niveles :

El nivel externo es la representacin de los datos, tal y como los ve el usuario. Cada
usuario tendr una visin distinta de la base de datos dependiente del subconjunto de
datos, que est autorizado a ver segn sus privilegios de acceso y tambin, del formato en
que se le presentan, que depender de las herramientas que utilice

El nivel lgico, es una representacin abstracta (no fsica como en el nivel interno) del
contenido total de la base de datos. Contiene la definicin de todos los datos existentes
ms otras informaciones como restricciones de seguridad, controles de integridad, etc.

El nivel interno es el ms cercano a la mquina. Es una representacin a bajo nivel de la


BD, en la que se define la forma en que los datos se almacenan fsicamente en la
mquina. Se definen caractersticas como los dispositivos en donde se almacenan los
datos, el espacio que se reserva, las estrategias de acceso, la creacin de ficheros de
ndices, etc. Es dependiente de la mquina en que se vaya a instalar la BD, del sistema
operativo que exista, etc.

Sistema de Gestin de Bases de Datos (SGBD)


Es el conjunto de programas que permiten definir, manipular y utilizar la informacin que contienen
las bases de datos, realizar todas las tareas de administracin necesarias para mantenerlas
operativas, mantener su integridad, confidencialidad y seguridad. Una BD nunca se accede o
manipula directamente sino a travs del SGBD. Se puede considerar al SGBD como la interfase
entre el usuario y la BD.
Funciones de un SGBD

Un SGBD debe proporcionar un amplio surtido de funcionalidades para poder cumplir


adecuadamente su misin. Normalmente se clasifican en definicin, manipulacin y utilizacin.

Funcin de definicin. Permite describir los elementos de datos, sus estructuras, sus
interrelaciones y sus validaciones a nivel externo, lgico e interno.

Funcin de manipulacin. Permite buscar, aadir, suprimir y modificar los datos de la BD.

Funcin de utilizacin. Incluye otras funcionalidades tales como: modificar la capacidad de


los registros, cargar archivos, realizar copias de seguridad, rearranque, proteccin frente a
accesos no autorizados, gestin de la concurrencia, estadsticas de utilizacin, etc.

2.6.2.2 Conceptos y funcionalidades bsicos


Diccionario de datos. Rene la informacin sobre los datos almacenados en la BD
Repositorio. Permiten describir y registrar las caractersticas o atributos de cada componente u
objeto de un Sistema o Base de Datos.
Directorio de datos. Es un subsistema del SGBD que describe dnde y cmo se almacenan los
datos de la BD
Modelo de datos. Es un conjunto de conceptos, reglas y convenciones que permiten describir y
manipular los datos.
Modelo relacional.introduce la teora de las relaciones en el campo de las BD. En este modelo,
los datos se estructuran en tablas manteniendo la independencia de esta estructura lgica,
respecto al modo de almacenamiento u otras caractersticas fsicas. Las tablas se manejan
mediante operaciones de la teora de conjuntos y el lgebra relacional.
DDL (Data Definition Language). Lenguaje de definicin de datos, se utiliza para crear y
mantener la base de datos y los elementos que contiene a nivel externo, lgico e interno. Es propio
de cada SGBD.
DML (Data Manipulation Language). Lenguaje de manipulacin de datos, se utiliza para la
actualizacin y consulta de los datos almacenados en la base de datos. Permite aadir,
seleccionar, suprimir o modificar los datos de la BD, respetando las reglas establecidas por el DDL.
SQL (Structured Query Language). El SQL es un lenguaje de alto nivel, no procedural,
normalizado, que permite la consulta y actualizacin de los datos de BD relacionales.
Transaccin. si se realiza alguna de las modificaciones deben realizarse todas, en caso contrario
no debe realizarse ninguna
Commit. Los SGBDs ofrecen sentencias especializadas para la gestin de transacciones.
COMMIT WORK, finalizar una transaccin y ROLLBACK, deshacerla.
Two-Phase Commit. Proceso necesario para realizar Commit en BD distribuidas. Para garantizar
que todas las BD involucradas quedarn correctamente modificadas, el Commit se divide en dos
fases. Primero, se comprueba que todos los nodos involucrados estn listos para realizar la

actualizacin. Segundo, se modifican las bases de datos si, y slo, si todos los nodos estn
preparados.
Bloqueo. Cuando una transaccin necesita asegurarse de que el contenido de un recurso de la
BD (un archivo, un registro u otro) no cambiar hasta que la transaccin finalice, se bloquea. El
bloqueo impide que otras transacciones lo modifiquen. Existen dos tipos principales de
bloqueos: bloqueos exclusivos y bloqueos compartidos. Si una transaccin realiza un bloqueo
exclusivo sobre un recurso, ninguna otra podr ejecutar ningn tipo de bloqueo contra el recurso.
Se utilizan cuando la transaccin va a actualizar el recurso. Si una transaccin realiza un bloqueo
compartido, otras transacciones podrn realizar bloqueos compartidos (pero no exclusivos) sobre
ese mismo recurso. Esta ltima tcnica se utiliza cuando la transaccin no va a actualizar los
datos, pero desea evitar que otras transacciones puedan modificarlo.
Interbloqueos. Los interbloqueos se producen cuando dos transacciones que acceden a una base
de datos, se bloquean mutuamente al intentar realizar un bloqueo exclusivo sobre los mismos
recursos. Todo SGBD debe implementar tcnicas automticas para evitar los interbloqueos, ya que
si se producen, ninguna de las transacciones puede continuar y permanecern en ese estado,
hasta que el SGBD lo resuelva. Por ejemplo:
Inconsistencia. Una base de datos est inonsistente si dos datos que deberan ser iguales no lo
son. Por ejemplo, un empleado aparece en una tabla como activo y en otra como jubilado.
Integridad. Se refiere a la exactitud y precisin de la informacin. El dato debe permanecer como
fue colocado inicialmente, sin ser modificado sin no cuenta con la respectiva autorizacin.
Redundancia. Se llama redundancia al hecho de que los mismos datos estn almacenados ms
de una vez en la base de datos.
Redundancia controlada. En ocasiones, es necesario introducir voluntariamente redundancia en
la BD por consideraciones de rendimiento.
Confidencialidad. Consiste en proteger la BD contra accesos no autorizados. Debe asegurarse no
slo que los usuarios no autorizados no consigan acceso a la BD sino, tambin, que los usuarios
legtimos acceden slo a los datos autorizados.
Recuperacin. Su objetivo es proteger a la BD contra fallos (lgicos o fsicos) que destruyan su
contenido parcial o totalmente. Los SGBDs suelen incluir los llamados "ficheros de log", en los que
se almacenan todos los cambios antes de almacenarlos en la BD, as como, marcas de comienzo
y final de transaccin.
Normalizacin. Segn el modelo relacional, las tablas deben definirse siguiendo una serie de
reglas precisas, para asegurarse de que no se producirn anomalas en la actualizacin de la base
de datos. Para ello, es habitual que se necesite descomponer las tablas iniciales en otras ms
simplificadas que no presenten dichos problemas
Middleware es un mdulo intermedio que acta como conductor entre dos mdulos de software.
Para compartir datos, los dos mdulos de software no necesitan saber cmo comunicarse entre
ellos, sino cmo comunicarse con el mdulo de middleware.
2.6.2.2.2 Los SGBDs relacionales
Basados en el modelo relacional, los datos se describen como relaciones que se suelen
representar como tablas bidimensionales,consistentes en filas y columnas. Cada fila (tupla, en

terminologa relacional) representa una ocurrencia. Las columnas (atributos) representan


propiedades de las filas. Cada tupla se identifica por una clave primaria o identificador. Por
ejemplo:
Esta organizacin de la informacin, permite recuperar de forma flexible los datos de una o varias
tablas, as como combinar registros de diferentes tablas para formar otras nuevas. No todas las
definiciones posibles de tablas son vlidas segn el modelo relacional. En l, deben emplearse
diseos normalizados que garantizan que no se producirn anomalas en la actualizacin de la BD.
En un diseo normalizado para cada tabla:

No pueden existir tuplas duplicadas.

El orden de las tuplas es irrelevante.

La tabla es plana, es decir, en el cruce de un atributo y una tupla slo puede haber un valor
(el orden de los atributos no es significativo).

2.6.2.2.3 Arquitectura de implantacin de un SGBD


La arquitectura centralizada el SGBD est implantado en una sola plataforma u ordenador
desde donde se gestiona directamente, de modo centralizado, la totalidad de los recursos
En la arquitectura distribuida, el SGBD y la BD no estn asociados a un determinado ordenador
sino a una red, cuyos nodos se reparten las funciones. Una base de datos distribuida es vista por
las aplicaciones igual que si fuera centralizada. una base de datos es distribuida si permite lecturas
y modificaciones remotas, independientemente de que stas sean transparentes o no, para las
aplicaciones.
Se suele distinguir entre sistemas homogneos y heterogneos. Un sistema es homogneo si el
SGBD usado en todas las mquinas es el mismo. Si existe ms de un SGBD distinto el sistema se
denomina heterogneo.
La arquitectura cliente/servidor
Esta arquitectura se basa, al igual que el caso anterior, en varias plataformas interconectadas, una
de las cuales acta como "servidor" de la BD, en la que los datos estn fsicamente localizados y
centraliza las funciones de administracin. Las plataformas denominadas "clientes" realizan
funciones de manejo de los interfases de usuario, logical de aplicacin, etc.
2.6.2.2.4 Ventajas e inconvenientes de los SGBD
La instalacin de un SGBD en un sistema que est funcionando sin l, normalmente proporciona
una amplia serie de ventajas. Entre las ms importantes se pueden destacar:

Eliminan las inconsistencias en los datos. Algo especialmente difcil sin un SGBD,
cuando los mismos datos se utilizan y actualizan en diferentes procesos.

Permiten compartir los mismos datos entre diferentes aplicaciones con distintas
necesidades. Por ejemplo: aplicaciones transaccionales junto con aplicaciones de soporte
a la direccin.

Se adaptan mejor a la existencia de aplicaciones rpidamente cambiantes. En estos


casos con los enfoques tradicionales se puede requerir la conversin de los datos cada
vez. Un SGBD proporcionar independencia de los datos respecto a las aplicaciones.

Ahorran espacio de almacenamiento al no existir redundancia o ser sta escasa.


Tambin porque muchos SGBDs utilizan mecanismos de compresin para almacenar los
datos.

Mejoran la seguridad de los datos pues, normalmente, incorporan mecanismos de


seguridad en el propio SGBD.

Permiten la creacin de entornos de alta disponibilidad. Los SGBDs modernos suelen


permitir realizar gran parte (a veces todo) del mantenimiento del sistema sin necesidad de
parar las aplicaciones. Por tanto, con algunos SGBDs es posible llegar a disponer de
aplicaciones funcionando ininterrumpidamente.

Por otra parte, si se escoge adecuadamente el SGBD, no suelen presentarse problemas de tipo
tcnico que no se presenten con los sistemas anteriores de almacenamiento de datos, sino que los
problemas suelen ser los tpicos de cualquier equipo lgico complejo:

La puesta en funcionamiento puede ser larga. Pues antes de obtener los primeros
resultados se necesita un perodo de formacin y adaptacin variable, segn la
complejidad del entorno.

Se necesita personal especializado para su mantenimiento. En principio un diseador


de la BD y un administrador permanente de la BD.

2.6.2.3 Tendencias tecnolgicas y del mercado


Evolucin de los SGBDs relacionales
En la tecnologa actual de SGBDs relacionales se observan las siguientes tendencias.

Integracin de la tecnologa de orientacin a objetos con la tecnologa relacional.

Los datos siguen estando centralizados en cuanto a modelado y administracin, mientras


que el desarrollo de aplicaciones se descentraliza.

Los usuarios finales acceden a las BDs con mayor facilidad (existencia de productos en el
mercado).

El ordenador central pasa de soportar los procesos de manera centralizada a ser un


servidor de datos.

El proceso en paralelo va madurando, apareciendo en el mercado SGBDs adaptados a


estas arquitecturas.

En cuanto a los SGBDs distribuidos, aunque no hay estndares definidos, existen en el mercado
algunos productos que incorporan caractersticas de estos SGBDs.
Los SGBD post - relacionales
El modelo post-relacional es de una estructura tridimensional , es decir, los campos o grupos de
stos pueden aparecer varias veces, una vez, o nunca, sin limitacin y sin necesidad de definicin.
Reduce el nmero de tablas y elimina la duplicacin de datos. El modelo relacional tradicional
(1NF) es un subgrupo del modelo post-relacional.
Los SGBD orientados a objetos
la idea fundamental es la integracin de dos conceptos que tradicionalmente se han venido
tratando de forma separada: datos y procesos. Cada objeto encapsula tanto datos como procesos.
Los objetos se comunican entre s mediante mensajes. Cada objeto se percibe por los dems
como el encapsulamiento de una serie de servicios que se pueden invocar externamente. De esta
forma, el encapsulamiento es una abstraccin que permite ocultar a los usuarios la instrumentacin
del objeto, ofrecindoles una interfase externa mediante la cul interacta con l. Esta orientacin
es muy adecuada para el manejo de elementos complejos como, por ejemplo, grficos.
Los SGBD orientados a objetos ofrecen varias ventajas sobre los sistemas relacionales:

Manejan ms efectivamente tipos de datos complejos como imgenes.

Son ms sencillos de mantener gracias al encapsulamiento.

Proveen un acceso ms sencillo a los datos.

En cuanto a las desventajas:

El modelo orientado a objetos no est totalmente desarrollado, ni acadmicamente ni en


cuanto a investigacin y desarrollo comerciales.

An no dispone de un lenguaje normalizado como SQL, ni otro tipo de estndares.

Los SGBD activos


los SGBD activos son un refinamiento de los sistemas existentes que intenta almacenar
la semntica de los datos, adems de los propios datos. Podemos definir un SGBD activo como
aquel que, cuando se producen ciertas condiciones predefinidas, ejecuta de forma automtica, es
decir, sin la intervencin del usuario, una serie de acciones (denominadas disparadores, reglas,
etc.) especificadas de antemano en la fase de definicin de la base de datos.
Los SGBD activos estn, en parte, "dirigidos por los datos" en lugar de estar dirigidos
exclusivamente por programas como los actuales. La lgica de control se codifica en reglas
almacenadas en la base de datos en lugar de en los propios programas.
Las principales ventajas de los SGBD activos son las siguientes:

Simplifican los programas al descargarlos de aquellos controles que, en realidad, forman


parte de la semntica de los datos.

Consiguen una mayor productividad y un menor mantenimiento ya que las reglas se


almacenan y, si es necesario, se modifican una sola vez en el diccionario de la base de
datos, en lugar de hacerlo en cada programa.

Reducen el trfico de red, pues al almacenar parte de los procedimientos en los servidores
se limita la cantidad de informacin que stos deben solicitar y/o devolver.

Facilitan el acceso a la base de datos por los usuarios finales, al almacenar las reglas de
actualizacin en el propio SGBD. Este podr preservar la integridad de los datos
independientemente de cul sea el mtodo de acceso empleado, lo que permite a los
usuarios finales acceder sin peligro de daar la base de datos.

SQL3
SQL3 es, como se ha mencionado, la prxima versin de SQL. Est en estudio por el grupo
correspondiente de ISO (ISO/IEC JTC1/SC21 WG3 DBL). SQL3 soportar, entre otras, las
extensiones necesarias para bases de datos orientadas a objeto y bases de datos activas.

Вам также может понравиться